Grundlagen der Statistik enthält Materialien verschiedener Vorlesungen und Kurse von H. Lohninger zur Statistik, Datenanalyse und Chemometrie .....mehr dazu.


MLR - Schätzung unbekannter Werte

Author: Hans Lohninger

Wenn man die Parameter ai der allgemeinen multiplen linearen Regressionsgleichung

berechnet, ist man nicht nur an den Parametern ai, sondern auch an einer Schätzung des Konfidenzintervalls sowohl für die Parameter ai als auch für die Zielvariable interessiert. Während die Schätzung der Standardabweichung der Parameter relativ einfach ist, ist die Berechnung der Standardabweichung von ziemlich kompliziert. Der Grund dafür liegt in der Tatsache, dass die Verteilung von vom jeweiligen Satz der Parameter ai abhängt. Im Allgemeinen kann die multivariate Verteilungsfunktion von ziemlich komplex sein.

Aus diesem Grund gibt es zwei Möglichkeiten, die Standardabweichung von zu bestimmen. Die erste Methode ist leicht zu implementieren, ist aber nur eine Näherung. Die zweite Methode verlangt wesentlich mehr Aufwand, ist aber die exakte Methode:

Grobe Näherung: Wir können die Standardabweichung der Residuen s verwenden, um die Standardabweichung zukünftiger Werte von y, nämlich abzuschätzen. Das Intervall von 2s kann man als grobe Näherung für die Genauigkeit des Modells nehmen (also die Genauigkeit mit der das Modell zukünftige Werte von y für konkrete x-Werte abschätzt). Die Berechnung von s ist einfach:

mit SSE als Summe der quadrierten Residuen, n als Zahl der Beobachtungen, und k die Zahl der unabhängigen Variablen.

Exakte Lösung: Die exakte Vorgangsweise, um das Konfidenzintervall von zu betrechnen, kann als Erweiterung des Working-Hotelling-Konfidenzbandes der einfachen Regression betrachtet werden. Im Fall der multiplen Regression wird dieses Band zu einem k-dimensionalen Volumen. Der Schätzwert für fällt in den folgenden Konfidenzbereich (mit einer Wahrscheinlichkeit von 1-α):

wobei s die Standardabweichung der Residuen ist, c der erweiterte Vektor der x-Werte, (XTX)-1 die inverse Kovarianzmatrix, und tα/2 das Quantil der t-Verteilung für die Wahrscheinlichkeit α/2.


Last Update: 2012-10-08