Regression, lineare

 

(= l. R.) [engl. linear regression], [FSE], Regressionsanalyse, bei der ein linearer Zusammenhang zw. einer Kriteriumsvariablen Y und einer (einfache l. R.) oder mehreren (multiple l.R.) Prädiktorvariablen X_%7Bk%7D angenommen wird. Die Prädiktorvariablen müssen dichotom (ggf. auch nominalskalierte Variablen nach Dummy-Codierung oder intervallskaliert sein (Skalenniveau). Im Falle einer Prädiktorvariablen lautet die Modellgleichung:

y_%7Bij%7D%3Db_%7B0%7D%2Bb_%7B1%7D%5Ccdot%20x_%7Bi%7D%2Be_%7Bij%7D

y_%7Bij%7D = Messwert in der Kriteriumsvariablen bei Person i

x_%7Bi%7D = Messwert in der Prädiktorvariablen bei Person i

b_%7B0%7D bzw. b_%7B1%7D = Regressionsgewichte

e_%7Bij%7D = Vorhersagefehler

Im Rahmen der l. R. werden die Regressionswichte so bestimmt, dass die Kriteriumswerte y_%7Bij%7D optimal vorhergesagt werden (Methode der kleinsten Quadrate). Im Falle eines signifikanten Wertes (Signifikanz) von %5Cbeta_%7B1%7D%7D können für jede Pb aufgrund des Wertes in der Prädiktorvariablen X Schätzwerte %5Chat%7By%7D_%7Bi%7D bestimmt werden. Die Güte der Vorhersage wird über r%5E%7B2%7D (Determinationskoeffizient) als Maß der Varianzaufklärung abgebildet. Dieses entspricht im Falle der einfachen l. R. dem Quadrat der Produkt-Moment-Korrelation der Variablen X und Y.

Werden n Prädiktorvariablen X_%7B1%7D...X_%7Bn%7D simultan berücksichtigt, so lautet die multiple Vorhersagegleichung:

y_%7Bij%7D%3Db_%7B0%7D%2Bb_%7B1%7D%5Ccdot%20x_%7B1i%7D%2B...%2Bb_%7Bn%7D%5Ccdot%20x_%7Bni%7D%2Be_%7Bij%7D

%3Db_%7B0%7D%2B%5Cleft%20(%5Csum_%7Bk%3D1%7D%5E%7Bn%7Db_%7Bk%7D%5Ccdot%20x_%7Bki%7D%20%5Cright%20)%2Be_%7Bij%7D

Bei der Schätzung der R.gewichte wird redundante Information in den Prädiktoren kontrolliert, sodass ein Prädiktor, der hoch mit den übrigen Prädiktoren korreliert, i. d. R. keine oder nur eine schwache zusätzliche Varianzaufklärung ermöglicht. Korrelieren zwei Variablen X_%7Bi%7D und X_%7Bj%7D bivariat gleich stark mit der Kriteriumsvariblen Y, so leistet diejenige Prädiktorvariable i. d. R. die höhere zusätzliche Varianzaufklärung, die in geringerem Maße mit den übrigen Prädiktorvariablen in Zusammenhang steht. Für die multiple l. R. wird das multiple R%5E%7B2%7D als Varianzaufklärungsmaß angegeben.

Da auch dichotome und nominalskalierte Prädiktoren berücksichtigt werden können, kann im Rahmen des Allgemeinen Linearen Modells gezeigt werden, dass die Varianzanalyse einen Spezialfall der l. R. darstellt. Allgemeines Lineares Modell (ALM), Supressorvariable.

Verwendete Literatur

Sie sind schon registriert? Zur Anmeldung
Erstellen Sie einen Account um das komplette Literaturverzeichnis einzusehen.