Regression, lineare
[engl. linear regression], [FSE], Regressionsanalyse, bei der ein linearer Zusammenhang zw. einer Kriteriumsvariablen Y und einer (einfache lineare Regression) oder mehreren (multiple lineare Regression) Prädiktorvariablen angenommen wird. Die Prädiktorvariablen müssen dichotom (ggf. auch nominalskalierte Variablen nach Dummy-Codierung oder intervallskaliert sein (Skalenniveau). Im Falle einer Prädiktorvariablen lautet die Modellgleichung:
= Messwert in der Kriteriumsvariablen bei Person i
= Messwert in der Prädiktorvariablen bei Person i
bzw.
= Regressionsgewichte
= Vorhersagefehler
Im Rahmen der linearen Regression werden die Regressionswichte so bestimmt, dass die Kriteriumswerte optimal vorhergesagt werden (Methode der kleinsten Quadrate). Im Falle eines signifikanten Wertes (Signifikanz) von
können für jede Pb aufgrund des Wertes in der Prädiktorvariablen X Schätzwerte
bestimmt werden. Die Güte der Vorhersage wird über
(Determinationskoeffizient) als Maß der Varianzaufklärung abgebildet. Dieses entspricht im Falle der einfachen linearen Regression dem Quadrat der Produkt-Moment-Korrelation der Variablen X und Y.
Werden n Prädiktorvariablen simultan berücksichtigt, so lautet die multiple Vorhersagegleichung:
Bei der Schätzung der Regressionsgewichte wird redundante Information in den Prädiktoren kontrolliert, sodass ein Prädiktor, der hoch mit den übrigen Prädiktoren korreliert, i. d. R. keine oder nur eine schwache zusätzliche Varianzaufklärung ermöglicht. Korrelieren zwei Variablen und
bivariat gleich stark mit der Kriteriumsvariblen Y, so leistet diejenige Prädiktorvariable i. d. R. die höhere zusätzliche Varianzaufklärung, die in geringerem Maße mit den übrigen Prädiktorvariablen in Zusammenhang steht. Für die multiple lineare Regression wird das multiple
als Varianzaufklärungsmaß angegeben.
Da auch dichotome und nominalskalierte Prädiktoren berücksichtigt werden können, kann im Rahmen des Allgemeinen Linearen Modells gezeigt werden, dass die Varianzanalyse einen Spezialfall der lineare Regression darstellt. Allgemeines Lineares Modell (ALM), Supressorvariable.