Regression, logistische

 

(= log. R.) [engl. logistic regression; gr. λογιστική (logistike) Rechenkunst], syn. binomiale log. R., [FSE], Regressionsanalyse zur stat. Vorhersage einer dichotomen abhängigen Kriteriumsvariable (= K., z. B. Erfolg «1» = «ja» vs. «0» = «nein»; «1» = «geeignet» vs. «0» = «nicht geeignet») aus einer oder mehreren dichotomen, nominalen (Dummy-Kodierung) oder intervallskalierten Prädiktorvariablen. Der Modellierungsansatz unterscheidet sich von demjenigen der linearen R.analyse (Regression, lineare) vor allem in zwei Aspekten: (1) Nicht die Werte der K. selbst, sondern die Wahrscheinlichkeit des Eintretens der Merkmalsausprägung «1» wird modelliert. (2) Der Zusammenhang zw. den Prädiktorvariablen und der K. wird nicht durch eine lineare Funktion (Gerade), sondern durch eine ogivenförmig verlaufende, log. Funktion beschrieben (Link-Funktion). Der Wertebereich der log. Funktion liegt zw. 0 und 1, wodurch insbes. für die durch die l. R. vorhergesagten Werte die Interpretation i. S. einer Wahrscheinlichkeit ermöglicht wird. Die Modellschätzung erfolgt mittels der Maximum-Likelihood-Methode.

Die Ähnlichkeit der Modellgleichung zu derjenigen der linearen R. wird durch die Definiton der sog. Logits möglich. Ein Logit entspricht dem natürlichen Logarithmus der Odds des Ereignisses, also dem Quotienten der Wahrscheinlichkeit des Eintretens des Merkmals und der Wahrscheinlichkeit des Nichteintretens des Merkmals. Angenommen, es liegt nur eine Prädiktorvariable X mit den Ausprägungen x_{i} vor, dann gilt:

Logit(Y%3D1|x_%7Bi%7D)%3Dln%5Cleft%20(%20%5Cfrac%7BP(Y%3D1|x_%7Bi%7D)%7D%7BP(Y%3D0|x_%7Bi%7D)%7D%20%5Cright%20)

Diese Logits stehen dann in linearer Abhängigkeit zu der Prädiktorvariablen:

Logit(Y%3D1|x_%7Bi%7D)%3D%5Cbeta%20_%7B0%7D%2B%5Cbeta%20_%7B1%7D%5Ccdot%20x_%7Bi%7D

Bestimmt man die exponentialtransformierten Werte der durch das Verfahren ermittelten β-Gewichte als exp(%5Cbeta%20_%7Bi%7D), so ermöglicht dies eine Interpretation im Sinne des Odds Ratio. Angenommen, es wurde für den dichotomen Prädiktor Rauchen («ja» vs. «nein») ein Wert von %5Cbeta%20_%7B1%7D%3D%2C695 zur Vorhersage einer Lungenkrebserkrankung ermittelt. Dann ergibt sich exp(%5Cbeta%20_%7B1%7D)%3D2%2C00. Dieser Wert kann so interpretiert werden, dass sich die Chance (Odds) für den Eintritt einer Lungenkrebserkrankung verdoppelt, wenn bekannt ist, dass eine Person raucht. Werte von exp(%5Cbeta%20_%7B1%7D) > 1 können i. S. einer Risikoerhöhung und Werte von exp(%5Cbeta%20_%7B1%7D)%3C1 können i. S. einer Riskoverringerung interpretiert werden. Liegt eine intervallskalierte Prädiktorvariable vor, so gibt exp(%5Cbeta%20_%7Bi%7D) an, in welchem Maße die Chance für das Ereignis mit der Erhöhung der Prädiktorvariablen um eine Einheit zunimmt.

Folg. Möglichkeiten stehen zur Testung der Bedeutsamkeit der Prädiktoren und zur Beurteilung der Modellgüte zur Verfügung: Signifikanztestung der β-Gewichte: Wald-Statistik, Likelihood-Ratio; Aufgeklärte Information im Kriterium: Pseudo-R-Quadrat, ROC-Analyse; Globale Datenpassung: Hosmer-Lemeshow-Test. ROC, ROC-Kurve

Referenzen und vertiefende Literatur

Sie sind schon registriert? Zur Anmeldung
Erstellen Sie einen Account um das komplette Literaturverzeichnis einzusehen.