Pseudo-R-Quadrat

 

Pseudo-R%5E%7B2%7D, [FSE], für Regressionsmodelle (Regressionsanalyse), bei denen nicht intervallskalierte, sondern lediglich nominal- oder ordinalskalierte Maße als Kriterium vorhergesagt werden (Regression, logistische, Regression, multinomiale, Regression, ordinale), sind die Varianz des Kriteriums und damit Maße der Varianzaufklärung R%5E%7B2%7D (Determinationskoeffizient) nicht definiert. Für diese Modelle wurden versch. Alternativmaße entwickelt, die den Anteil des durch die Prädiktoren aufgeklärten Informations- bzw. Variationsanteils angeben:

(1) McFadden-Index:

MF%3D%5Cfrac%7Bln(L_%7B0%7D)-ln(L_%7BM%7D)%7D%7Bln(L_%7B0%7D)%7D

(2) Cox-Snell-Index:

CS%3D1-%5Cleft%20(%5Cfrac%7BL_%7B0%7D%7D%7BL_%7BM%7D%7D%20%5Cright%20)%5E%7B%5Cfrac%7B2%7D%7Bn%7D%7D

(3) Nagelkerke-Index:

NK%3D%5Cfrac%7BCS%7D%7BCS_%7Bmax%7D%7D%3D%5Cfrac%7BCS%7D%7B1-%5Cleft%20(%20L_%7B0%7D%20%5Cright%20)%5E%7B%5Cfrac%7B2%7D%7Bn%7D%7D%7D

L_%7BM%7D = Wahrscheinlichkeit (likelihood; Maximum-likelihood-Methode) der Ausprägugnen des Kriteriums, wenn alle Prädiktoren berücksichtigt werden.

L_%7B0%7D = Likelihood, wenn lediglich die Regressionskonstante im Modell enthalten ist (Nullmodell, keine Prädiktorvariablen).

n = Stichprobengröße.

Für alle drei Maße gilt, dass der min. Wert gleich 0 ist. Für CS gilt, dass dieser im Falle der multiplen linearen Regressionsanalyse (Regression, multiple) identisch ist mit R%5E%7B2%7D. Da im Falle kategorialer Variablen für CS auch bei perfekter Vorhersage niemals der Wert 1 erreicht werden kann, berücksichtigt NK eine Korrektur: Lediglich für NK gilt somit ein Wertebereich [0;1].

Referenzen und vertiefende Literatur

Die Literaturverweise stehen Ihnen nur mit der Premium-Version zur Verfügung.