Simpson-Paradoxon

 

[engl. Simpson's paradox, Yule–Simpson effect], syn. Simpson-Effekt, [FSE], wird eine Gesamtstichprobe in Teilstichproben unterteilt, so können sich in allen Teilstichproben Zusammenhänge zeigen, die systematisch nicht dem Zusammenhang in der Gesamtstichprobe entsprechen oder gar konträr ausfallen. Dieser von Edward Hugh Simpson 1951 erstmals beschriebene Effekt kann sich aufgrund einer Konfundierung ergeben: Steht die Variable, aufgrund derer die Teilgruppen gebildet werden, in systematischem Zusammenhang mit den Analysevariablen, so kann die Betrachtung der Verhältnisse in der Gesamtstichprobe irreführend sein. In der Tab. ist eine entspr. Datenverteilung dargestellt (fiktive Daten). In der Tab. oben zeigt sich, dass 25% der Kinder, die eine traditionelle Schulform besuchen, eine Gymnasialempfehlung erhalten. Es scheint vorteilhaft, eine traditionelle Schule zu besuchen, da die Gymnasialempfehlungsquote in der Ganztagsschule mit 21% geringer ausfällt. Nach Aufteilung der Datenverteilung nach sozialem Hintergrund ergibt sich jedoch sowohl für Kinder der unteren als auch der mittleren/oberen sozialen Schicht eine höhere Gymnasialempehlungsquote für Besucher der Ganztagsschule. Die aggregierten Daten (oben) zeigen eine den Einzelverteilungen (unten) widersprechende Struktur. Dies ist dadurch bedingt, dass sich Kinder der unteren und mittleren/oberen sozialen Schicht systematisch unterschiedlich auf die Schulformen verteilen (Konfundierung): Aufgrund der Tatsache, dass Kinder der unteren sozialen Schicht eher die Ganztagsschule besuchen, erscheint die Ganztagsschule auf aggregierter Ebene unterlegen.

Das Simpson-Paradoxon verdeutlicht die Notwendigkeit kontrollierter Studien, bei denen die Struktur der Vergleichsgruppen durch den Vl gesteuert wird (randomisierte kontrollierte Studie), um eine eindeutige Interpretierbarkeit der Analyseergebnisse gewährleisten zu können (Evidenzbasierung, Validität, interne). Kontrolle würde im Bsp. bedeuten, dass Analysestichproben betrachtet werden, deren Merkmale nicht mit beiden Analysevariablen im Zusammehang stehen (im Bsp.: soziale Schicht). Alternativ können stat. Verfahren, die den Effekt potenziell konfundierter kontrollieren (matching, propensity score), zur Verbesserung der internen Validität eingesetzt werden.

Diese Abbildung steht Ihnen nur mit der Premium-Version zur Verfügung.
Simpson-Paradoxon: Zusammenhang von Gymnasialempfehlung und aktuell besuchter Grundschulart. Oben: Gesamtstichprobe; unten: Teilstichproben. Die Werte oben ergeben sich als Summe der unteren beiden Tabellen. (fiktive Daten)

Referenzen und vertiefende Literatur

Die Literaturverweise stehen Ihnen nur mit der Premium-Version zur Verfügung.