Simpson-Paradoxon

 

(= S.) [engl. Simpson's paradox, Yule–Simpson effect], syn. Simpson-Effekt, [FSE], wird eine Gesamtstichprobe in Teilstichproben unterteilt, so können sich in allen Teilstichproben Zusammenhänge zeigen, die systematisch nicht dem Zusammenhang in der Gesamtstichprobe entsprechen oder gar konträr ausfallen. Dieser von Edward Hugh Simpson 1951 erstmals beschriebene Effekt kann sich aufgrund einer Konfundierung ergeben: Steht die Variable, aufgrund derer die Teilgruppen gebildet werden, in systematischem Zusammenhang mit den Analysevariablen, so kann die Betrachtung der Verhältnisse in der Gesamtstichprobe irreführend sein. In der Tab. ist eine entspr. Datenverteilung dargestellt (fiktive Daten). In der Tab. oben zeigt sich, dass 25% der Kinder, die eine traditionelle Schulform besuchen, eine Gymnasialempfehlung erhalten. Es scheint vorteilhaft, eine traditionelle Schule zu besuchen, da die Gymnasialempfehlungsquote in der Ganztagsschule mit 21% geringer ausfällt. Nach Aufteilung der Datenverteilung nach sozialem Hintergund ergibt sich jedoch sowohl für Kinder der unteren als auch der mittleren/oberen sozialen Schicht eine höhere Gymnasialempehlungsquote für Besucher der Ganztagsschule. Die aggregierten Daten (oben) zeigen eine den Einzelverteilungen (unten) widersprechende Struktur. Dies ist dadurch bedingt, dass sich Kinder der unteren und mittleren/oberen sozialen Schicht systematisch unterschiedlich auf die Schulformen verteilen (Konfundierung): Aufgrund der Tatsache, dass Kinder der unteren sozialen Schicht eher die Ganztagsschule besuchen, erscheint die Ganztagsschule auf aggregierter Ebene unterlegen.

Das S. verdeutlicht die Notwendigkeit kontrollierter Studien, bei denen die Struktur der Vergleichsgruppen durch den Vl gesteuert wird (randomisierte kontrollierte Studie), um eine eindeutige Interpretierbarkeit der Analyseergebnisse gewährleisten zu können (Evidenzbasierung, Validität, interne). Kontrolle würde im Bsp. bedeuten, dass Analysestichproben betrachtet werden, deren Merkmale nicht mit beiden Analysevariablen im Zusammehang stehen (im Bsp.: soziale Schicht). Alternativ können stat. Verfahren, die den Effekt potenziell konfundierter kontrollieren (matching, propensity score), zur Verbesserung der internen Validität eingesetzt werden.

Referenzen und vertiefende Literatur

Sie sind schon registriert? Zur Anmeldung
Erstellen Sie einen Account um das komplette Literaturverzeichnis einzusehen.