Mehrebenenanalyse

 

(= M.) [engl. multilevel analysis], syn. hierachische lineare Modelle, Mehrebenenregression, Gemischte Modelle, [FSE], die M. ermöglicht die Analyse stat. Daten, wenn die Individuen der Stichprobe natürlichen Gruppen angehören und davon ausgegangen werden muss, dass die Gruppenzugehörigkeit einen Einfluss auf die indiv. Merkmalsausprägungen hat. In diesem Fall müssen die Daten als hierarchisch geschachtelt modelliert werden, da die Gruppenzugehörigkeit (bzw. Clusterzugehörigkeit) z. B. dazu führen kann, dass Individuen innerhalb einer Gruppe eine höhere Homogenität (geringere Varianz) und Individuen versch. Gruppen eine höhere Heterogenität aufweisen, als dies bei reinen Zufallsstichproben der Fall wäre. Bsp.: Schüler (Mitarbeiter/Patienten/Einwohner; Ebene 1) einer Klasse (eines Unternehmens, einer Station, eines Orts; Ebene 2) zeigen systematisch ähnlichere Merkmalsausprägungen, weil sie von derselben Lehrkraft unterrichtet werden (demselben Abteilungsleiter unterstellt sind/vom selben Personal behandelt werden/in derselben Umgebung leben). Sind die Cluster der Ebene 3 wieder Cluster einer höheren Ebene 2 eindeutig zugeordnet (z. B. Schule, Unternehmen, Krankenhaus, Landkreis), so müsste diese i. R. einer M. ebenfalls berücksichtigt werden (Drei-Ebenen-Struktur). Um eine M. durchführen zu können, muss die entspr. Gruppenzugehörigkeit bekannt sein.

Verfahren der klass. Statistik (z. B. Regressionsanalyse, Varianzanalyse) beruhen auf der in der in diesen Bsp. nicht begründeten Annahme einer echten Zufallsstichprobe, die die Unabhängigkeit der Stichprobenmitglieder erfordert. Wird die hierarchische oder geclusterte Datenstruktur (Mehrebenenstruktur) nicht berücksichtigt, so können insbes. folg. Probleme resultieren: (1) erhöhte Wahrscheinlichkeit eines stat. Fehlschlusses (Alpha-Fehler-Inflation) aufgrund invalider Schätzungen (i. d. R. Unterschätzung) der Standardfehler, (2) ökologischer Fehlschluss.

Bei der M. wird stets ein Merkmal der untersten Datenebene als abhängige Variable modelliert (z. B. Schülerleistung/Mitarbeiter-/Pat.zufriedenheit/indiv. Lebensqualität). Als Prädiktoren können Merkmale aller Analyseebenen verwendet werden, z. B. Motivation der Schüler (Ebene 1), didaktische Kompetenz der Lehrkraft (Ebene 2), Schulklima (Ebene 3). I. R. einer M. können versch. Modelle def. und geschätzt werden, die die Testung unterschiedlicher Hypothesen erlauben. Dabei können Prädiktoreffekte auf Ebene 1 insbes. als feste Effekte [engl. fixed effects] oder zufällige Effekte [engl. random effects] modelliert werden: Werden die Regressionsgewichte zur Vorhersage der Schülerleistung durch die Schülermotivation als feste Effekte [bzw. zufällige Effekte] definiert, so bedeutet dies, dass sich die Gewichte zw. den Schulklassen nicht unterscheiden bzw. dass diese zw. den Schulklassen variieren. Im Falle einer Zwei-Ebenen-Datenstruktur sind folg. Modellvarianten testbar:

Modell (1): Modell zur Bestimmung ebenenspezifischer Varianzanteile (Leermodell bzw. intercept-only model, baseline model, one-way-ANOVA with random effects): Es wird angenommen, dass sich lediglich die Mittelwerte der Gruppen (z. B. Schulklassen) unterscheiden. Es wird also keine Prädiktorvariable im Modell berücksichtigt. Dieses Modell dient der Bestimmung der Varianzen der abhängigen Variablen auf Ebene 1 (Schüler) und Ebene 2 (Klasse). Aus diesen Informationen kann die Intraklassenkorrelation (ICC) berechnet werden. Die ICC gibt an, welcher Anteil der Merkmalsvarianz auf Gruppenebene lokalisiert ist: z. B. x Prozent der Varianz der Schülerleistungen sind durch Unterschiede zwischen den Schulklassen erklärbar. Ab einer ICC von 0,1 ist mit einer gravierenden Inflation der Alpha-Fehler-Wahrscheinlichkeit zu rechnen (Fehler erster Art).

Modell (2): Modell zur Bestimmung von Gruppenunterschieden und des Vorhersagewerts von Individualmerkmalen (Modell mit einem festen Ebene-1-Effekt bzw. random-intercept model, einfaktorielle Kovarianzanalyse mit Zufallseffekten): Es wird angenommen, dass ein Prädiktor auf Ebene 1 (Schülermotivation) die abhängige Variable (Schülerleistung) vorhersagt. Simultan wird geprüft, ob sich eine signifikante Varianz der Mittelwerte zw. den Clustern (Schulklassen) ergibt: Dieses Prüfung hat den Vorteil gegenüber einer klassischen Kovarianzanalyse, dass die Signifikanztestung trotz geclusterter Datenstruktur korrekt erfolgen kann.

Modell (3):Modell zur Bestimmung von Gruppenunterschieden und des Vorhersagewerts gruppenspezifischer Individualmerkmale (Modell mit einem zufälligen Ebene-1-Effekt bzw. random-coefficients model): Es wird angenommen, dass sowohl die y-Achsenschnittpunkte als auch die Steigungen der Regressionsgeraden zw. den Clustern variieren. Grundlegendes Prinzip des Random-Coefficient-Modells ist hierbei, dass die Zusammenhänge einer unteren Ebene für alle Gruppen der nächsthöheren Ebene separat modelliert werden: Der Vorhersagewert der Schülermotivation für die Schülerleistung wird also klassenspezifisch betrachtet, da sich für jede Klasse ein anderer Zusammenhang ergeben kann. Unterscheidet sich die Vorhersagekraft des Prädiktors Schülermotivation für das Kriterium Schülerleistung zw. den Schulklassen, so würde sich dies in einer signifikanten Varianz der Regressionssteigung (random slopes) widerspiegeln.

Modell (4): Modell zur Vorhersage von Gruppenmittelwerten durch ein Gruppenmerkmal (Modell mit einem Ebene-2-Effekt bzw. means-as-outcomes model): Statt einem Prädiktor auf Ebene 1 wird hier ein Ebene-2-Prädiktor (z. B. didaktische Kompetenz der Lehrkraft) geprüft. Dabei wird getestet, ob sich die Mittelwertsunterschiede (z. B. Mittelwerte der Schülerleistungen der Schulklassen) zw. den Klassen durch den Ebene-2-Prädiktor systematisch vorhersagen lassen.

Modell (5): Modell zur simultanen Bestimmung des Vorhersagewerts von Individual- und Gruppenmerkmalen sowie deren Interaktion (Modell mit einem zufälligen Ebene-1-Effekt und einem Ebene-2-Effekt (bzw. intercepts and slopes-as-outcomes model): Es wird sowohl ein Ebene-1-Prädiktor (z. B. Schülermotivation) als auch ein Ebene-2-Prädiktor (z. B. didaktische Kompetenz der Lehrkraft) modelliert. Hierdurch kann simultan der Vorhersagewert des Ebene-1-Prädiktors (Schülermotivation: Ebene-1-Prädiktion), des Ebene-2-Prädiktors (didaktische Kompetenz der Lehrkraft) und der Interaktion des Ebene-1- und Ebene-2-Prädiktors (cross-level interaction) modelliert werden. Eine Cross-Level-Interaktion würde vorliegen, wenn sich in Abhängigkeit von der didaktischen Kompetenz der Lehrkraft der Vorhersagewert der Schülermotivation auf die Lernleistung unterscheiden würde: Die Prädiktionskraft des Ebene-1-Prädiktors würde also mit der Ausprägung des Ebene-2-Prädiktors in Zusammenhang stehen. Bei der simultanen Berücksichtigung von Ebene-1- und Ebene-2-Information müssen insbes. Methoden der Zentrierung und mögliche Kontexteffekte angemessen berücksichtigt werden.

Diese Modelle sollten i. d. R. schrittweise geprüft werden: Nur wenn in einem früherem Schritt ein hinreichender Varianzanteil (Varianzaufklärung) in der abhängigen Variablen unerklärt bleibt, sollten in den Folgemodellen zusätzliche Vorhersageeffekte geprüft werden. Dies wird insbes. empfohlen, da höhere Modellebenen die Schätzung zusätzlicher Parameter erfordert, sodass (1) das Gebot des ökonomischen Einsatzes stat. Hypothesenprüfungen verletzt wird und (2) Unsicherheiten in den Parameterschätzungen resultieren können. Als Grundregel für den Stichprobenumfang kann gelten, dass mind. 30 Einheiten pro Ebene (also jew. 30 Schüler in 30 Klassen) für die solide Parameterschätzung vorliegen sollten. Die Unterschreitung dieser Empfehlung ist eher auf Ebene 1 zulässig. Zur Prüfung einer Cross-Level-Interaktion sollten eher mind. 50 Ebene-2-Einheiten angestrebt werden. Die Parameter werden mittels der Maximum-Likelihood-Methode (ML; bzw. Restricted-Maximum-Likelihood-Methode; RML) geschätzt. Die Mehrebenenregressionsanalyse kann bspw. mittels der Software HLM [http://www.ssicentral.com/hlm/] durchgeführt werden. Das Programm Mplus ermöglicht zusätzlich die Integration latenter Variablen (Variable, latente). Statistische Datenanalyseverfahren, Wachstumsanalyse.

Referenzen und vertiefende Literatur

Sie sind schon registriert? Zur Anmeldung
Erstellen Sie einen Account um das komplette Literaturverzeichnis einzusehen.