Varianzanalyse
[engl. analysis of variance (ANOVA); lat. variantia Verschiedenheit, gr. ἀνάλυσις (analysis) Auflösung], [FSE], bez. eine Gruppe stat. Signifikanztests zur Prüfung von Mittelwertunterschieden einer abhängigen Variablen für versch. Stufen einer mehrklassigen unabhängigen Variablen oder mehrerer unabhängiger Variablen. Die Bez. m-faktorielle Varianzanalyse indiziert, dass m unabhängige Variablen betrachtet werden. Das Verfahren basiert auf einer Zerlegung der Variation (Varianzzerlegung) der abhängigen Variablen in versch. Varianzkomponenten, die in Zus.hang mit je einer unabhängigen Variablen allein oder mit der Kombination der Klassen mehrerer unabhängiger Variablen (Interaktion) oder auf Messfehler zurückgeführt werden können (Quadratsumme).
Das Grundkonzept der Varianzanalyse soll anhand einer einfaktoriellen Varianzanalyse dargestellt werden: Liegt eine aus versch. Gruppen (Stichprobe; z. B. Studienfach) zus.gesetzte Datenmenge vor, so kann die Varianz der abhängigen Variablen (z. B. Engl.kenntnisse) in der zugrunde liegenden Population einerseits aus der Varianz innerhalb der einzelnen Gruppen (Abweichung der einzelnen Messwerte innerhalb der Gruppen vom jew. Gruppenmittelwert) geschätzt werden («Varianz innerhalb») und andererseits aus der Varianz zw. den Gruppen (Abweichung der Gruppenmittelwerte vom Gesamtmittelwert aller Gruppen; «Varianz zw.»).
Da die erste dieser beiden Schätzungen auf einer größeren Zahl von Daten beruht und von den zw. den Gruppen möglicherweise bestehenden Mittelwertunterschieden unbeeinflusst ist, stellt sie die verlässlichere Schätzung der Populationsvarianz dar. Entstammen nun die versch. Gruppen einer gemeinsamen Population und unterscheiden sich in ihren Mittelwerten daher nur zufällig bzw. nicht systematisch voneinander, dann sollten beide Schätzungen der Populationsvarianz zum gleichen Resultat führen. Unterscheiden sich die Gruppen jedoch in ihren Mittelwerten systematisch voneinander, dann wird jene Varianzschätzung, die auf der Variation der Gruppenmittelwerte beruht («Varianz zw.»), größer ausfallen als die aufgrund der Varianzen innerhalb der einzelnen Gruppen («Varianz innerhalb»). Rechnerisch werden die Varianzschätzungen durch eine Zerlegung der Summe der quadrierten Abweichungen aller Einzelmessungen vom gemeinsamen Mittelwert («Quadratsumme total») in zwei Komponenten, nämlich in die mittlere Summe der quadrierten Abweichungen der Einzelmessungen vom jew. Gruppenmittelwert («Quadratsumme innerhalb») und in die Summe der quadrierten Abweichungen der Gruppenmittelwerte von ihrem gemeinsamen Mittelwert («Quadratsumme zw.»), gewonnen.
Die einzelnen Quadratsummen werden durch die ihnen zugehörigen Freiheitsgrade dividiert und so in Varianzen bzw. in Varianzschätzungen überführt (MS = mean square). Ob die Schätzung der «Varianz zw.» () signifikant größer als die der «Varianz innerhalb» (
) ist, wird mit dem F-Test geprüft, wobei F nach
bestimmt wird. Ist der errechnete F-Wert (gegeben die entspr. Zähler- und Nennerfreiheitsgrade) signifikant, so sind zur Feststellung, welche der Gruppenmittelwerte voneinander versch. sind, nachträglich paarweise Mittelwertvergleiche auf Basis von sog. Kontrasten durchzuführen. Die einfaktorielle Varianzanalyse kann als Verallgemeinerung des t-Test für unabhängige Stichproben auf mehr als zwei Gruppen gesehen werden. Im Falle des Vergleichs von nur zwei Gruppen sind die Ergebnisse von t-Test (bei gleichen Varianzen) und einfaktorieller Varianzanalysen identisch.
Die Anwendung der Varianzanalyse setzt Normalverteilung der Vorhersagefehler (Residuen) und Homogenität der einzelnen Gruppenvarianzen voraus (Varianzhomogenität). Während das Verfahren gegenüber Abweichungen von der Normalität robust ist, ist es gegen Verletzung der Homogenität sensibel. Werden die Voraussetzungen nicht erfüllt, so können Korrekturformeln angewendet werden oder anstelle einfacher Varianzanalysen versch. nicht parametrische Verfahren (z. B. Kruskal-Wallis-Test für unabhängige und Friedman-Test für abhängige Stichproben) angewendet werden. Es ist möglich, mehrere abhängige Variablen simultan zu analysieren (MANOVA). Ausweitungen des ursprünglichen varianzanalytischen Verfahrens sind u. a. in der Kovarianzanalyse zu sehen. Die Varianzanalyse kann i. R. des Allgemeinen Linearen Modells als Spezialfall der Regressionsanalyse aufgefasst werden. Statistische Datenanalyseverfahren.