Statistische Datenanalyseverfahren

 

[engl. statistical analysis procedures, statistical tests], [FSE], stat. Verfahren zur Quantifizierung von empir. Merkmalsverteilungen und Effekten sowie zur Hypothesenprüfung (Datenanalysemethoden, quantitative, Signifikanztest, Statistik). In der Tab. sind die gebräuchlichen Verfahren sowie Entscheidungskriterien für deren Auswahl zus.gefasst dargestellt. Die einzelnen Verfahren sind unter den entspr. Stichworteinträgen beschrieben.

SkalenniveauMaße der zentralen TendenzStreuungsmaße
NominalskalaModusEntropie (Informationstheorie)
OrdinalskalaMedianQuartile
IntervallskalaArithmetisches MittelSpannweite
Interquartalabstand
Mittlere durchschnittliche Abweichung (AD)
Standardabweichung
Varianz
VerhältnisskalaGeometrisches MittelVariationskoeffizient
Univariante Statistiken: Deskriptive Maße für die Verteilung eines Merkmals1)
1) Maße für niedrige Skalenniveaus sind auch für höhere Skalenniveaus definiert
Die Tabelle steht Ihnen nur mit der Premium-Version zur Verfügung..
SkalenniveauStatistischer Parameter/EigenschaftTestverfahrenFragestellung
NominalskalaMerkmalsverteilungBinomialtest
Chi–Quadrat–Test
Weicht die Verteilung eines kategorialen Merkmals von einer theoretisch angenommenen Verteilung (z.B. Gleichverteilung) ab?
OrdinalskalaMedianWilcoxon-Vorzeichen-Rangtest
Vorzeichen-Test
Weicht der Median von einem festgelegten Wert ab?
mind. IntervallskalaArithmetisches MittelEinstichproben-t-Test Weicht das arithmetische Mittel von einem festgelegten Wert ab?
VarianzF-Test Weicht die Varianz von einem festgelegten Wert ab?
VerteilungChi–Quadrat–Test
Kolmogorov-Smirnov-Test
Lilliefors-Test
Weicht die Verteilung eines kontinuierlich verteilten Merkmals von einer theoretisch angenommenen Verteilung ab?
Statistische Tests für die Verteilung eines Merkmals in einer Stichprobe
Die Tabelle steht Ihnen nur mit der Premium-Version zur Verfügung..
Maße des manifesten Zusammenhangs zweier Variablen
intervallskaliertordinalskaliertnominalskaliert
dichotompolytom
intervallskaliertProdukt-Moment-KorrelationSpearmans rho2)
Kendalls tau
punkt-biseriale Korrelation1)eta-Koeffizient
(Varianzanalyse)
ordinalskaliertSpearmans rho2)
Kendalls tau
biseriale RangkorrelationKontingenzkoeffizient
Cramers V
nominalskaliert: dichotomphi-Koeffizient1)
Yules Y
Kontingenzkoeffizient
Cramers V
nominalskaliert: polytomKontingenzkoeffizient
Cramers V
Statistische Maße für die Verteilung zweier bzw. den Zusammenhang zweier Merkmale (bivariante Korrelationsmaße)
Für alle in der Tab. aufgeführte Verfahren lautet die untersuchte Fragestellung: Besteht bzw. wie stark ausgeprägt ist ein Zusammenhang der beiden Analysevariablen? Die Auswahl der Verfahren wird durch das Skalenniveau (und ggf. Verteilungsannahmen) bestimmt. Maße des manifesten Zusammenhangs quantifizieren den Zusammenhang der gemessenen Werte. Maße des latenten Zusammenhangs quantifizieren den Zusammenhang der den gemessenen Were unterliegenden als normalverteilt angenommenen Merkmalsverteilungen.
Die Tabelle steht Ihnen nur mit der Premium-Version zur Verfügung..
Maße des latenten Zusammenhangs künstlich dichotomisierter oder polytomisierter normalverteilter Variablen
künstlich dichotomkünstlich polytom/ordinalintervallskaliert
natürlich dichotomnue-Koeffizient3)Biseriales eta3)
künstlich dichotom tetrachorische Korrelation4)polychorische Korrelation4)biseriale Korrelation4)
künstlich polytom/ordinalpolychorische Korrelation4)polychorische Korrelation4)polyseriale Korrelation4)
1) entspricht der Produkt-Moment-Korrelation
2) entspricht der Produkt-Moment-Korrelation der Rangreihen
3) entspricht der geschätzten punkt-biserialen Korrelation des dichotomen Merkmals mit dem latent normalverteilten Merkmal
4) Schätzung der Produkt-Moment-Korrelation der latenten bivariaten Normalverteilung

[Anmerkung: Diese Kategorie umfasst z.T. implizit auch Verfahren für Mittelwertvergleiche. Im Rahmen des Allgemeinen Linearen Modells sind bspw. die punkt-biseriale Korrelation und der t-Test für abhängige Stichproben äquivalent bzw. ineinander überführbar.]

Maßzahlen der epidemiologische Forschung sind z.T. ebenfalls als Indikatoren des bivarianten Zusammenhangs interpretierbar. Eine Übersicht findet sich in der Tab. zum Stichwort Epidemiologie.
Die Tabelle steht Ihnen nur mit der Premium-Version zur Verfügung..
Skalenniveau der AVStatistischer Parameter/Eigenschaft GruppenanzahlAnz. UV´sTestverfahrenFragestellung

Unterscheiden sich …
NominalskalaHäufigkeitsverteilung21Zweistichproben-Chi-Quadrat-Test
Fisher-Yates-Test
die Häufigkeitsverteilungen zweier Gruppen?
zentrale Tendenz gemäß Logit-Modell> 11Logistische Regression
Multinomiale Regression2)
die Häufigkeiten eines kategorialen Merkmals zwischen Gruppen?
OrdinalskalaMedian21Mann-Whitney-U-Testdie Mediane zwischen zwei Gruppen?
> 21Kruskal-Wallis-Test die Mediane zwischen mehr als zwei Gruppen?
zentrale Tendenz gemäß Logit-Modell> 11Ordinale Regression2)die ordinalen Merkmalsausprägungen zwischen Gruppen?
mind. IntervallskalaArithmetisches Mittel21t-Test für unabhängige Stichproben
Brown-Forsythe-Test
Welch-Test
die arithmetischen Mittelwerte zwischen zwei Gruppen?
> 21einfaktorielle Varianzanalyse
Brown-Forsythe-Test
Welch-Test
Varianzanalyse mit Messwiederholung3)
Mehrebenenanalyse3)
die arithmetischen Mittelwerte zwischen mehr als zwei Gruppen?
> 11Lineare Regression 2)die arithmetischen Mittelwerte zwischen Gruppen?
> 1> 1Mehrfaktorielle Varianzanalysedie arithmetischen Mittelwerte der Gruppen der einzelnen Faktoren (Faktor-spezifische Haupteffekte)?
Sind für Kombinationen von Stufen verschiedener Faktoren Mittelwertseffekte nachweisbar, die über die Haupteffekte der Einzelfaktoren hinausgehen (Interaktionseffekt)?
Varianz21F-Test
Levene-Test
die Varianzen zwischen zwei Gruppen?
Statistische Tests für Gruppenunterschiede1)
1) Wurden die Pbn in Gruppen bzw. sozialen/organisationalen Verbünden (z.B. Schulklassen, Arbeitsgruppen) erfasst, so bietet die Mehrebenenanalyse i.d.R. einen günstigen Analyseansatz.
2) Codierte (Codierung) Gruppenvariable als Prädikator. Der Regressionsansatz erlaubt zudem die simultane Berücksichtigung weiterer Prädikatoren (s. z.B Kovarianzanalyse).
3) Im Falle mehrerer abhängiger Stichproben.
Die Tabelle steht Ihnen nur mit der Premium-Version zur Verfügung..
SkalenniveauStatistischer Parameter/ EigenschaftAnzahl MesszeitpunkteTestverfahrenFragestellung

Verändert sich …
NominalskalaHäufigkeit2McNemar-Test
Bowker-Test
die Häufigkeit von Merkmalsausprägungen für zwei Messpunkte?
OrdinalskalaMedian2Wilcoxon-Vorzeichen-Rangtestder Median eines Merkmals über die Zeit?
> 2Friedman-Test
mind. IntervallskalaArithmetisches Mittel2t-Test für abhängige Stichprobendas arithmetische Mittel über die Zeit?
> 2Varianzanalyse mit Messwiederholungdas arithmetische Mittel über die Zeit?
> 1Wachstumskurvenmodelle, latentedie Ausprägung latenter Variablen über die Zeit (durchschnittliche und indiv. Veränderungsprozesse)?
Orientietierung >20Zeitreihenanalyse Insbes. Analyse von Trends und periodischen Entwicklungen.
Die Mehrebenenanalyse bietet einen alternativen Analyserahmen zur Analyse abhängiger Daten. Dieser erlaubt die Modellierung unterschiedlicher Skalenniveaus und setzt z.B. im Vergleich zur Varianzanalyse mit Messwiederholung nicht die Annahme der Homoskedaszidität voraus.
Wird analysiert, ob die Veränderung über die Zeit von (einem) anderen Merkmale(n) (Faktoren; z.B. Gruppenzugehörigkeit: Experimental- vs. Kontrollgruppe) abhängig ist, so werden diese z.B. in der Varianz-, Regressions- oder Mehrebenenanalyse als weitere Faktoren (Prädiktoren) neben dem Zeitfaktor in das Modell aufgenommen (mehrfaktorieller Analyseansatz). Der Interaktionseffekt von Zeit und dem/n übrigen Faktoren repräsentiert dann heterogene (z.B. gruppenspezifische) Entwicklungen über die Zeit.
Statistische Tests für die Veränderung von Merkmalsausprägungen über die Zeit (bzw. abhängige Stichproben)
Die Tabelle steht Ihnen nur mit der Premium-Version zur Verfügung..
Skalenniveau/Datenformat der Prädiktoren1)Skalenniveau/Format der KriteriumsvariablenAnzahl der KriteriumsvariablenTestverfahrenFragestellung
Modellierung der Vorhersage-/Zusammenhangstruktur der Prädiktoren und
dichotom und/oder mind. Intervallskaladichotom1 Logistische Regression2,3)
ROC-Analyse
einem dichotomen Kriterium.
Nominalskala1Multinomiale Regression2,3)
Diskriminanzanalyse
einem dichotom, polytomen Kriterium.
Ordinalskala1Ordinale Regression2,3)einem ordinalen Kriterium.
mind. Intervallskala1Lineare Regression 2,3)
Nicht lineare Regression2,3)
einem mind. intervallskalierten Kriterium.
> 1Kanonische Korrelation
Strukturgleichungsmodelle
mehreren mind. intervallskalierten Kriterien.
Überlebenszeiten1Cox-Regression2,3)der Zeit bis zum Eintritt eines Ereignisses.
Regressionsanalytische Verfahren1)
Alle Verfahren dienen der Modellierung des Zusammenhangs eines Prädikators oder mehrerer Prädikatoren mit einem Kriterium oder mehreren Kriterien. Es resultiert eine gewichtete Gleichung zur optimalen Vorhersage.

1) Wurden die Pbn in Gruppen bzw. sozialen/organisationalen Verbünden (z.B. Schulklassen, Arbeitsgruppen) erfasst, so bietet die Mehrebenenanalyse i. d. R. einen günstigeren Analyseansatz.
2) ‹Einfache› Modelle: ein Prädiktor; ‹Multiple› Modelle: Simultane Modellierung mehrerer Prädiktoren.
3) >Hierarchische Regression: Prädiktoren werden sukzessive (ggf. in Blöcken) in das Modell eingeführt. Schrittweise Regression (Wherry-Doolittle-Verfahren): Nur Prädiktoren, die die Vorhersage substantiell verbessern, werden ins Modell aufgenommen.
Die Tabelle steht Ihnen nur mit der Premium-Version zur Verfügung..
Skalenniveau des/r latenten Merkmals/e Skalenniveau / Format der manifesten IndikatorenAnalysemodell/-verfahren
NominalskalaDichotom
Polytom, Nominalskala
Ordinalskala
Latente Klassenanalyse
Intervallskala/kontinuierlichDichotomItem-Response-Theorie (insbes. dichotomes Rasch-Modell)
Polytom, NominalskalaItem-Response-Theorie (insbes. Rasch-Modell, mehrdimensionales nominales)
Latent Structure Analysis
OrdinalskalaItem-Response-Theorie (insbes. Rasch-Modell, ordinales)
mind. IntervallskalaFaktorenanalyse, exploratorische1)
Faktorenanalyse, konfirmatorische
Merkmal 1: Nominalskala
Merkmal 2: > Intervallskala/kontinuierlich
Dichotom
Ordinalskala
Mixed-Rasch-Modell1)
1) Exploratorische Modelle, bei denen Anzahl der latenten Merkmalen und die Zuordnung der Indikatoren zu den latenten Merkmalen im Rahmen der Analyse bestimmt und nicht theoriebasiert festgelegt werden.

Analyse latenter Merkmale auf Basis manifester Indikatoren
Diese Modelle kommen vor allem im Bereich der Test-/Skalenanalyse und Kompetenzmodellierung zum Einsatz. Es wird keine Unterscheidung in Prädikatoren und Kriterien vorgenommen, sondern die Ausprägung der gemesenen manifesten Merkmale wird als messfehlerbehafteter oder stochastischer Indikator einer latenten Merkmalsausprägung angenommen.
Die Tabelle steht Ihnen nur mit der Premium-Version zur Verfügung..
Weitere multivariate Analyseverfahren und Modellierungsansätze
Verfahren/ModellAnmerkungen/Analyseziele
Allgemeines Lineares ModellGemeinsamer Modellrahmen für multivariate Zusammenhangsanalyse, innerhalb dessen sich insbesondere die Unterscheidung in Regressions- und Varianzanalytische Verfahren erübrigt.
ClusteranalyseExploratorischer Ansatz zur Identifikation von Personentypen oder Merkmalsprofilen (z.B. Belastungsprofile, Persönlichkeitstypen, Käufertypen). Ähnliche Zielsetzung wie die latente Klassenanalyse. Bei der Clusteranalyse werden die manifesten Antwortmuster direkt modelliert. Bei der latenten Klassenanalyse werden hingegen die Antwortwahrscheinlichkeiten modelliert.
Conjoint-AnalyseBestimmung des Einflusses oder Nutzens einzelner Eigenschaften auf die Präferenzwahl, wenn zwischen verschiedenen Alternativen gewählt werden muss (z.B. Relevanz von Behandlungsmerkmalen bei der Entscheidung für eine Behandlungsform).
Data MiningÜberbegriff für den Einsatz unterschiedlicher explorativer Datenanalyseverfahren (z.B. Klassifikationsbäume, Neuronale Netze) in großen Datenmengen mit dem Ziel Hinweise auf markante Datenstrukturen zu erhalten
KonfigurationsfrequenzanalyseIdentifikation von Typen oder Mustern in Itemgruppen mit kategorialem Antwortformat
Korrespondenzanalyse Analyse von Daten einer zweidimensionalen Kontingenztabelle (z.B. Zeilen: Persönlichkeitstypen, Spalten: gezeigte Emotionen) mit dem Ziel der Visualisierung des Merkmalsraums bzgl. Nähe/Distanz von Alternativen.
KovarianzanalyseAnalyse von Gruppenunterschieden oder zeitlichen Veränderungen mittels Varianzanalyse mit statistischer Kontrolle potentiell verzerrender konfundierter Variablen.
Loglineare-ModelleModellierung der Zellhäufigkeit in einer Kontingenztabelle aufgrund der kategorialen Ausprägung der Zeilen- und Spaltenausprägungen (z.B. Spalten: Persönlichkeitstyp; Spalten: gezeigte Emotionen).
MehrebenenanalyseAnalyse multivariater Zusammenhangsstrukturen (insbes. Varianz-, Regressions- und Faktorenanalyse), wenn die Probanden sozialen Einheiten (Gruppen/Clustern, z.B. Schulklassen, Arbeitsgruppen) angehören. Bietet auch einen günstigen Analyseansatz bei Messwiederholungsdaten.
Moderatoranalyse (Moderatorvariable)Identifikation von Unterschieden in der Stärke des Zusammenhangs zweier Merkmale z.B. für verschiedene Gruppen oder in Abhängigkeit eines kontinuierlich verteilten Merkmals.
Multidimensionale SkalierungIdentifikation von Wahrnehmungs- oder Bewertungsdimensionen auf Basis von Ähnlichkeitsbeurteilung in Form von Triadenvergleichen: Welche beiden der Alternativen A, B und C sind sich am ähnlichsten?
Multitrait-Multi method-AnalyseIdentifikation von Antwortkomponenten, wenn angenommen wird, dass die Ausprägungen der gemessenen Daten sowohl von der zu messenden Eigenschaft (trait) als auch von der verwendeten Erhebungsmethode (z.B. Fragebogen, Beobachtung) determiniert werden. Ein ähnliches Analyseziel verfolgt die die dreimodale Faktorenanalyse.
Neuronale NetzeComputerbasierte Simulation neuronaler Verarbeitungsstrukturen (Informationsknoten, -schichten und -verbindungen) die durch Erfahrungen lernen, in dem Sinne, dass die Parameter innerhalb des Netzes sukzessive auf Basis von Prognoserfolgen vs. -misserfolgen optimiert eingestellt werden. Können als erfahrungsbasiert optimierte Prognosemodelle aufgefasst werden, deren Struktur sich exploratorisch, adaptiv und dynamisch entwickelt.
PfadanalyseKorrelationsstatistische Analyse theoriebasiert entwickelter Modelle von Kausalgefügen. Kann z.B. der Effekt von X auf Y durch ein zwischengeschaltetes Merkmal Z partiell oder komplett modelliert werden, so wird Z als Mediatorvariable bezeichnet.
StrukturgleichungsmodelleMultivariater Analyseansatz, der zur Schätzung (beliebig komplexer) theoriebasierter Modelle unter Berücksichtigung metrischer latenter Merkmale eingesetzt werden kann. Vereinigt u.a. die Merkmale pfad-, regressions- und faktorenanalytischer Modellierungsansätze. Die konfirmatorische Faktorenanalyse stellt einen Spezialfall dar.
SurvivalanalyseAnalyse bzw. Vorhersage der Zeit bis zum Eintritt eines Ereignisses.
Statistische Datenanalyseverfahren: Überblick und Entscheidungskriterien
Die Tabelle steht Ihnen nur mit der Premium-Version zur Verfügung..

Referenzen und vertiefende Literatur

Die Literaturverweise stehen Ihnen nur mit der Premium-Version zur Verfügung.

Datenschutzeinstellungen

Wir verwenden Cookies und Analysetools, um die Sicherheit und den Betrieb sowie die Benutzerfreundlichkeit unserer Website sicherzustellen und zu verbessern. Weitere informationen finden Sie unter Datenschutz. Da wir Ihr Recht auf Datenschutz respektieren, können Sie unter „Einstellungen” selbst entscheiden, welche Cookie-Kategorien Sie zulassen möchten. Bitte beachten Sie, dass Ihnen durch das Blockieren einiger Cookies möglicherweise nicht mehr alle Funktionalitäten der Website vollumfänglich zur Verfügung stehen.