Clusteranalyse
[engl. cluster analysis; cluster Gruppe, Klumpen], [FSE], deskriptive Methode zur Gruppierung von Objekten (z. B. Tests, Personen) bzgl. der Analysemerkmale in homogene Untergruppen (cluster). Während die Faktorenenanalyse eine variablenreduzierende Zielsetzung verfolgt (Gruppen von Items werden als homogene Indikatorgruppe einer jew. latenten Variablen identifiziert), werden bei der Clusteranalyse viele Objekte zu wenigen homogenen Gruppen mit jew. typischen Merkmalskonstellation zus.gefasst: Cluster können i. d. R. aufgrund eines charakteristischen Antwortprofils auf den Analysevariablen typologisch interpretiert werden. Zur Clusteranalyse zählen insbes. Klassifikations- oder taxometrische Methoden zur Auffindung «natürlicher» Gruppierungen, die rechnerisch nicht von der Interkorrelationsmatrix, sondern auf Basis metrischer oder nicht metrischer Distanzen identifiziert werden: bei dichotomen Merkmalen: z. B. Lance-Williams-Distanz; bei polytomen, nominalen Merkmalen: Chi-Quadrat-Maß; bei intervallskalierten Maßen: Minkowski-Metrik, euklidische Distanz, City-Block-Metrik, Tschbycheff-Distanz). Ein schrittweises Vorgehen durch Zus.fassung von kleinsten zu immer größeren Gruppen (bzw. umgekehrt durch Aufteilung größter in kleinere Gruppen) zus.gehöriger Objekte wird als hierarchische Clusteranalyse bez. Bei großen Datenmengen kommt der K-Means-Algorithmus (syn. Quick-Cluster; initiale Festlegung der Clusteranzahl ist erforderlich) oder die Two-Step-Clusteranalyse, die die Bestimmung der optimalen Clusteranzahl mittels informationstheoretischer Maße erlaubt, zum Einsatz. Die Latente Klassenanalyse verfolgt ähnliche Ziele wie die Clusteranalyse: Das Antwortverhalten wird aber als probabilistisch modelliert (nicht die Antworten der Pbn selbst, sondern die Antwortwahrscheinlichkeiten werden modelliert), was psychometrisch insbes. bei kategorialen Variablen als vorteilhaft gelten kann (Item-Response-Theorie).