Skalierung, Methoden der

 

(= S.) [engl. scaling methods; lat scala Treppe], [DIA, FSE]. (1) Anwendung einerSkala. Im einfachsten Fall befragt man Personen (z. B. «Wie gefällt Ihnen Venedig?») mit einer vorgegebenen Antwortskala (z. B. 0 = «gar nicht» bis 10 = «sehr gut»). Die Person beantwortet die Frage mit der Wahl einer der Kategorien der Antwortskala; oder sie antwortet nicht (KM = «keine Meinung», «trifft nicht zu», «weiß nicht»). Der Person wird dann der numerische Code der Antwortkategorie (bzw. KM oder «missing») als Messwert zugewiesen. Bei Skalen mit mehreren Items zum selben Thema werden die einzelnen Antwortwerte (mit Ausnahme von KM-Antworten) zu einem Gesamtwert aggregiert (d. h. meist mittels Mittelwertsbildung). Ein Bsp. hierfür ist die Introversion-Extraversion-Skala mit den Items «Ich bin eher zurückhaltend, reserviert» und «Ich gehe aus mir heraus, bin gesellig», jeweils kombiniert mit der fünfstufigen Likert-Antwortskala (Likert-Skala) von –2 = «trifft überhaupt nicht zu» bis +2 = «trifft voll und ganz zu». Antwortet eine Person hier mit –2 bzw. mit 1, dann erhält sie den Gesamtscore 1,5 auf dieser IE-Skala, also einen relativ hohen Extraversionswert (Rammstedt & John, 2007).

(2) Konstruktion einer Skala. Diese beruht auf einem S.modell, das postuliert, wie die beobachteten Beziehungen der Elemente (Personen, Stimuli) generiert werden. Bsp. A: Die Testaufgaben der Skala sind auf einer Dimension (z. B. «Grundrechnen» oder «Erkennen von Morse-Codes») von leicht bis schwer geordnet; jede Person löst alle Testaufgaben bis zu einem best. Schwierigkeitsgrad und keine Testaufgabe, die schwerer ist als diese Testaufgabe (Guttman-Skala, Skalierung, testtheoretisches Gütekriterium, Rasch-Modell); eine fähigere Person löst also immer alle Aufgaben, die eine weniger fähige Person auch löst, und darüber hinaus mind. eine weitere. Beispiel B: Die Einstellungsobjekte (z. B. politische Parteien) liegen «im Kopf» des Befragten auf einer Dimension (z. B. dem politischen Links-Rechts-Spektrum); die Person wählt die Partei, die ihrem Idealpunkt am nächsten liegt bzw., allgemeiner, ihre Präferenz für die verschiedenen Parteien nimmt mit der Distanz der Parteien von ihrem Idealpunkt monoton ab (Unfolding-Modell). Bsp. C: Fechner-Modelle (Fechner-Skalierung) postulieren, dass die Wahrscheinlichkeit, mit der die Objekte i und j verwechselt werden (p_%7Bij%7D), der Distanz der Punkte i und j in einem durch eine ein- oder mehrdimensionale Skala aufgespannten «psychologischen Raum» (d_{ij}) entspricht, d. h., es soll d_%7Bij%7D%3Df%20%5Babs(p_%7Bij%7D-0%2C5%7D)%20%20%5D gelten, wobei f eine monoton steigende Funktion ist.

S.modelle werden zunächst mit einer Startmenge von Items an Testpersonen wiederholt ausprobiert (Testkonstruktion). Wenn sich die Antworten der Testpersonen im gewählten Modell «gut genug» (d. h. mit nur kleinen Fehlern) darstellen lassen, dann wird das Modell zusammen mit den Items als geeignet akzeptiert: Es soll sich dann dazu eignen, eine potenziell unendliche Vielfalt von Beobachtungen best. Art (d. h. das Universum best. Items) sparsam zu erklären und zu messen (i. S. eines «so könnte der Befragte seine Antworten erzeugt haben» oder i. S. von «so lassen sich die Daten einfach beschreiben»). Selten eignen sich plausibel erscheinende S.modelle allerdings auf Anhieb für einen best. Gegenstandsbereich. Sie müssen vielmehr entwickelt werden. Dazu gehört zum einen, die Items so auszuwählen oder zu modifizieren, dass sie in das S.modell passen (z. B. Testtheorie, bei der die Items bzgl. Kriterien wie Trennschärfe, Schwierigkeit und Reliabilität bewertet und entwickelt werden; Gütekriterien). Zum anderen muss auch beurteilt werden, ob sich das Modell überhaupt eignet, d. h. insbes., ob Items, die alle in eine best. Grundgesamtheit von Items passen (z. B. alle Items zur Intro- und Extraversion), wirklich ein- oder nicht vielmehr multidimensional sind (Faktorenanalyse). Zudem kann die vom Modell postulierte Verrechnungsregel [engl. composition rule] anders sein als vermutet, d. h., die Personen erzeugen ihre Antworten oder Urteile aus den gegebenen Informationen nicht so wie vom Modell vermutet (z. B. nicht nach der Regel «Distanz vom Idealpunkt» im Unfolding-Modell, sondern per stufenweiser Elimination unattraktiver Alternativen).

Ein vollst. Austesten von S.modellen wird in der Praxis selten realisiert. Meist wird einfach angenommen, dass ein best. Gegenstandsbereich skalierbar ist, d. h. insbes., dass die Gegenstände auf einer Dimension liegend geordnet werden können, dass sie also z. B. vom Befragten alle als in nur einem (wesentlichen) Merkmal verschieden wahrgenommen werden. Items, die nicht in dieses Modell passen, werden eliminiert oder so lange verändert, bis sie passen (Skalierung, testtheoretisches Gütekriterium). Einstellungsskalen.

Verwendete Literatur

Sie sind schon registriert? Zur Anmeldung
Erstellen Sie einen Account um das komplette Literaturverzeichnis einzusehen.