Klassische Testtheorie

 

(= KTT bzw. KT) [engl. classical test theory, CTT], [DIA, FSE]. Die KTT stellt eine Sammlung von Methoden zur exakten und ökonomischen Erfassung interindiv. Unterschiede dar (Gulliksen, 1950, Lord & Novick, 1968, Zimmerman, 1975). Eine Vielzahl der gebräuchlichen psychometrischen Testverfahren (Test, Testkonstruktion, Testtheorie, Psychologische Diagnostik) beruht auf den Annahmen und den Konstruktionsprinzipien der KTT. Das Attribut «klassisch» soll nicht nur auf das gereifte Alter dieser formalen Theorie verweisen, sondern auch darauf, dass mittlerweile mit der probabilistischen Testtheorie (Item-Response-Theorie (IRT)) ein modernerer Ansatz formuliert wurde, der versch. Nachteile der KTT zu vermeiden sucht.

Annahmen der Klassischen Testtheorie: Die Kernüberlegung der KTT besteht darin, dass sich die mit einem Test ermittelte, beobachtete Merkmalsausprägung X einer Person additiv aus zwei Komponenten zus.setzt, nämlich der tatsächlichen, wahren Merkmalsausprägung T (true score) sowie einem zufälligen Messfehler E:

X = T + E.

So setzt sich bspw. das Intelligenztestergebnis einer Person zus. aus ihrer wahren Intelligenz zzgl. unsystematischer, d. h. in Stärke und Richtung unklarer, Fehlereinflüsse (z. B. Schwankungen der Aufmerksamkeit oder Motivation). Die KTT geht davon aus, dass die wahre Merkmalsausprägung intraindiv. konstant ist und die Messfehler sich bei wiederholten Messungen ausgleichen («herausmitteln»). Der erwartete Mittelwert des Messfehlers ist demnach Null. Wenn der Messfehler Null ist, entspricht die beobachtete Merkmalsausprägung der wahren Merkmalsausprägung:

X = T + 0 = T.

Würde also bei einer Person immer wieder (unendlich oft) die Intelligenz gemessen, entspräche der Mittelwert dieser Messungen dem wahren Intelligenzwert. Das ist auch ein Grund dafür, warum i. R. der KTT zur Erfassung der Ausprägung eines Merkmals bei einer Person jew. mehrere Items verwendet werden, die dasselbe Konstrukt erfassen. Jedes dieser Items wird dabei als wiederholte Messung aufgefasst. Messfehler werden durch die Zus.fassung der einzelnen Messungen zu einem Testwert ausgeglichen. Als Testwert der KTT, der als Schätzer der wahren Merkmalsausprägung gilt (Punktschätzung), wird zumeist die Summe der Antworten auf die Items verwendet, wobei Intervallskalierung (Intervallskala) der Antworten vorausgesetzt wird. Aus den Annahmen der KTT lassen sich Aussagen über die Reliabilität und weitere Eigenschaften eines Tests (Gütekriterien) ableiten (Moosbrugger, 2012).

Kritik an der Klassischen Testtheorie: Die Vorzüge der KTT sind vor allem in der Einfachheit ihrer Annahmen sowie der daraus resultierenden leichten empirischen Realisierbarkeit zu sehen. Die nach den Prinzipien der KTT entwickelten Verfahren haben sich in der diagn. Handhabung vielfach bewährt, d. h., sie erlauben eine differenzierte Beschreibung interindiv. Unterschiede. Gegenüber der KTT sind allerdings auch Einwände hervorzubringen. Die Annahmen der KTT werden beweislos vorausgesetzt (Axiom). Tatsächlich sind sie empirisch kaum überprüfbar, da sowohl wahrer Wert als auch Fehler nicht direkt beobachtbar sind (Steyer & Eid, 2001). Die Annahme, dass sich der beobachtete Wert aus wahrem Wert und (zufälligem) Fehler zus.setzt, ist möglicherweise zu grob. Erweiterungen der KTT erlauben z. B. die Berücksichtigung versch. Arten von Messfehlern (Generalisierbarkeitstheorie; Latent-State-Trait-Theorie). Die Annahme einer intraindiv. Konstanz (Invarianz) des wahren Wertes einer Person ist nur bei kurzen Zeiträumen und auch nur für best. Merkmalsbereiche vertretbar. Die KTT setzt mind. Intervallskalenniveau voraus. Bei einigen Testverfahren ist fraglich, ob diese Qualität erreicht wird. Außerdem sind die Kenngrößen der KTT (Reliabilität, Itemschwierigkeit, Itemtrennschärfe etc.; Itemanalyse) stichprobenabhängig. Je nach Zus.setzung der herangezogenen Stichprobe können sie unterschiedlich ausfallen. Es stellt sich folglich die Frage nach der Verallgemeinerbarkeit und Verbindlichkeit von Ergebnissen. Zudem beschränkt sich die KTT hauptsächlich auf die Reliabilität eines Tests und trifft zur Validität kaum Aussagen. Angesichts dieser und weiterer Einwände ist die probabilistische Testtheorie (Item-Response-Theorie (IRT)) als maßgebliche Ergänzung zur KTT zu sehen, die in der Lage ist, Grenzen und Probleme der KTT zu überwinden. Steyer & Eid (2001) und Eid & Schmidt (2014) zeigen allerdings, dass zentrale Annahmen der KTT durch die konfirmatorische Faktorenanalyse angemessen geprüft werden können. Ein grundlegender Vorteil probabilistischer Modelle gegenüber der KTT ist aufgrund der Prüfbarkeit der Modellannahmen somit nicht mehr begründbar.

Referenzen und vertiefende Literatur

Sie sind schon registriert? Zur Anmeldung
Erstellen Sie einen Account um das komplette Literaturverzeichnis einzusehen.