Klassische Testtheorie

 

[engl. classical test theory, CTT], [DIA, FSE]. Die Klassische Testtheorie stellt eine Sammlung von Methoden zur exakten und ökonomischen Erfassung interindiv. Unterschiede dar (Gulliksen, 1950, Lord & Novick, 1968, Zimmerman, 1975). Eine Vielzahl der gebräuchlichen psychometrischen Testverfahren (Test, Testkonstruktion, Testtheorie, Psychologische Diagnostik) beruht auf den Annahmen und den Konstruktionsprinzipien der Klassischen Testtheorie. Das Attribut «klassisch» soll nicht nur auf das gereifte Alter dieser formalen Theorie verweisen, sondern auch darauf, dass mittlerweile mit der probabilistischen Testtheorie (Item-Response-Theorie (IRT)) ein modernerer Ansatz formuliert wurde, der versch. Nachteile der Klassischen Testtheorie zu vermeiden sucht.

Annahmen der Klassischen Testtheorie: Die Kernüberlegung der Klassischen Testtheorie besteht darin, dass sich die mit einem Test ermittelte, beobachtete Merkmalsausprägung X einer Person additiv aus zwei Komponenten zus.setzt, nämlich der tatsächlichen, wahren Merkmalsausprägung T (true score) sowie einem zufälligen Messfehler E:

X = T + E.

So setzt sich bspw. das Intelligenztestergebnis einer Person zus. aus ihrer wahren Intelligenz zzgl. unsystematischer, d. h. in Stärke und Richtung unklarer, Fehlereinflüsse (z. B. Schwankungen der Aufmerksamkeit oder Motivation). Die Klassische Testtheorie geht davon aus, dass die wahre Merkmalsausprägung intraindiv. konstant ist und die Messfehler sich bei wiederholten Messungen ausgleichen («herausmitteln»). Der erwartete Mittelwert des Messfehlers ist demnach Null. Wenn der Messfehler Null ist, entspricht die beobachtete Merkmalsausprägung der wahren Merkmalsausprägung:

X = T + 0 = T.

Würde also bei einer Person immer wieder (unendlich oft) die Intelligenz gemessen, entspräche der Mittelwert dieser Messungen dem wahren Intelligenzwert. Das ist auch ein Grund dafür, warum i. R. der Klassischen Testtheorie zur Erfassung der Ausprägung eines Merkmals bei einer Person jew. mehrere Items verwendet werden, die dasselbe Konstrukt erfassen. Jedes dieser Items wird dabei als wiederholte Messung aufgefasst. Messfehler werden durch die Zus.fassung der einzelnen Messungen zu einem Testwert ausgeglichen. Als Testwert der Klassischen Testtheorie, der als Schätzer der wahren Merkmalsausprägung gilt (Punktschätzung), wird zumeist die Summe der Antworten auf die Items verwendet, wobei Intervallskalierung (Intervallskala) der Antworten vorausgesetzt wird. Aus den Annahmen der Klassischen Testtheorie lassen sich Aussagen über die Reliabilität und weitere Eigenschaften eines Tests (Gütekriterien) ableiten (Moosbrugger, 2012).

Kritik an der Klassischen Testtheorie: Die Vorzüge der Klassischen Testtheorie sind vor allem in der Einfachheit ihrer Annahmen sowie der daraus resultierenden leichten empirischen Realisierbarkeit zu sehen. Die nach den Prinzipien der Klassischen Testtheorie entwickelten Verfahren haben sich in der diagn. Handhabung vielfach bewährt, d. h., sie erlauben eine differenzierte Beschreibung interindiv. Unterschiede. Gegenüber der Klassischen Testtheorie sind allerdings auch Einwände hervorzubringen. Die Annahmen der Klassischen Testtheorie werden beweislos vorausgesetzt (Axiom). Tatsächlich sind sie empirisch kaum überprüfbar, da sowohl wahrer Wert als auch Fehler nicht direkt beobachtbar sind (Steyer & Eid, 2001). Die Annahme, dass sich der beobachtete Wert aus wahrem Wert und (zufälligem) Fehler zus.setzt, ist möglicherweise zu grob. Erweiterungen der Klassischen Testtheorie erlauben z. B. die Berücksichtigung versch. Arten von Messfehlern (Generalisierbarkeitstheorie; Latent-State-Trait-Theorie). Die Annahme einer intraindiv. Konstanz (Invarianz) des wahren Wertes einer Person ist nur bei kurzen Zeiträumen und auch nur für best. Merkmalsbereiche vertretbar. Die Klassische Testtheorie setzt mind. Intervallskalenniveau voraus. Bei einigen Testverfahren ist fraglich, ob diese Qualität erreicht wird. Außerdem sind die Kenngrößen der Klassischen Testtheorie (Reliabilität, Itemschwierigkeit, Itemtrennschärfe etc.; Itemanalyse) stichprobenabhängig. Je nach Zus.setzung der herangezogenen Stichprobe können sie unterschiedlich ausfallen. Es stellt sich folglich die Frage nach der Verallgemeinerbarkeit und Verbindlichkeit von Ergebnissen. Zudem beschränkt sich die Klassische Testtheorie hauptsächlich auf die Reliabilität eines Tests und trifft zur Validität kaum Aussagen. Angesichts dieser und weiterer Einwände ist die probabilistische Testtheorie (Item-Response-Theorie (IRT)) als maßgebliche Ergänzung zur Klassischen Testtheorie zu sehen, die in der Lage ist, Grenzen und Probleme der Klassischen Testtheorie zu überwinden. Steyer & Eid (2001) und Eid & Schmidt (2014) zeigen allerdings, dass zentrale Annahmen der Klassischen Testtheorie durch die konfirmatorische Faktorenanalyse angemessen geprüft werden können. Ein grundlegender Vorteil probabilistischer Modelle gegenüber der Klassischen Testtheorie ist aufgrund der Prüfbarkeit der Modellannahmen somit nicht mehr begründbar.

Referenzen und vertiefende Literatur

Die Literaturverweise stehen Ihnen nur mit der Premium-Version zur Verfügung.

Datenschutzeinstellungen

Wir verwenden Cookies und Analysetools, um die Sicherheit und den Betrieb sowie die Benutzerfreundlichkeit unserer Website sicherzustellen und zu verbessern. Weitere informationen finden Sie unter Datenschutz. Da wir Ihr Recht auf Datenschutz respektieren, können Sie unter „Einstellungen” selbst entscheiden, welche Cookie-Kategorien Sie zulassen möchten. Bitte beachten Sie, dass Ihnen durch das Blockieren einiger Cookies möglicherweise nicht mehr alle Funktionalitäten der Website vollumfänglich zur Verfügung stehen.