Testfairness

 

(= T.) [engl. test fairnessfairness Gerechtigkeit], [DIA], Ausmaß, in dem die aus einem Test resultierenden Werte zu keiner systematischen Benachteiligung best. Testpersonen bzw. Gruppen von Testpersonen führen. Eine systematische Benachteiligung kann sich z. B. aufgrund der ethnischen, soziokult. oder geschlechtsspezif. Zugehörigkeit ergeben. Seit den 1970er-Jahren wird das Thema der T. ausgehend vom Bereich der Intelligenzdiagnostik diskutiert. Es wurden vermehrt Tests entwickelt, die von Einflüssen des soziokult., schulischen und erziehungsspezif. Erfahrungshintergrundes möglichst unabhängig und damit fair sein sollten. T. bezieht sich in diesem Zus.hang vornehmlich auf Aspekte, die unmittelbar mit den Inhalten der Testaufgaben zu tun haben. Bei den sog. culture-fair tests ([engl.] kulturfaire Tests) erfolgt die Lösung der Aufgaben unabhängig von der/n Kulturzugehörigkeit/en der Testpersonen. Die Aufgaben sind derart gestaltet, dass sie keine bzw. nur geringe Voraussetzungen an die Beherrschung von Sprache bzw. von anderen Kulturtechniken wie Lesen oder Mathematik stellen. Die kulturfairen Verfahren arbeiten daher häufig mit geometrischen Figuren und Symbolik. Bsp. für kulturfaire Verfahren zur weitgehend sprachfreien Erfassung von Intelligenz (sprachfreie Tests) sind die Grundintelligenztest-Skalen (Grundintelligenztest (CFT 1 / 2 / 20-R / 3)) oder Matrizentests wie Ravens progressive Matrizen (Standard Progressive Matrices (SPM), Coloured Progressive Matrices (CPM), Advanced Progressive Matrices (APM)) oder der Bochumer Matrizentest (BOMAT). Culture fair bez. dennoch eher einen Ansatz bei der Konstruktion von Testaufgaben als eine vollkommene Umsetzung. Es konnte vielfach gezeigt werden, dass ein Rest von Kulturabhängigkeit erhalten bleibt (Süß 2003).

T. kann sich nicht nur unmittelbar auf die Inhalte der Testaufgaben beziehen (Differential Item Functioning (DIF)), sondern prinzipiell auf alle Aspekte eines Tests – von der Konstruktion über die Durchführung bis hin zur Auswertung. Ein übergeordnetes Verständnis von T. bildet daher die Gleichbehandlung aller Testpersonen, z. B. hinsichtlich Testbedingungen, Zugang zu Übungsmaterial, Rückmeldung und weiteren Aspekten der Testadministration. Alle Testpersonen sollten in einem Test und bei den aus ihm resultierenden Ergebnissen und Schlussfolgerungen in «fairer» Weise behandelt werden (Teststandards). Bei der computerbasierten Diagnostik spielen für die T. neben sprachlichen Aspekten bspw. auch Aspekte wie die Erfahrung im Umgang mit Computern eine wichtige Rolle. Wenn ein Testverfahren am Computer dargeboten wird, müsste i. S. der T. sichergestellt werden, dass etwa Testpersonen ohne Computererfahrung durch die Testbearbeitung nicht systematisch benachteiligt werden. Vertrautheit mit Tests (z. B. durch wiederholte Testbearbeitung) kann ein Testergebnis unabhängig von dem zu messenden Merkmal beeinflussen und sollte entspr. berücksichtigt werden. T. beinhaltet auch die Verwendung prognostisch valider Testverfahren (Prognose) sowie gleiche Verläufe von Regressionsgeraden für Angehörige versch. Gruppen. Ein Instrument ist dann nicht fair, wenn eine differenzielle prädiktive Validität (unterschiedliche Steigungen der Regressionsgeraden; Moderatorvariable) oder eine systematische Validitätsüberschätzung oder -unterschätzung (Achsenabschnitte der Regressionsgeraden) vorliegen (zu psychol.-diagn. Fairnessmodellen s. Amelang & Schmidt-Atzert, 2012). Bzgl. Testadaptationen oder -übersetzungen sollte i. S. der T. gelten, dass in allen Testversionen dieselben Konstrukte erfasst werden und durch die Vorgabe best. Testversionen keine Zielgruppen systematisch benachteiligt werden (Teststandards; Messinvarianz). Eine insbes. in den Bildungswissenschaften (Bildungsforschung) verbreitete Auffassung von T. bezieht sich auf gleiche Rahmenbedingungen des Lernens (z. B. hinsichtlich Curricula, Bereitstellung von Lernmaterialien, Ausstattung von Bildungsinstitutionen, Qualifikation von Lehrpersonen). Die Testpersonen sollten vergleichbare Gelegenheiten haben, den Testgegenstand zu lernen [engl. opportunity to learn].

Bei der T. handelt es sich um ein Testgütekriterium (Gütekriterien) zur Beurteilung psychol.-diagn. Testverfahren, das zu den Nebengütekriterien gezählt wird. Nebengütekriterien sind erstrebenswerte, aber nicht notwendige Kriterien eines Tests. Den Hauptgütekriterien ObjektivitätReliabilität und Validität dagegen muss ein Test zur Sicherung seiner Qualität notwendigerweise genügen. Es gibt nicht den fairen Test, sondern nur Fairness im Hinblick auf Handlungs- und Entscheidungsaspekte, die expliziert werden müssen. Dasselbe Testinstrument kann in Abhängigkeit von den angestrebten Zielen mehr oder weniger fair sein. Ansätze zur Verbesserung der T. umfassen das nachträgliche Adjustieren von Testergebnissen (z. B. Differential Item Functioning (DIF); Item-Response-Theorie (IRT)) oder Mischverteilungsmodelle (Mischverteilungsmodelle, diskrete; Mixed Rasch-Modell)), die Entwicklung neuer Aufgaben, die weniger benachteiligen, oder die strukturierte Vorbereitung versch. Teilnehmergruppen.

Referenzen und vertiefende Literatur

Sie sind schon registriert? Zur Anmeldung
Erstellen Sie einen Account um das komplette Literaturverzeichnis einzusehen.