Teststandards

 

[engl. test standards], [DIA], sind Standards oder Leitlinien, deren Einhaltung – in Kombination mit einem kompetenten diagn. Beurteilungsprozess (diagnostischer Prozess) – Qualitätsstandards psychol. Testens sicherstellen soll. Maßgebende Teststandards wurden von der American Educational Research Association (AERA), American Psychological Association (APA), National Council on Measurement in Education (NCME), dem Diagnostik- und Testkuratorium der Föderation Deutscher Psychologenvereinigungen (TK; Föderation Deutscher Psychologenvereinigungen) und der International Test Commission (ITC) entwickelt (z. B. Standards for Educational and Psychological Testing (SEPT; AERA, APA & NCME 2014); dt. Übersetzung Standards für pädagogisches und psychologisches Testen (SPPT; Häcker et. al., 1998).

(1) Testkonstruktion (Entwicklung und Evaluation von Tests (Test)): Ausgehend von den Standards für päd. und psychol. Testen (Häcker et al., 1998; engl. Original: AERA, APA & NCME 1999, 2014; vgl. auch DIN 33430) ist zu berücksichtigen, dass Verfahren hinsichtlich folg. Aspekte und Gütekriterien entwickelt und beurteilt werden müssen: (a) Validität (Inhaltsvalidität, kriteriumsbezogene Validität und Konstruktvalidität), (b) Reliabilität und Messfehler, (c) Testentwicklung und Testrevision, (d) Skalierung (Skalierung, testtheoretisches Gütekriterium) und Normierung, (e) Testdurchführung, -auswertung und Ergebnisdarstellung, (f) Testdokumentation. Hierbei wird insbes. gefordert, dass Kennwerte und Normierungsdaten aktuell sein sollten (nicht älter als acht Jahre).

(2) Testadaptation und -übersetzung: Veränderungen oder Übersetzungen (z. B. der Itemformulierungen) von Tests müssen hinsichtlich deren Auswirkungen auf Messeigenschaften psychometrisch evaluiert werden. Faire Testanwendungen (Testfairness; Differential Item Functioning) sind nur möglich, wenn in unterschiedlichen Populationen oder Kulturen invariante psychometrische Eigenschaften gelten, sodass in allen Testversionen dieselben Konstrukte erfasst werden und durch die Vorgabe best. Testversionen keine Zielgruppe bei der Testung systematisch benachteiligt oder bevorzugt wird. Die Guidelines on Adapting Tests (ITC 2001, 2017; [www.intestcom.org/page/16]) fordern insbes., dass die Äquivalenz (Äquivalenz, psychometrische) von Testversionen nachgewiesen wird und Testkomponenten (z. B. Items oder Einzelskalen) dokumentiert werden, deren psychometrische Güte in Subpopulationen eingeschränkt ist oder variiert.

(3) Testanwendung: Bei der adäquaten Durchführung, Auswertung und Interpretation psychol. Tests muss berücksichtigt bzw. entschieden werden, welche Fragestellung durch die Testung beantwortet werden soll, welche Merkmale erfasst werden sollen, wie der Erhebungsplan gestaltet wird und wie letztendlich die auf der Testung basierende Urteilsbildung bzw. Entscheidungsfindung erfolgt (diagnostischer Prozess). Gemäß den Internationalen Richtlinien für Testanwendung (= IRTA) der International Test Commission (2000) müssen Kompetenzen aufseiten des Testanwenders vorliegen, die erforderlich sind, um (a) fachliche und ethische Standards beim Testen zu gewährleisten, (b) die Rechte des Pbn und anderer am Testprozess Beteiligter zu wahren, (c) ggf. alternative Tests auszuwählen, anzuwenden und zu evaluieren, (d) den Test vorzugeben, zu bewerten und zu interpretieren sowie (e) Testberichte fachgerecht anzufertigen und die Ergebnisse adäquat rückzumelden. Testanwender müssen somit über (a) persönliche und handlungsorientierte Fertigkeiten (z. B. Kommunikationsfertigkeiten), (b) kontextbezogene Kenntnisse und Fertigkeiten (z. B. fachliches Hintergrundwissen), (c) Fertigkeiten für die Aufgabenhandhabung (z. B. Aspekte der Testvorgabe und des Umgangs mit Daten), (d) Fertigkeiten zur Bewältigung unvorhergesehener Situationen (z. B. Umgang mit Störungen) verfügen. In der Abb. sind die Phasen und Anforderungen der kompetenten Testanwendung dargestellt. Zur Auswahl angemessener Tests sind folg. Aspekte gemäß IRTA zu berücksichtigen: (a) Geltungsbereich und Repräsentativität des Testinhalts, Angemessenheit der Normgruppen, Schwierigkeitsgrad des Inhalts; (b) Genauigkeit der Messung und nachgewiesene Reliabilität im Hinblick auf die relevanten Populationen; (c) populationsspezif. Validität und Bedeutsamkeit für die vorgesehene Verwendung; (d) Fehlen eines systematischen Fehlers im Hinblick auf die Pbngruppen, (e) Annehmbarkeit für die an der Testanwendung Beteiligten, u. a. die von diesen wahrgenommene Fairness und Bedeutsamkeit; (f) Praktikabilität, u. a. hinsichtlich des notwendigen Zeit-, Kosten- und anderen Ressourcenaufwands. Aufgrund der vielfältigen Kompetenzen, die in der Testanwendung benötigt werden, ist i. d. R. ein Diplom- oder Masterabschluss in Ps. für die adäquate Anwendung erforderlich.

(4) Qualitätsbeurteilung psychol. Tests: Es existieren unterschiedliche Ansätze zur einheitlichen Beurteilung von Qualitätskriterien von Tests. Das Testbeurteilungssystem des Testkuratoriums (TBS-TK; Diagnostik- und Testkuratorium, 2018b) hat als Basis für eine transparente Qualitätsdokumentation ein dreischrittiges Prüfverfahren durch Testrezensenten entwickelt: (a) Beurteilung der grundsätzlichen Erfüllung der Anforderungen gemäß DIN 33430; (b) Kategorisierung des Tests nach ZPID- (Zentrum für Psychologische Information und Dokumentation, ZPID) und EFPA-Kriterien (European Federation of Psychologists Association (EFPA)); (c) abschließende Bewertung nach den Besprechungs- und Beurteilungskategorien (Informationen zur Testbeschreibung, theoret. Grundlagen, psychometrische Gütekriterien) des Testkuratoriums. Testbeurteilungen werden unter [www.zpid.de/Tk] veröffentlicht.

Referenzen und vertiefende Literatur

Sie sind schon registriert? Zur Anmeldung
Erstellen Sie einen Account um das komplette Literaturverzeichnis einzusehen.