Test
[engl. test; lat. testari bezeugen], [DIA, FSE], (1) psychol. Tests sind Datenerhebungsverfahren, die i. d. R. aus mehreren Testaufgaben (Testbogen/Testmaterial) sowie festgelegten Regeln zu dessen Anwendung und Auswertung (Testmanual) bestehen. Ziel eines psychol. Tests ist es, ein latentes psychol. Merkmal (Konstrukt, Variable, latente) – typischerweise eine Fähigkeit (z. B. Intelligenztests; Leistungstests), ein Persönlichkeitsmerkmal oder die absolute oder relative Ausprägung von Indikatoren einer psych. Störung quant. zu erfassen. Psychol. Tests müssen def. Gütekriterien entsprechen (Testkonstruktion, Teststandards). Qual. ausgerichtete projektive Testverfahren (projektive Tests) spielen heute in Forschung und Praxis eine untergeordnete Rolle. Wird ein indiv. Testwert mit empirischen Normwerten verglichen und daraus das Testergebnis abgeleitet (Normierung), so spricht man von normorientiertem Testen, hierbei geht es um interindiv. Vergleiche. Wird ein indiv. Testwert mit einem vorab def. Kriterium verglichen (z. B. Festlegung von Mindestpunktzahl 50 zum Bestehen eines Schulleistungstests), so handelt es sich um kriteriumsorientiertes Testen.
(2) Diagn. Tests dienen der Diagnosestellung (Diagnose). Bei der Diagnostik auf Basis eines Merkmals (z. B. Depressionsskala) werden i. d. R. metrische Skalen verwendet, für die ab einem kritischen Schwellenwert (cut-off point, cutting score) das Merkmal als vorhanden klassifiziert wird. Zur Begründung und Evaluation solcher Entscheidungen sollten versch. Maßzahlen berücksichtigt werden: Sensitivität, Spezifität, negativ prädiktiver Wert (NPV), positiv prädiktiver Wert (PPV), Odds Ratio (OR), ROC, ROC-Kurve.
Bzgl. psychol. und diagn. Tests wird weiterhin zw. Speedtest (Geschwindigkeitstest) und Powertest (Niveautest) unterschieden. Bei Speedtests müssen möglichst viele leichte bis mittelschwere Aufgaben in einem vorgegebenen Zeitintervall korrekt gelöst werden. I. d. R. enthält der Test deutlich mehr Aufgaben, als in der vorgegebenen Zeit bearbeitet werden können. Die Anzahl korrekt bearbeiteter Aufgaben im Zeitintervall (Tempowert) dient als Grundlage für den indiv. erreichten Testwert (z. B. d2-Test). Bei Powertests können Pbn i. d. R. alle Aufgaben in der vorgegebenen Zeit bearbeiten und es kommt darauf an, ob diese bzw. wie viele (ohne markanten Zeitdruck) richtig oder falsch gelöst werden (z. B.: Bis zu welchem Schwierigkeitsniveau ist der Pb in der Lage die Aufgaben zu lösen?). Brähler et al. (2002) unterscheiden drei zentrale Arten von Testverfahren: (a) Leistungstests: Entwicklungstests, Intelligenztests, Allg. Leistungstests, Schultests, Spez. Funktions- und Eignungstests (z. B. Berufseignungstest); (b) Psychometrische Persönlichkeitstests: Persönlichkeitsstrukturtests, Einstellungstests (Einstellungsskalen), Interessentests, Klin. Tests; (c) Persönlichkeitsentfaltungsverfahren: Formdeuteverfahren, verbal-thematische Verfahren, zeichnerische und Gestaltungsverfahren (projektive Tests).
(3) Stat. Tests prüfen hypothesengeleitet, ob Datenstrukturen auf Basis eines Zufallsmodells (a) mit hinreichender Wahrscheinlichkeit erwartbar sind (fehlende Signifikanz, Beibehaltung der Nullhypothese) oder (b) eine kritische Wahrscheinlichkeitsgrenze (i. d. R. 5%) unterschreiten (Signifikanz, Annahme der Alternativhypothese). Signifikanztest, Statistik.