Differential Item Functioning (DIF)

 

[engl.] «differentielle Itemfunktionsweise», [lat. differentia Unterschied], [DIA], stellt eine Technik zur Analyse der Testfairness von Einzelitems einer psychometrischen Skala dar, die i. R. der Modellierung mittels der probabilistischen Testtheorie (Item-Response-Theorie (IRT)) und insbes. des Rasch-Modell zur Anwendung kommt. DIF eines Items in Bezug auf eine Moderatorvariable liegt vor, wenn seine stat. Eigenschaften mit der Ausprägung der Moderatorvariable in spezif. Weise interagieren. Zumeist wird DIF in Bezug auf die Itemschwierigkeit analysiert. Liegt DIF für ein Item in Abhängigkeit von einer Moderatorvariable vor, so kann kein fairer Vergleich der Merkmalsausprägungen mittels der entspr. Skala vorgenommen werden. Ein Vergleich einer Merkmalsausprägung zw. versch. Stufen einer Moderatorvariable wäre verzerrt, weil in den Gruppen das entspr. Einzelitem in unterschiedlicher Weise die zu messende latente Merkmalsausprägung anzeigt. DIF kann exemplarisch an folg. Bsp. verdeutlicht werden. Eine Skala zur Erfassung des Gesundheitsbewusstseins von Pat. enthält ein Item, das erfragt, ob Pat. häufig Sport treiben. Dieses Item könnte für versch. Altersstufen (z. B. 20–30-Jährige vs. 80–90-Jährige; Ausprägungen der Moderatorvariablen) aufgrund unterschiedlicher Ursachen DIF aufweisen. Zum einen könnte das Item in der Gruppe der älteren Pat. – im Ggs. zur jüngeren Pat.gruppe – eine geringere Validität für das Gesundheitsbewusstsein besitzen, da in dieser Altersgruppe häufige sportliche Aktivitäten nicht notwendigerweise mit hohem Gesundheitsbewusstsein einhergehen. Zum anderen würde dieses Item in der Gruppe der älteren Pat. eine sehr viel höhere Schwierigkeit aufweisen. DIF würde bei einem Schwierigkeitsunterschied dieses Items zw. den Vergleichsgruppen nur dann vorliegen, wenn die Schwierigkeitsunterschiede der übrigen Skalenitems eine systematisch abweichende Ausprägung aufweisen. Ein Item mit DIF zeigt also einen Gruppenunterschied an, der durch die übrigen Skalenitems nicht abgebildet wird. Weiterhin wird zw. uniform und non-uniform DIF unterschieden. Uniform DIF gilt, wenn eine der Vergleichsgruppen (Moderatorvariable) in allen Bereichen des zu schätzenden latenten Fähigkeitsspektrums in gleicher Weise durch ein Item benachteiligt wird. Non-uniform DIF liegt vor, wenn die diagn. Verzerrung zw. den Vergleichsgruppen in den Bereichen des latenten Fähigkeitsspektrums variiert.

Verwendete Literatur

Sie sind schon registriert? Zur Anmeldung
Erstellen Sie einen Account um das komplette Literaturverzeichnis einzusehen.