Lehrevaluation
[engl. teaching evaluation, students’ evaluations of university teaching], [DIA, FSE, PÄD], soll die Qualität von Lehre messen und bewerten. I. e. S. ist damit die Qualität von Lehrveranstaltungen an Hochschulen gemeint (Lehrveranstaltungsevaluation), i. w. S. die gesamte Lehrqualität an Hochschulen und Einrichtungen der Erwachsenenbildung. Die Abgrenzung zur Unterrichtsevaluation (Unterricht an Schulen) ist gradueller Natur und nicht theoretisch, sondern institutionell begründet. Vor Beginn einer Evaluation benötigt man ein Konzept guter Qualität in dem zu evaluierenden Bereich, hier ein Modell von Lehrqualität. Dieses lässt sich theoretisch (instruktionspsychologische und hochschuldidaktische Theorien), definitorisch («gute Lehre ist …»), textanalytisch-exegetisch (Auswertung von Gesetzestexten, Bildungsidealen, Curricula, Lehrevaluationsbögen), modellorientiert (Beobachtung und Beschreibung der Lehre von als «guten» Lehrkräften bekannten Personen), befragend (offene Befragung von Lehrenden und Studierenden oder Relevanzrating vorgegebener Items) und empirisch-stat. (Prädiktoren von Lehrerfolg oder allg. Dozentenbeurteilung) gewinnen. Unter Evaluation selbst ist die systemat. Analyse und empir. Untersuchung von Konzepten, Bedingungen, Institutionen, Prozessen und Wirkungen zielgerichteter Aktivitäten zum Zwecke ihrer Bewertung und Modifikation zu verstehen. In der Lehrevaluation an Hochschulen werden meist die Studierenden mittels Fragebögen befragt. Veranstaltungsmittel solcher Einschätzungen sind i. d. R. reliabel (Reliabilität) und valide (r = ,50 mit Fremdeinschätzungen und Leistungszugewinn; Validität). Urteile einzelner Studierender sollten aber nicht herangezogen werden, mind. 10, besser 15 repräsentative Urteile je Veranstaltung sind ausreichend aussagekräftig (Beurteilerübereinstimmung). Beurteilungen eines Dozenten korrelieren über versch. Veranstaltungen und Studierende hinweg mit ca. r = ,50. Das Vorinteresse der Studierenden korreliert leicht mit Dozentenbeurteilungen (r = ,21). Deshalb sollten vor Schlussfolgerungen hinsichtlich allg. Dozentenqualität Urteile aus fünf bis zehn Veranstaltungen eingeholt werden (repräsentativ). Neben studentischen Einschätzungen sind Fremdeinschätzer als zusätzliche Informationsquelle heranziehbar. Auch Lehrinhalte ließen sich durch Experten beurteilen. Nur schwer realisierbar sind Leistungstests (Lernzugewinne). Da zu Lehrerfolg (Lernen, Interessierung, Kompetenzaufbau) nicht nur Dozentenmerkmale (etwa Didaktik, Strukturierung, Engagement, Freundlichkeit, Wissen), sondern auch Studentenmerkmale (Vorwissen, Intelligenz, Fleiß, Interesse) und Rahmenbedingungen (numerische Relation Dozenten/Studenten, Veranstaltungsform, Lehrdeputat, Gehalt, Vorbildung, Studierendenauswahl) beitragen, sollten diese Bedingungsfaktoren mit erhoben werden. Über Lehrveranstaltungen hinaus ist die Lehre i. Allg. zu evaluieren (sachliche Ausstattung, Bibliothek, numerische Relation Dozenten-Studenten, Sprechstunden, Betreuung, Studiendauer). Evaluationen sollen nicht nur beschreiben und bewerten, sondern auch einen Beitrag zur Verbesserung der Praxis bieten (Evaluation, formative). Übliche Fragebogenausteil- und Auswertungsprozedere tragen dazu nicht bei, Verbesserungseffekte betragen bei Messwiederholungen nur um d = 0,1 (Cohens d). Evaluation gemeinsam mit kommentierter Rückmeldung und Beratung oder Training ist aber effektiv (d = 0,6–0,8). L. bedarf eines Einbaus in ein Qualitätssicherungssicherungsmodell von Lehre. Wenn Lehre durch Evaluation verbessert werden soll, ist sie mit Beratung und Training sowie Anreizen zu verbinden. Bildungsevaluation, Lerndiagnostik, Diagnostik, PISA.