Transformation der Prüfungskultur durch KI
Willkommen zur leicht verspäteten Februar-Ausgabe dieses Newsletters. Wir freuen uns, dass ihr hier mitlest.
9. Mai in Berlin: Barcamp
Wie schon einmal angekündigt, findet am 9. Mai unser Barcamp in Berlin statt. Wir diskutieren mit euch die Frage: »Wieviele und welche Prüfungen braucht Lernen?«
📍 Ort: ESBZ – Evangelische Schule Berlin Zentrum
➡️ Infos: Ankündigung / Anmeldung
Was KI für die Gestaltung der Prüfungskultur bedeutet
Ein Team von tschechischen und niederländischen Forscher:innen hat eine «meta-meta-Analyse» der Auswirkungen von KI aufs Lernen publiziert (Preprint). In der Diskussion der Daten formulieren die Autor:innen, welche Konsequenzen sich für die Prüfungskultur ergeben. Wir haben das Fazit auf Deutsch übersetzt:
KI/LLMs verändern Bildung auch indirekt, indem sie Metakognition, Unterrichtspraktiken, Feedbackprozesse und Bewertungssysteme neu gestalten – Effekte, die sich häufig der Erfassung durch kurzfristige Leistungsmaße entziehen. Aus einer systemischen Perspektive wirken KI/LLMs oft über indirekte und zweitordentliche Wirkungswege: Sie verändern die Praxis von Lehrpersonen, ermöglichen adaptives Feedback, unterstützen neue Formen der Leistungsbeurteilung und verbessern die Abstimmung zwischen Curriculum, Unterricht und Evaluation […] [Die evaluierten Daten deuten auf] eine Fehlanpassung zwischen systemischen Veränderungen und den derzeitigen Messinstrumenten hin. Um diese Diskrepanz zu adressieren, argumentieren Kovanović et al. (2025), dass die Minderung von Bedenken hinsichtlich akademischer Integrität und oberflächlichen Lernens eine Ablösung von High-Stakes-Prüfungen erfordere: Gesprächsbasierte Assessments, die durch KI/LLMs unterstützt werden, können Denkprozesse und Lernverläufe möglicherweise besser erfassen. (S. 23)
Der erwähnte Kommentar von Kovanović und andere hat im Dezember 2025 darauf verwiesen, dass an Hochschulen High-Stakes-Testing im Zeitalter von KI durch kontinuierliche Formen von Assessments ersetzt werden sollten. Auch hier eine Übersetzung einer Schlüsselpassage:
Kontinuierliche Leistungsbeurteilung kann eine wirksame Alternative sein. In vielen Fachbereichen ist es dringend erforderlich, Abschlussprüfungen am Semesterende durch eine Reihe miteinander verknüpfter Assessments zu ersetzen, die ein umfassendes Bild des Lernfortschritts der Studierenden vermitteln. In der medizinischen Ausbildung ist kontinuierliche Beurteilung bereits fest etabliert. So werden Medizinstudierende während ihrer klinischen Praktika fortlaufend von Supervisorinnen und Supervisoren beurteilt, die ihr klinisches Denken, ihre Teamfähigkeit und ihre Kommunikation mit Patientinnen und Patienten beobachten. Diese Beobachtungen werden durch schriftliche Reflexionen und Peer-Evaluationen ergänzt und ergeben zusammen ein ganzheitliches Bild der Kompetenzentwicklung über die Zeit. Solche Modelle sind in anderen Disziplinen jedoch weiterhin selten, vor allem wegen des erhöhten Arbeitsaufwands, den sie für Lehrpersonen mit sich bringen.
Prüfungsformate als «Flaschenhals» für Schul- und Unterrichtsentwicklung
Im Podcast Welle lernen:digital von Jöran Muuß-Merholz war Institutsmitglied Christian Albrecht zu Gast. In der Folge geht es um die Frage, wie Prüfungen in einer Kultur der Digitalität gestaltet werden können. Ein Hörtipp!
(Auch in der Folge zuvor war ein Mitglied des Instituts als Gesprächspartner dabei…)
Prüfungskultur auf dem Prüfstand
In einem Doppelinterview hat Björn Nölte zusammen mit der Schülerin Maja Zaubitzer erklärt, wie Prüfungen gestaltet werden müssen, die einen klugen Umgang mit KI fördern. Nölte sagte unter anderem:
Schüler:innen sind nicht auf Betrug aus, sie haben kluge Ideen. Lehrkräfte müssen lernen, diese Ernsthaftigkeit zu sehen und zu unterstützen.
Das ganze Interview lässt sich hier nachlesen.

Die Unsicherheit von Lehrkräften
In der Ausgabe 419 von von bildung.table findet sich ein lesenswerter Beitrag zur Frage, weshalb eine Reform der Prüfungskultur so harzig verläuft. Im Artikel wird die Institutsvorsitzende Patricia Drewes wie folgt zitiert:
Drewes zufolge seien sich viele Lehrkräfte unsicher, was sie dürften. Es gibt durchaus Spielräume: In mehreren Bundesländern können Lehrkräfte jedes Jahr pro Facheine schriftliche Arbeit durch eine andere Form der Leistungsüberprüfung ersetzen. Auch der Einsatz von Hilfsmitteln ist grundsätzlich möglich, sofern sie allen getesteten Schülern zur Verfügung stehen. Wichtig ist vor allem: Die individuelle Schülerleistung muss erkennbar sein. Das ließe auch zeitweise Kollaboration oder den Einsatz von KI zu.