Zeugnisse und Noten stehen in der Kritik und mehr noch, sie gelten als gefährlich und werden als überflüssig hingestellt. Sie werden sozusagen benotet, meistens mit folgenden Argumenten: Noten sind unpräzise, ihr Zustandekommen ist intransparent, sie wirken als eine Art Schicksal, sind vor allem ein Machtfaktor und sicher kein Beitrag zur Bildungsgerechtigkeit.
Das „starre Ziffernotensystem” ist der Lieblingsfeind vieler Schulreformer. „Motivieren ohne Noten” war schon vor 25 Jahren ein immer wieder vorgebrachtes Stichwort der Schulkritik (Olechowski/Rieder 1990). Unterstellt wurde, dass die Schülerinnen und Schüler besser lernen, wenn sie nicht durch Noten geleitet werden und den eigenen Lernweg bestimmen können.
Motivieren mit Noten ist die vermutlich meist verbreitete Motivationspraxis in der Schulwirklichkeit, aber die wird als anrüchig hingestellt, da sie dem Ideal des „intrinsischen” Lernens widerspricht. Aber man lernt auch, wenn man motivationale Widerstände überwinden muss und man stelle sich vor, wohin man käme, wenn alles Lernen in der Schule von der Zustimmung intrinsischer Motivation abhängig wäre.
Noten als positive Anreize sind auch deswegen suspekt, weil sie eine Hierarchie voraussetzen. Nur wenige Schüler können Bestnoten erreichen und das, so die Kritik, fordert die anderen nicht etwa heraus, sondern schreckt sie ab und hindert sie am Lernen. Es soll, mit anderen Worten, keinen Wettbewerb geben und niemand soll mit anderen verglichen werden. Das bekanntlich schon Jean-Jacques Rousseau 1762 in seinem Erziehungsroman Emile ou de l’éducation postuliert.
Es ist danach immer wieder versucht worden, Alternativen zu der Notenskala zu entwickeln. Radikale Entwürfe gehen davon aus, dass nur die Lernfortschritte des einzelnen Schülers beschrieben werden können und sich ein Vergleich in der Lerngruppe verbietet, weil der ohnehin nicht objektiv sein kann und zudem die unterschiedlichen Voraussetzungen der Lernenden ignoriert.
Zudem zeigt die Forschung, dass die Urteile der Lehrpersonen im Blick auf ihre Klasse im Allgemeinen verlässlich sind (Weinert 2001).
Noten setzen die Klassennorm voraus und basieren so auf einem Vergleich der Leistungen mit anderen. Diese Beschreibung hat sich bewährt, sie ist ökonomisch und vergleichsweise leicht zu handhaben. Zudem zeigt die Forschung, dass die Urteile der Lehrpersonen im Blick auf ihre Klasse im Allgemeinen verlässlich sind (Weinert 2001). Die Kritik bemängelt allerdings die fehlenden Bezugsnormen (Fischer 2012, S. 50).
Ein Bewertung ist willkürlich, wenn sie die Aufgaben und Leistungen mit verschiedenen Massstäben interpretiert, einzelne Schüler gegenüber anderen bevorzugt, ohne Kriterien erfolgt oder unfaire Massstäbe anwendet, also mehr oder anderes erwartet, als gelernt werden konnte.
Aber ist die gestufte und vergleichende Beurteilung ungerecht? Die Antwort lautet ja, wenn die Bewertungen willkürlich erfolgen würden. Ein Bewertung ist willkürlich, wenn sie die Aufgaben und Leistungen mit verschiedenen Massstäben interpretiert, einzelne Schüler gegenüber anderen bevorzugt, ohne Kriterien erfolgt oder unfaire Massstäbe anwendet, also mehr oder anderes erwartet, als gelernt werden konnte.
Der Grundsatz ist, dass nur das geprüft werden darf, was unterrichtet worden ist und so gelernt werden konnte. Wenn dieser Grundsatz verletzt wird, ist das ungerecht. Wenn ein Schüler schlecht beurteilt wird oder nicht die Note erreicht, die er erreichen wollte, ist das nicht ungerecht, sofern die Kriterien der Benotung klar waren und keine Bevorzugung erkennbar ist.
Dieses Verfahren ist leicht handhabbar und nicht so schlecht, wie die Kritik häufig annimmt.
Noten erfassen Leistungen im Blick auf bestimmte Aufgabenstellungen, die von Lehrkräften im Blick auf eine bestimmte Gruppe bewertet werden. Endnoten nach einem bestimmten Unterrichtsabschnitt, meistens am Ende eines Schulhalbjahres, werden gebildet, indem verschiedene Einzelnoten addiert und ein (gewichteter) Durchschnitt errechnet wird.
Dieses Verfahren ist leicht handhabbar und nicht so schlecht, wie die Kritik häufig annimmt. Die Lehrpersonen stellen Aufgaben und bewerten Leistungen aufgrund langjähriger Erfahrungen und handeln vermutlich in den wenigsten Fällen wirklich „willkürlich” in dem genannten Sinne. Insofern muss man fragen, wieso sich die Notenkritik so hartnäckig immer wieder bemerkbar zu machen versteht. Wenn Medien die bessere Schule propagieren, dann sind die immer notenfrei. Freilich, oft sind diese Alternativen kleine Privatschulen und nie Gymnasien.
Vermeidet man die Karikaturen, dann lässt sich im Blick auf die schulische Notenpraxis festhalten: Schulnoten bewerten Leistungen und können nur begrenzt eine Aussage darüber machen, was die tatsächlichen Kompetenzen der Schülerinnen und Schüler sind. Vieles, was für das Zustandekommen der Leistung mitverantwortlich ist, wird mit einer Ziffernote auch gar nicht erfasst, etwa die allgemeine Leistungsfähigkeit, schulisches Engagement, Vor- und Nachteile der sozialen Herkunft oder das Interesse für bestimmte Unterrichtsfächer.
Aber jede Bewertung hat Grenzen und keine umfasst alles. Noten haben den Vorteil, dass sie einfach sind, leicht zu kommunizieren und keinen übermässigen Aufwand verlangen. Sie passen ins Arbeitsfeld der Schule, gelten als bewährt und werden als Beschreibungsform auch ausserhalb der Schule breit angewendet. Niemand stört sich daran, dass Fussballprofis jede Woche Noten erhalten, Filmkritiker vergeben Noten ebenso wie Restaurantkritiker, ein Hotel ohne Noten würde man kaum buchen und saldo könnte ohne Noten den Betrieb einstellen.
Unter den Schülerinnen und Schülern sind vergleichend benotete Leistungsunterschiede meist gar nicht strittig, zumal sie ja wissen, wie die Leistungen zustande kommen.
Unter den Schülerinnen und Schülern sind vergleichend benotete Leistungsunterschiede meist gar nicht strittig, zumal sie ja wissen, wie die Leistungen zustande kommen. Sie wissen auch, dass die Anstrengungen je nach Lage verschieden sind, zwischen Jungen und Mädchen Unterschiede bestehen und nicht erreichte Leistungen durchaus hätten erreicht werden können, wenn die Anstrengung grösser gewesen wäre. Die Zuschreibung „Streber” ist leicht einmal ein Indikator für eigenen Minimalismus.
Inzwischen liegen zahlreiche empirische Studien vor, die die gute prognostische Validität der Schulnoten für den späteren Studienerfolg belegen. Die Durchschnittsnote im Maturitätszeugnis gilt als der valideste Einzelprädiktor für den Erfolg im anschliessenden Studium.
Noch etwas ist auffällig: Die Notenkritik richtet sich primär auf das Zustandekommen der Noten und die Beschreibung in Form von Ziffern. Wenig gefragt ist der prognostische Wert von Schulnoten. Inzwischen liegen zahlreiche empirische Studien vor, die die gute prognostische Validität der Schulnoten für den späteren Studienerfolg belegen. Die Durchschnittsnote im Maturitätszeugnis gilt als der valideste Einzelprädiktor für den Erfolg im anschliessenden Studium. Die Notenkritik übersieht gerne diesen Zusammenhang.
In einer deutschen Metastudie aus dem Jahre 2007wird die Validität der Schulnoten zur Vorhersage des Studienerfolgs nochmals detailliert beschrieben (Trapmann-Hell/Weigand/Schuler 2007). Dabei wirkt sich gerade die Breite des Notensystems positiv aus. Je höher der Durchschnitt in den Fachnoten liegt, desto besser kann der Studienerfolg vorhergesagt werden
Eine der zentralen Begründungen für die Notenkritik bezieht sich auf die Folgen von schlechten Bewertungen, die blockierte Motivation und Schulunlust nach sich ziehen würden. Gute Noten werden akzeptiert, schlechte lösen Krisen aus. Das Prinzip der vergleichenden Graduierung in der Beschreibung des Leistungsverhaltens setzt wie gesagt voraus, dass nicht jeder gute Noten erhält und man so einen Diskriminierungseffekt auffangen muss, wenn man auf ein Ziffernotensystem setzt.
Die Anstrengungsbereitschaft verteilt sich nicht einfach nur mit dem Interesse, wie oft angenommen wird, sondern reagiert auch auf Notlagen, etwa auf die Folgen der Nichterreichung von Lernzielen oder die drohenden Selektionen an den Schnittstellen. Probleme wie diese werden in der didaktischen Literatur gemieden oder normativ bestritten, obwohl sie nicht verschwinden werden und das Lernen massiv beeinflussen.
Eine jüngere Studie über den Zusammenhang von Schulangst, Schulunlust, Anstrengungsvermeidung und Schulnoten in den Fächern Mathematik und Deutsch sieht zwischen diesen Konzepten signifikante geringe bis mittlere Interkorrelationen. Am stärksten hängen Prüfungsangst und die schulbezogene Anstrengungsvermeidung mit den Schulnoten zusammen (Weber/Petermann 2016, S. 562). Das ist eigentlich trivial: Wer Angst vor Prüfungen hat, vermeidet Anstrengungen, weil die Vorstellung vorherrscht, die Prüfung sei ohnehin nicht zu bestehen. Anderseits minimiert die Anstrengungsvermeidung die Chancen des Bestehens, wenn die Prüfung nicht vermieden werden kann.
Die Schülerinnen und Schüler lernen auch subversiv, nämlich wie die Anforderungen des Unterrichts umgangen werden können, oder strategisch, nämlich wie sich mit einem Minimum an Aufwand ein Maximum an Ertrag erreichen lässt. Sie kalkulieren im Blick auf die Ziele den notwendigen Ressourceneinsatz und gehen keineswegs immer „intrinsisch motiviert” vor, schon weil kaum eine Schülerin und kaum ein Schüler sich für das gesamte Angebot der Schule gleich interessiert. Die Schüler machen immer einen Unterschied, was sie gerne lernen und was nicht.
Die Anstrengungsbereitschaft verteilt sich nicht einfach nur mit dem Interesse, wie oft angenommen wird, sondern reagiert auch auf Notlagen, etwa auf die Folgen der Nichterreichung von Lernzielen oder die drohenden Selektionen an den Schnittstellen. Probleme wie diese werden in der didaktischen Literatur gemieden oder normativ bestritten, obwohl sie nicht verschwinden werden und das Lernen massiv beeinflussen. Auch im Falle der Lernstrategien überwiegen die Modellannahmen, die unabhängig vom tatsächlichen Erfahrungsraum „Schule” gedacht werden.
Jahrzehntelange Erfahrungen mit Lernberichten und Ähnlichem zeigen die Steigerung der Komplexität und damit einhergehend der drohenden Unverständlichkeit (Bos et al. 2010). Noten müssen klar und verständlich sein, die Abstände im Leistungsverhalten wiedergeben und hohe und tiefe Grade kennen. An dieser Anforderung sind die Alternativen zu messen und so lange keine besseren Alternativen zum Ziffernsystem vorliegen, wird dieses auch weiterhin die Praxis bestimmen. Umgekehrt gesagt, Noten sind überflüssig, wenn sie keine Abstände erfassen.
Trotz einer Vielzahl von scheinbaren oder tatsächlichen Alternativen ist die Notenskala das bei weitem gebräuchlichste Instrument der Leistungsbeurteilung.
In der Prüfungspraxis sind bis heute Noten zentral, also die Einschätzung der Leistungen von Schülerinnen und Schüler auf einer für alle Lehrkräfte verbindlichen Skala, die die Unterschiede von Fähigkeiten in Sachgebieten erfassen soll. Trotz einer Vielzahl von scheinbaren oder tatsächlichen Alternativen ist die Notenskala das bei weitem gebräuchlichste Instrument der Leistungsbeurteilung.
Für dieses Instrument spricht, dass Leistungen in Schulklassen tatsächlich immer mit Niveauunterschieden zustande kommen. Wer sie abbilden will, muss daher ein gestuftes Schema verwenden, wobei das Problem nur ist, welche Stufen zur Anwendung kommen und wie die tatsächlichen Leistungsunterschiede in der Beurteilung abgebildet werden. Die realistische Perspektive ist die Beibehaltung des Ziffernsystems unter der Voraussetzung, dass die Notengebung fair und transparent ist. Dafür müssen die einzelnen Schulen Kriterien festlegen, die für die Lehrerinnen und Lehrer verbindlich sind. Diese Kriterien beeinträchtigen nicht das Urteil der Lehrpersonen, sondern machen es für Schüler, Eltern und andere Lehrer transparent.
Die Notengebung kann verbessert werden
Bei der Bewertung von Leistungen in der Schule werden Noten und Zeugnisse als Formen des verbindlichen Feedbacks weiterhin eine zentrale Rolle spielen, die Instrumente sind bewährt und begrenzen den Aufwand. Aber die Notengebung kann verbessert werden. Zentrale Aufgaben sind neben der Klarheit der Kriterien die Präzisierung der Stufung, die zur Bewertung passende Aufgabenkultur und die schulischen Lernziele als Bezugsnorm. Die bessere Berücksichtigung des Lernwegs kann fünftens durch Portfolios erreicht werden. Insgesamt handelt es sich also um eine lösbare Aufgabe.
* Prof. em. Dr. Jürgen Oelkers war u. a. seit 1999 bis zu seiner Emeritierung 2012 ordentlicher Professor für Allgemeine Pädagogik an der Universität Zürich. Forschungsschwerpunkte: Historische Bildungsforschung, vor allem des 18. und 19. Jahrhunderts, Reformpädagogik im internationalen Vergleich, Analytische Erziehungsphilosophie, Inhaltsanalysen öffentlicher Bildung, Bildungspolitik.
Dieser Artikel erschien zuerst in der Zuger Schulinfo und ist hier mit freundlicher Genehmigung des Autors aufgeschaltet.
Literatur
Bos, W./Beutel, S.-I./ Berkemeyer,N./Schenk, S.: LUZI. Leistungsbeurteilung ohne Ziffernzeugnisse. Abschlussbericht der wissenschaftlichen Begleitforschung. Dortmund: IFS 2010. |
Fischer, Chr. (Hrsg.): Diagnose und Förderung statt Notengebung? Problemfelder schulischer Leistungsbeurteilung. Münster/New York/München/Berlin: Waxmann 2012. |
Olechowski, R./Rieder, K. (Hrsg.): Motivieren ohne Noten. Wien u.a.: Verlag Jugend und Volk 1990. (= Schule, Wissenschaft und Politik, Band 3) |
Trapmann, S./Hell, B./Weigand, S./Schuler, H.: Die Validität von Schulnoten zur Vorhersage des Studienerfolgs – Eine Metaanalyse. In: Zeitschrift für pädagogische Psychologie Band 2, Heft 1 (2007), S. 11-27. |
Weber, H.M./Petermann, F.: Der Zusammenhang zwischen Schulangst, Schulunlust, Anstrengungsvermeidung und den Schulnoten in den Fächern Mathematik und Deutsch. In: Zeitschrift für Pädagogik Band 62, Heft 4 (Juli/August 2016), S. 551-570. |
Weinert, F.E. (Hrsg.): Leistungsmessungen in Schulen. Weinheim/Basel: Beltz Verlag 2001. |
Auffällige Stille herrscht im Lager der notenabschaffenden Zunft: Wampfler, Maag Merki, Tschopp, Kunz, Minder, Berger, wo verstecken sie sich? Die Strategie: Ignorieren, sich Ducken, solange der Artikel nachhallt. Dann mit erneutem Eifer wieder loslegen, als hätte Jürgen Oelkers nie gesprochen. Das öffentliche Gedächtnis ist kein Langzeitgedächtnis. Ein tumbes Sprachrohr für die Pseudowissenschaft findet sich schnell wieder.