23. April 2024

Geheimsache Schwellenwerte

In Kürze wird die EDK die Ergebnisse zur Überprüfung der Grundkompetenzen der Schülerinnen und Schüler in Mathematik (per Ende der obligatorischen Schule), Schulsprache und erster Fremdsprache (jeweils per Ende der Primarschule) bekannt geben. Da die Daten bereits 2016 und 2017 erhoben wurden, fragt es sich, was die Gründe für deren verzögerte Publikation sind.

Rein wissenschaftliche Gründe können es kaum sein. Denn die Methoden solcher Studien sind aufgrund der in den letzten Jahrzehnten stark expandierenden Schulleistungs- und Schulevaluationsforschung gut entwickelt und bereiten den Forschenden keine grundsätzlichen Schwierigkeiten. Das Problem dürfte vielmehr darin liegen, dass die Vorgaben für die Testentwicklung zu ungenau sind, um eine standardisierte Überprüfung von Schülerleistungen zu ermöglichen.

Erinnern wir uns: Im Rahmen des Konkordats zur interkantonalen Vereinbarung über die Harmonisierung der obligatorischen Schule (HarmoS-Konkordat) haben die Kantone beschlossen, leistungsbezogene Bildungsstandards festzulegen, die gesamtschweizerisch vorgeben, was Schülerinnen und Schüler während der obligatorischen Schulzeit zu lernen haben. Das HarmoS-Konkordat bestimmt fünf Bereiche der Grundbildung, von denen bisher in zwei Bereichen (Sprachen sowie Mathematik und Naturwissenschaften) Bildungsstandards entwickelt und in Form von Grundkompetenzen festgelegt wurden. Die Standards und Grundkompetenzen in den beiden genannten Fachbereichen wurden von der EDK am 16. Juni 2011 beschlossen und – wie es im EDK-Jargon heisst – zuhanden der Umsetzung in den Kantonen freigegeben. Das Hauptinstrument zu deren Umsetzung bilden die Lehrpläne, die gemäss HarmoS-Konkordat sprachregional einheitlich sein müssen. Aktuell bestehen ein Lehrplan für die französischsprachige Schweiz (Plan d’études romand), ein Lehrplan für die deutschsprachige Schweiz (Lehrplan 21) und ein Lehrplan für den Kanton Tessin (Piano di studio). Die nationalen Grundkompetenzen sind in diese Lehrpläne eingeflossen. Sie bilden die Mindestanforderungen, an denen das Lernverhalten der Schülerinnen und Schüler während der obligatorischen Schulzeit gemessen wird. Die Erwartung ist, wie die EDK deutlich macht, dass unser Bildungssystem gewährleistet, «dass praktisch alle Schülerinnen und Schüler diese Mindestanforderungen … erreichen» (EDK 2011, S. 78).

Die Überprüfung der Grundkompetenzen müsste damit eigentlich eine triviale Angelegenheit sein. Stellt man in Rechnung, dass die Vorzüge eines kompetenzorientierten Unterrichts sowohl im Rahmen des HarmoS-Projekts wie im Lehrplan 21 unter anderem damit begründet werden, dass Kompetenzen transparent, klar und verständlich beschreiben, was gelernt werden muss, dann dürften sich den Forscherinnen und Forschern bei der Operationalisierung der Grundkompetenzen zum Zweck ihrer Messung kaum grössere Probleme stellen. Was gibt es Schöneres in der Wissenschaft als ein Forschungsobjekt, das so klar vorstrukturiert ist, dass gleichsam nur noch zur Kenntnis genommen werden muss, wie es beschaffen ist?

Wo liegt die Grenze zur Inkompetenz?

Wer sich die von der EDK verabschiedeten Grundkompetenzen allerdings einmal genauer anschaut oder den Lehrplan 21 etwas genauer durchsieht, bei dem wird sich bald die Vermutung einstellen, dass der Hase genau hier im Pfeffer liegt, sprich: dass die Kompetenzbeschreibungen in beiden Dokumenten viel zu vage und zu allgemein gehalten sind, als dass eine problemlose Ummünzung in Messoperationen möglich wäre. Es scheint, dass der Evaluationsgegenstand doch nicht so offen zu Tage liegt, wie die Rede von den klaren, verständlichen und eindeutigen Kompetenzbeschreibungen suggeriert. Dass hier ein Problem vorliegt, zeigt die Notwendigkeit der Bestimmung von Schwellenwerten. Im Konzeptpapier der EDK zur Überprüfung der Grundkompetenzen wird ein Schwellenwert definiert als «Wert auf der numerischen Messskala, der die Grenze zwischen erreichten Grundkompetenzen und nicht erreichten Grundkompetenzen markiert» (EDK 2013, S. 14). Abgesehen davon, dass nicht gerade klar ist, was eine numerische Messskala ist (auch eine Rangskala ist numerisch), scheint es darum zu gehen, dass die EDK bei ihrem Beschluss über die Grundkompetenzen nicht festgelegt hat, wo genau die Grenze zwischen Kompetenz und Inkompetenz liegt.

Obwohl man im Rahmen des HarmoS-Projekts die Begrifflichkeit von Diane Ravitch übernommen hat (vgl. EDK 2004, S. 6 und 10), scheint man nicht realisiert zu haben, dass zur Definition von Leistungsstandards die Angabe eines Kriteriums (cut-score) gehört, das genügende von ungenügenden Leistungen abgrenzen lässt. «Performance standards … answer the question: ‹How good is good enough?› Performance standards describe what kind of performance represents inadequate, acceptable, or outstanding accomplishment» (Ravitch 1995, S. 12f.). Offensichtlich lassen es die Vorgaben der EDK nicht zu, die Skalen zur Überprüfung der Grundkompetenzen so zu entwickeln, dass der Messvorgang eindeutig ist, d.h. vorweg festgelegt werden kann, wann die Leistung eines Schülers oder einer Schülerin als kompetent oder inkompetent zu beurteilen ist. Die Eindeutigkeit muss im Nachhinein durch Festlegung von Schwellenwerten auf den psychometrischen Skalen erst erzeugt werden!

In dem Konzeptpapier der EDK zur Überprüfung der Grundkompetenzen heisst es, die Festlegung darüber, «welcher Schwellenwert auf einer Fähigkeitsskala den von der EDK definierten Grundkompetenzen entspricht» (EDK 2013, S. 11), erfolge «in einem fachlichen (fachdidaktischen und psychometrischen) Aushandlungsprozess, der von der Koordinationsstelle Überprüfung der Erreichung der Grundkompetenzen im GS [Generalsekretariat, W.H.] EDK organisiert und angeleitet wird» (ebd.). In wissenschaftlichen Ohren tönt dies gelinde gesagt seltsam. Zwar ist von einem fachlichen Aushandlungsprozess die Rede, was darauf schliessen lässt, dass es die Forscherinnen und Forscher sind, welche die Schwellenwerte festlegen. Aber weshalb muss der Aushandlungsprozess – eine Bezeichnung, die schon als solche Fragen aufwirft, da sie eher an diplomatische denn wissenschaftliche Umgangsformen denken lässt – unter der Leitung des EDK-Generalsekretariats stehen? Die Vermutung liegt nahe, dass es nicht um die Klärung eines forschungsmethodischen Problems geht, sondern um politische Entscheidungen, die damit zu tun haben, dass man nicht will, dass zu viele oder zu wenige Schülerinnen und Schüler als inkompetent bezeichnet werden. Denn je nachdem wo der Schwellenwert zu liegen kommt – höher oder tiefer – ergeben sich mehr oder weniger Schülerinnen und Schüler, welche die Grundkompetenzen nicht erreichen. Da es bei der nationalen Überprüfung der Grundkompetenzen auch um kantonale Vergleiche geht, kann man sich leicht ausmalen, wie brisant das Thema ist.

Eine zusätzliche Dimension gewinnt das Problem dadurch, dass die nationalen Bildungsstandards die Schulrealität erst vermittelt über die sprachregional unterschiedlichen Lehrpläne und Lehrmittel erreichen. Wenn man nicht wie im Falle der PISA-Tests die Lehrpläne einfach ignorieren will, dann muss man entweder bei der Entwicklung der Testinstrumente die sprachregional bedingten Unterschiede zwischen den Lehrplänen berücksichtigen oder man muss die Unterschiede – wie es den Anschein macht – nachträglich austarieren. Zwar böte die Kompetenzorientierung der Lehrpläne eine elegante Lösung, weil sich Kompetenzen ohne Bezug auf spezifische Inhalte definieren lassen. Der Clou des Kompetenzbegriffs liegt ja genau darin, dass wir sprachlich, mathematisch oder technisch kompetent sein können, ohne dass eine genaue Angabe erforderlich ist, in welchen Inhaltsbereichen dies der Fall ist. Doch würde dies voraussetzen, dass die drei sprachregionalen Lehrpläne erstens tatsächlich konsequent an Kompetenzen ausgerichtet sind und zweitens dieselben Kompetenzen beinhalten. Weder das eine noch das andere ist jedoch der Fall (zum Lehrplan 21 vgl. meine Analyse in: Herzog 2018).

Blasierte EDK

Die verzögerte Veröffentlichung der Ergebnisse zur schweizweiten Überprüfung der Grundkompetenzen der Schülerinnen und Schüler scheint also mit Interferenzen zwischen Forschung und Politik zu tun zu haben, die sich einer ungenügend präzisen Festlegung der nationalen Grundkompetenzen durch die EDK verdanken. Was damals versäumt wurde, muss nun nachgeholt werden. Normalerweise würde man erwarten, dass die Forscherinnen und Forscher – wie im Falle anderer Schulleistungsvergleichsstudien – frei sind, ihre Daten zu erheben, zu analysieren und zu publizieren, ohne dass sie von der Politik an die Kandare genommen werden. Im vorliegenden Fall ist es offenbar anders. Nicht nur müssen im Nachhinein Schwellenwerte unter Beteiligung eines politischen Gremiums festgelegt werden, die Einmischung der Politik geht noch weiter. Die Ergebnisse des Aushandlungsprozesses müssen nämlich der EDK-Plenarversammlung zur Genehmigung vorgelegt werden! So steht es im genannten Konzeptpapier der EDK, und so wird es in einem Beschluss der EDK-Plenarversammlung vom 22. März 2018 nochmals bestätigt (vgl. EDK 2018).

Nicht nur als Wissenschaftler, auch als Bürger dieses Landes fragt man sich, was hier los ist. Demokratiepolitisch ist das Vorgehen der EDK äusserst fragwürdig. Bedenkt man, dass die EDK ihre Entscheidungen nicht nur ohne Beteiligung, sondern geradezu unter Ausschluss der Öffentlichkeit trifft – auch die Protokolle zu ihren Sitzungen gibt die EDK nach wie vor nicht frei –, steht zu befürchten, dass wir nie erfahren werden, wie die Schwellenwerte bestimmt wurden. Das würde bedeuten, dass die Ergebnisse zur Überprüfung der Grundkompetenzen auf eine Art und Weise politisch eingefärbt sein könnten, die ein objektives Urteil über die Qualität unseres Bildungssystems nicht zulassen. In ihrer Blasiertheit legt die EDK nicht nur fest, wie unser Schulsystem zu reformieren ist, sondern beschliesst auch gleich noch selber, wie gut ihr die Reform gelungen ist.

Nachbemerkung: Von Seiten der EDK waren keine Informationen zum Vorgehen bei der Überprüfung der Grundkompetenzen erhältlich. Die vorausgehende Analyse stützt sich daher ausschliesslich auf die wenigen offiziellen Dokumente, die zum Thema vorliegen. Insofern könnte sich herausstellen, dass die geäusserten Befürchtungen unbegründet sind. Dies wäre dann der Fall, wenn die EDK entgegen aller Erwatung offen darlegen würde, wie die Schwellenwerte im Rahmen des so genannten Aushandlungsprozesses zwischen Wissenschaft und Politik bestimmt wurden. Ich lasse mich gerne überraschen.

 

Walter Herzog

Literaturverzeichnis

EDK (2004). HARMOS. Zielsetzungen und Konzeption. Juni 2004. Bern: Schweizerische Konferenz der kantonalen Erziehungsdirektoren. Download: https://edudoc.educa.ch/static/web/arbeiten/harmos/weissbuch_d.pdf [07.05.2019]

EDK (2011): Die interkantonale Vereinbarung über die Harmonisierung der obligatorischen Schule (HarmoS-Konkordat) vom 14. Juni 2007. Kommentar, Entstehungsgeschichte, Instrumente. Bern: Schweizerische Konferenz der kantonalen Erziehungsdirektoren. Download: www.edk.ch/dyn/23211.php [07.05.2019]

EDK (2013): Überprüfung der Erreichung der Grundkompetenzen. Konzept. Bern: Schweizerische Konferenz der kantonalen Erziehungsdirektoren. Download: https://edudoc.ch/record/107770/files/PB_grundkompetenzen_d.pdf [07.05.2019]

EDK (2018): Medienmitteilung zur Verschiebung des Publikationstermins der Ergebnisse zur Überprüfung der Grundkompetenzen. Bern: Schweizerische Konferenz der kantonalen Erziehungsdirektoren. Download: https://edudoc.ch/record/130617/files/pb_ugk_verschiebung_publikationstermin_d.pdf [07.05.2019]

Herzog, Walter (2018): Kompetenzen für die Zukunft? Eine Kritik am Lehrplan 21. In: Schweizerische Zeitschrift für Bildungswissenschaften, 40, S. 503-519.

Ravitch, Diane (1995): National Standards in American Education. A Citizens’ Guide. Washington: The Brookings Institution.

Verwandte Artikel

Die Schule war männlich

Die gute „alte Schule“ von anno dazumal – an Klassentreffen oft nostalgisch überhöht. Der Autor weiss um diesen “Verklärungseffekt”. Er wagt es trotzdem: eine essayistische Skizze aus der Primarzeit, subjektiv formuliert und aufgetragen mit grobem Pinsel von Condorcet-Autor Carl Bossard.*

Wo Vergleiche Sinn machen

Die Rankingforderung haben dem Basler Freisinn viel Kritik eingebracht. Und auch in unserem Blog kamen sie gar nicht gut an. Condorcet-Autor Alain Pichard, ein früher Kritiker der Vergleichsteste, mahnt zur Differenzierung. Gezielt eingesetzt, so meint er, liefern sie wertvolle Rückmeldungen.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert