KI-Systeme imitieren unsere kognitiven Fähigkeiten immer besser. Und je besser sie das tun, desto deutlicher rückt ein Unterschied in den Fokus, den man aus der Linguistik kennt: zwischen Kompetenz und Performanz. Ich kann zum Beispiel einige Sätze Italienisch sprechen. Diese Performanz ist natürlich kein Beleg für meine Italienisch-Kompetenz. Eher lässt sich sagen: I’m faking it, not making it. Und das scheint mir auch eine treffende Kurzcharakterisierung der Künstlichen Intelligenz (KI) zu sein.
I’m faking it, not making it.
KI-Systeme demonstrieren schon heute eine eindrückliche Performanz. Jüngst der Textgenerator ChatGPT von OpenAI. Auf die Frage nach dem Unterschied zwischen Kompetenz und Performanz «antwortet» er: Kompetenz ist das Vermögen, etwas erfolgreich zu tun, während Performanz die aktuelle Demonstration dieses Vermögens ist.
Bündiger kann man das nicht formulieren. Aber was für ein Vermögen demonstriert denn eigentlich der Textgenerator? Schreibt ChatGPT wirklich? Liegt seine Kompetenz nicht schlicht darin, aus einer Bitfolge mittels eines Transformer-Algorithmus eine neue Bitfolge zu generieren? Na und? Nenne man das nun «schreiben» oder auch nicht. Wenn man die «intelligente» Maschinenleistung – Problemlösen – auf vielen Gebieten nicht mehr von der menschlichen Leistung unterscheiden kann, weshalb dann nicht die Gänsefüsschen bei «intelligent» streichen?
Man schreibt der Maschine ein Vermögen zu, das sich aus einer Schwäche des Menschen ableitet.
Mit solchen Fragen stecken wir mitten in einem dornigen Problemnest. Es ist so alt wie die KI selbst. Einer ihrer theoretischen Pioniere, der Mathematiker Alan Turing, stellte vor gut 70 Jahren die Frage: Können Maschinen denken? Turing gab keine direkte Antwort, sondern schlug ein sogenanntes Imitationsspiel vor, in dem eine Jury prüft, ob die Maschine den Menschen so imitieren kann, dass dieser zur Überzeugung gelangt, sie denke. Je weniger dies dem Menschen gelingt, als umso intelligenter kann man die Maschine betrachten. Der definitorische Trick ist offensichtlich: Man schreibt der Maschine ein Vermögen zu, das sich aus einer Schwäche des Menschen ableitet: seiner Neigung, gefoppt zu werden.
Kernauftrag durch Informationstechnologie herausgefordert
Seither investieren Computerwissenschaftler, Kognitionsforscher und Philosophen eine Menge Hirnschmalz in die Aufgabe, den Output künstlicher Hirne zu «entlarven». Und vermehrt sehen Lehrerinnen und Lehrer ihren Kernauftrag durch die Imitationstechnologie herausgefordert. Wir befinden uns auf der Schwelle zu einer neuen technischen Ära. Die KI-Systeme sind nicht mehr bloss Werkzeuge. Schüler und Studenten sollen Kompetenzen lernen. Nun begleiten sie ständig lernende Artefakte, die vielleicht sogar gelehriger sind als Menschen. Sie «emanzipieren» sich vom Hilfsmittel zum künstlichen Schüler. Sie wollen «erzogen» werden. Das heisst, Grundeinheit des Unterrichtens ist heute Schüler-plus-Chatbot – ein Hybrid aus Mensch und Maschine. Man prüft nicht den Schüler, sondern dieses Hybrid. Einen Aufsatz schreiben? Einen Roman zusammenfassen? Einen Text auf logische Stringenz überprüfen? «There’s an app for that»..
In der ganzen Entwicklung liegt eine tiefe Ironie.
Das hat Folgen, die man noch kaum bedenkt, bedenken kann. In der ganzen Entwicklung liegt eine tiefe Ironie. Mittel- und Hochschulen feierten die digitalen Medien als Initiatoren für selbstgesteuertes Arbeiten. Nun stellt sich die Frage: Wer oder was ist dieses Selbst? Prüfungs-, Matura-, Seminar-, Masterarbeiten – von wem stammt der geschriebene Text, vom Schüler oder vom ChatGPT? Wem attestieren wir welche Kompetenzen? Wie unterscheiden und verteilen wir sie? Fragen, die wohl über kurz oder lang zum Standard des Unterrichts gehören dürften. Die Schule mutiert von der Lehranstalt zur Turing-Test-Anstalt.
Es droht ein digitales Katz- und Maus-Spiel
Wie immer gibt es die vorschnelle technische Lösung. Schon arbeitet OpenAI an Test-Programmen, die in den ausgegebenen Wortfolgen von ChatGPT heimliche statistische Muster und andere Indizien ihrer Künstlichkeit entdecken. Ein Programm zur «Entlarvung» von Programmen. Inwieweit ist darauf Verlass? Die Testläufe zeigen mässigen Erfolg.[1] Ein nicht unwahrscheinliches Szenario zeichnet sich ab: Der Schüler rüstet sich mit immer raffinierterer Schreib-Software aus, der Lehrer mit entsprechend ausgeklügelter Entlarvungs-Software. Eine digitale Katz-und-Maus-Schleife, in dem nicht unbedingt der Lehrer obenaus schwingen wird. Bis er sich die fatale Frage stellt, ob es sich überhaupt noch lohne, Schreiben zu unterrichten.
Nun war die Schule ja schon immer das Übungsfeld von Schummelei. Zum herkömmlichen Verdachtsmoment des Plagiats tritt jetzt das neue der technischen Imitation hinzu. Und damit erodiert der vitale Boden des Unterrichtens: das gegenseitige Vertrauen von Lehrer und Schüler. «Ein Rückgriff auf konventionelle Arbeits- und Prüfungsformen scheint derzeit die einzige Möglichkeit zu sein», schreibt der Deutschlehrer Andreas Pfister kürzlich: «Dazu gehören die 45-Minuten-Prüfung, der 90-Minuten-Aufsatz, die Mündlichprüfung. Denn wer möchte Schülerarbeiten mit dem grundsätzlichen Misstrauen begegnen, es habe ein Co-Autor mitgeschrieben?» [2]
Den Blick auf die menschlichen Kompetenzen neu kalibrieren
Es gibt eine optimistischere Perspektive. Sie lässt sich zusammenfassen mit dem Motto «Wiederentdeckung verdrängter Selbstverständlichkeiten». Wozu ist Sprache da? Welche Kompetenzen fördert man mit ihr eigentlich? Das heisst, wir sollten unsere Aufmerksamkeit von der Maschine lösen und sie auf den Menschen richten. Gerade weil die Maschine so gut menschliche Kompetenzen performen kann, hält sie uns an, den Blick auf unsere Kompetenzen neu zu kalibrieren. Was ist daran das genuin Menschliche? Eigentlich sollten wir dem Computer danken dafür, dass er uns die Möglichkeit verschafft, eine solche Frage zu stellen; unser Können in der «Kommunikation» mit der Maschine wieder kennen zu lernen oder vielleicht erst zu entdecken.
Neue Aussichten auf die Bildung eröffnen sich. Der ChatGPT bietet sich geradezu als ein massgefertigtes Tool an. Aber nicht im Sinn von «Text auf Knopfdruck». Vielmehr andersrum: Das Leichte ins Schwierige verkehren. Das Leichte ist das Generieren eines Textes. Das kann ausserhalb des Unterrichtens stattfinden. Der Schüler eignet sich individuell sein Wissen und seine Kompetenzen an, mit welcher KI-Technologie auch immer. Aber was er abliefert, ist nichts Endgültiges, sondern Ausgangsmaterial, anhand dessen er nun seine Kompetenzen «coram publico» vorzuführen hat: im realen Gespräch mit dem Lehrer und den anderen Schülern, von Angesicht zu Angesicht. Das ist das Schwierige.
Trivialitäten gewinnen im Rahmen eines massiv technisierten Unterrichts an pädagogischem Gewicht.
Die verdrängte Selbstverständlichkeit, die hier zum Vorschein kommt, lautet: Schreiben ist mehr als Textgenerieren – Schreiben ist ein Handwerk. Es verlangt das Erlernen und Einüben von Routinen; Geduld, Disziplin und Liebe im Umgang mit der Sprache; das vertiefte Studium eines Themas; das Einschätzen von Behauptungen; das Zusammenfügen von Wissensgebieten; den Ausdruck von Ideen in klarer, kohärenter Sprache. Daraus entwickelt sich im besten Fall eine innere Bindung an den Text. Das klingt trivial, aber genau solche Trivialitäten gewinnen im Rahmen eines massiv technisierten Unterrichts an pädagogischem Gewicht. Der Philosoph Odo Marquard hat vom «Homo compensator» gesprochen. Der «ausgleichende» Mensch, der in all dem, was heute die Maschinen für ihn tun, sich selber, seine eigenen Fähigkeiten und Kompetenzen wiederentdeckt und neu bewertet. Und die Schule definiert sich als Ort dieses Ausgleichens.
Wir treten ein in eine neue Runde der Selbstbegegnung. Was kann der Computer, was kann der Mensch? Diese Unterscheidungsfrage wird zu einer vordringlichen Bildungsaufgabe. Und sie hechelt der Technologie hinterher.
[1] https://www.nzz.ch/wissenschaft/chat-gpt-erfinder-praesentieren-eine-programm-das-erkennen-soll-ob-texte-von-maschinen-geschrieben-wurden-ld.1724050
[2] https://www.nzz.ch/meinung/chatgpt-wird-das-bildungswesen-auf-eine-harte-probe-stellen-ld.1721909
Das Eingangsbeispiel mit den linguistischen Begriffen Performanz und Kompetenz (nach Noam Chomsky) bedarf der Klärung. Mit Performanz ist gemeint: eine sprachliche Äusserung, in welcher menschlichen Sprache auch immer. Mit Kompetenz meint die Linguistik NICHT die Beherrschung einer bestimmten Sprache (Deutsch, Englisch, Italienisch), sondern die grundlegende Fähigkeit, sich überhaupt einer Sprache bedienen zu können. Dem Begriffspaar Performanz und Kompetenz entspricht das Paar Tiefen- und Oberflächenstruktur. Die einzelnen Sprachen (Deutsch, Englisch, Italienisch) lassen sich nach Chomsky auf sprachlogische Grundelemente zurückführen (=Tiefenstruktur). Mit sogenannten Transformationsregeln können diese Grundelemente algorithmisch wieder in eine wirkliche Sprache (=Oberflächenstruktur) verwandelt werden. Also: Auch perfektes Italienisch, Deutsch, Englisch ist linguistisch immer Performanz. Das Ziel dieser Übung war die Herstellung einer Übersetzungsmaschine, die jede Sprache mittels Transformationsregeln auf Grundelemente und dann wieder in eine andere Sprache verwandeln könnte.
Na ja – letztlich geht es um die Frage, ob Bluffen reicht oder ob es doch wirkliche Fähigkeiten (= Kompetenz) braucht. Je nach Situation reicht der Bluff sprich die Performance.
Ich habe mir heute ein neues Smartphon erstanden. Der Datentransfer war nicht vollständig abgeschlossen worden seitens der Technikabteilung. Der Verkäufer erwies sich zum Glück insofern als kompetent, als dass er diesen Transfer zu meiner vollsten Zufriedenheit vollzog und nicht nur etwas dahergeschnorrt hat.
KI kann vieles – etwas kann sie nicht: Wirklich individuell schöpferisch kreativ sein. Sie kann zwar Texte verfassen, Bilder malen oder Beethoven-Sonaten komponieren. Das sind aber alles zusammengestellte und neu kombinierte Algorithmen-Produkte von etwas, das bereits bestanden hat.
Ehrlicherweise muss man allerdings zugeben, dass auch der Mensch so lernt. Mozart hat Bach und die Bach-Söhne studiert und sich so sein kompositorisches Rüstzeug erworben. Aber er hat nicht wie Bach komponiert, letztlich auch nicht genau wie Johann Christian Bach, dem Bach-Sohn, der am ehesten den damals neuen Klassik-Stil etabliert hat.