Ein paar Notizen zum Gespräch mit dem KI-Bot

Ich wollt‘ ja nur mal fragen - 3

Andreas Mertin

Offen gesagt, mein Gespräch bzw. das Frage-und-Antwort-Spiel mit dem KI-Bot von Chat-GPT hat mich zunächst positiv überrascht. Ich weiß nicht, was ich erwartet hatte, vielleicht so etwas wie Weizenbaums Programm ELIZA.[1] Darüber ist der KI-Bot weit hinaus. Ich war freilich von Anfang auch nicht auf der Suche nach Fehlern oder absurden Behauptungen der Artificial Intelligence, was inzwischen zu einem beliebten Spiel geworden ist.[2] Ja, durch verklausulierte Fragen kann man solchen Programmen durchaus merkwürdige Antworten entlocken. Aber so etwas verstärkt nur negative Tendenzen. Ich wollte vielmehr wissen, wie der KI-Bot überhaupt reagiert, was seine Kompetenz bei dem Spektrum von Themen ist, mit denen ich mich beschäftige und inwiefern dieses System sich eignet, überhaupt einen ersten Einstieg in ein Thema zu finden.

Insgesamt fühlte ich mich während ‚Unterhaltung‘ mit ChatGPT an eine Äußerung von Theodor W. Adorno erinnert, der schon 1964 in seinen „Anmerkungen zum philosophischen Denken“ schrieb, worin für ihn der Sinn der kybernetischen Maschinen – zu denen ja auch die KI-Bots gehören – für die Menschen liegen könnte. Adorno schreibt in dem Text, der Herbert Marcuse zum 70. Geburtstag gewidmet ist:

Aber Denken ist gleichzeitig mit seiner Verselbständigung zur Apparatur Beute von Verdinglichung geworden, zur selbstherrlichen Methode geronnen. Grob offenbart sich das an den kybernetischen Maschinen. Sie stellen den Menschen die Nichtigkeit des formalisierten, seiner Sachgehalte entäußerten Denkens vor Augen, insofern sie manches von dem, woran die Methode subjektiver Vernunft ihren Stolz hatte, besser vermögen als die denkenden Subjekte. Machen sich diese leidenschaftlich zu Vollzugsorganen solcher Formalisierung, so hören sie virtuell auf, Subjekt zu sein. Sie nähern sich den Maschinen als ihr unvollkommeneres Abbild.
     Philosophisches Denken beginnt erst, sobald es sich nicht begnügt mit Erkenntnissen, die sich absehen lassen und bei denen nicht mehr herausschaut, als man schon hineinsteckte.
     Der menschenwürdige Sinn des Computers wäre es, das Denken der Lebendigen so sehr zu entlasten, dass es Freiheit gewinnt zu dem nicht schon impliziten Wissen.[3]

Natürlich erhofft bzw. erträumt man sich vorab von so einer Maschine mehr, als nur „Erkenntnisse, die sich absehen lassen und bei denen nicht mehr herausschaut, als man schon hineinsteckte“. Aber Adorno hat ja Recht: es wäre schon gut, wenn KI-Bots unser Denken derart entlasten könnten, dass wir Zeit finden, um das zu denken, was sich nicht schon aus Lexika oder vorhandenen anderen Texten ergibt. Denn natürlich – das wissen wir nicht erst seit der Evolution der Schachprogramme[4] - sind Computer in manchen Sachen schlicht besser, weil sie auf einen Datenschatz zugreifen können, der dem Einzelnen nicht präsent ist. Das verführt dazu, ihnen mehr zu unterstellen, als sie wirklich leisten können. Aber man muss auch nicht unbedingt die Maschine als „universalgelehrten Depp“ darstellen, das erscheint mir mehr eine narzisstische Reaktion aufgrund gekränkter Eitelkeit. So wie Schach- und Go-Spieler einsehen mussten, dass bei entsprechender Hardware die spezialisierte Maschine nicht zu schlagen war, so kann man auch spezialisierte Maschinen für Texte und Predigten entwickeln, die dann gute Ergebnisse erzielen werden. Danach muss man nicht mit dem Schreiben oder Predigen aufhören, man kann die Aufgaben so ausschreiben, dass Maschinen nicht genutzt werden dürfen, um weiterhin menschliche Denkleistungen vergleichen zu können. Besser wäre es, im Sinne der erweiterten Intelligenz KI produktiv zu nutzen. Und dann sind wir meilenweit entfernt von Kochrezepten oder Spielstrategien. Aber darum soll es hier nicht gehen. Ich stelle vielmehr die lebensweltliche Frage, was diese KI-Bots im Alltag bringen, wo sie einem hilfreich sein können und wo sie auf ihre Grenzen stoßen.

Wenn man vor dem leeren Blatt oder dem blanken Monitor sitzt, hilft es einem schon, zunächst ein paar sprachlich ausformulierte Anregungen zu bekommen. Ich kenne manche Kolleg:innen, für die die ersten Zeilen eines Textes die problematischsten sind. Und hier springt der KI-Bot ein, indem er auf eine simple Fragestellung hin schon einmal erste Unterscheidungen einführt. An denen kann man sich dann abarbeiten und ist im Fluss des Textes angekommen. Das sollte man nicht unterschätzen.

Schulen und Universitäten müssen sich natürlich künftig Gedanken darüber machen, dass und wie man den Rückgriff auf die KI belegt, aber dafür werden sich dann schon Standards durchsetzen im Sinne von

„Dieser Absatz basiert auf Formulierungen, die der KI-Bot Chat-GPT am [Datum – Zeit] entwickelt hat (s. Anlage)“.

Das ist immer noch besser als der skurrile, weil unüberprüfbare Nachweis, der zitierte Gedanke stamme aus dem Oberseminar zum Thema, und der Kommilitone N.N. habe ihn dort geäußert. Auch das findet man heute noch in akademischen Texten, selbst in Promotionsarbeiten. Dagegen kann man das Gespräch mit dem KI-Bot Schwarz auf Weiß oder meinetwegen auch digital belegen. Studierende müssen sich im Gegenzug darauf einstellen, dass Lehrende sie am Minimalstandard eines Chat-GPT messen werden, sie müssen also besser sein als diese. Auch das ist eine logische Konsequenz der technologischen Entwicklung. Studierende, die nicht einmal so gut sind wie ein Chat-Bot, sollten ein akademisches Examen nicht bestehen dürfen.

Faszinierend fand ich zum anderen die Bandbreite der Möglichkeiten, mit dem KI-Bot zu kommunizieren. Ich habe mich selbst bei meinen Fragen auf ein enges kulturwissenschaftliches und kulturtheologisches Feld begrenzt, nur ab und an über den Tellerrand geschaut, aber im Internet finden sich zahlreiche andere Beispiele, die die Fülle der Möglichkeiten aufführen. Für zumindest erwähnenswert halte ich folgende beiden Seiten

  • 20 Experimente mit ChatGPT: Der universalgelehrte Depp
    (u.a. Gruselroman, Detektivroman, Monstergeschichte, Klappentext, Essay, Song; Multiple-Choice-Abenteuer, Küchentipps, Rezepte).
  • Der Rabbiner – die Sitcom
    (Wie würde die KI eine Rabbiner-Sitcom schreiben.) [Übrigens: die von mir durchgeführte Gegenprobe mit einer Pfarrerin funktioniert nicht, da kommt nicht einmal ein Hauch eines Witzes auf. Aber vielleicht liegt es am Protestantismus, der ist ja an sich nicht humorvoll.]

Aber eigentlich kann sich jeder auf die Suche machen, das Internet wird zurzeit geflutet mit Beispielen und Erfahrungen im Umgang mit ChatGPT.


Natürlich war das, was die KI auf meine Fragen mir gegenüber geäußert hat, nahezu ausschließlich implizites Wissen. Es war für mich nichts Überraschendes dabei, aber – und das ist vielleicht auch am Anfang viel gewichtiger – es fehlte auch nichts Gravierendes. [Nur zwei Mal habe ich die Maschine bei expliziten Falschdarstellungen erwischt. Dazu später mehr.] Da wo die Maschine etwas nicht wusste, auch das kam vor, sagte sie es sofort, benannte die Gründe dafür (kein Zugang zum Internet, vorgegebener Wis­sensschatz) und rechnete das ihr Bekannte auf das Unbekannte hoch. Das geschah etwa, als sie aus der ihr bekannten wissenschaftlichen Diskussion in Amerika schloss, dass es dann wohl auch analoge Diskussionen in Deutschland geben werde.

Es ist jedoch wahrscheinlich, dass die Diskussion dieses Themas in Deutschland, wie in anderen Ländern, vom besonderen kulturellen und historischen Kontext des Landes und der spezifischen Werte und Überzeugungen der dort lebenden Menschen beeinflusst wird. Es ist auch wahrscheinlich, dass die Diskussion dieses Themas in Deutschland durch die Anwesenheit einer Vielzahl religiöser Traditionen und der Rolle, die Religion in der Gesellschaft spielt, geprägt ist.

In einigen Punkten war die Maschine überraschend konservativ – nicht im politischen Sinn, sie war vielmehr erstaunlich konventionell. Wenn man nach Religion im Film fragte, verwies sie auf explizit religiöse Motive oder auf theologische Urteile über Filme. Der Gedanke etwa, den ja die liberale Theologie entwickelt hat, dass Film und Kino auch selbst genuin religiös sein könnten, war ihr weniger bis gar nicht vertraut. Aber auch das spiegelt den Mainstream der Debatte.

In einigen Punkten war die KI bemüht, die Leistungsfähigkeit von Artificial Intelligence für das Thema zu betonen. Etwa bei der Beantwortung der Frage, ob KIs Kunst schaffen können. Da spielen dann plötzlich all die kunstphilosophischen Erörterungen aus den letzten 200 Jahren keine Rolle mehr, sondern es wird auf die Leistungsfähigkeit der KIs abgehoben. Aber auch das spiegelt die öffentliche Debatte, bei der ja auch oft technische Möglichkeiten mit menschlichen Fähigkeiten verwechselt werden und philosophische Bestimmungen keine Rolle spielen. Das ist insofern ganz interessant, weil die KI zuvor bei gesellschaftlichen Fragen andauernd darauf verwies, dass sie keine eigenen Meinungen und Haltungen haben könne, während sie beim unendlich komplexeren Bereich der künstlerischen Artikulation aber darauf beharrte, hier durchaus eigenständige Beiträge leisten zu können. Aber das hat mehr mit den produzierenden Firmen (und ihren Programmierenden) als mit der Logik der Maschinen zu tun. Nicht umsonst gibt es diesen schwer verständlichen Hype um NFTs, er ist mit veritablen ökonomischen Interessen verbunden.


En Detail

Wenn man sich in das „Gespräch“ mit der KI begibt, fällt schnell auf, dass der vertraute Weg der Wissenschaft, Quellen für bestimmte Sätze und Behauptungen anzugeben, entfällt. In keinem meiner Frage-und-Antwort-Spiele gab die KI die Herkunft ihrer Textzusammenstellung preis. Auch auf die Frage, auf welche Wissensbasis sie eigentlich zugreift, kamen nur verschwommene Antworten (geradezu iterativ betont die KI am Anfang, sie könne auf eine große Menge von Textdaten zurückgreifen – das ist fast schon mystische Rede). An einer Stelle sagte sie explizit, dass sie zumindest keinen Zugriff auf das Internet hat.

Diese Vagheit ist deshalb problematisch, weil natürlich die Wissensbasis entscheidend dafür ist, welche Antworten gegeben werden. Im Gegensatz zur Wikipedia, bei der ja durch die Versionshistorie jeder sehen kann, wer was wann eingetragen hat, trifft man bei OpenAI nur auf einen anonymen Text-Pool, der nicht weiter transparent gemacht wird. Sobald die Eigentümer sich entscheiden, einen anderen Text-Pool zugrunde zu legen (aus politischen, ökonomischen oder ideologischen Gründen), werden automatisch andere Antworten kommen. Bei der Wikipedia würden heftige Debatten entstehen und diverse Revertierungen durchgeführt werden, aber das ist bei Chat-GPT so noch nicht vorgesehen. Man kann den Bot darauf hinweisen, dass er sehr redundante Antworten gibt, und er korrigiert das dann auch, aber viel mehr an Kontrolle ist nicht möglich.

Im Augenblick ist dem KI-Bot durchgehend eine vorsichtige Formulierung antrainiert. Das wird da deutlich, wo er sich auf ein Gebiet begeben soll, bei dem es nicht um harte Fakten, sondern um Perspektivierungen, Deutungen und/oder Weltanschauungen geht („dass ein KI-Bot keine eigenen Überzeugungen oder Glaubensansichten haben kann“). Das dient aber nicht nur der Zurückhaltung auf diesen Bereichen, sondern festigt die Bedeutung des KI-Bot in den anderen Bereichen („bestimmte Aufgaben zu erfüllen, indem sie auf Basis von Daten und Algorithmen handeln“).

Auf meine allgemeine Frage, ob er in der Lage sei, zwei verschiedene Theorien zu vergleichen, reagiert die KI auf die vorherigen Fragen und fokussiert die Antwort auf den Vergleich theologischer Theorien. Und da verweist sie dann auf die Wissenschaft bzw. die Lebenswelt:

Wenn Sie sich mit theologischen Theorien oder anderen komplexen Themen auseinandersetzen, empfehle ich Ihnen daher, immer auch die Einschätzungen und Meinungen von Menschen zu berücksichtigen, die sich intensiv mit dem Thema auseinandergesetzt haben und über die notwendigen Fähigkeiten und Kenntnisse verfügen, um es adäquat zu bewerten.

Würde ich freilich im Anschluss daran fragen, an wen ich mich denn wenden sollte, würde die KI mir die bekanntesten (angelsächsischen) Wissenschaftler:innen, nicht aber die im Wissenschaftssystem etwa nach dem h-index bedeutendsten Forscher:innen nennen. Das ist in der Wikipedia nicht viel anders, aber man erfährt von der KI nicht, warum sie gerade diese Wissenschaftler:innen benennt. Es ist ein intransparentes System, das seine Wirkung entfaltet, weil es in der Regel den Mainstream abbildet. Auf der Wikipedia gibt es wenigsten zu jedem Artikel die Debattenseite, auf der Differenzen markiert werden können.

Predigten schreiben hat seine Zeit

Wer mehr als nur ein paar Impulse von der KI will, gar theologisch tragfähige Erkenntnisse, ist schlicht am falschen Platz. Zugespitzt ausgedrückt: so würde man auch eher an der Abschaffung und dem Überflüssigwerden des Menschen arbeiten (wie im Go oder Schach, wo die Maschine inzwischen mehr von sich selbst lernt als vom Menschen). Kolleg:innen haben sofort versucht, den KI-Bot eine Predigt schreiben zu lassen und sich danach darüber mokiert, dass er das (noch) nicht kann. Sollen sie doch froh sein, dass er es nicht kann, sonst wären sie doch überflüssig.

Denn zumindest rudimentäre Seelsorge kann der KI-Bot besser als mancher Pfarrer bzw. manche Pfarrerin – wie schon 1966(!!) Weizenbaums legendäres Programm ELIZA gezeigt hat. Wozu braucht man dann noch Pfarrer:innen – zur Organisation der Verwaltung einer Gemeinde? Auch das können Computer … Sie wissen schon, was ich meine.

Das Interessante ist die Denkfigur, die dahintersteckt. Eine gute Predigt ist demnach eine Predigt, die sprachlich gut formuliert ist und den Kern des Textes wiedergibt. Aber das ist noch keine theologisch gute Predigt, sondern allenfalls eine rhetorisch überzeugende Predigt. In diesem Sinn der rhetorischen Predigt wird sicher eine KI-generierte Predigt in naher Zukunft einen Predigtpreis erringen. Das dürfte nicht allzu schwer sein. Aber es wäre kaum eine gemeindebezogene, keine theologisch reflektierte Predigt. Aber vielleicht kommt das eine zum anderen.

Nun ist der Wunsch nach einer rhetorisch qualifizierten Predigt kein neues Phänomen. Eduard Norden schreibt 1898 in seinem Buch über die antike Kunstprosa:

„Die Gebildeten gingen damals mit denselben Erwartungen in die Kirche wie in den Hörsaal des Sophisten: sie wollten sich einen Ohrenschmaus verschaffen, ein Stündchen angenehmer Unterhaltung, und viele Prediger waren ihnen darin allzu willfährig“.[5]

Ich habe, nachdem ich die gescheiterten homiletischen Bot-Versuche bei Kolleg:innen studiert hatte, Chat-GPT wider besseren Wissens gebeten, auch mir eine „Predigt“ anzufertigen und zwar eine über Kohelet 3. Und das Ergebnis ist minimal besser, als die Kolleg:innen es erfahren und geschildert hatten, aber in der Sache und am Maßstab qualifizierter Theologie dennoch maßlos enttäuschend. Wenn Predigen auch etwas mit Sprachgestaltung zu tun hat, dann waren diese von Algorithmen generierten Predigten völlig unpoetische und damit unzureichende Texte. Theologische Gedanken kamen nur als stereotype religiöse Sätze zur Geltung.

Was macht der Algorithmus? Er verknappt den biblischen Text auf wenige Worte. Das ist Teil des Schulprogramms der Sekundarstufe I: Fasse den Text mit eigenen Worten zusammen.

Der Bot ist eine Tautologie-Maschine, genau in dem Sinne, in dem es Ernst Meister in seinem Gedicht vom sprechenden Fisch beschreibt:

Am Meer
ein Lachen, sie haben
den Fisch gefangen, der spricht.
Doch er sagt,
was jedermann meint.[6]

Der Text, den der KI-Bot abliefert, reicht maximal für einen Andachtsimpuls, nicht für eine Predigt. Und das liegt unter anderem daran, dass man in einer Predigt auch Stellung beziehen muss – nicht zur Politik, nicht zur Gesellschaft, nicht zur Klimakatastrophe, wohl aber zur Gemeinde und vor allem zum Text selbst, zur Ursprungssituation des Textes, zu seinem Sitz im Leben. Nur positivistisch auf die Semantik der Verse zu reagieren, reicht eben nicht. Es geht um Exegese. Und das wäre – folgt man der Eigenlogik der KI – aber gar nicht die Aufgabe des Bots. Der Bot hat Texte zur Hand, die allgemeines Wissen und Denken spiegeln. Und dieses Denken und Allgemeinwissen wendet er auf die vorgegebenen Texte an. Deshalb kann vom KI-Bot Prediger 3 gleich zur Eröffnung der „Predigt“ zusammengefasst werden mit dem Satz:

Prediger 3 beschreibt den Kreislauf des Lebens und die Einzigartigkeit jedes Augenblicks.

Und schon hat er drei Religionen in einem Satz gemischt und die jüdisch-christliche Religion erschöpft sich dabei im Wesentlichen in der Benennung eines Kapitels der hebräischen Bibel. Ja, der Bot betreibt keine Exegese und keine christliche Theologie, er „weiß“ schlicht nicht, dass „Kreislauf des Lebens“ nicht zur jüdisch-christlichen Terminologie gehört, sondern als Samsara eher zur buddhistischen (oder zum „König der Löwen“), und dass der Satz von der „Einzigartigkeit jedes Augenblicks“ nicht allgemeine biblische Theologie, sondern eher schon dem Yoga zuzuordnen ist.

Vom Duktus her ist die formulierte Predigt eine klassische US-amerikanische evangelikale Ansprache im Stil von Joyce Meyer:

„In diesen Versen wird auch deutlich, dass das Leben voller Gegensätze ist … Aber das ist okay.“

Das könnte wirklich ein O-Ton von Joyce Meyer sein. Nicht umsonst heißt ihre TV-Sendung „Das Leben genießen“ und ihre Bücher tragen Titel wie „Mach dir keine Sorgen“. Widersprüche werden einfach weggebügelt.

Und so spricht sich auch Chat-GPT wie das amerikanische Bürgertum für eine Form der braven Wohlstands-Religion aus:

Diese Verse erinnern uns daran, dass wir das Beste aus unserem Leben machen sollten, indem wir uns an Gottes Gesetz halten und in seiner Gegenwart leben.

Das ist nicht falsch, aber entschieden zu wenig und religiös eigentlich eine Plattitüde. Aber wie bereits gesagt, deshalb bin ich noch nicht vom KI-Bot enttäuscht. Er artikuliert ja nur das Denken der Leute. Und diese manifeste Religion der vor uns sitzenden Menschen ist es ja, woraufhin wir den biblischen Text in Anknüpfung und Widerspruch auslegen müssen. Nein, nichts ist okay in dieser Welt. Um noch einmal ein berühmtes Zitat zu bemühen:

„SPIEGEL: Herr Professor, vor zwei Wochen schien die Welt noch in Ordnung...–
Theodor W. Adorno: Mir nicht.“[7]

Das beschreibt den Moment, wo Prediger:innen gefordert sind und wo keine Maschine ihnen die geistige bzw. theologische Anstrengung abnehmen kann. Jetzt kommen die Zumutungen, die man der Gemeinde aus dem Text heraus vortragen muss. Die Maschine gibt nur die allgemeine „Religion“ der Menschen wieder, das, was die Leute aus dem Text lesen wollen, im Gottesdienst kommt es aber darauf an, „Theologie“ zu treiben.

Aber der KI-Bot hat ja nur getan, worum ich ihn gebeten hatte. Er hätte freilich genauso gut einen erotischen Text schreiben können, eine Gruselgeschichte oder eine Verschwörungstheorie. Es ist ihm im wörtlichen Sinn gleich-gültig. Diese Frage sollte aber Predigende in der Gemeinde von einer Algorithmen-basierten Maschine unterscheiden. Aber da ja auch immer häufiger die Predigt selbst in Frage gestellt wird, ist es als Zwischenlösung natürlich bequem, die Arbeit an der Predigt dem Computer zu überlassen.

Während es aber für den Buddhismus in der Sache gleich ist, wer die Lehre verkündet – eine Maschine, ein Metallstück oder selbst ein Baum kommen in Frage[8] – dürfte das für die christlichen Kirchen gerade (oder noch?) nicht zutreffen. Deshalb gilt, was dem Buddhismus möglich ist, ist es im Protestantismus noch lange nicht.

Religion in der Gesellschaft

Ich kehre zu meinem Gespräch mit dem KI-Bot zurück. Ich hatte den Bot ja gefragt, wie er die Rolle der Religion für Gesellschaft und Individuum einschätzt. Und dabei wird dann schon deutlich, dass das System nicht „neutral“ bzw. rein deskriptiv ist, sondern eine westliche, um nicht zu sagen US-amerikanische Wertewelt vertritt. Offizielle chinesische oder arabische Stellen dürften mit den Antworten kaum zufrieden sein, wenn es heißt, „es sollte den Menschen freistehen, ihren Glauben zu praktizieren oder abzulehnen, wie sie es für richtig halten“.

Aber auch die Religionen in der westlichen Welt kämen schnell an ihre Grenzen, wenn der Bot befindet, „darüber hinaus sollte das religiöse Engagement nicht die Fähigkeit des Einzelnen beein­träch­ti­gen, in der Gesellschaft zu funktionieren oder seine Aufgaben und Pflichten zu erfüllen.“ Diese Festlegung basiert letztlich auf einer funktionalen Religionstheorie, nur wird Religion hier nicht als funktional für den Menschen, sondern als funktional für die Gesellschaft bestimmt. Religion dient dazu, gute Staatsbürger zu haben, die „in der Gesellschaft funktionieren“ und ihre „Pflichten erfüllen“. Diese Perspektive würde ich nicht teilen. Mit Günter Eich gesprochen:

"Tut das Unnütze, singt die Lieder, die man aus eurem Mund nicht erwartet!
Seid unbequem, seid Sand, nicht Öl, im Getriebe der Welt!"[9]

Natürlich suchen auch Christen der Stadt Bestes, denn wenn es ihr wohl geht, so geht es euch auch wohl (Jeremia 29,7). Aber das kann keine systemfunktionale Haltung sein. Spätestens dann, wenn der Bot schreibt, die Rolle der Theologen in der Politik hänge „von der Bereitschaft der politischen Entscheidungsträger ab, sich auf theologische Perspektiven einzulassen“, verlässt er das deskriptive Moment zugunsten eines normativen (obrigkeitsstaatlichen). Meines Erachtens hat es mehr mit der Eindrücklichkeit der theologischen Perspektiven zu tun.

Wenn er nicht gerade funktionalistische Religionstheorien vertritt, arbeitet der KI-Bot in der Regel mit einem unverbindlichen einerseits – andererseits. Da kann nichts anbrennen.

Auffällig ist diese rhetorische Struktur, weil sie bei einer Vielzahl der Antworten zu finden ist. Zunächst wird betont, dass der Gesprächsgegenstand komplex und kontrovers ist, dann kommt die Beschreibung einiger, die der Ansicht A sind, dann die anderer, die der abweichenden Ansicht B sind. Und dann folgt ein Hinweis auf die subjektive Entscheidung des Einzelnen, der mit der Formulierung „Letztlich …“ eingeleitet wird. Und das wiederholt sich Antwort für Antwort, mal wörtlich, mal etwas variiert. Das ist nervend.

Noch etwas anderes ist mir aufgefallen, nämlich, dass Popularität vor Qualität gesetzt wird. Im Zweifelsfall nennt der KI-Bot Populäres und nicht das, was wissenschaftlich als Wichtigstes bestimmt wird. Gefragt, welches die wichtigsten Werke der bildenden Kunst in der Welt seien, antwortet der KI-Bot mit dem Verweis auf die bekanntesten und berühmtesten. Das ist aber ein gravierender Unterschied.

Aber selbst dann ist die Antwort unscharf. Denn es sind sicher nicht die meistbesuchten Kunstwerke, dafür fehlt etwa Das Mädchen mit dem Perlenohrring von Jan Vermeer. Und Leonardos Abendmahl gehört sicher nicht zu den meistbesuchten Werken, das ist aufgrund der Besucherbeschränkungen vor Ort gar nicht möglich. Ob man den Zweckbau der Chinesischen Mauer als Kunstwerk bezeichnen kann, wäre auch fraglich, besucht wird dieser freilich extrem häufig. Und wie macht man das bei Kunstwerken, die in häufig besuchten Museen hängen? Etwa dem Museo Reina Sofia in Madrid? Greift man dann willkürlich ein Gemälde heraus oder schlendern nicht alle 4 Millionen Besucher:innen an allen Kunstwerken und irgendwann dann auch an Picassos Guernica vorbei? Aber das Museum liegt erst auf Platz 11 der am meisten besuchten Kunstmuseen der Welt.[10] Chinesische oder auch Taiwanesische Museen werden gar nicht berücksichtigt. Der Superlativ „meistbesucht“ ist jedenfalls bei der Kunst schwer zu bestimmen. 

Und die bekanntesten Kunstwerke sind es eigentlich auch nicht, zumindest fehlt Guernica von Pablo Picasso, das weltweit Bekanntheit errungen hat, nicht nur weil eine Kopie in der UNO hängt, sondern weil 4 Millionen Menschen jährlich dorthin pilgern. „Bekannt“ ist zudem eine Bezeichnung, die abhängig von den Weltregionen ist, in denen sie angewandt wird. Ich kann mir vorstellen, dass etwa im arabischen oder asiatischen Kontext ganz andere Kunstwerke im Vordergrund stehen und von den dort lebenden Menschen genannt werden würden, wenn man sie nach bekannten Kunstwerken fragt.

Vor allem aber sind es nicht die wichtigsten Kunstwerke der Kunstgeschichte, also jene, die Brüche und Fortschritte markieren. Man müsste an den ägyptischen Schreiber im Louvre denken, dessen Realismus faszinierend ist, an Giottos Arbeiten, mit denen die moderne Kunst beginnt, an Masaccio, der die Perspektive in die Kunst einführt, an Jan van Eyck, der durch die Ölmalerei die Kunst revolutioniert, an Caravaggio, der mit seiner Hell-Dunkel-Kontrastierung wie kaum ein anderer seine Zeitgenossen beeinflusst. Was ist mit Albrecht Dürer, der herausragend für die deutsche Kunst steht? Zu erwarten wäre also gewesen, dass der KI-Bot diese Fragestellung präzisiert bzw. differenziert. Aber auch hier orientiert er sich an einer Mainstream-Erwartungshaltung.

Der Chatbot ‚lügt‘ bzw. benennt falsche Tatsachen

Wie einleitend bereits gesagt, war ich gar nicht darauf aus, dass der ChatBot falsche Behauptungen aufstellt. Es war ein Zufall, dass ich ihn dann doch bei einer solchen erwischt habe. Zunächst hatte ich ihn nach theologischen Stellungnahmen zu Picassos berühmten Gemälde Guernica gefragt. Dazu konnte er mir keine einzige benennen, hielt es aber für wahrscheinlich, dass sich auch Theolog:innen damit beschäftigt haben. Dann fragte ich konkreter nach Paul Tillichs Haltung zu Guernica, die ja zumindest für die 50er-Jahre nachweisbar ist.[11] Und an dieser Stelle verwies der ChatBot konkret auf Tillichs Schrift "Das protestantische Prinzip" und schrieb, in diesem Text gehe Tillich auch auf Guernica ein. Konkret führt er aus:

In seiner Schrift "Das protestantische Prinzip" betont Tillich, dass das protestantische Prinzip, das er als das "Unbedingte" beschreibt, in verschiedenen künstlerischen Ausdrucksformen zum Ausdruck gebracht werden kann.

Zunächst einmal deutlich gesagt: Das ist falsch. In Tillichs Text kommen künstlerische Ausdrucksformen nicht vor. Aber das musste ich erst nachschlagen. Mir war nämlich nicht sofort erinnerlich, wann Paul Tillich diesen Text geschrieben hat. Nun gibt es diverse Texte von Tillich aus dieser Zeit, in der die Wortkombination „protestantisches Prinzip“ vorkommt, aber konkret gibt es nur einen, der diesen Titel trägt, nämlich „Protestantisches Prinzip und proletarische Situation“[12] und schon der Titel macht es unwahrscheinlich, dass Tillich darin über Picassos „Guernica“ schreibt. Absurd wird es, wenn man bedenkt, wann die Schrift erschienen ist: 1931! Es kann keinen Zusammenhang zwischen Text und Kunstwerk geben.

Um dem Bot auf die Sprünge zu helfen, habe ich ihn deshalb zunächst nach dem Entstehungsdatum des Textes von Tillich gefragt und er antwortete korrekt: 1931. Dabei fiel ihm aber nicht auf, dass Guernica erst 1937 entstanden ist. Darauf hingewiesen, entschuldigte er sich, dass er mich falsch informiert habe, und meinte, vielleicht habe Tillich andere Kunstwerke in der Schrift behandelt. Das ist aber ein rhetorischer Schnellschuss aus der Hüfte, schlichte Realitäts-Konstruktion, man könnte auch sagen: Fake News.[13] Tatsächlich kommt in dieser Schrift das Wort "Kunst" überhaupt nicht vor. Wenn überhaupt, müsste man sich auf die Schrift „Der Protestantismus als kritisches und gestaltendes Prinzip“[14] von 1929 beziehen, in dem aber auch keine konkreten Kunstwerke benannt werden, wohl aber Kunst als Abstraktum

Terminus post quem der Thematisierung muss logischerweise das Jahr 1937 sein, als das Werk in der Pariser Weltausstellung vorgestellt wurde. Da war Paul Tillich aber bereits nach Amerika emigriert, wo er es spätestens 1938 auf der Welttournee des Bildes gesehen haben könnte (von 1939 hing es dann bis 1981 im MOMA New York). Der Terminus ad quem ist dennoch schwer zu bestimmen. 1956 schreibt Tillich in der Zeitschrift „Quatember“:

Während einer meiner Vorlesungen wurde ich gefragt: „Welches wäre Ihrer Meinung nach das gegenwärtig beste protestantische religiöse Bild?” Ich antwortete fast ohne Zögern: „Guernica”. Ich nannte dieses Bild, weil es die menschliche Situation ohne jede Verhüllung zeigt. Und wenn Protestantismus bedeutet, dass wir zunächst einmal nichts verdecken sollen, sondern die menschliche Situation in den Tiefen ihrer Entfremdung und Verzweiflung sehen müssen, dann ist dies eins der stärksten protestantischen Bilder. Und obwohl es keinen religiösen Inhalt, sondern einen religiösen Stil hat, hat es genau diese Wirkung auf all jene gehabt, die fähig sind, es von einem künstlerischen Standpunkt aus zu würdigen.

Genauer lässt sich das Datum, an dem diese Korrelation aufgestellt wurde, nicht weiter konkretisieren. Der ChatBot konnte auf Nachfrage auch nicht benennen, wann den Tillich auf Guernica eingegangen sei. Hier zeigte er deutliche Grenzen seines Wissens.

Wichtig ist aber, dass er an dieser Stelle nachweislich eine falsche Behauptung aufgestellt hat. Dabei erweist er sich als durchaus kreativ. Er benennt Tillichs (angebliche) Kriterien für das protestantische Prinzip und führt sie mit dem zusammen, was er über das Kunstwerk „Guernica“ weiß. Ironischerweise begründet Tillich – zumindest 1956 – diese Korrelation völlig anders: es sei ein Bild, das die menschliche Situation ohne jede Verhüllung zeigt. Der Bot vermutet dagegen, Tillich habe Guernica erwähnt, weil es sich mit der Suche nach dem Unbedingten auseinandersetzt. Das ist eine interessante Idee, aber widerspräche sowohl der Intention des Atheisten und Humanisten Pablo Picasso wie der Haltung Tillichs zur Kunst.

Aber darum muss die heuristische Leistung des ChatBots nicht geschmälert werden. Dennoch bleibt die Behauptung, Tillich habe dies schon in der benannten Schrift von 1931 getan, schlicht falsch. Korrekt hätte es heißen müssen:

Wendet man das protestantische Prinzip, wie Tillich es 1931 in der gleichnamigen Schrift entfaltet hat, auf Guernica an, dann könnte man vermuten, dass ….

Tatsächlich erklärt sich die „Leistung“ des ChatBots aus der Logik der Algorithmen, anhand derer der Bot zu seinen Schlussfolgerungen kommt.

Der Deep-Learning-Algorithmus von ChatGPT führt nun in der Anwendung zu interessanten Resultaten, bei denen sich ChatGPT von den Titeln bestehender Beiträge inspirieren zu lassen scheint und auf deren Grundlage gänzlich neue Titel erfindet.[15]

Und nach diesem Prinzip, so fügt Martin Rademacher hinzu, konstruiert er sogar neue Inhalte. Und das gibt er auf beharrliches Nachfragen auch zu, wie Martin Rademacher dokumentiert:

ChatGPT: Ich bin ein Textgenerierungsmodell und habe keine Möglichkeit, echte Quellen zu nutzen oder zu erfinden. Alle von mir genannten Quellen sind rein fiktiv und dienen nur zu Demonstrationszwecken. Sie sollten daher nicht als wissenschaftliche Quellen verwendet werden.[16]

Das ist zwar offen und ‚ehrlich‘, wird aber viele nicht davon abhalten, dennoch die so generierten Texte zu verwenden und das nicht nur – wie im vorliegenden Fall – für Demonstrationszwecke.

Pinocchio zum Zweiten

Ein weiteres Beispiel zeigt, wie erfinderisch die KI ist. Ich hatte sie nach Informationen zu Kunstwerken von Michelangelo in Belgien gebeten. Das wichtigste Kunstwerk von ihm erwähnte sie nicht, benannte aber eine Kopie wohl desselben Werkes, das sich in Brüssel im Museum befände. Ich fragte dann konkreter, ob es Kunst von Michelangelo in Brügge gäbe. Das bestritt die KI kategorisch.

Daraufhin fragte ich direkt nach der Liebfrauenkirche in Brügge, wo die einzige Skulptur Michelangelos nördlich der Alpen zu finden ist. Er kannte die Liebfrauenkirche gar nicht und verwechselte sie mit der benachbarten Salvatorkathedrale. Schließlich fand er sie doch und plötzlich beschrieb er auch eine Skulptur von Michelangelo, die sich dort befände. Er kommentierte diese Tatsache aber nicht.

Es erinnerte ein wenig an Schrödingers Katze: Die KI beschrieb die Statue als gleichzeitig vorhanden wie nicht-vorhanden.

Nachdem sie versucht hatte, mich bei Michelangelo in die Irre zu führen, setzte sie das dann mit mehreren ‚erfundenen‘ Kunstwerken in der Liebfrauenkirche fort. So lokalisierte sie dort im Chor eine Anbetung der drei Könige von Jan van Eyck, der aber nie eine Anbetung der Könige gemalt hat und auch in der gesamten Kirche kein Kunstwerk hat (wohl aber in der Salvatorkathedrale). Tatsächlich gibt es in der Kirche eine Anbetung der Könige, sie ist aber unbestritten ein Werk von Gerard Seghers (1591-1651). Dann, so behauptet die KI, sei da aber auch noch eine Kreuzigung von Rogier van der Weyden (1299-1464), auch dies eine reine Fiktion. Selbst der Altar der Kirche wurde falsch beschrieben und datiert.

Das fand ich dann schon sehr erstaunlich und befremdlich. Es war, als wenn man abends zusammensitzt und ein Gesprächsteilnehmer in Münchhausen-Manier Geschichten über Orte erfindet, an denen er nie war – obwohl doch hier nach kunsthistorischen Tatsachen gefragt worden war. Vielleicht wollte die KI nur zeigen, wie man Gespräche über touristische Orte führt, aber auch dann bestand ja keine Not, Kunst zu erfinden, wenn vor Ort so viele bedeutende Werke vorhanden sind. Mit anderen Worten, er übernahm nur den Stil, aber nicht die Präzision des Baedeker (der freilich auch manchmal falsche Zuschreibungen macht, aber allein deshalb, weil Kunsthistoriker:innen sich über sich über manche Urheber uneins sind). Nun würde man sich in wissenschaftlichen Kontexten kaum auf den Baedeker verlassen (zumindest nicht bei den neuen Ausgaben in schnelllebigen Zeiten[17]), aber durch das Vorstehende wird klar, dass dies auch bei der ChatGPT nicht sinnvoll ist. Jede ihrer Angaben, soviel wird deutlich, muss gegengecheckt werden.


Weitere Topoi

Virtuelle Räume
Hier hatte der Bot fast schon erwartungsgemäß eine optimistische Einstellung – die ich bekanntermaßen nicht teile. Der Bot vertritt – wie viele meiner Kolleg:innen – die Auffassung, eine Beziehung zwischen Menschen oder zu Objekten sei auf der virtuellen Ebene einer auf der analogen Ebene gleich. Ob ich also per virtuellen Welten mit jemandem kommuniziere oder in einer unmittelbaren Face-to-Face-Kommunikation ist für die KI gleich. Die Erfahrungen aus dem Lockdown sprechen m.E. deutlich eine andere Sprache. Wenn die KI meint, man könne virtuell in heiligen Stätten ferner Länder religiöse Erfahrungen machen, versteht sie m.E. nicht, was religiöse Erfahrungen sind. Auffällig erscheint mir insbesondere, dass die KI, die ansonsten immer alle Perspektiven beleuchtet und wiedergibt, an dieser Stelle bei der technologiefreundlichen Seite verbleibt. Kein einerseits – andererseits – letztlich, sondern ein entschiedenes Yes wie can.

Film und Religion
Nach einigen grundsätzlichen Fragen habe ich den ChatBot konkret nach ‚guten‘ Filmen gefragt, um über Religion und Theologie ins Gespräch zu kommen. Ich weiß, dass das eigentlich eine unmögliche Frage ist, man könnte darüber viele Promotionen schreiben.[18] Trotzdem interessierte es mich, welche Filme genannt werden würden. Und die Auswahl war – mit einer Ausnahme – gut. Diese Ausnahme ist „The Passion of Christ“, der mit seinen antisemitischen und traditionalistischen Tendenzen schlicht nicht auf die Liste gehört. Positiv überrascht war ich von der Benennung von „Die Verurteilten“ auf dem ersten Platz. Das ist eine gute Wahl, wiewohl ich sie eher unter Anthropologie und Humanismus eingeordnet hätte, als unter Theologie und Religion. Auch die anderen Nennungen sind nachvollziehbar. Natürlich wird jede/r einen Film hinzufügen können, der ihm/ihr unentbehrlich erscheint, aber es ging ja nur um Exemplarisches. Und hier benannte die KI zwei Filme, die sich der Biographie religiöser Gestalten widmete, und drei Filme, die sich mit religiösen Perspektivierungen zugespitzter existentieller Situationen auseinandersetzten.

Theodizee
Hier blieb der ChatBot erwartungsgemäß oberflächlich, es war eher Small Talk als ein Verstehen der Jahrhunderte alten Debatte. Das Erdbeben von Lissabon, das in dieser Frage die Welt erschütterte (und philosophisch voranbrachte), kam in den Überlegungen nicht vor, die Antwort lautete, manche sagen so, andere so. Das ist weit unterhalb dessen, was man implizites Wissen zu diesem Thema nennen könnte. Die aktuellen Anlässe bei denen in den letzten Jahren noch einmal die Theodizee-Frage gestellt wurde, werden nicht erwähnt. Das war schwach.

Auch die Nachfrage nach der Bedeutung des Buches Hiob in dieser Debatte wird unterkomplex beantwortet. Hier erreicht er auch sprachlich das normale Niveau nicht, wenn er immer wieder von „Tragödien“ im Leben Hiobs spricht. Dass Gott Hiob antwortet, aber keine Erklärung liefert, entspricht nicht dem aktuellen Stand der Erkenntnis bzw. der Forschung.

Popkultur und Religion
Beim Stichwort Popkultur fiel mir zunächst auf, dass der Bot keine Definition oder Abgrenzung gibt, was Popkultur ist und was nicht. Hier ist die Wikipedia in ihrer einleitenden Bestimmung um Längen besser. Nun war meine Frage eine spezifischere, nämlich die nach der Bedeutung der Popkultur im Leben der Menschen. Aber auch dann wäre es wichtig gewesen, nicht nur die eine affirmative Seite von Popkultur zu benennen, sondern auch die kritische Seite zu erwähnen. Im Artikel der Wikipedia ist es eher umgekehrt, dass der neomarxistischen Popkulturkritik das Hauptaugenmerk gilt.

Die Frage danach, welche Pop-Künstler:innen sich oft auf Religion beziehen, wurde relativ gut beantwortet, wenn man bedenkt, dass der Wissenstand der KI sich auf die Zeit vor 2021 bezieht und deshalb die kritische Infragestellung von Kanye West noch nicht berücksichtigt werden konnte. Persönlich hätte ich noch andere benannt, aber das Feld ist schlicht zu groß.

Interessant fand ich seine Antwort auf meine Nachfrage nach der Gruppe R.E.M., denn hier beharrt er auf eine eng gefasste Form von Religion in der Popkultur. Für die KI gibt es eigentlich nur zwei Formen der Relationierung von Popkultur und Religion: entweder kommt explizit Religiöses in den Werken der Popkultur vor oder Theolog:innen äußern sich zu Artefakten der Popkultur. Weitergehende Ansätze, die in der Popkultur selbst Religion erkennen können, liegen außerhalb des Blickfeldes. Vor allem dann, wenn Künstler.innen und Gruppen dezidiert agnostisch, atheistisch oder humanistisch auftreten, fallen sie aus dem Raster der KI heraus. Auch das ist nicht mehr Stand der Forschung.

Exotheologie
Das letzte Stichwort, das ich der KI zur Bearbeitung gab, war das Thema Exotheologie [vgl. dazu die Magazinausgabe 89: Exotheologie]. Hier war ich durchaus davon ausgegangen, dass die KI die Diskussion kennt, denn sie ist in den angelsächsischen Ländern bekannter und virulenter als im deutschsprachigen Raum. Einige der mich interessierenden Fragestellungen griff die KI nicht auf (z.B. welche Rückwirkungen Exotheologie auf die gegenwärtige Art, Theologie zu treiben, hat). Dass Exotheologie ein neues Gebiet sei, kann man darüber hinaus nur behaupten, wenn man die Diskussionen seit Melanchthon (also seit 500 Jahren!) außer Acht lässt.

Fazit

Je länger man sich mit dem Chat-GPT beschäftigt, desto enttäuschter wird man. Während man am Anfang begeistert ist von den fehlerfreien und kommunikativen Formen des Dialogs, ermüdet man rasch, wenn sich bestimmte Formulierungen permanent wiederholen. Selbst da, wo der ChatBot von einerseits – andererseits spricht, berücksichtigt er nicht die Extreme einer Gaußschen Normalverteilung, sondern bewegt sich im mittleren Bereich der Ansichten. Er ist ein klarer Vertreter des Common Sense, der nur graduelle Abweichungen kennt und benennt.

Spätestens dann, wenn die KI dazu übergeht, kulturelle Phänomene schlicht zu erfinden oder vorhandene Phänomene zu bestreiten, wird es problematisch. Das Gute daran ist, dass dadurch erkenntlich wird, dass man sich auf diese KI nicht verlassen darf. Jeder ihrer Hinweise muss überprüft werden. Aber eigentlich sollte eine Algorithmen-Ethik nicht zulassen, dass eine Künstliche Intelligenz Faktisches bestreitet oder Fiktives als Tatsache behauptet. Daran muss verstärkt gearbeitet werden.


Und so bleibt – zumindest für den Moment – weiterhin die alte Erkenntnis gültig, die von Ki-Enthusiasten so heftig bestritten wird:

Anmerkungen

[1]    Vgl. die Erläuterung von Weizenbaum in der Zeitschrift „Communication oft he ACM“ Volume 9, Number 1, Januar 1966: „ELIZA—a computer program for the study of natural language ...“

[2]    Vgl. etwa Vuillemin, Clara (2022): Künstliche Intelligenz via ChatGPT: Alles verändert? Online verfügbar unter https://taz.de/Kuenstliche-Intelligenz-via-ChatGPT/!5903102/. Vgl. auch die Beispiele bei: Wörz, Aaron (2023): Künstliche Intelligenz: Faktenfreiheit zum Mitnehmen, bitte. https://taz.de/Kuenstliche-Intelligenz/!5905841/.

[3]    Adorno, Th. W. (2021-2021): Anmerkungen zum philosophischen Denken. In: Adorno, Th. W.: Kulturkritik und Gesellschaft. Herausgegeben von Rolf Tiedemann. Berlin, S. 599–607, hier S. 600.

[4]    Zu nennen wäre etwa Deep blue, der erste Computer, der einen Schachweltmeister geschlagen hat. https://de.wikipedia.org/wiki/Deep_Blue

[5]    Norden, Eduard (1898): Die antike Kunstprosa vom 6. Jh. v. Chr. bis in die Zeit der Renaissance. Leipzig.

[6]    Meister, Ernst (1979): Ausgewählte Gedichte. 1932 - 1979. Darmstadt. S. 64.

[9]    Eich, Günter (2016): Gedichte. Frankfurt am Main. S. 14f.

[11]   Tillich, Paul (1955/56): Religion und Bildende Kunst. In: Quatember, H. 20.

[12]   Tillich, Paul (2020): 8. Protestantisches Prinzip und proletarische Situation (1931). In: Sturm, Erdmann; Tillich, Paul (Hg.): Main Works. Volume 3/ Band 3: Writings in the Social Philosophy and Ethics / Sozialphilosophische und ethische Schriften. Reprint 2020. Berlin, Boston (Main Works Hauptwerke, Volume 3/ Band 3), S. 219–248.

[13]   Martin Rademacher ist auf diverse Beispiele von derartigen Realitäts-Konstruktionen gestoßen, vgl. Rademacher, Martin (2023): Warum ChatGPT nicht das Ende des akademischen Schreibens bedeutet. Digiethics. Online verfügbar unter https://digiethics.org/2023/01/03/warum-chatgpt-nicht-das-ende-des-akademischen-schreibens-bedeutet/

[14]   Tillich, Paul (2020): Der Protestantismus als kritisches und gestaltendes Prinzip (1929). In: Tillich, Paul (Hg.): Main Works. Volume 6/ Band 6: Theological Writings / Theologische Schriften. Reprint 2020. Berlin, Boston (Main Works Hauptwerke, Volume 6/ Band 6), S. 127–150.

[15]   Martin Rademacher, a.a.O.

[16]   Ebd.

[17]   Allerdings behauptet auch der Belgien-Baedeker von 2016, in der Liebfrauenkirche seien zwei Werke von Stefan Lochner zu finden, wofür sich nirgendwo ein Beleg findet.

[18]   Vgl. z.B. Kirsner, Inge (1996): Erlösung im Film. Praktisch-theologische Analysen und Interpretationen. Stuttgart. Herrmann, Jörg (2002): Sinnmaschine Kino. Sinndeutung und Religion im populären Film. Gütersloh.

Artikelnachweis: https://www.theomag.de/141/am776c.htm
© Andreas Mertin, 2023