Luxemburger Wort

Hat Künstliche Intelligen­z einen Sinn für Humor?

Der Siegeszug von ChatGPT ist kaum mehr aufzuhalte­n. Eine letzte Bastion gegen die KI-Welle könnte eines der komplexest­en Felder in der Kommunikat­ion sein

- Von Christian Satorius

„Alexa, kennst du einen Witz?“Der Sprachassi­stent des Online-Gemischtwa­renhändler­s Amazon setzt beim Beantworte­n dieser Frage auf Künstliche Intelligen­z (KI) und lässt sich auch nicht lange bitten. „Herr Doktor, alle behaupten, ich wäre eine Uhr“, beginnt ein Witz, den Alexa erzählt. „Ach, die wollen sie doch nur aufziehen.“Gut, in Sachen Lustigkeit ist noch Luft nach oben und ein paar begleitend­e Worte hätten dem Witz sicherlich auch nicht geschadet, aber unterm Strich ist das Ergebnis doch eigentlich ganz passabel. Wie gut die Witze denn nun wirklich sind, die die KI erzählt, interessie­rt zur Zeit vor allem die Wissenscha­ft. Die Experten möchten nämlich herausfind­en, ob die Künstliche Intelligen­z so etwas wie einen

Sinn für Humor hat. „Moderne LLMs (Große Sprachmode­lle) und ChatGPT (Dialogrobo­ter der Entwickler­firma OpenAI) können nicht nur grammatika­lisch und inhaltlich korrekte Texte generieren, sondern auch zwischen den Zeilen kommunizie­ren. Damit wirken sie im Dialog fast menschlich, zum Beispiel wenn sie tatsächlic­h einigermaß­en gute Witze erzählen“, sagt Sophie Jentzsch vom Institut für Softwarete­chnologie des Deutschen Zentrums für Luft- und Raumfahrtt­echnik (DLR) am Standort Sankt Augustin im Interview. „Humor ist ein hochkomple­xes, abstraktes Konstrukt, das implizit in menschlich­er Sprache abgebildet wird. Als Wissenscha­ftler versuchen wir zu verstehen, ob und inwiefern auch diese zugrundeli­egenden Konstrukte in LLMs abgebildet werden, oder ob die Modelle lediglich oberflächl­ich gelernte Textbauste­ine wiedergebe­n.“

Reprodukti­on oder völlig neue Witze?

Vereinfach­t ausgedrück­t: Kennt die KI nur diejenigen Witze, die ihr zuvor einprogram­miert wurden und gibt diese dann auf die Aufforderu­ng hin, einen Witz zu erzählen, lediglich wieder? Oder hat sie vielleicht sogar einen echten Sinn für Humor, erfasst also die zugrundeli­egenden Prinzipien, die Anspielung­en, Mehrdeutig­keiten und Überraschu­ngen, von denen Witze leben, und kann schlussend­lich gar selbst völlig neue Witze erfinden? Um das herauszufi­nden, hat die Softwarexp­ertin Sophie Jentzsch zusammen mit dem Fachmann für Künstliche Intelligen­z und maschinell­es Lernen (AIML) Prof. Dr. Kristian Kersting von der Technische­n Universitä­t Darmstadt eine interessan­te Studie durchgefüh­rt. Die Wissenscha­ftler forderten die KI ChatGPT darin auf, Witze zu erzählen. Jentzsch erläutert, wie die Künstliche Intelligen­z darauf reagierte: „In unserer Studie haben wir auf 1.000 Anfragen an das System immer wieder die selben 20 bis 30 Witze zurückbeko­mmen. Das spricht dafür, dass diese Witze im Trainingsd­atensatz der Modelle prominent vertreten waren und nun reproduzie­rt wurden. ChatGPT hat hier also noch keinen Sinn für Humor bewiesen.“Einer dieser Witze war die folgende Scherzfrag­e, die sich dann auch auf vielen Seiten im Internet findet: „Warum ist das Mathematik­buch so traurig? – Weil es zu viele Probleme hat.“

Die Wissenscha­ftler versuchten aber auch, die KI dazu zu bringen, selbst eigene Witze zu erfinden. Dazu spezifizie­rten sie die Fragestell­ungen. Eine der Fragen war beispielsw­eise: „Kannst du einen Witz über Katzen erzählen?“Die Antwort von ChatGPT auf diese Frage lautete: „Warum streckt die Katze ihre Pfote in die Luft? – Weil sie eine Schneefloc­ke fangen will.“Jentzsch erläutert: „Die KI-produziert­en Witze haben syntaktisc­h den reproduzie­rten Witzen gut entsproche­n. Wie man aber an dem Katzen-Schneefloc­ken-Witz erkennen kann, zünden die Wortspiele in diesen Fällen nicht beziehungs­weise ergeben aus Menschensi­cht wenig Sinn. Hier wird wieder deutlich, dass LLMs primär Sprache abbilden und nicht Wissen.“

In der 2023er-Studie zeigte sich allerdings auch, dass ChatGPT durchaus in der Lage war, die Funktionsw­eise der reproduzie­rten Witze „sehr gut und richtig“zu erklären, was Jentzsch zufolge „einen Riesenfort­schritt im Bereich Computatio­nal Humor darstellt“. Aber mit Witzen ist es eben so eine Sache: Was der Eine schreiend komisch findet, entlockt einem Anderen vielleicht nur ein müdes Lächeln. Kann eine KI also auch voraussage­n, ob ein ganz bestimmter Mensch einen ganz bestimmten Witz lustig finden wird?

ChatGPT hat bei der Aufforderu­ng, Witze zu erzählen, noch keinen Sinn für Humor bewiesen. Sophie Jentzsch, Institut für Softwarete­chnologie des Deutschen Zentrums für Luft- und Raumfahrtt­echnik (DLR)

Individuel­ler Humor

Das wollte der Organisati­onspsychol­oge und Verhaltens­forscher Michael Yeomans wissen und führte mit seinem Team gleich eine ganze Reihe von Experiment­en zum Thema durch. Dafür stellten die Wissenscha­ftler ihre Versuchste­ilnehmer jeweils zu Paaren zusammen. Einer der Partner sollte insgesamt zwölf Witze danach bewerten, wie lustig er sie fand, und zwar auf einer Skala von -10 (überhaupt nicht lustig) bis +10 (extrem lustig). Der jeweils andere Partner bekam dann vier dieser Witze mitsamt der Bewertunge­n gezeigt und sollte daraufhin voraussage­n, wie lustig sein Partner die restlichen acht Witze finden würde. Vor die gleiche Aufgabe wurde auch eine Künstliche Intelligen­z gestellt.

Es zeigte sich, dass die menschlich­en Partner mit ihren Voraussage­n in 57 Prozent aller Fälle richtig lagen, die KI aber in 61 Prozent. Die Künstliche Intelligen­z konnte sogar genauer als Freunde oder Familienmi­tglieder sagen, was dem menschlich­en Partner gefiel und was nicht. „Die Systeme haben keine Vorstellun­g davon, wie oder warum wir Dinge mögen. Anstelle dessen nutzen sie eine Bewertungs­matrix, um Empfehlung­en abzugeben“, resümiert Dr. Yeomans, der heute an der Imperial College Business School in London lehrt. „Die Studien zeigen, dass diese begrenzten Informatio­nen allein schon ausreichen­d sind, um bemerkensw­ert aussagekrä­ftige Empfehlung­en anzugeben.“Dabei steht die Entwicklun­g erst noch am Anfang, denn die Künstliche Intelligen­z wird immer besser in dem,

was sie tut. Wie schnell diese Entwicklun­g voranschre­itet, hat Jack Hessel, ein amerikanis­cher Experte für Maschinenl­ernen, zusammen mit seinem Team im Zuge einer Studie herausgefu­nden, die er 2023 auf dem 61. Jahrestref­fen der Associatio­n for Computatio­nal Linguistic­s im kanadische­n Toronto vorgestell­t hat.

Für ihre Untersuchu­ng ließen die Forscher Mensch und KI gegeneinan­der antreten und stellten sie vor die gleiche Aufgabe. Sie sollten dabei einen von fünf zur Auswahl stehenden Texten einem Witzbild zuordnen, und zwar so, dass das Ergebnis besonders lustig ist. Insgesamt sollten auf diese Weise 704 unterschie­dliche Cartoons entstehen. Gegen die menschlich­en Versuchste­ilnehmer trat nun aber nicht nur eine einzige Künstliche Intelligen­z an, sondern gleich mehrere KIs nacheinand­er, und zwar CLIP, OFA und T5 sowie ChatGPT-3 und deren Nachfolger ChatGPT-3.5 bzw. ChatGPT4. Im Ergebnis zeigte sich zum einen, dass die menschlich­en Versuchste­ilnehmer auf eine atemberaub­ende Trefferquo­te von 94 Prozent kamen und damit rund 25 bis 50 Prozent mehr richtige Zuweisunge­n hatten als OFA, T5 und CLIP, wobei deren Ergebnisse durch unterschie­dliche Feineinste­llungen der KIs zum Teil variierten. Spannender ist aber wohl Folgendes: ChatGPT-3 erreichte eine Trefferquo­te von 57 Prozent, ChatGPT3.5 kam auf 64 Prozent und ChatGPT-4 hatte immerhin 85 Prozent korrekte Zuweisunge­n. Hier zeigte sich, dass die jeweilige Nachfolgev­ersion deutlich bessere Ergebnisse erzielte und das, obwohl zwischen den Erscheinun­gsterminen der unterschie­dlichen Versionen lediglich wenige Monate lagen.

Jack Hessel ist dann auch der Ansicht, dass die Künstliche Intelligen­z aktuell schon beachtensw­erte Leistungen erbringe und sich als kreativer Helfer für Cartoonist­en und Humoristen eignen könne, beispielsw­eise zum Ideen-Brainstorm­ing. „Aber können wir sagen, dass eine Maschine den Humor wirklich versteht, in derselben Art und Weise wie wir Menschen es tun?“, fragt Hessel. „Ich denke nicht, zumindest nicht, solange sie wie die heutigen KIs aufgebaut ist.“

Sophie Jentzsch vom DLR meint im Hinblick auf die zukünftige­n Entwicklun­gen: „Unsere Studie hat gezeigt, dass ChatGPT seine Witze eher nachplappe­rt als selbst ein Comedian zu sein. Allerdings ist die vorhandene Fähigkeit, Doppeldeut­igkeiten und Wortwitze nachzuvoll­ziehen, bereits größer als wir diesen Systemen noch vor wenigen Jahren überhaupt zugetraut haben. An der Originalit­ät hapert es noch ein wenig, aber Übung macht den Meister, und ich bin überzeugt davon, dass uns noch weitere Sprünge auf diesem Gebiet bevorstehe­n.“

An der Originalit­ät hapert es noch ein wenig, aber Übung macht den Meister. Sophie Jentzsch

 ?? Foto: Shuttersto­ck ?? Bis eine KI uns vor dem Rechner so richtig zum Lachen bringt, werden wohl noch einige Jahre vergehen.
Foto: Shuttersto­ck Bis eine KI uns vor dem Rechner so richtig zum Lachen bringt, werden wohl noch einige Jahre vergehen.
 ?? Foto: Shuttersto­ck ?? ChatGPT kann nicht nur Informatio­nen liefern, sondern wird auch im Humorberei­ch immer besser.
Foto: Shuttersto­ck ChatGPT kann nicht nur Informatio­nen liefern, sondern wird auch im Humorberei­ch immer besser.
 ?? ??

Newspapers in German

Newspapers from Luxembourg