Vokabeln auf der Waage der Wissenschaft
An der Saar-Universität untersuchen 30 Wissenschaftler in einem Sonderforschungsbereich die Informationsdichte von Texten.
und zu Verfahren der Künstlichen Intelligenz gebe es hier noch viel zu erforschen, erklärt die Anglistin. So sieht das auch die Deutsche Forschungsgemeinschaft. Sie hat den 2014 eingerichteten Saarbrücker SFB gerade um vier Jahre verlängert (wir haben berichtet). Die Saar-Universität erhält dafür rund elf Millionen Euro.
Im Saarbrücker SFB wollen 30 Wissenschaftler unter anderem untersuchen, wie Kinder lernen und wie sie mit Begriffen umgehen, die sie nie zuvor gehört haben. Das könnte zu neuen Verfahren führen, mit denen der Stand der sprachlichen Entwicklung beurteilt werden kann. Auch das Thema Mehrsprachigkeit spielt eine Rolle und die Frage, wie sich Menschen in Gesprächen an ihre Partner anpassen. „Das bekommen Menschen völlig unbewusst hin“, erklärt Elke Teich. „Wir versuchen dabei im Gespräch unwillkürlich, die Informationsdichte konstant auf einem Pegel zu halten, um unsere Partner weder zu langweilen noch zu überfordern.“
Wie schaffen Menschen das? Sie nutzen Kontextwissen, wie die Forscher sagen, achten also nicht nur darauf, was sie sagen, sondern auch darauf, wen sie unter welchen Umständen ansprechen. So kann die hingeschlenzte Bitte „Gib mir das bitte herüber“denselben Informationsgehalt haben wie der Satz „Könntest Du mir bitte das Notizheft aus der rechten, oberen Schublade des Schreibtisches geben?“Ein menschlicher Gesprächspartner kann die Frage „Schon gefrühstückt?“problemlos verstehen, obwohl da die Zeitangabe fehlt. Ein Computerprogramm wird dagegen erst die Langfassung „Haben Sie heute schon gefrühstückt?“korrekt interpretieren.
Ein anderes Projekt im SFB konzentriert sich auf die Wissenschaftssprache vergangener Jahrhunderte. Die Forscher werten dazu eine Sammlung von Texten der Royal Society of London der Jahre 1650 bis 1900 aus, berichtet Elke Teich. In dieser Zeit habe es gewaltige Veränderungen gegeben, erklärt die Anglistin. Bis zur Mitte des 18. Jahrhunderts seien wissenschaftliche Texte wie gesprochen notiert worden. Erst später habe sich eine Schriftsprache entwickelt, die es ermöglichte, Informationen sprachlich kompakter zu formulieren. Ihre Informationsdichte ist gewachsen.
Ein Sonderforschungsbereich betreibt Grundlagenforschung. Doch bei wissenschaftlichen Projekten, an denen die Informatik beteiligt ist, ist es von den Grundlagen bis zur Anwendung meist nicht weit. Die Forschung zur Informationsdichte könnte helfen, die maschinelle Sprachdatenverarbeitung zu verbessern. Wovon wiederum Programme zur Sprachsteuerung, zur Übersetzung und zur Steuerung von Suchmaschinen profitieren könnten. Auswirkungen auf den Computeralltag könnte schließlich ein Projekt haben, in dem die Wissenschaftler in Experimenten über Hirnstrommessungen bei Versuchspersonen die Informationsdichte von Youtube-Videos ermitteln wollen. Die Kurzfilme gibt es bekanntlich zu fast allen Themen, vom Abwasch bis zur korrekten Benutzung von Zahnseide.
Am SFB nimmt eine Arbeitsgruppe Anleitungen zum Computerspiel Minecraft unter die Lupe. In diesem Aufbauspiel geht es ums Überleben in einer digitalen Klötzchenwelt, in der sich jeder Spieler zunächst einmal eine virtuelle Existenz aufbauen muss. Es gibt tausende Youtube-Videos für jeden Schwierigkeitsgrad. Anfänger lernen, wie sie die ersten Schritte im digitalen Dschungelcamp überleben, Profis erfahren, wie sie in aussichtsloser Lage digitalen Monstern entrinnen können. Über die Analyse derartiger Videos wollen die SFB-Wissenschaftler Verfahren entwickeln, die es Computersystemen ermöglichen, vollautomatisch Bedienungsanleitungen zu beliebigen Themen zu erzeugen. Und die könnten dann auch – und damit wären wir zurück beim Eingangsbeispiel – das Vorwissen der Nutzer zum gewählten Thema berücksichtigen. Wenn’s klappt, dürfte die Fehlermeldung „Falsche oder unvollständige Eingabe“künftig seltener zu sehen sein.