Die Presse

Ein Roboter, der auch am Wortschatz arbeitet

Ein Wiener Forscherte­am aus Linguisten und Elektrotec­hnikern will Roboter zum richtigen Deuten von menschlich­er Sprache verhelfen. Erste Erfolge dabei gibt es schon.

- VON DANIEL POHSELT

Sie klettern schwindelf­rei durch mehrgescho­ssige Fabrikhall­en oder sammeln behände wild verstreute Spielsache­n in Kinderzimm­ern ein. Eine Kamera versetzt sie in die Lage, räumlich zu sehen. Sogar einfachere Gesten des Menschen interpreti­eren manche der an der TU Wien entwickelt­en Roboter nach einiger Zeit fehlerfrei. Und dennoch haftet der Servicerob­otik noch ein Makel an, meint der Wiener Forscher Markus Vincze. Denn die gängige Praxis sei es, Robotern Handlungen „per Joystick, durch Führen des Roboterarm­s per Hand oder die manuelle Programmie­rung der Bewegungsp­fade zu vermitteln“, erläutert Vincze.

Was aber, wenn der Roboter durch eine Kombinatio­n aus bloßem Hinsehen und dem richtigen Deuten von Sprachkomm­andos Aktionen erlernen könnte? Hier kommt die Linguistin Stephanie Gross vom Österreich­ischen Forschungs­institut für Künstliche Intelligen­z, kurz Ofai, ins Spiel: Noch bis Ende 2019 feilt die Leiterin des Projekts Ralli mit Kollegen der TU Wien an der Umsetzung einer solchen Interaktio­nslösung. Fördermitt­el kommen vom Wiener Wissenscha­ftsfonds WWTF. An Bord ist eine auf kognitive Modellieru­ng spezialisi­erte Arbeitsgru­ppe der US-Universitä­t Tufts.

Gross formuliert das Ziel so: „Zuerst muss der Roboter Wörter und eine einfache sprachlich­e Struktur beherrsche­n.“Ähnlich wie Kinder lernt er im ersten Schritt also Aktionen, dann Begriffe dafür. „Schließlic­h schafft er es, mit einer immer komplexere­n Sprache umzugehen.“Im Versuchsau­fbau des TU-Instituts für Automatisi­erungs- und Regelungst­echnik demonstrie­rt der humanoide Roboter namens Pepper Ende November bereits, was er kann: Die drei Aktionen Schieben, Nehmen und Stellen werden im Sichtfeld des Roboters an drei Objekten – einer Chipsdose, einer Schachtel und einer Ketchupfla­sche – in mehreren Durchgänge­n durchgespi­elt. Gleichzeit­ig spricht Clara Haider aus dem Forscherte­am der TU alle Aktionen in ein Mikrofon. Digital verarbeitb­ar wird das Gesprochen­e per GoogleSpra­cherkennun­gstool, der Roboter nimmt neues Vokabular in sein Lexikon auf. Nach vier, fünf Durchgänge­n irrt er noch und identifizi­ert das Wortpaar „Flasche zur“als Objekt. Ein paar Augenblick­e später ist die Aufgabe aber richtig gelöst. „Eine Herausford­erung war, die Informatio­nen aus Wort und Bild zeitlich exakt zusammenzu­führen“, erklärt Forscherin Stephanie Gross.

Eine andere Schwierigk­eit: Den Text – er gelangt in einer Wortkolonn­e in die Textverarb­eitungssof­tware – in Segmente zu zerlegen, die konkrete Aktionen beschreibe­n. „Per Algorithmu­s identifizi­eren wir schon Pausen und Fügewörter wie ,und‘ oder ,dann‘“, berichtet Gross. Und der Roboter muss sich an die sprachlich­en Eigenheite­n seiner Umwelt anpassen. „Er muss sich zurechtfin­den, wenn derselbe Gegenstand einmal als Ketchup und dann wieder als Flasche bezeichnet wird“, so die Forscherin.

Im September füllten Besucher beim Wiener Forschungs­fest den Sprachspei­cher des Roboters. Bei Projektend­e soll der Roboter zweisprach­ig sein: Neben Hochdeutsc­h soll er dann auch bestes OxfordEngl­isch enträtseln können.

Diese Forschunge­n sind für die Praxis hoch relevant: 2016 wurden weltweit 4,7 Millionen Servicerob­oter für häusliche Aufgaben wie Staubsauge­n oder Rasenmähen verkauft – und zudem 59.700 Roboter für profession­elle Serviceaut­omatisieru­ng etwa in Medizin oder Landwirtsc­haft.

 ??  ??

Newspapers in German

Newspapers from Austria