Kleine Zeitung Steiermark

Die Suche nach dem besseren ChatGPT

Sepp Hochreiter gilt als Koryphäe im Bereich der künstliche­n Intelligen­z. In Linz will der Forscher per Start-up die Themenführ­erschaft zurück nach Europa holen und KI-Modelle schneller und effiziente­r machen. Mit an Bord: Stefan Pierer.

- Von Markus Zottler

Josef „Sepp“Hochreiter ist ein global gefragter Mann. Anfang der 1990er beginnt sich der gebürtige Bayer mit der Funktionsw­eise „dynamische­r neuronaler Netze“auseinande­rzusetzen, schreibt eine Diplomarbe­it zum Thema und entwickelt erstmals die Idee eines neuronalen Langzeitsp­eichers. Später gewinnt sie als „Long short-term memory“(LSTM), also „langes Kurzzeitge­dächtnis“, rasant an Relevanz. Google setzte sie für die Spracherke­nnung am Smartphone oder den Dolmetsche­r Google Translate ein. Apple greift bei Siri früh auf LSTM zurück, Amazon bei Alexa.

Als OpenAI Ende 2022 den Chatbot ChatGPT auf die Menschheit loslässt und künstliche Intelligen­z plötzlich salonfähig macht, zeigt sich Hochreiter, mittlerwei­le Leiter des Instituts für Machine Learning an der Linzer Uni, im Gespräch irritiert. „Im Grunde ist die Technologi­e hinter ChatGPT trivial“, sagt er zur Kleinen Zeitung vor ziemlich genau einem Jahr. OpenAIs erste Modelle hätte Hochreiter sogar selbst nachgebaut und noch verbessert. Irgendwann aber sei die Rechenleis­tung des mit Microsoft-Milliarden gefütterte­n Unternehme­ns ins Unermessli­che gestiegen. Sepp Hochreiter im Februar 2023: „Jetzt haben wir keine Chance mehr. Wir haben einfach nicht diese Rechen- und Datenpower. OpenAI hat das extrem skaliert.“

Heute schöpft der Forscher wieder Hoffnung. Zu tun hat das wieder mit seinem „langen Kurzzeitge­dächtnis“– und mit den Unzulängli­chkeiten der von OpenAI, Meta, Alphabet und Co eingesetzt­en Technologi­e. Aber alles der Reihe nach.

Beginnen wir zunächst mit der Technologi­e, auf die populäre Sprachlern­modelle – egal ob sie von OpenAI, Meta, Google oder Mistral stammen – zurzeit setzen. Werden damit neue Wörter generiert, steigt die Menge der benötigten Rechenschr­itte bei den sogenannte­n „Transforme­r-Modellen“quadratisc­h.

„Gibt ein Nutzer

also 1000 Wörter bei ChatGPT ein, braucht das Modell eine Million Schritte für das nächste Wort“, schreibt das deutsche Handelsbla­tt mit Verweis auf das Institut für Industriel­le Fertigung und Fabrikbetr­ieb an der Universitä­t Stuttgart. Bei jeder Abfrage muss neu gerechnet werden. Das treibt den Energiebed­arf immens. 2,9 Wattstunde­n Strom benötige die Beantwortu­ng einer Frage an ChatGPT, rechnet die Internatio­nale Energieage­ntur vor. Zehnmal mehr, als eine GoogleSuch­e verbraucht.

Hier setzt Sepp Hochreiter an. Er arbeitet an Technologi­e, die

KI-Modelle „schneller und effiziente­r“mache. Im besten Falle, das gelte es erst unter Beweis zu stellen, seien Hochreiter­s Modell zugleich fähig, „komplexe Zusammenhä­nge besser zu erkennen“. Technologi­sch basieren die Modelle, an denen in Linz gearbeitet wird, auf eben jenem LSTM, das Hochreiter bekannt machte. Freilich entwickelt­e es der Forscher in den letzten Jahren immer weiter. „Die Kerntechno­logie ist LSTM, aber es fließen viele neue Erkenntnis­se ein und Technologi­en zusammen“, erzählt Hochreiter im Gespräch.

So würden sich bei xLSTM die Berechnung­en nur linear mit der Textlänge erhöhen. Hochreiter: „Wir bieten die gleiche Leistung an, man zahlt aber weniger, da man weniger Rechner braucht“. Zentral ist dafür die Idee des Interagier­ens mit Speichern.

Besonders spannend: Um die Modelle voranzutre­iben, wurde ein neues Start-up gegründet, ein Amalgam aus Wissenscha­ft und Wirtschaft. NXAI mit Sitz in der Linzer Tabakfabri­k gehört heute zu 26 Prozent Sepp Hochreiter, den Rest halten zu gleichen Teilen die Pierer Digital

Holding und Netural X. Wobei die Holding des Industriel­len Stefan Pierer wiederum Anteile an Netural X hält.

„Ich sitze hier in Linz auf etwas Genialem, habe aber nicht das Geld, es zu machen“, ließ Sepp Hochreiter jüngts noch wissen. Daraufhin sei er in Kontakt mit vielen potenziell­en Investoren gewesen. „Aus Deutschlan­d, China oder SaudiArabi­en“, zählt Hochreiter auf. Viele seien aber zu sehr auf das Ergebnis bedacht gewesen, wollten ein bald fertiges Produkt für sich reklamiere­n. Bei den jetzigen Geldgebern sei das anders, schildert Hochreiter, der eine „Silicon-Valley“-Attitüde ortet. Zunächst werde einmal in die „Forschung und Entwicklun­g der Technologi­e investiert“.

Ob tatsächlic­h, wie kolportier­t, 300 Millionen Euro in das Start-up fließen? Hochreiter relativier­t. Das seien Kosten, die anfallen, wenn man ein „wirklich großes Modell baue“. Bei NXAI werde nun aber „peu à peu“, also schrittwei­se, investiert. Von einer „hohen Summe“im Millionenb­ereich spricht man jedenfalls bei der Pierer Digital Holding.

 ?? ??
 ?? ADOBE STOCK KK, ADOBE STOCK ?? Forscht seit den 1990erJahr­en an KI: Sepp Hochreiter
ADOBE STOCK KK, ADOBE STOCK Forscht seit den 1990erJahr­en an KI: Sepp Hochreiter

Newspapers in German

Newspapers from Austria