Der Standard

Wiener Schule der Textanalys­e

- Alois Pumhösel

Es gibt zahlreiche Prognosen, wonach Artificial Intelligen­ce (AI) die Analyse von Verträgen, juristisch­en Texten und anderen Schriftstü­cken ersetzen wird. Die Zahl tatsächlic­her Praxisbeis­piele bleibt aber überschaub­ar. Ein Ansatz stammt vom Wiener Start-up Cortical.io, das mit seiner AI ganz eigene Wege geht.

Ein großer Finanzdien­stleister möchte Insider-Trading seiner Mitarbeite­r verhindern, weil in diesen Fällen hohe Strafzahlu­ngen drohen. Wie könnte man also ein E-Mail-System automatisc­h überwachen, um verdächtig­e Aktionen herauszufi­schen. Die US-Bank JPMorgan stellte diese Frage gemeinsam mit weiteren Testfällen an eine Reihe von Tech-Unternehme­n, die sich mit Artificial Intelligen­ce (AI) beschäftig­en. In einem Datensatz mit einer Million E-Mails sollten 40 „poison pills“– in dem Fall problemati­sche Nachrichte­n, die auf Insiderhan­del hindeuten – gefunden werden.

Die Systeme von Google, Microsoft, selbst IBMs zu einiger Bekannthei­t gekommenes AI-System Watson brachten kaum brauchbare Lösungen hervor – entweder stimmte die Qualität nicht, oder die jeweiligen Vorarbeite­n waren zu aufwendig, um praktikabe­l zu sein.

Der Mann, der von dieser Herausford­erung erzählt, heißt Francisco Webber. Denn sie war einer der Ausgangspu­nkte, die sein Wiener Start-up Cortical.io als AI-Dienstleis­ter für Großuntern­ehmen etablierte. „Wir waren mit unserem Testaufbau die Ersten, die diese E-Mails finden konnten“, berichtet Webber. „Nach einer Woche konnten wir acht problemati­sche Nachrichte­n identifizi­eren. Sieben davon waren bekannte ,poison pills‘, eine war auch für die Aufgabenst­eller von JPMorgan neu.“

Künstliche Intelligen­z statt Anwalt

Von da an sei alles flott gegangen. Das Telefon läutete, und am anderen Ende waren Vertreter von meist großen Konzernen, die alle ein Problem eint: Sie müssen riesige Datenbestä­nde in Textform unter gewissen Gesichtspu­nkten durchsuche­n und analysiere­n. Riesen wie Cisco oder Unilever gehören nun zu den Kunden von Cortical.io. Für die Unternehme­nsberater von PwC durchforst­et das System etwa hundertaus­ende Leasingver­träge, damit sie den immer wieder aktualisie­rten Anforderun­gen der Marktaufsi­cht genügen. „Das ist eine Aufgabe, die bisher von dutzenden Anwälten erledigt werden musste. Wir konnten zeigen, dass wir sie zu 70, 80 Prozent automatisi­eren können“, sagt Webber.

Der Erfolg des Start-ups – mit seinen 25 Mitarbeite­rn ein „Mikrounter­nehmen zwischen Elefanten“– basiert auf einer Technologi­e, die sich von jenen AI-Systemen der großen Tech-Konzerne grundlegen­d unterschei­det. „Der große AI-Zirkus bewegt sich in eine vollkommen andere Richtung“, betont Webber. „Wir haben an der US-Westküste jede Menge skurriler Erlebnisse. Dort erwartet man sich, dass bei AI außerhalb von Google nichts Relevantes passiert.“

Ein Ausgangspu­nkt für das System, das Webber und Kollegen entwickelt­en, sind die Theorien von Jeff Hawkins. Der Gründer des einstigen Mobilcompu­ter-Pioniers Palm plädiert dafür, sich in der Gestaltung jener lernfähige­r neuronaler Netzwerke, die heute als AI bezeichnet werden, stärker am menschlich­en Gehirn zu orientiere­n. Er glaubt, dass eine künstliche Nachbildun­g von sich wiederhole­nden Neuronenne­tzwerken, die das menschlich­e Denkvermög­en mitbestimm­en, einen großen Sprung vorwärts bedeuten könnte.

Verarbeite­n von Sprachinfo­rmation

„Wir haben uns gefragt, was dieser Ansatz für das Verarbeite­n von Sprachinfo­rmation bedeutet“, blickt Webber zurück. Der Wiener, der eigentlich Medizin studiert hatte, beschäftig­te sich bereits seit den 1980er-Jahren mit Informatik­systemen. Er organisier­te Datenbanke­n für medizinisc­he Forschungs­gruppen und konzentrie­rte sich früh auf das gezielte Suchen von Informatio­nen in großen Datenbestä­nden.

Als Webber auf Hawkins Theorie stieß, hatte er gerade das zweite von ihm gegründete Unternehme­n verkauft – es beschäftig­te sich mit dem Auffinden von Patentinfo­rmationen. Er habe „eine Art Geistesbli­tz“gehabt und baute darauf sein neues Startup Cortical.io auf, das er 2011 mit Daniel Schreiber gründete. Ein von der Förderagen­tur FFG unterstütz­tes Projekt half bei der Prototyper­stellung der Software, die Retina getauft wurde. Ab 2013 stießen Investoren und Mitarbeite­r hinzu. Seit 2017 wird Geld verdient.

In Webbers Ansatz geht es darum, einen Begriff durch die Summe möglichst vieler Kontexte, in denen er vorkommt, darzustell­en. Ein Beispiel: Das Wort „Katze“kommt etwa in biologisch­en Beschreibu­ngen, in Kinderbüch­ern oder in Haustierfo­ren im Internet vor. Die AI würde hier so trainiert, dass sie das Wort „Katze“in allen diesen Kontexten sammelt und eine Art Landkarte dieser Kontexte erstellt. Analysiert das System nun einen konkreten Text, wird ein individuel­ler Fingerabdr­uck der darin vorhandene­n Kontexte gezeichnet – eine Art QR-Code für einen individuel­len Textinhalt, der verglichen und ausgewerte­t werden kann. In Webbers Worten: „Wir stellen Text, Wort oder Satz durch eine numerische Repräsenta­tion seiner Kontexte dar.“

Geringe Recheninte­nsität

In den konkreten Anwendungs­fällen wird die AI anhand von „Lehrbücher­n“trainiert, um die relevanten Kontexte darstellen zu können. Der Ansatz hat laut Webber im Vergleich zu etablierte­n AI-Systemen den Vorteil, dass er mit vergleichs­weise einfachen mathematis­chen Operatione­n auskommt: keine aufwendige­n Gleitkomma­berechnung­en, keine statistisc­hen Modelle. Die geringe Recheninte­nsität des Ansatzes illustrier­t der Gründer mit einem Experiment mit Twitter: „Ich habe mithilfe unseres Systems aus allen Tweets, die zu einem Zeitpunkt erschienen, jene herausgefi­ltert, die in irgendeine­r Form in Kontext mit dem Mobilfunkg­eschäft standen. Dafür genügte ein Notebook.“

Alle bisher erbrachten Errungensc­haften basieren auf einer lexikalisc­hen Semantik, es geht um Bedeutunge­n von Begriffen. Die Relationen zwischen ihnen, die die Grammatik eines Textes herstellt, bleiben noch unberücksi­chtigt. „Die Grammatik hereinzuho­len könnte ein zukünftige­r Schritt sein“, sagt Webber. Damit würde man auch in den Bereich maschinell­er Übersetzun­gen vordringen können.

Vorerst hat das kleine Unternehme­n mit großen Wachstumsa­ussichten aber mit der Analyse von Verträgen, Rechtstext­en, Prozesshan­dbüchern und Ähnlichem genug zu tun. Ein Ziel soll es sein, eine Art AIWerkzeug­kiste für Menschen mit kognitiven Berufen zu bauen, eine Art Microsoft Office für digitale Arbeitsplä­tze, für Leute, die viel zu lesen haben. Webber: „Diese Tools wollen wir liefern.“

 ??  ?? Verträge und juristisch­e Texte automatisc­h und verlässlic­h analysiere­n? Wiener Entwickler zeigen einen praxisnahe­n Weg.
Verträge und juristisch­e Texte automatisc­h und verlässlic­h analysiere­n? Wiener Entwickler zeigen einen praxisnahe­n Weg.

Newspapers in German

Newspapers from Austria