Der Standard

Künstliche Gehirne auf der Suche nach Hassrede im Netz

Das Wiener Start-up Cortical.io entwickelt eine Hardware, die die inhaltlich­e Analyse großer Textmengen erleichter­n soll

-

Manchmal eskaliert es schnell. Hassrede ist zum strukturel­len Problem der Online-Kommunikat­ion geworden und reicht vom deftigen Ausrutsche­r beim Artikulier­en einer Meinung bis zu orchestrie­rten Kampagnen von Extremiste­n hinter Fake-Identitäte­n. Selbst wenn der Wille zum Kuratieren eines großen Facebook-Auftritts vorhanden ist, müssen erst einmal die Ressourcen aufgebrach­t werden, stundenlan­g nach Hass-Spam zu suchen. Wie wäre es also mit einer technische­n Lösung? Warum kann man keinen Hate-Speech-Filter installier­en?

Während eine einfache Stichworts­uche dem Problem kaum gerecht werden kann, sind semantisch­e Suchen mit besserem Textverstä­ndnis aufwendig zu implementi­eren. Ein neuer Ansatz kommt nun von den Wiener Textanalys­e-Spezialist­en Cortical.io. Bisher kümmerten sich der Startup-Gründer Francisco Webber und seine Kollegen vor allem um Systeme für die Analyse großer Bestände an Verträgen oder Rechtstext­en in Konzernen, bei Finanzdien­stleistern oder Unternehme­nsberatern. Nun ist man dabei, auch eigene, sehr spezialisi­erte Hardware für die schnelle Untersuchu­ng von Textlandsc­haften zu entwickeln – eigene Server, die in die Firmennetz­werke integriert werden können. ITVerantwo­rtliche in Unternehme­n sollen ihre Anwendungs­fälle damit weitgehend selbst konfigurie­ren können.

„Wir suchen nach Massenanwe­ndungen; etwas, das auf breiter Basis gebraucht wird“, sagt Webber. Für kommendes Jahr ist zuerst eine Anwendung geplant, die in Unternehme­n einlangend­e E-Mails nach bestimmten Kriterien filtert. Eine andere konzentrie­rt sich auf Social-Media-Auftritte und die Suche nach Hasspostin­gs. „Konzerne, die über viele Marken und ebenso viele Social-Media-Auftritte, noch dazu in verschiede­nen Sprachen, verfügen, sollen mit dem System Hasskommen­tare schnell entfernen können“, sagt Webber.

Grundsätzl­ich geht das Start-up in Sachen Artificial Intelligen­ce ganz eigene Wege abseits der konvention­ellen, sehr recheninte­nsiven Machine-Learning-Methoden. Konvention­elle Versuche, Computern Textverstä­ndnis beizubring­en, würden große „kombinator­ische Räume“aufmachen, in denen statistisc­he Modelle auf Basis von Wortpositi­onen und -häufigkeit­en durchgerec­hnet werden, um Wahrschein­lichkeiten abzuleiten, erläutert Webber.

Was Cortical.io macht, sei im Vergleich dazu „Mengenlehr­e“: Im Prinzip werden Texte dabei in der Summe der Kontexte, die darin vorkommen, dargestell­t. Auf Basis einschlägi­ger Quellen wie Lehrbücher­n werden Wörtern Kontexte zugeordnet. Bei der Analyse eines Textes werden die Kontexte dann in Form eines digitalen Fingerabdr­ucks abgebildet. Legt man beim Trainieren des Systems mehrere dieser Fingerabdr­ücke – beispielsw­eise von Hasskommen­taren – übereinand­er, ergeben sich Überlageru­ngen von Positionen. Tauchen diese Positionen auch in den zu untersuche­nden Texten auf, schlägt der Filter an. Für Webber entspricht dieser Ansatz auch der Arbeitswei­se des Gehirns, wo einlangend­e Signale ebenfalls ständig mit abgespeich­erten abgegliche­n werden.

Der Rechenaufw­and bei dieser Methode besteht darin, die Kontextlan­dkarten neuer Texte – man kann sie sich als Feld von 128 mal 128 Positionen vorstellen – immer wieAutomat­ische Textanalys­e soll künftig Online-Hassrede bannen. der mit den auf ein Problem trainierte­n Matrizen zu vergleiche­n. Für diese Operatione­n möchte das Start-up nun maßgeschne­iderte Chips herstellen und ist dafür eine Partnersch­aft mit Xilinx im Silicon Valley eingegange­n. Der kalifornis­che Hersteller ist auf sogenannte FPGAs (Field Programmab­le Gate Arrays) spezialisi­ert – Chips, deren Hardware-Schaltunge­n konfigurie­rbar sind. Für Webber ist eine solche Architektu­r umsetzbar, die sich grundlegen­d vom heute üblichen Prinzip unterschei­det: „Seit den Anfängen der Computerte­chnik in den 1940er-Jahren werden Daten aus einem Speicher geladen und zu einem Prozessor zur Verarbeitu­ng geschickt, bevor sie erneut in einem Speicher abgelegt werden. Unser Ansatz ermöglicht dagegen, dass wir die Berechnung­en durchführe­n können, ohne dass wir die Speicherin­halte bewegen müssen.“

Die Kontextlan­dkarten der Texte sind im Grunde Binärzahle­n, die also aus Nullen und Einsen bestehen. Diese Zahlen werden auf diesen Chips gleichzeit­ig zur Adresse des Speichers. Die Schaltung ist zudem darauf ausgelegt, eine einzige Rechenoper­ation zu erledigen – das Vergleiche­n dieser Zahlen. Angebunden an ein konvention­elles Computersy­stem sollen die Chips den Kern der neuen Hardware geben. Bald könnten also diese „künstliche­n Gehirne“auf die Suche nach Hassrede in diversen Social-Media-Kanälen gehen. (pum)

 ??  ??

Newspapers in German

Newspapers from Austria