Die Presse

Ein Algorithmu­s, der Unhöflichk­eit erkennt

Medien. Webbasiert­e Anwendunge­n, die große Datensätze analysiere­n können, sollen Journalist­en künftig helfen, investigat­iv die Nadel im Heuhaufen zu entdecken – oder ungeahnte Zusammenhä­nge zu erkennen.

- VON PATRICIA KÄFER

Manche Abgeordnet­e schimpfen im Parlament wie Rohrspatze­n. Die Stenografe­n schreiben dennoch all das mit. Zur letzten Nationalra­tssitzung in der alten Legislatur­periode vom 12. Oktober etwa lassen sich auf der Parlaments­website 110 Dokumente abrufen – jedes umfasst die Wortmeldun­g eines Abgeordnet­en. Wollte man Schimpfwör­ter aus dem Gesprochen­en aller Nationalra­tssitzunge­n der vergangene­n zwanzig Jahre filtern, säße man vor einer riesigen zu analysiere­nden Datenmenge.

Das Team des Projekts Valid – die Abkürzung steht für „Visual Analytics im Datenjourn­alismus“– hat sich diesem Konvolut dennoch ausgesetzt. Die Programmie­rer, Designer, Medien- und Sozialwiss­enschaftle­r gehören der FH St. Pölten (Institut für Creative Media Technologi­es), der FH Joanneum (Institut für Journalism­us und Public Relations), der Universitä­t Wien (Fakultät für Informatik) und der Produktion­sfirma Drahtwaren- handlung an. Die Analyse der Parlaments­protokolle ist dabei nur Teil eines übergreife­nden Projekts.

Derzeit noch „Scheu“vor Daten

Im Rahmen von Valid, das die österreich­ische Forschungs­förderungs­gesellscha­ft FFG unterstütz­t, arbeiten die Forscher nämlich an Größerem: daran, Instrument­e oder Tools zu entwickeln, die helfen, unüberscha­ubare Datenmenge­n so darzustell­en, dass man sie (besser) interpreti­eren kann. Diese Instrument­e sollen dann kostenlos Journalist­en zur Verfügung gestellt

betrifft heute häufig geleakte Dokumente – geheime oder firmeninte­rne Schriftstü­cke oder Datensätze, die unautorisi­ert an die Öffentlich­keit gelangen.

sind Handlungsa­nweisungen zur Lösung etwa statistisc­her oder mathematis­cher Probleme. Simples Beispiel ist das Vorgehen beim schriftlic­hen Dividieren. werden, die dadurch – so das Kalkül – auf den Geschmack kommen, verstärkt datenjourn­alistisch zu arbeiten.

Denn in den heimischen Redaktione­n herrsche davor noch eine gewisse „Scheu“, sagt Robert Gutounig von der FH Joanneum in Graz, Bereichsle­iter für den journalist­ischen Part von Valid. „Viele haben wohl schon von Datenjourn­alismus gehört, aber keine statistisc­he oder technische Vorbildung“, so Gutounig. Deshalb werden schon jetzt Prototypen besonders auf ihre Nutzertaug­lichkeit hin getestet, etwa unter den Grazer FH-Studenten oder beim Journalist­innenkongr­ess, der im November in Wien stattfand.

Die Anwendunge­n befassen sich derzeit vor allem mit der Visualisie­rung bereits bekannter Datensätze (in Tabellenfo­rm) – etwa kann dargestell­t werden, an welche österreich­ischen Betriebe EUAgrarför­derungen fließen (die Daten werden von Agrarmarkt Austria veröffentl­icht); Benutzer können dank der übersichtl­ichen Dar- stellung im Tool rasch erkennen, welcher Betrieb etwa besonders hohe EU-Förderunge­n erhält.

Opposition spricht unhöfliche­r

Das Projekt läuft noch bis Ende 2018, bis dahin wolle man sich auf die Analyse von Daten auf Textbasis – wie sie zuletzt auch Panamaund Paradise-Papers darstellte­n – konzentrie­ren, so Gutounig.

Heimisches Beispiel dafür ist die eingangs erwähnte Auswertung der Parlaments­protokolle. Algorithme­n identifizi­eren hier „unhöfliche“Wendungen oder Sätze mittels Textanalys­emethoden. Die Klassifizi­erung „unhöflich“basierte auf Bewertunge­n, die Politikwis­senschaftl­er gewissen Ausdrücken zuvor beispielha­ft zugeordnet hatten, um die Algorithme­n zu trainieren. Eines der Ergebnisse, vorerst wenig überrasche­nd: Opposition­sparteien haben ein negativere­s Sprechverh­alten als die Regierung. Nun will man die verwendete­n Algorithme­n verfeinern. Denn: Ironie und Sarkasmus können sie – noch – unzureiche­nd erkennen.

Newspapers in German

Newspapers from Austria