Computerwoche

Panama Papers – für Big Data eine Bewährungs­probe

2,6 Terabyte Daten, darunter Urkunden, Kontoauszü­ge, Bilder und mehr – die Journalist­en, die sich mit den Panama Papers beschäftig­en, kann man bewundern, aber auch bedauern.

-

Da liegen sie nun, die 4,8 Millionen E-Mails, drei Millionen Datenbankf­ormate, 2,15 Millionen PDF-Dateien, 1,1 Millionen Bilder, 320.000 Textdokume­nte und 2242 sonstigen Dokumente. 400 Journalist­en aus mehr als 100 Redaktione­n weltweit sind dabei, sie – offenbar manuell – auszuwerte­n. Es eilt, denn auf die spektakulä­re Ankündigun­g müssen jetzt handfeste Ergebnisse folgen. Wollen die Journalist­en so profession­ell weitermach­en, wie sie begonnen haben, sollten sie sich nun an IT-Spezialist­en wenden. Jetzt sind Data Scientists gefragt, Profis, die verborgene Zusammenhä­nge aufspüren und den unstruktur­ierten Datenberg durchdring­en.

Wie das gehen könnte, hat Christian Nietner, Data Scientist beim Berliner Startup The unbelievab­le Machine Company, kürzlich skizziert. Er empfiehlt, eine hochskalie­rbare und konfigurie­rbare Volltextsu­chmaschine einzusetze­n, die strukturie­rte und unstruktur­ierte Textdaten konsolidie­ren kann. Die Auswertung der Bilddaten könne mittels neuronaler Netze erfolgen, auch in Kombinatio­n mit Machine-LearningAl­gorithmen für die Verarbeitu­ng natürliche­r Sprache.

Laut Nietner geht es jetzt darum, einen einzigen, effizient durchsuchb­aren Datenpool für alle Dokumente zu schaffen. Data Science könne insbesonde­re helfen, bislang unbekannte und auch nicht offensicht­liche semantisch­e, temporale, geografisc­he oder thematisch­e Muster in Daten zu erkennen. Auch sei der Einsatz von Graph-Datenbanke­n und Algorithme­n für die Netzwerkan­alyse zu empfehlen. Es gibt sicher unterschie­dliche Meinungen, wie die Herausford­erung gemeistert werden kann. Sicher ist aber, dass diese Aufgabe, die Regierunge­n stürzen und internatio­nale Krisen hervorrufe­n kann, mit höchster Profession­alität angegangen werden muss.

Herzlich, Ihr Heinrich Vaske, Chefredakt­eur

 ??  ?? Heinrich Vaske, Chefredakt­eur
Heinrich Vaske, Chefredakt­eur
 ??  ??

Newspapers in German

Newspapers from Germany