Pa­na­ma Pa­pers – für Big Da­ta ei­ne Be­wäh­rungs­pro­be

2,6 Te­ra­byte Da­ten, dar­un­ter Ur­kun­den, Kon­to­aus­zü­ge, Bil­der und mehr – die Jour­na­lis­ten, die sich mit den Pa­na­ma Pa­pers be­schäf­ti­gen, kann man be­wun­dern, aber auch be­dau­ern.

Computerwoche - - Editorial -

Da lie­gen sie nun, die 4,8 Mil­lio­nen E-Mails, drei Mil­lio­nen Da­ten­bank­for­ma­te, 2,15 Mil­lio­nen PDF-Da­tei­en, 1,1 Mil­lio­nen Bil­der, 320.000 Text­do­ku­men­te und 2242 sons­ti­gen Do­ku­men­te. 400 Jour­na­lis­ten aus mehr als 100 Re­dak­tio­nen welt­weit sind da­bei, sie – of­fen­bar ma­nu­ell – aus­zu­wer­ten. Es eilt, denn auf die spek­ta­ku­lä­re An­kün­di­gung müs­sen jetzt hand­fes­te Er­geb­nis­se fol­gen. Wol­len die Jour­na­lis­ten so pro­fes­sio­nell wei­ter­ma­chen, wie sie be­gon­nen ha­ben, soll­ten sie sich nun an IT-Spe­zia­lis­ten wen­den. Jetzt sind Da­ta Sci­en­tists ge­fragt, Pro­fis, die ver­bor­ge­ne Zu­sam­men­hän­ge auf­spü­ren und den un­struk­tu­rier­ten Da­ten­berg durch­drin­gen.

Wie das ge­hen könn­te, hat Christian Niet­ner, Da­ta Sci­en­tist beim Ber­li­ner Star­t­up The un­be­lieva­ble Ma­chi­ne Com­pa­ny, kürz­lich skiz­ziert. Er emp­fiehlt, ei­ne hoch­s­ka­lier­ba­re und kon­fi­gu­rier­ba­re Voll­text­such­ma­schi­ne ein­zu­set­zen, die struk­tu­rier­te und un­struk­tu­rier­te Text­da­ten kon­so­li­die­ren kann. Die Aus­wer­tung der Bild­da­ten kön­ne mit­tels neu­ro­na­ler Net­ze er­fol­gen, auch in Kom­bi­na­ti­on mit Ma­chi­ne-Le­arnin­gAl­go­rith­men für die Ver­ar­bei­tung na­tür­li­cher Spra­che.

Laut Niet­ner geht es jetzt dar­um, ei­nen ein­zi­gen, ef­fi­zi­ent durch­such­ba­ren Da­ten­pool für al­le Do­ku­men­te zu schaf­fen. Da­ta Sci­ence kön­ne ins­be­son­de­re hel­fen, bis­lang un­be­kann­te und auch nicht of­fen­sicht­li­che se­man­ti­sche, tem­po­ra­le, geo­gra­fi­sche oder the­ma­ti­sche Mus­ter in Da­ten zu er­ken­nen. Auch sei der Ein­satz von Graph-Da­ten­ban­ken und Al­go­rith­men für die Netz­werkana­ly­se zu emp­feh­len. Es gibt si­cher un­ter­schied­li­che Mei­nun­gen, wie die Her­aus­for­de­rung ge­meis­tert wer­den kann. Si­cher ist aber, dass die­se Auf­ga­be, die Re­gie­run­gen stür­zen und in­ter­na­tio­na­le Kri­sen her­vor­ru­fen kann, mit höchs­ter Pro­fes­sio­na­li­tät an­ge­gan­gen wer­den muss.

Herz­lich, Ihr Hein­rich Vas­ke, Chef­re­dak­teur

Hein­rich Vas­ke, Chef­re­dak­teur

Newspapers in German

Newspapers from Germany

© PressReader. All rights reserved.