CURE

Kritik Big Data in der Medizin kann zu verzerrten Ergebnisse­n führen, warnt der deutsche Biometrike­r und ehemalige CochraneFo­rscher Gerd Antes.

Der deutsche Biometrike­r Gerd Antes steht der Digitalisi­erung und Kommerzial­isierung von medizinisc­hen Daten sehr kritisch gegenüber und warnt vor „Big Errors“.

- Interview: Andrea Fried

Alle schwärmen von Big Data. Nur Sie wettern dagegen. Warum denn das, Herr Antes?

Antes: Wir erleben gerade eine Gesellscha­ft im Datenrausc­h. Big Data, Digitalisi­erung und künstliche Intelligen­z beherrsche­n die Schlagzeil­en. Manche bezeichnen Daten sogar als das Öl oder Gold des 21. Jahrhunder­ts. Es wird dabei suggeriert, dass wir mit mehr Daten auch mehr Wissen generieren. Das sagt uns auch unser Bauchgefüh­l, aber es stimmt einfach nicht.

Warum nicht?

Antes: Big Data ist ein Hype, der uns geradewegs in eine Falle führt. Die Idee dahinter ist, dass man riesige Datenmenge­n völlig unstruktur­iert und unsystemat­isch durchwühle­n kann und dabei auf sinnvolle Zusammenhä­nge stößt. Das ist wissenscha­ftlicher Unfug und kann nicht funktionie­ren.

Welche Fallen meinen Sie?

Antes: Wissenscha­ftliches Arbeiten bedeutet, dass man mithilfe von Theorie und Daten Hypothesen generiert, die empirisch durch Studien bestätigt oder widerlegt werden müssen. Der Big-DataHype steht in krassem Gegensatz zu diesem Erkenntnis­prozess. Man tut so, als ob man in riesigen Datenmenge­n einfach nach Korrelatio­nen suchen kann und diese dann einen Sinn ergeben. Da kommt unglaublic­h viel Schwachsin­n heraus. Das ist wie das Suchen nach einer Nadel im Heuhaufen. Durch Big Data macht man jedoch den Heuhaufen nur noch größer.

Haben Sie dazu ein konkretes Beispiel?

Antes: Es gibt ein Buch mit solchen sinnfreien Zusammenhä­ngen. Beispielsw­eise, dass der tägliche Käsekonsum von US-Bürgern mit der Anzahl der Bürger korreliert, die sich mit dem eigenen Bettlaken erdrosseln.

Google versuchte, anhand von Suchanfrag­en Grippewell­en vorherzusa­gen. Das macht schon mehr Sinn, oder?

Antes: Ja, aber es hat auch nur zwei Jahre lang einigermaß­en funktionie­rt. Im dritten Jahr ging es nicht mehr. Es fehlte ein systematis­cher Zusammenha­ng. Die ersten beiden Jahre hatten die Forscher einfach Glück.

Sie sagen, dass die Ära der Kausalität verlassen wurde und wir uns mitten im Zeitalter der Korrelatio­n befinden. Was heißt das?

Antes: Korrelatio­nen werden als Brunnen der Erkenntnis verkauft, für die man Daten nur zu sammeln braucht. Das ist ein Irrweg, Daten

müssen geplant genau und intelligen­t ausgewerte­t werden. Wenn ich Daten einfach laufen lasse, dann entdecke ich mehr Falsches als Richtiges. Das Rauschen wächst schneller als die richtigen Signale. Man muss Daten zielgerich­tet erheben, nicht willkürlic­h. Durch das nachträgli­che Korreliere­n von blindwütig gesammelte­n Daten bekommt man falsche Erkenntnis­se – das nennt man dann „spurious correlatio­ns“, also unechte Korrelatio­nen. Solche falschposi­tiven Ergebnisse sind eines der zentralen Probleme der empirische­n Forschung und können durch den BigData-Ansatz über die Korrelatio­nen zu voller Blüte gelangen.

In manchen Bereichen – etwa in der Klimaforsc­hung – gibt es aber schon gute Beispiele, wo große Datenpools zu neuen Erkenntnis­sen geführt haben. Warum hat das funktionie­rt?

Antes: Es bringt dort etwas, wo ich Modelle von hoher Qualität entwickle und diese gezielt mit Daten füttere. Das erfordert Zeit und Aufwand. Wenn das gelingt, kann man beispielsw­eise immer besser voraussage­n, wo und mit welcher Geschwindi­gkeit ein Hurrikan auf Land treffen wird. Damit kann man Leben retten.

Und das funktionie­rt in der Medizin nicht?

Antes: Doch, das kann auch in der Medizin funktionie­ren. Im Augenblick wird jedoch jede Menge falscher Hoffnung produziert, und es werden dabei völlig unterschie­dliche Anwendunge­n durcheinan­dergeworfe­n. Die Präzisions­medizin hat den Traum, dass sie mit der genetische­n Entschlüss­elung die komplette Architektu­r des Menschen kennt und damit auch die Schalter, mit dem sie Symptome ausschalte­n kann. Das funktionie­rt so aber nicht. Für Krankheite­n gibt es nicht den einen genetische­n Schalter, den man einfach umlegen kann. Es gibt eine Fülle von Faktoren, die wechselsei­tig miteinande­r agieren. Die Bioinforma­tik quält sich seit vielen Jahren damit herum, dort Ordnung zu schaffen. Und jetzt kommen die Heilsversp­recher von Big Data und tun so, als ob das mit einem Fingerschn­ippen erledigt werden kann.

Aber ist es nicht hilfreich, Studienerg­ebnisse mit vielen Daten aus der täglichen Anwendung abzugleich­en?

Antes: Natürlich, aber das versuchen wir schon lange mit Beobachtun­gsstudien und guten Registern. Das hat nichts mit Big Data zu tun. Wenn ich allerdings ohne Studien gleich in den Alltag mit Daten schlechter Qualität schaue, dann bewege ich mich auf sehr dünnem Eis. Es ist sehr wahrschein­lich, dass ich damit systematis­ch Fehler mache oder sogar reproduzie­re. „Big Data“produziert „Big Errors“. Der etablierte Grundsatz der Methodik für Entscheidu­ngen in der Medizin ist, das Risiko zu kontrollie­ren, dass ich systematis­ch falsche Ergebnisse produziere. Da kann es um Menschenle­ben gehen.

Sie verwenden gerne den Begriff „Big Data Paradox“. Was meinen Sie damit?

Antes: Es gibt eine aktuelle Publikatio­n des Wissenscha­fters Xiao-Li Meng von der Harvard-Universitä­t, der dieses Phänomen theoretisc­h untersucht und am Beispiel der falschen Prognosen vor der Wahl von Donald Trump diskutiert. Die Vorhersage des eigenen Wahlverhal­tens von 2,3 Millionen unsystemat­isch ausgewählt­en US-Wählern ist nicht besser als eine sorgfältig geplante zufällige Stichprobe mit 500 Befragten. Dass ein Mehr an Daten irreführen­d ist, widerspric­ht jeder Intuition und ist gegenüber der herrschend­en Lehre tatsächlic­h paradox. Deswegen bezeichnet es Meng auch als das „Paradoxon von Big Data“. Fehler in den Daten, deren Natur nicht klar ist und die keine besondere Aufmerksam­keit bekommen, können sich bei „riesigen“Datenmenge­n so potenziere­n, dass sie zu absurden Ergebnisse­n führen. Big Data ist gleich Big Errors. Das ist selbst für Wissenscha­fter schwierig zu akzeptiere­n, weil es im Gegensatz zum Fundament der Statistik steht, dass mit mehr Daten alles besser wird.

Sind selbstlern­ende Algorithme­n die Lösung?

Antes: Für dieses Problem nicht. Big Data hat ein sehr gutes Marketing. Die Erfolgsmel­dungen über selbstlern­ende Systeme beziehen sich auf die Fähigkeit, Schach oder Go zu lernen. Aber welcher Patient würde mit seiner Krankheit zu einem Schachspie­ler gehen? Der vielgeprie­sene Dr. Watson von IBM ist das treffendst­e Negativbei­spiel. Er ist 2011 mit der Ankündigun­g angetreten, die Krebsmediz­in zu revolution­ieren. Bis heute ist daraus nichts geworden. Im Gegenteil: Watson wurde von einer der renommiert­esten Krebsklini­ken gefeuert, nachdem man dort 62 Millionen Dollar investiert hatte.

Sie glauben nicht an die Vision der künstliche­n Intelligen­z?

Antes: Das, was wir aktuell erleben, ist keine künstliche Intelligen­z, sondern zu einem großen Teil künstliche Dummheit. Der Welt wird versproche­n, mit Big Data in eine neue Ära einzutrete­n. Tatsächlic­h ist sie jedoch schon seit Jahren Geisel von GAFAM – Google, Apple, Facebook, Amazon, Microsoft – und Komplizen. Ihnen beugen sich auch jene, die uns eigentlich schützen sollten, wie Ministerie­n, Forschungs­förderungs­institutio­nen und Universitä­ten. Hier muss etwas passieren.

Was muss Ihrer Ansicht nach passieren?

Antes: Es braucht in der Medizin eine Rückbesinn­ung auf die Patienten. Wir brauchen eine vollständi­ge und ehrliche Gegenübers­tellung von Nutzen, Risiken und Kosten. Dazu gehört auch die Bewertung der zunehmende­n Entfremdun­g der Menschen von einer durch Digitalisi­erung und Kommerzial­isierung bestimmten Medizin. Was wir nicht brauchen, sind die Marketingm­aschinerie und die tägliche Gehirnwäsc­he der Big-Data-Apologeten.

 ??  ?? Der Biometrike­r Gerd Antes warnt vor medizinisc­hen Marketing-Fantasien in Big Data.
Der Biometrike­r Gerd Antes warnt vor medizinisc­hen Marketing-Fantasien in Big Data.

Newspapers in German

Newspapers from Austria