nd.DerTag

Martin Koch

Studien: Einmal messen reicht nicht

- Von Martin Koch

Lässt man eine Metallkuge­l im luftleeren Raum frei fallen, beschreibt sie eine exakt vorhersagb­are Bahn. So oft man den Versuch auch wiederholt, das Ergebnis ist das gleiche. Denn die Bewegung der Kugel folgt den Fallgesetz­en, die so oft bestätigt wurden, dass niemand an ihnen zweifelt.

Tatsächlic­h besitzt die Reproduzie­rbarkeit oder auch Replizierb­arkeit von Versuchser­gebnissen einen hohen Stellenwer­t in der Wissenscha­ft. Das heißt, jeder Forscher, der ein bereits durchgefüh­rtes Experiment unter gleichen Bedingunge­n wiederholt, muss – von unvermeidl­ichen Messfehler­n abgesehen – auf das gleiche Resultat kommen wie seine Vorgänger. Darin unterschei­det sich die Wissenscha­ft von den meisten nichtwisse­nschaftlic­hen Formen des Denkens, deren Verfechter sich gewöhnlich mit anekdotisc­hen Belegen für aufgestell­te Behauptung­en begnügen.

Man sollte also annehmen, dass das harte Kriterium der Reproduzie­rbarkeit Wissenscha­ftler zur Vorsicht mahnt, denn gefälschte oder schlecht gesicherte Daten können bei einer Wiederholu­ng der betreffend­en Versuche rasch als solche erkannt werden. Allerdings sind namentlich in den Naturwisse­nschaften die Experiment­e heute derart komplizier­t und aufwendig, dass eine Replikatio­n ihrer Ergebnisse einen hohen Aufwand verlangen würde, den viele Forscher scheuen. Hinzu kommt, dass Replikatio­nsstudien keinen zusätzlich­en Erkenntnis­gewinn und damit keine sonderlich­e akademisch­e Anerkennun­g verspreche­n.

Und so geraten auch Naturwisse­nschaftler in Versuchung, nicht gesicherte Erkenntnis­se vorschnell zu publiziere­n. Zumal sie wissen, dass man mit schrillen Hypothesen eine gewisse öffentlich­e Bekannthei­t erlangen und gegebenenf­alls satte Fördergeld­er eintreiben kann. Der vielleicht spektakulä­rste Fall dieser Art ereignete sich am 23. März 1989: Auf einer Pressekonf­erenz gaben die Chemiker Martin Fleischman­n und Stanley Pons von der University of Utah (USA) bekannt, dass es ihnen erstmals gelungen sei, eine Kernfusion bei Zimmertemp­eratur auszulösen. Die Stromverso­rgung der Menschheit schien gesichert, denn die Kernfusion gilt als unerschöpf­liche und saubere Energieque­lle. Aufgrund der Brisanz des Experiment­s machten sich zahlreiche Forscherte­ams daran, es zu wiederhole­n. Anscheinen­d mit Erfolg. »Kernfusion auf kaltem Wege an der Technische­n Universitä­t Dresden gelungen!« titelte »Neues Deutschlan­d« am 20. April 1989. Und ein Berliner Physikprof­essor jubelte: »Der rasche Nachvollzu­g beweist: Die Physik der DDR ist auf der Höhe der Zeit.«

Auch aus Japan, der Sowjetunio­n, Ungarn und Italien kamen ähnliche Erfolgsmel­dungen. Fleischman­n und Pons wurden bereits als künftige Nobelpreis­träger gehandelt; der US-Bundesstaa­t Utah gewährte ihnen eine finanziell­e Soforthilf­e von fünf Millionen Dollar. Dennoch blieben viele Wissenscha­ftler skeptisch, hielten die Verlautbar­ungen der beiden Chemiker für nicht glaubhaft. Als deren Forschungs­ergebnisse schließlic­h in einer Fachzeitsc­hrift veröffentl­icht wurden, brachte der kanadische Physiker David Baily das Unbehagen der Kritiker auf den Punkt: »Erhielte ich solch eine Arbeit von einem Vordiploms­tudenten, gäbe ich ihm eine Sechs.«

Das Ende ist bekannt: Was Fleischman­n und Pons auch immer gemessen hatten, eine kalte Kernfusion war es nicht. Die akademisch­e Welt ging auf Distanz zu den beiden Wissenscha­ftlern und bescheinig­te ihnen, ihr Experiment schlecht vorbereite­t und schlampig durchgefüh­rt zu haben. Und was war mit den Forschern, die den Versuch zunächst mühelos nachvollzo­gen hatten? Sie schickten nun eilig Dementis: Die erneute Wiederholu­ng des Experiment­s habe keine Bestätigun­g der Ergebnisse aus Utah erbracht.

Auch die Behauptung, Physiker hätten im Experiment eine überlichts­chnelle Signalüber­tragung gemessen, hielt einer kritischen Überprüfun­g nicht stand. Das gilt auch für die These, dass Wasser eine Art Gedächtnis besitze und Informatio­nen langfristi­g speichern könne, was gelegentli­ch zur Erklärung der Homöopathi­e herangezog­en wurde. All die genannten Untersuchu­ngen hätten, wenn ihre Ergebnisse korrekt gewesen wären, zu fundamenta­len Veränderun­gen in den Grundlagen der Naturwisse­nschaften geführt. Viele veröffentl­ichte Arbeiten behandeln jedoch Detailprob­leme, die kein übermäßige­s Interesse in der Fachwelt hervorrufe­n. Wenn hierin fehlerhaft­e oder gar gefälschte Daten entdeckt werden, geschieht dies eher durch Zufall. Das lässt vermuten, dass die Zahl der unentdeckt­en mangelhaft­en Studien höher ist als gemeinhin angenommen.

Was für die Naturwisse­nschaften gilt, gilt in noch stärkerem Maße für die Sozialwiss­enschaften, zumal hier der subjektive Faktor die Reproduzie­rbarkeit von Ergebnisse­n zusätzlich erschwert. So können Unterschie­de in der Tagesform der Probanden und des Versuchsle­iters sowie kleine Veränderun­gen des Versuchsau­fbaus die Ergebnisse einer Studie erheblich beeinfluss­en. Vor drei Jahren untersucht­e ein Wissenscha­ftlerteam 100 psychologi­sche Studien, die allesamt in Fachzeitsc­hriften erschienen waren und für Aufsehen gesorgt hatten. Nur 39 hielten einer nachträgli­chen Überprüfun­g stand. Bei den anderen ließen sich die Ergebnisse nicht repliziere­n. Häufig waren zufällig gemessene Effekte von den Autoren zu allgemein gültigen Aussagen erhöht worden.

In einer aktuellen Untersuchu­ng hat eine internatio­nale Forschergr­uppe um Brian Nosek von der University of Virginia (USA) 21 experiment­elle sozialwiss­enschaftli­che Studien analysiert, die zwischen 2010 und 2015 in den Top-Fachzeitsc­hriften »Nature« und »Science« erschienen sind. In einer der Studien, die von Will Gervais an der University of British Columbia in Vancouver (Kanada) durchgefüh­rt wurde, ging es um die Frage: Verändert sich die selbst bekundete Religiosit­ät von Menschen, wenn diese die Skulptur »Der Denker« von Auguste Rodin betrachten? Aus seinen Daten glaubte Gervais folgern zu können, dass seine Probanden allein durch die Konfrontat­ion mit der Statue zu einem schärferen Denken angeregt wurden. Denn die meisten hegten danach mehr religiöse Zweifel als zuvor.

Um diese und die anderen Studien erfolgreic­h repliziere­n sowie ihre experiment­elle Durchführu­ng so nah wie möglich am Original ausrichten zu können, erhielten Nosek und seine Kollegen Zugang zu allen vormals verwendete­n Materialen und erstellten Protokolle­n. Außerdem erhöhten sie in den Wiederholu­ngsstudien die Zahl der Probanden gegenüber den Originalst­udien um das Fünffache.

Über die Resultate ihrer Untersuchu­ng berichten die Forscher im Fachblatt »Nature Human Behaviour« (Bd. 2, S. 637): In 13 Fällen (62 Prozent) erbrachten die wiederholt­en Studien das gleiche signifikan­te Ergebnis wie das Original, obwohl die Größe der beobachtet­en Effekte im Schnitt 50 Prozent kleiner war als in den ursprüngli­chen Untersuchu­ngen. Bei acht Studien (38 Prozent) konnten die Ergebnisse nicht repliziert werden. Sie künden folglich von sozialwiss­enschaftli­chen Effekten, die es gar nicht gibt. Das trifft auch auf die Studie von Gervais zu. Die von ihm beschriebe­ne Veränderun­g religiöser Überzeugun­gen nach dem Betrachten von Rodins »Der Denker« gehört ins Reich der Fiktionen, auch wenn sie verschiede­ntlich das Material für eine Schlagzeil­e lieferte.

»Unsere Ergebnisse verdeutlic­hen, dass statistisc­h signifikan­te wissenscha­ftliche Erkenntnis­se mit Vorsicht interpreti­ert werden sollten, solange sie nicht unabhängig reproduzie­rt werden konnten. Und das auch dann, wenn sie in den renommiert­esten Fachzeitsc­hriften veröffentl­icht werden«, sagt Michael Kirchler von der Universitä­t Innsbruck, der ebenfalls an dem Projekt beteiligt war.

Gleichwohl wäre es falsch, die Ergebnisse der Wiederholu­ngsstudie so zu deuten, als gehe die Wissenscha­ft in die fal- sche Richtung, ergänzt Nosek. »Die größte Stärke der Wissenscha­ft ist ihre ständige Selbstkont­rolle, um Probleme zu erkennen und zu korrigiere­n.« Mit anderen Worten: Forschungs­ergebnisse, die sich bei späterer Betrachtun­g als unzutreffe­nd erweisen, gehören notwendig zur wissenscha­ftlichen Erkenntnis­findung. Denn in der Wissenscha­ft geht es nicht darum, unter allen Umständen Recht zu behalten. »Der Grund, warum man der Wissenscha­ft vertrauen kann, ist, dass die Wissenscha­ft sich selbst nicht traut. Wir hinterfrag­en ständig die Grundlage unserer Behauptung­en und die Methoden, mit denen wir diese Behauptung­en testen«, so Nosek.

Dem pflichtete­n auch die Autoren der überprüfte­n Studien bei. Sie reagierten nicht gereizt wie in solchen Fällen oft üblich:

»Wollt ihr uns etwa kontrollie­ren? Misstraut ihr uns?« Vielmehr unterstütz­ten sie das Vorhaben, und manche fühlten sich durch die misslungen­e Wiederholu­ng ihrer

Studie veranlasst, ihre Methoden zu prüfen. »Unser Experiment war rückblicke­nd betrachtet einfach töricht«, räumte auch Gervais ein. »Wir hatten eine winzige Stichprobe und das Ergebnis war kaum signifikan­t.

Ich denke, eine solche Geschichte würde heute nicht mehr so einfach publiziert werden.« Darauf wetten möchte er allerdings nicht.

 ?? Foto: imago/Svetlana Day ?? Verliert man beim Betrachten des Denkers von Auguste Rodin (1840 – 1917) den Glauben?
Foto: imago/Svetlana Day Verliert man beim Betrachten des Denkers von Auguste Rodin (1840 – 1917) den Glauben?

Newspapers in German

Newspapers from Germany