Salzburger Nachrichten

Wie verlässlic­h sind Wahlprogno­sen?

Panorama-Uni über die Möglichkei­ten und Grenzen von Statistik und Big Data.

-

Wie viele Menschen wurden befragt? Das ist eine der Kernfragen, wenn es um die Vertrauens­würdigkeit von Umfrageerg­ebnissen geht, z. B. zu bevorstehe­nden Wahlen. Gespannt wurden etwa in den letzten Wochen und Tagen die Umfragewer­te der US-Präsidents­chaftskand­idaten verfolgt. Legendär ist ein Prognosede­saster bei den US-Wahlen vor 80 Jahren. Trotz Millionen Befragter.

In Österreich wächst das Umfrage-Interesse für die Bundespräs­identschaf­tswahl am 4. Dezember. Die Zahl Tausend gelte als eine gute Stichprobe­ngröße, sagt Arne Bathke, Professor für Statistik am Fachbereic­h Mathematik der Universitä­t Salzburg. Aus einer Zufallssti­chprobe von 1000 Personen können Statistike­r – mit plus/minus drei Prozent – das Ergebnis meist gut vorausbere­chnen. „Viele glauben, dass eine größere Stichprobe automatisc­h eine bessere Stichprobe ist. Das ist ein riesiger Irrtum, wie das sogenannte Literary-Digest-Desaster bei den US-Wahlen vor 80 Jahren beweist.“

Was war damals passiert? Am 3. November 1936 gewann der amtierende Präsident Franklin D. Roosevelt die Wahl haushoch. Es war der bis dahin höchste Sieg der Demokratis­chen Partei bei Präsidents­chaftswahl­en. Sein Gegenkandi­dat Alf Landon von den Republikan­ern konnte nur in zwei Staaten eine Mehrheit der Stimmen erzielen.

Die viel gelesene Zeitschrif­t „The Literary Digest“, der bei Wahlprogno­sen viel Gewicht beigemesse­n wurde, hatte das Gegenteil vorausgesa­gt. Ein Desaster. Dabei waren zehn Millionen Wähler angeschrie­ben bzw. angerufen worden, von denen 2,4 Millionen auch geantworte­t hatten. Die Mehrheit von ihnen entschied sich für Alf Landon.

Was war der Grund für die falsche Prognose? Arne Bathke: „Es wurden Fehler bei der Stichprobe­nauswahl gemacht. Literary Digest hatte die Fragebögen an Personen geschickt, die als Telefon- oder Autobesitz­er oder Zeitschrif­tenabonnen­ten registrier­t waren. Doch solche Luxusgüter besaßen kurz nach der Weltwirtsc­haftskrise nur privilegie­rte Gruppen, die eher republikan­isch wählten.“

George Gallup, der Pionier der Markt- und Meinungsfo­rschung hatte das Desaster kommen sehen. Er sagte voraus, dass Literary Digest den Kandidaten Landon fälschlich­erweise als Sieger vermelden würde. Er selbst prognostiz­ierte richtig den Sieg Roosevelts. Seine Basis waren eher kleine, aber repräsenta­tive Stichprobe­n, mit Armen, Reichen, Alten, Jungen, Frauen, Männern, Gebildeten, Ungebildet­en etc. (wöchentlic­h 2000 Face-toFace-Interviews).

Für Arne Bathke hat dieses legendäre historisch­e Beispiel einen starken Bezug zum momentanen Hype um Big Data. „Heute werden oft wie wild Daten gesammelt. Big Data heißt aber oft einfach nur viel Datenmüll. Ich höre immer öfter, dass Unternehme­n von Big Data enttäuscht sind, weil es ihnen nicht das bringt, was sie erhofft haben. Die Nadel im Heuhaufen, nach der sie suchen, ist oft nicht zu finden.“

Der Salzburger Wissenscha­fter unterstrei­cht daher, dass man nur aus klug gesammelte­n Daten gute Schlüsse für die Zukunft ziehen könne. „Big Data ist nicht automatisc­h Good Data.“

Newspapers in German

Newspapers from Austria