El profesor de Cambridge y socio de la Royal Society es una eminencia de la ciencia de datos. Acaba de publicar ‘El arte de la estadística’ para ayudarnos a entender los números y, a través de ellos, el mundo. Y alerta: “Comer un filete quita 30 minutos d
El estadístico más mediático.
Un dato: 69. Otros dos: 0.116 y 52.200. Uno más: 1.700.000. ¿Le han dicho algo por sí mismos estos misteriosos números? Probablemente, no. Es normal: necesitarían de un estadístico para interpretarse. Y uno de los mejores del mundo en ese cometido es Sir David Spiegelhalter. El 69 indica su edad; 0.116 y 52.200 son la longitud y latitud de Cambridge, el lugar donde se ubica la prestigiosa universidad donde trabaja; y 1.700.000 son las visualizaciones de una famosa y airada intervención suya en la televisión británica por el mal uso de los datos del Covid en lo peor de la pandemia. Ahora, el mediático matemático británico presenta El arte de la estadística (Capitán Swing), un ensayo con el que pretende «ayudar a responder las cuestiones que emergen cuando tratamos de entender el mundo».
P. Su libro comienza con el caso del asesino en serie Harold Shipman, procesado en 1999. Sorprende en un ensayo sobre estadística…
R. Yo trabajé en ese caso, participé en la investigación como científico forense. Fue muy impactante emocionalmente porque las familias de las víctimas se sentaban enfrente mientras enseñábamos los datos. Y teníamos que tener cuidado con qué palabras emplear, porque Shipman asesinó a 250 personas, puede que hasta 400. Nos preguntaron si podía haber sido atrapado antes. Y gracias a la estadística concluimos que en teoría sí, pero que tristemente nadie había estado prestando atención a los datos. Aquella conclusión fue dura de escuchar para los familiares.
P. En el libro también habla de encuestas electorales y hoy se celebran elecciones en España. ¿En qué se fija para darles credibilidad?
R. El tamaño de la muestra es importante, pero una encuesta bien hecha solo requiere 1.000 personas que respondan para realizar una estimación con un margen de error del 3% como máximo. Lo que pasa, claro, es que las encuestas no siempre son perfectas y los sesgos sistemáticos que presentan acaban teniendo más importancia que la dimensión de la muestra. Mi regla de oro es duplicar el margen de error: del 3% lo llevo al 6%. Al hacerlo así de grande asumes que el margen de error es enorme.
P. ¿Qué problemas metodológicos se dan en este tipo de encuestas?
R. El principal problema es cuando la gente que desea responder no es representativa de los votantes en general, o cuando no se puede dar credibilidad a su respuesta. Muchas veces se les dice: ‘Si tuvieras que votar ahora, ¿qué votarías?’. No creo que se les pregunte sobre su intención de voto el día de las elecciones. No sé, quizá sí. Pero en cualquier caso, la gente puede cambiar de opinión, puede mentir, puede no querer admitir el sentido de su voto. En mi país, por ejemplo, no creo que la gente quisiera admitir que fuera a votar a favor del ‘Brexit’.
P. Ha mencionado antes el Brexit, un referéndum de sí o no. ¿Cree que a la gente, como ha sugerido, le daba vergüenza admitir en las encuestas que votaría a favor de salir de la Unión Europea?
¿Por eso fallaron?
R. Recuerda que el resultado fue de 52% a 48%, una diferencia equivalente al margen de error habitual. Fácilmente podría haber salido lo contrario. Las encuestas finales no fueron tan inexactas, la verdad, y si te fijas en la dispersión no salen tan mal paradas. Probablemente el mayor problema vino por la reticencia de algunos votantes a admitir que iban a votar Brexit, tal vez incluso a admitírselo a sí mismos. Era un tema muy emotivo.
P. P. Siguiendo con el ‘Brexit’: otro tema que usted ha destacado como ejemplo de manipulación es el del autobús del ‘Vote leave’ (’Vota irnos’).
R. Es el peor uso político de un número que conozco. El del autobús rojo que decía: ‘Todas las semanas enviamos a la UE 350 millones de libras que podríamos gastar en el Servicio Nacional de Salud’. El número era erróneo y ciertamente no nos hemos gastado esa cantidad en Sanidad desde el Brexit. Eso no ha sucedido. Pero lo más interesante no es que el número fuera erróneo o que se tratase de una mentira, sino la descontextualización del número. Porque si hubieran dividido la cifra entre los habitantes del Reino Unido el resultado equivale a 80 peniques por persona al día. O sea, lo mismo que una bolsa de patatas fritas con sabor a queso y cebolla.
P. Otro momento donde cobraron importancia las estadísticas fue en la pandemia y usted no ocultó su enfado por cómo las utilizaron los políticos.
R. Sí, es verdad. Malgasté mucho tiempo enfadándome con los políticos por su manera de comunicar estadística. Son horribles en eso. No entienden de donde vienen los números o qué significan, pero les encantan las cifras, así que tratan de utilizarlas para impresionar. Hacen lo que llamo teatro de números.
P. Usted utilizó esa expresión en una famosa intervención en la BBC...
R. Sí, tuvo 1,7 millones de visualizaciones [ríe]. Ese fue mi pequeño arrebato de ira hacia ellos, algo que intenté evitar en adelante. Pero estaba realmente enfadado con los políticos por cómo estaban insultando a la gente. Porque la gente tenía interés y puede entender los números si se los contextualizas y les aportas elementos de comparación razonables.
P. Tras un artículo suyo en ‘The Guardian’, precisamente sobre las comparativas entre países, tanto el primer ministro como el líder de la oposición trataron de apropiarse de sus palabras. ¿Es posible reconciliar a la ciencia con la política?
R. A los políticos les gusta utilizar la ciencia como apoyo para sus opiniones. Suelen decir que están siguiendo a la ciencia. Pero la ciencia no les dice lo que hacer porque funciona con incertidumbres y, a lo sumo, solo puede hacer un juicio sobre lo que pasaría si ciertas políticas se aplican. Los políticos necesitan empezar a asumir su responsabilidad sin escudarse en la ciencia.
P. Ayúdeme a hacer autocrítica: ¿qué malas prácticas son más comunes al comunicar datos? R. Me temo que hay bastantes errores. Quizá el más común es concluir que una cosa causó otra, cuando en realidad simplemente son elementos que se dieron a la vez en un grupo de gente. Es decir, correlación no significa necesariamente causalidad. Mi ejemplo favorito es cuando una gran cabecera británica sacó que los refrescos hacen violentos a los niños. Pero, ¿había tal vez un factor común entre ambas cosas? O quizá simplemente tienes sed tras un duro día de violencia.
P. Destaca también muchos titulares de prensa realmente fantásticos donde se confunde riesgo absoluto y relativo, por lo que llevan a error a los lectores. ¿Cuáles son sus favoritos?
R. El del beicon es un clásico. Se dijo que comerlo eleva el cáncer colorrectal un 18%, pero en realidad el estudio revelaba que el riesgo subyacente pasaba del 6% al 7%. Así que, en realidad, sólo aumentaba en un caso de cada 100, algo que no suena tan impresionante. Pero mi favorito es uno que no usé en el libro que
conectaba los atracones de televisión con la embolia pulmonar.
P. Sí, lo menciona en los capítulos finales…
R. ¿Ah, sí? No me acordaba. Pues es divertido. Hace que parezca que el riesgo es altísimo, pero si le das la vuelta tendrías que ver la tele cinco horas cada noche durante 12.000 años para tener el problema.
P. Hablando de cómo comunicar bien las cosas. ¿Me puede recordar cuántas ‘microvidas’ me resta al día comer un filete de ternera?
R. [Ríe con ganas] Bueno, era una especie de broma, pero todavía creo que es bastante útil como medida. Está claro que fumar, beber o comer mal acorta la vida y lo que hicimos fue traducir proporcionalmente el riesgo en años dentro de una vida a un riesgo en minutos dentro de un día. Una microvida son 30 minutos y había cosas, como fumar, que te restaban microvidas. Un ejemplo: comer un filete de ternera acorta tu vida 30 minutos. Pero lo bueno es que, por ejemplo, hacer ejercicio te sumaba una microvida.
P. Le hago una pregunta sobre las preguntas. ¿Les da más importancia que a las propias respuestas? R. La pregunta es lo primero. En el famoso libro
The Hitchhikers´s Guide to the Galaxy… ¿Lo has leído? ¿No? Bueno, pues en este libro el ordenador aporta la respuesta clave sobre el universo. Y la respuesta es 42. Y el problema es que nadie conoce cuál es la pregunta. No es posible encontrar una respuesta sin la pregunta. Por eso, pongo énfasis en el ciclo de resolución de problemas que siempre comienza con una pregunta. De esto va la estadística: de ayudar a la gente a responder preguntas y comprender el mundo. De otro modo, son sólo números.
P. Quería sacarle el tema de las preguntas porque, hasta donde sé, la inteligencia artificial todavía no puede planteárselas.
R. Oh, gran asunto. La verdad es que ChatGPT y otros programas similares son extraordinarios. Hay una disciplina entera, que llamamos prompt engineering, que se basa en lo que comentas: ¿qué preguntas puedo hacer?. Y se ha convertido en una actividad muy humana, porque requiere imaginación decidir cómo plantear preguntas para aprovechar los sistemas de inteligencia artificial.
P. Aboga por mejorar la alfabetización en datos de la sociedad. ¿Cómo debería enseñarse esta materia? Quizá con un enfoque detectivesco, como el de su libro, sería más interesante.
R. Esa idea, la del detective de datos, muestra que esta disciplina no debe colgar de las matemáticas. La estadística y la ciencia de datos debería ser un pilar por sí mismo en la educación, aunque no sé cómo llamaría a esa asignatura. Pero creo que es algo importantísimo para nosotros, los ciudadanos, dotarnos de la capacidad de entender el mundo y poder cuestionarnos lo que nos dicen.
P. ¿Y usted cree que los políticos desean que desarrollemos esa capacidad crítica?
R. Yo creo que es algo en lo que todo el mundo estaría de acuerdo, en parte porque beneficia a la economía. La alfabetización en datos, la facilidad con los números, ayudaría mucho a todos. A todos. Y los políticos quieren que la economía funcione porque es la manera en que salen reelegidos. Hace poco nuestro primer ministro dijo que todo el mundo debería estudiar matemáticas hasta los 18 años. No debería haber dicho eso. Debería haber dicho que todo el mundo estudie estadística y ciencia de datos, porque es más importante que las abstractas matemáticas.
P. Usted da importancia a reconocer que uno no lo sabe todo porque la realidad es incierta. ¿No deberían hacer lo mismo los políticos? R. Generalmente no siento lástima por los políticos, pero en este caso sí. Durante el Covid salí mucho en los medios y decía, una y otra vez, «no lo sé». Me preguntaban sobre variantes, y qué iba a pasar, y yo decía «no lo sé, no soy un virus». A mí, decir que no sé algo no me cuesta. En cambio resulta tan ridículo que los políticos salgan en los medios pretendiendo tener una respuesta para todo...
Malgasté mucho tiempo enfadándome con los políticos por su forma de comunicar la estadística
La alfabetización en datos, la facilidad con los números, ayudaría a todos mucho. Debe ser un pilar educativo
Cada ‘microvida’ son 30 minutos: las pierdes fumando o bebiendo, pero las ganas haciendo deporte