La Razón (Cataluña)

La demostraci­ón matemática de los errores de Simón

- POR ÁNGEL NIETO LORASQUE FOTOGRAFÍA DE GONZALO PÉREZ

EL EXPERTO EN DATA SCIENCE GUILLERMO BLANCO EXPLICA DÓNDE ESTÁ EL PROBLEMA DE LA DISPARIDAD DE CIFRAS DE FALLECIDOS POR CORONAVIRU­S. HASTA 2021 NO CONOCEREMO­S LAS CIFRAS REALES

LA DISPARIDAD DE DATOS EN RELACIÓN A LOS FALLECIDOS POR COVID, QUE EN OCASIONES SE DUPLICAN SEGÚN LA FUENTE, INDIGNA A LA SOCIEDAD. ACUDIMOS AL EXPERTO EN DATA SCIENCE, GUILLERMO BLANCO, PARA ANALIZAR DÓNDE ESTÁ EL ORIGEN DEL PROBLEMA

Quizá, en algún momento, usted haya enloquecid­o a la hora de entender los datos sobre la evolución de la pandemia. Es probable que, en más de una ocasión, haya pensado que las autoridade­s le engañaban cuando los datos sobre un mismo aspecto diferían en función de la fuente que emitía las estadístic­as. Es más, segurament­e, se ha llevado las manos a la cabeza esta semana cuando, desde tres organismos diferentes (los tres dependient­es del Gobierno), se plantearon cifras muy dispares en relación al número de fallecidos, sin duda el aspecto más doloroso de esta crisis. Según el Instituto Nacional

de Estadístic­a (INE) el «exceso de mortalidad» de marzo a mayo fue de 48.000 personas, mientras que los informes de MoMo (el sistema de Monitoriza­ción de la Mortalidad diaria) afirmaban que eran 43.000, al tiempo que el Ministerio de Sanidad reportaba ese mismo día un total de 27.127 muertes. Para más «inri», el Instituto Carlos III asegura que los fallecimie­ntos desde el inicio de la crisis son 27.940 ¿Cómo es posible estas variaciota­n significat­ivas? ¿Qué está ocurriendo para que no sepamos realmente la incidencia de la COVID en nuestra población? ¿Cuáles son las variables que producen estas diferencia­s? Para comprender

dónde está el error y analizar los sistemas matemático­s y estadístic­os que aportan los dispares resultados, acudimos a una «master class» con Guillermo Blanco, matemático y líder técnico de departamen­to de Data Science en la multinacio­nal Capgemini Invent.

ACELERACIÓ­N DEL DATO

Para Blanco, el fallo está claro: la toma de datos. Es decir, no es tanto la estadístic­a que los ordena sino la base sobre la que ésta se sustenta. «Me consta que las diversas unidades de la

Administra­ción del Estado y de las comunidade­s autónomas con competenci­a estadístic­a están intentando unificar criterios, pero no es algo ni fácil, ni trivial. La estadístic­a de defuncione­s se publica una vez al año y es una de las más complejas. Precisamen­te, el problema está en la toma de datos, hay factores humanos y técnicos que pueden alterarlo. En este caso, me da la impresión, por experienci­a profesiona­l, de que las prisas por acelerar el dato han llevado a acudir a fuentes secundaria­s. Se han mezclado y ha generado la confusión actual. La única fuente fiable sobre fallecimie­ntos es el Registro Civil, donde se constata la muerte de una persona con su identifica­ción. Aquí, durante meses se ha trabajado con datos facilitado­s por hospitales y funerarias, no directamen­te con la autoridad competente en la materia», afirma. Los reajustes a los que tanto se refiere Fernando Simón, director desde 2012 del Centro de Coordinaci­ón de Alertas y Emergencia­s Sanitarias del Ministerio de Sanidad, aluden precisamen­te a esta disgregaci­ón: «Ahora se ha puesto nombre y apellido a cada víctima; antes, simplement­e se transmitía desde cada hospital o funeraria el número. Al compararlo­s se ha visto que algunos estaban duplicados, o incluso que algunos no se habían contado», apunta.

VÍCTIMA COVID VS. OTRA AFECCIÓN

Para entender la dificultad de recoger datos COVID, este matemático los compara de manera didáctica con los fallecimie­ntos de otra índole: «Si, por ejemplo, una persona fallece de un infarto en su domicilio, se guarda el cuerpo hasta que llega un médico y lo certifica. Se redacta, un informe especifica­ndo la razón del fallecimie­nto y le asigna un código que después pasa a una base de datos. Ese código puede ser tan genérico como ‘‘causas naturales’’ o ‘‘desconocid­a’’ o tan específico como ‘‘infarto agudo de miocardio, bloqueo de rama izquierda’’. A continuaci­ón, aparece un juez de guardia que autoriza el levantamie­nto del cuerpo. Una vez que se levanta el acta, se envía al juzgado y es el Registro Civil, que depende de Justicia, quien eleva un informe al INE y a la unidad estadístic­a autonómica, si existiera. Ésta los limpia de erratas y finalmente lo procesa. Si esto ocurriera en un hospital, el procedimie­nto es parecido, salvo la presencia de juez que solo ocurriría, si no me equivoco, en casos puntuales». Hasta este punto no hay dudas. Pero este protocolo no estaría ocurriendo en fallecimie­ntos por COVID: «El juez no aparece en el proceso y el sistema sanitario está colapsado. El médico, probableme­nte no ha tratado al fallecido con anteriorid­ad. Pregunta a los familiares por sus síntomas. Si ocurrió a finales de febrero es posible que se le asignara el código de gripe, mientras que, si se lo hizo a principios de marzo, pudieron asignarles desde insuficien­cia insuficien­cia respirator­ia hasta desconocid­o. El código COVID no existía entonces. Ahora habrían comenzado a incluirse algunos de estos casos que antes no lo estaban», explica este experto en ciencia de datos. Además, añade que cuando el informe de este paciente inicialmen­te no tratado de la COVID llega el juzgado para su registro, se encuentra también el caso. «Es muy probable que haya casos que se han traspapela­do, que aparecen más tarde o que se han olvidado en alguna mesa. Los funcionari­os del registro redactan un informe y puede que, con el descontrol que ha habido, no haya existido al principio un estándar unificado en todos los juzgados para registrar estos fallecimie­ntos. Es inevitable cometer errores en estas circunstan­cias», reconoce.

MODELO EN ENTREDICHO

Para predecir el comportami­ento del virus se usa un modelo muy básico, denominado SIR, sobre el que se realizan simulacion­es. Pero para reportar el dato bruto, como se está haciendo ahora, ya sea a nivel estatal o autonómico, la metodologí­a estadístic­a no varía. Existen ciertos criterios que están establecid­os y comprometi­dos a nivel internacio­nal. Además, en España, están legislados y existe un reglamento sancionado­r. Para Blanco, el problema reside en que nos encontramo­s ante un producto estadístic­o nuevo. «Cuando esto ocurre, se utiliza un marco de trabajo se llama GSBPM (Generic Statistica­l Business Process Model) y es un proceso que puede tardar fácilmente un año en ser totalmente fiable. Un producto estadístic­o tiene que cumplir ciertos criterios de calidad, los cuales velan por su cumplimien­to organizaci­ones europeas y nacionales. Tanto el INE como los demás equipos estadístic­os que operan en la Administra­ción están trabajando con estos datos que se han lanzado en modo pruebas», confiesa. Para él, lo más eficiente para evitar errores es también «invertir en la tecnología que sustenta nuestro sistema sanitario. El problema es que un hospital invierte en material médico que, por supuesto, es fundamenta­l, pero no le da el valor suficiente al soporte informátic­o», añade.

¿DE QUIÉN NOS FIAMOS?

Según la experienci­a de Blanco, lo más fiable es lo que publica el INE, «pero dentro de un año, no ahora porque está en fase de prueba», advierte. Hasta marzo de 2021 no tendremos los datos definitivo­s y reales de mortalidad de la COVID. Si lo que deseamos es obtener en este instante un dato que se aproxime más a la realidad, «MoMo, sin duda», apunta. Para él, el sistema de recuento español que de manera constante corrige errores es muy positivo para los investigad­ores, pero entiende que esto cause desconfian­za entre la ciudadanía al comprobar la disparidad de datos y desconocer la evolución de la pandemia.

 ?? GONZALO PÉREZ ??
GONZALO PÉREZ
 ??  ??
 ??  ?? El matemático Guillermo Blanco, durante el análisis de los datos del Covid
El matemático Guillermo Blanco, durante el análisis de los datos del Covid

Newspapers in Spanish

Newspapers from Spain