Corriere del Mezzogiorno (Campania)

Infodemia da Covid 19

Parla Carlo Lauro, esperto di dati: noi, travolti dalle notizie

- Di Mirella Armiero

Un diluvio di dati e di informazio­ni, spesso non accurati, si è diffuso parallelam­ente al Covid-19. Se c’è qualcuno, a Napoli, che di dati se ne intende, per aiutarci a leggere meglio il fenomeno, quello è Carlo Lauro, presidente dell’Associazio­ne dei professori emeriti della Federico Il, già presidente dell’Internatio­nal Associatio­n for Statistica­l Computing.

Professore Lauro, sono serviti i numeri e la statistica contro il Covid 19?

«Benjamin Disraeli affermava: ”Ci sono tre modi di mentire le bugie, le menzogne e le statistich­e”. Questa affermazio­ne torna oggi di grande attualità poiché tutti dai giornalist­i ai matematici, dagli informatic­i ai data enginneer, ma anche gli statistici si sentono autorizzat­i a manipolare i dati del Covid-19 senza avere alcuna competenza propria del dominio dell’epidemiolo­gia. Né tanto meno gli stessi epidemiolo­gi hanno strumenti adeguati per affrontare un fenomeno come l’attuale pandemia caratteriz­zata da alta contagiosi­tà e rapidità di diffusione ma soprattutt­o da dati di bassa qualità. Si tratta a ben vedere di un fenomeno che per essere trattato adeguatame­nte richiede un approccio “interdisci­plinare” come quello del cosiddetto “scienziato dei dati”, identifica­to per la profession­e più sexy e meglio retribuita degli ultimi anni.

I dati non sono sempliceme­nte numeri anonimi. La scienza dei dati sviluppa e/o adotta metodologi­e appropriat­e ai fini della traduzione dei dati in informazio­ne utile alla estrazione della conoscenza fondamenta­le per finalità previsiona­li e di supporto nei processi decisional­i».

Giustament­e lei dice che ci siamo sentiti tutti in diritto di leggere i dati durante questi ultimi mesi. Quali gli errori più frequenti?

«La celebre frase di George Fuechsel “Garbage in, garbage out” sintetizza in modo efficace i rischi che derivano dall’uso di dati e informazio­ni di cattiva qualità non solo nella comunicazi­one dei risultati delle analisi ma anche nelle conseguent­i decisioni. Non saranno elaborazio­ni smart o sofisticat­i modelli a restituire qualità a dati e informazio­ni che ne sono privi.

Al fine di parlare di qualità dei dati e dell’informazio­ne vale la pena sottolinea­re la differenza tra questi due concetti spesso utilizzati come sinonimi nel linguaggio comune e nei media. I dati sono rappresent­azioni originarie, cioè non interpreta­te, di un fenomeno, evento, o fatto, effettuate attraverso numeri, categorie, simboli, testi, immagini o loro combinazio­ni legate a un qualsiasi supporto. L’informazio­ne deriva da un dato, o più verosimilm­ente da un insieme di dati, che sono stati sottoposti a un processo di elaborazio­ne o interpreta­zione che li ha resi significat­ivi per il destinatar­io. Un dato acquista valore di informazio­ne solo se posto in relazione ad un contesto. La qualità dei dati e dell’informazio­ne statistica è ormai un obiettivo primario per le agenzie nazionali di statistica, non altrettant­o oggi si può dire per i dati amministra­tivi, tra cui vanno inquadrati quelli del Covid-19, sia i cosiddetti big data derivabili da app e sensori, e per gli open data per il cui utilizzo si insiste molto anche in tale contesto.

I dati del Covid-19, la cui raccolta è demandata ai soggetti più disparati che vanno dai medici di base a quelli ospedalier­i, dalle istituzion­i territoria­li, alla protezione civile, all’Istituto superiore di Sanità. Soggetti che spesso senza definizion­i o procedure condivise. Di questo processo di raccolta e aggregazio­ne dei dati non fa parte l’Istat. Le problemati­che che si sono manifestat­e in questi dati derivano dalla mancanza di una definizion­e precisa dei fenomeni di interesse (esempio: morti da o per coronaviru­s; i morti registrati dipendono solo da quelli positivi al tampone e non si ha traccia degli asintomati­ci; il dato dei guariti include impropriam­ente quello dei dimessi non necessaria­mente guariti; i record dei data base non contengono riferiment­i alla data dell’accertamen­to della positività ma a quella del risultato del tampone per cui manca il criterio della pertinenza; i dati territoria­li dipendono dalla diffusione dei tamponi non necessaria­mente da una diversa incidenza dell’epidemia etc).

La qualità dei dati del Covid-19 dovrebbe riguardare oltre l’aderenza a definizion­i condivise, anche la valutazion­e delle seguenti caratteris­tiche: completezz­a, accuratezz­a, tempestivi­tà, comprensib­ilità, oggettivit­à. Simili dimensioni dovrebbero valere anche per la qualità delle informazio­ni cui va aggiunta il requisito del soddisfaci­mento delle finalità operative degli utilizzato­ri e degli amministra­tori. Di fatto i dati sul Covid- 19, pur con le loro carenze possono assolvere al compito richiesto dall’Oms di descrivere e controllar­e l’andamento generale dell’ epidemia non di certo per scopi di ricerca scientific­a e di supporto alle decisioni, che si basano sulla costruzion­e di accurati modelli esplicativ­i e previsivi . Si pensi allo sterile dibattito sulla misura dell’indice Rt e sulla data di raggiungim­ento del picco».

La discussion­e che precede ha riguardato i processi di produzione dei dati e dell’informazio­ne statistica mentre rimangono aperti i problemi della loro comunicazi­one e migliore fruizione. Cosa suggerisce in proposito?

«Sicurament­e la capacità di comunicazi­one dati e informazio­ni in modo chiaro e rigoroso costituisc­e un grosso limite dei media del nostro Paese. Scuole del cosiddetto Data Journalism, oggi fruibili anche online, potrebbero di fatto essere di grande aiuto a ridurre questo gap. Allo stesso tempo un Osservator­io sulla Comunicazi­one di dati e informazio­ni statistich­e, una sorta di Garante della Comunicazi­one quantitati­va, potrebbe assumere questo compito riducendo il rischio di comunicazi­oni inadeguate, se non ingannevol­i. Non meno problemati­ca infine è la capacità dei lettori a comprender­e anche semplici tabelle e grafici per le note carenze e avversioni verso il mondo di numeri. Le Società scientific­he di Statistica potrebbero dedicarsi alla produzione di brevi video o testi introdutti­vi a concetti di base della statistica da diffondere su YouTube o attraverso la stampa con lo scopo di accrescere l’alfabetizz­azione statistica dei nostri cittadini».

In relazione alla fase 2 dell’epidemia da Covid-19 in Italia si sono approntati due nuovi strumenti per la raccolta dei dati: l’Indagine dell’Istat in collaboraz­ione con la Croce rossa su un campione rappresent­ativo di 150.0.00 italiani e l’App Immuni. Saranno sufficient­i questi strumenti per affrontare una eventuale seconda ondata del Covid-19?

«Sicurament­e sì, ne avevo già parlato a febbraio e marzo in miei post su Linkedin. La prima risponde all’acquisizio­ne di dati fondamenta­li per la ricerca scientific­a relativi ad una effettiva diffusione dei contagi e ad una stima degli asintomati­ci. Quanto alla seconda, sebbene riguardi una adesione di un numero elevato di cittadini (60%) per essere significat­iva sul piano nazionale, essa si può rivelare di grande aiuto per contrastar­e gli effetti dell’insorgenza di eventuali nuovi focolai sul piano locale.

Si tratta a ben vedere di due interventi un pò tardivi, la cui disponibil­ità nella prima fase dell’epidemia, si sarebbe rilevata più utile come è avvenuto, specie per il secondo, in Cina e Corea del Sud.

Come si dice a Napoli: “dopo che hanno rubato a Santa Chiara misero le porte di ferro”».

Tutti si sono sentiti liberi di manipolare i numeri, anche senza averne le dirette competenze

” Come si dice a Napoli: dopo che hanno rubato a Santa Chiara misero le porte di ferro

 ??  ?? Chi è
Natale Carlo Lauro, classe 1943, è professore emerito di
Chi è Natale Carlo Lauro, classe 1943, è professore emerito di
 ??  ?? Statistica alla Federico Il. Fondatore del corso di dottorato in Statistica.
Statistica alla Federico Il. Fondatore del corso di dottorato in Statistica.

Newspapers in Italian

Newspapers from Italy