Centinaia di pubblicazioni scientifiche scritte da un’intelligenza artificiale «stupida»
Software che usano termini diversi da quelli riconosciuti permettono a certi “furbetti” di “riscrivere” articoli di altri, accreditandoli come propri e originali
Alcuni mesi fa il matematico Alexander Magazinov leggeva a tarda notte una rivista specializzata. «Cosa diavolo significano “colossal information”, “discourse acknowledgement” (tradotto letteralmente: riconoscimento del discorso) o “counterfeit consciousness” (coscienza contraffatta), mi chiedevo», dice il matematico che durante il giorno lavora come programmatore di software per il provider di servizi Internet Yandex. Dato che già da tempo smascherava contraffazioni, i suoi sospetti si risvegliarono e lesse quindi frase per frase le pubblicazioni in questione. Apparentemente, «colossal information» stava per «big data», «discourse acknowledgement» per «voice recognition» e «counterfeit consciousness» per «artificial intelligence». Ma perché gli autori avevano usato queste parole, a prima vista piuttosto divertenti, invece dei termini tecnici tradizionali?, si chiese Magazinov. Dopotutto, le pubblicazioni erano state stampate su riviste specializzate riconosciute, non su una rivista satirica. Ha quindi contattato gli informatici Cyril Labbé dell’Università di Grenoble e Guillaume Cabanac dell’Università di Tolosa, che altrettanto seguono da diversi anni le falsificazioni nelle pubblicazioni scientifiche. I tre sono stati quindi non solo in grado di ricostruire i veri termini tecnici. Ben presto fu loro chiaro come si fosse arrivati a questa situazione. «Si tratta di frasi in cui un software speciale, un cosiddetto spinbot, ha utilizzato parole diverse dai termini tecnici riconosciuti», spiega Labbé. Tale software, in parte accessibile gratuitamente su Internet, viene utilizzato da autori che desiderano scrivere una pubblicazione senza dover effettuare ricerche loro stessi. O, per dirla in altro modo, che vogliono contraffare senza alcuno sforzo.
Per mascherare la copiatura da pubblicazioni già disponibili su riviste specializzate, lo spinbot riformula leggermente una data frase e sostituisce i termini con sinonimi. Così, le somiglianze non sono troppo evidenti. Labbé lo illustra con il detto «The road to hell is paved with good intentions» (La strada per l’inferno è lastricata di buone intenzioni). Dopo un passaggio attraverso spinbot è diventato: «The way to damnation is cleared with well meaning goals» (La via della dannazione è spianata con obiettivi ben intenzionati). Nel linguaggio di tutti i giorni si può, con buona volontà, riconoscere il proverbio originale e si può pensare che lo stesso sia stato citato da un soggetto non di madre lingua. Ma nella scienza ciò è del tutto fuori luogo, sottolinea Cabanac. «Perché se voglio descrivere qualcosa in modo tecnicamente corretto ed essere riconosciuto dagli esperti, devo usare termini tecnici comuni - e a maggior ragione in una pubblicazione specializzata». «Tutto il resto è spazzatura», aggiunge Labbé. Tuttavia, la spazzatura è traditrice e mette i detective delle contraffazioni sulla giusta strada.
Oltre agli spinbot, ci sono anche altri metodi basati su software per coloro che vogliono creare testi senza sudore e diligenza, affermano i tre ricercatori. Alcuni programmi generano automaticamente interi passaggi o addirittura testi. Quattro riassunti già pubblicati danno vita a un quinto, tre introduzioni di altre pubblicazioni ne generano una quarta. Anche immagini, grafici e tabelle vengono rubati alla letteratura specializzata pubblicata, leggermente modificati con l’ausilio di Photoshop e presentati come nuovi dati. Magazinov stima che nel solo settore dell’informatica siano state pubblicate diverse migliaia di pubblicazioni contraffatte. Secondo un articolo della rivista «Nature», altri esperti temono dimensioni simili per le proprie aree di specializzazione. I falsi sono stati stampati in dozzine di riviste specializzate, tra cui quelle di note case editrici come Elsevier, Springer e Wiley. Solo quest’anno centinaia di persone hanno ricevuto degli avvertimenti dopo che i detective della contraffazione avevano presentato le loro scoperte sulla piattaforma pubpeer.com. Secondo l’articolo di «Nature», gli autori provenienti dalla Cina e dall’India in particolare si distinguono per un gran numero di articoli specializzati contraffatti o inventati. Ma, indipendentemente dal Paese di origine degli autori, la loro motivazione è sempre la stessa: è necessario un certo numero di pubblicazioni per ottenere un lavoro nella ricerca o per evitare di essere licenziati. «Publish or perish» (Pubblica o muori), lo si chiama nella comunità scientifica. Ma spesso rimane poco tempo per produrre seriamente le pubblicazioni richieste, ossia tramite un vero lavoro di ricerca. Se mancano i dati, ma si avvicina il termine del contratto a tempo determinato, allora vengono semplicemente inventati.
Anche gli editori ne beneficiano
Anche gli editori specializzati traggono beneficio dalle contraffazioni, dicono Magazinov, Cabanac e Labbé. Perché più articoli una rivista può mostrare, più spesso questi vengono citati e tanto maggiore sarà non solo la reputazione del ricercatore ma anche quella della rivista. E quindi, più abbonamenti e a prezzo più caro potranno essere venduti agli istituti di ricerca. Di conseguenza, non tutti gli editori cercano di arginare l’ondata di articoli contraffatti. Sarebbe possibile. Per questo, i manoscritti presentati dovrebbero essere esaminati attentamente in modo empirico o mediante un software investigativo. Ma spesso mancano soldi e tempo - e anche la volontà, dicono gli intervistati.
Pubblicare testi insensati o dati falsif icati, presentandoli come conoscenza scientifica, non è un reato banale, sottolinea Cabanac che ora sembra molto arrabbiato. «Questo distrugge la fiducia nella scienza. Ma costa anche tempo e denaro ai giovani ricercatori, per confutare i dati inventati. A volte la propria carriera è in pericolo, perché si sta cercando di verificare un’idea che non è stata riconosciuta come assurda, o di costruire su di essa». L’oncologa e detective della contraffazione Jennifer Byrne dell’Università di Sydney è convinta che le pubblicazioni completamente inventate o anche «solo» falsificate possano costare anche delle vite. In particolare, se vengono pubblicati dati sugli effetti di farmaci o procedure in una cellula malata e su di essi si sviluppano poi nuove terapie. * dalla NZZ del 01.09.2021 Traduzione di Eros Mellini