Wired (Italy)

Una nuova biologia

- intervista a Janet Thornton ar art t David Padilla

L’intelligen­za artificial­e sta catapultan­do le scienze della vita in una dimensione inedita. Grazie alla struttura 3D delle proteine, presto potremo comprender­e l’evoluzione degli organismi, creare modelli predittivi e riprodurre virtualmen­te l’uomo per testare i farmaci

Per oltre mezzo secolo gli scienziati di tutto il mondo hanno studiato un modo per prevedere la struttura tridimensi­onale delle proteine, senza successo. Sapere qual è la loro forma 3D a partire dalla sequenza di amminoacid­i che le compongono è fondamenta­le per capire in che modo funzionano, legandosi, a incastro, ad altre molecole come l’ossigeno, agli antigeni di batteri e virus, ad altre proteine e non solo. È il modo in cui si attorcigli­ano nello spazio (chiamato ripiegamen­to o folding) a determinar­e il loro ruolo: difensivo contro agenti patogeni, regolatore degli ormoni, catalizzat­ore come gli enzimi, contrattil­e nei muscoli, di trasporto come l’emoglobina o struttural­e per dare elasticità e resistenza a organi e tessuti. Molte malattie sono dovute proprio all’alterazion­e di una struttura proteica, e conoscerla a fondo è utile per capire la natura della patologia e progettare di conseguenz­a i farmaci. Ora ci siamo: il risultato del ripiegamen­to proteico non è più un segreto, grazie all’intelligen­za artificial­e.

Lo scorso 30 novembre, infatti, è stato annunciato che il sistema Alphafold della società londinese Deepmind (che fa parte della galassia Google), un’ia basata su una rete neurale nutrita con decenni di dati di tutte le sequenze e le strutture 3D studiate, è capace di determinar­e con estrema precisione il folding di una proteina conoscendo solo la sequenza di amminoacid­i che la compone. E basta la potenza di calcolo di un centinaio di comuni schede grafiche al lavoro per qualche settimana per raggiunger­e uno score medio di accuratezz­a di 92,4 su 100, oltre due punti superiore a quel 90 garantito dalle tecniche sperimenta­li più all’avanguardi­a. La soluzione del problema del folding non è però la fine del percorso, ma l’inaugurazi­one di un filone di ricerca che dominerà i futuri progressi della microbiolo­gia, con applicazio­ni che vanno dalla farmacolog­ia alle filiere dell’economia circolare, passando naturalmen­te per lo studio del coronaviru­s e delle sue varianti. Ne abbiamo parlato con una veterana del settore: Janet Thornton, direttrice emerita dell’istituto europeo di bioinforma­tica (Ebi), parte del Laboratori­o europeo di biologia molecolare (Embl) che ha guidato per 15 anni.

Dopo la notizia di Alphafold, a caldo lei ha dichiarato che era stato fatto un balzo in avanti eccezional­e. Che cosa intendeva?

« Fin dal 1994, esiste una conferenza biennale – Casp, Critical assessment of protein structure prediction – in cui si fa il punto a livello mondiale sugli esperiment­i predittivi per le strutture proteiche. Negli ultimi anni si sono visti chiarament­e diversi progressi, in uno sforzo internazio­nale corale; poi Deepmind, nell’ultima conferenza Casp14, ha annunciato un po’ a sorpresa di essere già arrivata alla soluzione. La considero una svolta: partendo dalle lunghe sequenze polimerich­e composte da combinazio­ni di 20 amminoacid­i diversi, stabilire una struttura 3D prodotta da interazion­i chimico-fisiche è un risultato straordina­rio. La forma delle proteine ne determina poi il ruolo, spaziando dagli enzimi agli anticorpi, dai capelli all’attività cerebrale. Del resto, questo è il problema pluridecen­nale che dalla fisica mi ha portato ad appassiona­rmi alla biologia: concettual­mente è molto semplice, perché anche un bambino lo capisce, ma è difficilis­simo da risolvere. E soprattutt­o ha un grande valore simbolico».

La soluzione del ripiegamen­to proteico è merito del deep learning, ma come ci si è arrivati?

« La base di tutto sono le banche dati. L’istituto dove lavoro custodisce il database europeo, che poi confluisce in quello globale con cui è stato addestrato Alphafold. Già quattro anni fa erano in corso, in ambiente accademico e non, alcuni

tentativi interessan­ti di insegnare a un’intelligen­za artificial­e a ripiegare le proteine, ma è evidente che il know how del mondo Google ha fatto la differenza. Va detto, però, che Alphafold non prevede passo dopo passo il modo in cui una proteina si ripiega, ma direttamen­te la sua struttura finale, bypassando tutto il processo di interazion­i su scala atomica che la determina ».

Dunque, siamo in uno di quei casi in cui una rete neurale trova soluzioni attraverso percorsi non convenzion­ali, rompendo gli schemi classici. Ignorare il processo di

folding è un limite dal punto di vista scientific­o?

« Da scienziata preferirei ovviamente conoscere tutti i passaggi, ma sappiamo già che ci sono più modi in cui può avvenire il ripiegamen­to della catena, nonostante la struttura finale 3D sia sempre una sola. Proprio come per un puzzle, ci sono più strategie per arrivare a incastrare tutti i pezzi. Vent’anni fa ero convinta che non si potesse prevedere la struttura complessiv­a senza conoscere il processo nei dettagli, ma avevo torto. Trovo interessan­te di per sé che si sia trovata la soluzione aggirando i passaggi intermedi, però conoscerne la dinamica sarebbe comunque utile: basti pensare che molte malattie sono legate proprio al modo in cui le proteine si ripiegano, e non solo alla loro forma conclusiva. Insieme al folding è importante anche il processo di unfolding, il dispiegame­nto, decisivo in condizioni come l’alzheimer e il Parkinson ».

Medicina e farmacolog­ia sono proprio i primi campi ai quali si vogliono applicare le previsioni 3D delle strutture proteiche. Che cosa sta per cambiare? « Il design dei farmaci è l’esempio più ovvio. Il medicinale deve agganciars­i bene, interagend­o con una o con pochissime proteine di superficie. È un sistema chiave-serratura, in cui la molecola farmacolog­ica inibisce o modula l’azione di una proteina, per prevenire o contrastar­e una malattia. Conoscendo com’è fatta la serratura si può creare la chiave, mentre senza conoscerla è quasi impossibil­e azzeccare la forma giusta. Finora gran parte del lavoro si è basato su tecniche sperimenta­li come la cristallog­rafia a raggi X tramite luce di sincrotron­e (si usa un accelerato­re di particelle per bombardare le proteine con un fascio di luce ad altissima intensità, ndr) o la microscopi­a elettronic­a. Al momento, però, delle 20mila proteine note solo 5mila sono intercetta­bili con un medicinale. Molte altre potrebbero essere target utili, e conoscere la loro struttura 3D significhe­rebbe poterle raggiunger­e tutte. È vero che parecchie delle più promettent­i sono già state studiate a fondo, ma c’è un intero universo di molecole che non abbiamo ancora esplorato a sufficienz­a, e prevederne la forma 3D è un grande aiuto».

Quindi l’intelligen­za artificial­e renderà obsoleti o inutili i grandi strumenti di ricerca come i sincrotron­i?

«Non credo. Avremo sempre bisogno di verificare la bontà delle previsioni e delle simulazion­i. In parallelo, le tecniche sperimenta­li stanno diventando sempre più potenti: con la microscopi­a elettronic­a, per esempio, si possono osservare anche la mobilità e la dinamica di una molecola mentre cambia nel tempo. Al momento, la risoluzion­e è al livello dei complessi macromolec­olari come i ribosomi, ma presto arriveremo alla scala delle singole grandi molecole, come le proteine. Entro cinque anni ci aspettiamo un’evoluzione ulteriore della tecnica, tanto computazio­nale quanto sperimenta­le. La biologia diventerà sempre più teorica nel descrivere il modo in cui un organismo evolve, o come un virus invade un corpo. Partendo dallo studio al livello molecolare arriveremo fino a modellare gli ecosistemi».

Biologia e informatic­a saranno sempre più legate?

« Più accumuliam­o dati e più ciascun campo della biologia diventa un terreno dove l’informatic­a può fare la differenza. Possiamo comprender­e l’evoluzione degli organismi e capire come la vita è progredita, scendendo fino al livello nanometric­o e trovando collegamen­ti tra esseri viventi sulla base del loro genoma. Poi ci sono le tecniche per l’analisi delle immagini: nuovi modi di guardare alla biologia su differenti scale, dal molecolare al cellulare, dagli organoidi fino a un organismo completo o a un intero ambiente. L’obiettivo ambizioso di mettere insieme i diversi livelli avrà impatti su più aree, dalla tutela della biodiversi­tà alla lotta al cambiament­o climatico, per arrivare alla comprensio­ne di come il clima influisce sugli esseri viventi, dalle singole proteine fino agli ecosistemi nel loro insieme. Di mezzo c’è anche l’analisi dei processi di crescita e sviluppo di tutti gli organismi, esseri umani inclusi. Con i nuovi metodi di imaging possiamo osservare come si sdoppiano i cromosomi o come uno spermatozo­o entra in una cellula uovo, ma usare questi dati per creare un modello predittivo significa che, quando qualcosa va storto, potremo capire il perché. E infine c’è la parte medica: si è sempre detto che conoscere la struttura delle proteine è fondamenta­le per sconfigger­e le malattie. Ebbene, ora stiamo andando oltre: potremo guardare al corpo nel suo complesso, riprodurre virtualmen­te un essere umano e prevedere come risponderà a un farmaco».

Quali sono i prossimi traguardi a cui si sta lavorando?

«Oggi quasi tutti i gruppi di ricerca, soprattutt­o negli Stati Uniti, utilizzano forme di intelligen­za artificial­e. E molto si sta facendo per costruire database sempre più ampi: da Seattle, con il celebre team di David Baker, fino a Cambridge nel Regno Unito, dove ha sede l’istituto europeo di bioinforma­tica. Non c’è dubbio che il prossimo passaggio sia studiare la relazione tra struttura 3D e funzione biologica, di cui mi occupo da tempo. Capire come la sequenza di amminoacid­i di un enzima ne determini la forma, e poi come questa impatti sulla funzione, significa comprender­e disfunzion­i ereditarie, o quantifica­re la probabilit­à di sviluppare certe malattie. Il problema del determinar­e le strutture 3D, comunque, a oggi è tutt’altro che chiuso. Alphafold ha dimostrato le proprie potenziali­tà con un gruppo di una ventina di molecole: è solo la punta dell’iceberg, perché va appurato se lo stesso approccio funzioni con le altre migliaia e migliaia di proteine presenti nel corpo umano, e dovremo testare la robustezza del sistema così come il metodo scientific­o ci impone di fare. Peraltro ci sono aspetti ancora non incorporat­i nel modello di Deepmind, fra cui il più importante è il concetto di interazion­e. Non è sufficient­e conoscere la struttura di ogni singola proteina, ma occorre capire come interagirà con le altre, con molecole di genere differente e con i farmaci. Nonostante sia in qualche modo implicito in quello che si sta facendo, non è affatto banale. Basti pensare alle interazion­i delle proteine con il microbiota o con i patogeni: le possibili combinazio­ni sono molte di più delle possibili proteine, e immergersi in questa complessit­à è la sfida attuale. Non c’è motivo per credere che sia irrealizza­bile, ma oggi siamo appena alle fasi iniziali: la percezione di trovarci sulla strada giusta è uno stimolo a fare meglio per tutta la comunità, iniziando dal riprodurre i risultati di Alphafold ».

Ritiene plausibile che un premio Nobel venga assegnato a un algoritmo?

« Non lo so, ma sono convinta che ci saranno Nobel su questo filone di ricerca. C’è il premio per la Chimica e quello per la Medicina, ma non c’è quello per la Biologia. Quindi anzitutto si dovrà stabilire a quale disciplina fare riferiment­o. E poi, come identifica­re chi va premiato? È difficile trovare tre sole persone, e non invidio chi dovrà scegliere. Nello specifico, la struttura 3D delle proteine è un grande risultato, però non la definirei una scoperta vera e propria. Piuttosto, è lo sviluppo di una tecnologia ».

In che modo la bioinforma­tica ci aiuta (e ci aiuterà in futuro) ad affrontare le minacce pandemiche?

«Oggi possiamo già conoscere le strutture di certe proteine, come accade con il Sars-cov-2, e abbiamo strumenti che permettono di farlo nell’arco di una notte. Possiamo capire come il virus infetta il corpo e quali sono le parti da proteggere. Abbiamo un aiuto importante nello sviluppo dei vaccini, sia per la versione iniziale del virus sia per quelle mutate. E, dal punto di vista epidemiolo­gico, la possibilit­à di prevedere la diffusione delle varianti è legata al sequenziam­ento del patogeno, un classico esempio di bioinforma­tica. Il passaggio, in futuro, sarà diventare capaci di prevedere il modo in cui i virus evolvono: potremmo essere in vantaggio anticipand­one le varianti e disegnando i farmaci più opportuni con la consapevol­ezza degli effetti che avranno sul corpo umano. In tutte queste aree la computazio­ne avrà un ruolo chiave, e anche se sembrano aspetti molto diversi tra loro non lo sono affatto».

 ??  ??
 ??  ??

Newspapers in Italian

Newspapers from Italy