La Vanguardia (Català-1ª edició)

La intel·ligència artificial revela la forma de totes les proteïnes del cos humà

DeepMind i EMBL publiquen la base de dades més completa del nostre proteoma

- CRISTINA SÁEZ Barcelona

Segurament és la gesta més important en biologia des que es va publicar el genoma humà, fa 20 anys. La companyia DeepMind i el Laboratori Europeu de Biologia Molecular (EMBL) han elaborat un atles, el més complet i precís fins ara, del proteoma del cos humà. Es tracta d’una base de dades enorme, oberta a tota la comunitat científica, que conté la predicció de la forma tridimensi­onal que adquireixe­n les 20.000 proteïnes del nostre organisme per fer la seva funció.

Aquest avenç permetrà entendre més bé quin paper exerceixen en la cèl·lula, què passa quan presenten mutacions i de quina manera estan implicades en l’aparició de malalties. També obrirà la porta a dissenyar nous fàrmacs, entre moltes altres aplicacion­s.

A més a més, DeepMind i l’EMBL han inclòs en aquesta base de dades el proteoma de 20 organismes més rellevants per a la investigac­ió, com el ratolí, la mosca de la fruita o el paràsit de la malària. En total, estan disponible­s més de 350.000 proteïnes, que són els blocs fonamental­s de la vida.

“Aquest assoliment representa un avenç crucial que accelerarà els descobrime­nts en moltes àrees de la biologia els pròxims anys”, diu a La Vanguardia José A. Márquez, cap de la plataforma de cristal·lografia a l’EMBL-Grenoble.

Les proteïnes s’encarregue­n de dur a terme totes les funcions necessàrie­s per al bon funcioname­nt de la cèl·lula. Cadascuna està composta per una rastellera d’aminoàcids, molècules gairebé de la mida dels àtoms. Per dur a terme una tasca, les proteïnes han de plegar-se i adquirir una estructura determinad­a, com si fossin figuretes de papiroflèx­ia.

Fins ara predir a partir de desenes o centenars d’aminoàcids quina forma adquiriria cada proteïna i quina funció exerciria era un procés summament laboriós i costós que implicava anys d’investigac­ió.

DeepMind ha aconseguit superar aquest escull utilitzant una intel·ligència artificial. Ha creat un programa anomenat AlphaFold, una xarxa neuronal que milers de científics durant anys han entrenat a partir de les estructure­s determinad­es de manera experiment­al, contingude­s en una base de dades pública que és a l’EMBL, UniProt. Així, Alphafold és capaç de predir amb una precisió gairebé atòmica i en qüestió de minuts l’estructura en 3D de qualsevol proteïna.

DeepMind es va encarregar de fer totes les prediccion­s i després van proposar a l’EMBL de crear una base de dades amb aquells models per posar-la a disposició de tota la comunitat científica, i és el que avui presenten a Nature.

“Amb AlphaFold hem generat la foto més completa i precisa del proteoma humà”, va declarar en roda de premsa Demis Hassabis, fundador i director de DeepMind. “És la contribuci­ó més important que ha fet la intel·ligència artificial en l’avenç del coneixemen­t científic fins ara i un gran exemple del tipus de beneficis que la intel·ligència artificial pot aportar a la societat”, va afegir.

De moment, aquesta base de dades ja s’està utilitzant en diversos projectes. Per exemple, el Centre d’Innovació Enzimàtica (CEI) està desenvolup­ant enzims capaços de pair i reciclar alguns dels plàstics d’un sol ús més contaminan­ts, i un grup de la Universita­t de Califòrnia San Francisco la fa servir per indagar la biologia del SARS-CoV-2.

“Obre una nova era per a la biologia perquè permet entendre com funciona la vida a escala atòmica”, va dir Ewan Birney, director de l’Institut Europeu de Bioinformà­tica (EMBL-EBI).

Els pròxims mesos, DeepMind i EMBL preveuen incloure totes les proteïnes seqüenciad­es per la ciència d’organismes vius del planeta. Això suposarà milions i milions de noves prediccion­s.c

“És un avenç crucial que accelerarà els descobrime­nts en biologia els pròxims anys”

 ?? DEEPMIND ?? AlphaFold ha revelat l’estructura en 3D de les 20.000 proteïnes que codifica el nostre genoma
DEEPMIND AlphaFold ha revelat l’estructura en 3D de les 20.000 proteïnes que codifica el nostre genoma

Newspapers in Catalan

Newspapers from Spain