La inteligencia artificial revela la forma de todas las proteínas del cuerpo humano
Deepmind y EMBL publican la base de datos más completa de nuestro proteoma
Es, seguramente, la hazaña más importante en biología desde la publicación del genoma humano hace 20 años. La compañía Deepmind y el Laboratorio Europeo de Biología Molecular (EMBL) han elaborado un atlas, el más completo y preciso hasta el momento, del proteoma del cuerpo humano. Se trata de una enorme base de datos, abierta a toda la comunidad científica, que contiene la predicción de la forma tridimensional que adquieren las 20.000 proteínas de nuestro organismo para realizar su función.
Este avance permitirá comprender mejor qué papel desempeñan en la célula; qué ocurre cuando presentan mutaciones y de qué forma están implicadas en la aparición de enfermedades; también abrirá la puerta a diseñar nuevos fármacos, entre muchas otras aplicaciones.
Además, Deepmind y el EMBL han incluido en esta base de datos el proteoma de otros 20 organismos relevantes para la investigación, como el ratón, la mosca de la fruta o el parásito de la malaria. En total, están disponibles más de 350.000 proteínas, que son los bloques fundamentales de la vida.
“Este logro representa un avance crucial que acelerará los descubrimientos en muchas áreas de la biología en los próximos años”, valora a La Vanguardia José A. Márquez, jefe de la plataforma de cristalografía en el Embl-grenoble.
Las proteínas se encargan de llevar a cabo todas las funciones necesarias para el buen funcionamiento de la célula. Cada una está compuesta por una ristra de aminoácidos, moléculas casi del tamaño de los átomos. Para llevar a cabo una tarea, las proteínas deben plegarse y adquirir una estructura determinada, como si fueran figuritas de origami.
Hasta el momento, predecir a partir de decenas o cientos de aminoácidos qué forma adquiriría cada proteína y qué función desempeñaría era un proceso sumamente laborioso y costoso que implicaba años de investigación.
Deepmind ha logrado superar ese escollo usando una inteligencia artificial. Ha creado un programa llamado Alphafold, una red neuronal que ha entrenado a partir de las estructuras determinadas de forma experimental durante años por miles de científicos, contenidas en una base de datos pública que está en el EMBL, Uniprot. Así, Alphafold es capaz de predecir con una precisión casi atómica y en cuestión de minutos la estructura en 3D de cualquier proteína.
Deepmind se encargó de realizar todas las predicciones y luego propusieron al EMBL crear una base de datos con esos modelos para ponerla a disposición de toda la comunidad científica y es lo que hoy presentan en Nature.
“Con Alphafold hemos generado la foto más completa y precisa del proteoma humano”, declaró en rueda de prensa Demis Hassabis, fundador y director de Deepmind. “Es la contribución más importante que ha hecho la inteligencia artificial en el avance del conocimiento científico hasta la fecha y un gran ejemplo del tipo de beneficios que la inteligencia artificial puede aportar a la sociedad”, añadió.
De momento, esta base de datos ya se está utilizando en diversos proyectos; por ejemplo, el Centro de Innovación Enzimática (CEI) está desarrollando enzimas capaces de digerir y reciclar algunos de los plásticos de uno solo uso más contaminantes; y un grupo de la Universidad de California San Francisco lo hace para indagar sobre la biología del SARSCOV-2.
“Abre una nueva era para la biología porque permite entender cómo funciona la vida a escala atómica”, dijo Ewan Birney, director del Instituto Europeo de Bioinformática (EMBL-EBI).
En los próximos meses, Deepmind y EMBL prevén incluir todas las proteínas secuenciadas por la ciencia de organismos vivos del planeta. Eso supondrá millones y millones de nuevas predicciones. •
“Es un avance crucial que acelerará los descubrimientos en biología en los próximos años”