APRENDE LA INTELIGENCIA ARTIFICIAL SOBRE LA VIDA
A partir de una gran cantidad de datos sobre genes y células, los modelos de IA han hecho algunos descubrimientos sorprendentes
Nueva York– En 1889, un médico francés llamado Francois-gilbert Viault bajó de una montaña de los Andes, se extrajo sangre del brazo y la analizó bajo el microscopio. Sus glóbulos rojos, los cuales se encargan de transportar oxígeno, habían aumentado 42 por ciento. Había descubierto que el cuerpo humano tenía un poder misterioso: cuando necesita tener más de estas células fundamentales, puede fabricarlas según las requiera.
A principios del siglo XX, los científicos plantearon la teoría de que la causa de ese fenómeno era una hormona. A esta hormona teórica la llamaron eritropoyetina, que significa “productora de glóbulos rojos” en griego. Siete décadas después, los investigadores descubrieron la verdadera eritropoyetina después de filtrar 2536 litros de orina.
Y cerca de 50 años después de eso, biólogos de Israel anunciaron que habían encontrado una célula renal poco común que fabrica esa hormona cuando el oxígeno desciende demasiado. La nombraron célula Norn en honor a las deidades nórdicas que, según se creía, controlan el destino de la humanidad.
Los seres humanos tardaron 134 años en descubrir las células Norn. El verano pasado, unas computadoras en California las descubrieron en solo seis semanas.
El descubrimiento ocurrió cuando los científicos de la Universidad de Stanford programaron las computadoras para que ellas mismas se enseñaran biología. Estas computadoras ejecutaban un programa de inteligencia artificial parecido al CHATGPT, el popular bot que ha llegado a manejar el lenguaje con fluidez después de haberse entrenado con miles de millones de textos obtenidos de internet. Pero los investigadores de esta universidad entrenaron sus computadoras con datos sin procesar acerca de millones de células reales y su composición química y genética.
Los investigadores no les dijeron a las computadoras lo que significaban estas mediciones; tampoco les explicaron que los diferentes tipos de células tienen distintos perfiles bioquímicos. No definieron, por ejemplo, qué células captan la luz en nuestros ojos, ni cuáles fabrican anticuerpos.
Las computadoras desentrañaron los datos por sí mismas y crearon un modelo de todas las células con base en el parecido de unas con otras en un espacio enorme y multidimensional. Cuando las máquinas terminaron, ya habían aprendido muchísimo. Pudieron clasificar una célula que nunca antes habían visto como una entre 1,000 tipos diferentes. Una de ellas fue la célula Norn.
“Eso es muy extraordinario porque nunca nadie le dijo al modelo que las células Norn estaban en el riñón”, comentó Jure Leskovec, un informático de la Universidad de Stanford que entrenó a las computadoras.
Este software es uno de los muchos programas nuevos impulsados por inteligencia artificial que se conocen como modelos fundacionales y que se están centrando en los aspectos fundamentales de la biología. Los modelos no solo están ordenando la información que los biólogos recaban, sino que están realizando descubrimientos sobre cómo funcionan los genes y cómo se desarrollan las células.
A medida que aumenten los modelos, con cada vez más datos de laboratorio y capacidad informática, los científicos prevén que comenzarán a realizar descubrimientos más profundos. Es posible que descubran secretos sobre el cáncer y otras enfermedades y podrían idear recetas para convertir un tipo de célula en otro. “Creo que en cierto momento veremos algún descubrimiento fundamental sobre la biología que, de otra manera, los biólogos no hubiesen realizado”, señaló Eric Topol, director del Scripps Research Translational Institute.
Qué tan lejos se llegará sigue siendo un tema de debate. Aunque algunas personas escépticas creen que los modelos llegarán a su tope, los científicos más optimistas piensan que los modelos fundacionales abordarán incluso la pregunta más grande de la biología: ¿Qué separa la vida de lo que no es vida?.
Las células cardiacas y las ratas topo
Desde hace mucho tiempo, los biólogos han querido entender la manera en que las diferentes células del cuerpo usan los genes para hacer muchas cosas que necesitamos con el fin de mantenernos vivos.
Hace aproximadamente una década, los investigadores comenzaron a realizar experimentos a escala industrial para buscar fragmentos genéticos procedentes de células individuales. Los científicos registraron lo que hallaron en catálogos o “atlas celulares”, los cuales se llenaron de miles de millones de datos.
Christina Theodoris, una médico residente en el Hospital Infantil de Boston, estaba leyendo acerca de un nuevo tipo de modelo de inteligencia artificial fabricado por los ingenieros de Google en 2017 para traducciones lingüísticas. Los investigadores alimentaron el modelo con millones de oraciones en inglés, junto con sus traducciones al alemán y al francés. El modelo desarrolló la capacidad de traducir oraciones que nunca antes había visto. Theodoris se preguntó si un modelo similar podría aprender a interpretar los datos de los atlas celulares.
En 2021, no podía encontrar un laboratorio que le permitiera tratar de construir uno. “Había mucho escepticismo acerca de que este método funcionara”, comentó.
Shirley Liu, una bióloga computacional en el Instituto para el Cáncer Dana-farber en Boston, le dio una oportunidad. Theodoris extrajo datos de 106 estudios en seres humanos que habían sido publicados, los que, en su conjunto, incluían 30 millones de células e introdujo todo en un programa llamado Geneformer. El modelo alcanzó un conocimiento profundo de la manera en que se comportan nuestros genes en las diferentes células. Por ejemplo, predijo que apagar un gen llamado TEAD4 en un cierto tipo de célula cardiaca la afectaría de manera considerable. Cuando su equipo puso a prueba esta predicción en células reales llamadas cardiomiocitos, la pulsación de las células cardiacas se debilitó.
En otra prueba, Theodoris y sus colegas le mostraron a Geneformer células del corazón tanto de personas con ritmos cardiacos deficientes como de personas sanas. “Luego le pedimos que nos dijera qué modificaciones hay que hacerles a las células enfermas para poder sanarlas”, explicó Theodoris, quien ahora trabaja en la Universidad de California, campus San Francisco.
Geneformer recomendó disminuir la actividad de cuatro genes que nunca antes se habían asociado con cardiopatías. El equipo de Theodoris siguió el consejo del modelo y eliminó cada uno de los cuatro genes. En dos de los cuatro casos, el tratamiento mejoró cómo las células se contraían.
El equipo de la Universidad de Stanford entró al negocio de los modelos fundacionales después de ayudar a construir una de las bases de datos de células más grandes del mundo, conocida como Cellxgene. Desde el mes de agosto, los investigadores entrenaron a sus computadoras con 33 millones de células de esa base de datos y se concentraron en un tipo de información genética llamada ARN mensajero. También alimentaron el modelo con estructuras tridimensionales de proteínas, que son el producto de los genes.
Creo que en cierto momento veremos algún descubrimiento fundamental sobre la biología que, de otra manera, los biólogos no hubiesen realizado”
Eric Topol
Director del Scripps
Research Translational Institute