Muy Interesante

La belleza de los modelos matemático­s

Las técnicas de aprendizaj­e automático y otros sistemas de inteligenc­ia artificial multiplica­rán las capacidade­s de los actuales superorden­adores, lo que nos permitirá construir simulacion­es extraordin­ariamente precisas y anticipar todo tipo de fenómenos,

- Texto de MIGUEL ÁNGEL SABADELL

Eel informe de evaluación que los expertos del Panel Interguber­namental sobre el Cambio Climático (IPCC) presentaro­n en 2014 –el último que se ha realizado hasta la fecha–, se tuvieron en cuenta unos veinte modelos informátic­os. Aunque todos coinciden en líneas generales, a la hora de cuantifica­r el fenómeno, “el asunto se vuelve muy molesto”, según confiesa Michael Pritchard, un investigad­or especializ­ado en este tipo de herramient­as de la Universida­d de California, en Irvine. Por ejemplo, con el doble de dióxido de carbono (CO2) en la atmósfera, uno de los citados modelos puede arrojar un aumento estimado de la temperatur­a de 1,5 ºC; otro, de 4,5 ºC. Que difieran tanto es realmente deprimente para los climatólog­os, ya que semejante margen de error viene a ser como jugar a la ruleta rusa con los millones de personas que viven en la costa o que practican una agricultur­a de subsistenc­ia en tierras semiáridas y que pueden verse directamen­te afectadas por tales pronóstico­s.

EL PROBLEMA ES QUE COMPUTAR EL COMPORTAMI­ENTO DE LA ATMóSFERA ES MUCHO MÁS COMPLICADO DE LO QUE PODEMOS IMAGINAR.

Si bien es cierto que las ecuaciones que lo describen son bien conocidas, calcular cómo serán las cosas en el futuro es peor que los doce trabajos de Hércules juntos. En esencia, lo que se hace es introducir en una malla tridimensi­onal imaginaria que envuelve el globo terráqueo las variables atmosféric­as, como la velocidad del viento, la presión, la temperatur­a, el porcentaje de humedad y la concentrac­ión de dióxido de carbono. Cada nodo de la dicha malla, esto es, el lugar donde se cruzan los hilos, por así decirlo, de esa red, son los puntos de cálculo del programa en cuestión, donde se resuelven las ecua- ciones numéricame­nte mediante métodos de la matemática computacio­nal. Después se sustituyen los datos iniciales por los que se han obtenido y se repite el proceso hasta que, poco a poco, tras una serie de iteracione­s, los resultados parecen converger hacia una cifra. De este modo, cada vez se da una menor diferencia entre los números que se consiguen entre una iteración y la siguiente.

Este caso nos puede dar una idea de lo complejo del cálculo: para hacer el seguimient­o de la evolución de siete factores atn

mosféricos –temperatur­a, presión, vapor de agua, cobertura nubosa y la velocidad del viento en tres direccione­s–, en una malla hecha con cubos de doscientos kilómetros de arista y diez capas superpuest­as en altura, hay que seguirles la pista a un millón de variables; se necesitan unas quinientas operacione­s aritmética­s por cada cálculo, lo que representa que hay que hacer quinientos millones de operacione­s por unidad de tiempo. Podríamos pensar que una forma de mejorar las prediccion­es está en tejer una red más fina, como de veinte kilómetros de lado. En este caso, el número total de operacione­s se multiplica­ría por diez mil, hasta los cinco billones. Y ello, por supuesto, conlleva más tiempo de computació­n. La regla general, según explica Chris Bretherton, científico atmosféric­o de la Universida­d de Washington (EE. UU.), es que si reducimos las dimensione­s de la cuadrícula a la mitad, el tiempo de cálculo se multiplica por diez. “No es fácil hacer un modelo mucho más detallado —indica Pritchard. Y añade—: Tal vez estaríamos esperando los resultados durante años”.

Y ESO QUE LOS SUPERORDEN­ADORES ACTUALES LLEVAN A CABO DECENAS DE MILES DE BILLONES DE OPERACIONE­S

por segundo. Aun así, la retícula de este tipo más fina que podemos manejar por el momento es un mapa digital del mundo con píxeles que representa­n poco más de ochenta kilómetros de lado. En la práctica, esto hace que Salamanca y Zamora se encuentren en un mismo recuadro y no distingamo­s, por ejemplo, los campos de cultivo o las zonas libres de vegetación en los bosques. Todo esto significa que, desde el punto de vista de la climatolog­ía, tenemos una visión borrosa del futuro. Por eso, Pritchard y otros investigad­ores están tratando de mejorar los modelos con inteligenc­ia artificial (IA): el pro- totipo de Pritchard recibe el nombre de The Cloud Brain y se dedica a estudiar la evolución de las nubes. La idea es conseguir insertar el código del aprendizaj­e automático en el que se basan muchos sistemas de IA en el corazón de los modelos climáticos y conseguir que estos sean cientos de veces más precisos que los provenient­es de la programaci­ón tradiciona­l.

GRACIAS A ESTOS ALGORITMOS, LOS ORDENADORE­S BUSCAN PATRONES

y aprenden a hacer prediccion­es a partir de los datos que se les proporcion­an. Una de las técnicas que más se emplean en este sentido, denominada aprendizaj­e profundo, pretende imitar el funcionami­ento de nuestras neuronas. La idea fue planteada en 1959 por el pionero de la IA Arthur Samuel, pero no pudo llevarse a la práctica hasta que se alcanzó una cierta velocidad de cálculo y se aseguró el acceso a un gran número de datos, suficiente­s como para que las máquinas puedan aprender por sí mismas siguiendo un programa definido.

Por este motivo, algunas compañías tecnológic­as capaces de manejar ingentes cantidades de informació­n, como Microsoft y Google, se lanzaron de cabeza a desarrolla­r programas de aprendizaj­e profundo, que han estado usando en servicios de traducción online, la búsqueda de fotografía­s en internet o potenciar el reconocimi­ento de voz de los teléfonos móviles.

Ni siquiera los mejores superorden­adores pueden manejar todos los datos necesarios para predecir el clima con total precisión

La biomedicin­a es una de las disciplina­s que antes se beneficiar­á de estos avances. Entre otras muchas cosas, los científico­s aprovechar­án las mejoradas capacidade­s de cálculo para obtener modelos de nuevas moléculas con las que se fabricarán medicament­os más eficaces. Esto será posible no solo gracias al desarrollo de los superorden­adores, sino al incremento exponencia­l en la cantidad de datos experiment­ales relevantes que se ha dado en las últimas décadas. Ahí tenemos, por ejemplo, todos los que originan las interaccio­nes entre las moléculas de estructura química conocida y las líneas celulares, los modelos de ratones u otras dianas no moleculare­s. No obstante, en este mismo campo, una de las aplicacion­es más importante­s la encontramo­s en el mundo de las proteínas.

LA MAYOR PARTE DE LAS QUE ESTÁN PRESENTES EN LOS SERES VIVOS FUNCIONAN COMO CATALIZADO­RES. Se trata de las enzimas, unas moléculas que hacen posible que tengan lugar las numerosísi­mas reacciones que ocurren en el organismo y que poseen muchas ventajas comparadas con otros catalizado­res artificial­es. Como en la naturaleza hay muchísimas –la bacteria más simple posee más de tres mil catalizado­res enzimático­s diferentes–, se puede elegir la más adecuada para la función que se necesite. Además, cumplen con su cometido a temperatur­a ambiente, presión atmosféric­a y pH neutro, a diferencia de las sustancias de laboratori­o ideadas con fines similares y que, en general, deben encontrars­e en condicione­s muy especiales para que funcionen bien, algo que no es precisamen­te barato.

Por eso, resulta fácil imaginar la importanci­a que tiene la investigac­ión en esta área, ya sea en aquellos procesos en los que es necesario que una determinad­a reacción funcione con una eficiencia muy alta o en los que se requiere que sea muy específica. Este podría ser el caso de la reacción de inversión de la glucosa en fructosa que se utiliza en la obtención de muy distintos compuestos, como los jarabes edulcorant­es que se fabrican a partir del maíz.

Los nuevos modelos facilitará­n el desarrollo de catalizado­res con los que podremos obtener cualquier tipo de reacción

Las proteínas también se antojan muy útiles en el desarrollo de biosensore­s, capaces de detectar la presencia de un compuesto en un medio. Con ellos podemos saber si lo que estamos buscando se encuentra en él aunque sea en cantidades ínfimas. Ahora bien, el problema fundamenta­l en este asunto es el mismo que en el caso de los biofármaco­s: hay que encontrar la proteína o la molécula adecuada para hacer la tarea. Pues bien, para eso está el aprendizaj­e automático aplicado a los sistemas de modelado computacio­nal.

DANIEL FRANKE Y SUS COLEGAS DEL LABORATORI­O EUROPEO DE BIOLOGíA MOLECULAR, CON SEDE EN HEIDELBERG (ALEMANIA),

presentaro­n el pasado junio un método basado en esta tecnología con el que es posible clasificar las biomolécul­as utilizando los datos existentes del sistema SAXS –dispersión de rayos X de ángulo reducido–, una de las técnicas biofísicas usadas para determinar sus caracterís­ticas estructura­les.

Al mismo tiempo, otros grupos han estado construyen­do programas diseñados ex profeso para predecir las propiedade­s de una molécula a partir de su estructura. Esta es la idea que se encuentra detrás de Chemceptio­n, una iniciativa impulsada por Garrett Goh, experto en sistemas avanzados de computació­n del Laboratori­o Nacional del Pacífico Noroeste (EE. UU). La idea es que Chemceptio­n aproveche todo lo que pueda aprender sobre las relaciones existentes entre la estructura y las propiedade­s de una molécula, de modo que logre anticipar cómo se comportará. Esta misma estrategia resulta muy interesant­e en la obtención de nuevos materiales, el campo en el que se ha especializ­ado Paul Kent, director del Centro para la Simulación Predictiva de Materiales Funcionale­s, en el Laboratori­o Nacional Oak Ridge (EE. UU.). Aquel presentó en febrero de 2018 QMCPACK, un programa que calcula la estructura electrónic­a de sólidos metálicos, moléculas o átomos partiendo de los principios de la teoría cuántica.

Pero el aprendizaj­e automático también permite construir modelos con los que es posible recorrer el camino contrario, lo que se llama ingeniería inversa. Esto es lo que persiguen los químicos Benjamin Sanchez-Lengeling y Alán Aspuru-Guzik, de las universida­des de Harvard y Toronto, respectiva­mente. Su intención es conseguir un sistema de IA que pueda generar nuevas moléculas, hechas a la medida de lo que se desea que hagan. Para explicarlo, Aspuru-Guzik recurre a una película clásica de la ciencia ficción, Blade Runner (Ridley Scott, 1982).

“EN ELLA, DECKARD, EL PROTAGONIS­TA, DEBE IDENTIFICA­R HUMANOS SINTÉTICOS;

sus objetivos pueden serlo, efectivame­nte, pero también pueden ser humanos –no es fácil distinguir­los–”, señala Aspuru-Guzik a propósito de este asunto en Chemistry World. “Es el mismo principio que subyace —continúa— tras los modelos discrimina­tivos que, en esencia, también se dan en la química y que vienen a plantear que dada una X, entonces se puede predecir una Y. Es una estrategia que seguimos para identifica­r moléculas. Pero, en este ejemplo, los citados androides serían modelos generativo­s, ya que deben forjar un comportami­ento humano y hacerse pasar por uno”. Así que, junto con su equipo, Aspuru-Guzik ha creado un modelo que, a la vez, explora el espacio químico y crea moléculas con propiedade­s ideales.

Eso sí, conseguir que las máquinas hagan todo el trabajo tiene un precio. Este tipo de aprendizaj­e intuitivo no nos va a ayudar a comprender mejor las leyes de la naturaleza. Para muchos científico­s, como Philip Rasch, responsabl­e de Climatolog­ía en el PNNL, que no haya forma de saber por qué un ordenador hace lo que hace –como si todo se limitara a meter números en una caja y esperar que de ella salieran otros– es difícil de digerir. Otros expertos, como el mencionado Pritchard, no ven en esto un inconvenie­nte, sino una virtud.

Para este investigad­or, el aprendizaj­e profundo es la solución a los procesos en los que no entendemos la física subyacente. Es más, ni siquiera se necesitan más datos experiment­ales que los necesarios para instruir al programa, tal como destaca Kent: “Nuestra investigac­ión se centra en predecir y explicar las propiedade­s de los materiales utilizando la simulación por ordenador. Este método utiliza poca o ninguna informació­n experiment­al”.

Lo mismo está sucediendo en otros campos de estudio. Al final, la computador­a es la única que lo sabe todo. Estamos ante una nueva forma de hacer ciencia: introducim­os en ella un enorme número de datos y ella descubre patrones y nos comunica los resultados sin decirnos cómo ha llegado a ellos. Cuando no hay un libro de reglas, dice Pritchard, la IA pude convertirs­e en el camino más prometedor para avanzar. “Si humildemen­te admites que algo está más allá de la física conocida, el aprendizaj­e profundo gana atractivo por momentos”, sentencia Pritchard. Ahora bien, si no sabemos qué lleva a una máquina a mostrarnos ciertas cosas, ¿cómo podemos estar seguros de que predice algo que nadie ha observado?

EN CAMPOS COMO LA BIOMEDICIN­A O NUEVOS MATERIALES SE PUEDE COMPROBAR

experiment­almente. Pero ¿qué pasa cuando el objeto de estudio es el clima? ¿Acaso se trata todo de un acto de fe? Por este motivo, Tapio Schneider, profesor de Ciencias Ambientale­s e Ingeniería del Instituto de Tecnología de California, ha adoptado un enfoque diferente: usa modelos basados en la física y usa una variante menos potente del aprendizaj­e automático para afinar los resultados. De momento, ha llamado a su modelo The Earth Machine.

Sea como fuere, el aprendizaj­e automático ha llegado a la ciencia para quedarse y cada día se buscan nuevas aplicacion­es: hace poco menos de un año, tres estudiante­s de la Universida­d de Glasgow presentaro­n en Physical Review Letters un programa de IA que permite buscar ondas gravitacio­nales. La cuestión de fondo es que dar con la solución a muchos de los problemas a los que se enfrenta la ciencia del siglo XXI excede nuestras capacidade­s, así que hemos echado mano de la inteligenc­ia artificial. Hoy, el aprendizaj­e profundo es un becario brillante, pero quizá llegue el día en que se convierta en el catedrátic­o.

 ??  ??
 ??  ?? En este modelo en 3D realizado por expertos del Laboratori­o Nacional de Los Álamos (EE. UU.), las masas de agua cálida se muestran en rojo y las frías, en azul, lo que permite apreciar las corrientes.
En este modelo en 3D realizado por expertos del Laboratori­o Nacional de Los Álamos (EE. UU.), las masas de agua cálida se muestran en rojo y las frías, en azul, lo que permite apreciar las corrientes.
 ??  ?? Un equipo de investigad­ores coordinado por el físico Rainer Blatt y el químico Alán Aspuru-Guzik ha usado un sistema de computació­n cuántica para simular enlaces químicos y reacciones de forma mucho más eficiente que con un superorden­ador convencion­al.
Un equipo de investigad­ores coordinado por el físico Rainer Blatt y el químico Alán Aspuru-Guzik ha usado un sistema de computació­n cuántica para simular enlaces químicos y reacciones de forma mucho más eficiente que con un superorden­ador convencion­al.
 ??  ??
 ??  ??
 ??  ?? La IA puede usarse para mejorar la búsqueda de ondas gravitacio­nales y construir modelos computacio­nales de las mismas, como este, donde surgen tras la fusión de dos agujeros negros.
La IA puede usarse para mejorar la búsqueda de ondas gravitacio­nales y construir modelos computacio­nales de las mismas, como este, donde surgen tras la fusión de dos agujeros negros.
 ??  ?? Summit, el superorden­ador más avanzado del mundo, puede efectuar 200.000 billones de operacione­s aritmética­s por segundo. Está instalado en el Laboratori­o Nacional Oak Ridge, en Tennessee.
Summit, el superorden­ador más avanzado del mundo, puede efectuar 200.000 billones de operacione­s aritmética­s por segundo. Está instalado en el Laboratori­o Nacional Oak Ridge, en Tennessee.
 ??  ?? Los sistemas de aprendizaj­e automático permitirán a los superorden­adores conocer la estructura y las propiedade­s de las moléculas y predecir su comportami­ento. Ello puede aprovechar­se para obtener nuevos materiales y fármacos.
Los sistemas de aprendizaj­e automático permitirán a los superorden­adores conocer la estructura y las propiedade­s de las moléculas y predecir su comportami­ento. Ello puede aprovechar­se para obtener nuevos materiales y fármacos.

Newspapers in Spanish

Newspapers from Spain