“Este año estará listo el primer modelo en español de inteligencia artificial”

El centro impulsa una IA para hispanohablantes que se alimentará con datos públicos

2024-04-08 - RAÚL LIMÓN

El cerebro humano es la estructura natural más compleja del universo conocido, con 86.000 millones de neuronas que transmiten 1.000 impulsos por segundo. Imitar solo una parte de esa extraordinaria maquinaria biológica para aprender, entender y responder en el español que hablan más de 500 millones de personas es la monumental tarea encargada por el Gobierno y en la que se han embarcado el Barcelona Supercomputing Center (BSC) con su superordenador MareNostrum y la multinacional IBM, que pondrá a disposición del proyecto todo su potencial de programación, investigación e infraestructura mundial de inteligencia artificial.

Darío Gil, murciano criado en Madrid que este 2024 cumple 49 años, ha sido el principal valedor tecnológico de esta aventura como máximo responsable de la división mundial de investigación de IBM. Realiza esta entrevista poco después de firmar el acuerdo que dará lugar al primer gran modelo de lenguaje de IA nacido en español. Convencido de que este avance es “una revolución”, apuesta por una arquitectura abierta y colaborativa donde quepa todo, desde las actas de sesiones parlamentarias hasta la Real Academia Española o cualquier universidad o colectivo hispanohablante. Calcula que el primer desarrollo se podrá mostrar este año.

Pregunta. ¿Por qué apuesta IBM por la inteligencia artificial en español?

Respuesta. Nuestro punto de vista sobre la inteligencia artificial nos permite alinearnos con la estrategia que tiene el Gobierno. El futuro de la IA se va a crear y definir a través de un ecosistema abierto y eso contrasta con otras empresas. Sucedió con los sistemas operativos hace más de 20 años y se hizo bien en su momento. Fue una apuesta decidida para que el futuro de los sistemas operativos, tanto en supercomputación como para todos los sistemas distribuidos de internet y demás, estén basados en código abierto. La comunidad quiere participar en la creación de la IA.

P. ¿Cómo será la participación?

R. Vamos a crear entornos colaborativos para desarrollar modelos fundacionales basados en código abierto donde haya transparencia en los datos que se van a utilizar para el preentrenamiento y una metodología. Es muy importante para incrementar la capacidad de los modelos de manera discreta y día a día. Los modelos fundacionales existentes necesitan de seis a nueve meses de preentrenamiento y sacan versiones una vez al año. Si nosotros tenemos un modelo base para toda la comunidad de desarrolladores, para todo el que quiera a añadir conocimiento o capacidades, vamos a trabajar conjuntamente para crear los mejores modelos fundacionales abiertos en español y las lenguas cooficiales.

P. ¿Cómo se va a desarrollar?

R. Desde el punto de vista de la computación, utilizaremos las capacidades existentes en el BSC. Con su MareNostrum hay un compromiso del ministro [para la Transición Digital, José Luis Escrivá] de seguir invirtiendo para acelerar el paso del MareNostrum 5 al 6. Por nuestra parte, aportamos centros de supercomputación dedicados a IA y los últimos avances de IBM Research.

P. ¿Cuáles son los sectores prioritarios a los que va dirigido el modelo?

R. A todos, pero el Gobierno tiene interés en garantizar que se beneficie la pequeña y mediana empresa, donde hay mayor inhibición o complejidad a la hora de adoptar ese tipo de innovaciones, y la Administración del Estado. Hemos definido casos de uso para implementar la difusión de la IA en estos dos sectores.

P. ¿Cuánto cuesta?

R. No hay una respuesta concreta. Pero, si sirve para hacer una aproximación, puedo decir que para crear un modelo fundacional de alto rendimiento se necesitan miles de unidades de procesamiento que cuestan, cada una, 35.000 dólares [32.300 euros] como mínimo. Son proyectos muy ambiciosos; esto no es dos personas que hablan una tarde y hacen un PowerPoint. En IBM Research tenemos 3.600 científicos e ingenieros que participarán y nuestros propios equipos de supercomputación dedicados exclusivamente a crear modelos fundacionales. Y, como es un sistema abierto, habría que sumar la comunidad de desarrolladores hispanohablantes que quieran participar. Son esfuerzos que van en paralelo.

P. ¿De dónde saldrán los datos para alimentar el modelo?

R. Serán datos públicos, pero hay un deseo de utilizar documentos que son propiedad del Estado, que es una cuestión muy singular e interesante. Las transcripciones de todos los debates del Parlamento es un ejemplo. Pero también se prevé la colaboración de las bibliotecas nacionales y la Real Academia Española. Serán datos que son públicos.

P. ¿Y cómo se salva la diversidad de hablas del español?

R. Desde el punto de vista matemático, se pueden incorporar una gran diversidad de idiomas. La diversidad está dentro de la misma red neuronal y luego, cuando se hace el fine tuning [ajuste o perfeccionamiento], se adapta, aunque se haya entrenado con los documentos base, a las diferentes variaciones del español. Al modelo le puedes pedir respuestas consistentes con la experiencia argentina y se comportará de esa manera, aprenderá del contexto desde donde se genera la interacción.

P. Pero “coger una cita” en castellano puede no tener el mismo significado en algunos países de Hispanoamérica.

R. El modelo base aumentará, se especializará y ganará habilidades con el esfuerzo de todos para que entienda contextos específicos. El modelo de código abierto permite esa enorme diversidad. Y el objetivo es expandirlo lo más posible, incluso a Brasil. Iberoamérica es un mercado enorme de oportunidades y es importante aprovechar la ventaja competitiva del español.

P. ¿Cuándo estará disponible el primer modelo?

R. El objetivo es hacer algo este año y, en paralelo, desarrollar algunos casos de uso en las mismas fechas. En este mundo [de la IA], que es muy dinámico, a nadie le interesan los plazos de años.

P. ¿Y qué gana IBM?

R. Pondré el ejemplo de Red Hat [multinacional de programación de código abierto cuya empresa matriz es IBM]. Factura miles de millones de dólares anuales y es la mayor empresa del mundo de software abierto. El modelo es facilitar el programa a empresas y gobiernos que, luego, querrán mantenimiento o seguridad compatible con los equipos. A ese modelo comercial estamos acostumbrados. No lo hacemos porque seamos altruistas, sino porque creemos en ese modelo. Queremos socios estratégicos y hemos encontrado muchísimas resonancias en el Gobierno de España. En la alianza de IA que tenemos hay más de 80 instituciones que forman parte de este compromiso.

P. ¿Hay burbuja de la inteligencia artificial?

R. La tecnología en sí está evolucionando a una velocidad como nunca he visto hacerlo a ninguna otra. Y ya no planificamos a un año o dos, sino para dentro de un mes, semanas o días. No veo burbuja. Si la hay es de catastrofistas, pero la base tecnológica es potente y sólida.

“Iberoamérica es un mercado enorme de oportunidades para la expansión”

“La herramienta aprenderá del país donde se genere la interacción”

?? MISHA FRIEDMAN ?? Darío Gil, en las instalaciones de investigación de la compañía IBM en 2019. — MISHA FRIEDMAN Darío Gil, en las instalaciones de investigación de la compañía IBM en 2019.

“Este año estará listo el primer modelo en español de inteligencia artificial”

El centro impulsa una IA para hispanohablantes que se alimentará con datos públicos

Newspapers in Spanish

Newspapers from Spain

“Este año estará listo el primer modelo en español de inteligenc­ia artificial”

El centro impulsa una IA para hispanohab­lantes que se alimentará con datos públicos

Newspapers in Spanish

Newspapers from Spain

“Este año estará listo el primer modelo en español de inteligencia artificial”

El centro impulsa una IA para hispanohablantes que se alimentará con datos públicos