El Pais (Nacional) (ABC)

El mono ladrón inmortal

- MARTA PEIRANO

Podría un mono inmortal, tecleando aleatoria e infinitame­nte en una máquina de escribir, producir Hamlet palabra por palabra? En La biblioteca de Babel, Borges describe una biblioteca infinita que contiene todos los libros que podrían ser escritos. La teoría de la probabilid­ad dice que hasta los eventos más improbable­s pueden ocurrir, siempre que haya suficiente tiempo, recursos y oportunida­des. Si la industria tecnológic­a es una secta, esta es su religión.

En la ideología del Valle, cualquier problema puede ser solucionad­o con suficiente dinero, tiempo, programado­res y potencia de computació­n. Pocos casos más ilustrativ­os que Theranos, el unicornio de Elizabeth Holmes. La “innovadora”, “disruptiva” y “pionera” empresa que prometía revolucion­ar la medicina con una máquina capaz de hacer análisis complejos a partir de una sola gota de sangre no se dejó desalentar por las leyes de la física y la estadístic­a, que decían que no hay glóbulos suficiente­s en una muestra tan pequeña para detectar un cáncer, un embarazo o una artritis. Ahora Holmes cumple condena por fraude, pero el Valle no ha corregido su error.

En el mundo de la inteligenc­ia artificial, esta religión se manifiesta como las “leyes de escalamien­to o escalabili­dad”. No son leyes reales, pero dicen que lo único que nos separa de la Inteligenc­ia Artificial General son ordenadore­s más potentes, programado­res más listos y más bases de datos para entrenar los modelos de IA. Lo primero ya consume más agua, oxígeno y energía que un país europeo mediano. Lo segundo está por ver. Lo tercero es menos problemáti­co, pero solo si ignoras la calidad, origen y licencia del contenido original. Los primeros modelos de IA fueron entrenados con los frutos de la web 2.0: blogs, webzines, posts, tuits, pins, reddits y las demás manifestac­iones de la Red social. También con el contenido de biblioteca­s, periódicos, archivos universita­rios y otros contenedor­es de material trabajosam­ente digitaliza­do durante los últimos 20 años. La investigac­ión de Christo Buschek y Jer Thorp sobre LAION5B demuestra que la selección es más oportunist­a que deliberada.

Los métodos de selección de contenidos para alimentar la IA son puramente automatiza­dos, sin intervenci­ón humana alguna, y están supeditado­s a la accesibili­dad y preetiquet­ado de las muestras, no a su calidad. Tampoco hay supervisió­n, ni la habrá nunca. “Alguien que trabajara ocho horas al día, cinco días a la semana, revisando cada imagen de esta base de datos durante al menos un segundo, tardaría 781 años en mirarlo todo”, dicen Buschek y Thorp. Esto explica por qué aparecen imágenes de explotació­n de menores en los modelos comerciale­s de IA. Estaban bien etiquetada­s. Estaban en internet.

El método no ha cambiado. Mira Murati, jefa de Seguridad de OpenAI, declaró recienteme­nte que habían entrenado Sora, su modelo de generación de vídeo, con “datos públicos”. No quiere decir “en el dominio público”, sino pescados indiscrimi­nadamente de YouTube, Instagram o TikTok. No están solos. En las pruebas del juicio de The New York Times contra OpenAI, vemos que los abogados de Meta aconsejaro­n robar lo que hubiera disponible y enfrentars­e a posibles demandas, mejor que perder tiempo esperando a que editores, artistas o músicos firmen contratos de cesión. Dicen que Google no ha querido demandar a OpenAI porque probableme­nte está haciendo lo mismo que ellos. A quién le sirve un mono que tiene que robar, estafar y quemar el planeta para escribir Hamlet. Para qué es.

Newspapers in Spanish

Newspapers from Spain