La Semana

SORA, EL NUEVO MODELO DE OPENAI QUE TRANSFORMA TEXTOS EN VIDEO

-

Según Sam Altman, CEO de la compañía focalizada en inteligenc­ia arti cial, Sora es capaz de crear "escenas complejas con detalles del componente principal y el trasfondo". La compañía todavía no la ha puesto a disposició­n del público porque sigue analizándo­la para comprender los peligros del sistema, según indicó el diario The New York Times

La empresa Openai, uno de los líderes en inteligenc­ia artiqcial generativa, presentó este jueves a Sora. Este nuevo modelo acepta instruccio­nes en texto y las convierte en escenas de video, realistas, con múltiples caracteres y movimiento­s especíqcos.

Según la Qrma, establecid­a en 2015 y dirigida por Sam Altman, que ha desarrolla­do CHATGPT y el generador de imágenes Qjas DALL-E, Sora es capaz de crear «escenas complejas con detalles del componente principal y el trasfondo».

La compañía también indicó que su modelo puede «entender cómo existen los objetos en el mundo físico». Además, tiene la capacidad de «interpreta­r acertadame­nte las instruccio­nes y de generar caracteres convincent­es que expresan emociones vibrantes».

Sora es el término en japones para «cielo». La compañía todavía no la ha puesto a disposició­n del público porque sigue analizándo­la para comprender los peligros del sistema, según indicó el diario The New York Times.

Openai sigue haciendo pruebas

La empresa compartió, sin embargo, la tecnología con un pequeño grupo de académicos y otros investigad­ores externos. Su tarea es detectar las maneras en las cuales Sora podría usarse con Qnes maliciosos.

Steven Levy, de la revista Wired, describió su experienci­a cuando Openai le permitió ver, aunque no operar, el modelo Sora en respuesta a la instrucció­n en texto para crear una escena de la ciudad de Tokio captada por una cámara que se mueve por las calles, sigue a algunas personas en un día con nieve.

«El resultado es una vista convincent­e de lo que es, sin duda, Tokio en ese momento; cuando coexisten los copos de nieve y los capullos de cerezos» escribió Levy. «La cámara virtual, colocada en un robot volador (dron), sigue a una pareja que camina por el paisaje».

La Qrma indica que permite la creación de muchos mundos, con escenas realistas o fantástica­s, tridimensi­onales, con movimiento­s #uidos. Y aún en las escenas que no existen en el mundo real, el modelo aplica las reglas físicas correctas.

De este modo, Openai, que revolucion­ó el emergente sector de los servicios de IA regenerati­va, dispondrá de un conjunto de servicios que van desde la generación de texto, imagen estática y video.

Newspapers in English

Newspapers from United States