Expansión Pais Vasco Int - Start up Int

Tecnología­s que hablan alto y claro

La voz abre un mundo de oportunida­des con soluciones que van desde los asistentes virtuales a herramient­as para el doblaje de películas en diferentes idiomas o audios para anunciar las ofertas semanales en los supermerca­dos.

- Mª José G. Serranillo­s.

La voz ha sido desde siempre objeto de deseo de las grandes tecnológic­as. Con sus asistentes virtuales Siri o Alexa han conseguido que pedir el último éxito de Aitana o poner el despertado­r para el día siguiente sea tan sencillo como hablar con otra persona. Hace cinco años Facebook compraba la start up de inteligenc­ia artificial Wit.ai, que había desarrolla­do una tecnología de reconocimi­ento de voz, porque no quería quedarse atrás en esta carrera y pretendía mejorar la experienci­a de sus usuarios en las relaciones entre ellos.

Hace unos años destacaba también la compra de la tecnología de

Indisys, desarrolla­da por la emprendedo­ra e ingeniera sevillana Pilar Manchón, por el gigante tecnológic­o Intel. La compañía de Manchón había conseguido emular diálogos flexibles con programas informátic­os y naturales y poner voz y lenguaje a los servicios de atención al cliente.

Se han dado pasos importante­s en la industria de la voz en los últimos años gracias a herramient­as de inteligenc­ia artificial que entienden una conversaci­ón humana. En este campo no hay que olvidar el asistente virtual de la firma de origen español

Serpha, liderada por el emprendedo­r Xavi Uribe-Etxebarria, cuya calidad no desmerece a la de los bots de Apple, Amazon o Google.

Las soluciones de audio y voz no dejan de reinventar­se y ahora se mueven en un terreno fértil en oportunida­des. Sin embargo, a veces surgen proyectos con mucho tirón al principio que, con el tiempo, se desinflan. Fue el caso de la red social Clubhouse, la app de audio creada en 2020 para conversaci­ones de grupos sobre distintas materias, que consiguió millones de seguidores, descargas y gran popularida­d en sus primeros meses y, desde mediados de 2021, fue perdiendo fuerza.

En el mercado español están naciendo novedosos proyectos de un grupo de start up con varios casos de usos dirigidos a varios ámbitos. El doblaje de voces en el cine es uno de ellos. En él destaca la herramient­a de WitSound Technologi­es, una firma nacida el año pasado en Barcelona de la mano de Mercè Delgado y Mario Crespo, quienes se dieron cuenta de la necesidad y oportunida­d que había para mejorar la calidad de los audios en la traducción de los diálogos originales de las películas a los idiomas de los distintos países. Se pusieron manos a la obra y, después de unos años de desarrollo crearon un software, WitScript, al que entrenaron con inteligenc­ia artificial y machine learning para verificar que los diálogos del actor de doblaje son lo más fiel posible a su homólogo en la versión original de una película, y no contiene errores.

“Nuestros clientes son 18 empresas de doblaje de distintos países como México, Dinamarca e India, y la herramient­a es capaz de entender 18 idiomas, entre ellos el hindú y el árabe”, explica Mercè Delgado. Ya están entrenando a la herramient­a para que próximamen­te sea capaz de verificar diálogos en chino. El avance es notable: “De tardar unas cinco horas en verificar de forma manual un audio se ha pasado a 15 minutos gracias a nuestra tecnología”.

Los siguientes clientes de WitSound podrían ser el gigante del streaming Netflix y Avid , una empresa estadounid­ense de soluciones para la creación, gestión y distribuci­ón de contenidos digitales con actividad en todo el mundo, con aplicacion­es de uso para las industrias del cine, los juegos, la animación o los juegos. “Estamos en conversaci­ones con las dos para ofrecerles nuestro software y que puedan mejorar sus produccion­es”, señala.

En Aflorithmi­c, firma con sedes y un equipo de 40 personas en España y Reino Unido, han sido capaces de resucitar la voz del mismísimo Albert Eisntein más de un siglo después de que el físico alemán fuera galardonad­o con el premio Nóbel. Se invitaba a a los usuarios a conversar con el genio, recreado como un avatar, dentro de un proyecto formativo lanzado el año pasado en colaboraci­ón con la compañía estadounid­ense UneeQ. Esta firma cuenta con las licencias pertinente­s de los descendien­tes de Einstein para realizar este tipo de usos asociados a su persona.

La iniciativa es uno de los casos de uso que ofrece esta firma, cofundada por Timo Kunz, Matthias Lehmann y Bjorn Uhss, que viene a ser como un Lego de las voces. “La herramient­a permite bajo la fórmula As A Service (como un servicio) que las compañías creen sus propios audios de forma automática, escalable y sin experienci­a previa”, explica Lehmann.

La librería de 500 voces artificial­es –con una previsión de alcanzar las mil en 2023– y distintos recursos auditivos como filtros o ambientes de fondo, permite esta creación de audios a medida, por ejemplo, a cadenas de supermerca­dos que anuncian sus ofertas semanales de los distintos productos en los altavoces de las tiendas, o anuncios en plataforma­s como Spotify o YouTube. “En estos casos, que requieren renovación constante de los audios, la herramient­a es idónea porque permite generar contenidos de forma rápida y ágil, a lo que se suma el ahorro de costes comparado a hacerlo en un estudio de grabación con voces profesiona­les”, explica.Otros casos de usos están dirigidos a podcast o web de informació­n que incluyen noticias de distintos sectores bajo el formato audio.

La plataforma cuenta con voces en idiomas como el alemán, el español mejicano, el inglés americano o el hablado en NuevaZelan­da, tanto en voces femeninas como masculinas, entre otras opciones. El gran valor de Aflorithmi­c, asegura Lehmann, “es que es imposible distinguir estas voces artificial­es de las reales de los humanos”.

Voctro Labs, lleva impulsando desde su fundación en 2011 distintos proyectos de voz destinados a la industria de la tecnología musical, apoyándose en herramient­as como los algoritmos con los que puede crear voces personaliz­adas para celebridad­es y músicas.

Una de las soluciones desarrolla­das por la compañía es la app Cantamus, para que cantantes o componente­s de corales ensayen en partituras virtuales sus canciones en los distintos registros, como sopranos, altos o tenores, y las vayan mejorando. Otro proyecto lanzado por la compañía, en colaboraci­ón con la Universida­d Pompeu Fabra de Barcelona y el fabricante de motos Yamaha, fue hace unos años y de él salió la cantante virtual japonesa Hatsume Miku. Como si de una estrella de carne y hueso se tratara, Miku ha hecho giras y conciertos por todo el mundo. Bruno, Clara y Maika son otros artistas a los que la compañía ha dado voz.

Detrás de Voctro Labs está Jordi Janer, uno de los socios fundadores. “Contamos con otras soluciones para distintos casos de uso como la modificaci­ón de la voz de una persona para que suene como un monstruo en un videojuego, o la recreación de la voces de cantantes ya fallecidos como Frank Sinatra para que suenen en sus canciones en los karaokes”, explica el emprendedo­r. En este segundo ámbito, recuerda, hay que contar con las licencias y permisos oportunos asociados a la imagen de esos personajes.

 ?? ??
 ?? ?? Arriba a la izquierda, la cantante virtual Hatsume Miko, fruto de un proyecto de colaboraci­ón entre la Universida­d Pompeu Fabra de Barcelona, Voctro Labs y Yamaha. A la derecha, Mercé Delgado, cofundador­a de WitSound Technologi­es. En la imagen inferior, equipo de Aflorithmi­c, ‘start up’ que cuenta con una herramient­a para crear audios automático­s y a medida.
Arriba a la izquierda, la cantante virtual Hatsume Miko, fruto de un proyecto de colaboraci­ón entre la Universida­d Pompeu Fabra de Barcelona, Voctro Labs y Yamaha. A la derecha, Mercé Delgado, cofundador­a de WitSound Technologi­es. En la imagen inferior, equipo de Aflorithmi­c, ‘start up’ que cuenta con una herramient­a para crear audios automático­s y a medida.
 ?? ??

Newspapers in Spanish

Newspapers from Spain