El Periódico - Català

Primers passos per crear un assistent de veu lliure en català

Mozilla i Softcatalà impulsen un sistema obert a qualsevol programado­r Animen a gravar textos llegits per recollir accents, edats i gèneres

- CARMEN JANÉ

La intel·ligència artificial no és en absolut poliglota. Els robots, com molts turistes, a penes surten de l’anglès i la majoria d’assistents que impliquen reconeixem­ent i tractament del llenguatge es programen des d’aquesta llengua, la qual cosa pot acabar excloent la majoria de la població mundial.

Dels 7.623 milions d’habitants de la Terra, a penes 378 milions tenen l’anglès com a primera llengua, i 745 milions més l’entenen o el parlen amb fluïdesa com a segon o tercer idioma. La resta de persones, parla almenys un dels més de 7.000 idiomes coneguts.

Un projecte de la Fundació Mozilla, creada sense ànim de lucre i que es nodreix sobretot de voluntaris, pretén corregir aquesta deficiènci­a i evitar, de passada, que tot el saber quedi en mans d’unes quantes empreses: Google, Amazon, Apple o Nuance. Google acaba de llançar el seu assistent de veu en castellà fa un mes i Apple té reconeixem­ent de veu en català però el seu assistent de veu, Siri, encara no l’ha après.

El projecte Common Voice, que es va obrir a totes les llengües fa unes setmanes, anima tots els internaute­s a contribuir per crear un corpus lingüístic per a cada idioma del món. Qualsevol internauta pot proposar una llengua, i les comunitats de desenvolup­adors tindran accés a aquest saber sense restriccio­ns gràcies a una llicència Creative Commons 0, la més pròxima al domini públic.

LLEGIR EN VEU ALTA La proposta per als usuaris és molt senzilla: es tracta de llegir en veu alta un text que apareix a la pantalla del navegador i permetre que el micròfon de l’ordinador o el mòbil el gravi. Mozilla recollirà dades que comparteix­i l’usuari, com ara accent, edat i gènere, que afirmen que només associaran a les gravacions per identifica­r varietats dialectals. També es pot contribuir enviant textos per ser llegits.

La intenció és entrenar un sistema de reconeixem­ent de veu i llengua a base que milions de persones llegeixin els mateixos textos que apareixen en pantalla. Només així, el sistema és capaç d’associar veu i text. Amb això, la idea és, utilitzant xarxes neuronals, generar un model informàtic que es pugui utilitzar en aplicacion­s o en navegadors. «La idea és que el pugui utilitzar realment qualsevol», afirma Jordi Mas, coordinado­r de Softcatalà, l’entitat que s’encarrega de gestionar la versió catalana i que fa 20 anys que tradueix de forma voluntària programes lliures al català.

«Perquè funcioni necessitem tenir gravades almenys un miler d’hores d’àudios, amb la varietat de variants dialectals més gran del català, gravats per homes i dones de totes les edats», assenyala. L’objectiu de Softcatalà és comptar amb un primer model que funcioni a principis d’any. «Ja havíem intentat crear un model abans amb el corpus de TV-3 i amb el del Parlament. Amb la televisió hi havia el problema dels drets d’autor, que ens deixaven només amb els seus programes de producció pròpia, i amb el Parlament, hi havia poques veus», explica Mas.

El compromís de la Fundació Mozilla, que està preparant també el seu propi navegador basat en veu, Firefox Scout, per competir amb l’Alexa d’Amazon, el Google Voice de Google o el Siri d’Apple, és publicar les dades recollides tot i que el projecte no es completi.

 ??  ?? Altaveu d’Amazon amb l’assistent virtual Alexa integrat.
Altaveu d’Amazon amb l’assistent virtual Alexa integrat.

Newspapers in Catalan

Newspapers from Spain