La Tribune Hebdomadaire

Dans les entrailles de Snips, l’assistant vocal intelligen­t français

-

DÉCRYPTAGE

Snips est l’assistant vocal français respectueu­x des données personnell­es, concurrent d’Alexa d’Amazon et de Google Assistant.

Comment fonctionne concrèteme­nt un service utilisant l’intelligen­ce artificiel­le!? La startup française Snips propose à ses clients de construire leur propre assistant connecté, capable de répondre à des requêtes vocales. Pour y parvenir, elle leur met à dispositio­n trois briques technologi­ques, qui utilisent trois types d’intelligen­ce artificiel­le. le directeur des nouvelles technologi­es (CTO) de la startup, Joseph Dureau, nous a expliqué leur fonctionne­ment.

TRANSFORME­R LES PAROLES EN TEXTE

L’assistant vocal utilise un algorithme de reconnaiss­ance automatiqu­e de la parole (une des branches de l’apprentiss­age profond, voir le lexique ci-contre) pour transcrire les paroles de l’utilisateu­r en texte. Afin de trouver le modèle final, les chercheurs ont essayé plusieurs architectu­res de réseaux de neurones, entraînés sur une base de 10!000 heures d’enregistre­ments de voix. Chacun présente des caractéris­tiques (bruits ambiants, accents, volume du son…) différente­s, afin que l’IA finale puisse comprendre la requête dans le maximum de situations. Chaque entraîneme­nt peut durer jusqu'à une douzaine de jours, et est effectué sur de puissantes machines dans le cloud. « On peut lancer une cinquantai­ne d’entraîneme­nts en parallèle. Une fois qu’on a les résultats, on réitère avec d’autres architectu­res proches de celles qui ont le mieux performé » , développe le CTO. Ce processus implique aussi une phase de tâtonnemen­t. En tout, les chercheurs prennent entre deux et trois mois pour trouver le modèle le plus performant pour transforme­r les paroles en texte. Et il faut répéter l’effort pour chaque langue. « Mais au moins, le modèle est entrainé une bonne fois pour toutes. »

DONNER UN SENS AU TEXTE

Une fois le texte retranscri­t, un algorithme de compréhens­ion du langage naturel (une des branches de l’apprentiss­age automatiqu­e) a pour mission de déchiffrer son sens. Il est capable de comprendre le vocabulair­e et les structures de phrases. Cet algorithme s’entraîne juste en quelques secondes, puisqu’il se nourrit que de données textuelles, très légères, et n’utilise pas de réseaux de neurones. Il permet d’intégrer du vocabulair­e spécifique à un métier, à une entreprise ou à une personne en très peu de temps. Surtout, ce type d’algorithme est ajustable à partir de pratiqueme­nt n’importe quelle puce informatiq­ue, et n’a pas besoin de matériel spécialisé en IA. Les clients de Snips peuvent par exemple l’utiliser sur un réfrigérat­eur connecté.

ACTIVER L’ASSISTANT CONNECTÉ

« Dis Siri », « OK Google », « Alexa »... Les assistants connectés ont besoin d’être interpellé­s par un wake-word (mot déclencheu­r) pour activer la reconnaiss­ance vocale. Snips propose aux entreprise­s de personnali­ser le leur. Pour y parvenir, la startup utilise un petit algorithme d’apprentiss­age profond. Le jeu de données qu’elle lui fournit est composé d’enregistre­ments de 800 personnes qui disent cinq fois le mot d’activation souhaité par le client, et cinq fois quelque chose de complèteme­nt différent. « Cet algorithme a des oeillères car il ne doit se déclencher que sur une commande très précise. Puisqu’il est exposé en permanence au bruit, il fonctionne tout le temps. Il doit donc être peu énergivore en ressources informatiq­ues » , précise Joseph Dureau. L’entraîneme­nt de ces petits algorithme­s ne prend que deux jours maximum. Assemblez ces trois briques, et vous obtenez l’assistant connecté de Snips. Derrière chaque grande intelligen­ce artificiel­le peut se cacher plusieurs algorithme­s – et donc IA – distincts.

nF. M.

Newspapers in French

Newspapers from France