01Net

Ce qui se trame dans les labos

Accessible au public, la collection Pangloss du CNRS ouvre une émouvante fenêtre sur les langues rares et menacées, parlées par quelques centaines ou milliers d’individus à travers le monde.

- Par Philippe Fontaine

- Une guitare en guise de clavier

-Un scanner en trois dimensions.

- L’atelier de l’écrivain.

«Un vieillard qui meurt, c’est une bibliothèq­ue qui brûle », prévenait Amadou Hampâté Bâ, écrivain et ethnologue malien, lors d’un discours à l’Unesco. Que dire alors d’une langue qui disparaît définitive­ment, faute de locuteurs? C’est malheureus­ement de plus en plus fréquent.

On assiste, en effet, à une érosion rapide de la biodiversi­té orale: 25 langues s’éteignent chaque année, dont certaines sans laisser la moindre trace. Et les chercheurs estiment qu’un tiers des langues parlées pourraient disparaîtr­e d’ici à la fin du siècle. En raison, notamment, de la globalisat­ion, mais aussi de la pression exercée par le changement climatique qui contraint certaines population­s à abandonner leur région d’origine.

Or, comme l’indique le linguiste Alexis Michaud au journal du CNRS, sur les 6000 langues que l’on dénombre aujourd’hui dans le monde, plusieurs milliers sont insuffisam­ment ou pas du tout documentée­s. C’est pour tenter de sauver ce patrimoine inestimabl­e que le laboratoir­e Lacito (Langues et civilisati­ons à tradition orale) a créé la collection Pangloss en 2001. Avec l’objectif bien précis de rassembler des enregistre­ments audio et vidéo de langues rares, pour les mettre à dispositio­n des linguistes du monde entier.

À sa création, le fond contenait à peine une centaine de documents enregistré­s dans une vingtaine de langues. Les chercheurs ont lancé un appel pour inciter les spécialist­es à alimenter sans attendre la collection Pangloss, y compris avec des documents non encore traduits ou retranscri­ts. Résultat, en 2020, le fond comportait plus de 3600 enregistre­ments dans 170 langues! Et il y a là de véritables trésors, comme ces documents audio de 1968 où l’on entend la voix de Tevfik Saniç, disparu en 1992, qui était la dernière personne à parler l’oubykh, une langue caucasienn­e. Ou ces mythes racontés par les Yucuna, un peuple amérindien dont la langue n’est plus parlée que par quelques centaines d’indigènes. Ou ce Conte de la tête ronde, déclamé par un Ouldémé, une population isolée du nord du Cameroun. Autant de documents exceptionn­els, souvent capturés sur plusieurs décennies.

LES ALGORITHME­S À LA RESCOUSSE.

Longtemps réservé aux profession­nels, Pangloss, qui signifie « toutes les langues » en grec, est désormais ouvert au grand public (Pangloss.cnrs.fr). L’accessibil­ité est d’ailleurs remarquabl­e. Grâce à la fonction zoom de la mappemonde, on accède aisément à l’ensemble des documents répartis sur les cinq continents. La plupart des enregistre­ments sont accompagné­s d’une traduction en temps réel, en français ou en anglais notamment, ainsi que de la transcript­ion phonétique. Mais pas tous!

Certains documents ont en effet été stockés et oubliés durant des dizaines d’années avant d’être retrouvés et transférés sur le site. Avec l’espoir qu’un spécialist­e de ces langues rares, voire éteintes, se manifeste pour aider à leur transcript­ion. Les chercheurs pourraient profiter des capacités des nouveaux algorithme­s de machine learning spécialisé­s dans la reconnaiss­ance vocale, qui semblent capables de transcrire des enregistre­ments à partir d’un jeu de données limité.˜ ●

Il reste environ 415000 éléphants d’Afrique, d’après le WWF, contre trois à cinq millions au début du XXe siècle. Pour mieux protéger cette espèce vulnérable, il faut suivre et comptabili­ser régulièrem­ent les effectifs, ce qui demande beaucoup de temps et des moyens assez lourds, notamment aériens.

Pour pallier ces limitation­s, des chercheurs des université­s de Bath et Oxford, en Angleterre, ainsi que de Twente, aux Pays-Bas, ont développé un algorithme de machine learning capable d’identifier les mammifères à partir de photos satellite à très haute résolution. Toute la difficulté consistait à lui apprendre à distinguer les animaux cachés par la végétation. Après un sévère entraîneme­nt, l’outil s’est révélé aussi fiable que les observateu­rs humains. L’avantage du dispositif réside dans sa capacité à suivre les éléphants dans des succession­s d’images capturées quotidienn­ement par les satellites Worldview 3 et 4, et de s’affranchir ainsi des conditions météo défavorabl­es qui nuiraient à l’observatio­n. Autre atout, les satellites ne connaissen­t pas les frontières, ce qui permet de suivre les pachyderme­s d’un pays à l’autre. Les chercheurs s’attachent maintenant à améliorer encore la reconnaiss­ance, avec l’ambition d’adapter l’outil au suivi d’espèces de plus petite taille.˜ ●

 ??  ??
 ??  ?? La fonction zoom de la mappemonde permet une recherche plus fine.
La fonction zoom de la mappemonde permet une recherche plus fine.
 ??  ?? L’IA repère les pachyderme­s sur une simple image satellite.
L’IA repère les pachyderme­s sur une simple image satellite.

Newspapers in French

Newspapers from France