Ce qui se trame dans les labos
Accessible au public, la collection Pangloss du CNRS ouvre une émouvante fenêtre sur les langues rares et menacées, parlées par quelques centaines ou milliers d’individus à travers le monde.
- Une guitare en guise de clavier
-Un scanner en trois dimensions.
- L’atelier de l’écrivain.
«Un vieillard qui meurt, c’est une bibliothèque qui brûle », prévenait Amadou Hampâté Bâ, écrivain et ethnologue malien, lors d’un discours à l’Unesco. Que dire alors d’une langue qui disparaît définitivement, faute de locuteurs? C’est malheureusement de plus en plus fréquent.
On assiste, en effet, à une érosion rapide de la biodiversité orale: 25 langues s’éteignent chaque année, dont certaines sans laisser la moindre trace. Et les chercheurs estiment qu’un tiers des langues parlées pourraient disparaître d’ici à la fin du siècle. En raison, notamment, de la globalisation, mais aussi de la pression exercée par le changement climatique qui contraint certaines populations à abandonner leur région d’origine.
Or, comme l’indique le linguiste Alexis Michaud au journal du CNRS, sur les 6000 langues que l’on dénombre aujourd’hui dans le monde, plusieurs milliers sont insuffisamment ou pas du tout documentées. C’est pour tenter de sauver ce patrimoine inestimable que le laboratoire Lacito (Langues et civilisations à tradition orale) a créé la collection Pangloss en 2001. Avec l’objectif bien précis de rassembler des enregistrements audio et vidéo de langues rares, pour les mettre à disposition des linguistes du monde entier.
À sa création, le fond contenait à peine une centaine de documents enregistrés dans une vingtaine de langues. Les chercheurs ont lancé un appel pour inciter les spécialistes à alimenter sans attendre la collection Pangloss, y compris avec des documents non encore traduits ou retranscrits. Résultat, en 2020, le fond comportait plus de 3600 enregistrements dans 170 langues! Et il y a là de véritables trésors, comme ces documents audio de 1968 où l’on entend la voix de Tevfik Saniç, disparu en 1992, qui était la dernière personne à parler l’oubykh, une langue caucasienne. Ou ces mythes racontés par les Yucuna, un peuple amérindien dont la langue n’est plus parlée que par quelques centaines d’indigènes. Ou ce Conte de la tête ronde, déclamé par un Ouldémé, une population isolée du nord du Cameroun. Autant de documents exceptionnels, souvent capturés sur plusieurs décennies.
LES ALGORITHMES À LA RESCOUSSE.
Longtemps réservé aux professionnels, Pangloss, qui signifie « toutes les langues » en grec, est désormais ouvert au grand public (Pangloss.cnrs.fr). L’accessibilité est d’ailleurs remarquable. Grâce à la fonction zoom de la mappemonde, on accède aisément à l’ensemble des documents répartis sur les cinq continents. La plupart des enregistrements sont accompagnés d’une traduction en temps réel, en français ou en anglais notamment, ainsi que de la transcription phonétique. Mais pas tous!
Certains documents ont en effet été stockés et oubliés durant des dizaines d’années avant d’être retrouvés et transférés sur le site. Avec l’espoir qu’un spécialiste de ces langues rares, voire éteintes, se manifeste pour aider à leur transcription. Les chercheurs pourraient profiter des capacités des nouveaux algorithmes de machine learning spécialisés dans la reconnaissance vocale, qui semblent capables de transcrire des enregistrements à partir d’un jeu de données limité. ●
Il reste environ 415000 éléphants d’Afrique, d’après le WWF, contre trois à cinq millions au début du XXe siècle. Pour mieux protéger cette espèce vulnérable, il faut suivre et comptabiliser régulièrement les effectifs, ce qui demande beaucoup de temps et des moyens assez lourds, notamment aériens.
Pour pallier ces limitations, des chercheurs des universités de Bath et Oxford, en Angleterre, ainsi que de Twente, aux Pays-Bas, ont développé un algorithme de machine learning capable d’identifier les mammifères à partir de photos satellite à très haute résolution. Toute la difficulté consistait à lui apprendre à distinguer les animaux cachés par la végétation. Après un sévère entraînement, l’outil s’est révélé aussi fiable que les observateurs humains. L’avantage du dispositif réside dans sa capacité à suivre les éléphants dans des successions d’images capturées quotidiennement par les satellites Worldview 3 et 4, et de s’affranchir ainsi des conditions météo défavorables qui nuiraient à l’observation. Autre atout, les satellites ne connaissent pas les frontières, ce qui permet de suivre les pachydermes d’un pays à l’autre. Les chercheurs s’attachent maintenant à améliorer encore la reconnaissance, avec l’ambition d’adapter l’outil au suivi d’espèces de plus petite taille. ●