À l’aise thèse
Par mots et par vaux
Chaque mois, un chercheur, une chercheuse, nous raconte sa thèse sans jargonner. Clément Chagnaud, doctorant au Laboratoire d’informatique de Grenoble, n’a pas peur de s’attaquer à un sujet hautement explosif : est-ce qu’on dit « pain au chocolat » ou « chocolatine » ? Ingénieur, il fabrique des outils pour aider les linguistes à cartographier et à comprendre l’usage local des mots.
Causette : Comment un informaticien s’est-il retrouvé à faire une thèse autour de la linguistique ?
Clément Chagnaud : J’ai répondu à un appel à doctorants sur un sujet qui avait déjà été établi. Il portait sur la géolinguistique, c’est-à-dire l’intérêt que les linguistes ont pour la répartition géographique des mots. Ils partent du postulat que les différences de dialectes, de langues, sont présentes du fait de leur positionnement dans l’espace. Cette discipline ne bénéficie pas encore de moyens techniques, disons en phase avec les avancées technologiques. L’informatique était un moyen de donner à ces experts des outils pour visualiser leurs données sur des cartes numériques. Jusqu’à présent, les meilleurs d’entre eux faisaient des cartes sur Word ou sur Photoshop !
Par quoi commence-t-on un chantier comme celui-ci ?
C. C. : Au début, j’ai dû absorber énormément de connaissances sur cette discipline et comprendre comment les experts menaient leurs recherches en géolinguistique. Aujourd’hui, certains partent enquêter sur le terrain et interrogent les gens sur l’utilisation des mots et leur prononciation, mais la majorité travaille sur des données anciennes, recueillies dans des atlas linguistiques. À partir de ces données, ils interprètent tout un tas de choses : par exemple, ils vont pouvoir retrouver l’étymologie des mots comme celle de « tataragne », une araignée dans le Sud-Ouest, qui provient de l’occitan. Ils réalisent aussi des études lexicales pour voir pourquoi des termes différents sont utilisés pour décrire une même chose, comme « tomate » et « pomme d’amour », qui étaient employées pour désigner ce même fruit. Certains, également, font des études phonétiques pour voir les différences de prononciations des mots en fonction de l’emplacement sur le territoire. J’ai même travaillé avec une linguiste qui s’intéresse à la motivation sémantique, c’est-à-dire aux éléments qui ont motivé les humains à dénommer un objet de la sorte. Le meilleur exemple vient du mot « champignon » qui a quarante-cinq manières différentes de se dire, certaines en fonction de sa forme (« coulemelle ») ou de sa toxicité (« chapeau de sorcière »). L’enjeu de cette thèse n’était pas seulement de proposer un outillage logiciel pour faire des cartes, c’était aussi d’essayer d’établir des liens entre des phénomènes linguistiques dont on constate une spatialisation.
C’est-à-dire ?
“La langue est vivante, elle évolue avec les gens, les générations”
C. C. : Par exemple, une chaîne de montagnes qui aurait joué un rôle dans la répartition des phénomènes linguistiques en empêchant la diffusion d’un mot d’un versant à l’autre. Ou bien, au contraire, le rôle d’un
fleuve qui aurait permis sa diffusion. Ainsi, les monts du Forez, dans le Massif central, auraient empêché la diffusion du dialecte franco-provençal. Avec les outils informatiques, on peut émettre ce type d’hypothèses et les confirmer ou non.
Pour cela, vous vous êtes appuyé sur un ouvrage de référence : l’Atlas linguistique de la France. Pourquoi ?
C. C. : Cet ouvrage a été réalisé à la fin du XIXe siècle par deux linguistes francophones, Jules Gilliéron et Edmond Edmont. Ils ont entrepris de recenser les dialectes gallo-romans de la France. Edmond Edmont est allé sur le terrain en tant qu’oreille, et Jules Gilliéron analysait les données à Paris. Le premier se rendait dans des localités précises, toujours les mêmes, et interrogeait un informateur sur la manière de prononcer tel ou tel mot. Dans l’Atlas, chaque carte représente un mot, comme « canard » ou « toupie », sa prononciation, sa variante. Il y en a mille neuf cents en tout. Jules Gilliéron était un précurseur de la géolinguistique. Il disait que si on s’intéressait aux cartes, on allait pouvoir mieux comprendre l’évolution des langues et des langages.
Avez-vous un exemple ?
C. C. : Prenons la carte du mot « chaise ». En fonction des régions, le mot peut se prononcer « quaise » ou bien « chaise » par exemple. Les géolinguistes sont capables de montrer comment le mot a évolué et quel mot est arrivé avant l’autre. Ici le son « k » s’est progressivement transformé en « ch » grâce à une transformation de notre larynx !
À quoi ressemblent vos outils ?
C. C. : Pendant mes travaux, j’étais en constante collaboration avec les experts. Cela m’a permis d’établir des cartes comprenant des zones où le même mot est employé à l’époque de l’Atlas linguistique. Ensuite, grâce à des algorithmes les plus généralistes possible, les linguistes peuvent étudier cette répartition et comprendre pourquoi elle s’est faite ainsi. Par exemple, si l’on prend le mot « abeille », ils peuvent réfléchir à pourquoi, au début du XXe siècle, on appelait une abeille une « mouche à miel » dans le nord de la France et une « abeille » dans le Sud. Je leur ai aussi permis de feuilleter un grand nombre de cartes pour voir s’il y avait des zones où des variations linguistiques se produisaient pour beaucoup de mots. Le but est d’expliquer pourquoi un tel phénomène se retrouve à chaque fois dans une ville ou une région précise. C’est le cas par exemple dans les Pays de Savoie, où il existe encore des particularismes linguistiques très marqués.
Malgré des différences moindres aujourd’hui entre les dialectes, le sujet passionne toujours autant. Avez-vous réussi à comprendre pourquoi ?
C. C. : Le langage touche tout le monde. J’ai pris conscience que chacun avait son mot à dire sur le sujet. La langue est vivante, elle évolue avec les gens, les générations. Il ne faut pas fustiger telle façon de parler, il faut embrasser la diversité et la favoriser. La richesse de notre langue, ce sont toutes ces subtilités, ces petites variations, dans certaines expressions, dans certains mots. Ce sont les vestiges des données que je manipule. Maintenant, je n’ai plus envie de trancher pour savoir si on dit « pain au chocolat » ou « chocolatine », je trouve génial qu’il y ait encore deux façons de dénommer une même chose et d’aider à comprendre pourquoi elles sont réparties ainsi sur le territoire.