L’HYPERTRUCAGE, POUR LE MEILLEUR ET POUR LE PIRE
« Bonsoir, Mesdames, Messieurs ; ici Bernard Derome de 1970. Eh oui. » Complet-cravate brun, coupe de cheveux vaguement Beatles, longs favoris : à l’écran, le célèbre présentateur de nouvelles apparaît comme il était jadis, lorsqu’il a commencé à animer le Téléjournal de Radio-Canada. Les images, on le comprend assez vite, sont trafiquées ; Loto-Québec, qui les a dévoilées à l’occasion de son 50e anniversaire en février 2020, ne s’en est jamais cachée. Ce coup de pub a été rendu possible par l’hypertrucage (ou deepfake en anglais), une technique de synthèse d’images basée sur l’intelligence artificielle qui vise à superposer des fichiers audio et vidéo existants sur d’autres vidéos. « Reconnaître un hypertrucage bien fait est difficile, même pour quelqu’un comme moi dont c’est le sujet de recherche, avoue Éric Paquette, professeur au Département de génie logiciel et des technologies de l’information de l’École de technologie supérieure (ÉTS). Les enjeux éthiques sont pourtant criants : on peut créer de toutes pièces des contenus pour diffuser des discours de haine ou propager de fausses nouvelles. »
Les travaux de ce spécialiste en développement d’applications graphiques et interactives n’ont pourtant rien à voir avec la désinformation. Bien au contraire : ils visent à faciliter la vie d’entreprises spécialisées en postproduction audio offrant par exemple des services de doublage. « Nous souhaitons littéralement faire bouger les lèvres des acteurs de manière conforme à la langue parlée. Traditionnellement, on emprunte plutôt le chemin inverse : on compose un texte dans la langue de doublage souhaitée qui correspond le plus possible au mouvement des lèvres à l’écran, dans la langue originale », explique-t-il.
Pour réaliser ce tour de force, Éric Paquette et ses collaborateurs font appel à des algorithmes d’apprentissage automatique, qu’ils alimentent d’images filmées dans différentes langues. Grâce à cette approche basée sur l’intelligence artificielle, ils espèrent être en mesure de générer des vidéos dans lesquelles les bottines suivent les babines, et vice-versa, d’ici un à deux ans. « Nous nous sommes donné comme contrainte de ne pas numériser les acteurs en 3D. Ce ne serait pas très réaliste dans le contexte de la production cinématographique internationale, où les comédiens ne sont pas facilement accessibles », souligne le scientifique.
À l’heure actuelle, un certain niveau de compétence est nécessaire pour réaliser un hypertrucage digne de ce nom. Les quelques applications qui prétendent y parvenir, notamment Reface et FaceApp, remplacent tout simplement un visage par un autre dans une vidéo, sans plus. L’hypertrucage s’est d’ailleurs fait connaître ainsi, lorsque les minois de personnalités célèbres comme Emma Watson ont été vulgairement posés sur des corps d’actrices nues. Ce n’est cependant qu’une question de quelques années avant que la technologie se raffine et soit plus accessible. « Ne nous leurrons pas : l’hypertrucage est déjà à la portée d’organisations malveillantes et des gouvernements », prévient Éric Paquette.