Vers une intelligence artificielle plus frugale
De nombreux chercheurs planchent sur des systèmes d’apprentissage utilisant moins de données et d’énergie que le deep learning.
Côté pile, c’est un outil formidable, capable de battre un champion de go ou de guider une voiture autonome. Côté face, l’intelligence artificielle (IA) est un gouffre énergétique. Entre 2012 et 2018, les besoins en calculs liés au deep learning (l’apprentissage profond, l’une des méthodes les plus utilisées en IA) ont été multipliés par… 300 000. Et le coût d’entraînement de ce genre de système, qui repose sur un volume de données importantes, double plusieurs fois par an. Une situation aberrante : l’IA est censée imiter le cerveau humain. Or celuici n’a besoin que d’une vingtaine de watts pour fonctionner, contre 400 kilowatts en moyenne pour un système d’apprentissage profond.
Ce manque d’efficacité pousse aujourd’hui les chercheurs à revoir leur copie. D’autant que, sur le terrain, le déploiement du deep learning se heurte à de nombreuses difficultés. « Beaucoup de sociétés souhaitant utiliser l’IA ne disposent pas des bases de données adéquates », constate Bruno Maisonnier, fondateur de la startup AnotherBrain. Soit les informations ne sont pas disponibles en quantité suffisante, soit il serait trop long de les annoter, c’estàdire de les classer en catégories permettant à l’IA d’apprendre. Parfois, pour des raisons de sécurité ou de confidentialité, l’IA ne peut être connectée à Internet. Elle ne peut donc pas compter sur la puissance de calcul du cloud. Enfin, l’IA embarquée – dans un avion, par exemple – doit fonctionner elle aussi avec des ressources limitées. Toutes ces raisons plaident pour le développement d’algorithmes bien plus efficaces qu’actuellement.
De multiples pistes sont à l’étude. La plus simple consiste à remplacer – totalement ou en partie – l’apprentissage profond par de l’IA symbolique, une approche plus ancienne, laissée de côté ces dernières années. Fondée sur des règles logiques, cette méthode n’a pas besoin d’énormes bases de données pour fonctionner. Elle peut même surclasser le deep learning. C’est le cas dans l’analyse de textes. « Alors que nos concurrents utilisent des solutions gourmandes en données et en énergie, nous avons mis au point un algorithme léger, capable de résumer des documents complexes rédigés en plusieurs langues. Ce programme met en avant les points importants sans rien oublier », explique Thomas Solignac, dirigeant et cofondateur
de la société Golem AI. Dans le domaine militaire, Thales utilise aussi l’IA symbolique pour simuler le comportement d’un avion de chasse ou permettre à un engin d’exploration spatial de se poser. L’entreprise a même trouvé une méthode plus économe pour entraîner une IA à détecter les menaces potentielles en vol : elle a créé de toutes pièces 2 millions d’images de cibles, pour lesquelles aucune base de données réelle n’existe. Ce système de reconnaissance, qui consomme très peu d’énergie, pourrait être embarqué prochainement sur des Rafale.
La course à la frugalité pousse aussi les chercheurs à se rapprocher encore plus du fonctionnement du cerveau humain. En évitant notamment d’avoir à traiter des informations inutiles. « A l’heure actuelle, dans les systèmes de reconnaissance d’images, tous les capteurs envoient des signaux en même temps de manière répétée. Même ceux qui ne voient rien d’intéressant. En se focalisant sur les informations nouvelles – par exemple, une modification de la lumière reçue par un pixel –, on peut gagner en efficacité », explique Ryad Benosman, professeur à l’université de Pittsburgh (Pennsylvanie) et spécialiste de la vision par ordinateur. Une caméra peut ainsi fonctionner 1 million de fois plus vite en utilisant à peine 5 % d’énergie par rapport à un modèle classique, assure le chercheur. Ce procédé aux résultats spectaculaires, qui s’appuie sur des puces neuromorphiques, fait en ce moment l’objet de recherches intenses, y compris dans des grands groupes comme IBM.
La théorie récente du « ticket de loterie » attire elle aussi de plus en plus l’attention des chercheurs. « Celleci stipule que, à l’intérieur d’un réseau de neurones, on peut trouver des sousréseaux bien plus efficaces que l’ensemble auquel ils appartiennent », explique Philippe Esling, chercheur en IA à l’Institut de recherche et coordination acoustique/musique (Ircam). L’idée consiste à décortiquer un système de deep learning pour l’alléger. « Parfois, une réduction de 90 % se traduit par de meilleurs résultats », assure le scientifique, qui applique ces travaux à la création musicale par les machines. Certes, la méthode présente un inconvénient : il faut d’abord mettre au point un système d’apprentissage imparfait avant de pouvoir l’améliorer. Mais si, ensuite, le modèle allégé est utilisé de nombreuses fois en remplacement du premier, alors les coûts diminuent drastiquement. D’autant que l’on peut toujours utiliser un modèle d’apprentissage pour de nouvelles tâches, en le modifiant légèrement.
« C’est le principe du transfert learning », confirme Laurent Wlodarczyk, directeur technique d’Axionable, une société de conseil en IA durable. Grâce à des modèles disponibles en open source, il est possible de développer des systèmes pour 1 % du coût d’apprentissage initial et de les appliquer à des usages différents. La méthode donne déjà de bons résultats pour la classification de brevets ou le contrôle de défauts dans l’industrie. Mais l’IA la plus efficace dans le futur sera peutêtre basée sur… le comportement des insectes, grâce aux recherches menées par AnotherBrain. « En suivant des règles simples fondées sur le mouvement, les abeilles ou les termites parviennent à réaliser des tâches complexes, comme choisir le meilleur emplacement pour un abri ou réguler les températures », détaille Bruno Maisonnier. En reprenant ce principe et en s’appuyant sur des réseaux antagonistes génératifs (GANs) – des réseaux de neurones qui apprennent l’un de l’autre –, l’entreprise espère mettre au point une IA qui comprenne mieux sa mission. « Les premières applications sont concluantes ; le système gagne beaucoup en efficacité », confie le spécialiste. Dans cette course à la technologie dominée par les Gafa, la France n’a pas dit son dernier mot.