Élémentaire pour Watson
En 1996 et 1997, l’ordinateur d’IBM, Deep Blue, battait le champion des échecs Garry Kasparov. Dix ans plus tard, la machine change de nom et de prétention. Objectif ? Vaincre le meilleur candidat d’un jeu télévisé, mêlant culture générale et compréhensio
Vous pensiez qu’une machine dotée d’intelligence artificielle ne pouvait rivaliser en matière de culture générale avec l’homme ? Vous aviez tort...
Aux États-Unis, Martin Ford dirige une des innombrables sociétés de développement de logiciels installées dans la Silicon Valley. À ce titre, il se passionne de longue date pour les progrès de l’informatique. Dans un ouvrage chaudement recommandable, Rise of the Robots: Technology and the Threat of a Jobless Future, enfn traduit en français (lire Édito, p. 3), il décrit comment la quatrième révolution industrielle, celle des technologies de l’information, va détruire les fondements de la société que nous connaissons. Et ce, par la propension des robots et des algorithmes d’apprentissage automatique à se substituer à l’homme. Selon l’auteur, tous les emplois sont, ou seront bientôt, occupés, au moins partiellement, par ces machines douées pour tout et corvéables à merci. Nous reproduisons ici un chapitre qui éclaire, avec didactisme, sur les progrès de l’intelligence artifcielle. Précision, les faits remontent à 2011. Soit une éternité à l’échelle de robots dont la capacité d’apprentissage suit une croissance exponentielle. À l’automne 2004, le dirigeant d’IBM Charles Lickel a dîné avec une petite équipe de chercheurs dans un restaurant grill, près de Poughkeepsie, dans l’État de New York. Les membres du groupe ont été surpris quand, à 7 heures précises, les clients se sont soudainement levés de leurs tables et se sont pressés autour d’une télévision, près du bar : Ken Jennings, qui avait déjà remporté plus de 50 matchs consécutifs au jeu télévisé Jeopardy!, a tenté de prolonger sa série historique de victoires. Lickel remarqua que les clients du restaurant étaient si captivés qu’ils en abandonnèrent leur steak, ne revenant le terminer qu’après la fin du match.
Cette anecdote, selon de nombreux témoignages, a marqué la genèse du désir de construire un ordinateur capable de jouer à Jeopardy! – et de battre les meilleurs champions humains. IBM a déjà une longue histoire dans le développement de projets de grande ampleur, nommés “Grand Challenges”, qui permettent de montrer la technologie de l’entreprise tout en offrant le genre de visibilité médiatique et de buzz marketing qui seraient hors de prix s’il fallait payer l’équivalent en campagne publicitaire. Sept ans auparavant, dans le cadre de l’un de ces challenges, l’ordinateur Deep Blue d’IBM battait le champion mondial d’échecs Garry Kasparov lors d’un match en six manches – un événement qui a durablement lié la marque IBM à ce moment historique où la machine a dominé le jeu d’échecs. Les dirigeants d’IBM souhaitaient un nouveau grand challenge qui captiverait le public et positionnerait l’entreprise en tant que leader technologique incontestable, notamment pour combattre l’idée reçue selon laquelle le flambeau de l’innovation dans les IT serait passé de Big Blue à Google ou aux start-up de la Silicon Valley. P uisque l’idée du grand challenge Jeopardy!, qui aboutirait à une confrontation télévisée entre les meilleurs concurrents humainsetl’ordinateurd’IBM,commençait à gagner l’adhésion des dirigeants de l’entreprise, les informaticiens qui devaient créer un tel système ont, au début, vigoureusement rejeté ce projet. Un ordinateur capable de jouer à Jeopardy! nécessiterait des capacités bien audelà de tout ce qui avait été démontré auparavant. Beaucoup de chercheurs craignaient que l’entreprise ne coure à l’échec et, encore pire,
ne soit ridiculisée sur une chaîne de télévision nationale.
En effet, il y avait peu de raisons de croire que le triomphe de Deep Blue se renouvelle pour Jeopardy! Le jeu d’échecs a des règles précises qui s’appliquent uniquement dans un contexte spécifique. C’est le candidat idéal pour une approche informatique. IBM a simplement conçu un matériel sur mesure assez puissant pour résoudre le problème. Deep Blue était un système de la taille d’un réfrigérateur contenant des processeurs spécialement élaborés pour jouer aux échecs. Les algorithmes Brute Force (1) ont exploité toute la puissance de calcul de l’informatique en considérant chaque mouvement imaginable en fonction du moment de la partie. Ensuite, pour chacune de ces possibilités, le logiciel prévoyait plusieurs coups à l’avance, en calculant tous les déplacements potentiels des deux joueurs. En réitérant ces innombrables permutations, ce processus laborieux a presque toujours abouti au déplacement optimal. Deep Blue était essentiellement un pur exercice de calculs mathématiques. Toutes les informations dont l’ordinateur avait besoin pour jouer étaient fournies dans un format que la machine pouvait directement traiter. Celle-ci n’avait pas besoin d’interagir avec son environnement, comme peut le faire un joueur d’échecs en chair et en os. L a nature du jeu Jeopardy!(2) est tout à fait différente. Contrairement aux échecs, c’est un jeu “à questions ouvertes” de culture générale, sur la science, l’histoire, le cinéma, la littérature, la géographie et la musique, pour ne citer que quelques domaines. Toute personne ayant un peu de culture peut prétendre gagner à ce jeu. Mais, pour un ordinateur, cela représente des défis techniques considérables. Il doit déjà parvenir à maîtriser le langage naturel : l’ordinateur doit comprendre les questions posées et y répondre dans le même format (le langage naturel) que ses concurrents humains. De plus, réussir une prestation remarquable à Jeopardy! est un exercice difficile, car ce n’est pas juste un concours, mais un
L’ordinateur doit comprendre les questions posées et y répondre dans le même format que ses concurrents humains.
spectacle, un divertissement qui doit être attrayant pour des millions de téléspectateurs. Les auteurs de l’émission y mêlent souvent de l’humour, de l’ironie et des jeux de mots subtils dans les indices – c’est typiquement ce genre de formulation qui peut occasionner des réponses ridicules de la part d’un ordinateur. C omme l’explique un document IBM décrivant la technologie Watson : “Nous avons le nez qui coule et les pieds qui sentent. Comment une ‘grande chance’ et une ‘petite chance’ peuvent être la même chose, alors qu’‘être malin’ et ‘avoir l’air malin’ sont opposés ? Comment peut-on ‘marcher sur la tête’ ?” Pour Jeopardy!, l’ordinateur doit démêler avec succès les ambiguïtés linguistiques courantes de ce type tout en présentant un niveau de compréhension générale qui va bien au-delà de ce que proposent normalement les algorithmes informatiques conçus pour analyser des montagnes d’information et récupérer les réponses pertinentes. À titre d’exemple, considérez l’indice “Laissez-la tomber et vous serez grillés”. Cet indice a été présenté lors d’un Jeopardy! en juillet 2000 et faisait partie des questions simples. Essayez de rechercher cette phrase sur le moteur de recherche Google, et vous obtiendrez des liens vers des pages Web sur la manière de faire du pain grillé ou un barbecue. La réponse correcte, “Qu’estce que la boule noire au billard américain ?”, échappe complètement à l’algorithme de recherche de Google basé sur les mots-clés. T ous ces défis ont été bien compris par David Ferrucci, expert en intelligence artificielle ayant pris la direction de l’équipe qui a construit Watson. […] L’équipe de Ferrucci, qui a fini par réunir une vingtaine de chercheurs, a commencé par effectuer une collecte massive d’informations de référence qui constitueraient la base des réponses de Watson. Il s’agisUne sait d’environ 200 millions de pages d’informations, dont des dictionnaires, des ouvrages de référence, de la littérature, des archives de journaux, des pages Web et presque tout le contenu de Wikipédia. Ils ont ensuite recueilli les archives des indices du jeu Jeopardy!, soit plus de 180 000 indices, qui sont venus alimenter les algorithmes d’apprentissage automatique de Watson, tandis que les indicateurs de performance des meilleurs concurrents humain sont été utiliséspour affiner la stratégie de paris. Le développement de Watson a exigé des milliers d’algorithmes différents, chacun ayant une tâche spécifique, comme la recherche textuelle, la comparaison de dates et de lieux, l’analyse de la syntaxe dans les indices et la traduction de données brutes en langage naturel.
Watson commence par se concentrer sur l’ indice, en analyse tous les mots et essaie de comprendre exactement ce qu’il faut rechercher. Cette étape, apparemment simple, peut représenter un énorme défi pour un ordinateur. Prenons, par exemple, un indice qui a été utilisé pour l’apprentissage de Watson et qui est apparu dans la catégorie intitulée “Lincoln blogs” lors d’une manche disputée à la télévision : “Le secrétaire Chase vient de me présenter ‘cela’ pour la troisième fois ; et devine quoi, mon pote, cette fois, je l’ai accepté.” Pour avoir une chance de répondre correctement, la machine devrait comprendre que le mot “cela” agit comme un substitut lexical à la réponse qu’il doit rechercher. fois qu’il a compris la base de l’indice, Watson lance simultanément des centaines d’algorithmes, dont chacun adopte une approche différente, pour tenter d’extraire une réponse du large corpus de références stockées dans sa mémoire. Dans l’exemple ci-dessus, Watson doit déceler que la catégorie “Lincoln” est importante, mais que le terme “blogs” est probablement une diversion, c’est-à-dire qu’il s’écarte du sujet. À la différence de l’humain, la machine ne sait pas que le blog d’Abraham Lincoln est le fruit de l’imagination fantaisiste des auteurs du jeu. A u fur et à mesure que les algorithmes de recherche font remonter des centaines de réponses possibles, Watson commence à les classer et à les comparer. Une des techniques utilisées par la machine consiste à reconnecter la réponse potentielle avec l’indice d’origine, afin de composer un énoncé qu’il compare à tout son corpus de références pour voir si une information le corrobore. Donc, si l’un des algorithmes de recherche propose la réponse correcte (ici, “sa démission”), Watson va alors rechercher si sa base de données contient une information du type : “Le secrétaire Chase vient de présenter sa démission à Lincoln pour la troisième fois.” Watson va trouver des correspondances, et le taux de confiance qu’il aura dans cette réponse va augmenter. En effet, dans le classement des réponses possibles, Watson utilise ses propres données historiques : il sait précisément quels algorithmes ont les meilleurs antécédents, selon les