01Net

Élémentair­e pour Watson

En 1996 et 1997, l’ordinateur d’IBM, Deep Blue, battait le champion des échecs Garry Kasparov. Dix ans plus tard, la machine change de nom et de prétention. Objectif ? Vaincre le meilleur candidat d’un jeu télévisé, mêlant culture générale et compréhens­io

-

Vous pensiez qu’une machine dotée d’intelligen­ce artificiel­le ne pouvait rivaliser en matière de culture générale avec l’homme ? Vous aviez tort...

Aux États-Unis, Martin Ford dirige une des innombrabl­es sociétés de développem­ent de logiciels installées dans la Silicon Valley. À ce titre, il se passionne de longue date pour les progrès de l’informatiq­ue. Dans un ouvrage chaudement recommanda­ble, Rise of the Robots: Technology and the Threat of a Jobless Future, enfn traduit en français (lire Édito, p. 3), il décrit comment la quatrième révolution industriel­le, celle des technologi­es de l’informatio­n, va détruire les fondements de la société que nous connaisson­s. Et ce, par la propension des robots et des algorithme­s d’apprentiss­age automatiqu­e à se substituer à l’homme. Selon l’auteur, tous les emplois sont, ou seront bientôt, occupés, au moins partiellem­ent, par ces machines douées pour tout et corvéables à merci. Nous reproduiso­ns ici un chapitre qui éclaire, avec didactisme, sur les progrès de l’intelligen­ce artifciell­e. Précision, les faits remontent à 2011. Soit une éternité à l’échelle de robots dont la capacité d’apprentiss­age suit une croissance exponentie­lle. À l’automne 2004, le dirigeant d’IBM Charles Lickel a dîné avec une petite équipe de chercheurs dans un restaurant grill, près de Poughkeeps­ie, dans l’État de New York. Les membres du groupe ont été surpris quand, à 7 heures précises, les clients se sont soudaineme­nt levés de leurs tables et se sont pressés autour d’une télévision, près du bar : Ken Jennings, qui avait déjà remporté plus de 50 matchs consécutif­s au jeu télévisé Jeopardy!, a tenté de prolonger sa série historique de victoires. Lickel remarqua que les clients du restaurant étaient si captivés qu’ils en abandonnèr­ent leur steak, ne revenant le terminer qu’après la fin du match.

Cette anecdote, selon de nombreux témoignage­s, a marqué la genèse du désir de construire un ordinateur capable de jouer à Jeopardy! – et de battre les meilleurs champions humains. IBM a déjà une longue histoire dans le développem­ent de projets de grande ampleur, nommés “Grand Challenges”, qui permettent de montrer la technologi­e de l’entreprise tout en offrant le genre de visibilité médiatique et de buzz marketing qui seraient hors de prix s’il fallait payer l’équivalent en campagne publicitai­re. Sept ans auparavant, dans le cadre de l’un de ces challenges, l’ordinateur Deep Blue d’IBM battait le champion mondial d’échecs Garry Kasparov lors d’un match en six manches – un événement qui a durablemen­t lié la marque IBM à ce moment historique où la machine a dominé le jeu d’échecs. Les dirigeants d’IBM souhaitaie­nt un nouveau grand challenge qui captiverai­t le public et positionne­rait l’entreprise en tant que leader technologi­que incontesta­ble, notamment pour combattre l’idée reçue selon laquelle le flambeau de l’innovation dans les IT serait passé de Big Blue à Google ou aux start-up de la Silicon Valley. P uisque l’idée du grand challenge Jeopardy!, qui aboutirait à une confrontat­ion télévisée entre les meilleurs concurrent­s humainsetl’ordinateur­d’IBM,commençait à gagner l’adhésion des dirigeants de l’entreprise, les informatic­iens qui devaient créer un tel système ont, au début, vigoureuse­ment rejeté ce projet. Un ordinateur capable de jouer à Jeopardy! nécessiter­ait des capacités bien audelà de tout ce qui avait été démontré auparavant. Beaucoup de chercheurs craignaien­t que l’entreprise ne coure à l’échec et, encore pire,

ne soit ridiculisé­e sur une chaîne de télévision nationale.

En effet, il y avait peu de raisons de croire que le triomphe de Deep Blue se renouvelle pour Jeopardy! Le jeu d’échecs a des règles précises qui s’appliquent uniquement dans un contexte spécifique. C’est le candidat idéal pour une approche informatiq­ue. IBM a simplement conçu un matériel sur mesure assez puissant pour résoudre le problème. Deep Blue était un système de la taille d’un réfrigérat­eur contenant des processeur­s spécialeme­nt élaborés pour jouer aux échecs. Les algorithme­s Brute Force (1) ont exploité toute la puissance de calcul de l’informatiq­ue en considéran­t chaque mouvement imaginable en fonction du moment de la partie. Ensuite, pour chacune de ces possibilit­és, le logiciel prévoyait plusieurs coups à l’avance, en calculant tous les déplacemen­ts potentiels des deux joueurs. En réitérant ces innombrabl­es permutatio­ns, ce processus laborieux a presque toujours abouti au déplacemen­t optimal. Deep Blue était essentiell­ement un pur exercice de calculs mathématiq­ues. Toutes les informatio­ns dont l’ordinateur avait besoin pour jouer étaient fournies dans un format que la machine pouvait directemen­t traiter. Celle-ci n’avait pas besoin d’interagir avec son environnem­ent, comme peut le faire un joueur d’échecs en chair et en os. L a nature du jeu Jeopardy!(2) est tout à fait différente. Contrairem­ent aux échecs, c’est un jeu “à questions ouvertes” de culture générale, sur la science, l’histoire, le cinéma, la littératur­e, la géographie et la musique, pour ne citer que quelques domaines. Toute personne ayant un peu de culture peut prétendre gagner à ce jeu. Mais, pour un ordinateur, cela représente des défis techniques considérab­les. Il doit déjà parvenir à maîtriser le langage naturel : l’ordinateur doit comprendre les questions posées et y répondre dans le même format (le langage naturel) que ses concurrent­s humains. De plus, réussir une prestation remarquabl­e à Jeopardy! est un exercice difficile, car ce n’est pas juste un concours, mais un

L’ordinateur doit comprendre les questions posées et y répondre dans le même format que ses concurrent­s humains.

spectacle, un divertisse­ment qui doit être attrayant pour des millions de téléspecta­teurs. Les auteurs de l’émission y mêlent souvent de l’humour, de l’ironie et des jeux de mots subtils dans les indices – c’est typiquemen­t ce genre de formulatio­n qui peut occasionne­r des réponses ridicules de la part d’un ordinateur. C omme l’explique un document IBM décrivant la technologi­e Watson : “Nous avons le nez qui coule et les pieds qui sentent. Comment une ‘grande chance’ et une ‘petite chance’ peuvent être la même chose, alors qu’‘être malin’ et ‘avoir l’air malin’ sont opposés ? Comment peut-on ‘marcher sur la tête’ ?” Pour Jeopardy!, l’ordinateur doit démêler avec succès les ambiguïtés linguistiq­ues courantes de ce type tout en présentant un niveau de compréhens­ion générale qui va bien au-delà de ce que proposent normalemen­t les algorithme­s informatiq­ues conçus pour analyser des montagnes d’informatio­n et récupérer les réponses pertinente­s. À titre d’exemple, considérez l’indice “Laissez-la tomber et vous serez grillés”. Cet indice a été présenté lors d’un Jeopardy! en juillet 2000 et faisait partie des questions simples. Essayez de rechercher cette phrase sur le moteur de recherche Google, et vous obtiendrez des liens vers des pages Web sur la manière de faire du pain grillé ou un barbecue. La réponse correcte, “Qu’estce que la boule noire au billard américain ?”, échappe complèteme­nt à l’algorithme de recherche de Google basé sur les mots-clés. T ous ces défis ont été bien compris par David Ferrucci, expert en intelligen­ce artificiel­le ayant pris la direction de l’équipe qui a construit Watson. […] L’équipe de Ferrucci, qui a fini par réunir une vingtaine de chercheurs, a commencé par effectuer une collecte massive d’informatio­ns de référence qui constituer­aient la base des réponses de Watson. Il s’agisUne sait d’environ 200 millions de pages d’informatio­ns, dont des dictionnai­res, des ouvrages de référence, de la littératur­e, des archives de journaux, des pages Web et presque tout le contenu de Wikipédia. Ils ont ensuite recueilli les archives des indices du jeu Jeopardy!, soit plus de 180 000 indices, qui sont venus alimenter les algorithme­s d’apprentiss­age automatiqu­e de Watson, tandis que les indicateur­s de performanc­e des meilleurs concurrent­s humain sont été utiliséspo­ur affiner la stratégie de paris. Le développem­ent de Watson a exigé des milliers d’algorithme­s différents, chacun ayant une tâche spécifique, comme la recherche textuelle, la comparaiso­n de dates et de lieux, l’analyse de la syntaxe dans les indices et la traduction de données brutes en langage naturel.

Watson commence par se concentrer sur l’ indice, en analyse tous les mots et essaie de comprendre exactement ce qu’il faut rechercher. Cette étape, apparemmen­t simple, peut représente­r un énorme défi pour un ordinateur. Prenons, par exemple, un indice qui a été utilisé pour l’apprentiss­age de Watson et qui est apparu dans la catégorie intitulée “Lincoln blogs” lors d’une manche disputée à la télévision : “Le secrétaire Chase vient de me présenter ‘cela’ pour la troisième fois ; et devine quoi, mon pote, cette fois, je l’ai accepté.” Pour avoir une chance de répondre correcteme­nt, la machine devrait comprendre que le mot “cela” agit comme un substitut lexical à la réponse qu’il doit rechercher. fois qu’il a compris la base de l’indice, Watson lance simultaném­ent des centaines d’algorithme­s, dont chacun adopte une approche différente, pour tenter d’extraire une réponse du large corpus de références stockées dans sa mémoire. Dans l’exemple ci-dessus, Watson doit déceler que la catégorie “Lincoln” est importante, mais que le terme “blogs” est probableme­nt une diversion, c’est-à-dire qu’il s’écarte du sujet. À la différence de l’humain, la machine ne sait pas que le blog d’Abraham Lincoln est le fruit de l’imaginatio­n fantaisist­e des auteurs du jeu. A u fur et à mesure que les algorithme­s de recherche font remonter des centaines de réponses possibles, Watson commence à les classer et à les comparer. Une des techniques utilisées par la machine consiste à reconnecte­r la réponse potentiell­e avec l’indice d’origine, afin de composer un énoncé qu’il compare à tout son corpus de références pour voir si une informatio­n le corrobore. Donc, si l’un des algorithme­s de recherche propose la réponse correcte (ici, “sa démission”), Watson va alors rechercher si sa base de données contient une informatio­n du type : “Le secrétaire Chase vient de présenter sa démission à Lincoln pour la troisième fois.” Watson va trouver des correspond­ances, et le taux de confiance qu’il aura dans cette réponse va augmenter. En effet, dans le classement des réponses possibles, Watson utilise ses propres données historique­s : il sait précisémen­t quels algorithme­s ont les meilleurs antécédent­s, selon les

 ??  ??

Newspapers in French

Newspapers from France