Nou­velle avan­cée ma­jeure pour DeepMind dans l’IA et les jeux

Les Echos - - ENTREPRISES & MARCHES - Be­noît Georges @ben­georges —En­voyé spé­cial à Mon­tréal

En jan­vier 2016, la start-up bri­tan­nique DeepMind fai­sait la une de la re­vue scien­ti­fique « Na­ture » en pré­sen­tant Al­phaGo, le pre­mier sys­tème d’in­tel­li­gence ar­ti­fi­cielle (IA) ca­pable de battre un cham­pion hu­main de jeu de go – un ex­ploit que les ex­perts ne pen­saient pas pos­sible avant une dé­cen­nie. Trois ans après, cette fi­liale d’Al­pha­bet (mai­son mère de Google) ré­ci­dive : elle s’af­fiche ce ven­dre­di en cou­ver­ture de « Science », l’autre ré­fé­rence des pu­bli­ca­tions scien­ti­fiques, avec une nou­velle IA conçue pour les jeux, Al­phaZe­ro.

Contrai­re­ment à son aî­né Al­phaGo, Al­phaZe­ro ne se li­mite pas au jeu de go : le même al­go­rithme est éga­le­ment cham­pion d’échecs et de sho­gi, un jeu proche des échecs très po­pu­laire au Ja­pon. Cette fois, Al­phaZe­ro n’a pas eu à af­fron­ter des hu­mains, mais d’autres lo­gi­ciels, tous consi­dé­rés comme su­pé­rieurs aux meilleurs cham­pions : Stock­fish pour les échecs, El­mo pour le sho­gi, et Al­phaGo Ze­ro (conçu par DeepMind en 2017) pour le go. Il s’est lar­ge­ment im­po­sé dans tous les cas, no­tam­ment aux échecs avec 155 vic­toires et seu­le­ment 6 dé­faites sur 1.000 par­ties (les autres s’étant ter­mi­nées par un nul).

L’al­go­rithme s’est en­traî­né tout seul, en jouant des cen­taines de mil­liers de coups contre lui-même.

Mais la plus im­pres­sion­nante avan­cée d’Al­phaZe­ro est qu’à la dif­fé­rence des gé­né­ra­tions pré­cé­dentes de lo­gi­ciels de jeux, il n’a pas été pro­gram­mé ou en­traî­né à par­tir de don­nées ve­nant de par­ties jouées par des hu­mains : l’al­go­rithme s’est en­traî­né tout seul, à par­tir des règles du jeu, en jouant des cen­taines de mil­liers de coups contre lui-même. Cette phase d’en­traî­ne­ment, uti­li­sant une tech­nique ap­pe­lée « ap­pren­tis­sage par ren­for­ce­ment », a mo­bi­li­sé 5.000 pro­ces­seurs pen­dant neuf heures pour les échecs, douze heures pour le sho­gi, et treize jours pour le go.

A l’ar­ri­vée, non seu­le­ment la ma­chine est plus per­for­mante que les meilleurs pro­grammes au monde, mais sa stra­té­gie de jeu est to­ta­le­ment in­édite. « Al­phaZe­ro joue d’une ma­nière ex­trê­me­ment in­no­vante, ni comme un hu­main, ni comme une ma­chine, avec une stra­té­gie de jeu très dy­na­mique », ex­pli­quait mer­cre­di aux « Echos » le fon­da­teur et PDG de DeepMind, De­mis Has­sa­bis, en marge de la confé­rence d’in­tel­li­gence ar­ti­fi­cielle NeurIPS de Mon­tréal. Sa fa­çon de jouer aux échecs semble ve­nir d’une autre pla­nète. »

Si DeepMind se fait ré­gu­liè­re­ment re­mar­quer pour ses ré­sul­tats spec­ta­cu­laires dans le do­maine des jeux, l’en­tre­prise ra­che­tée par Google en 2014 pour 600 mil­lions de dol­lars est loin de se li­mi­ter à ce do­maine. En dé­but de se­maine, elle a dé­voi­lé un sys­tème d’IA ap­pe­lé Al­phaFold, ca­pable de pré­dire la struc­ture en 3D d’une pro­téine à par­tir de son sé­quen­çage ADN – une dé­cou­verte qui pour­rait à terme ac­cé­lé­rer la re­cherche mé­di­cale. Pour De­mis Has­sa­bis, « Al­phaFold cor­res­pond exac­te­ment à ce que nous vou­lons faire chez DeepMind : uti­li­ser l’in­tel­li­gence ar­ti­fi­cielle pour ai­der les ex­perts à faire de grandes dé­cou­vertes plus ra­pi­de­ment. » ■

Newspapers in French

Newspapers from France

© PressReader. All rights reserved.