La intel·ligència artificial també s’imposa jugant al pòquer
Libratus intenta derrotar quatre dels millors jugadors de pòquer del món amb un nou enfocament de programació
El pòquer és un joc que normalment associem als casinos o a partides clandestines en antres, soterranis i golfes plenes de fum i whisky barat. Potser no té glamur i sí certa llegenda negra de ser un joc de busca-raons i tafurs, però en els últims temps gaudeix de certa popularitat gràcies als casinos en línia i als tornejos de pòquer professional que fins i tot es retransmeten per televisió.
Des del passat 11 de gener, quatre jugadors professionals de pòquer disputen un maratonià torneig de vint dies de durada i 120.000 mans –al River Casino de Pittsburgh– en què hi ha en joc un pot de 200.000 dòlars. A la taula també s’hi asseu un cinquè jugador –que amaga un as sota la màniga–, i que respon al nom de Libratus. No és un pseudònim. Es tracta del nom de l’últim programa d’intel·ligència artificial (IA) creat per demostrar –una vegada més–, que les màquines són millors que nosaltres en tot. Els creadors de Libratus són investigadors de l’escola de Ciències de la Computació de la Universitat Carnegie Mellon dels Estats Units.
Libratus segueix els passos de Deep Blue (escacs), Alpha Go (go) i de Claudico, la versió anterior de Libratus, que ja va jugar al pòquer amb quatre professionals el 2015. En aquella ocasió, tres dels quatre jugadors van aconseguir més fitxes que Claudico, però els seus creadors, l’equip liderat per Tuomas Sandholm, va dir que les 80.000 mans que s’havien jugat eren insuficients “estadísticament” per establir amb seguretat que en el pòquer la intel·ligència humana continuava sent superior a l’artificial. Per això en el torneig actual es jugaran 120.000 mans.
I és que el pòquer presenta peculiaritats que fan que sigui un repte més difícil d’aconseguir per a l’IA. Segons un article publicat a la MIT Technology Review, a diferència dels jocs de tauler, els escacs o el go, el pòquer és un joc d’“informació imperfecta”, i per aquesta raó és més resistent a la computerització. En els escacs o el go, tota la informació està a la vista en un tauler que reflecteix el resultat de “totes les jugades que s’han fet fins al moment” i la situació actual de la partida, mentre que en el pòquer hi ha “informació crucial desconeguda, com les cartes –les mans– de la resta de jugadors”, explica Sandholm en un comunicat de la universitat.
A més, tant el 2015 com en aquesta ocasió es juga al pòquer en una variant –la Texas Hold’em Heads-Up No-Limit– que es considera una de les més difícils, ja que ofereix moltes més probabilitats. Tradicionalment, les màquines d’intel·ligència artificial dissenyades per derrotar un humà en qualsevol joc se centraven en estratègies basades en el machine learning: se les alimentava amb una quantitat ingent d’informació perquè aprenguessin a jugar.
Els programadors de Libratus han canviat d’enfocament. L’única informació que li han proporcionat han estat les regles per jugar. Res d’introduir-li tots els llibres de pòquer que s’han publicat. Les regles i uns algoritmes basats en el joc racional i l’estratègia de l’equilibri de Nash (desenvolupada pel científic John Forbes Nash Jr, el de la pel·lícula Una ment meravellosa).
I sembla que aquest canvi de paradigma està donant bons resultats. De moment, després de tres dies de torneig, s’han jugat gairebé 18.000 mans i Libratus està plomant els seus oponents. Tots els jugadors humans perden entre els 9.560 dòlars del que menys i els 76.991 del que més. O el que és el mateix: Libratus guanya, de moment, 193.300 dòlars.
De moment la màquina està plomant els quatre jugadors humans i ja els guanya 193.300 dòlars