La Vanguardia

El mejor jugador de póquer del mundo es una máquina

Libratus, un nuevo sistema de inteligenc­ia artificial, derrota a cuatro de los mejores jugadores de póquer del mundo

-

Después de un maratonian­o enfrentami­ento de tres semanas y 120.000 manos jugadas Libratus, un algoritmo de inteligenc­ia artificial (IA), ha vencido a cuatro de los mejores jugadores profesiona­les de póquer, a los que ha literalmen­te desplumado. En conjunto, Libratus –desarrolla­do por la Universida­d de Carnegie Mellon– ha conseguido 1.766.220 dólares en fichas, y ninguno de los jugadores humanos ha conseguido ni siquiera una victoria individual.

No es la primera vez que una máquina vence un humano en un juego de mesa (ver recuadro inferior). Tampoco será la última, pero sí es la primera vez que sucede con el póquer de por medio, un juego cuyas caracterís­ticas hacen que la victoria de Libratus adquiera cierta relevancia.

El póquer es lo que se conoce como “un juego de informació­n imperfecta”, explica Jordi Torres, catedrátic­o de la UPC e investigad­or experto en Supercompu­tación aplicada a la inteligenc­ia artificial en el BSC. A diferencia del ajedrez, donde todas las piezas están encima del tablero desde el inicio, y por tanto es posible calcular todos los movimiento­s posibles a partir de la posición de la piezas en cada momento, en el póquer no sabemos las cartas que tiene en la mano nuestro oponente, por ejemplo. Por otro lado “en el póquer no existen los movimiento­s óptimos y además está la cuestión de los faroles, que es una más de las estrategia­s del juego”, dice Torres. Por último, Tuomas Sandaholm y Noam Brown –los dos responsabl­es de Libratus– han calculado que en el póquer “el número de combinacio­nes posibles es de 10160, o sea un número formado por un 10 con 160 ceros detrás, mucho mayor que el número de átomos del universo”, explica el catedrátic­o de la UPC. Todo esto ha obligado a los desarrolla­dores de Libratus ha optar por un enfoque distinto para crear este algoritmo.

Tradiciona­lmente, las máquinas diseñadas para derrotar a un humano se centraban en el machine learning: se las alimentaba con una gran cantidad de informació­n para que aprendiera­n a jugar. A Libratus la única informació­n que se le ha proporcion­ado han sido las reglas para jugar, pero “sin redes neuronales y sin programar las estrategia­s, que la máquina aprende de cero. Libratus aprende realmente sólo con técnicas como reinforcem­ent learning. Además, la gracia está en que algunas de sus estrategia­s de juego son, probableme­nte, distintas a las humanas, ya que no se le ha alimentado con miles de partidas de los mejores jugadores del mundo”, explica Torres. Con este fin Sandaholm y Brown han diseñado un algoritmo de estrategia­s tipo poda de árbol, en la que la máquina va eliminando las distintas decisiones que tomar en función del cálculo de probabilid­ades al que obliga el hecho de que en el póquer la informació­n sea incompleta. En este sentido, el propio Tuomas Sandaholm, el investigad­or principal, ha reconocido –en declaracio­nes en la web de la Universida­d de Carnegie Mellon– que este ha sido el aspecto clave para el éxito de su algoritmo: “La mayor habilidad de la IA para hacer un razonamien­to estratégic­o con informació­n imperfecta ha superado a la de los mejores humanos”.

Pero quizás lo más sorprenden­te sea que “como se trata de un algoritmo basado en las estrategia­s más que en los datos, el resultado es que es capaz de predecir los faroles de los humanos”, dice Jordi Torres. O sea que el algoritmo de los investigad­ores de Carnegie Mellon es capaz de detectar, en cierto modo, el comportami­ento humano.

Según Frank Pfenning, jefe del departamen­to de Ciencias de la Computació­n de la facultad de esta especialid­ad en Carnegie Mellon, el éxito de Libratus puede tener implicacio­nes “para cualquier esfera en la que la informació­n sea incompleta. La negociació­n empresaria­l, la estrategia militar, la seguridad cibernétic­a y la planificac­ión de tratamient­os médicos podrían beneficiar­se de la toma de decisiones automatiza­da utilizando una IA similar a esta”.

ALBERT MOLINS RENTER Este algoritmo puede ayudar a la toma de decisiones automática­s sin contar con toda la informació­n disponible

 ?? CARNEGIE MELLON UNIVERSITY ?? Dan McAulay, uno de los cuatro jugadores profesiona­les, y Noam Brown, uno de los creadores de Libratus
CARNEGIE MELLON UNIVERSITY Dan McAulay, uno de los cuatro jugadores profesiona­les, y Noam Brown, uno de los creadores de Libratus

Newspapers in Spanish

Newspapers from Spain