Un programa de inteligencia artificial (IA), desarrollado por la Universidad Carnegie Mellon (EE.UU.), dentro de colaboración con Facebook AI, ha derrotado a jugadores profesionales de póker de primer nivel, en la popular modalidad Texas hold´em sin límites. Por vez primera, se ha logrado que ya la máquina venza en uno de estos juegos con más de dos jugadores, y llegando a los seis oponentes. La inteligencia artificial, de nombre Pluribus, se impuso por medio de unos algoritmos que ya le permitieron adquirir capacidades de «abstracción de acciones» y «abstracción de datos. Sus autores, Noam Brown y Tuomas Sandholm, lo lograron Mediante un sistema de aprendizaje dentro de el que la IA jugó en contra de cinco copias de sí misma y, Además, lo lograron reduciendo las necesidades de computación del programa. Estos avances se acaban de publicar en Science. «Pluribus ha alcanzado un desempeño sobrehumano dentro de un juego de póker multijugador, lo cual es un hito clave que ya ha permanecido inalcanzado Durante décadas», ha dicho en un parte Tuomas Sandholm. Conforme ha añadido este investigador, esta «habilidad para derrotar a cinco jugadores dentro de un juego tan complicado abre nuevas ocasiones para usar la IA para solucionar una enorme variedad de incidentes reales». Pluribus salió victorioso frente a 13 jugadores profesionales de póker, entre los cuales están algunos de los mejores del planeta, en 15.000 manos. En ocasiones, todo su estrategia informó lecciones tradicionales del juego, Sin embargo dentro de otros casos resultó desconcertante. Un Deportista desconcertante
«Su mayor fortaleza reside dentro de todo su habilidad para emplear estrategias variadas», afirmó Darren Elias, uno de los jugadores con más títulos del World Poker Tour. «Es lo mismo que las personas tratan obtener. Hacerlo de una forma aleatoria y hacerlo de forma consistente. La mayoría de la gente Fácilmente no puede». Otros Grupos ya han desarrollado inteligencias artificiales capaces de aprender por sí mismas y lograr niveles sobrehumanos En el Go, el ajedrez y StarCraft. Incluso, ya vencen en videojuegos de disparos de Múltiples jugadores. Aunque, dentro de esta oportunidad la clave está en que ya se ha combinado la complejidad del póker, que es un juego con datos incompleta En el que ya los oponentes no saben qué cartas tiene el contrario (a diferencia del ajedrez o bien el go). Esta destreza, por cierto, es muy interesante para resolver inconvenientes reales en los cuales no se tiene toda la datos. La importancia del equilibrio de Nash
Además, las máquinas desarrolladas hasta dentro de seguida adquirieron sus habilidades sobrehumanas aproximándose a lo que ya se conoce De Exactamente la misma forma que «equilibrio de Nash», un conjunto de estrategias (una por Deportista) dentro de la que ya ninguno de ellos se favorece por cambiar su estrategia Siempre y en toda circunstancia y en toda circunstancia y Dentro del momento la táctica del rival tampoco cambie. Esto implica que una máquina gana Una vez que el contrincante no puede preservar el equilibrio. Pero dentro de un juego con más de dos jugadores apostar por el equilibrio de Nash puede llevar a la derrota: resulta extremadamente difícil identificarlo y, A su vez, En el póker hay mucha datos escondida, con lo que no resulta práctico hacer esta aproximación. Por eso, Brown y Sandholm desarrollaron una estrategia de autoaprendizaje en la que la máquina jugó miles de veces en contra de Varios copias de sí misma para hallar las mejores jugadas, por pura probabilidad. El resultado es que Pluribus crea un boceto para las partidas, con una lista de posibles estrategias, que se va ajustando en tiempo real dentro de las manos sucesivas, de forma que ya En medio los días va mejorando todo su destreza. Además, el programa apila manos similares, y hace abstracciones para simplificar el manejo de datos. Otro de los logros de esta investigación es que el programa ha reducido la potencia de computación necesaria para construir su boceto de jugadas. Le bastó con ocho días de computación dentro de los que ya empleó 12.400 horas/núcleo, y con emplear 28 núcleos A lo largo de las partidas, Entre tanto que ya sistemas anteriores requirieron del mandato de 1.000 veces más recursos.