https://frosthead.com

Esta IA que juega al póker sabe cuándo sostenerlos y cuándo doblarlos

Un programa de computadora llamado Pluribus ha superado a los profesionales del póker en una serie de juegos Texas Hold'em sin límite de seis jugadores, alcanzando un hito en la investigación de inteligencia artificial. Es el primer bot en vencer a los humanos en una compleja competencia multijugador.

Como los investigadores del laboratorio de IA de Facebook y la Universidad Carnegie Mellon informan en la revista Science, Pluribus salió victorioso en partidos dominados por humanos y algoritmos. Inicialmente, Merrit Kennedy escribe para NPR, cinco versiones del bot enfrentadas contra un jugador profesional de póker; En la siguiente ronda de experimentos, un robot jugó contra cinco humanos. Según una publicación de blog de Facebook, la IA ganó un promedio de alrededor de $ 5 por mano, o $ 1, 000 por hora, al jugar contra cinco oponentes humanos. Esta tasa se considera un "margen decisivo de victoria" entre los profesionales del póker.

Hablando con Kennedy, el cuatro veces campeón del World Poker Tour, Darren Elias, explica que ayudó a entrenar a Pluribus al competir contra cuatro mesas de rivales bot y alertar a los científicos cuando la IA cometió un error. Pronto, el bot "estaba mejorando muy rápidamente, pasando de ser un jugador mediocre a básicamente un jugador de póker de nivel mundial en cuestión de días y semanas". La experiencia, dice Elias, fue "bastante aterradora".

Según James Vincent, de Verge, Pluribus, una IA sorprendentemente de bajo costo entrenada con menos de $ 150 en recursos de computación en la nube, dominó aún más la estrategia de póker jugando contra copias de sí mismo y aprendiendo a través de prueba y error. Como Jennifer Ouellette señala para Ars Technica, el bot rápidamente se dio cuenta de que su mejor curso de acción era una combinación de jugabilidad y movimientos impredecibles.

La mayoría de los profesionales humanos evitan las "apuestas donk", que encuentran a un jugador que termina una ronda con una llamada y comienza la siguiente con una apuesta, pero Pluribus adoptó fácilmente la estrategia impopular. Al mismo tiempo, informa Ouellette, la IA también ofreció tamaños de apuesta inusuales y exhibió una mejor aleatorización que los oponentes.

"Su mayor fortaleza es su capacidad para usar estrategias mixtas", dijo Elias, según un comunicado de CMU. “Eso es lo mismo que los humanos intentan hacer. Es una cuestión de ejecución para los humanos: hacer esto de una manera perfectamente aleatoria y hacerlo de manera consistente. La mayoría de la gente simplemente no puede ".

Pluribus no es la primera IA que juega póker en derrotar a profesionales humanos. En 2017, los creadores del bot, Noam Brown y Tuomas Sandholm, desarrollaron una iteración anterior del programa llamado Libratus. Esta IA derrotó decisivamente a cuatro profesionales del póker en 120, 000 manos de Texas Hold'em de dos jugadores, pero como explica la publicación del blog de Facebook, estaba limitada por el hecho de que solo se enfrentaba a un oponente a la vez.

Según Will Knight de MIT Technology Review, el póker representa un desafío para la IA porque involucra a múltiples jugadores y una gran cantidad de información oculta. Comparativamente, juegos como el ajedrez y Go involucran solo dos participantes, y las posiciones de los jugadores son visibles para todos.

Para superar estos obstáculos, Brown y Sandholm crearon un algoritmo diseñado para predecir los próximos dos o tres movimientos de los oponentes en lugar de medir sus pasos hasta el final del juego. Aunque esta estrategia parezca priorizar la ganancia a corto plazo sobre las ganancias a largo plazo, el Vincent de Verge escribe que "la incisividad a corto plazo es realmente todo lo que necesitas".

En el futuro, los programas multijugador como Pluribus podrían usarse para diseñar medicamentos capaces de combatir las bacterias resistentes a los antibióticos, así como para mejorar la ciberseguridad y los sistemas robóticos militares. Como Ouellette, de Ars Technica, señala que otras aplicaciones potenciales incluyen la supervisión de negociaciones multipartitas, la fijación de precios de productos y la lluvia de ideas sobre estrategias de licitación de subastas.

Por ahora, Brown le dice a Knight, el algoritmo permanecerá en secreto, principalmente para proteger a la industria del póker en línea de incurrir en pérdidas financieras devastadoras.

El investigador concluye: "Podría ser muy peligroso para la comunidad del póker".

Esta IA que juega al póker sabe cuándo sostenerlos y cuándo doblarlos