El año pasado, un programa de inteligencia artificial llamado AlphaGo creado por el equipo DeepMind de Google venció a un campeón humano en Go, un antiguo juego de estrategia chino que es en muchos aspectos más complejo que el ajedrez. Como Emily Matchar informó para Smithsonian.com en ese momento, fue un logro sorprendente, ya que en 1997 algunas personas predecían que una computadora tardaría 100 años en vencer a un humano en Go.
Si bien la hazaña es impresionante, AlphaGo aprendió a jugar el juego analizando juegos anteriores jugados por humanos. Pero como informa Merrit Kennedy en NPR, una nueva versión de la inteligencia artificial llamada AlphaGo Zero ha descubierto cómo dominar el juego por sí solo, sin intervención ni manipulación humana, un avance que tiene grandes implicaciones para el desarrollo futuro de IA.
Según un comunicado de prensa de DeepMind, las versiones anteriores de AlphaGo aprendieron a jugar el juego mediante el estudio de partidos entre jugadores aficionados profesionales y fuertes, absorbiendo las reglas del juego y las estrategias de juego exitosas. AlphaGo Zero, sin embargo, no miró ningún juego jugado por humanos. En cambio, se le dieron las reglas del juego y luego se jugó contra sí mismo, utilizando el aprendizaje por refuerzo para enseñarse a sí mismo movimientos correctos e incorrectos y estrategias a largo plazo. Mientras la IA jugaba, actualizó su red neuronal avanzada para predecir mejor los movimientos de su oponente.
Los investigadores observaron cómo la IA dominaba el juego en tiempo real. Después de tres días, fue capaz de derrotar a una versión anterior llamada AlphaGo Lee, que venció al maestro coreano de Go Go Lee Sedol en 4 de 5 juegos en 2016. Después de 21 días superó a AlphaGo Master, la versión que venció a los 60 mejores jugadores de Go en línea y el El mejor jugador del mundo Ke Jie a principios de este año. La última versión superó los juegos AlphaGo Master 100 a 0. Después de 40 días, alcanzó niveles de juego que nadie había visto antes. La investigación aparece en la revista Nature.
"En un corto espacio de tiempo, AlphaGo Zero ha entendido todo el conocimiento de Go que los humanos han acumulado durante miles de años de juego", dice el investigador principal David Silver de DeepMind de Google en un video de Youtube. "A veces se elige ir más allá de eso y descubrió algo que los humanos ni siquiera habían descubierto en este período de tiempo y descubrieron nuevos conocimientos que son creativos y novedosos en muchos sentidos".
Como informa la Agencia France-Presse, AlphaGo Zero alcanzó este nivel de dominio mucho más eficientemente que sus predecesores. Mientras que la iteración anterior tenía 48 unidades de procesamiento de datos y jugó 30 millones de juegos de entrenamiento en el transcurso de varios meses, Zero solo tenía 4 unidades de procesamiento y jugó 4.9 millones de juegos de entrenamiento durante tres días. "La gente tiende a suponer que el aprendizaje automático se trata de grandes datos y cantidades masivas de cómputo, pero en realidad lo que vimos con AlphaGo Zero es que los algoritmos importan mucho más", Silver le dice a AFP.
Pero la investigación es más que solo dominar un juego de mesa. Como informa Ian Sample en The Guardian, este tipo de tabula rasa, o pizarra en blanco, el aprendizaje podría conducir a una nueva generación de inteligencia artificial de propósito general que podría ayudar a resolver problemas en campos que pueden simularse bien en una computadora, como la composición de drogas, plegamiento de proteínas o física de partículas. Al construir su conocimiento desde cero sin prejuicios ni limitaciones humanas, los algoritmos podrían ir en direcciones que los humanos aún no han pensado mirar.
Mientras que muchas personas en la comunidad de IA ven a AlphaGo Zero como un gran logro, Gary Marcus, profesor de psicología en la Universidad de Nueva York que se especializa en inteligencia artificial, le dice a Kennedy de NPR que no cree que el algoritmo sea realmente tabula rasa porque el conocimiento humano previo fue en la construcción del algoritmo. Tampoco cree que tabula rasa AI sea tan importante como parece. "[En] biología, los cerebros humanos reales no son tabula rasa ... No veo la razón teórica principal por la que deberías hacer eso, por qué deberías abandonar muchos de los conocimientos que tenemos sobre el mundo", dice.
Aun así, el rápido dominio del juego de Alpha Go es impresionante, y un poco aterrador.