https://frosthead.com

La nueva IA de Google es un maestro de los juegos, pero ¿cómo se compara con la mente humana?

Para los humanos, el ajedrez puede tomar toda una vida para dominarlo. Pero el nuevo programa de inteligencia artificial de Google DeepMind, AlphaZero, puede aprender a conquistar el tablero en cuestión de horas.

Sobre la base de su éxito anterior con la suite AlphaGo, una serie de programas de computadora diseñados para jugar al juego de mesa chino Go, Google se jacta de que su nuevo AlphaZero logra un nivel de "rendimiento sobrehumano" en no solo un juego de mesa, sino tres: Go, ajedrez y shogi (esencialmente, ajedrez japonés). El equipo de científicos e ingenieros informáticos, dirigido por David Silver de Google, informó sus hallazgos recientemente en la revista Science .

"Antes de esto, con el aprendizaje automático, podría obtener una máquina para hacer exactamente lo que quiere, pero solo eso", dice Ayanna Howard, experta en computación interactiva e inteligencia artificial en el Instituto de Tecnología de Georgia que no participó en el investigación. "Pero AlphaZero muestra que puede tener un algoritmo que no es tan [específico] y que puede aprender dentro de ciertos parámetros".

La programación inteligente de AlphaZero ciertamente sube la apuesta en el juego para humanos y máquinas, pero Google siempre ha puesto su mira en algo más grande: la inteligencia de ingeniería.

Los investigadores tienen cuidado de no afirmar que AlphaZero está al borde de la dominación mundial (otros han sido un poco más rápidos para saltar el arma). Aún así, Silver y el resto del equipo de DeepMind ya tienen la esperanza de que algún día verán un sistema similar aplicado al diseño de medicamentos o la ciencia de los materiales.

Entonces, ¿qué hace que AlphaZero sea tan impresionante?

El juego ha sido venerado durante mucho tiempo como un estándar de oro en la investigación de inteligencia artificial. Los juegos estructurados e interactivos son simplificaciones de escenarios del mundo real: se deben tomar decisiones difíciles; las victorias y las derrotas aumentan las apuestas; y la predicción, el pensamiento crítico y la estrategia son clave.

Codificar este tipo de habilidad es complicado. Las IA más antiguas de los juegos, incluidos los primeros prototipos del AlphaGo original, se han llenado tradicionalmente de códigos y datos para imitar la experiencia que generalmente se obtiene a través de años de juego humano natural (esencialmente, un volcado de conocimiento pasivo derivado del programador). Con AlphaGo Zero (la versión más reciente de AlphaGo), y ahora AlphaZero, los investigadores le dieron al programa solo una entrada: las reglas del juego en cuestión. Luego, el sistema se agachó y aprendió activamente los trucos del comercio en sí.

Ir AlphaZero se basa en AlphaGo Zero, parte de la suite AlphaGo diseñada para jugar al juego de mesa chino Go, en la foto de arriba. Las primeras iteraciones del programa original fueron alimentadas con datos de juegos humanos contra humanos; versiones posteriores dedicadas a la autoaprendizaje, en las que el software jugaba contra sí mismo para aprender su propia estrategia. (Chad Miller / Flickr / CC BY-SA 2.0)

Esta estrategia, llamada aprendizaje de refuerzo de auto-juego, es más o menos exactamente lo que parece: para entrenar para las grandes ligas, AlphaZero jugó en iteración tras iteración, perfeccionando sus habilidades por prueba y error. Y el enfoque de la fuerza bruta valió la pena. A diferencia de AlphaGo Zero, AlphaZero no solo juega Go: también puede vencer a las mejores IA del negocio en ajedrez y shogi. El proceso de aprendizaje también es impresionantemente eficiente, ya que requiere solo dos, cuatro o 30 horas de auto-tutelaje para superar los programas específicamente diseñados para dominar shogi, ajedrez y Go, respectivamente. En particular, los autores del estudio no informaron ninguna instancia de AlphaZero enfrentando a un humano real, dice Howard. (Los investigadores pueden haber asumido que, dado que estos programas constantemente golpean a sus contrapartes humanas, tal enfrentamiento no habría tenido sentido).

AlphaZero también fue capaz de derrotar a Stockfish (el maestro de ajedrez AI ahora sin asiento) y a Elmo (el antiguo experto en shogi de IA) a pesar de evaluar menos movimientos posibles en cada turno durante el juego. Pero debido a que los algoritmos en cuestión son inherentemente diferentes y pueden consumir diferentes cantidades de energía, es difícil comparar directamente AlphaZero con otros programas más antiguos, señala Joanna Bryson, quien estudia inteligencia artificial en la Universidad de Bath en el Reino Unido y lo hizo No contribuir a AlphaZero.

Google guarda silencio sobre gran parte de la letra pequeña en su software, y AlphaZero no es una excepción. Si bien no sabemos todo sobre el consumo de energía del programa, lo que está claro es esto: AlphaZero tiene que estar empacando algo de munición computacional seria. En esas pocas horas de entrenamiento, el programa se mantuvo muy ocupado, participando en decenas o cientos de miles de rondas de práctica para mejorar su estrategia de juego de mesa, mucho más de lo que un jugador humano necesitaría (o, en la mayoría de los casos, podría incluso lograr) en la búsqueda de competencia.

Este régimen intensivo también usó 5, 000 unidades de procesadores de aprendizaje automático patentados de Google, o TPU, que según algunas estimaciones consumen alrededor de 200 vatios por chip. No importa cómo lo corte, AlphaZero requiere mucha más energía que un cerebro humano, que funciona con unos 20 vatios.

El consumo absoluto de energía de AlphaZero debe tenerse en cuenta, agrega Bin Yu, que trabaja en la interfaz de estadísticas, aprendizaje automático e inteligencia artificial en la Universidad de California, Berkeley. AlphaZero es poderoso, pero podría no ser una buena inversión, especialmente cuando se agregan las horas-persona que se dedicaron a su creación y ejecución.

Energéticamente costoso o no, AlphaZero es impactante: la mayoría de las IA están hiperespecializadas en una sola tarea, lo que hace que este nuevo programa, con su triple amenaza de juego, sea notablemente flexible. "Es impresionante que AlphaZero haya podido usar la misma arquitectura para tres juegos diferentes", dice Yu.

Entonces sí. La nueva IA de Google establece una nueva marca de varias maneras. Es rápido. Es de gran alcance. ¿Pero eso lo hace inteligente?

Aquí es donde las definiciones comienzan a ponerse turbias. "AlphaZero pudo aprender, comenzando desde cero sin ningún conocimiento humano, jugar cada uno de estos juegos a un nivel sobrehumano", dijo Silver de DeepMind en un comunicado a la prensa.

Incluso si la experiencia en juegos de mesa requiere agudeza mental, todos los poderes para el mundo real tienen sus límites. En su iteración actual, AlphaZero se maximiza al ganar juegos diseñados por humanos, lo que puede no garantizar la etiqueta potencialmente alarmante de "sobrehumano". Además, si se sorprende con un nuevo conjunto de reglas a mitad del juego, AlphaZero podría quedar desconcertado. El cerebro humano real, por otro lado, puede almacenar mucho más de tres juegos de mesa en su repertorio.

Además, comparar la línea de base de AlphaZero con una tabula rasa (pizarra en blanco) , como hacen los investigadores, es una exageración, dice Bryson. Los programadores todavía le están dando un bocado crucial de conocimiento humano: las reglas del juego que está a punto de jugar. "Tiene mucho menos para seguir que cualquier otra cosa", agrega Bryson, "pero lo más fundamental es que todavía se le dan reglas". Esos son explícitos ".

Y esas reglas molestas podrían constituir una muleta significativa. "A pesar de que estos programas aprenden a desempeñarse, necesitan las reglas del camino", dice Howard. "El mundo está lleno de tareas que no tienen estas reglas".

Cuando se trata de empujar, AlphaZero es una actualización de un programa ya poderoso: AlphaGo Zero, explica JoAnn Paul, quien estudia la inteligencia artificial y los sueños computacionales en el Instituto Politécnico de Virginia y la Universidad Estatal y no participó en la nueva investigación. AlphaZero utiliza muchos de los mismos bloques de construcción y algoritmos que AlphaGo Zero, y todavía constituye solo un subconjunto de inteligencia verdadera. "Pensé que este nuevo desarrollo era más evolutivo que revolucionario", agrega. “Ninguno de estos algoritmos puede crear . La inteligencia también se trata de contar historias. Es imaginar cosas que aún no están allí. No estamos pensando en esos términos en las computadoras ".

Parte del problema es que todavía no hay consenso sobre una verdadera definición de "inteligencia", dice Yu, y no solo en el dominio de la tecnología. "Todavía no está claro cómo estamos entrenando seres con pensamiento crítico, o cómo usamos el cerebro inconsciente", agrega.

Hasta este punto, muchos investigadores creen que probablemente haya múltiples tipos de inteligencia. Y aprovechar uno lejos de garantizar los ingredientes para otro. Por ejemplo, algunas de las personas más inteligentes son terribles en el ajedrez.

Con estas limitaciones, la visión de Yu del futuro de la inteligencia artificial asocia a humanos y máquinas en una especie de coevolución. Las máquinas ciertamente continuarán sobresaliendo en ciertas tareas, explica, pero el aporte humano y la supervisión siempre pueden ser necesarios para compensar lo no automatizado.

Por supuesto, no se sabe cómo se desarrollarán las cosas en el campo de la IA. Mientras tanto, tenemos mucho para reflexionar. "Estas computadoras son potentes y pueden hacer ciertas cosas mejor que un humano", dice Paul. "Pero eso aún no llega al misterio de la inteligencia".


Este artículo fue publicado originalmente en NOVA.
La nueva IA de Google es un maestro de los juegos, pero ¿cómo se compara con la mente humana?