AlphaZero de DeepMind ya es la mejor del mundo en varios juegos de mesa, sólo se está entrenando

En octubre de este año DeepMind (la empresa de inteligencia químico de Alphabet) nos sorprendió a todos con AlphaGo Zero. Esta nueva lectura de su inteligencia químico había aprendido a competir al Go sin la ayuda de los humanos y en cuestión de horas era la mejor del mundo. No se ha conformado con el Go, ahora incluso es la mejor del mundo en ajedrez y en shogi (ajedrez japonés). Pero su meta final no es ser la campeona en todos los juegos de mesa, sólo se está entrenando.

En un nuevo paper publicado por la compañía se describe cómo la segunda lectura de AlphaGo Zero, AlphaZero, ha aprendido a competir a otros juegos de mesa. Para el Go se le dieron tan sólo las reglas de grupo, y en unas horas ya había rebaño a AlphaGo por 100 victorias a 0. Se entrenó sola hasta ser la mejor. Con AlphaZero y el ajedrez ha pasado poco similar, conociendo las reglas y entrenándose durante cuatro horas ha tenido suficiente para vencer a Stockfish (uno de los motores de ajedrez más potentes del mundo). Por si esto era poco, con dos horas de entrenamiento en el shogi ya se ha hecho imbatible.

Shogi, incluso conocido como el ajedrez japonés, cuenta con un tablero más holgado y difícil.

La secreto esta en el autoaprendizaje

¿Por qué AlphaZero aprende tantos juegos de mesa? No lo hace por diversión, los ingenieros de DeepMind tienen un propósito viejo, poder aplicar estas técnicas de estudios a muchos otros ámbitos. Todavía están muy remotamente de poder conseguir esto, ya que significaría poder ampliar y rasgar el pensamiento de AlphaZero hasta tal punto de que sea capaz de formarse cualquier cosa (con muchas más variables que las reglas de un grupo), como un humano.

Pero AlphaZero y estas “pequeñas victorias” en juegos de mesa son un primer paso. Esta inteligencia químico (es una modificación de AlphaGo Zero más genérica) se ha desarrollado de tal forma que pueda formarse por si sola y no mediante la experiencia con agentes externos. AlphaZero puede aplicarse a una tonalidad más amplia de campos y temas sin requisito de enseñarle, por lo que probablemente en las próximas semanas veamos más avances y quizás no solo en juegos de mesa.

Google DeepMind

La desarrollo de DeepMind con sus motores de inteligencia químico es constante. En marzo de este año vimos cómo ya era capaz de recordar y utilizar lo aprendido en nuevas tareas. Posteriormente DeepMind nos enseño cómo quieren aplicarla para detectar signos iniciales de enfermedades oculares crónicas. También ha jugado al Starcraft II y en octubre como vimos aprendió a jugar al Go por si sola. Lo dicho, sólo se está entrenando.

Más información | MIT Technology Review
En Xataka | La nueva versión de AlphaGo (que aprende de sí misma, no de los humanos) superó a la antigua versión 100 victorias a 0


Source link

deja tu opinion

Seguinos

Tecnoblog en las redes sociales