La nueva versión de AlphaGo (que aprende de sí misma, no de los humanos) superó a la antigua versión 100 victorias a 0

Con sólo un tablero de de Go, el coyuntura más difícil del mundo, y jugando contra sí misma. AlphaGo Zero (el nombre de la nueva traducción) ha vapuleado a la antigua AlphaGo por 100 victorias a 0. La inteligencia fabricado de Google no sólo bate a cualquier hábil del Go, sino que ahora se supera a si misma, y lo hace sin que ningún humano le enseñe.

A lo dadivoso de la historia de la inteligencia fabricado hemos tenido diferentes hitos: Deep Blue derrotando al mejor tahúr de ajedrez, Watson de IBM acabando con los mejores jugadores de ‘Jeopardy!’ o el propio AlphaGo aplastando a Lee Sedol en el Go. Ahora quizás estemos en presencia de otro de esos hitos, pues por primera vez una inteligencia fabricado se supera a si misma y lo hace sin la interacción de ningún humano.

Lee Sedol viendo cómo una máquina acababa con él.

Tres días de entrenamiento en solitario para anticiparse a sus movimientos

La primera traducción de AlphaGo tuvo la superioridad de instruirse de miles de jugadores, tanto aficionados como profesionales. AlphaGo Zero sin requisa no ha tenido acercamiento a estas partidas, los ingenieros de DeepMind (la empresa de Alphabet a la que pertenece Google) tan sólo le introdujeron las reglas del coyuntura. El Go es un coyuntura dócil de comprender, dos jugadores tienen diferentes piezas (blancas y negras) y cada uno debe tratar de rodear con sus propias piedras un radio del tablero viejo que la del oponente. Prácticamente esto es todo lo que AlphaGo Zero necesitó memorizar.

Durante tres días AlphaGo se entrenó en solitario, jugando contra sí misma y aprendiendo de cada uno de los fallos que realizaba. Primero eran movimientos al azar, y es aquí donde se dio cuenta cuáles eran los caminos o movimientos que la llevaban ayer al éxito. AlphaGo Zero poco a poco iba prediciendo sus próximos movimientos combinando simulaciones de jugadas anteriores y las probabilidades de trofeo en cada una de ellas. A las tres horas de situar la máquina, atrapaba fichas mejor que un principiante del coyuntura. En 70 horas era una experta capaz de corretear contra los mejores del mundo.

AlphaGo Jugadas del Go seguidas por AlphaGo Zero

Las estrategias que sigue AlphaGo Zero y las razones por las que ha llegado a la conclusión de que son las mejores efectivamente no las conocemos. El deep learning cuenta con la peculiaridad de que no muestra paso a paso las decisiones tomadas. No obstante, las estrategias que sigue son mejores que las seguidas por la primera traducción de AlphaGo, la que aprendió de los humanos. Según sus creadores:

AlphaGo Zero puede estar aprendiendo una organización que es cualitativamente diferente del coyuntura humano

A diferencia de la primera traducción, AlphaGo Zero utiliza una sola red neuronal en superficie de varias redes separadas. De este modo puede hacer movimientos más rápidos ya que tan sólo necesita hacer búsquedas de probabilidades en una sola red. Para hacernos una idea, cada pasada la decidía en 0,4 segundos.

Después de tres días de duro entrenamiento y casi 5 millones de partidas jugadas, AlphaGo Zero estaba directorio para corretear contra su antecesora, la AlphaGo Master que ganó a los mejores jugadores del mundo. ¿El resultado? De 100 partidas ganadas la antigua traducción gano… cero.

No solamente para corretear al Go

Hasta ahora donde más hemos gastado en energía a la inteligencia fabricado de Google es jugando al Go. Se alcahuetería de un “primer filtro” efectivamente, adecuado a que el Go es considerado el coyuntura más difícil del mundo, a la inteligencia fabricado le sirve para entrenarse. El tablero es de 19×19 con 361 intersecciones, el número de movimientos y posiciones legales posibles es tan noble que hasta hace poco se pensaba que era infinito.

DeepMind

Aparte de verla corretear al Go, la inteligencia fabricado de Google además ha echado partidas al Starcraft II. Pero además ha ayudado a ayudado a que Google se ahorre un dineral en la relación de la luz. O mejor incluso, está luchando contra la ceguera.
Demis Hassabis de DeepMind dice lo próximo:

En última instancia, queremos exprimir los avances algorítmicos para ayudar a resolver todo tipo de problemas apremiantes del mundo existente.

Vía | WIRED
En Xataka | AlphaGo gana la última partida a Lee Sedol y cierra con un contundente 4-1 final


Source link

deja tu opinion

Seguinos

Tecnoblog en las redes sociales