Crean máquina que aprende a jugar ajedrez en 72 horas

robotchess02

Grischuk enfrentándose al robot KUKA en 2012; la máquina ganó por 4.5-1.5 | foto: Julia Manakova

Ya no hay duda de que las computadoras juegan al ajedrez mejor que los humanos. Sin embargo, nosotros todavía tenemos la ventaja de poder aprender a jugar sin que un programador haya codificado en nuestro cerebro algoritmos que deben ser procesados miles de millones de veces por segundo. El siguiente reto para los programadores, entonces, es crear una máquina que “aprenda” a jugar ajedrez y lo comprenda como lo hacemos nosotros. Matthew Lai del Imperial College de Londres ya ha lanzado una máquina que lo hace. Giraffe, como la ha bautizado, alcanza un nivel de Maestro Internacional ¡en solo 72 horas!

Las máquinas superan al hombre

Ya han pasado 20 años desde que la súpercomputadora Deep Blue de la IBM venciera al campeón del mundo Garry Kasparov por primera vez siguiendo las reglas estándares de torneos. Desde entonces, los módulos se han vuelto significativamente más fuertes, dejando a los mejores jugadores sin chances siquiera contra una máquina corriendo en un smartphone.

Pero, a pesar de que las computadoras se han vuelto más rápidas, la forma de trabajar de los módulos no ha cambiado. Su poder reside en su fuerza bruta, el proceso de buscar todas las jugadas posibles hasta encontrar la mejor.

Por supuesto, ningún hombre puede siquiera acercarse a ese nivel. Mientras Deep Blue buscaba unas 200 millones de posiciones por segundo, Kasparov probablemente no veía más que cinco por segundo. Y, aun así, jugaban esencialmente al mismo nivel. Claramente, los hombres tienen algo que las computadoras todavía no han logrado.

deep-blue-kasparov

El famoso y polémico match en el que Kasparov cayó ante Deep Blue, la súpercomputadora de la IBM

Inteligencia artificial aplicada al ajedrez

Este truco es la evalución de posiciones y la eliminación de posibilidades hasta encontrar los caminos más efectivos. Esto simplifica dramáticamente el trabajo posicional, pues reduce el árbol de posibilidades a solo unas cuantas ramas.

Las computadoras nunca han sido buenas para esto, pero ahora eso está cambiando gracias al trabajo de Matthew Lay del Imperial College de Londres. Lai ha creado una máquina de inteligencia artificial llamada Giraffe, que se ha enseñado a sí misma a jugar ajedrez. La máquina evalúa posiciones de manera muy similar al proceso humano y de manera totalmente distinta a los módulos convencionales de ajedrez.

En sus primeros intentos, la nueva máquina ya juega al mismo nivel que los módulos convencionales, muchos de los cuales han sido trabajados durante muchos años. En un nivel humano, Giraffe juega como un Maestro Internacional.

La tecnología detrás de la nueva máquina de Lai es la red neuronal. Esta es la manera de procesar información del cerebro humano. Son muchas capas de nodos que están conectadas de manera que cambian en tanto el sistema se va entrenando. Este proceso de entrenamiento usa muchos ejemplos para afinar las conexiones, de manera que la red produzca una salida específica para cada entrada. Esta tecnología permite el reconocimiento de una cara humana en una fotografía, por ejemplo.

El trabajo de investigación de Lai propone crear un sistema más eficiente de toma de decisiones. Para hacerlo planteó las siguientes tareas para su máquina:

– Evaluar posiciones estáticas: Estimar cuán buena es una posición sin prever lo que sucederá después.

– Decidir qué ramas de análisis son las más “interesantes” en cualquier posición, y evaluarla con más profundidad. Al mismo tiempo, deberá decidir qué ramas desechar.

– Ordenar las jugadas: Definir qué jugadas analizar antes que otras, lo que afecta la eficiencia de las búsquedas.

El modelo de Lai entra dentro de la categoría de los sistemas genéricos, que, a diferencia de los sistemas expertos, toman más tiempo en  realizar evaluaciones. Esto es especialmente importante para aplicaciones como los módulos de ajedrez, donde la habilidad de buscar nodos con rapidez está muy relacionada con la fuerza de juego.

En la NASA ya investigaban el tema de las computadoras y el ajedrez en 1970

En la NASA ya investigaban el tema de las computadoras y el ajedrez en 1970

Comparando a Giraffe con otras máquinas

Algunos intentos previos de aplicar redes neuronales al ajedrez han tenido resultados relativamente malos. La implementación optimizada de Giraffe, sin embargo, se ha combinado con la aritmética vectorial de avanzada que manejan los procesadores modernos.

Lai entrena su red con una base de datos de partidas reales generada con mucho cuidado. Esta base debe tener una distribución verosímil de posiciones. “Por ejemplo, no tiene sentido entrenar el sistema en posiciones con tres damas por lado, pues estas posiciones virtualmente nunca se presentan en partidas reales”, menciona Lai.

Esta base fue generada con una selección aleatoria de cinco millones de posiciones rescatadas de un repositorio de partidas. Lai luego añadió variedad al determinar una jugada legal aleatoria a cada posición antes de usarla para el entrenamiento. En total, generó 175 millones de posiciones de esta manera.

Normalmente, las máquinas se entrenan con una evaluación manual de cada posición, la cual se usa para enseñar a la máquina a reconocer qué jugadas son más fuertes que otras.

Pero esta es una tarea demasiado grande para 175 millones de posiciones. Otros módulos logran hacerlo, pero el objetivo de Lai era más ambicioso. Él quería que la máquina aprenda sola.

En cambio, utilizó una técnica a través de la cual Giraffe jugaba repetidamente contra sí misma, con el objetivo de mejorar la predicción de su propia evaluación en una posición futura. Esto funciona porque existen puntos de referencia fijos que determinan el valor de una posición. Es decir, para definir si la partida será ganada, perdida o igualada.

Así, la computadora aprende a determinar qué posiciones son fuertes y qué posiciones débiles.

“Todo esto es destacable, pues las funciones de evaluación de los módulos normales han sido diseñadas cuidadosamente con cientos de parámetros que han sido afinados tanto manual como automáticamente por muchos años, y muchos de ellos han sido trabajados con equipos de grandes maestros”, añade Lai.

Este es un trabajo interesante que representa un gran cambio en la manera en la que trabajan los módulos de ajedrez. No es perfecta, claro. Una desventaja de Giraffe es que las redes neuronales son mucho más lentas que otros tipos de procesamientos de datos. Lai menciona que a Giraffe le toma unas diez veces más de tiempo buscar el mismo número de posiciones en comparación con los módulos convencionales.

“…Giraffe deriva su fuerza no por su capacidad de ver muy lejos, sino por ser capaz de evaluar posiciones complejas con precisión y de comprender conceptos posicionales complicados que son intuitivos para los humanos, pero que no han sido aprendidos por los módulos de evaluación”, menciona Lai. “Esto es especialmente importante en las fases de apertura y en los finales, donde Giraffe juega excepcionalmente bien.”


Accede a toda nuestra MEGABIBLIOTECA de ajedrez - Más de 200 GB de información, libros, revistas, películas, programas, cursos completos y más... TODO POR SOLO 10$ USD.