El mérito es de los humanos
Las máquinas por sí solas no mueven una tecla y necesitan de la asistencia del humano (la conciencia artificial no existe) para que le dicte las reglas del juego. Una de las técnicas que se utiliza es el aprendizaje por refuerzo, un área del aprendizaje automático inspirado en la psicología conductista, cuya finalidad es determinar las acciones que debe cumplir un programa de Inteligencia Artificial (IA) ante determinadas situaciones. Es decir, si el robot en el laberinto choca contra una pared sube la variable de castigo y para subir la variable satisfacción, debe completar el recorrido sin dificultades. Lo que hacen los programadores es cargar ejemplos para que vaya entrenando su aprendizaje. El objetivo es que logre determinar si lo que está haciendo es correcto o defectuoso. La IA se encarga de analizar las variables ante cada situación y si hay algo que desconoce, se le enseña a deducirlo con ejemplos.
En el caso de AlphaGo Zero el sistema dedujo en cada movimiento cuál es la mejor jugada para llegar al camino óptimo.
El mérito no es de la IA sino de los programadores de DeepMind. El sistema asimila el conocimiento a través del humano y si las reglas no son claras, aprende mal.
*Doctora en Ciencias de la Computación UBA, especialista en Inteligencia Artificial