Ein System wird Schachweltmeister
Österreicher waren an der Entwicklung der intelligenten Software beteiligt.
Die Google-Software AlphaZero, deren Entwickler 2017 damit aufhorchen ließen, dass das System das Brettspiel Go ohne menschliches Zutun erlernte, hat sich nun auch zum Schachmeister weiterentwickelt. Im Jahr 2016 war die internationale Aufmerksamkeit groß, als der Vorgänger des Programms (AlphaGo) den Go-Spitzenspieler Lee Sedol besiegte. Seither hat das System unter dem Namen AlphaGo Zero einige Weiterentwicklungen erfahren und nicht nur seine künstlich intelligenten Vorgänger, sondern auch weitere namhafte menschliche Spitzenspieler das Fürchten gelehrt.
Die Fähigkeiten der Systeme lösten Erstaunen aus, da das rund 3000 Jahre alte asiatische Spiel spezielle Anforderungen stellt, die bisher eher dem menschlichen Geist exklusiv zugebilligt wurden. Angesichts nahezu unbegrenzter Möglichkeiten für Züge sind nämlich viel Intuition, kreatives Denken und Lernfähigkeit gefragt. Die Algorithmen stammen von der britischen Firma DeepMind, die vor einigen Jahren vom US-Konzern Alphabet (vormals Google) übernommen wurde. Teil des Teams ist auch der Softwareentwickler Julian Schrittwieser aus Niederösterreich, der bereits im Rahmen seines Studiums an der TU Wien im Jahr 2013 bei Google eingestiegen ist. Wegen seiner Beteiligung an der Entwicklung des aufsehenerregenden Systems zählte das Magazin „Forbes“den 26-jährigen KI-Forscher (KI = künstliche Intelligenz) heuer zu den 30 interessantesten Persönlichkeiten unter 30 Jahren in Europa in der Rubrik „Technologie“.
Während AlphaGo noch Millionen Züge von menschlichen Topspielern über Monate hinweg analysieren musste, um sein hohes Spielniveau zu erreichen, ging das Londoner Team um David Silver bei der neuen Generation einen anderen Weg. Sie entwickelten ein System, das Go ohne Anschauungsmaterial von der Pike auf in Hunderttausenden Spielen gegen sich selbst trainiert und auf sich allein gestellt weiterentwickelt. Lediglich die Regeln des Spiels waren der Software vorher bekannt.
Nun haben die Forscher ihren Ansatz unter dem Namen AlphaZero verallgemeinert. Der neue Algorithmus kann ohne menschliches Coaching mehrere Spiele lernen. In Schach, Shōgi – einer japanischen Variante des Spiels – und Go erreichte auch die neue Inkarnation innerhalb weniger Stunden ein derart hohes Niveau, dass es andere hoch entwickelte KI-Programme besiegte. AlphaZero lernt schrittweise, was ein gutes Spiel ausmacht, und evaluiert es eigenständig. Es ist frei von den Einschränkungen, die die menschliche Sichtweise darauf mit sich bringt.
„AlphaGo lernt ohne Hilfe von uns Menschen.“