c't 2/2018
S. 30
News
Künstliche Intelligenz
Aufmacherbild

Kalkuliertes Matt

Künstliche Intelligenz lernt autodidaktisch Schach, Go und Shogi

AlphaZero von der Google-Tochter DeepMind hat sich die komplexen Strategiespiele Schach, Go und Shogi selbst beigebracht und wurde binnen 24 Stunden der stärkste Spieler auf diesem Planeten. Damit bringt es die Theoriegebäude der Jahrhunderte alten Spiele ins Wanken.

Nicht genug damit, dass DeepMind mit ihrer Go-Software AlphaGo die Nummer eins der Weltrangliste im Go besiegt hat: Im Oktober veröffentlichten die Forscher ein Paper über eine noch stärkere Version namens AlphaGo Zero, die das Spiel komplett selbst gelernt hat [1]. Nun setzen sie noch eins drauf und zeigen, dass sich das Verfahren verallgemeinern lässt: Ihre neueste Schöpfung namens AlphaZero hat Schach, dessen japanische Variante Shogi sowie Go nur durch Spielen gegen sich selbst gelernt und übertraf in allen drei Disziplinen alle anderen Programme – und die Menschen sowieso [2].

AlphaZero kombiniert ein neuronales Netz mit Monte-Carlo-Baumsuche. Außer den Spielregeln floss kein menschliches Wissen über das jeweilige Spiel ein. Nur die Repräsentation der Spielstellung in den Eingabeschichten des neuronalen Netzes und die Ausgabeschichten für die Züge mussten angepasst werden, das wars aber schon. Von Menschen erdachte Heuristiken wie Materialwert, Einfluss, Beweglichkeit, Bauernstruktur, … nichts davon gab man AlphaZero mit.