Alpha Go

Alpha Go – Wegbereiter der künstlichen Intelligenz

Alpha Go ist auch unter den Namen Master(P) und Magister(P) bekannt. Auf den ersten Blick handelt es sich einfach nur um ein Computerprogramm, das das Brettspiel Go spielt und man könnte sich fragen, wozu solche Spiele-Computer gebraucht werden. Die Antwort auf diese Frage kennen wir am Ende dieses Textes.

Entwickelt wurde Alpha Go von Google DeepMind. Google DeepMind ist ein Unternehmen aus Groß-Britannien, das im Bereich der künstlichen Intelligenz arbeitet. Es hat seinen Sitz in London mit Außenstellen in Kanada, Frankreich und in den Vereinigten Staaten. Die Firma erfand Netzwerke, die Videospiele in einer Art ähnlich dem Menschen spielen können. Computer sind also in der Lage, das Kurzzeitgedächtnis von Menschen zu imitieren. Die Aufmerksamkeit der Medien bekam Google DeepMind als der erste Computer mit Alpha Go im Jahr 2015 den mehrfachen Europameister und den Weltmeister im Spielen von Go besiegt hatte. Über diese Sache wurde sogar ein Dokumentarfilm gedreht. Des weiteren konnten die Programme von Google DeepMind später auch andere Computerprogramme besiegen, die auf das automatisierte Spielen spezialisiert waren. Der entscheidende Unterschied dabei war, dass Alpha Go Lernen durch Verstärkung beherrschte. So war Alpha Go das erste Programm, das bei einem Turnier ohne Handicap professionelle Spieler durch die Kombination maschinellen Lernens und Traversierung besiegte.

Der Entwicklung von Alpha Go waren andere Spiele voraus gegangen und hatten ihm den Weg bereitet. Ein Programm von IBM namens Deep Blue besiegte im Jahr 1997 Garn Kasparow, den zu dieser Zeit amtierenden Weltmeister im Schach. Daraufhin wurde mit einem Spiel, das Go spielen konnte, die nächste große Herausforderung in der Entwicklung von künstlicher Intelligenz angenommen, was dann schließlich zur Entwicklung von Alpha Go führte. Go ist ein komplexeres Spiel als Schach. Es besitzt ein größeres Spielbrett, daher sind um ein Vielfaches mehr Spielzüge möglich. Deep Blue arbeitete noch auf Basis der Alpha-Beta-Suche, was bedeutet dass alle möglichen Spielzüge durchgesucht werden müssen, um den strategisch besten Spielzug zu finden. Diese Möglichkeit besteht bei Go aufgrund der höheren Komplexität des Spiels nicht. Hinzu kommt, dass Schach mit heuristischen Methoden gespielt werden kann. Darunter versteht man eine wissenschaftliche Methode, die Probleme aufgrund von Erfahrung löst. Für Go gab es solche heuristischen Methoden aber nicht.

Noch zu Beginn der 1990-er Jahre hatten die Vorläufer von Alpha Go eine Spielstärke, die ungefähr einem menschlichen Anfänger entsprach. Erst 2006 gelang der entscheidende Durchbruch in der Entwicklung von Alpha Go, als es zur ersten Anwendung von Monte-Carlo-Algorithmen, die im Vergleich mit deterministischen Algorithmen effizienter sind, kam. Über einen Monte-Carlo-Algorithmus können Wahrscheinlichkeiten berechnet werden. Monte-Carlo-Algorithmen dürfen im Gegensatz zu zum Beispiel Las-Vegas-Algorithmen falsche Ergebnisse liefern. Diese falschen Ergebnisse werden dann durch Wiederholung des Algorithmus eingegrenzt. Mit dem Einsatz von Monte-Carlo-Algorithmen lieferten Computerprogramme die Spielstärken guter Amateure. Auf kleineren Brettern gewannen sie auch manchmal gegen Profis. Der Algorithmus berechnet über eine Statistik alle möglichen Züge und bewertet sie anschließend, indem er sich merkt zu welchem Spielergebnis der Zug am Ende geführt hat. Deshalb spricht man von einer Ähnlichkeit des Programms mit dem menschlichen Kurzzeitgedächtnis.

Mit der letztendlichen Entwicklung von Alpha Go gelang ein Meilenstein im Bereich der künstlichen Intelligenz. Alpha Go gewann so gut wie alle Spiele bevor es den amtierenden Europameister in Go mit 5:0 besiegte. Daran ist klar zu sehen, wie effizient und fehlerfrei das Programm arbeitet. Alpha Go ist so effizient, weil es zusätzlich zum Monte-Carlo-Algorithmus zwei weitere Lernmethoden verwendet: das Value Network, das Positionen bewertet und das Policy Netzwerk, das Daten zu den möglichen Zügen mit Hilfe von überwachtem und bestärkendem Lernen sammelt. Überwachtes Lernen ist maschinelles Lernen, das Gesetzmäßigkeiten nachbildet. Beim bestärkenden Lernen handelt es sich ebenfalls um maschinelles Lernen, bei dem die Maschine eine Strategie erlernt, um möglichst viele Belohnungen zu erhalten.

Die Entwicklung von Alpha Go kann für die Zukunft wichtig sein, weil seine Methoden auf andere Anwendungsbereiche übertragbar sein könnten. Das Programm kann zum Beispiel über eine Datenbankanalyse das Verhalten eines Menschen vorhersagen. Allerdings stimmt diese Analyse nur zu 56 %. Diese 56 % reichen aber schon aus, um besser zu sein als ein menschliches Gehirn. Hinzu kommt, dass die Quote von Alpha Go durch die Monte-Carlo-Methode verbessert wurde, was dem Programm einen noch größeren Vorsprung vor dem Menschen gibt. Was allerdings nicht zu vergessen ist: Alpha Go benötigte am Anfang eine massive Rechenleistung, die nur unter großem Aufwand zu ermöglichen war, um seine Ergebnisse zu erbringen.

Nach den Erfolgen von Alpha Go im Jahr 2016 wurde es zu Alpha Go Zero weiter entwickelt. Es war nun gelungen, die Software so zu verändern, dass der Hardware-Aufwand, und somit die Rechenleistung geringer waren. Das Programm wurde ohne Vorwissen nur für drei Tage trainiert bis es ein besseres Ergebnis lieferte als die stärkste Version von Alpha Go. Im Dezember 2017 wurde dann klar, dass es sich bei Alpha Go Zero um die beste bislang entwickelte Software im Bereich der künstlichen Intelligenz handelte. Das Programm lernte in wenigen Stunden Schach, Go und Shogi. Es bekam als Grundlage die Spielregeln und spielte dann einige Stunden gegen sich selbst. Es benutzte dabei keine menschlichen Spielstrategien. Professionelle Schachspieler sind begeistert von der künstlichen Intelligenz, denn sie haben gemerkt, dass sie von einem Computer neue Strategien erlernen können, auf die sie von alleine nicht gekommen wären.

Manche Menschen, die schon mal gegen so einen Computer mittels Alpha Go gespielt haben und seine Leistung selbst erlebt haben, sind sogar der Meinung, dass diese weitaus höhere „Denkleistung“ einer Maschine die Welt verändern könnte, da der Computer eine derartige Vielzahl komplexer Informationen speichern und verarbeiten könnte, wie es das menschliche Gehirn niemals schaffen würde. Wenn sich nun in Zukunft sinnvolle Anwendungsgebiete dieser Technologie finden, könnte es sein, dass wir uns bald auf einem ganz neuen technischen Level befinden. Dies würde bedeuten, dass vielleicht in naher Zukunft ein Leben ohne künstliche Intelligenz nicht mehr vorstellbar wäre, bzw. dass wir bei einem Ausfall von Computern unsere Technologien nicht mehr aufrecht erhalten könnten, die wir in der Zukunft gewohnt sein werden und auf die wir dann angewiesen sein werden. Die phänomenalen Entwicklungen mittels Alpha Go im Bereich der künstlichen Intelligenz können also ein Meilenstein für die Menschheit sein, sie bergen aber auch hohe Risiken.