AlphaZero schlägt Stockfisch nach 4 Std. Lernen

    Diese Seite verwendet Cookies. Durch die Nutzung unserer Seite erklären Sie sich damit einverstanden, dass wir Cookies setzen. Weitere Informationen

    • Die Spiele Go, Schach, Shogi haben feste Regeln. In der realen Welt muss man auf Situationen reagieren, die sich dynamisch verändern, d.h. die Regeln sind unklar.

      Hierfür hat DeepMind das Programm MuZero entwickelt, das auch bei unbekannten Regeln Pläne entwerfen kann. Es beruht wie AlphaZero auf neuronalen Netzwerken. Es war bei Schach und Shogi ebenso gut wie AlphaZero, bei Go besser als AlphaZero und bei Atari besser als die existierenden Programme.

      Eine Mitteilung der Firma DeepMind:

      deepmind.com/blog/muzero-maste…i-and-atari-without-rules

      Eine Publikation hierzu vom 23. Dez. 2020 in der weltweit führenden Zeitschrift Nature:

      nature.com/articles/s41586-020…0fiMf45ZGDAQ7fUI66-u7Y%3D

      Am Ende der Mitteilung von DeepMind schreiben die Autoren, dass bereits AlphaZero Anwendungen in der Chemie und in der Quantenphysik hatte, mit Links zu Publikationen. Sie hoffen, dass MuZero auch für komplexere Problemlagen der realen Welt mit unbekannten Regeln Hilfe für Lösungen bieten kann.
    • Es gibt sehr wichtige aktuelle Weiterentwicklungen.

      Es war ein großes, 50 Jahre lang offenes Problem der Biologie/Chemie, die 3D-Struktur von Proteinen zu bestimmen, wenn nur ihre Zusammensetzung aus oftmals hunderten von Aminosäuren bekannt ist.
      Mit dem Wissen über den räumlichen Aufbau kann man dann bestimmen, wie sich die Proteine im Körper verhalten. Noch vor wenigen Jahren hatte dies bereits für ein Protein eine Dissertation für einen Promovenden bedeutet.

      DeepMind ist es nun gelungen, die 3D-Struktur von nahezu allen bekannten 200 Millionen Proteinen zu berechnen. Dies gilt als Riesenereignis für die Lebenswissenschaften, das viele Folgeresultate nach sich ziehen wird.

      Das Computerprogramm AlphaFold beruht auf maschinellem Lernen und neuronalen Netzwerken, den Techniken, deren Anwendung auch für AlphaGo, AlphaZero und MuZero (s.o.) entwickelt wurde.

      Im folgenden Interview vom 15. Juni zwischen Eric Topol und Demis Hassabis wird auf Seite 4 beschrieben, dass DeepMind fast direkt nach dem 4:1 Sieg gegen den Go-Vizeweltmeister Lee Sedol 2016 mit der Arbeit am neuen Programm begann:

      medscape.com/viewarticle/975013

      Eric Topol ist ein bekannter Kardiologe, der in den USA verschiedene Institute gegründet hat und zu den 10 meistzitierten Wissenschaftlern in der Medizin gehört.
      Demis Hassabis war in seiner Jugend ein hervorragendes Schachtalent, Computerspiele-Entwickler und dann Co-Gründer von DeepMind.

      Dies ist auch zu Anfang der im folgenden Link beschriebenen Zeitschiene angegeben:

      deepmind.com/research/highligh…imeline-of-a-breakthrough

      Diese Spielprogramme für Go und Schach dienten als erster Schritt und als Test für weiterentwickelte Programme, die nun essentielle Probleme bearbeiten können.

      Ein Artikel zur Berechnung der 3D-Struktur der Proteine vom 29. Juli:

      heise.de/news/AlphaFold-Deepmi…ter-Proteine-7193356.html

      Die Mitteilung von DeepMind vom 28. Juli:

      deepmind.com/blog/alphafold-re…e-of-the-protein-universe

      Wenn ich es richtig sehe, wurden die Berechnungen an etwa 190.000 experimentell bestimmten Proteinstrukturen überprüft, mit sehr hoher Zuverlässigkeit.

      Nun kann jeder Wissenschaftler die weiteren Vorhersagen überprüfen bzw. nutzen. Denn interessanterweise hat DeepMind den Sourcecode von AlphaFold vor 1 Jahr öffentlich (opensource) zur Verfügung gestellt. Danach wurde es bereits über 500.000 mal von Forschern aus 190 Ländern aufgerufen. Und die neuen Berechnungen der 200 Millionen Proteine werden ebenfalls öffentlich und kostenlos zur Verfügung stehen.
    • Hier ist eine Publikation von DeepMind-Forschern in der weltführenden Zeitschrift "Nature" von Dez. 2021, wie maschinelles Lernen auch in der Reinen Mathematik bei der Entdeckung neuer Zusammenhänge helfen kann:

      nature.com/articles/s41586-021-04086-x

      Sie beschreiben darin einen neu entdeckten Zusammenhang zwischen numerischen Struktureigenschaften in der algebraischen bzw. geometrischen Knotentheorie, sowie eine neue Vermutung in der Darstellungstheorie zu den sog. Kazhdan–Lusztig Polynomen für symmetrische Gruppen.

      Die Verfahren maschinellen Lernens können helfen, bei numerischen Fragen, Abzählproblemen ... Zusammenhänge und Vermutungen über Gesetzmäßigkeiten (wie z.B. Polynome, Abschätzungen) zu entwickeln. Das verlangt natürlich auch tiefe Kenntnisse der Gebiete an sich.

      Bereits seit den 1960ern wurden Computer verwendet, um mathematische Fragen rechnerisch anzugehen.
      Aber die Verwendung der AI-Verfahren des maschinellen Lernens ist neu.

      Die Autoren beschreiben auch kurz die Zusammenhänge zu AlphaGo, die im größeren Rahmen einen Test für diese Ansätze darstellten.
    • DeepMind-Forscher haben eine neue, schnellere Art der Matrizen-Multiplikation entdeckt.

      Die klassische Art, zwei 4 x 4 - Matrizen zu multiplizieren, verlangt 64 Multiplikationen
      (Zeile mal Spalte verlangt 4 Multiplikationen, wir haben 4 Zeilen, 4 Spalten; 4 x 4 x 4 = 64).

      Bereits 1969 hat Volker Strassen einen Algorithmus entdeckt, der nur 49 Multiplikationen verlangt, also schneller ist.
      Damit wurde Strassen berühmt (zumindest in der Mathematiker-Welt).

      Die DeepMind-Forscher haben nun, nach über 50 Jahren, einen Algorithmus gefunden,
      der nur 47 Multiplikationen verlangt.

      Das klingt zunächst nach nur einem kleinen Erfolg. Aber:
      1. Matrizen-Multiplikationen werden in einer Fülle von Anwendungen täglich sehr häufig verwendet, so dass sich die Verbesserung dann schon auswirken kann.
      2. Mathematiker haben es seit 50 Jahren nicht geschafft, den Strassen-Algorithmus diesbezüglich zu verbessern.
      3. DeepMind-Forscher fanden auch eine Reihe von Verbesserungen für größere Matrizen.
      und:

      4. Das Verfahren ist interessant und neu:

      Dies erfolgte mit "AlphaTensor", laut Publikation explizit eine Weiterentwicklung von AlphaGo und AlphaZero, die für Go bzw. Schach entwickelt wurden.

      Bei AlphaTensor wird das Finden von Algorithmen für die Matrizenmultiplikation als ein *Spiel* aufgefasst. Wie bei Schach und Go, spielt der Computer dieses Spiel, lernt dabei und wird im Laufe der Zeit besser.
      Im Fall der Matrizen hat dieses Spiel aber wesentlich mehr mögliche Aktionen: 10 hoch 12, statt wie bei Schach und Go nur einige Hundert.
      Im Laufe der Zeit wurde der Computer besser, fand dabei auch Strassen's Algorithmus und dann den besseren.

      Eine Beschreibung:

      arstechnica.com/information-te…substack&utm_medium=email

      Die Publikation in der führenden Zeitschrift "Nature" im Okt. 2022:

      nature.com/articles/s41586-022-05172-4

      Die Publikation ist frei zugänglich, die neuen Algorithmen auch.