AlphaZero schlägt Stockfisch nach 4 Std. Lernen

Manni5 · 29. Juli 2022, 22:41

Die Spiele Go, Schach, Shogi haben feste Regeln. In der realen Welt muss man auf Situationen reagieren, die sich dynamisch verändern, d.h. die Regeln sind unklar.

Hierfür hat DeepMind das Programm MuZero entwickelt, das auch bei unbekannten Regeln Pläne entwerfen kann. Es beruht wie AlphaZero auf neuronalen Netzwerken. Es war bei Schach und Shogi ebenso gut wie AlphaZero, bei Go besser als AlphaZero und bei Atari besser als die existierenden Programme.

Eine Mitteilung der Firma DeepMind:

deepmind.com/blog/muzero-maste…i-and-atari-without-rules

Eine Publikation hierzu vom 23. Dez. 2020 in der weltweit führenden Zeitschrift Nature:

nature.com/articles/s41586-020…0fiMf45ZGDAQ7fUI66-u7Y%3D

Am Ende der Mitteilung von DeepMind schreiben die Autoren, dass bereits AlphaZero Anwendungen in der Chemie und in der Quantenphysik hatte, mit Links zu Publikationen. Sie hoffen, dass MuZero auch für komplexere Problemlagen der realen Welt mit unbekannten Regeln Hilfe für Lösungen bieten kann.

Manni5 · 30. Juli 2022, 22:30

Es gibt sehr wichtige aktuelle Weiterentwicklungen.

Es war ein großes, 50 Jahre lang offenes Problem der Biologie/Chemie, die 3D-Struktur von Proteinen zu bestimmen, wenn nur ihre Zusammensetzung aus oftmals hunderten von Aminosäuren bekannt ist.
Mit dem Wissen über den räumlichen Aufbau kann man dann bestimmen, wie sich die Proteine im Körper verhalten. Noch vor wenigen Jahren hatte dies bereits für ein Protein eine Dissertation für einen Promovenden bedeutet.

DeepMind ist es nun gelungen, die 3D-Struktur von nahezu allen bekannten 200 Millionen Proteinen zu berechnen. Dies gilt als Riesenereignis für die Lebenswissenschaften, das viele Folgeresultate nach sich ziehen wird.

Das Computerprogramm AlphaFold beruht auf maschinellem Lernen und neuronalen Netzwerken, den Techniken, deren Anwendung auch für AlphaGo, AlphaZero und MuZero (s.o.) entwickelt wurde.

Im folgenden Interview vom 15. Juni zwischen Eric Topol und Demis Hassabis wird auf Seite 4 beschrieben, dass DeepMind fast direkt nach dem 4:1 Sieg gegen den Go-Vizeweltmeister Lee Sedol 2016 mit der Arbeit am neuen Programm begann:

medscape.com/viewarticle/975013

Eric Topol ist ein bekannter Kardiologe, der in den USA verschiedene Institute gegründet hat und zu den 10 meistzitierten Wissenschaftlern in der Medizin gehört.
Demis Hassabis war in seiner Jugend ein hervorragendes Schachtalent, Computerspiele-Entwickler und dann Co-Gründer von DeepMind.

Dies ist auch zu Anfang der im folgenden Link beschriebenen Zeitschiene angegeben:

deepmind.com/research/highligh…imeline-of-a-breakthrough

Diese Spielprogramme für Go und Schach dienten als erster Schritt und als Test für weiterentwickelte Programme, die nun essentielle Probleme bearbeiten können.

Ein Artikel zur Berechnung der 3D-Struktur der Proteine vom 29. Juli:

heise.de/news/AlphaFold-Deepmi…ter-Proteine-7193356.html

Die Mitteilung von DeepMind vom 28. Juli:

deepmind.com/blog/alphafold-re…e-of-the-protein-universe

Wenn ich es richtig sehe, wurden die Berechnungen an etwa 190.000 experimentell bestimmten Proteinstrukturen überprüft, mit sehr hoher Zuverlässigkeit.

Nun kann jeder Wissenschaftler die weiteren Vorhersagen überprüfen bzw. nutzen. Denn interessanterweise hat DeepMind den Sourcecode von AlphaFold vor 1 Jahr öffentlich (opensource) zur Verfügung gestellt. Danach wurde es bereits über 500.000 mal von Forschern aus 190 Ländern aufgerufen. Und die neuen Berechnungen der 200 Millionen Proteine werden ebenfalls öffentlich und kostenlos zur Verfügung stehen.

Manni5 · 30. August 2023, 15:13

Hier ist eine Publikation von DeepMind-Forschern in der weltführenden Zeitschrift "Nature" von Dez. 2021, wie maschinelles Lernen auch in der Reinen Mathematik bei der Entdeckung neuer Zusammenhänge helfen kann:

nature.com/articles/s41586-021-04086-x

Sie beschreiben darin einen neu entdeckten Zusammenhang zwischen numerischen Struktureigenschaften in der algebraischen bzw. geometrischen Knotentheorie, sowie eine neue Vermutung in der Darstellungstheorie zu den sog. Kazhdan–Lusztig Polynomen für symmetrische Gruppen.

Die Verfahren maschinellen Lernens können helfen, bei numerischen Fragen, Abzählproblemen ... Zusammenhänge und Vermutungen über Gesetzmäßigkeiten (wie z.B. Polynome, Abschätzungen) zu entwickeln. Das verlangt natürlich auch tiefe Kenntnisse der Gebiete an sich.

Bereits seit den 1960ern wurden Computer verwendet, um mathematische Fragen rechnerisch anzugehen.
Aber die Verwendung der AI-Verfahren des maschinellen Lernens ist neu.

Die Autoren beschreiben auch kurz die Zusammenhänge zu AlphaGo, die im größeren Rahmen einen Test für diese Ansätze darstellten.

Manni5 · 22. November 2023, 14:53

DeepMind-Forscher haben eine neue, schnellere Art der Matrizen-Multiplikation entdeckt.

Die klassische Art, zwei 4 x 4 - Matrizen zu multiplizieren, verlangt 64 Multiplikationen
(Zeile mal Spalte verlangt 4 Multiplikationen, wir haben 4 Zeilen, 4 Spalten; 4 x 4 x 4 = 64).

Bereits 1969 hat Volker Strassen einen Algorithmus entdeckt, der nur 49 Multiplikationen verlangt, also schneller ist.
Damit wurde Strassen berühmt (zumindest in der Mathematiker-Welt).

Die DeepMind-Forscher haben nun, nach über 50 Jahren, einen Algorithmus gefunden,
der nur 47 Multiplikationen verlangt.

Das klingt zunächst nach nur einem kleinen Erfolg. Aber:
1. Matrizen-Multiplikationen werden in einer Fülle von Anwendungen täglich sehr häufig verwendet, so dass sich die Verbesserung dann schon auswirken kann.
2. Mathematiker haben es seit 50 Jahren nicht geschafft, den Strassen-Algorithmus diesbezüglich zu verbessern.
3. DeepMind-Forscher fanden auch eine Reihe von Verbesserungen für größere Matrizen.
und:

4. Das Verfahren ist interessant und neu:

Dies erfolgte mit "AlphaTensor", laut Publikation explizit eine Weiterentwicklung von AlphaGo und AlphaZero, die für Go bzw. Schach entwickelt wurden.

Bei AlphaTensor wird das Finden von Algorithmen für die Matrizenmultiplikation als ein *Spiel* aufgefasst. Wie bei Schach und Go, spielt der Computer dieses Spiel, lernt dabei und wird im Laufe der Zeit besser.
Im Fall der Matrizen hat dieses Spiel aber wesentlich mehr mögliche Aktionen: 10 hoch 12, statt wie bei Schach und Go nur einige Hundert.
Im Laufe der Zeit wurde der Computer besser, fand dabei auch Strassen's Algorithmus und dann den besseren.

Eine Beschreibung:

arstechnica.com/information-te…substack&utm_medium=email

Die Publikation in der führenden Zeitschrift "Nature" im Okt. 2022:

nature.com/articles/s41586-022-05172-4

Die Publikation ist frei zugänglich, die neuen Algorithmen auch.

Manni5 · 5. Mai 2024, 04:11

Können Computer Geometrie-Aufgaben lösen?
Diese verlangen doch meist sehr originelle Überlegungen, um einen Beweis der geometrischen Behauptung zu erhalten.
Klappt dies für Geometrie-Aufgaben, wie sie bei den Internationalen Mathematik-Olympiaden den weltweit besten Schülern in der Mathematik gestellt werden?

Google's DeepMind hat in Zusammenarbeit mit Forschern des Computer Science Department der New York University nun ein weiteres Programm der "Alpha-Reihe" vorgestellt, AlphaGeometry, das 25 von 30 IMO-Geometrie-Aufgaben in vorgegebener Zeit richtig löste. Bezogen auf alle Mathematik-Aufgaben, ist das fast das Level der Goldmedaillen-Gewinner.
Außerdem fand es zu einer Aufgabe aus dem Jahr 2004 eine allgemeinere Lösung, die den Fachleuten bisher entgangen war.

Das Verfahren: In der Geometrie gibt es endlich viele Regeln, mit denen man Schlüsse ziehen kann. Z.B. Regeln über rechtwinklige Dreiecke, Winkel an Parallelen, usw. Hierfür gibt es bereits Programme.

Damit man diese Regeln anwenden kann, muss man aber meist darauf kommen, die richtigen zusätzlichen Punkte und Geraden hinzuzufügen, um dann die Schlüsse durchzuführen.

Die KI sollte lernen, die "richtigen" Punkte und Linien hinzuzufügen. Ein Problem dabei: Es gibt nicht genügend Aufgaben mit Lösungen.

Also hat ein Programm zunächst über 100 Millionen zufällige Diagrammen erzeugt und dann hierfür alle möglichen Aussagen aufgestellt. Danach hat es Punkte oder Linien entfernt, um so überprüfen zu können, welches Hinzufügen besonders erfolgreich ist (ein beliebiges Hinzufügen würde die Rechenkapazität sprengen). Dadurch konnte es "lernen", wie es für diverse Situationen besonders erfolgreiches Hinzufügen von Punkten oder Linien an das andere Programm weitergeben kann, das dann die Beweise probiert. Der Computer kann - wie im Schach - diverse Möglichkeiten des Hinzufügens und der Beweise schnell durchrechnen.

Fields-Medaillist Ngô Bảo Châu:

"Es leuchtet mir ein, dass sich die KI-Forscher zuerst an den IMO-Geometrie-Problemen versuchen, denn die Lösung dieser Probleme funktioniert ein wenig wie beim Schach, da wir bei jedem Schritt nur eine relativ kleine Anzahl sinnvoller Züge haben. Aber ich finde es dennoch erstaunlich, dass sie es schaffen konnten. Das ist eine beeindruckende Leistung."

(übersetzt mit DeepL, etwas verbessert)

Auch andere Mathematiker sind beeindruckt.

spektrum.de/news/die-ki-alphag…hematik-olympiade/2204167

Der Bericht von DeepMind, auch mit Beispielen aus der Geometrie:

deepmind.google/discover/blog/…l-ai-system-for-geometry/

Dort gibt es auch einen Link zum AlphaGeometry Code und Modell, open source.

Publiziert wieder in Nature, im Jan. 2024:

nature.com/articles/s41586-023-06747-5

DeepMind hofft, dieses Verfahren auch in anderen Bereichen der Mathematik anwendbar zu machen (siehe auch die vorherigen Posts).

***********

Auch die Programmierer wissen also nicht, welches Wissen AlphaGeometry durch das systematische Probieren erhalten hat.

Aber: dieses Programm wurde von Menschen entwickelt, von Informatik- und Mathematik-Spezialisten.
Die Beurteilung, was "wichtig" ist, angefangen bereits mit der Auswahl von Geometrie-Aufgaben der IMO, erfolgt durch die Menschen.

Manni5 · 22. Mai 2024, 13:12

DeepMind hat neue KI-Verfahren zur Wettervorhersage entwickelt.
Wettervorhersagen sind nicht nur für uns alle "nützlich", sondern können lebensrettende Vorbereitungen ermöglichen.

Die bisherigen Verfahren verwenden Wetterstationen, Satelliten und Meeresstationen, um viele Daten zu erhalten, mit denen durch komplizierte Systeme von partiellen Differentialgleichungen mit Hilfe von Großrechnern und viel Rechenzeit die Vorhersagen berechnet werden.

DeepMind hat nun die Wetterdaten der letzten 39 Jahre verwendet, um ihre Rechner und "neuronalen Netzwerke" damit "zu trainieren". Nachdem dies erfolgt war, wendeten sie es auf eine Reihe von Testfällen und den Hurrikan Lee vom letzten September an. Für Lee konnten sie früher und genauer vorhersagen, wann und wo er an Land geht. In den Testfällen waren sie in der Troposphäre, dem für uns wichtigen unteren Teil der Atmosphäre, mit weniger Rechenaufwand wesentlich genauer und schneller als die bisherigen Verfahren (in weniger als einer Minute, statt in Stunden).

Bei unvorhergesehenen Wetterereignissen haben beide Verfahren ihre Probleme, und DeepMind wird bei lokalen Vorhersagen ungenau.

Die Idee ist, diese Verfahren mit den bisherigen zu verknüpfen. Mit den neuen Verfahren können Erfahrungsdaten verwendet werden, die sich bisher nicht gut in die Gleichungssysteme einfügen lassen.

Der Modellcode ist wieder OpenSource.

br.de/nachrichten/netzwelt/wet…assische-prognose,TwnnQfv

daswetter.com/nachrichten/wiss…rsage-in-60-sekunden.html

Die Mitteilung von DeepMind von Nov. 2023:

deepmind.google/discover/blog/…obal-weather-forecasting/

Die Publikation in "Science", zusammen mit "Nature" die führende wissenschaftliche Zeitschrift:

science.org/stoken/author-tokens/ST-1550/full

AlphaZero schlägt Stockfisch nach 4 Std. Lernen

Teilen

Benutzer online 1