Die Spiele Go, Schach, Shogi haben feste Regeln. In der realen Welt muss man auf Situationen reagieren, die sich dynamisch verändern, d.h. die Regeln sind unklar.
Hierfür hat DeepMind das Programm MuZero entwickelt, das auch bei unbekannten Regeln Pläne entwerfen kann. Es beruht wie AlphaZero auf neuronalen Netzwerken. Es war bei Schach und Shogi ebenso gut wie AlphaZero, bei Go besser als AlphaZero und bei Atari besser als die existierenden Programme.
Eine Mitteilung der Firma DeepMind:
deepmind.com/blog/muzero-maste…i-and-atari-without-rules
Eine Publikation hierzu vom 23. Dez. 2020 in der weltweit führenden Zeitschrift Nature:
nature.com/articles/s41586-020…0fiMf45ZGDAQ7fUI66-u7Y%3D
Am Ende der Mitteilung von DeepMind schreiben die Autoren, dass bereits AlphaZero Anwendungen in der Chemie und in der Quantenphysik hatte, mit Links zu Publikationen. Sie hoffen, dass MuZero auch für komplexere Problemlagen der realen Welt mit unbekannten Regeln Hilfe für Lösungen bieten kann.
Hierfür hat DeepMind das Programm MuZero entwickelt, das auch bei unbekannten Regeln Pläne entwerfen kann. Es beruht wie AlphaZero auf neuronalen Netzwerken. Es war bei Schach und Shogi ebenso gut wie AlphaZero, bei Go besser als AlphaZero und bei Atari besser als die existierenden Programme.
Eine Mitteilung der Firma DeepMind:
deepmind.com/blog/muzero-maste…i-and-atari-without-rules
Eine Publikation hierzu vom 23. Dez. 2020 in der weltweit führenden Zeitschrift Nature:
nature.com/articles/s41586-020…0fiMf45ZGDAQ7fUI66-u7Y%3D
Am Ende der Mitteilung von DeepMind schreiben die Autoren, dass bereits AlphaZero Anwendungen in der Chemie und in der Quantenphysik hatte, mit Links zu Publikationen. Sie hoffen, dass MuZero auch für komplexere Problemlagen der realen Welt mit unbekannten Regeln Hilfe für Lösungen bieten kann.