AlphaZero schlägt Stockfisch nach 4 Std. Lernen

    Diese Seite verwendet Cookies. Durch die Nutzung unserer Seite erklären Sie sich damit einverstanden, dass wir Cookies setzen. Weitere Informationen

    • deepmind.com/research/alphago/alphazero-resources/

      So und hier kann man sich selbst alle 10 zugänglichen Partien im pgn-Format herunterladen.

      Kommentar von Conrad Schormann zu folgender Partie: 1.d4 e6 2.Sc3...
      "AlphaZero hält den holländischen Stonewall und das Damengambit für die besten schwarzen Eröffnungen gegen 1.d4, Französisch hält es für minderwertig. Folgerichtig versucht die Google-Maschine Stonewall und Damengambit zu vermeiden und seinen Gegner in Französisch zu locken."

      Dieser Beitrag wurde bereits 2 mal editiert, zuletzt von e4e5f4exf4 ()

    • I Robot ist passend zu manchen Beiträgen,ein Film mit Will Smith in der Hauptrolle. :)




      Eine Revolution? Ein Muster ohne Wert? Ein PR-Coup? Die Meinungen gingen weit auseinander, nachdem das Schachprogramm AlphaZero der Google-Tochter DeepMind das Schachprogramm Stockfish vermöbelt hatte: 64:36 nach 100 Partien.
      Erfahrung ist beim Schach ein wesentlicher Faktor. In dieser Hinsicht war Stockfish seinem Gegner weit voraus. Zusammen mit seinen etwa gleichstarken Kollegen Houdini und Komodo repräsentiert es den vorläufigen Gipfel einer jahrzehntelangen Entwicklung, die die Maschinen in Spielstärkesphären geführt hat, die dem Menschen verschlossen bleiben. Auch AlphaZero repräsentiert den Gipfel einer jahrelangen Entwicklung maschinellen Lernens.
      Für eine Revolution der Eröffnungstheorie ist AlphaZero ein ernsthafter Kandidat. Allein die zehn von DeepMind ausgewählten Partien zeigen, dass einige Abspiele der Damenindischen Verteidigung wahrscheinlich neu bewertet werden müssen. :thumbup:
      Mein Fazit "Hoffentlich geht alles in die richtige Richtung mit der KI"
    • Ich habe kürzlich davon auch etwas im Web gelesen. Das soll allerdings mit unfairen Mitteln einhergegangen sein. Dabei wurden 2 Punkte herausgestellt:
      1) soll es eine Zugzeit von 1min gewesen sein, nicht normale Turnierzeit.
      2) kommt diese Zeiteinstellung dem Rechner auch entgegen weil seine Rechenleistung viel größer gewesen sein soll.
      Erschwerend soll er mit sehr kleiner Hash-Tabelle angetreten sein & ohne Eröffnungsbuch gespielt haben was ich selber nun nicht verstehe. Wenn er alles selber ausrechnen muß braucht er dazu schonmal unnötig Zeit & greift auch noch verstärkt daneben weil er ja sein Wissen ausgeschaltet bekam.
      Fazit:
      Natürlich wird die Rechenleistung des Großcomputers immer höher sein als beim Stockfish. Aber man sollte ihn wenigstens auf seine Höchststufe einstellen, also seine Hash nicht noch ausbremsen & natürlich ihm auch sein Buch erlauben bei richtiger Turnierzeit.
      Dann wird alles wesentlich knapper ausgehen denke ich mal. Weshalb man das so gemacht hat kann man nur spekulieren. Aber natürlich ist es beachtenswert nach nur 4 Stunden Training eine solche Leistung zu erbringen. Das wird noch nicht das Ende der Fahnenstange sein.
    • Ich halte diese Nachricht weder für erschütternd noch für lehrreich.Dass Programme das Fernschach auf den Kopf stellen wissen wir seit 25 Jahren. Was solls? Dass vor kurzem polnische Programmierer das Königsgambit widerlegten, was solls? Was nützt mir das am Brett - auch am, virtuellen? Nimmt das an unserem Spiel die Faszination weg? oder die Spannung? oder die imaginäre Kraft des Einfallreichtums? Höre ich auf Auto zu fahren nur weil ich mit einem Ferrari nicht mithalten kann? Hör auf mit diesen lächerlichen Diagrammen. Ich hatte vor 2 Jahren die Chance anlässlich der Mannschaftsweltmeistershhcahft der Senioren in Dresden mit GM John Nunn diverse Problemstellungen und Studien anzusehen. John ist ein Liebhaber des Problemschachs. Das war für mich faszinierend und spannend und lehrreich. Aber dieser Quatsch mit AlphaZero?
      pangloss
    • Jeder darf ja eine Meinung dazu haben, was auch völlig ok ist. Man sollte nur nicht den DARAN Interessierten die Chance nehmen sich darüber informieren zu können.
      Die Sache mit dem Königsgambit wußte ich selber noch nicht, nur von verschiedenen anderen Systemen bisher.
      Die Programme sind ja eine Art Werkzeug für die Wissenschaft. Die Top-GM's werden sich sicherlich das genau ansehen & dadurch vom PC abgeguckte Strategien anwenden. Denn wer bei DENEN nur den 2.besten erforschten Zug spielt verliert bereits! Die denken erst selber jenseits der erforschten Theorie. Das bringt dann sicherlich völlig neue Strategien zu Tage was ja nichts schlechtes ist.
      Aber WIR Otto-Normalspieler - da ändert sich natürlich nur wenig bis Garnichts. Sollten Endspielstudien überarbeitet werden, DANN nutzt es aber sogar Uns etwas, falls man sich für soetwas interessiert.
      Ich finde den Bericht sehr spannend & mahnte nur einen Makel an,der bei dem Turnier nicht ok war. Die Sache an sich finde ich sehr gut! Man kann ja davon nur lernen.
    • Pangloss, ich würde auch gerne einmal ...Zug um Zug...von John Nunns Erfahrungen kosten, aber ich glaube, dass die Diagramme durchaus auch Interessantes zu bieten haben. Mir ist z.B. aufgefallen, dass nach etwa 200 Spielen das Programm mit recht großer Wahrscheinlichkeit sich in französischen Strukturen bewegte. Danach muss aber etwas Einschneidendes passiert sein, denn von da an mied AlphaZero Französisch immer mehr und fast zeitgleich wendete es sich Caro-Kann zu. Bei beiden Eröffnungen wird der schwarze d5-Bauer vom e6 bzw. c6 Bauern verteidigt. Hat AZ vielleicht herausgefunden, dass das Verstellen seines c8 Läufers ungünstiger ist, als das Verstellen des besten Feldes für den b8 Springer? Das ist natürlich nur eine Vermutung aus dem wenigen Datenmaterial, das uns zur Verfügung steht. Mich würde interessieren, ob AZ zu einem typischen 1.e4 Spieler oder eher zu einem typischen 1.d4 Spieler werden wird, beide Typen kommen bei uns im Schachverein vor, um bestimmten Varianten ein- für allemal zu entkommen.
    • Es ist ja ein regelrechter Hype um den Wettkampf AlphaZero - Stockfish entstanden. In der Tat ist der neue Programmansatz sehr bemerkenswert. Damit hatte keiner gerechnet. Dennoch war der Sieg ist in diesem Wettkampf nicht so überzeugend, wie er oft dargestellt wird. Stockfish durfte seine Eröffnungsdatenbanken nicht benutzen, auf Grund der festen Bedenkzeit pro Zug auch nicht sein Programm zur Erkennung kritischer Situationen und besseren Zeiteinteilung, und die Hardware wurde von DeepMind gewählt, nicht von den Stockfisch-Entwicklern.

      Es wäre leicht gewesen, einen zweiten Wettkampf mit Eröffnungsdatenbanken und dem Zeitprogramm für Stockfish durchzuführen. (Vielleicht gab es den ja sogar, aber ohne einen so schönen überzeugenden Sieg ??)

      Eine weitere interessante Frage ist: Was passiert, wenn AlphaZero mit 4 Std Lernen gegen AlphaZero mit 6 Std oder mit 8 Std Lernen spielt. Tritt eine weitere Leistungssteigerung ein. oder hat dieses Programm seine Grenzen erreicht?
    • Genau zu dem gleichen Ergebnis bin ich auch gekommen!
      Die Rechenüberlegenheit des Großrechners ist ja bereits eine schwierige Hürde die man ausgleichen muß. Aber dann noch Hash zu begrenzen, - die Stockfish zumindestens in einem kommerziellen Computer benutzt, dazu noch die Eröffnungsbibliothek auszuschalten, das riecht für mich etwas nach einer Art Wunschergebnisherbeiführung. Wenn ein Computer seine volle Power nutzen darf & dem Anderen seine ohnehin bereits nachteilige Rechenleistung beschnitten wird, ist das in meinen Augen eines zuschauenden Laien Manipulation, aber niemals ein gerechter Zweikampf!
    • Zur Zeit gibt es ein spannendes neues Projekt:
      LeelaChessZero, in dem versucht wird, ein hervorragendes Schachprogramm durch Selbstlernen
      mittels Beteiligung vieler Computer zu erreichen, ohne Google's DeepMind-computing power.
      Jeder kann mitmachen. Siehe

      chess.com/blog/smurfo/move-ove…theres-a-new-girl-in-town

      Ein sehr guter Artikel ist

      en.chessbase.com/post/leela-chess-zero-alphazero-for-the-pc

      Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von Manni5 () aus folgendem Grund: Zweite www-Referenz eingefügt.

    • Nun gibt es eine offizielle Publikation in der Zeitschrift "Science" über die Grundlagen und Ergebnisse
      von AlphaZero:

      science.sciencemag.org/content/sci/362/6419/1140.full.pdf

      "Science" gehört mit "Nature" zu den beiden bedeutendsten wissenschaftlichen Zeitschriften.
      Vorher waren die Ergebnisse nur im "ArXiV" publiziert worden (siehe Post 1),
      in dem jeder etwas zur schnellen Publikation einstellen kann, ohne dass es begutachtet wird.

      Eine amüsantes kurzes Video über einen Besuch von IM Anna Rudolf in Google's DeepMind Zentrale,
      in der AlphaZero entwickelt wurde, findet sich unter



      siehe auch

      chess.com/blog/Anna_Rudolf/ann…the-deepmind-headquarters
    • Im Jahr 2008 hat GM Hikaru Nakamura eine sehr interessante Partie gegen das Programm Rybka gespielt.
      Die Partie ist aus mehreren Gründen bemerkenswert, auch weil sie den Unterschied im menschlichen bzw. Computer-Denken beleuchtet. Nakamura hat bekanntlich mehrmals gegen Computer gespielt und kennt ihre Eigenarten.

      1. Nakamura hat gewonnen. Rybka sollte überlegen sein.
      2. Die Strategie von Nakamura: er hat dem Programm Raumvorteil angeboten, was dieses gerne annahm, aber dafür ergab sich eine absolut geschlossene Stellung. Nakamura bot dem Computer nun 2 Qualitäten an -- der Computer hatte dann 2 Türme, Nakamura Läufer und Springer. Es kam auch zum Damentausch. Der Computer hatte also großen numerischen Vorteil. Nach 49 Zügen ohne Bauernzug und Schlagfall drohte Remis durch die 50 Züge-Regel. Der Computer wollte das vermeiden und opferte einen Bauern. Die Stellung des Computers hatte dann mehrere Schwächen, bei denen Nakamura sofort sah, dass er sie langfristig ausnutzen kann, der Computer sah das nicht. Nakamura gewann.
      3. Am Ende wandelte er seine Freibauern in Läufer um und setzte mit 5 Läufern matt.
      4. Die Partie im Internet Chessclub dauerte 230 Züge.
      5. Laut nachfolgendem Artikel war es eine Blitzpartie 3 Min. ohne Inkrement, d.h. Nakamura schaffte die 230 Züge in 180 Sekunden!

      Besprochen in (siehe Partie zu Anfang, direkt nach der Penrose-Stellung):

      chess.com/de/article/view/10-s…s-einfach-nicht-verstehen

      Der Artikel beleuchtet 10 Stellungstypen, bei denen Computer Probleme haben.

      Es gibt auch ein Youtube-Video von Nakamura selber zu dieser Partie:



      Nakamura sagt, es waren 270 Züge. Ich weiß nicht, was richtig ist.
      Nach der Partie wurde diese Schwäche des Computers wohl korrigiert.
    • Bin durch Zufall auf eine alte klassische Arbeit von Claude Shannon gestoßen, die als Grundlage für Computerschach gilt. Er bestimmte als Maß der Komplexität des Problems die Zahl der möglichen Schachpartien: 10 hoch 120. Diese Zahl erhielt den Namen Shannon-Zahl.

      Die Originalarbeit von 1950 im "Philosophical Magazine":

      archive.computerhistory.org/pr…ess.shannon.062303002.pdf

      Beschreibung der Shannon-Zahl:

      de.wikibrief.org/wiki/Shannon_number
    • Sehr interessant, obwohl mir die Zahl zu groß erscheint. Bei einer durchschnittlichen Spieldauer von etwa 40 Zügen (laut mehreren Berechnungen im www) und 3 bis 4 jeweils sinnvollen Zügen erhält man 3^80 (etwa 1,5 x 10^38) bzw. 4^80 (etwa 1,5 x 10^48) verschiedene Partien. Immer noch gigantisch, wenn man bedenkt, dass unsere Erde aus etwa 10^50 Atomen besteht. Die oft im Netz zu lesende Behauptung, dass es mehr Schachpartien als Atome im Universum gibt (ca. 10^80), halte ich daher für falsch.
    • Tatsächlich beschreibt Shannon in der Arbeit vor allem, wie man durch geeignete Strategien einen Schachcomputer programmieren könnte, damit er sinnvoll spielt. Bezüglich der typischerweise möglichen Züge verweist er auf Seite 4 auf ein Buch des holländischen Psychologen und starken Schachspielers Adriaan De Groot

      De Groot, A.D., Het Denken van den Schaker 17-18, Amsterdam; 1946, Amsterdam, 207.

      der "das Denken von Schachspielern" bereits in seiner Dissertation untersuchte. Siehe auch

      de.wikipedia.org/wiki/Adriaan_de_Groot

      Habe zwar de Groots Begründung nicht gesehen, aber da er ein recht starker Schachspieler war, halte ich die Zahl für glaubhaft.

      Die Frage ist ja auch, wie erkennt ein Computer, welche Züge "sinnvoll" sind. Bereits für den 1. Zug von Schwarz kommen alle Züge a6 bis e6, g6, e5, d5, c5, Sf6, Sc6 in Frage, 11 Möglichkeiten. In einer typischen Eröffnungs-/Mittelspielsituation gibt es ebenfalls eine ganze Reihe von Möglichkeiten.