2019 World Series of Poker Europe

Polaris 2.0 besiegt Team Stoxpoker beim Mensch-Maschine Championship Rückspiel

Polaris 2.0 besiegt Team Stoxpoker  beim Mensch-Maschine Championship Rückspiel 0001

Nachdem im letzten Sommer die Menschen die erste Mensch-Maschine Poker Meisterschaft, welche in Vancouver/Kanada stattfand, knapp gewonnen hatten, hatte die University of Alberta's Computer Poker Research Group (CPRG) nun ein Jahr Zeit, ihre Pokerspiel-Programme zu verbessern (in der Gesamtheit wird dieses Softwarepaket als Polaris bezeichnet) und auf das Rückspiel diesen Sommer vorzubereiten. Die Bemühungen waren erfolgreich, da Polaris 2.0 ein Team aus menschlichen Herausforderern in einer Reihe von "duplicate" Limit Hold'em Matches besiegte.

Der Wettbewerb fand überwiegend im Rio All-Suite Casino Hotel/Las Vegas im Rahmen der Gaming Life Expo statt (welche wiederum im Rahmen der WSOP veranstaltet wurde), vom 03.07 bis zum 06.07 fand an jedem Tag jeweils ein Match statt. Das menschliche Team bestand aus einigen Mitgliedern der Stoxpoker Poker Coaching Webseite. Anders als im letzten Sommer, als die Menschen nur durch zwei Spieler, Phil Laak and Ali Eslami, repräsentiert wurden, waren es in diesem Jahr insgesamt sieben Spieler, welche an dem Wettbewerb teilnahmen. Die Teammitglieder waren: Nick Grudzien, Kyle Hendon, Rich McRoberts, Victor Acosta, Mark Newhouse, IJay Palansky und Matt Hawrilenko.

Wie im letzten Jahr, bestand dieser Wettbewerb aus vier Sessions, bei welchen jeweils zwei Spieler simultan (aber räumlich getrennt) gegen den Computer "duplicate" Limit Hold'em spielten. Die Blinds waren 500$/1000$ und die Limits 1000$/2000$. Entsprechend den Regeln von Duplicate Poker, waren die Karten welche in einer Session an die menschlichen Spieler verteilt wurden gleich den Karten welche der Computer erhielt und umgekehrt, die Community Cards bei der entsprechenden einzelnen Hand waren ebenfalls identisch. Dieses Format sorgt dafür, daß der Glücksfaktor durch "Draws" minimiert wird, somit erhielten Beide (die Menschen und Polaris 2.0) die gleichen Karten ausgeteilt und sahen sich mit den gleichen Situationen konfrontiert.

Am Ende jedes Matches, wurden die Gesamtergebnisse der beiden simultan gespielten 500-Hand Sessions zusammengezählt, um festzustellen, wer die jeweilige Session gewonnen hat. Wenn die Differenz der Gesamtergebnisse weniger als 500-Small Bets betrug (25.000$) wurde das Match als Unentschieden deklariert, wenn die Differenz größer war, hatte das Team mit der höheren Gesamtsumme gewonnen.

Im ersten Match traten Nick Grudzien und Kyle Hendon gegen Polaris 2.0 an, Hendon hatte nach 500 Händen insgesamt 37.000$, Grudzien hatte 42.000$. Das die Gesamtdifferenz nur 5.000$ betrug wurde das erste Match als unentschieden gewertet.

Dank Rich McRoberts konnten die Menschen das zweite Match gewinnen, er hatte am Endes des Matchs gegen den Computer 89.000$. Sein Partner Victor Acosta schlug sich leider nicht so gut und hatte am Ende 39.500$. Somit hatten die menschlichen Spieler einen Netto Profit in Höhe von 50.000$ was mehr als ausreichte um dieses Match zu gewinnen.

Polaris 2.0 hatte ein schönes Comeback und entschied Match 3 und 4 zu seinen Gunsten. Im dritten Match hatte Mark Newhouse nach 500 Händen gegen den Computer 251.500$ gewonnen (mit Abstand das beste Ergebnis von allen menschlichen Spielern). Sein Partner, IJay Palansky, hatte am Ende 307.500$, somit hatte der Computer das Match mit einem Gesamtprofit in Höhe von 56.000$ gewonnen. Sicherlich waren die Karten in diesem Match zu Gunsten von Newhouse und zu Gunsten des Computers gegen Palansky. Polaris schaffte es aber mit den gleichen Karten gegen Newhouse weniger Geld zu verlieren, als Palansky gegen den Computer.

In der vierten Session gewann der Computer gegen beide menschlichen Herausforderer, er lag 60.500$ vor Mark Newhouse und 29.000$ vor Palansky. Somit hatte Polaris 2.0 bei den Matches im Rahmen der Gaming Expo Life zwei Mal gewonnen, ein Mal verloren und ein Mal unentschieden erreicht. Zwei frühere Matches bei welchen ebenfalls Stockspoker Spieler mit von der Partie waren, zählten auch zu den Wertungsspielen. Die Menschen hatten ein Match gewonnen, der Computer das andere Match. Somit hatte Polaris 2.0 abschließend drei Matches gewonnen, Zwei verloren und ein Match unentschieden gespielt.

Nach Aussagen von Michael Bowling, welcher die Studenten der University of Alberta bei der Programmierung von Polaris 2.0 unterstützt und beaufsichtigt hatte, wurden seit dem letzten Jahr signifikante Veränderungen an Polaris vorgenommen, welche es den menschlichen Gegenspielern erschweren Schwächen von Polaris 2.0 auszunutzen.

Laut Bowling, bestand die wichtigste Veränderung, welche die Programmierer vorgenommen haben, darin, daß ein Programmteil hinzugefügt wurde, durch welchen Polaris 2.0 in der Lage ist selbstständig zu lernen und zu erkennen, welche Pokerstrategie ein Mensch im allgemeinen einsetzt. Aufgrund dieser Daten ist Polaris 2.0 nun in der Lage die eigene Strategie entsprechend anzupassen. Somit entwickelt der Computer nicht nur eine Strategie um gegen die menschlichen Gegner zu spielen, sondern entwickelt für jeden menschlichen Gegenspieler mehrere spezifische Strategien und wechselt während den Sessions auch noch zwischen den spezifischen Strategien. Dadurch haben es die menschlichen Spieler sehr schwer sich auf die wechselnden Strategien von Polaris 2.0 einzustellen/ bzw. ist es sehr schwierig die aktuelle Spielweise von Polaris 2.0 mit anderen, vorher gespielten Sessions zu vergleichen.

Polaris lernt aus seinen eigenen Fehlern, er setzt dabei einen verblüffenden Algorithmus ein, welcher den Namen "counter-factual regret" trägt. Die Software ist in der Lage die Art und Weise aufzuzeichnen, wie die menschlichen Gegner eine Hand spielen in welcher Polaris verloren hat, danach wird das Spiel aufgrund der Daten von Polaris entsprechend angepasst, wenn genau diese spezifische Situation wieder auftritt.

Die CPRG sagte, daß beabsichtigt wird, die Forschungen über Heads-Up Limit Hold'em hinaus auszuweiten, die Forschungsgruppe will sich zukünftig auch mit komplizierteren Pokervarianten beschäftigen. Die Forschungsgruppe beabsichtigt die Ergebnisse im Bereich der künstlichen Intelligenz auch auf Themen ohne Pokerbezug anzuwenden.

Lesen Sie dazu auch Polaris 2 – wer wird dieses Mal gewinnen?

Ed note: Pacific Poker bietet allen PokerNews Spielern einen First Deposit Bonus von 100% bis zu $400 - dieses Angebot beinhaltet einen 25% sofort verfügbaren First Deposit Bonus bis zu $100!

Was denken Sie?

MEHR ARTIKEL

Weitere Artikel