A mi életünkben nem lesz megoldva az NLHE - Noam Brown interjú

Interjúk | olvasási idő
2016. március 18.
Claudico és Baby Tartanian 8 egyik vezető fejlesztője, Noam Brown szerint az NLHE játékra még sokáig nem lesz tökéletes stratégia, de a top profik legyőzése éveken belül elérhető. Attól viszont szerinte nem kell tartani, hogy magasan képzett botok lepik el az online termeket.
Mint arról beszámoltunk, a Carnegie Mellon University új póker botja, Baby Tartanian 8 nyerte az éves Computer Poker Competitiont. Baby Tartanian 8 annak a Claudico névre keresztelt botnak az utódja, amely 2015-ben vereséget szenvedett Doug "WCGRider" Polk, Dong "Donger Kim" Kim, Bjorn "iamalagtard" Li és Jason Les ellen a "Brains Vs. Artificial Intelligence" párbajon.
Baby Tartanian 8 egyik vezető fejlesztője, Noam Brown már korábban elmondta, hogy bár az új bot jobb pókeres, mint Claudico, még nem tart ott, hogy legyőzze a világ legjobb NLHE heads-up játékosait. 2-3 éven belül azonban kifejleszthetnek olyan botot, amelynek reális esélye lesz erre.
Brown a napokban részletesebben is nyilatkozott a botok témájáról a Pokernewsos Matthew Pittnek.
"Ha jól emlékszem, 2008-2009 körül kezdtünk no limit hold'em botokkal indulni. Az első botok mindössze annyit tudtak, hogy hívtak, megadtak, pot méretűt hívtak, vagy all-in mentek. Azóta rengeteget fejlődtek, elég csak megnézni a kártya absztrakciót, amin a handek csoportba rendezését értjük, hogy ésszerű keretek közé szorítsuk azokat a lehetőségeket, amiket a botnak le kell futtatnia. Annak idején a river-szituációkban 500 csoportba soroltuk a handeket, az új botnak viszont már körülbelül 1.000.000 ilyen csoportja van".
Mint Brown elmondta, Baby Tartanian 8 megírása nagyjából egy hónapot vett igénybe, majd egy hónapon át futtatták a San Diego Supercomputer Center egyik "erőművén". Ugyanakkor nem szükséges szuperszámítógép egy erős bot készítéséhez, mint a Computer Poker Competition másik két dobogós csapatának teljesítménye is mutatja.
"A három legjobb bot egyike a miénk volt, a másik kettő azonban nem köthető sem egyetemhez, sem más kutatócsoporthoz. Az egyik készítője egy profi pókerjátékos, aki szoftvermérnök is, a másikat pedig egy hobbipókeres készítette, aki korábban a Google alkalmazásában állt. Mindkét bot nagyszerűen teljesített, és kevesebb, mint $10.000-ból hozták össze."
"A botok készítésének költségei drasztikusan csökkentek az elmúlt években, főként a Cloud szolgáltatás megjelenésével. Ma már bárki készíthet jó botot, de azért ehhez hozzátartozik, hogy csak a lehetőségek adottak, a készítés nagy szakértelmet igényel" - mondta Brown.
A szoftverfejlesztő arról is beszélt, hogy menyire lehetséges az NLHE megoldása, vagyis a tökéletes stratégia kialakítása. Mint mondta, az NLHE a mi életünkben biztosan nem lesz megoldva, de az is lehet, hogy sosem.
"A limit és no limit játék közt hatalmas a különbség. A limit hold'emben három opció van: call, fold és bet. A no limit azonban gyakorlatilag végtelen számú lehetőséget kínál, hiszen minden apró centes eltérés egy új szituáció programozási szempontból, ez pedig iszonyú terhelés napjaink számítógépeinek. Ahhoz, hogy megoldjuk az NLHE játékot, abban az esetben, ha 20.000 a kezdőstack, mint a Computer Poker Competitionön, 10^163 lehetőséget kellene lefuttatnunk, ami felfoghatatlanul nagy szám. Ez a limit játék esetében 10^15. Esélytelen, hogy a mi életünkben megoldják az NLHE-t, de az is lehet, hogy ez sosem történik meg. Egy közel optimális játék azonban elérhető, és szerintem néhány éven belül megjelenik olyan bot, amely legyőzi a legjobb NLHE játékosokat. De ez egyáltalán nem jelenti azt, hogy megoldott lesz a játék."
A fentiek a heads-up játékra vonatkoznak, 6-maxban nagyobb a botok lemaradása az emberi játékosokkal szemben.
Brown szerint a botok legnagyobb gyengesége, hogy nem képesek kihasználni az ellenfelek játékában fellelhető hibákat.
"Jó kérdés, hogy képesek lennének-e a botok a hibák kihasználására. A botok a Nash Equilibrium és a Game Theory Optimal (GTO) alapján játszanak, amit lehetetlen legyőzni. De ott van az exploitív stratégia, ami az ellenfél hibáinak kihasználására épül. Az, hogy GTO-t játszik a bot, annyit jelent, hogy egy olyan stratégiája van, amit nem lehet legyőzni. Ez viszont nem biztos, hogy a legnagyobb várható értékű játék az adott ellenféllel szemben. Ez az, amiben a profi játékosok nagyon jók, felfedezik és kihasználják az ellenfelek hibáit. Voltak próbálokozások erre vonatkozóan botokkal is, de nem voltak igazán sikeresek. Ahhoz, hogy a szoftver felismerje egy adott ellenfél hibáit, leosztások billiójára lenne szüksége, kis minta alapján azonban nem képes erre. Úgy gondolom, ez a legnagyobb gyengesége a mai botoknak az emberi játékosokkal szemben."
A beszélgetés végén Brown megnyugtatta a pókereseket, nem kell attól tartaniuk, amitől a legjobban félnek.
"A heads-up póker botok ma már erősebbek, mint a legtöbb emberi játékos. Azt viszont nem hiszem, hogy a széleskörű elterjedésüktől kellene tartani. A termek manapság is hatékonyan kiszűrik és eltávolítják ezeket a játékból".
Mint arról beszámoltunk, a Carnegie Mellon University új póker botja, Baby Tartanian 8 nyerte az éves Computer Poker Competitiont. Baby Tartanian 8 annak a Claudico névre keresztelt botnak az utódja, amely 2015-ben vereséget szenvedett Doug "WCGRider" Polk, Dong "Donger Kim" Kim, Bjorn "iamalagtard" Li és Jason Les ellen a "Brains Vs. Artificial Intelligence" párbajon.

Baby Tartanian 8 egyik vezető fejlesztője, Noam Brown már korábban elmondta, hogy bár az új bot jobb pókeres, mint Claudico, még nem tart ott, hogy legyőzze a világ legjobb NLHE heads-up játékosait. 2-3 éven belül azonban kifejleszthetnek olyan botot, amelynek reális esélye lesz erre.

Brown a napokban részletesebben is nyilatkozott a botok témájáról a Pokernewsos Matthew Pittnek. 


Noam Brown

"Ha jól emlékszem, 2008-2009 körül kezdtünk no limit hold'em botokkal indulni. Az első botok mindössze annyit tudtak, hogy hívtak, megadtak, pot méretűt hívtak, vagy all-in mentek. Azóta rengeteget fejlődtek, elég csak megnézni a kártya absztrakciót, amin a handek csoportba rendezését értjük, hogy ésszerű keretek közé szorítsuk azokat a lehetőségeket, amiket a botnak le kell futtatnia. Annak idején a river-szituációkban 500 csoportba soroltuk a handeket, az új botnak viszont már körülbelül 1.000.000 ilyen csoportja van".

Mint Brown elmondta, Baby Tartanian 8 megírása nagyjából egy hónapot vett igénybe, majd egy hónapon át futtatták a San Diego Supercomputer Center egyik "erőművén". Ugyanakkor nem szükséges szuperszámítógép egy erős bot készítéséhez, mint a Computer Poker Competition másik két dobogós csapatának teljesítménye is mutatja.

"A három legjobb bot egyike a miénk volt, a másik kettő azonban nem köthető sem egyetemhez, sem más kutatócsoporthoz. Az egyik készítője egy profi pókerjátékos, aki szoftvermérnök is, a másikat pedig egy hobbipókeres készítette, aki korábban a Google alkalmazásában állt. Mindkét bot nagyszerűen teljesített, és kevesebb, mint $10.000-ból hozták össze."

"A botok készítésének költségei drasztikusan csökkentek az elmúlt években, főként a Cloud szolgáltatás megjelenésével. Ma már bárki készíthet jó botot, de azért ehhez hozzátartozik, hogy csak a lehetőségek adottak, a készítés nagy szakértelmet igényel" - mondta Brown.

A szoftverfejlesztő arról is beszélt, hogy menyire lehetséges az NLHE megoldása, vagyis a tökéletes stratégia kialakítása. Mint mondta, az NLHE a mi életünkben biztosan nem lesz megoldva, de az is lehet, hogy sosem.

"A limit és no limit játék közt hatalmas a különbség. A limit hold'emben három opció van: call, fold és bet. A no limit azonban gyakorlatilag végtelen számú lehetőséget kínál, hiszen minden apró centes eltérés egy új szituáció programozási szempontból, ez pedig iszonyú terhelés napjaink számítógépeinek. Ahhoz, hogy megoldjuk az NLHE játékot, abban az esetben, ha 20.000 a kezdőstack, mint a Computer Poker Competitionön, 10^163 lehetőséget kellene lefuttatnunk, ami felfoghatatlanul nagy szám. Ez a limit játék esetében 10^15. Esélytelen, hogy a mi életünkben megoldják az NLHE-t, de az is lehet, hogy ez sosem történik meg. Egy közel optimális játék azonban elérhető, és szerintem néhány éven belül megjelenik olyan bot, amely legyőzi a legjobb NLHE játékosokat. De ez egyáltalán nem jelenti azt, hogy megoldott lesz a játék."

A fentiek a heads-up játékra vonatkoznak, 6-maxban nagyobb a botok lemaradása az emberi játékosokkal szemben.
Brown szerint a botok legnagyobb gyengesége, hogy nem képesek kihasználni az ellenfelek játékában fellelhető hibákat.

"Jó kérdés, hogy képesek lennének-e a botok a hibák kihasználására. A botok a Nash Equilibrium és a Game Theory Optimal (GTO) alapján játszanak, amit lehetetlen legyőzni. De ott van az exploitív stratégia, ami az ellenfél hibáinak kihasználására épül. Az, hogy GTO-t játszik a bot, annyit jelent, hogy egy olyan stratégiája van, amit nem lehet legyőzni. Ez viszont nem biztos, hogy a legnagyobb várható értékű játék az adott ellenféllel szemben. Ez az, amiben a profi játékosok nagyon jók, felfedezik és kihasználják az ellenfelek hibáit. Voltak próbálokozások erre vonatkozóan botokkal is, de nem voltak igazán sikeresek. Ahhoz, hogy a szoftver felismerje egy adott ellenfél hibáit, leosztások billiójára lenne szüksége, kis minta alapján azonban nem képes erre. Úgy gondolom, ez a legnagyobb gyengesége a mai botoknak az emberi játékosokkal szemben."

A beszélgetés végén Brown megnyugtatta a pókereseket, nem kell attól tartaniuk, amitől a legjobban félnek.

"A heads-up póker botok ma már erősebbek, mint a legtöbb emberi játékos. Azt viszont nem hiszem, hogy a széleskörű elterjedésüktől kellene tartani. A termek manapság is hatékonyan kiszűrik és eltávolítják ezeket a játékból".




Kapcsolódó cikkek

0 hozzászólás