Nash-egyensúly szerinti játék hyper husng-ben

2013. június 22., szombat 09:42
Nash-egyensúly hyper husng-ben, elmélet és gyakorlat

 

 

 Sziasztok!

 

Mint bizonyára sokan tudjátok, Nash jónevű amerikai matematikus volt, aki sok minden más mellett játékelmélettel is foglalkozott. Róla készült az Egy csodálatos elme c. film.

Az általa kidolgozott és bizonyított tétel azt mondja ki, h az ilyen kétszereplős játékok során, mint pld husng, mindig létezik egy optimális játékstratégia. Ha a két résztvevő mindegyike követi ezt a stratégiát, akkor hosszú távon egyik sem nyer szinte semmit a másiktól.

Póker esetében persze a kötelező rake mindenképpen veszteséget jelent.

 

Amennyiben a két játékos közül  csak az egyik (A) követi a Nash-egyensúly szerinti stratégiát, míg a másik (B) ettől rendszeresen eltér, akkor ha a fene fenét eszik is B játékos hosszú távon mindenképpen bukni fog.

A hosszú táv szerintem itt leginkább több ezer partit jelent.

 

Találtam oldalakat, ahol husng-re és más típusú játékokra is konkrét laptartományokat adnak meg, egyfajta push – and – fold módszer gyanánt, h mikor melyiket kell választani.

A döntést  a legkisebb stack vakhoz viszonyított aránya alapján kell meghozni.

Nagyon széles laptartományt adnak meg, s ahogy a legkisebb stack/nagyvak csökken úgy lesz egyre nagyobb azon lapok száma amivel allin kell menni.

 

Ha az elmélet helyes és miért ne lenne az, akkor normál és turbó husng-k esetében ez talán csak a végjátéknál alkalmazható, amikor az egyik játékos zsetonszáma már jelentősen lecsökkent mondjuk stack/nagyvak 12 alá.

Hyper játéknál az eleve nagyon kevés induló zsetonmennyiség miatt viszont szinte azonnal használható, vagy legalábbis alig egy-két perc elteltével.

 

Érdekelne, hogy valaki esetleg foglalkozott-e ezzel a témával mélyebben, netalán ez alapján játszik és milyen eredménnyel?

 

Néha figyelem a nagyok játékát hyperben, rams85 a Pokerstarson irdatlan mennyiséget játszik szinte nap mint nap, igaz jelentős swingekkel. Lehet, h ő ezt a módszert követi?

 

callwilson

Hozzászólások

  • sabe832013. június 22., szombat 10:05
    avatar

    A NASH-t általában 8bb eff. stack alatt alkalmazzuk, sőt adódhat olyan ellenfél aki ellen még 8bb alatt is el lehet tőle térni (pl. enged limpelni és sokat dob limpcbetre). A NASH annyit mutat meg, hogy az allin várható értéke jobb a dobás várható értékénél (SB-ről a dobás ugye -50bb/100), más lehetőséget nem vesz számításba, ezeknek azonban nagyon sok esetben a várható értéke lényegesen jobb lesz mint a pushné. Ergó ha semmi másból nem áll a játékod, mint hogy push/fold-ot játszol minden stackméretnél, garantáltan vesztő leszel, ugyanis a kicsit is értelmes ellenfelek ezt nagyszerűen ki fogják tudni használni.

    Említetted hogy figyelemmel követed a nagyok játékát, ha megnézed hogy játszanak, az ő játékuk sem abból áll hogy nash szerint pusholgatnak az első party-tól, ha belegondolsz eléggé easy money lenne ha 500$-on ezzel lehetne nyerni.

  • callwilson2013. június 22., szombat 11:32

    sabe83

    Amit írtál, azzal egyetértek. Én is írom a szövegben, h hypernél is 1-2 perc után juthat el a játék abba a szakaszba, amikor a Nash-nek van értelme. A játék kezdeti szakaszában biztosan van jövedelmezőbb stratégia.

  • straubbazsi2013. június 22., szombat 12:03
    avatar

    Ha csak paraszti ésszel belegondolsz, nem nyerhetsz úgy egy játékon, hogy kinyomtatsz egy nash táblát (1-2-3...-12 vakra), majd leülsz... nem, inkább leülteted a nagymamád, akinek sok ideje van és kis nyugdíja, hogy kezdjen el pénzt keresni (bízom benne, nem sértő a példa).

    A nash skála egy optimálisra adott optimális válasz. Ha az ellenfeled nem azt játssza, akkor nem az lesz az optimum, minuszos lépéseid lesznek és hosszútávon pénzt fogsz veszíteni. A nash használata nem azt jelenti, hogy hosszútávon nem fogsz pénzt veszíteni.

  • Krono2013. június 22., szombat 12:17

    straubbazsi+1

    "Amit írtál, azzal egyetértek. Én is írom a szövegben, h hypernél is 1-2 perc után juthat el a játék abba a szakaszba, amikor a Nash-nek van értelme."

    1-2 perc? Fél percenként emelkedik a vak? :))

  • bia892013. június 22., szombat 12:28
    avatar

    Hu sabe :) kepzed a konkurenciát ?:)

  • callwilson2013. június 22., szombat 12:42

    straubbazsi

    A példád nem volt sértő!
    "Ha az ellenfeled nem azt játssza, akkor nem az lesz az optimum, minuszos lépéseid lesznek és hosszútávon pénzt fogsz veszíteni. A nash használata nem azt jelenti, hogy hosszútávon nem fogsz pénzt veszíteni."-írod.

    Szerintem ebben tévedsz, hiszen ha az ellenfél nem a Nash-optimumot járssza, akkor ő tér el az optimálistól, vagyis hosszú távon neki kell veszítenie. Ha a matek működik.
    Igaz, még soha nem próbáltam, ezért dobtam fel a topicot, hátha valaki hosszú távú tapasztalattal rendelkezik.

    1 - 2 perc téma: nem a vak emelkedésére céloztam, hanem arra, h egy-két perc játék után már van stackméretben különbség, vagyis a Nasz-tábla alkalmazható.
    GL

  • jak12013. június 22., szombat 12:56
    avatar

    Érdekes amit írsz! Érdemes a definíciókon elgondolkodni és választ kapunk a kérdésekre! Mi az optimális játék?? Sosem lesz két teljesen egyformán gondolkodó és cselekvő játékos, így az optimális játék definíció szerint sosem lehet állandó. Ha előfordulna, hogy két jól gondolkodó játékos több ezer "meccset" lejátszana, akkor a statisztikájuk és a játékuk folyamatosan alkalmazkodna és ezzel együtt változna ahogy haladunk előre. A változásokkal pedig megint alkalmazkodna és megint változna és így tovább... Optimális játékot csak az adott szituációban az adott ismeretek alapján lehet meghatározni.

  • Lucsi2013. június 22., szombat 13:28
    avatar

    "Igaz, még soha nem próbáltam, ezért dobtam fel a topicot, hátha valaki hosszú távú tapasztalattal rendelkezik. "

    "Szerintem ebben tévedsz"

    óvatosan bánj ezekkel, hogy valamiről leírod, hogy fogalmad sincs, aztán ha valaki ír rá valamit, akkor azt mondod, hogy téved. olyannak, aki történetesen "hosszú távú tapasztalattal rendelkezik" :)

    az elméletednél pedig figyelj arra, hogy a nash a feet nem számolja bele.emiatt igenis veszíthetsz sajnos. ráadásul hiába pluszos egy push 0.1 vakkal, ha bekúrod egy overaggro callozo ellenfél ellen a 10 vakodat a ranged aljával, akkor a nash legyen veled.

  • FlössösMadrid2013. június 22., szombat 13:44

    Én nagyon szívesen játszanék veled egy olyan hyperhu párbajt, ahol mondjuk 15bb-ről kezdődik a meccs, és neked mindig a nash szerinti döntéseket kell meghoznod, én viszont limpelhetek, raisefoldolhatok stb.
    És nagy tétben mernék rá fogadni, hogy én fogok nyerni :)

  • vadallat2013. június 22., szombat 14:36
    avatar

    minden stratégiának van ellenszere, vagy amelyiknek nincs, annak önmaga. :D na ezt kéne kitalálni, csak még senki se jutott odáig.

  • straubbazsi2013. június 22., szombat 14:53
    avatar

    Nincs gond a megkérdőjelezéssel, alapvetően a pókeres világban mindenkit érdemes (legyen oktató évek óta, nyerő játékos vagy akármi).
    Az irreleváns, hogy emelünk is, az elméleti kérdés nem ennek szólt.

    "Nash-optimumot járssza, akkor ő tér el az optimálistól"

    Viszont félreérted, kiragadsz a definícióból. A nash még mindig nem az optimális játék, hanem a tökéletes játékra adott válasz. Hol van ebben, hogy a nash az optimális játék akármikor is?

    "k (A) követi a Nash-egyensúly szerinti stratégiát, míg a másik (B) ettől rendszeresen eltér, akkor ha a fene fenét eszik is B játékos hosszú távon mindenképpen bukni fog"

    Ez nagyrészt igaz fordítva is. Ha te nem az optimális játékra válaszolsz a nash skáláddal, akkor kimozdulsz az egyensúlyból, rossz reakciót adsz és pénzt veszítesz (máskor máshonnan: pénzt, előnyt hagysz a partiban, ami nyilván ugyanazt jelenti).

    Nem tudom, próbáld meg átültetni a gyakorlatba példákon keresztül, ha elméletben nehéz a megértése. Mondjuk a feszesebb ellenfeled 10bb(+ante) 60 helyett 40et pussol és te megadod például K4oval. Nézd meg, hogy mennyit veszítesz ezzel, esetleg próbáld meg kiszámolni, hogy ő mennyit veszít azzal x leosztás alatt kevesebbet pussol.

    Ha te nasht játszol, villain meg mást, akkor mindketten pénzt fogtok veszíteni. Ha mindig egymással játszanátok, akkor lényegében a ki játszik rosszabbul (!) döntene, de ez ugye nem áll fent (és igen, még egyszer, nagy bajunk a rake :)).

    Azzal, hogy nasht játszol, biztosan nem fogod megverni a rake-et, ennél tovább pedig valószínűleg felesleges komplikálni elméleti szinten.

    Hogy valaki kitalálta, dolgozzunk ezzel a matematikai elmélettel, az konkrétan zseniális, de nem azért, mert megmondta, hogy mi az optimális játék, mert nem mondja meg, ráadásul igen korlátolt a számolás, de ezzel szemben matematikailag leírja a helyzeteket, ami miatt a tornapóker tanulásának a legfontosabb eleme lesz. HUban, lényegében egy odds számolásról beszélünk, ezért éppen HUban a legkevésbé hasznos a modell használata. A buborékhatás jelenlétekor válik valóban megkerülhetetlenné.

    (A "szinte" furcsa és felesleges a bejegyzés szövegében. Nincs olyan, hogy szinte semmit :) )
    (Az a "leginkább több ezer" erősen optimista tipp ;) )

  • straubbazsi2013. június 22., szombat 14:57
    avatar

    (Ja és siettem, már termeltem 5k VPPét ebben a remek időben, szóval simán lehetnek hibák a kommentben :) )

  • callwilson2013. június 22., szombat 16:19



    Straubbazsi

    Tetszett, amit írtál, ilyet várnék sokat, ami gondolatébresztő.
    Egyetértek azzal, h a Nash-tételre épített játéknál létezik jövedelmezőbb, pláne egy gyenge játékos ellen.

    Azonban, ha egy kis időre elvonatkoztatunk a pókertől, Nash a tételét úgy általában kétszereplős versenyhelyzetekre dolgozta ki, és a tétel azt állítja, h ilyen szitukban
    MINDIG van olyan stratégia, ami a két játékos számára a legelőnyösebb. Továbbá, ha az egyik fél ettől eltér, akkor biztosan rosszul fog kijönni a buliból.

    Ha elfogadjuk, h az elmélet helyes, akkor igaznak kell lennie póker esetében is.
    (jut eszembe: érdekes lenne tudni, ki – kik állapították meg és hogyan azt a laptartományt, amelyről az járja, h ez követi a Nash-tételt)

    Szóval még egyszer: szerintem husng esetén a Nash-egyensúlyra törekvés helyes és hosszú távon nyereséget termel. Mi a hosszú táv? Ahogy Te is megállapítod a pár ezer parti lehet egy túlzottan optimista becslés. Lehet, akkor talán tíz ezer- húsz ezer parti alatt jön ki!
    Na de, ki bírja addig br-al? Valamint ott van még a pszichés teher is a jelentős ingadozások miatt. Egy hobbi pókeres hamar elveszíti a lendületet, ha megindul lefelé a lejtőn, míg egy profi akkor is játszik tovább.

    GL

  • idApRO2013. június 22., szombat 18:30
    avatar

    "Továbbá, ha az egyik fél ettől eltér, akkor biztosan rosszul fog kijönni a buliból. "

    Ha az ellenfeled eltér a NASH-től, mondjuk 11%-os stealje lesz és 11effen pushol és te ott NASH callozol T9s-el akkor azért gondolhatjuk, hogy nem leszel pluszos ellene mert hoszzútávon buksz, hiába használod a NASH-t.
    Ugye?

  • mmm2013. június 22., szombat 20:33

    Amit idApRO irt arra egy nem pokeres példa.

    Furcsa osztozkodás. A következő osztozkodási játékot mérlegeljük.
    100 Ft-ot kell elosztani két fél között kerek Ft-okban. A két játékos egyszerre és egy-
    mástól függetlenül dönt és jelenti be igényét a bírónak. Ha az igények összege nagyobb,
    mint 100 Ft, akkor egyik fél sem kap semmit. Ha az igények összege legfeljebb 100 Ft,
    akkor mindkét fél megkapja azt, amit kért, s az esetleges maradékot a bíró jótékonysági
    célra fordítja, s ez közömbös a játékosok számára.

    Amíg a partnered követi a "tökéletes" taktikát addig az 50 a megfelelő igény. Ha ettől eltér onnantól nem.

  • titcar2013. június 22., szombat 22:51
    avatar

    csak magyar szavakat kéne tudni értelmezni :) Nash _egyensúly_ a dolog neve és nem Nash _stratégia_ :)

  • 641stone2013. június 23., vasárnap 07:59
    avatar

    A nash egyensúly nem csak 2 szereplős játékokra van megfolgalmazva. Azért írom, hogy megfogalmazva, mert ez csak egy definíció. http://hu.wikipedia.org/wiki/Nash-egyensúly

    A játékelméletben Nash-egyensúlynak nevezzük a résztvevő játékosok egyéni stratégiáinak olyan stratégiaegyüttesét, amelyre igaz, hogy minden egyes játékos aktuális stratégiája egy parciálisan legjobb választ ad a többi játékos aktuális stratégiájára. Pontosabban: amennyiben a többi játékos egyike sem változtat az aktuális stratégiáján, akkor az adott játékosnak sem érdemes változtatnia, mert nem járna jobban a változtatással.

  • hokuszpoker2013. június 23., vasárnap 09:46
    avatar

    Azt mondjak limit jatekokban jobban lehet gepiesen jatszani es ki is dogoztak mar eleg jol

  • Holdenper2013. június 23., vasárnap 18:08
    avatar

    Elég sok tévedés van abban amit írtál, de a többiek valamennyire elmondták már.

    Rams nem nashel, a játéka meg azért swinges, mert iszonyat aggro, és sokat tolja regekkel.

  • Sai2013. június 24., hétfő 00:27
    avatar

    Azt kell figyelembe venni, hogy pontosan mire készül egy stratéiga (mik a feltételek és mi a célja). A Nash-féle push-fold táblázat azt feltételezi, hogy az adott játékban csak mindent betolni vagy dobni lehet.

    A célja pedig:
    ip (push/fold): megadni azt a stratégiát, ami a legjobb, ha azt feltételezzük, hogy az ellenfél ismeri a stratégiánkat (tehát az ellenfél optimálisan játszik ellenünk, pontosan tudja mikkel pusholunk és mikkel dobunk - pot odds alapján könnyen dönt)
    oop (call/fold): ugyanez, csak itt azt feltételezhetjük, hogy az ip játékos tudja pontosan, hogy mivel adunk meg/mivel dobunk, és ez ellen push-sol optimálisan.

    Könnyen be lehet látni, hogy a két stratégia egymás ellen optimális (más ellen meg nem optimális, de viszont nem nagyon negatív). DE csak akkor ha teljesül a feltétel.

    Ami a fő probléma: nem igaz a feltételezés, hogy csak allin és dobás jöhet szóba (talán 8bb alatt már közel állnuk hozzá). ip játszhatunk a táblázat szerint (így kikényszerítve a feltételt), ennek a hátrányát mindjárt kifejtem. oop viszont nem tudjuk kényszeríteni az ellenfelet, hogy ne limpeljen vagy emeljen kisebbet (ha véletlen allin megy is dönthetett volna másképp, így ilyenkor se érdemes a táblázatra hagyatkozni).

    Az egyik hátrány, ha ip push/fold-ot játszunk: Az ilyen "optimálisan ellenünk játszó ellenfél" ellen "elég tág" range-dzsel kell betolni, aminek az lesz a következménye, hogy az ellenfél sok lappal "határeset" szituációba kerül, azaz relatíve közel esik egymáshoz a call és a fold várható értéke (-1 bb) (ettől leszünk kihasználhatatlanok). Ebből az következik, hogy hiába tér el ezekkel a lapokkal az optimális ellenstratégiától (ad meg vagy dob hibásan), nem veszít túl sokat az optimálishoz képest -> tehát gyakorlatilag nem nagyon fog tudni hibázni (minden kicsit is értelmes stratégia elég jól működik ellenünk, esélyünk sincs edge kialakítására). A másik hátrány, hogy a gyakorlatban sokkal több value van egy minraise-ben ip, mint egy push-ban, amivel feladjuk a pozíciós előnyünket, hiszen push/fold esetén az ellenfél fog utoljára dönteni a leosztásban, ami nagy előny.

    Ha oop valamiért úgy gondoljuk, hogy az ellenfél push/fold-ot játszik akkor játszhatunk a nash-táblázat szerint, ezzel legalább egy közel 0-s eredményt fogunk hozni. (idApRO példájánál: 11%-os steal ellen a T9s megadás nyilván sokkal rosszabb a dobásnál, de ezt bőven ellensúlyozza az a 89%, amikor az ellenfél (talán hibásan) dob preflop és nyerünk egy sb-t, így összességében a táblázat jól működik). Viszont játszhatunk sokkal jobban ennél, ha direkt a 11%-os range ellen adunk meg vagy dobunk (persze ilyenkor az ellenfél alkalmazkodhat hozzánk és máris rossz a stratégiánk, ha nem változtatunk mi is, de erről szól a HU póker, folyamatos alkalmazkodásról).

  • thomyca2013. június 24., hétfő 19:27

    Titcart tudnám ismételni. Szerintem részben elbeszéltek egymás mellett. Nash-egyensúly nem egyenlő Nash-stratégiával (póker).

    A Nash stratégia pedig csak egy része az ismereteknek, amit felhasználsz.
    A cikk amúgy jó gondolatébresztő.

  • Thorles2013. június 27., csütörtök 10:13
    avatar

    Milyen jó kis vitát generált ez a cikk, szerintem már ezért megérte kirakni, még ha végül ki is derült, hogy nagyrészt nem helyes amit állít.

Ha hozzá szeretnél szólni, lépj be! vagy regisztrálj!