A Player of Games hozza el a póker végnapjait?

Egyéb | olvasási idő
2022. január 18.
A Google játékelmélet alapú mesterséges intelligencia projektje.

A Deepmind, a Google által támogatott mesterséges intelligenciával foglalkozó vállalat, létrehozta a Player of Games nevű rendszert, amely várhatóan jól teljesít majd a teljes információs és a hiányos információs játékokban egyaránt. (Ebbe a kategóriába tartozik többek között a póker is.)

A mesterséges intelligenciának ez a felhasználása jelentős potenciállal rendelkezik az számos valós probléma megoldásában is az elkövetkező években.

Az olyan feladatok, mint a leghatékonyabb útvonal megtervezése, az ügyfélkapcsolattartás vagy akár a szerződéskötésekhez kapcsolódó tárgyalások is profitálhatnak az ilyen szakosított mesterséges intelligenciából.

A Cornell Egyetem által kiadott közlemény a következőket tartalmazza a projekt kapcsán:

„Ez egy úgynevezett „általános célú” algoritmus, amely egyesíti a korábbi megközelítéseket. Ötvözi az irányított keresést, az önálló, játékos tanulást, és a játékelméleten alapúló döntéshozást"

"A Player of Games az első olyan algoritmus, amely kiemelkedő eredményt ért el nagyméretű mintán,
mind teljes, mind hiányos információjú játékokban. Ez egy fontos mérföldkő a tetszőleges környezetbe adaptálható általános algoritmusok felé”

Amikor két mesterséges intelligencia összeakaszkodik:

A program nemrégiben megmérkőzött a Slumbot ellen, amely a legerősebb, nyilvánosan elérhető NL Hold’em mesterséges intelligencia programnak számít, és könnyedén győzött, Facebook ReBel programja pedig fel sem tudta venni vele a versenyt.

A Player of Games a Stockfish, az egyik legerősebb sakkmotor ellen is megmérkőzött, és nem vallott szégyent, sőt sok paraméterben erősebbnek is bizonyult. Az AlphaZero ellen egy go meccsen a játszmák mindössze 0,5%-át nyerte meg, de úgy vélték, hogy majdnem egy profi emberi játékos szintjén teljesít.

Hogy csinálja, mi a technikai háttér:

A mesterséges intelligencia a tanulást egy szabványos fa keresés algoritmussal kezdi.

A trükk a következő fázisban van, ez az a különbség, ami a teljes, és a hiányos információval kapcsolatos kihívásokban egyaránt nagyszerűvé teszi. Az algoritmus figyelembe veszi a korábbi döntéseinket, modellezi a lehetséges kimeneteleket, majd kiszámolja, hogy ezek közül melyik a lehető „legkisebb utólagos megbánással járó lehetőség” Counterfactual Regret Minimization (CFR) és azt választja.

Martin Schmid, a DeepMind vezető kutatója elmondta:

"Ez egy lépés az általános mesterséges intelligencia felé - a Player of Games képes teljes és hiányos információjú játékokat is játszani, Az AlphaZero erősebb, mint a Player of Games a teljesinformációs játékokban, de [nem] hiányos információjú játékokra tervezték."

Az általános AI az egyik legizgalmasabb és legmegosztóbb előrelépés, amelynek a következő évtizedekben tanúi lehetünk.

A korábban megoldhatatlannak tartott feladatok kapcsán, képesek lehetnek tökéletes stratégiájuknak köszönhetően, a hibamentes kivitelezésre.

A kérdés csupán az, hogy ez mennyiben fogja rossz értelemben befolyásolni az amúgy tökéletlen mindennapjainkat.


Kapcsolódó cikkek

0 hozzászólás