2017. január; Internetes hírek

A mesterséges intelligencia véget vet a pókernek ?

Mivel Alphago „feltörte” a go játékot, létezik-e még olyan játék, amely ellenáll a mesterséges intelligencia fejlődésének? Valójában a sakktól és a Go-tól eltérően a póker, legalábbis összetettebb formáiban, eddig ellenállt minden automatizálási kísérletnek. Ennek az az oka, hogy ez egy "hiányos információ" játék. Más szavakkal, a gép nem ismeri az összes kártyát, amelyet az ellenfele tart. Ami az algoritmus új formáját jelenti. A pókernek több változata létezik, de a kutatókat leginkább a Heads Up Texas hold'em hívja, amelyben egyes kártyák láthatók, másokat csak a játékos ismer (a heads up azt jelenti, hogy négyszemközt, vagyis hogy a játék csak két játékos). Ez a változat két változatban is kapható: a „korlátokkal” és a „korlátok nélkül”. A másodikban a játékosok a játék során emelhetnek téteket. A "határtalan" 10 160 különböző játéklehetőséggel rendelkezik, vagyis az IEEE Spectrum emlékeztet minket, talán többet, mint az univerzum atomjainak száma. A Cepheus nevű bot már megnyerte a "korlátokkal" verziót, amely csak 10 14 lehetőséget kínál.

A póker az elmúlt napokban felkeltette a szaksajtó figyelmét, két csapat két különböző bejelentése miatt, amelyek a "nincs korlátozás" összetettségét igyekeztek megoldani. Először is, a Carnegie Mellon University csapata, Tuomas Sandholm vezetésével, teszteli szoftvereit a legjobb profi játékosok ellen: a verseny január 11-én kezdődött és 30-án fejeződik be (a meccs előrehaladását valós módon is követhetjük). idő ezen az oldalon).

Ugyanakkor egy másik csoport Michael Bowling vezetésével az Alberta Egyetemen új programot, a Deepstack (.pdf) programot javasolt. A kutatók szerint 33 profi játékossal játszották a programjukat, akik mindegyike körülbelül 3000 játékot játszott a gép ellen, és a Deepstack az ellenfelei szintjén lett volna. Alapvetően a két versenyző csapat két különböző elméleten alapszik. Az első, a Libratus középpontjában álló, a mesterséges intelligencia "klasszikus" formája. A második, amelyre a Deepstack alapul, a híres Deep Learning.

Emberek nyomás alatt

Kis probléma - emlékeztet az IEEE Spectrum - még egy szuperszámítógép sem képes lefedni a texasi hold'em határtalan változatának 10 160 potenciálját. Sandholm és csapata ezért megtalálta a módját annak, hogy csökkentse ennek a fának a méretét, és - ellentétben azzal, amit Claudico tett - tanulni a hibáiból.

A Claudicóval végzett kísérlet az emberek győzelmével zárult. A fő ok az utóbbi alkalmazkodóképességével függ össze, akik nagyon gyorsan megértették a bot stratégiáját - miközben a bot nem volt képes alkalmazkodni az emberi stratégiához. Sandholm az említett játékosokról azt mondta: "Nagyon lenyűgözött a gyors alkalmazkodásuk, nagyon gyorsan tanultak nagyon kevés kézből".

Vajon ugyanez fog történni a Libratusszal is? Természetesen túl korai megítélni (a verseny csak január 30-ig ér véget). Az első szakasz után, amikor Libratus volt az élen, az emberek január 17-én felmentek a lejtőn. De Jason Les, a program ellen versenyző egyik játékos magassugárzó szála 18-án megemlíti, hogy a gép átvette a hatalmat.

De az embereknek van előnyük. A játék végeztével a játékosok megvitatják és átgondolják az elfogadandó stratégiákat. Oliver Roeder, a fivethirtyeight.com oldalon (a híres weboldal, amelyet Nate Silver statisztikus vezet), a következő tájékoztató ülések egyikével foglalkozik:

„A napi foglalkozás után minden egyes leosztásról naplót adnak digitálisan a játékosok. Ezen a szerdán, amikor betöltik az adatokat, színes számok, hőtérképek, vonaldiagramok és valószínűségek villognak elemző szoftverük ablakában (...). Átmentek a nap összes legnagyobb kezén, szinte azonnal megemésztették őket, ahogy a sakkmester másodpercek alatt fejben játszhatott. Megpróbálták meghatározni saját stratégiájuk hibáit, és megtámadni a bot hibáit. Lassan, de biztosan úgy tűnt, hogy lebontják Libratus játékmódját. "

Ebben az az érdekes, hogy azt tapasztaltuk, hogy a játékosok is számítógépeket és algoritmusokat használnak terveik elkészítéséhez. Más szóval, a "pusztán emberi" játékosok ellenállása a gépekkel szemben már nagyrészt mítosznak tűnik ...

Ennek ellenére a potenciális Libratus-győzelem súlyosan károsíthatja az online póker jövőjét. Már a triblive.com-nak is elmondja, a játékosok kezdenek óvakodni a virtuális interakcióktól, hogy inkább a személyes találkozókat részesítsék előnyben: az interneten nem tudják, hogy emberrel vagy botdal harcolnak-e. Ezenkívül az online póker világa évek óta válságban van, az úgynevezett fekete péntek után, amikor a három nagy online póker platformot csalás miatt bezárták. Már nem lenne elég pénz és játék a profi játékosok számára a megélhetéshez. Ma a fivethirtyeight.com szerint a heads-up Texas hold'hem no limit követői különösen nehéz helyzetben vannak, mert Jason Les szerint csak körülbelül 20 jó játékos van a világon. Ha Libratus megnyeri a versenyt, a játék meghalhat ...

Mély tanulás a mentéshez

Fontos szerepet játszhatnak-e a neurális hálózatok, a mély tanulás a hiányos információkkal kapcsolatos problémák megoldásában? A Wired szerint a Deepstack a hagyományosabb programokhoz hasonlóan a lehetőségek fájának felépítésével indul. De nem éri el a végét. Minden kezét a kontextus szerint elemzi, és döntését a megtett fogadásoknak megfelelően is meghozza.

A kutatók összehasonlítják a DeepStack közelítési technikáját az emberi játékos ösztönével, amikor az ellenfél blöfföl vagy nyerő kezet tart, még akkor is, ha a gépnek az értékelését arra kell alapoznia, hogy az ellenfél hogyan fogad, nem pedig a nyelvén. "Ez a becslés a DeepStack intuíciójának tekinthető" - írják.

De Wired rámutat, hogy a Deepstack további jelentőséggel bír. Ha kiderül, hogy az alkalmazott módszer hatékony egy olyan játéknál, mint a póker, az algoritmus kiterjeszthető más, sokkal fontosabb területekre is, például a gazdaságra, a hadviselésre vagy a kereskedelemre.

De nem csak a mély tanulás rendelkezik ezzel az ambícióval. A Tumoas Sandholm is a Libratus programját tartja kiindulópontnak minden olyan helyzet megoldásához, amely hiányos információkat tartalmaz.

Más szavakkal, az AI pókerjátékosok közel kerülnének a valódi AI-hoz, képesek kezelni azokat a bonyolult helyzeteket, amelyekkel az emberek találkoznak ... A kaszinók lesznek a kapu a szingularitáshoz ?

Élesíthetjük az algoritmusok "átláthatóságát" ?

Roger Taylor (@rtayloropendata) a Királyi Művészeti Társaság nyílt közszolgáltatási hálózatának alapítója. Tim Kelsey-vel, az ausztrál digitális egészségügyi ügynökség igazgatójával (miután a brit NHS igazgatója volt, és a kabinet irodájában az adatok nyitottságáért és átláthatóságáért felelős) az átláthatóság és a nyitott társadalom szerzője. A Discover Society figyelemre méltó fórumán visszatért az átláthatóság kérdéséhez.