Környezeti szimuláció táblázattal

Hősök, gyávák és mások közül

Probléma: A társadalmi és gazdasági interakciók rendkívül összetett és alig átlátszó világokban zajlanak. Az olyan kifejezések, mint hűség, tisztesség, bátorság, gyávaság, agresszió, együttműködés, egoizmus és a felebaráti szeretet nagy, de nehezen értékelhető szerepet játszanak.

Cél: Tisztázni kell, hogy mely alapminták határozzák meg viselkedésünket, mi a megemlített (nem) erények lényege, és milyen felhasználásuk van bizonyos összefüggésekben. Ez a lecke a következő órák alapos kezelésének alapjait tartalmazza.

Módszer: Az interakciók egyszerű mintákra redukálódnak, amelyek megtalálhatók az egyszerű játékokban. Néhány ilyen egyszerű játékot elemi eszközökkel játszanak és elemeznek.

Játékelméleti paradoxon

Két ember és Q játszani a következő szabályok szerint: mindkettő egyszerre emel egy vagy két ujjat; ha a feltartott ujjak teljes száma páros, akkor fizet Q nál nél , ha furcsa, akkor fizet nál nél Q; Mindig annyit fizet, amennyit feltartja az ujjait. A kifizetési mátrix azoknak a fizetéseknek, amelyek Q nál nél kell tennie, így néz ki:

Nyilvánvaló - feltéve, hogy a játékot folyamatosan ismételjük - van értelme a másik játékost sötétben hagyni, hogy hány ujját emelje fel. Ezt például úgy lehet elérni, hogy egy és két ujjat a lehető leg véletlenszerűbben tartanak.

Első pillantásra úgy tűnik, hogy a játék tisztességes: ha a lehetséges kombinációk (1, 1), (1, 2), (2, 1), (2, 2) - az előkelő számok zárójelben vannak Finger off játékos és a játékosok Q - ugyanolyan gyakran fordulnak elő, az egyes játékosok profitvárakozása nulla. Ennek ellenére a játék nem igazságos, amint az egy pillanat alatt megmutatkozik. (Azt a tényt, hogy ez a látszólag igazságos játék igazságtalan, a játékelmélet paradoxonának nevezzük.)

Az igazságtalanság felkutatásához egy kis szimulációt futtatunk. Feltételezzük, hogy minden játékosnak van egy vegyes stratégia választ. A vegyes stratégiát annak a valószínűsége határozza meg, hogy egy adott lépést választanak. Lenni q annak valószínűsége Q feltartja az egyik ujját (1 - q az a valószínűsége, hogy két ujját feltartja). játékos valószínűséggel választja az ujját o.

A táblázatban láthatja a kiválasztott stratégiákat o és q belép. Az eredménymezőkben megjelennek azok a nyeremények, amelyeket az adott játékos hosszú távon kap (a nyeremény várható értéke). Mivel ez egy nulla összegű játék, az egyik elveszíti azt, amit a másik kap. A beviteli mezőkbe megadhat olyan számokat, mint 0,75, de olyan törteket is, mint a 3/4 (vagy általános JavaScript képletek). Mivel ezek valószínűségek, csak a 0 és 1 közötti értékeknek van értelme.

Ha a Q játékos választja a stratégiát q = q * = 7/12, P játékos azt tehet, amit akar. Hosszú távon átlagosan 1/12-es veszteséget kell elfogadnia meccsenként.

A ... val Minimax elv Az optimális stratégia levezethető a nulla összegű játékok elméletéből (von Neumann, 1944): Az óvatos játékos számára az a legjobb stratégia, amely minimalizálja maximális veszteségét (ami optimális védekezés esetén következik be) (Szйkely, 1990, 54. o.). ) .

Az ujjjáték a Zéró-összegű játék: Amit az egyik játékos nyer, a másik veszít és fordítva. És amint láttuk, ez attól függ, hogy soros (P) vagy oszlopos (Q) játékos vagy-e. Itt nem foglalkozunk nulla összegű játékokkal.

A sólyom-galamb játék

A társas viselkedés jobban összeegyeztethető a szimmetrikus játékok Modellezés: Szimmetrikus játékokban a játékosok kifizetése csak az ő és az ellenfél stratégiájától függ, és nem attól, hogy soros vagy oszlopos-e. A sólyom-galamb játék olyan szimmetrikus játék.

Tegyük fel, hogy van olyan populációnk, amely teljes egészében galambokból áll. Bármikor veszekednek, senki sem sérül meg. A konfrontációk hosszadalmas rituális versenyekből állnak, talán olyan bámulatos versenyek, amelyek csak akkor állnak le, amikor az egyik rivális megadja magát. A győztes ezután 50 pontot szerez a vitatott erőforrás megnyeréséért, de -10 büntetést fizet azért, ha időt veszteget egy hosszú bámészkodó mérkőzésre; így összességében 40 pontot kap. A vesztes időveszteségért -10 büntetést is kap. Átlagosan minden galamb arra számíthat, hogy a harcok felét megnyeri, fele pedig veszít. Az egy vitára eső átlagos prémium tehát +40 és -10, azaz +15 átlaga. Ezért úgy tűnik, hogy a galambok minden egyes galambjának nagyon jól megy. "További elemzések a következő játékmátrixhoz vezetnek az egyes játékosok számára.