Design a site like this with WordPress.com
Rozpocznij

Gry niekooperacyjne: gry dwuosobowe: gry o sumie niestałej: strategie czyste: dylemat więźnia

Ledwo minęło 5 lat od napisania Theory of Games and Economic Behavior przez von Neumanna i Morgensterna (N-M), gdy John Nash [2] pokazał swoje rozwiązanie problemu w grach niekooperacyjnych o sumie niezerowej (niestałej). U N-M zarówno gra niekooperacyjna, jak i kooperacyjna była de facto grą o sumie stałej. Jak opisałem w poprzednim artykule, zaproponowali oni również rozwiązanie gry o sumie niestałej wykorzystując ideę gracza fikcyjnego, ale nawet ten pomysł zakładał, że gracze prawdziwi mogą ze sobą kooperować, a wiadomo, że nie zawsze jest to możliwe. To co jest niezwykle istotne to fakt, że Nash uogólnił rozwiązanie gry o sumie stałej (u N-M w postaci maximin), rozszerzając pojęcie równowagi. W strategiach czystych punkt siodłowy powstawał, gdy gracze minimalizowali straty lub maksymalizowali minimalne zyski, co wiązało się z założeniem, że przeciwnik wybierze najlepszy możliwy ruch. Zysk jednego był zawsze stratą drugiego i dlatego gracze byli jakby zależni od siebie nawzajem. Równowaga Nasha odrzuca konieczność takiej zależności.

Dylemat więźnia

Słynna opowieść o więźniach, którzy powinni podjąć paradoksalną decyzję, nie została wymyślona przez Nasha, ale przez M. Dreshera i M. Flooda w 1950 r., a następnie rozpowszechniona przez A. W. Tuckera [3]. W oryginalnym eksperymencie Dreshera i Flooda nie użyto nawet dwuwartościowej macierzy wypłat, ale dwóch obok siebie pojedynczych macierzy (jednej dla gracza 1, drugiej dla gracza 2) [1].

Dwóch więźniów jest oskarżonych o przestępstwo i są przesłuchiwani oddzielnie. Każdy więzień ma dwa wyjścia: „współpracować” z drugim więźniem (nie przyznawać się) lub zdradzić go (przyznać się). Kara za przestępstwo wynosi 1 rok więzienia, jeżeli obaj się przyznają (tj. będą zdradzać). Jeżeli jeden więzień zdradzi, a drugi nie, to pierwszy zostanie w nagrodę zwolniony z kary, a drugi posiedzi dodatkowy rok za pierwszego, czyli 2 lata. W końcu jeśli żaden z nich się nie przyzna – będą współpracować – zacznie się proces sądowy przeciw nim i szansa, że przegrają wynosi 1/2, a stąd wartość oczekiwana kary (0 – 1)/2 = -0,5. Macierz wypłat ma postać

Pierwsza liczba danej komórki to wypłata Gracza 1, druga liczba to wypłata Gracza 2. Gra jest symetryczna, więc wystarczy znaleźć rozwiązanie dla jednego, a wtedy znajdziemy od razu dla drugiego. Rozumowanie Gracza 1 jest następujące: jeżeli Gracz 2 wybierze „Współpracuj”, to jeżeli ja wybiorę „Współpracuj” dostanę -0,5, a jeżeli wybiorę „Zdradzaj”, to dostanę 0. Czyli wtedy lepiej jest zdradzić. Jeżeli Gracz 2 wybierze „Zdradzaj”, to jeżeli ja wybiorę „Współpracuj” dostanę -2, a jeżeli wybiorę „Zdradzaj”, to dostanę -1. Czyli znowu lepiej zdradzać. W sumie Gracz 1 powinien zdradzać. Ze względu na symetrię Gracz 2 będzie miał to samo rozwiązanie. Obaj będą zdradzać. To znaczy, że powstała równowaga Nasha: jest to wybór {wiersz – Zdradzaj, kolumna – Zdradzaj}.

Na czym więc polega paradoks? Gdyby obaj współpracowali, to dostaliby tylko pół roku więzienia zamiast 1 roku, czyli zmniejszyliby karę do minimum. A więc mogliby uzyskać lepszy wynik, niż wybór zgodny z równowagą Nasha. Innymi słowy równowaga Nasha nie musi być efektywna w sensie Pareta. Efektywność w sensie Pareta oznacza, że nie można poprawić sytuacji jednego bez pogorszenia sytuacji kogoś innego. Równowaga Nasha maksymalizuje wypłaty graczy warunkowo, a nie globalnie; warunkiem jest uniezależnienie się od wyboru drugiej strony. Czyli gracze nie mogą się kontaktować między sobą ani w żaden sposób nie zgadują co robi drugi – to jest powód występowania tego paradoksu.

Dylemat więźnia nie jest specjalnie odkrywczy, bo strategia zdradzania jest jedyną dominującą, a dominację wprowadzili sami N-M. Gdybyśmy zastąpili wypłatę drugiego gracza wartością przeciwną pierwszego (a więc grą o sumie zero), dostalibyśmy to samo rozwiązanie. Dlatego omówiony przykład należy bardziej traktować jako wstęp do teorii gier niekooperacyjnych niż samej równowagi Nasha.

Literatura:

[1] Flood, M.M. (1958) Some Experimental Games, Research Memorandum. RM-789, RAND Corporation,” Management Science (5)

[2] Nash, J., Non-Cooperative Games, Annals of Mathematics, Second Series, Vol. 54, No. 2 (Sep., 1951), pp. 286-295

[3] Walker, P. (1995). An outline of the history of game theory, Discussion Paper No. 9504,
Department of Economics, University of Canterbury, Christchurch, New Zealand ;

[4] von Neumann, J., Morgenstern, O., (1944), Theory of Games and Economic Behavior.
Princeton: Princeton University Press

Skomentuj

Wprowadź swoje dane lub kliknij jedną z tych ikon, aby się zalogować:

Logo WordPress.com

Komentujesz korzystając z konta WordPress.com. Wyloguj /  Zmień )

Zdjęcie z Twittera

Komentujesz korzystając z konta Twitter. Wyloguj /  Zmień )

Zdjęcie na Facebooku

Komentujesz korzystając z konta Facebook. Wyloguj /  Zmień )

Połączenie z %s

%d blogerów lubi to: