1930-ih, John von Neumann i Oscar Morgenstern postali su osnivači nove i zanimljive grane matematike pod nazivom "teorija igara". Pedesetih godina prošlog veka mladi matematičar Džon Neš se zainteresovao za ovaj pravac. Teorija ravnoteže postala je tema njegove disertacije koju je napisao u dobi od 21 godine. Tako je rođena nova strategija igre pod nazivom "Nash Equilibrium", koja je dobila Nobelovu nagradu mnogo godina kasnije - 1994.
Duga jaz između pisanja disertacije i opšteg priznanja postao je test za matematičara. Genijalnost bez prepoznavanja rezultirala je ozbiljnim mentalnim poremećajima, ali je John Nash uspio riješiti ovaj problem zahvaljujući svom izvrsnom logičkom umu. Njegova teorija Nashove ravnoteže dobila je Nobelovu nagradu, a njegov život je snimljen u Beautiful mind.
Ukratko o teoriji igara
Pošto Nashova teorija ravnoteže objašnjava ponašanje ljudi u uslovima interakcije, vrijedi razmotriti osnovne koncepte teorije igara.
Teorija igara proučava ponašanje učesnika (agenata) u smislu međusobne interakcije poput igre, kada ishod zavisi od odluke i ponašanja više ljudi. Učesnik donosi odluke na osnovu svojih predviđanja o ponašanju drugih, što se naziva strategija igre.
Postoji i dominantna strategija u kojoj učesnik dobija najbolji rezultat za svako ponašanje drugih učesnika. Ovo je igračeva najbolja win-win strategija.
Zatvorenikova dilema i naučni proboj
Zatvorenikova dilema je slučaj igre u kojoj su učesnici primorani da donose racionalne odluke, postižući zajednički cilj suočeni sa sukobom alternativa. Pitanje je koju će od ovih opcija izabrati, ostvarujući lični i opšti interes, kao i nemogućnost da dobije i jedno i drugo. Čini se da su igrači zatvoreni u teškom okruženju igre, što ih ponekad tjera da razmišljaju vrlo produktivno.
Ovu dilemu je istražio američki matematičar John Nash. Ravnoteža koju je uspostavio bila je revolucionarna na svoj način. Ova nova misao je posebno uticala na mišljenje ekonomista o tome kako tržišni igrači donose odluke, uzimajući u obzir interese drugih, uz blisku interakciju i ukrštanje interesa.
Najbolje je proučavati teoriju igara na konkretnim primjerima, pošto ova matematička disciplina sama po sebi nije suvoteorijska.
Primjer dileme zatvorenika
Primjer, dvije osobe su izvršile pljačku, pale u ruke policiji i ispituju se u odvojenim ćelijama. Istovremeno, policijski službenici svakom učesniku nude povoljne uslove pod kojima će biti pušten ako svjedoči protiv svog partnera. Svaki odkriminalci imaju sljedeći skup strategija koje će razmotriti:
- Obojica svjedoče u isto vrijeme i dobijaju 2,5 godine zatvora.
- Obojica ćute u isto vrijeme i dobijaju po godinu dana, jer će u ovom slučaju baza dokaza o njihovoj krivici biti mala.
- Jedan svjedoči i pušta se, dok drugi šuti i dobija 5 godina zatvora.
Očigledno da ishod slučaja zavisi od odluke oba učesnika, ali se ne mogu složiti, jer sjede u različitim ćelijama. Jasno je vidljiv i sukob njihovih ličnih interesa u borbi za zajednički interes. Svaki od zatvorenika ima dvije opcije za akciju i 4 opcije za ishod.
Lanac logičkih zaključaka
Dakle, prekršilac A razmatra sljedeće opcije:
- Ja ćutim i moj partner ćuti - oboje ćemo dobiti po 1 godinu zatvora.
- Prijavim partnera i on me preda - oboje dobijamo 2,5 godine zatvora.
- Ja ćutim, a partner me izdaje - dobiću 5 godina zatvora, a on će biti slobodan.
- Pružam partnera, ali on ćuti - ja dobijam slobodu, a on dobija 5 godina zatvora.
Dajmo matricu mogućih rješenja i ishoda radi jasnoće.
Tabela mogućih ishoda zatvorenikove dileme.
Pitanje je šta će svaki takmičar izabrati?
"Budite tihi, ne možete govoriti" ili "Ne možete šutjeti, ne možete govoriti"
Da biste razumjeli izbor učesnika, morate proći kroz lanac njegovih misli. Po obrazloženju zločinca A: ako ja šutim, a moj partner šuti, dobićemo minimalni rok (1 godinu), ali jaNe znam kako će se ponašati. Ako on svjedoči protiv mene, onda je bolje da ja svjedočim, inače mogu sjediti 5 godina. Radije bih sjedio 2,5 godine nego 5 godina. Ako on šuti, onda sve više moram svjedočiti, jer ću tako dobiti slobodu. Učesnik B.
Nije teško uočiti da je dominantna strategija za svakog od počinitelja svjedočenje. Optimalna tačka ove igre dolazi kada oba kriminalca svjedoče i dobiju svoju "nagradu" - 2,5 godine zatvora. Nash teorija igara ovo naziva ravnotežom.
Neoptimalno optimalno Nash rješenje
Revolucionarna priroda Nashianskog gledišta je da takva ravnoteža nije optimalna kada se uzme u obzir pojedinačni učesnik i njegov lični interes. Na kraju krajeva, najbolja opcija je šutjeti i osloboditi se.
Nash ekvilibrijum je tačka konvergencije interesa, gde svaki učesnik bira opciju koja je optimalna za njega samo ako drugi učesnici izaberu određenu strategiju.
S obzirom na opciju kada oba kriminalca šute i dobiju samo 1 godinu, možemo to nazvati Pareto-optimalnom opcijom. Međutim, to je moguće samo ako se kriminalci unaprijed dogovore. Ali ni to ne bi garantovalo ovakav ishod, jer je iskušenje da se odustane od dogovora i izbjegne kazna veliko. Nedostatak potpunog povjerenja jedni u druge i opasnost od dobijanja 5 godina prisiljeni su odabrati opciju sa priznanjem. Razmislite o tome čega će se učesnici pridržavatiopcija sa šutnjom, djelovanjem u skladu, jednostavno je iracionalna. Takav zaključak se može izvesti ako proučavamo Nashovu ravnotežu. Primjeri samo dokazuju da ste u pravu.
Sebično ili racionalno
Nashova teorija ravnoteže dala je zapanjujuće zaključke koji su opovrgli principe koji su postojali prije. Na primjer, Adam Smith je ponašanje svakog od učesnika smatrao potpuno sebičnim, što je sistem dovelo u ravnotežu. Ova teorija je nazvana "nevidljiva ruka tržišta."
John Nash je uvidio da ako svi učesnici djeluju u svojim interesima, to nikada neće dovesti do optimalnog grupnog rezultata. S obzirom da je racionalno razmišljanje svojstveno svakom učesniku, vjerovatniji je izbor koji nudi Nashova ravnotežna strategija.
Čisto muški eksperiment
Odličan primjer je igra paradoksa plavuše, koja, iako naizgled nije na mjestu, jasna je ilustracija kako funkcionira Nashova teorija igara.
U ovoj igri morate zamisliti da je društvo slobodnih momaka došlo u bar. U blizini je društvo djevojaka, od kojih je jedna draža od drugih, recimo plavuša. Kako se momci ponašaju da sebi nađu najbolju djevojku?
Dakle, obrazloženje momaka: ako svi počnu da se upoznaju sa plavušom, onda, najvjerovatnije, niko to neće dobiti, tada se njeni prijatelji neće htjeti upoznati. Niko ne želi da bude druga rezerva. Ali ako dječaci odluče izbjegavatiplavuša, onda je vjerovatnoća da će svaki od momaka naći dobru djevojku među djevojkama velika.
Nashova ravnotežna situacija nije optimalna za muškarce, jer bi, slijedeći samo svoje sebične interese, svako izabrao plavušu. Može se vidjeti da će težnja samo za sebičnim interesima biti jednaka urušavanju grupnih interesa. Nash ekvilibrijum će značiti da svaki momak djeluje u svojim interesima, koji su u kontaktu sa interesima cijele grupe. Ovo nije najbolja opcija za svakoga lično, ali najbolja za svakoga, na osnovu ukupne strategije uspjeha.
Cijeli naš život je igra
Donošenje odluka u stvarnom svijetu je vrlo slično igrici u kojoj očekujete određena racionalna ponašanja i od drugih učesnika. U poslu, na poslu, u timu, u kompaniji, pa čak i u odnosima sa suprotnim polom. Od velikih poslova do običnih životnih situacija, sve je podložno jednom ili drugom zakonu.
Naravno, gore navedene situacije u igri sa kriminalcima i barom su samo odlične ilustracije koje demonstriraju Nashovu ravnotežu. Primjeri ovakvih dilema se vrlo često javljaju na stvarnom tržištu, a to radi posebno u slučajevima kada dva monopolista kontrolišu tržište.
Mješovite strategije
Često smo uključeni u ne jednu, već nekoliko igara odjednom. Odabirom jedne od opcija u jednoj igri, vođeni racionalnom strategijom, ali završite u drugoj igri. Nakon nekoliko racionalnih odluka, možda ćete otkriti da vam rezultat nije po volji. Štauzeti?
Razmotrimo dvije vrste strategije:
- Čista strategija je ponašanje učesnika, koje proizilazi iz razmišljanja o mogućem ponašanju drugih učesnika.
- Mješovita strategija ili nasumična strategija je nasumična izmjena čistih strategija ili izbor čiste strategije sa određenom vjerovatnoćom. Ova strategija se također naziva randomizirana.
S obzirom na ovo ponašanje, dobijamo novi pogled na Nashovu ravnotežu. Ako je ranije rečeno da igrač jednom bira strategiju, onda se može zamisliti drugo ponašanje. Može se pretpostaviti da igrači biraju strategiju nasumično sa određenom vjerovatnoćom. Igre koje ne mogu pronaći Nashovu ravnotežu u čistim strategijama uvijek ih imaju u mješovitim strategijama.
Nashova ravnoteža u mješovitim strategijama naziva se mješovita ravnoteža. Ovo je ravnoteža u kojoj svaki učesnik bira optimalnu učestalost izbora svojih strategija, pod uslovom da drugi učesnici biraju svoje strategije sa datom frekvencijom.
Kazneni i mješovita strategija
Primjer mješovite strategije može se naći u igri fudbala. Najbolja ilustracija mješovite strategije je možda izvođenje jedanaesteraca. Dakle, imamo golmana koji može da skoči samo u jedan ugao, i igrača koji će izvesti penal.
Dakle, ako prvi put igrač odabere strategiju da šutira u lijevi ugao, a golman također padne u ovaj ugao i uhvati loptu, kako se stvari mogu razviti drugi put? Ako igračće pogoditi u suprotni ugao, to je najvjerovatnije previše očigledno, ali udaranje u isti ugao nije ništa manje očigledno. Prema tome, i golman i izbačaj nemaju drugog izbora nego da se oslone na slučajni odabir.
Tako, naizmjeničnim slučajnim odabirom sa određenom čistom strategijom, igrač i golman pokušavaju postići maksimalan rezultat.