Samenvatting voor economie - Gevangenendilemma (speltheorie)
Wat is speltheorie?
Speltheorie is een techniek om situaties met strategische keuzes tussen verschillende partijen te analyseren en de uitkomst te voorspellen. Hierin kijken we welke keuzes een partij heeft en hoe de uitkomst van de gemaakte keuze beïnvloed kan worden door de keuze van de andere partij. Eerst bespreken we het simultaan spel aan de hand van het gevangenendilemma met een dominante strategie. Daarna zal je leren hoe deze techniek in een economische situatie gebruikt kan worden.
Wat is een gevangenendilemma?
Een gevangenendilemma is een simultaan spel, oftewel een gelijktijdig spel, met meerdere kenmerken, die we nu op een rijtje zetten:
- Beide spelers maken onafhankelijk en gelijktijdig van elkaar een keuze.
- Beide spelers beschikken over alle informatie die van belang is om hun keuze te maken.
- Beide spelers hebben een dominante strategie: de keuze die een speler maakt, ongeacht de keuze van de andere speler.
Dominante strategieën
Als beide spelers hun dominante strategieën volgen, is de uitkomst niet optimaal. In dit voorbeeld gaat het gevangenendilemma om twee verdachten van moord: Jasper en Willem. Jasper en Willem zijn betrapt op illegaal wapenbezit, maar er is geen sluitend bewijs dat zij de moord ook daadwerkelijk gepleegd hebben. Zowel Jasper als Willem worden in aparte ruimtes ondervraagd en krijgen beide hetzelfde voorstel voorgeschoteld.
- Jasper wordt verteld dat als hij bekent en Willem ook bekent, zij dan allebei 6 jaar gevangenisstraf krijgen.
- Ook wordt verteld dat als Jasper bekent, en Willem bekent niet, Jasper 1 jaar en Willem 12 jaar gevangenisstraf krijgt.
- Houden ze allebei hun mond strak dicht en bekent geen van beide, dan zullen zowel Jasper als Willem 3 jaar gevangenisstraf krijgen.
- Willem krijgt hetzelfde te horen.
Opbrengstenmatrix
In een simultaan spel weten beide partijen dus niet van elkaar wat zij gaan kiezen. De opties kunnen we in een opbrengstenmatrix weergeven. Een opbrengstenmatrix is een manier om een spel weer te geven in een tabel. In die tabel worden zowel de keuzes van de spelers als de uitkomsten voor alle keuze combinaties weergegeven. Hoe dit eruit ziet, kun je zien in de video hierboven.
Een opbrengstenmatrix bestaat altijd uit twee spelers met dezelfde twee opties:
- Rijspeler: de speler die kiest welke rij van de tabel wordt gespeeld.
- Kolomspeler: de speler die kiest welke kolom van de tabel wordt gespeeld.
Het maakt voor de tabel niet uit wie de rijspeler is en wie de kolomspeler is. Let wel op: de eerste uitkomst is altijd van de rijspeler! Er zijn altijd 4 verschillende uitkomsten mogelijk.
Opbrengstenmatrix: voorbeeld
Stel nou dat Willem bekent, wat is dan de beste keuze voor Jasper? In de matrix (zie video) kun je aflezen dat als Willem bekent, Jasper 6 jaar krijgt als hij ook bekent, en 12 jaar als hij ontkent. Bekennen is dus de beste keuze voor Jasper als Willem bekent. Dit betekent dus dat zowel Jasper als Willem 6 jaar gevangenisstraf krijgen.
Maar wat nou als Willem ontkent? Als Willem ontkent krijgt Jasper 3 jaar als hij ook ontkent, maar slechts één jaar als hij bekent. Weer is bekennen dus de beste keuze optie. Ongeacht wat Willem kiest, is het voor Jasper dus het beste om te bekennen! Deze keuze, die dus altijd de beste keuze is, ongeacht wat de andere speler doet, noemen we de dominante strategie. De dominante strategie voor zowel Willem als Jasper is hier om te bekennen, en dus komen ze altijd op de optie van beide bekennen uit, wat helemaal niet optimaal is, want dat zou zijn als ze beiden ontkennen.
Pareto-optimaal
Deze uitkomst, die voor Jasper en Willem als collectief het beste is, wordt Pareto-optimaal genoemd. Zowel Jasper als Willem moeten dan ontkennen. Stel nou dat het hele goede vrienden zijn, dan kan dit hun beide toch nog motiveren om voor een niet-dominante strategie te kiezen. De vraag is echter of zij elkaar wel kunnen vertrouwen. Want als de één ontkent en de ander bekent, dan krijgt degene die ontkent maar liefst 12 jaar gevangenisstraf!
De keuze om te bekennen of te ontkennen is daarom een vrij moeilijk dilemma. Niemand zit te wachten op 12 jaar gevangenisstraf, dus de kans op de gunstigste uitkomst voor beide partijen, de dominante strategie, is om te bekennen. In ieder geval krijg je dan geen 12 jaar, en misschien slechts 1 jaar.
Nash-equilibrium
Beiden zullen dus kiezen uit eigenbelang en bekennen. Dit wordt het Nash-Equilibrium genoemd, ofwel Nash-evenwicht. Hierin is de strategie van de ene partij de beste reactie op de gekozen strategie van de ander. Het is een equilibrium, oftewel evenwicht, omdat vanuit dat evenwicht van beide bekennen, geen van beide partijen een reden heeft om te wisselen, want dan verslechtert hun eigen situatie.
Probeer maar eens zelf; vanuit de situatie van beide bekennen krijgen ze allebei een celstraf van 6 jaar. Als alleen Jasper nu zou ontkennen, dan zou hij ineens 12 jaar krijgen. Niemand heeft dus reden om te veranderen. Als ze beide zouden veranderen, dan zouden ze erop vooruit gaan, maar ze denken vanuit eigenbelang en nemen dat risico dus niet.
Stel nou dat er geen sprake is van een dominante strategie, of als de dominante strategieën naar een evenwicht leiden dat Pareto-optimaal is, dan is er geen sprake van een gevangenendilemma. Zowel de dominante strategie als de niet optimale uitkomst moeten aanwezig zijn voordat men spreekt van een gevangenendilemma. Ofwel: wanneer het Nash-evenwicht niet gelijk is aan de optimale uitkomst, is er sprake van een gevangenendilemma.