Het gevangenisdilemma

© Flor Aguilar

Wat het beste is voor het individu, kan rampzalig zijn voor de groep. John Nash probeerde daar een evenwicht in te brengen.

John Nash arriveerde in 1948 in Princeton om er zijn PhD aan te vatten met een aanbeveling die uit één enkele zin bestond: “Hij is een wiskundig genie.” Nash stelde niet teleur. Hij was 19 en had aan de universiteit slechts één cursus economie gevolgd. In zijn eerste 14 maanden als academicus produceerde hij het werk dat hem in 1994 de Nobelprijs voor Economie opleverde voor zijn bijdrage aan de speltheorie.

Op 16 november 1949 stuurde Nash een nota van amper meer dan een pagina naar de Proceedings of the National Academy of Sciences, waarin hij het concept uiteenzette dat sindsdien bekendstaat als het Nash-evenwicht. Dat concept beschrijft een stabiel resultaat dat tot stand komt als mensen of instellingen rationele keuzen maken op basis van wat ze denken dat anderen zullen doen. In een Nash-evenwicht is niemand in staat zijn situatie te verbeteren door van strategie te veranderen: elke persoon doet zo goed als hij kan, ook al leidt dat niet tot een optimaal resultaat voor de maatschappij. Met zwierige mathematische elegantie toonde Nash aan dat elk ‘spel’ met een eindig aantal spelers, elk met een eindig aantal opties om uit te kiezen, ten minste zo’n evenwicht heeft.

Door zijn ideeën werd het bereik van de economie uitgebreid. In perfect concurrerende markten, waar geen toetredingsbarrières zijn en ieders producten identiek zijn, kan geen afzonderlijke koper of verkoper de markt beïnvloeden. Niemand moet in de gaten houden wat de anderen van plan zijn. Maar zo zijn de meeste markten niet. De beslissingen van rivalen en klanten zijn wel degelijk van belang. Het Nash-evenwicht bood de economische wetenschap de mogelijkheid reële voorspellingen te maken op basis van informatie over de motieven van elk individu.

Gevangenendilemma

Eén voorbeeld staat symbool voor het Nash-evenwicht: het gevangenendilemma. Nash maakte gebruik van algebra en getallen om die situatie te beschrijven in een paper die in 1951 werd gepubliceerd, maar de versie waarmee economiestudenten vertrouwd zijn is heel wat boeiender.

Het gaat over twee boeven die in aparte gevangeniscellen piekeren over hetzelfde voorstel dat de officier van justitie hen heeft gedaan. Als ze allebei een moord bekennen, wacht hen tien jaar gevangenisstraf. Als de ene zwijgt en de andere praat, dan krijgt de verklikker een beloning en de andere levenslang. Maar als ze allebei hun mond houden, moeten ze maar een jaar de nor in.

Er is slechts één Nash-evenwichtsoplossing voor het gevangenendilemma: beiden bekennen. Elk reageren ze op de beste manier op de strategie van de andere: omdat de andere kan hebben geklikt, wordt met een bekentenis een levenslange gevangenisstraf vermeden. Het tragische is dat als ze op een of andere manier zouden kunnen samenwerken, ze beter af zouden zijn.

Het voorbeeld toont aan dat groepen dwaas of wijs kunnen zijn. Wat het beste is voor het individu, kan rampzalig zijn voor de groep. Dat tragische resultaat komt maar al te vaak voor in de echte wereld. Als mensen zomaar de zee kunnen plunderen, zullen ze meer vissen dan goed is voor de groep en zullen ze de visvoorraad uitputten. Werknemers die indruk willen maken op hun baas door het langst op kantoor te blijven, zullen uitputting onder het personeel bevorderen.

Het Nash-evenwicht hielp economen te begrijpen hoe individuen die zichzelf willen verbeteren ervoor kunnen zorgen dat groepen zichzelf schaden. Om dat probleem aan te pakken, moesten ze er alleen maar voor zorgen dat elk individu de best mogelijke aansporingen kreeg. Als het dan nog misliep – ouders die hun kinderen niet lieten inenten tegen de mazelen, bijvoorbeeld – dan was dat omdat mensen niet in hun eigenbelang handelden. In zulke gevallen moest het openbaar beleid de mensen informeren.

Waanvoorstellingen

Het idee van Nash had antecedenten. In 1838 pakte de Franse econoom Antoine-Augustin Cournot uit met een theorie. Als in een markt met slechts twee concurrerende ondernemingen, beide marktaandeel willen winnen door hun productie op te voeren, resulteert dat voor beide ondernemingen in lagere prijzen en kleinere winstmarges. Onbewust was Cournot op een voorbeeld van een Nash-evenwicht gestoten. Het was voor elke onderneming zinvol de productieniveaus vast te leggen op basis van de strategie van haar concurrent. De consumenten werden dan wel opgezadeld met minder producten en hogere prijzen dan wanneer de concurrentie volop had gespeeld.

Een andere pionier was de Hongaarse wiskundige John von Neumann. In 1928 schetste Von Neumann een eerste speltheorie, waarin hij aantoonde dat in een nulsomspel met twee personen er altijd een evenwicht bestaat. Als een speler wint, moet de andere speler evenveel verliezen. Toen Nash zijn bevinding deelde met Von Neumann, die tegen die tijd uitgegroeid was tot een intellectuele halfgod, verwierp die het resultaat als “triviaal” en weinig meer dan een uitbreiding van zijn eerdere bewijs.

De economische wetenschap deelde aanvankelijk Von Neumanns vaststellingen en zag Nash’ ontdekking grotendeels over het hoofd. Nash stortte zich op andere wiskundige bezigheden, maar zijn veelbelovende capaciteiten werden ondermijnd toen hij in 1959 begon te lijden aan waanvoorstellingen en paranoia. Zijn vrouw liet hem opnemen in een ziekenhuis. Nadat hij uit het ziekenhuis was ontslagen, werd hij een vertrouwd personage op de campus van Princeton, een figuur die tegen zichzelf sprak en op schoolborden krabbelde. Zijn evenwicht nam een almaar centraler plaats in de economie in. Het aantal economische papers die het Nash-evenwicht vernoemen is sinds 1980 verzevenvoudigd en het concept werd aangewend om een resem beleidsproblemen op te lossen.

Een befaamd voorbeeld was het Amerikaanse ziekenhuissysteem, dat zich in de jaren veertig in een slecht Nash-evenwicht bevond. Elk ziekenhuis wou de beste geneeskundestudenten. Omdat die bijzonder schaars waren door de oorlog, werden de ziekenhuizen tot een wedloop gedwongen waarbij ze veelbelovende kandidaten almaar vroeger een aanbod deden. Wat het beste was voor het individuele ziekenhuis, was verschrikkelijk voor de collectiviteit: ziekenhuizen moesten aanwerven voor de studenten voor hun examens waren geslaagd. Ook de studenten hadden er een hekel aan omdat ze niet de kans kregen verschillende aanbiedingen in overweging te nemen.

Het probleem werd pas terdege opgelost door een ontwerp van Elliott Peranson en Alvin Roth in de jaren negentig. Vandaag geven de studenten hun voorkeuren door en worden hen ziekenhuizen toegewezen op basis van een algoritme dat garandeert dat geen enkele student de aangegeven voorkeuren kan wijzigen en naar een aantrekkelijker ziekenhuis kan worden gestuurd dat bereid is hem te ontvangen; en dat geen enkel ziekenhuis aan het systeem kan ontsnappen om een betere werknemer in te pikken. Het systeem maakt gebruik van het Nash-evenwicht: iedereen doet zijn best op basis van wat al de anderen doen.

Een andere beleidstoepassing betrof de veiling van 3G-licenties door de Britse regering in 2000. Ze riep de hulp in van speltheoretici om de veiling te structureren, gebruikmakend van enkele van de inzichten van het Nash-evenwicht. Uiteindelijk werd 22,5 miljard pond binnengehaald. De inzichten van Nash helpen ook te verklaren waarom reistijden gemiddeld langer kunnen worden als een traject toegevoegd wordt aan het wegennet. Egoïstische bestuurders die opteren voor de kortste route, houden geen rekening met het effect dat ze de reistijd van anderen verlengen en kunnen zo een nieuwe kortere verbinding in de weg staan. In een studie uit 2008 werden zeven wegverbindingen in Londen en twaalf in New York gevonden waar de afsluiting van een straat de doorstroming van het verkeer kon bevorderen.

Rationeel gedrag

Het Nash-evenwicht zou niet zijn huidige status bereikt hebben zonder een aantal verfijningen van het oorspronkelijke idee. Ten eerste is in heel wat situaties meer dan één Nash-evenwicht mogelijk. Autobestuurders kiezen aan welke kant van de weg ze rijden als een beste reactie op het gedrag van andere bestuurders. Maar dat is afhankelijk van waar ze wonen: ze rijden links in Groot-Brittannië, maar rechts in de Verenigde Staten. Kennis van sociale normen en gewoonten is dus vereist. Nash’ theorema alleen volstaat niet.

Een tweede verfijning bestond erin terdege rekening te houden met ongeloofwaardige dreigementen. Als een tiener ermee dreigt van huis weg te lopen als zijn moeder hem van zijn smartphone scheidt, dan ontstaat een Nash-evenwicht wanneer ze hem de telefoon geeft om de gemoedsrust te bewaren. Maar Reinhard Selten, de Duitse econoom die de Nobelprijs van 1994 deelde met Nash en John Harsanyi, vond dat geen aannemelijk resultaat. De moeder zou moeten weten dat het dreigement van haar kind leeg is. Hoe tragisch het verlies van een telefoon ook is, een nacht doorbrengen op straat zou erger zijn. Ze moet gewoon de telefoon afnemen en haar zoon dwingen zich toe te leggen op zijn huiswerk.

Het werk van Selten laat de economen toe het aantal mogelijke Nash-evenwichten te reduceren. Harsanyi stelde het feit aan de orde dat in veel ‘spelletjes’ in het echte leven, deelnemers onzeker zijn over wat hun tegenstander wil. Denk bijvoorbeeld aan twee geliefden die een plek voor een afspraakje proberen te kiezen die voor beiden goed is, zonder dat ze een idee hebben van wat de andere verkiest. Door de veronderstellingen van elke persoon in het spel op te nemen – bijvoorbeeld dat de ene correct denkt dat de andere evenveel van pizza als van sushi houdt – maakt Harsanyi het probleem oplosbaar.

Maar er sluimerde nog een ander probleem: de voorspellingskracht van het Nash-evenwicht hangt af van rationeel gedrag. Maar mensen schieten vaak tekort als het daarover gaat. Bij experimenten waarbij het gevangenendilemma werd nagespeeld, koos slechts ongeveer de helft van de mensen ervoor te bekennen. Voor economen die rationaliteit (en Nash) in hun modellen aan het inbouwen waren, was dat problematisch. Wat voor zin heeft het goede stimulansen te creëren als de mensen hun eigenbelang niet ter harte nemen?

Maar alles was niet verloren. De experimenten toonden ook aan dat ervaring de spelers slimmer maakte: tegen de tiende ronde weigerde nog maar 10 procent van de spelers te bekennen. Dat leerde de economen voorzichtiger om te gaan met de toepassing van het Nash-evenwicht. In ingewikkelde spelen of spelen waar ze geen mogelijkheid hebben uit hun fouten te leren, werken zijn inzichten wellicht niet zo goed.

Het Nash-evenwicht eist niettemin een centrale rol op in de moderne micro-economie. Nash stierf bij een auto-ongeval in 2015. Tegen dan was zijn mentale gezondheid weergekeerd, doceerde hij opnieuw aan Princeton en had hij die gemeenschappelijke Nobelprijs ontvangen, als erkenning dat de interacties van de groep een grotere bijdrage leveren dan om het even welk individu.

The Economist, illustratie Flor Aguilar

In een Nash-evenwicht is niemand in staat zijn situatie te verbeteren door van strategie te veranderen: elke persoon doet zo goed als hij kan, ook al leidt dat niet tot een optimaal resultaat voor de maatschappij.

Het aantal economische papers die het Nash-evenwicht vernoemen is sinds 1980 verzevenvoudigd en het concept werd aangewend om een resem beleidsproblemen op te lossen.

Fout opgemerkt of meer nieuws? Meld het hier

Partner Content