Wiskunde: het Nash-evenwicht in non-coöperatieve speltheorie
Speltheorie is een gebied van de wiskunde dat zich bezighoudt met het maken van beslissingen waar ook andere spelers bij betrokken zijn. Het Nash-evenwicht is een belangrijk concept in de speltheorie. Wanneer een Nash-evenwicht is bereikt zal geen van de spelers zijn strategie willen wisselen. Dat wil overigens niet zeggen dat een Nash-evenwicht een goede uitkomst biedt. Er kunnen nog steeds uitkomsten van het spel zijn waarin alle spelers beter af zijn. Die kunnen dan alleen bereikt worden als meerdere spelers van strategie zouden wisselen.
Non-coöperatieve speltheorie
Speltheorie is de tak van de wiskunde die gaat over het maken van beslissingen binnen een spel. Oorspronkelijk ging dit over spelletjes, maar het kan doorgetrokken worden naar heel veel situaties uit het echte leven. Denk hierbij aan het bepalen voor een strategie in een veiling, of het bepalen van de optimale productiegrootte van een product op een markt met meerdere bedrijven.
Een sub-gebied van de speltheorie is de non-coöperatieve speltheorie. In de non-coöperatieve speltheorie maken alle spelers afzonderlijk van elkaar een beslissing, zonder dat zij informatie hebben over wat de andere spelers doen. De uitkomst wordt bepaald door te kijken wat alle spelers gedaan hebben. Elke speler krijgt dan het resultaat dat gepaard gaat met zijn strategie, maar ook met de strategieën van de andere spelers.
Een voorbeeld van een non-coöperatief spel met twee spelers is het volgende:
| Links | Rechts |
Boven | 3,3 | 10,1 |
Onder | 1,10 | 7,7 |
Deze tabel wordt de resultaatmatrix genoemd. Speler A heeft de keuze tussen Boven en Onder, Speler B heeft de keuze tussen Links en Rechts. We zien dat als A kiest voor Boven en B kiest voor links dan krijgen beide spelers 3. Wanneer A kiest voor Boven en B voor Rechts krijgt A 1 en B 10. Kiest A Onder en B links krijgt A 10 en B 1. Kiest A onder en B rechts dan krijgen beide spelers 7.
John Forbes Nash Jr.
De bedenker van het Nash-evenwicht is John Forbes Nash. Hij was een Amerikaanse wiskundige die leefde van 1928 tot 2015. Hij is bekend vanwege zijn werk in de speltheorie, maar ook in de gebieden van differentiaalvergelijkingen. Het deed veel van zijn onderzoek voor de universiteit van Princeton.
Het Nash-evenwicht
Het Nash-evenwicht is een uitkomst waarbij geen van de spelers individueel van strategie wil wisselen, dus zonder dat een andere speler ook zou wisselen. Aannames voor het Nash-evenwicht zijn dat alle spelers de mogelijke resultaten van elkaar weten en dat spelers voor zichzelf een rationele beslissing nemen. Dat wil zeggen dat ze geen strategie kiezen die ongeacht wat de anere spelers doen slechter is dan een andere strategie.
In het voorbeeld is (3,3) een Nash-evenwicht. Dat kun je zien op de volgende manier. (3,3) betekent dat A heeft gekozen voor Boven en B voor Links. Als A nu zou wisselen naar Onder dan krijgt hij maar 1 in plaats van 3. Als B zou wisselen van Links naar Rechts dan gaat hij van 3 naar 1. Ofwel, geen van beide spelers zou individueel willen wisselen. Zoals je kan zien wil dat niet zeggen dat dit de beste uitkomst is. Als ze beide zouden wisselen zouden ze immers tot (7,7) kunnen komen. (7,7) is zelf geen Nash-evenwicht. Beide spelers zouden immers kunnen wisselen naar een situatie waarin ze 10 zouden krijgen.
Meerdere Nash-evenwichten
Het is mogelijk dat een spel meerdere Nash-evenwichten heeft. Een voorbeeld hiervan is het volgende:
| Links | Rechts |
Boven | 3,3 | 2,1 |
Onder | 1,2 | 7,7 |
In dit voorbeeld is (3,3) nog steeds een Nash-evenwicht, met de zelfde argumentatie als in het vorige voorbeeld. Echter is (7,7) nu ook een Nash-evenwicht geworden, omdat een speler nu van 7 naar 2 gaat als hij zelf wisselt en de ander niet.
Geen Nash-evenwicht
Het is ook mogelijk dat een spel helemaal geen Nash-evenwicht heeft. Een voorbeeld van zo'n spel is:
| Links | Rechts |
Boven | 3,3 | 4,2 |
Onder | 4,2 | 3,3 |
In deze situatie is (Boven,Links) geen Nash-evenwicht meer. Speler A zou immers kunnen veranderen naar Onder en dan krijgt hij 4. (Boven,Rechts) is geen Nash-evenwicht omdat speler B kan wisselen naar Links om van 2 naar 3 te gaan. (Onder,Links) is geen Nash-evenwicht omdat speler B kan wisselen naar Rechts om 3 te krijgen in plaats van 2. Ook (Onder,Rechts) is geen Nash-evenwicht omdat speler A kan wisselen naar Boven om 4 te krijgen in plaats van 3.
Gemengde strategieën
Bij gemengde strategieën gaat een speler niet voor één strategie, maar kiest hij met bepaalde kans voor een bepaalde strategie. Bekijk het volgende voorbeeld:
| Links | Rechts |
Boven | 0,1 | 1,0 |
Onder | 1,0 | 0,1 |
Dit spel heeft geen Nash-evenwicht in de zogenaamde pure strategiën, waarbij een speler voor één strategie gaat. Wanneer speler A echter de helft van de keren voor Boven gaat en de helft van de keren voor Onder, en speler B gaat de helft van de keren voor Links en de helft van de keren voor Rechts dan verwachten beide spelers 0.5 als resultaat. Wanneer een van de spelers af zou wijken van deze strategie, terwijl de ander ermee doorgaat dan gaat zijn verwachte resultaat omlaag. Nash heeft aangetoond dat elk non-coöperatief spel een Nash-evenwicht heeft in gemengde strategieën. Het vinden van deze evenwichten is niet altijd zo eenvoudig als in het voorbeeld. Sterker nog, het kan ontzettend lastig zijn.
Een voorbeeld van het Nash-evenwicht in een praktijksituatie
Het stoplicht is een voorbeeld van een maatregel met een Nash-evenwicht. Stel twee auto's komen uit verschillende richtingen op een kruispunt aan. Ze hebben beide de keuze om door te rijden, of om te stoppen. Als ze allebei doorrijden zullen ze botsen, als ze allebei stoppen staan ze onnodig stil. Als één doorrijdt en één stopt dan is dat goed voor degene die doorrijdt, en slecht voor degene de stopt, maar nog altijd beter dan botsen. Ook is het stilstaan voor een andere auto beter dan onnodig stilstaan. Dit kan worden vertaald naar de volgende tabel:
| Stoppen | Rijden |
Stoppen | -1,-1 | 0,1 |
Rijden | 1,0 | -5,-5 |
Beide situaties waarin één speler stopt, en de ander rijdt zijn Nash-evenwichten. Dit is precies de situatie die een stoplicht creëert. Dit illustreert dat een Nash-evenwicht overeenkomt met een wet die voor niemand goed is om te verbreken. Dit voorbeeld kun je direct vertalen naar het maximum aantal bezoekers van een patiënt in het ziekenhuis. Als twee gezinnen op bezoek willen komen en ook de patiënt niet willen overbelasten, is het het beste als er maar één komt. Als er geen komt is dat niet goed, maar heeft de patiënt rust. Als ze beide komen is dat het slechtst, want dan is het te druk voor de patiënt en heb je last van elkaar. Daarom is er een maximum van één gezin per keer toegestaan. Op deze manier kun je nog veel meer situaties bedenken.