La théorie des jeux peut-elle nous aider à maîtriser nos impacts sur le climat ?
L’économie n’est pas un jeu à somme nulle. La vision d’un gâteau à partager, qu’il suffirait de mieux répartir pour que tout le monde se porte mieux, est une vue de l’esprit populaire mais simpliste. En fait, la taille et la qualité du gâteau dépendent de la recette choisie et de notre manière de le préparer ensemble. La théorie des jeux permet de mieux comprendre la nécessité de subordonner la poursuite du seul intérêt personnel à la volonté de poursuivre l’intérêt collectif et durable. Explications.
Depuis mes études en sciences économiques, il y a un domaine qui m’a toujours intrigué, la théorie des jeux. À l’évidence, la théorie des jeux est une preuve que les maths servent à quelque chose. Au-delà des modèles mathématiques souvent sophistiqués y relatifs, j’affectionne particulièrement les exemples très pédagogiques qui permettent d’en approcher les idées de base.
À la frontière entre les mathématiques et la psychologie, la théorie des jeux s’intéresse aux situations où plusieurs personnes peuvent décider de coopérer.
À la frontière entre les mathématiques et la psychologie, la théorie des jeux s’intéresse à toutes sortes de situations présentées sous forme de jeux stratégiques où plusieurs personnes peuvent être en état de coopérer. En faisant l’hypothèse que chaque agent/joueur effectue un choix rationnel visant à maximiser ses gains et à minimiser ses pertes, la théorie des jeux fournit un modèle permettant d’aborder les problèmes décisionnels en situation d’interdépendance stratégique1. Des problèmes qui sont fréquents dans le monde des affaires.
La théorie des jeux ne concerne pas seulement la pratique des jeux et la modélisation économique. Elle trouve des applications dans une multitude d’autres domaines : les sciences sociales, les sciences politiques, en biologie (évolutive), dans les relations internationales, dans la théorie des organisations… bref, dans tous les domaines qui nécessitent une prise de décision face à des choix stratégiques.
Par exemple, à la question de savoir pourquoi les commerces du même type ont tendance à s’installer à proximité les uns des autres, le « jeu des vendeurs de glace » apporte une modélisation pédagogique intéressante. Il illustre ce qu’un économiste désigne comme le modèle de différentiation minimale (ou encore Loi de Hotelling pour les puristes), reflet d’une force de gravité stratégique, et qui fait que dans une situation de concurrence parfaite, il n’y a dans l’immensité de la plage, qu’une seule place optimale pour les deux vendeurs de glace : le milieu de la plage.
Laisser le milieu de la plage à son concurrent serait l’assurance de vendre moins que lui. Il s’agit d’une situation d’équilibre pour les vendeurs de glace, mais situation largement sous-optimale pour une partie des utilisateurs de la plage qui vont donc devoir parcourir une distance plus importante pour déguster la précieuse glace. Si la distance leur semble excessive, certains clients potentiels pourraient même choisir de renoncer à leur glace et ce sont alors les deux vendeurs qui voient une partie des ventes possibles leur échapper. La meilleure solution ? La coopération. En théorie, les deux vendeurs devraient se mettre d’accord pour diviser la plage en deux parties égales et occuper chacun le parfait centre d’une moitié différente de plage. Chacun doit faire confiance à son concurrent pour rester à sa place et s’interdire lui-même de tricher en se rapprochant du centre réel de la plage considérée dans son entièreté.
Le dilemme du prisonnier
Au hit-parade de la théorie de jeux, le dilemme du prisonnier reste l’exemple le plus célèbre. En voici une version légèrement revisitée. Imaginons qu’un hold-up a été commis et que la police arrête deux individus complices de ce méfait. L’inspecteur de police, féru de théorie des jeux, interroge séparément les deux complices et leur présente les options suivantes : soit se taire, soit balancer son complice. Selon les choix des deux individus, les conséquences seront les suivantes :
-
- Si les 2 complices se taisent, le policier les fera condamner pour port d’arme illégal, et chacun fera un an de prison.
- S’ils se dénoncent mutuellement, chacun écopera de cinq ans de prison.
- Si l’un des deux complices décide de se taire, et que son complice le trahit en le dénonçant, le traître ressort libre et son complice fera vingt ans de prison.
Le dilemme est alors pour chacun des suspects de savoir ce qu’il doit faire : se taire ou balancer son complice. Bien entendu, les deux individus n’ont aucun moyen de communiquer entre eux pour se mettre d’accord sur la meilleure stratégie commune, à savoir se taire tous les deux. Vu de l’extérieur, l’intérêt collectif des deux complices est évidemment de rester silencieux. Mais cela suppose de faire passer l’intérêt collectif avant l’intérêt personnel. Si un complice ne regarde que l’intérêt personnel, la logique devient différente et la dénonciation s’impose. Sous cet angle, en cas de dénonciation par le complice, il vaut mieux également privilégier la dénonciation pour ne faire « que » cinq ans de prison au lieu de 20. Et si le complice ne dit rien, la dénonciation lui permet de sortir libre immédiatement.
Le dilemme du prisonnier décrit une situation dans laquelle les intérêts individuels s’opposent aux intérêts collectifs.
Alors que la solution optimale est que chacun des deux prisonniers coopèrent en se taisant, la trahison est la meilleure solution si chacun raisonne dans son coin et selon son propre intérêt. Le dilemme du prisonnier décrit une situation dans laquelle les intérêts individuels s’opposent aux intérêts collectifs.
L’équilibre de Nash
Les deux prisonniers n’ayant pas la capacité de coopérer pour obtenir la peine minimale, la meilleure stratégie est la dénonciation qui permet d’éviter avec certitude les 20 ans de prison, même si elle peut se solder par 5 années de prison pour chacun. Cette solution s’appelle « équilibre de Nash ».
Et l’économiste qui sommeille en moi s’empressera de vous dire que cet équilibre de Nash n’est pas un optimum de Pareto2 puisque les deux joueurs, qu’ils s’agissent des prisonniers ou des vendeurs, pourraient améliorer leur bien-être en coopérant.
Un équilibre de Nash est en ensemble de stratégies (une par joueur) tel qu’aucun joueur ne peut obtenir un gain supplémentaire en changeant unilatéralement de stratégies. Cet équilibre renvoie à un critère d’absence de regret, aucun joueur n’a envie de dévier unilatéralement. Si un prisonnier choisit de se taire, mais que l’autre ne le fait pas, le premier obtient le pire résultat possible. Face à l’incertitude, il fait passer son intérêt propre d’abord, même si une solution meilleure existe potentiellement.
L’équilibre de Nash est le concept central de la théorie des jeux non coopératifs (objectifs indépendants) à information parfaite. On le doit à John Nash, connu des cinéphiles grâce au film « A beautiful mind » basé sur sa vie. Les travaux de John Nash continuent, encore aujourd’hui, à avoir de nombreuses applications en économie : l’analyse du comportement des firmes pour la fixation des quantités, la fixation des prix, les choix de localisation, les choix relatifs à la qualité produits, … Ses applications s’étendent également à la géopolitique (par exemple pour étudier la dissuasion nucléaire comme lors de la crise des missiles de Cuba en 1962) et, plus généralement, à l’étude des choix stratégiques.
Le dilemme du prisonnier formalise les situations où l’intérêt collectif nécessite la coopération alors que l’intérêt individuel conduit plutôt à la non-coopération.
Le dilemme du prisonnier formalise les situations où l’intérêt collectif nécessite la coopération alors que l’intérêt individuel conduit plutôt à la non-coopération. Seule la coopération entre les individus permet de passer de l’intérêt individuel à l’intérêt collectif. Dans la vie courante, cela suggère que, dans certaines situations, le fait de gagner (ou perdre) pour un individu au sein d’un groupe dépend non seulement de sa décision personnelle, mais aussi des décisions qui sont prises par tous les autres. D’où la nécessité de se mettre tous d’accord sur la meilleure décision collective possible.
Jeux à somme non nulle
Pour la théorie de jeux, une distinction fondamentale est relative au résultat final. Ainsi, il faut distinguer les jeux à somme nulle et les jeux à somme non nulle.
-
- Dans un jeu à somme nulle, la somme des gains et des pertes de tous les joueurs est égale à zéro. Le gain de l’un constitue obligatoirement une perte pour l’autre. Dans ce type de jeu, il n’y a pas de notion de coopération.
- Dans un jeu à somme non nulle, la somme des gains et des pertes est différente de zéro (positive ou négative).
La plupart des jeux de société sont des jeux à somme nulle. Au Poker, par exemple, les gains de l’un sont les pertes de l’autre, etc. Les jeux à somme non nulle sont moins évidents, mais beaucoup plus fréquents dans la vraie vie. Ils sont même à la base de tous les développements économiques et sociaux. Le dilemme du prisonnier est un jeu à somme non nulle, il n’y a pas compensation des gains et des pertes entre les joueurs.
Dans la vie quotidienne, tout échange de produits ou services non identiques est un jeu à somme non nulle, le plus souvent positive. Le boulanger gagne à vendre son pain contre de l’argent et l’acheteur gagne à échanger son argent contre ce pain. Le gain de l’un n’est pas la perte de l’autre, mais les deux parties sont gagnantes. À condition de collaborer de sorte à pouvoir continuer le « jeu » de manière pérenne. En effet, le boulanger refusera de vendre son pain à quelqu’un qui l’aura payé en monnaie de singe et l’acheteur n’achètera plus son pain chez le boulanger qui lui aura refilé du pain rassis. Bref, les deux parties peuvent également perdre.
De la même façon, les marchés financiers, l’investissement et l’immobilier ne sont pas non plus des jeux à somme nulle. Le gain de l’un n’est pas la perte de l’autre, sauf à imaginer que chaque transaction oblige la liquidation simultanée et systématique de toutes les positions existantes. Ce n’est pas parce que votre voisin a vendu son appartement à 7.000 € du m² que vous allez pouvoir faire pareil.
Loin de certains clichés tout droit sortis des productions hollywoodienne, l’économie, la finance et l’investissement ne sont pas un champ de bataille, une guerre ou seul l’un des deux adversaires peut gagner. L’économie peut voir prospérer deux partenaires commerciaux, même si ceux-ci se livrent une concurrence acharnée.
La théorie des jeux pour expliquer l’inertie face à l’urgence climatique
Face à la menace, nous avons tous, collectivement, intérêt à endiguer le changement climatique. Mais à l’évidence, nous préférons perpétuer nos habitudes de consommation et de production en vue de maximiser notre bien être à court terme. L’homo economicus qui sommeille en nous est rationnellement déraisonnable. Le dilemme du prisonnier nous conduit dans un monde de schizophrènes.
Le climat et l’environnement sont des biens publics. Ce sont des biens accessibles à tout le monde et il est dans l’intérêt de chacun de les protéger, mais chacun préférerait que les coûts de cette protection soient supportés par les autres.
La théorie des jeux offre ainsi un cadre d’analyse pertinent dans la lutte contre le changement climatique.
La théorie des jeux offre ainsi un cadre d’analyse pertinent dans la lutte contre le changement climatique. Face à la diversité des possibilités, chacune de celles-ci comportant une combinaison de coûts et de bénéfices, les « joueurs » font face à des options stratégiques. À chaque fois, si l’intérêt personnel prime, il existe une option dominante : ne rien faire, ne rien changer ou, pire, jouer au passager clandestin et faire payer aux autres. C’est là un équilibre de Nash par excellence, dans lequel la solution non-coopérative domine car elle maximise le gain individuel au détriment du gain collectif.
Le dilemme du prisonnier est fascinant parce qu’il montre que, dans une société où le développement économique est massivement fondé sur la coopération, cette dernière ne va pas du tout de soi. Les utilisateurs d’une ressource naturelle collective ont intérêt individuellement à la surexploiter, au détriment de leur intérêt collectif. La poursuite de l’intérêt individuel ne conduit pas à la situation la meilleure, loin s’en faut. Cela remet solidement en cause l’idée de l’économiste Adam Smith selon laquelle, sous l’action d’une « main invisible », la réalisation de l’intérêt général découle de la poursuite des intérêts individuels.
À la question de savoir si la théorie des jeux peut nous aider à maîtriser nos impacts sur le climat, la réponse est vraisemblablement à trouver dans le fait que John Nash, ce brillant mathématicien et économiste, est aussi réputé pour son long combat contre la schizophrénie paranoïaque. Dans un souci de bienveillance psychique, il me semblait donc intéressant de vous donner rendez-vous dans un prochain article pour explorer comment « hacker » l’équilibre de Nash dans lequel nous nous complaisons au lieu d’opter pour la meilleure solution collective par la coopération.
1 Les conséquences des actions des uns dépendent des actions prises par d’autres, chacun essayant de deviner ou d’influencer les comportements des autres, ou encore de s’y adapter
2 Un optimum de Pareto est une allocation des ressources sans alternative, c’est-à-dire que tous les agents économiques sont dans une situation telle qu’il est impossible d’améliorer le sort de l’un d’entre eux sans réduire la satisfaction d’un autre. Concept majeur de la microéconomie, il porte le nom de l’économiste italien Vilfredo Pareto, qui l’a utilisé pour décrire un état de la société dans lequel on ne peut pas améliorer le bien-être d’un individu sans détériorer celui d’un autre.