Sortir de l’inertie climatique en hackant le dilemme du prisonnier
La théorie des jeux nous apprend que la poursuite rationnelle du seul intérêt personnel ne permet pas d’atteindre le meilleur résultat au bénéfice de l’intérêt collectif. Cela explique en partie les difficultés à défendre un bien commun essentiel : le climat et la planète. Pour y parvenir, il est grand temps d’apprendre à jouer autrement !
Le climat est un bien public mondial et les gaz à effet de serre un mal public collectif. Mais dès lors que l’action de chacun a des effets sur tous, des rivalités apparaissent. Resquilleurs1, dilemme du prisonnier, stratégies de manipulations et d’extorsions ou encore tactiques de compétition sont alors monnaie courante. C’est ce que met en évidence la théorie des jeux dont il a été question dans l’article intitulé « La théorie des jeux peut-elle nous aider à maîtriser nos impacts sur le climat ? ».
Dans un langage d’économiste, une externalité négative conduit à une défaillance de marché. La théorie économique nous apprend que l’action des pouvoirs publics est alors nécessaire afin de corriger les défaillances de marché et retrouver une allocation optimale des ressources.
L’intérêt collectif, oui mais comment ?
Dans le dilemme du prisonnier, souvenez-vous que, si chacun des belligérants raisonne dans son coin et selon son propre intérêt, il va systématiquement choisir de dénoncer son complice. Ce dilemme décrit une situation dans laquelle les intérêts individuels s’opposent aux intérêts collectifs et empêchent la concrétisation du meilleur scénario possible, à savoir garder collectivement le silence et minimiser la sentence totale. La poursuite de l’intérêt personnel conduit alors à un équilibre de Nash qui n’est pas optimal mais permet d’éviter le pire. Ce dilemme du prisonnier illustre bien que, dans une société où le développement économique est massivement fondé sur la coopération, cette dernière ne va pas du tout de soi.
Le dilemme du prisonnier illustre bien que la coopération ne va pas du tout de soi.
Comment les prisonniers pourraient-ils déjouer les plans du policier et concrétiser la meilleure solution ? Le premier réflexe consiste à penser qu’il suffit que les deux malfrats puissent se parler et s’entendre entre eux avant l’interrogatoire… et tenir parole ! En pratique, la communication ne résout pas grand-chose. Ceux qui ont visionné quelques épisodes du jeu télévisé intitulé « Golden Balls » basé sur le principe du « dilemme du prisonnier » ont constaté que la trahison l’emporte régulièrement sur l’esprit d’équipe. L’appât d’un gain personnel potentiellement plus important l’emporte souvent sur le choix d’un gain collectif maximal. Surtout si les protagonistes ne jouent qu’une seule fois ensemble. Comment éviter cela ? La mafia et les manchots ont trouvé des solutions radicales.
La mafia et les manchots
Si on ne parvient pas à gagner à un jeu, il est sans doute temps d’arrêter de jouer, ou de changer les règles. Ainsi, la mafia a trouvé un moyen pour hacker le dilemme du prisonnier : l’omerta, c’est-à-dire la loi du silence. Concrètement, tout membre de l’organisation criminelle est conscient que la délation équivaut à une sentence de mort de la part de cette même organisation. De quoi aider sérieusement les prisonniers à opter pour la meilleure stratégie collective. L’ajout de cette contrainte extérieure (liquidation du dénonciateur) se révèle être bénéfique pour les deux prisonniers. Face à cela, la police peut tenter de revenir à l’équilibre non coopératif initial en mettant en place un programme de protection de témoins et de repentis. Bref, pour obtenir un résultat différent, il faut modifier les conditions du « jeu ».
Les pingouins et les manchots déploient une technique encore plus brutale pour sortir de l’équilibre de Nash. Leur dilemme est le suivant : leurs mets préférés nagent dans les mêmes eaux que leurs plus grand prédateurs, les orques. À l’évidence, les manchots ont appris à se méfier de l’eau qui dort. Comment savoir s’ils peuvent plonger sans danger pour se sustenter de harengs ? Personne ne souhaite être le premier à plonger. Mais ce manque d’initiative personnelle pose un problème majeur à l’ensemble de la colonie. La solution ? Forcer un manchot pris au hasard à plonger à l’aide d’un coup de patte dans l’arrière-train ou d’une bousculade. Si ce dernier est dévoré par les orques dans les secondes qui suivent, un autre terrain de pêche doit être envisagé. On appelle cela le « sacrifice du manchot émissaire ».
Une intervention extérieure constitue la meilleure façon de résoudre un équilibre de Nash.
Si ces pratiques peuvent sembler très discutables, elles ont le mérite de nous enseigner qu’une intervention extérieure constitue la meilleure façon de résoudre un équilibre de Nash. Dans le cas de la mafia, bien que moralement contestable, l’ajout d’une contrainte via la restriction à priori de liberté d’action des acteurs n’est pas nécessairement défavorable pour ceux qui la subissent. Dans le cas des pingouins, la morale de l’histoire est encore plus ambigüe.
Pour en revenir à nos moutons, ou plus précisément nos prisonniers et le climat, le dilemme du prisonnier ne signifie pas que nous sommes condamnés à l’autodestruction du fait de notre égoïsme. En revanche, il semble bien que, ici aussi, une intervention extérieure soit nécessaire. La gestion des émissions de gaz à effet de serre suppose donc une intervention de l’État (par incitation, réglementation et contrôle) pour restaurer l’optimum au sens économique. Mais, in fine, cela nécessite d’internaliser l’externalité (quotas et taxe carbone). En pratique, l’instauration d’une comptabilité carbone en plus d’une comptabilité financière traditionnelle doit s’imposer.
Jouer, encore et encore
Là où la théorie des jeux devient vraiment intéressante, c’est quand on joue plusieurs tours d’affilé. Fera-t-on encore confiance à celui qui a déjà trahi ? Trahira-t-on celui avec qui on a déjà collaboré ? Le monde animal nous offre ici encore de nombreuses illustrations du fait que la collaboration et l’altruisme constituent parfois la stratégie la plus efficace en sélection naturelle. Il suffit de penser aux colonies de fourmis, aux essaims d’abeilles, aux meutes de loup…
Si on ne joue le jeu qu’une seule fois, nous avons vu que chacun essaiera de trahir l’autre au nom de son intérêt personnel. Mais s’il faut y jouer encore et encore, la donne change dans la mesure où il devient possible par notre comportement de punir la traîtrise ou d’encourager la coopération dont les autres joueurs ont fait preuve dans le passé. Ainsi, chaque joueur doit définir sa stratégie pour le prochain coup en fonction de ce qui s’est passé les tours précédents : toujours trahir (le méchant), toujours coopérer (le gentil), un choix aléatoire (le lunatique), copier le choix précédent de l’autre (le copycat), toujours coopérer tant qu’on n’est pas trahi, mais toujours trahir après avoir été une fois trahi (le rancunier)…
La stratégie de réciprocité ne gagne pas systématiquement contre une autre stratégie, mais elle cumule les meilleurs résultats après répétitions multiples.
Le biologiste William Donald Hamilton, reconnu comme l’un des plus grands biologistes de la théorie de l’évolution du 20e siècle, et Robert Axelrod, professeur en science politique et lauréat du prix MacArthur de 1987, se sont associés pour diagnostiquer les comportements de coopération chez les êtres vivants en utilisant le cadre mathématique de la théorie de jeux. Leur diagnostic est sans appel. Robert Axelrod a ainsi démontré que, dans des jeux à somme non nulle avec plusieurs parties, la meilleure stratégie est celle qui débute par une coopération et qui duplique ensuite le choix de l’autre joueur au tour précédent. C’est ce que l’on appelle communément la stratégie du « donnant-donnant » (« tit-for-tat » en anglais) ou stratégie de réciprocité. Cette stratégie de réciprocité ne gagne pas systématiquement contre une autre stratégie, mais c’est celle qui cumule les meilleurs résultats après répétitions multiples2.
Trahir ou coopérer ? Punir ou pardonner ? Pour mieux comprendre les choix stratégiques qui combinent mathématique, psychologie, économie et climat, je vous suggère de pratiquer le jeu « the evolution of trust » développé par Nicky Case et disponible en ligne gratuitement. Cette variation du dilemme du prisonnier fait comprendre que si les deux joueurs résistent à la tentation de trahir et arrive à créer une relation de confiance, tout le monde y gagne. Ni plus ni moins qu’une justification d’une conduite éthique hissée au rang de règle d’or dans un jeu à somme non-nulle répété et qui transforme un « donnant-donnant » en « gagnant-gagnant ».
On le sait, le changement climatique et l’érosion de la biodiversité ne connaissent pas de frontières. De toute évidence, les temporalités des scientifiques, des politiques et des marchés financiers diffèrent. Les intérêts nationaux sont antagonistes et les égoïsmes nationaux l’emportent régulièrement sur les schémas coopératifs dans lesquels tous les acteurs seraient gagnants à terme.
Dans ce contexte, le dilemme du prisonnier nous aide à comprendre pourquoi les acteurs du monde entier continuent à tergiverser. Chaque Etat a comme intérêt d’assurer sa croissance économique, c’est-à-dire à polluer plus, alors que l’intérêt collectif est de sauver la planète, c’est-à-dire réduire les émissions de CO2. Avec une particularité complémentaire souvent bien ancrée dans le cas du dilemme du prisonnier climatique : les plus gros pollueurs sont souvent les moins vulnérables au changement climatique.
Pour envisager une issue favorable, il faut se rappeler que, dans la théorie des jeux, la solution au dilemme du prisonnier apparaît lorsque l’on considère la répétition. En cela, il faut noter que l’accord de Paris sur le climat (COP21) constitue aussi une avancée significative dans le cheminement collaboratif. Basé sur une logique d’engagement des Etats, une masse critique d’acteurs décidés et une « revoyure » tous les cinq ans, il y a là des éléments qui ont pour vocation de déclencher une mécanique vertueuse de collaboration.
À l’évidence, il n’est pas utile d’argumenter sur le fait que la coopération et la confiance sont deux des éléments les plus importants de toute entreprise humaine réussie. Mais avouons que, en matière de climat, un large coup de pouce est nécessaire. Et objectivement, si le paternalisme libéral est sympa (ce que les anglo-saxon appellent la « Nudge Theory »), il est temps de reconnaître qu’il s’avère largement insuffisant.
Le climat et plus globalement l’environnement sont des biens communs qui requièrent des actions aussi bien individuelles que collectives. Restons optimistes en observant que les coûts inhérents à l’action ont chuté, que les avantages de la lutte pour leur protection sont devenus plus évidents et que le cheminement vers un modèle collaboratif est l’une des clés énoncées par la théorie des jeux pour hacker le dilemme du prisonnier. Je termine en rappelant encore une fois que l’investisseur joue aussi un rôle crucial dans la lutte contre le changement climatique par ses choix d’allocation de capital.
1 Problème du passager clandestin
2 L’explication réside dans le fait que les travaux de R. Axelrod portaient sur des jeux à somme non constante, le nombre de points distribués n’est pas toujours le même. Démonstration non équivoque de la force incontestable de cette stratégie dans l’évolution des espèces.