Mes finances, mes projets, ma vie
3 décembre 2022

Quand les apparences sont trompeuses

Les investisseurs doivent être conscients que corrélation n’est pas synonyme de causalité.

Quel que soit son niveau d’expérience, un investisseur ne doit jamais oublier la règle d’or statistique suivante : la corrélation n’est pas l’équivalent de la causalité. Que ce soit dans le domaine de l’investissement ou ailleurs, nous avons facilement tendance à confondre les deux. Pourtant, ce n’est pas parce que deux variables rassemblées sur un même graphique financier évoluent de manière similaire qu’il existe forcément un lien causal entre elles. C’est pourquoi certaines corrélations sont dites fallacieuses. Soit elles suggèrent une connexion entre plusieurs éléments qui n’existe pas dans la réalité, soit elles proviennent d’un facteur confondant, c’est-à-dire d’un élément supplémentaire qui relie les autres entre eux et qui ne ressort pas sur le graphique.

Corrélations trompeuses

Dans ce contexte, le travail de Tyler Vigen permet de mieux comprendre les conséquences possibles de telles corrélations. Cet étudiant de Harvard désormais célèbre a écrit un programme informatique qui a déjà débusqué plus de 30.000 corrélations aussi fallacieuses que ridicules.

Il a par exemple trouvé une corrélation à plus de 99 % sur 10 ans entre le taux de divorce dans l’état américain du Maine et la consommation de margarine. Faut-il en conclure que la margarine nuit à la vie de couple ?

Autre exemple : sur 10 ans, il y a une corrélation à plus de 66 % entre le nombre de personnes qui meurent noyées dans leur piscine et les sorties de films dans lesquels Nicolas Cage apparaît. Les films de l’acteur seraient-ils dangereux ?

Ces corrélations dont la fausseté est évidente peuvent prêter à sourire. Il en va de même pour le lien entre l’apparition de cigognes et le taux de natalité. Statistiquement, on compte en effet plus de naissances dans les régions où le nombre de cigognes est élevé. Une corrélation, oui, mais certainement pas une causalité…

Si deux courbes d’un graphique financier présentent une évolution similaire, cela ne signifie pas nécessairement qu’il existe un lien direct entre elles.

Utiliser son esprit critique

Lorsqu’on examine une corrélation, il faut toujours se demander si la corrélation apparente n’est pas en réalité liée à une autre variable. Car même dans le monde de la finance, certaines corrélations persistent au-delà du raisonnable et continuent d’alimenter des légendes. Un des exemples les plus célèbres est celui de la théorie de la longueur de la jupe. Décrit pour la première fois en 1926 par George Taylor, l’indice Hemline – l’indice de l’ourlet – suggère que la longueur moyenne des jupes portées par les femmes et l’orientation du marché boursier sont corrélées.

Selon cette théorie, si les jupes courtes gagnent en popularité, alors les marchés vont bientôt s’inscrire en hausse. À l’inverse, si les jupes plus longues sont à la mode, cela signifie que les marchés vont baisser. La théorie part du principe que les jupes ont tendance à raccourcir lorsque la confiance et l’enthousiasme des consommateurs sont élevés. Tandis que certains économistes cherchent aujourd’hui encore à vérifier la validité de cette théorie de la jupe, l’investisseur lambda, lui, ferait bien de ne pas trop s’intéresser à ce type de pseudo-indicateur dans le cadre de sa stratégie d’investissement.

Les ordinateurs sont capables d’effectuer un nombre incroyable de calculs en quelques secondes seulement.

L’ère du Big Data

Le problème des corrélations fallacieuses est donc loin d’être nouveau, mais il prend de l’ampleur et gagne en complexité avec l’émergence de technologies comme le Big data, l’intelligence artificielle et le machine learning, qui offrent désormais des capacités inédites au monde de la finance.

La puissance de ces technologies est telle que les ordinateurs sont capables d’effectuer un nombre incroyable de tests et de calculs en quelques secondes seulement. Or, plus on cherche et plus on trouve. Par conséquent, les super calculateurs ont bien plus de chances que les humains de trouver des relations entre variables qui semblent significatives, mais qui s’avèrent en réalité n’être que des corrélations fallacieuses.

Ainsi, aussi formidables et avancées que soient ces technologies, il faut toujours s’assurer que les résultats trouvés soient encadrés par des protocoles scientifiques stricts et analysés par des experts.

De même, les investisseurs doivent si possible toujours solliciter l’avis d’un professionnel pour éviter de comparer des pommes et des oranges, ou, pour reprendre un des exemples précités, des morts par noyade et les sorties de films avec Nicolas Cage.

Notre cerveau aime les explications simples et se plaît à établir des liens faciles à assimiler, même là où il n’y en a pas forcément. Véritable machine à tirer des conclusions rapides, il peut très facilement nous amener à croire, à la lecture d’un graphique, que le mouvement de la variable A est lié à celui de la variable B ou vice versa. Or, un examen statistique plus approfondi peut faire apparaître qu’une évolution similaire sur un graphique n’est pas une causalité mais une simple coïncidence.

Le problème des corrélations fallacieuses est loin d’être nouveau.

La prudence est dès lors de mise. En effet, si une corrélation forte peut indiquer un lien de causalité, elle peut également avoir d’autres explications : il peut s’agir tout simplement d’une coïncidence semblant mettre en lumière un lien pourtant inexistant entre des variables. Une troisième variable cachée pourrait aussi faire croire que la relation est plus forte (ou plus faible) qu’elle ne l’est en réalité.