Approfondissement : corrélation et causalité

Document 1 : Faut- il manger du chocolat pour être Prix Nobel?

Le scientifique Franz Messerli a un jour fait un constat troublant : les pays qui reçoivent le plus de prix Nobel proportionnellement à leur population sont aussi ceux qui consomment davantage de chocolat par personne. Faut-il y voir un lien ? Probablement pas ! (…)

Le chocolat pourrait nous rendre plus intelligent. Certaines études attribuent cette propriété aux flavanols contenus dans ces denrées. Cependant, cela ne fait pas l’unanimité dans le monde de la recherche. (…) Franz Messerli était en voyage à Katmandou. N’ayant rien à faire pour s’occuper dans sa chambre d’hôtel, il a eu l’idée de vérifier le lien entre chocolat et intelligence en regardant la corrélation entre la consommation de chocolat et le nombre de prix Nobel par habitant. (…)

L’étude : des prix Nobel forts en cacao

Le chercheur, non sans ironie, se dit stupéfait par les résultats observés. Plus la consommation de chocolat par habitant est forte, plus un territoire a de chances de fournir un prix Nobel, si on le rapporte à sa population.(…) [D’après l’auteur] pour qu’un État obtienne davantage de récompenses, il lui faudrait augmenter sa consommation de chocolat par habitant de 400 g chaque année. (…) Cependant, il reconnaît que l’intelligence ne s’explique pas forcément par le chocolat, apportant une autre hypothèse. Les prix Nobel pourraient être des gens tellement savants qu’ils connaîtraient les vertus du cacao sur l’intellect, expliquant ainsi pourquoi ils en mangent davantage… L’œil extérieur : un peu d’humour, ça ne fait jamais de mal Bien évidemment, Franz Messerli a tout simplement voulu s’amuser un peu. Pourtant, ces résultats ne surprennent pas Eric Cornell, distingué en 2001 pour ses travaux de physique. « La consommation nationale de chocolat est corrélée à la richesse d’un pays et la recherche de haute qualité est elle aussi corrélée avec la richesse d’un pays. […] Il n’y a pourtant aucun lien entre les deux. » N’aurait-il pas compris l’ironie de l’étude ? Bien sûr que si. Car il conclut : « Si vous voulez un prix Nobel de chimie ou de médecine, vous pouvez vous permettre du chocolat au lait, mais pour un prix Nobel de physique, le chocolat noir est plus conseillé. »

Par Janlou Chaput, Futura, le 02/12/2017

Document 2 : Le générateur aléatoire de comparaisons absurdes sur Lemonde.fr

Document 3 : Les expérimentations aléatoires en économie

Esther Duflo est une des économistes français les plus connus dans le monde. Elle préconise, lors de la mise en place de politiques publiques d’évaluer leur efficacité en utilisant les expérimentations aléatoires. De quoi s’agit-il ?

Prenons l’exemple d’un projet qui consisterait à distribuer gratuitement des ordinateurs portables à des collégiens pour améliorer leur niveau scolaire. Le commanditaire du projet serait en droit de se poser la question : est-ce que « ça marche » ? L’évaluation intervient pour chercher à répondre à cette question et savoir si « quelque chose », que ce soit une politique publique, un programme d’aide ou encore un médicament, donne des résultats.

Comment évaluer?

Toute la difficulté revient à se demander « ce qui se serait passé » si l’intervention n’avait pas existé (on parle d’une « évaluation contrefactuelle »). Admettons que pour soigner des maux de tête, je prenne un cachet d’aspirine. Au bout d’une heure, la douleur a disparu. Puis-je pour autant en conclure que le médicament a marché ? Certainement pas, car pour cela il aurait fallu savoir si ma douleur aurait persisté en l’absence de la prise de ce cachet. Après tout, peut-être que les maux de tête seraient partis d’eux-mêmes. Or au niveau individuel, on ne peut présumer d’une causalité. Il en va de même pour un collégien pris isolément : si son niveau a augmenté quelques mois après la distribution de l’ordinateur, la relation de cause à effet n’est pas démontrée pour autant, car son niveau aurait tout aussi bien pu augmenter sans l’octroi d’un ordinateur.

Une solution pour dépasser ce problème consiste à ne plus raisonner au niveau individuel, mais au niveau groupal. Prenons deux groupes A et B présentant des caractéristiques suffisamment similaires (p.ex. : âge moyen, pourcentage de garçons, niveau scolaire) et permettant ainsi de supposer que l’un comme l’autre agirait de la même manière en l’absence de distribution d’ordinateurs portables. Ainsi, lorsque le groupe A reçoit des ordinateurs portables et que le groupe B n’en reçoit pas, on peut penser que le niveau atteint par le groupe B à la fin de l’année scolaire est celui qu’aurait atteint le groupe A s’il n’avait pas eu d’ordinateurs portables.

Bien sûr, la difficulté repose sur la constitution de groupes pouvant être comparés. Plusieurs méthodes existent, mais la plus convaincante est le tirage au sort. Pour peu que les élèves soient suffisamment nombreux, il y a de grandes chances pour qu’un tirage au sort permette de constituer des groupes semblables.

Voilà donc la méthode des expérimentations aléatoires : diviser une population en deux groupes. Le programme est appliqué au groupe de traitement (ou test), tandis que le groupe de contrôle (ou témoin) ne reçoit pas d’ordinateurs. Au bout d’un certain temps, la différence entre les groupes permet ainsi de mesurer l’effet du programme testé.

Le portail de l’Economie, des finances, de l’action et des comptes publics economie.gouv.fr par Arthur Jatteau

Questions :

  1. D’après vos connaissances, donnez une définition de la corrélation et une définition de la causalité. Quelle est la différence entre les 2 ?

    Cliquer pour voir la réponse On parle de corrélation lorsque des variables évoluent en même temps, c’est-à-dire des variations concomitantes de deux phénomènes. Il y a un lien de causalité lorsqu’une variable est explicative de l’évolution d’une autre variable.


  2. Le document 2 présente l’évolution du taux d’homicides au Salvador depuis le milieu des années 1990 ainsi que le nombre de nouveaux nés prénommés Kevin dans le département des Bouches du Rhône sur la même période.

  1. Lecture. Quel est le taux d’homicides au Salvador en 1995 ? Quel est le nombre de nouveaux nés prénommés Kevin à cette même date ?
    Cliquer pour voir la réponse Il y a environ 225 Kevin qui naissent dans les Bouches-du-Rhône en 1995. Le chiffre se lit sur l’axe des ordonnées à droite du repère (orange comme la courbe).

  2. Interprétation. On observe que les 2 variables évoluent dans le même sens. Pensez-vous qu’il puisse y avoir une corrélation ? une causalité ?
    Cliquer pour voir la réponse On observe en effet une variation concomitante des deux variables. Elles évoluent dans le même sens (il y a de moins en moins de prénommés Kevin qui naissent dans les Bouches du Rhône et de moins en moins d’homicides pour 100 000 habitants au Salvador). Il s’agit donc d’une corrélation (et on peut dire une corrélation positive car les deux variables vont dans le même sens). En revanche, il est difficile d’imaginer un lien de causalité entre ces deux variables. Cela voudrait dire qu’il y aurait des gens au Salvador qui détesteraient tellement le prénom Kevin prononcé avec l’accent marseillais qu’à chaque naissance d’un Kevin dans les Bouches du Rhône ils iraient tuer quelqu’un ? Ou, si la causalité était à l’inverse, que la recrudescence de meurtres au Salvador dissuaderait certains parents des Bouches du Rhône d’appeler leur enfant Kevin ? « Chérie, je vois que le taux d’homicides au Salvador est passé sous la barre des 60 pour 100 000 habitants. Je crois qu’on peut l’appeler Kevin ». Ce n’est pas vraiment raisonnable !

  1. Dans quels cas y a-t-il une « fausse causalité » entre A et B, c’est-à-dire une corrélation qui n’implique pas de causalité de A vers B ? (attention : plusieurs réponses sont possibles!)
  1. Lorsque c’est en fait B qui est la cause de A

    Cliquer pour voir la réponse En effet, quand on observe une corrélation entre A et B, ce n’est pas forcément A qui cause B. ça pourrait être l’inverse, B cause A. Par exemple, si on observe que les gens qui font du sport sont en meilleure santé, bien sûr cela peut être parce que les gens font du sport qu’ils sont en meilleure santé, mais ça pourrait être parce qu’ils sont en meilleure santé que les gens font du sport…


  2. Lorsque la corrélation est négative

    Cliquer pour voir la réponse Non. La corrélation est négative quand 2 variables évoluent en sens inverse : quand l’une augmente, l’autre diminue. Mais une corrélation négative ne dit rien de la causalité. Il peut y avoir corrélation négative et lien de causalité, ou corrélation négative et fausse causalité.


  3. Lorsqu’il y a une autre variable, C, qui cause à la fois B et A

    Cliquer pour voir la réponse Oui ! Une corrélation entre A et B peut tout à fait exister sans que A cause B, ni que B cause A. Il peut en effet y avoir une autre variable encore qui agisse sur les 2, sans que l’une n’agisse sur l’autre. Par exemple, on a observé que 25% des filles prénommées Madeleine, Irène ou Ariane ont eu mention très bien au Bac en 2013. Voilà une corrélation entre le prénom (A) et la réussite au bac (B). Mais ce n’est pas parce qu’elles s’appellent Madeleine, Irène ou Ariane qu’elles réussissent leur bac ! (A n’est pas la cause de B). Ce n’est pas non plus parce qu’elles ont eu mention très bien au bac qu’elles s’appellent Madeleine, Irène ou Ariane ! elles portaient ces prénoms avant d’avoir leur bac… (B n’est pas la cause de A). Il y a une autre variable, la catégorie socio-professionnelle des parents (C) qui influe à la fois sur le prénom (davantage de parents de catégories socio-professionnelles supérieures aiment les prénoms Madeleine, Irène et Ariane) ET sur la réussite au bac (les enfants de ces parents sont mieux préparés à l’examen…) C’est bien une variable C qui cause A et B. Il y a du coup une corrélation entre A et B, mais pas de causalité de A vers B. Donc, si un jour vous donnez naissance à une fille, ne l’appelez pas Madeleine juste pour qu’elle réussisse au bac. Ça risque de ne pas marcher. En revanche, si vous adorez le prénom Madeleine, n’hésitez pas à le donner à votre petite. Mais alors vous pourrez vous interroger sur vos goûts pour les prénoms avec la sociologie, surtout si vous appartenez à une catégorie socio-professionnelle supérieure !!


  4. Lorsque par hasard A et B évoluent dans le même sens mais qu’il n’y a rien qui relie ces 2 variables

    Cliquer pour voir la réponse Oui ! On en a justement vu un exemple avec le taux d’homicides au Salvador et le nombre de nouveaux-nés qui reçoivent le prénom Kevin dans les Bouches du Rhône. Si ça vous amuse, vous en trouverez plein sur le générateur de comparaisons absurdes du site lemonde.fr.


  1. Dans le document 1, la corrélation entre la consommation de chocolat et le nombre de prix Nobel pourrait être une fausse causalité. Lorsque Franz Messerli dit : « les prix Nobel pourraient être des gens tellement savants qu’ils connaîtraient les vertus du cacao sur l’intellect, expliquant ainsi pourquoi ils en mangent davantage… » de quelle type de fausses causalités listées à la question 3 s’agit-il ?

    Cliquer pour voir la réponse Il s’agit de la première de la liste : ce serait en fait B qui causerait A. La consommation de chocolat ne serait pas une explication du nombre de prix Nobel, c’est le nombre de prix Nobel qui expliquerait la consommation de chocolat, ces derniers étant plus enclins à en consommer…


  2. Toujours dans le document 1, Eric Cornell, prix Nobel de physique, dit : « La consommation nationale de chocolat est corrélée à la richesse d’un pays et la recherche de haute qualité est elle aussi corrélée avec la richesse d’un pays. » La corrélation entre consommation de chocolat et nombre de prix Nobel par habitant est elle d’après lui le résultat d’une relation de causalité ? S’il s’agit d’une fausse causalité, de quelle sorte de fausse causalité listée à la question 3 s’agit-il ?

    Cliquer pour voir la réponse Il s’agit cette fois de la 3ème proposition listée à la question 3 : une variable C influerait à la fois sur la consommation de chocolat (A) et sur le nombre de prix Nobel (B), et cette variable C serait la richesse du pays. Cette explication est évidemment de loin la plus plausible !


  1. Le document 3 nous dit qu’il est difficile en économie de prouver qu’il existe une relation de causalité quand on observe une corrélation entre 2 variables. Pourquoi, si on observe que des étudiants qui reçoivent un ordinateur gratuit ont un meilleur niveau scolaire après l’avoir reçu, cela ne suffit-il pas à démontrer que c’est grâce à l’ordinateur reçu ?
    Cliquer pour voir la réponse Il faudrait pouvoir connaître le niveau scolaires de ces étudiants au même moment s’il n’avait pas reçu l’ordinateur gratuit, ce que l’article nomme « le contrefactuel ». Ces étudiants auraient très bien pu progresser sans ordinateur, donc nous ne pouvons pas attribuer ces progrès à l’ordinateur.