Correlação e Causalidade

EST127 - Análise de Regressão

Anderson Ribeiro Duarte

Correlação não implica Causalidade

  • Agora que compreendemos melhor a correlação linear, é tentador fazer afirmações como a seguinte: “Maiores alturas implicam em maiores circunferências de pescoço”.

  • Entretanto, a correlação nos indica uma tendência de variação conjunta, mas não indica uma relação de causa e efeito.

  • Observe o gráfico a seguir. Existe correlação entre os dados?

Correlação não implica Causalidade

Os dados são correlacionados?

Correlação não implica Causalidade

Sim! r = 0,791. Mas o que esses dados representam?

Correlação não implica Causalidade

Então quer dizer que comer chocolate aumenta as chances de ganhar um prêmio Nobel?

Correlação não implica Causalidade

  • O estudo de MESSERLI (2012) indica que há uma correlação positiva forte entre o consumo de chocolate de um país e o número de prêmios Nobel conquistados por esse país (r = 0,791).

  • Porém o mesmo estudo não aponta quais seriam as possíveis relações entre as variáveis.

  • Já o estudo de PRINZ (2020), demonstra que o consumo de chocolate está correlacionado à variáveis econométricas importantes, como gastos com Ciência e Tecnologia (r = 0,4626) e PIB per capita (r = 0,6008).

  • Ambas as variáveis poderiam resultar em maior qualidade educacional, de ciência e tecnologia.

  • Outros estudos mencionam um ganho cognitivo a nível individual causado pelo consumo de chocolate.

  • Entretanto, o estudo conclui que não há evidencias populacionais da relação. Ou seja, até onde se sabe, comer mais chocolate não aumenta a chance de ganhar um prêmio Nobel.

Correlação não implica Causalidade

  • O exemplo anterior é bastante útil para demonstrar que correlação não implica, necessariamente, causalidade.

  • Para se atribuir uma relação de causa e efeito, é necessário identificar o mecanismo relacional entre as variáveis.

  • Existem métodos estatísticos para detecção desses mecanismos, como técnicas de inferência causal, mas não os abordaremos nesse curso.

  • Mais exemplos de correlações espúrias, acidentais ou por coincidência podem ser vistas no site https://tylervigen.com/spurious-correlations

Conclusão

  • Nessa aula aprendemos a verificar a existência ou não de relação entre duas variáveis;

  • Além de verificar, quando a relação é linear, aprendemos a quantificar essa relação por meio do coeficiente de correlação de Pearson.

  • Para finalizar, aprendemos que correlação não implica necessariamente em causalidade e que precisamos compreender o mecanismo relacional para afirmar a existência de uma relação de causa e efeito.

Referências

MESSERLI, F. H. Chocolate consumption, cognitive function, and nobel laureates. N Engl J Med, v. 367, n. 16, p. 1562–1564, 2012.
PRINZ, A. L. Chocolate consumption and noble laureates. Social Sciences & Humanities Open, v. 2, n. 1, p. 100082, 2020.