EST127 - Análise de Regressão
Agora que compreendemos melhor a correlação linear, é tentador fazer afirmações como a seguinte: “Maiores alturas implicam em maiores circunferências de pescoço”.
Entretanto, a correlação nos indica uma tendência de variação conjunta, mas não indica uma relação de causa e efeito.
Observe o gráfico a seguir. Existe correlação entre os dados?
Os dados são correlacionados?
Sim! r = 0,791. Mas o que esses dados representam?
Então quer dizer que comer chocolate aumenta as chances de ganhar um prêmio Nobel?
O estudo de MESSERLI (2012) indica que há uma correlação positiva forte entre o consumo de chocolate de um país e o número de prêmios Nobel conquistados por esse país (r = 0,791).
Porém o mesmo estudo não aponta quais seriam as possíveis relações entre as variáveis.
Já o estudo de PRINZ (2020), demonstra que o consumo de chocolate está correlacionado à variáveis econométricas importantes, como gastos com Ciência e Tecnologia (r = 0,4626) e PIB per capita (r = 0,6008).
Ambas as variáveis poderiam resultar em maior qualidade educacional, de ciência e tecnologia.
Outros estudos mencionam um ganho cognitivo a nível individual causado pelo consumo de chocolate.
Entretanto, o estudo conclui que não há evidencias populacionais da relação. Ou seja, até onde se sabe, comer mais chocolate não aumenta a chance de ganhar um prêmio Nobel.
O exemplo anterior é bastante útil para demonstrar que correlação não implica, necessariamente, causalidade.
Para se atribuir uma relação de causa e efeito, é necessário identificar o mecanismo relacional entre as variáveis.
Existem métodos estatísticos para detecção desses mecanismos, como técnicas de inferência causal, mas não os abordaremos nesse curso.
Mais exemplos de correlações espúrias, acidentais ou por coincidência podem ser vistas no site https://tylervigen.com/spurious-correlations
Nessa aula aprendemos a verificar a existência ou não de relação entre duas variáveis;
Além de verificar, quando a relação é linear, aprendemos a quantificar essa relação por meio do coeficiente de correlação de Pearson.
Para finalizar, aprendemos que correlação não implica necessariamente em causalidade e que precisamos compreender o mecanismo relacional para afirmar a existência de uma relação de causa e efeito.