Diagrama de Dispersão

Introdução

Este trabalho tem como objetivo analisar a correlação entre as variáveis quantitativas contínuas Horas de estudo e Desempenho, da Base de Dados Questionário Estresse. Para tanto, serão utilizados o coeficiente de correlação e um gráfico de dispersão.

library(readxl)
Questionario_Estresse <- read_excel("Questionario_Estresse.xls")

Coeficiente de correlação

cor(Questionario_Estresse$Horas_estudo,Questionario_Estresse$Desempenho)
## [1] 0.2231532

Gráfico de dispersão

plot(Questionario_Estresse$Horas_estudo,Questionario_Estresse$Desempenho, col = "blue", pch=20, main =  "Horas de Estudo x Desempenho", ylim =  c(5,10), ylab = "Desempenho", xlab =  "Horas de Estudo")
abline(lsfit(Questionario_Estresse$Horas_estudo,Questionario_Estresse$Desempenho), col = "green")

Análise

O coeficiente de correlação obtido a partir do cruzamento entre as variáveis acima é positivo, porém tem um valor bem mais próximo de 0, o que o caracteriza como fraco. O gráfico de dispersão reforça que as variáveis possuem uma correlação linear positiva e de grau fraco, uma vez que a linha é crescente e há muitos pontos dispersos. Contudo, é possível constatar que quanto maior o número de horas de estudo, maior tende a ser o desempenho.

Considerações finais

Assim sendo, mesmo que fraca a correlação entre as variáveis Horas de Estudo e Desempenho, atesta-se uma sutil tendência do desempenho ser maior entre quem estuda por mais horas.