Este trabalho tem como objetivo analisar a correlação entre as variáveis quantitativas contínuas Horas de estudo e Desempenho, da Base de Dados Questionário Estresse. Para tanto, serão utilizados o coeficiente de correlação e um gráfico de dispersão.
library(readxl)
Questionario_Estresse <- read_excel("Questionario_Estresse.xls")
cor(Questionario_Estresse$Horas_estudo,Questionario_Estresse$Desempenho)
## [1] 0.2231532
plot(Questionario_Estresse$Horas_estudo,Questionario_Estresse$Desempenho, col = "blue", pch=20, main = "Horas de Estudo x Desempenho", ylim = c(5,10), ylab = "Desempenho", xlab = "Horas de Estudo")
abline(lsfit(Questionario_Estresse$Horas_estudo,Questionario_Estresse$Desempenho), col = "green")
O coeficiente de correlação obtido a partir do cruzamento entre as variáveis acima é positivo, porém tem um valor bem mais próximo de 0, o que o caracteriza como fraco. O gráfico de dispersão reforça que as variáveis possuem uma correlação linear positiva e de grau fraco, uma vez que a linha é crescente e há muitos pontos dispersos. Contudo, é possível constatar que quanto maior o número de horas de estudo, maior tende a ser o desempenho.
Assim sendo, mesmo que fraca a correlação entre as variáveis Horas de Estudo e Desempenho, atesta-se uma sutil tendência do desempenho ser maior entre quem estuda por mais horas.