O presente trabalho tem como objetivo apresentar de forma visual gráfico de dispersão, matriz de correlação e uma interpretação da relação de duas variáveis quantitativas. Sendo essas variáveis horas de estudo e desempenho.
library(readxl)
Questionario_Estresse <- read_excel("Aula de Estatistica/Questionario_Estresse.xls")
View(Questionario_Estresse)
par(bg = "lightyellow")
par(cex = 0.9)
plot(Questionario_Estresse$Horas_estudo,Questionario_Estresse$Desempenho, pch=16,col="blue",
main = "Diagrama de dispersão entre hora de estudo X desempenho",
ylab = "Desempenho", xlab = "Hora de estudo")
abline(lsfit(Questionario_Estresse$Horas_estudo,Questionario_Estresse$Desempenho),col = "red")
selecao1 <- c("Horas_estudo","Desempenho")
cor_quest <- cor(Questionario_Estresse[,selecao1])
cor_quest
## Horas_estudo Desempenho
## Horas_estudo 1.0000000 0.2231532
## Desempenho 0.2231532 1.0000000
library(corrplot)
## corrplot 0.92 loaded
par(bg = "lightyellow")
par(cex=0.9)
corrplot(cor_quest, method = "number")
Observando os dados apresentados, podemos concluir que de acordo com o gráfico de dispersão com as variáveis horas de estudo e desempenho, há uma falta correlação entre elas. Desse modo, tendo sua reta quase linear.
Visualizando a matriz de correlação exposta, pode se ter essa confirmação da falta de correlação, pois através dela se compreende que o coeficiente de correlação é 0,22. Ou seja, sua correlação se denomina como fraca.