Passo 1 - Carregar base de dados

library(readxl)
Questionario_Estresse <- read_excel("C:/Users/Rica Meira/Desktop/Base_de_dados-master/Questionario_Estresse.xls")

Passo 2 - Diagrama de dispersão

par(bg="lightyellow")
plot(Questionario_Estresse$Desempenho,Questionario_Estresse$Horas_estudo,
     pch=16,col="blue",
     main="Diagrama de dispersão - Desempenho e horas estudadas",
     ylab = "Horas de estudo",xlab = "Desempenho")
abline(lsfit(Questionario_Estresse$Desempenho,Questionario_Estresse$Horas_estudo)
       ,col="darkred")

Passo 3 - Matriz de correlação

selecao<-c("Desempenho","Horas_estudo")

cor_1 <- cor(Questionario_Estresse[,selecao])
cor_1
##              Desempenho Horas_estudo
## Desempenho    1.0000000    0.2231532
## Horas_estudo  0.2231532    1.0000000
library(corrplot)
## corrplot 0.92 loaded
par(cex=0.5)
corrplot(cor_1)

Passo 4 - Interpretação dos resultados apresentados

Na base de dados utilizada temos as duas variáveis quantitativas analisadas. O intuito é associar o desempenho dos alunos nos exames e as horas que os mesmos destinaram aos estudos. O diagrama de dispersão e a matriz de correlação vão ser utilizadas para tentar demonstrar com mais clareza a associação.

Na matriz, como são apenas duas variáveis, não é uma ferramenta que vai facilitar o entendimento, pois não existem muitas comparações, o que ajuda visualmente a entender as correlações. Já no diagrama de dispersões consegue se visualizar com mais facilidade, se percebe que os alunos com pior desempenho não possuem tantas horas estudadas, por outro lado, os alunos com bom desempenho, não necessariamente possuem muitas horas estudadas.