Primeiro fez se a importação da base de dados e adequação dos dados para as respostas com a legenda da pesquisa
library(readxl)
Dados <- read_excel("C:/Users/Laryssa/Desktop/Mestrado_UFF/Estatistica/Base_de_dados-master/Questionario_Estresse.xls",
sheet = "Dados")
plot(Dados$Créditos,Dados$Horas_estudo,
main = " Correlação entre Créditos e Horas de Estudo",
pch=19, col="orange",
ylab="Horas de Estudo",
xlab = "Créditos")
abline(lsfit(Dados$Créditos,Dados$Horas_estudo),col="green")
Podemos ver que os valores entre Créditos e Horas de Estudo variam muito, tendo o que pode ser considerado um outlier, que tem apenar 25 créditos e 60 horas de estudo por semana. Mas mesmo assim os valores em geral são muito espalhados, sem grande padrão, vendo que pessoas com a mesma quantidade de créditos tem padrões de estudo muito únicos.
selecao <- c("Desempenho","Estresse","Créditos","Horas_estudo")
library(dplyr)
library(corrplot)
Dados %>% select(selecao) %>% cor(use = "complete.obs") %>% corrplot(addCoef.col=TRUE,number.cex=0.7)
Na matriz de correlação podemos ver os coeficientes por Pearson de todas as variáveis quantitativas de uma vez só e comprovamos que nenhuma das variáveis tem grande associação entre si. Sendo a correlação mais alta entre Créditos e Horas de Estudo e a mais baixa entre Créditos e Estresse. Por Pearson vemos que a correlação de 1 ou -1 são perfeitas e valores mais próximos de 0, as variáveis não dependem uma da outra.