Introdução

Primeiro fez se a importação da base de dados e adequação dos dados para as respostas com a legenda da pesquisa

library(readxl)
Dados <- read_excel("C:/Users/Laryssa/Desktop/Mestrado_UFF/Estatistica/Base_de_dados-master/Questionario_Estresse.xls", 
                    sheet = "Dados")

Diagrama de dispersão de duas variáveis quantitativas.

plot(Dados$Créditos,Dados$Horas_estudo, 
     main = " Correlação entre Créditos e Horas de Estudo",
     pch=19, col="orange",
     ylab="Horas de Estudo",
     xlab = "Créditos")
abline(lsfit(Dados$Créditos,Dados$Horas_estudo),col="green")

Podemos ver que os valores entre Créditos e Horas de Estudo variam muito, tendo o que pode ser considerado um outlier, que tem apenar 25 créditos e 60 horas de estudo por semana. Mas mesmo assim os valores em geral são muito espalhados, sem grande padrão, vendo que pessoas com a mesma quantidade de créditos tem padrões de estudo muito únicos.

Matriz de Correlação de variáveis quantitativas.

selecao <- c("Desempenho","Estresse","Créditos","Horas_estudo")

library(dplyr)
library(corrplot)

Dados %>% select(selecao) %>% cor(use = "complete.obs") %>% corrplot(addCoef.col=TRUE,number.cex=0.7)

Na matriz de correlação podemos ver os coeficientes por Pearson de todas as variáveis quantitativas de uma vez só e comprovamos que nenhuma das variáveis tem grande associação entre si. Sendo a correlação mais alta entre Créditos e Horas de Estudo e a mais baixa entre Créditos e Estresse. Por Pearson vemos que a correlação de 1 ou -1 são perfeitas e valores mais próximos de 0, as variáveis não dependem uma da outra.

Cruzamento de duas variáveis quantitativas

Entrega 6

Laryssa Willcox

16/05/2022

Introdução

Diagrama de dispersão de duas variáveis quantitativas.

Matriz de Correlação de variáveis quantitativas.