Atividade 06 - Cruzamento de variáveis quantitativas

Juliana do Nascimento Roberto

08/01/2022

Introdução

Atividade referente à disciplina de estatística aplicada às ciências humanas e sociais, da turma de administração pública, 2021.2.

Atividade 06: Fazer um documento do RMarkdown, interpretar as estatísticas abaixo e fazer uma publicação no rpubs:

1. Diagrama de dispersão de duas variáveis quantitativas;    
2. Matriz de Correlação de duas variáveis quantitativas.    
 

 

Passo 1 - Carregando a base de dados

Carregando a base de dados que Questionario_Estresse, a qual será utilizada nessa atividade.

library(readxl)
Questionario_Estresse <- read_excel("C:/Users/julia/Base_de_dados-master/Questionario_Estresse.xls")

Passo 2 - Gráfico de dispersão

Variáveis utilizadas: Desempenho e Horas_estudo.
teoria: quanto mais horas de estudo, melhor tende a ser o desempenho.

par(bg ="skyblue")
par(cex = 0.9)
plot(Questionario_Estresse$Desempenho, Questionario_Estresse$Horas_estudo, pch=19, col="yellow",
     main = "Gráfico - Diagrama de dispersão entre desempenho e horas de estudo",
     ylab = "Horas de estudo", xlab = "Desempenho")
abline(lsfit(Questionario_Estresse$Desempenho, Questionario_Estresse$Horas_estudo),col="darkblue")

Resultados:

As variáveis desempenho e horas de estudo apresentam uma correlação linear positiva fraca, em outras palavras, é fraco o impacto que a váriavel horas de estudo causa na variável desempenho. Em suma, a teoria “quanto mais horas de estudo, melhor tende a ser o desempenho” tende a uma relação fraca, apesar de apresentar alguns outliers, alguns estudantes possuem mais de 50 horas de estudo e apresentam uma nota de desempenho maior que 9, porém menor que 10.

Passo 3 - Matriz de correlação

Variáveis utilizadas: Desempenho e Horas_estudo.

selecao <- c("Desempenho", "Horas_estudo")

cor_questionario <- cor(Questionario_Estresse[,selecao])
cor_questionario
##              Desempenho Horas_estudo
## Desempenho    1.0000000    0.2231532
## Horas_estudo  0.2231532    1.0000000

Visualização da matriz de correlação em dois modelos

modelo 1:

library(corrplot)
## corrplot 0.92 loaded
par(cex = 1)
corrplot(cor_questionario, method = "number")

modelo 2:

par(cex = 1)
corrplot.mixed(cor_questionario)

Resultados da matriz de correlação:

A correlação na matriz apresenta uma associação positiva (0,22) entre as variáveis, porém é uma associação positiva linear fraca entre as variáveis desempenho e horas de estudo.

 

Conclusão:

Essa atividade tem como finalidade a análise do cruzamento de duas variáveis quantitativas, a criação de um diagrama de dispersão e uma matriz de correlação entre as variáveis.