Introdução
Atividade referente à disciplina de estatística aplicada às ciências humanas e sociais, da turma de administração pública, 2021.2.
Atividade 06: Fazer um documento do RMarkdown, interpretar as estatísticas abaixo e fazer uma publicação no rpubs:
1. Diagrama de dispersão de duas variáveis quantitativas;
2. Matriz de Correlação de duas variáveis quantitativas.
Passo 1 - Carregando a base de dados
Carregando a base de dados que Questionario_Estresse, a qual será utilizada nessa atividade.
library(readxl)
Questionario_Estresse <- read_excel("C:/Users/julia/Base_de_dados-master/Questionario_Estresse.xls")Passo 2 - Gráfico de dispersão
Variáveis utilizadas: Desempenho e Horas_estudo.
teoria: quanto mais horas de estudo, melhor tende a ser o desempenho.
par(bg ="skyblue")
par(cex = 0.9)
plot(Questionario_Estresse$Desempenho, Questionario_Estresse$Horas_estudo, pch=19, col="yellow",
main = "Gráfico - Diagrama de dispersão entre desempenho e horas de estudo",
ylab = "Horas de estudo", xlab = "Desempenho")
abline(lsfit(Questionario_Estresse$Desempenho, Questionario_Estresse$Horas_estudo),col="darkblue")Resultados:
As variáveis desempenho e horas de estudo apresentam uma correlação linear positiva fraca, em outras palavras, é fraco o impacto que a váriavel horas de estudo causa na variável desempenho. Em suma, a teoria “quanto mais horas de estudo, melhor tende a ser o desempenho” tende a uma relação fraca, apesar de apresentar alguns outliers, alguns estudantes possuem mais de 50 horas de estudo e apresentam uma nota de desempenho maior que 9, porém menor que 10.
Passo 3 - Matriz de correlação
Variáveis utilizadas: Desempenho e Horas_estudo.
selecao <- c("Desempenho", "Horas_estudo")
cor_questionario <- cor(Questionario_Estresse[,selecao])
cor_questionario## Desempenho Horas_estudo
## Desempenho 1.0000000 0.2231532
## Horas_estudo 0.2231532 1.0000000
Visualização da matriz de correlação em dois modelos
modelo 1:
library(corrplot)## corrplot 0.92 loaded
par(cex = 1)
corrplot(cor_questionario, method = "number")modelo 2:
par(cex = 1)
corrplot.mixed(cor_questionario)Resultados da matriz de correlação:
A correlação na matriz apresenta uma associação positiva (0,22) entre as variáveis, porém é uma associação positiva linear fraca entre as variáveis desempenho e horas de estudo.
Conclusão:
Essa atividade tem como finalidade a análise do cruzamento de duas variáveis quantitativas, a criação de um diagrama de dispersão e uma matriz de correlação entre as variáveis.