Análise Variáveis

Análise Variáveis Quali x Quanti

Gráfico Boxplot
library(readxl)
Questionario_Estresse <- read_excel("C:/Users/lab02/Desktop/Base_de_dados-master/Questionario_Estresse.xls")
library(corrplot)
## corrplot 0.84 loaded
library(RcmdrMisc)
## Loading required package: car
## Loading required package: carData
## Loading required package: sandwich
#Boxplot

Questionario_Estresse <- within(Questionario_Estresse, {
  Mora_pais <- factor(Mora_pais, labels=c('Sim','Não'))
})

par(bg="#dbbda2")
boxplot(Estresse~Mora_pais, data=Questionario_Estresse, id=list(method="y"), col= c("#b351bc", "#8f0bed"), ylab="Estresse", xlab="Mora com os pais", main="Relação Estresse com Morar com os pais")

Observando o diagrama Boxplot gerado em função das variáveis Estresse e Mora com os pais, percebe-se a mediana é de 27,5 pontos em nível de estresse para os estudantes que moram com os pais e de 27 pontos para os que não moram com os pais. Porém os estudantes que moram com os pais apresentam uma distribuição de pontos de estresse levemente assimétrica e negativa, enquanto aqueles não trabalham apresentam distribuição assimétrica e positiva.

Tabela Resumo
library(abind, pos=16)
library(e1071, pos=17)
numSummary(Questionario_Estresse[,"Estresse", drop=FALSE], 
  groups=Questionario_Estresse$Mora_pais, statistics=c("mean", "sd", "quantiles"), 
  quantiles=c(0,.25,.5,.75,1))
##         mean       sd 0% 25%  50%   75% 100% Estresse:n
## Sim 28.11364 7.160018 12  24 27.5 32.25   44         44
## Não 27.56863 7.915188 13  21 27.0 33.00   44         51

O resumo numérico indica que os valores mínimos de pontos de estresse foram de 12 pontos entre os estudantes que moram com os pais, e de 13 pontos entre os que não moram com os pais. Já os máximos registrados foram de 44 pontos entre os que moram com os pais e o mesmo valor para os que não moram com os pais. Portanto, percebe-se que a variação do nível de estresse entre s alunos não sofre grande alteração quando estes moram ou não com os pais.

Análise Variáveis Quati x Quanti

Diagrama de Dispersão

par(bg="#dbbda2")
scatterplot(Horas_estudo~Estresse, regLine=TRUE, smooth=FALSE, xlab="Estresse",
  ylab="Horas_estudo", boxplots='xy', data=Questionario_Estresse, pch=19, col=c("#3d3a37", "#d11944", "#271cef"), 
  main="Gráfico de Dispersão: Relação Horas de Estudo com Estresse", lty=2, lwd=3)

Pelo gráfico de dispersão gerado em função das variáveis Estresse e Horas de Estudo, observamos uma simetria, no íncio do gráfico o nível de estresse é baixo e os alunos estudam pouco. No centro o nível de estresse é médio e as horas de estudo são as mais elevadas, por fim,o nível de estresse mais alta contempla horas de estudos baixas novamente.

Matriz de Correlação

library(corrplot)
par(bg="#dbbda2")
MC<-cor(Questionario_Estresse[,c("Horas_estudo","Estresse","Desempenho","Créditos")], use="complete")
corrplot(MC,method="square")

Por fim, os resultados apresentados pela matriz de correlação revelam que os alunos que possuem o nível de estresse em 0.2 tem um desempenho ruim e possuem poucos créditos. Enquanto que alunos com o nível de estresse 0.4 possuem um desempenho razoável e um número maior de créditos.