A seguir, são apresentados o script, os diagramas de dispersão e boxplot, o resumo numérico e a matriz de correlação.
#Carrega o rcmdr:
library(Rcmdr)
## Loading required package: splines
## Loading required package: RcmdrMisc
## Loading required package: car
## Loading required package: carData
## Loading required package: sandwich
## Loading required package: effects
## lattice theme set by effectsTheme()
## See ?effectsTheme for details.
## The Commander GUI is launched only in interactive sessions
##
## Attaching package: 'Rcmdr'
## The following object is masked from 'package:car':
##
## Confint
#Carrega a base de dados:
df_estresse <-
readXL("C:/Users/rianm/Documents/Rian/Mestrado_UFF/Estatistica/Base_de_dados-master/Questionario_Estresse.xls",
rownames=FALSE, header=TRUE, na="", sheet="Dados", stringsAsFactors=TRUE)
#Transforma a variável numérica "Trabalha" em fator:
df_estresse <- within(df_estresse, {
Trabalha <- factor(Trabalha, labels=c('Sim','Não'))
})
#Gera o boxplot:
par(bg="#fffbe2")
boxplot(Horas_estudo~Trabalha, data=df_estresse, id=list(method="y"), col= c("#a8382b", "#2ba899"), ylab="Horas de estudo", xlab="Trabalha", main="Boxplot Trabalha vs Horas de Estudo")
#Exclui os outliers:
df_estresse <- df_estresse[-c(10, 14),]
#Gera o resumo numérico:
library(abind, pos=16)
library(e1071, pos=17)
numSummary(df_estresse[,"Horas_estudo", drop=FALSE],
groups=df_estresse$Trabalha, statistics=c("mean", "sd", "quantiles"),
quantiles=c(0,.25,.5,.75,1))
## mean sd 0% 25% 50% 75% 100% Horas_estudo:n
## Sim 28.51429 5.893024 19 24.5 30 33.00 40 35
## Não 31.06897 5.866533 20 28.0 30 34.75 44 58
#Gera o diagrama de dispersão:
par(bg="#fffbe2")
scatterplot(Desempenho~Estresse, regLine=TRUE, smooth=FALSE, xlab="Estresse",
ylab="Desempenho", boxplots='xy', data=df_estresse, pch=19, col=c("brown", "red", "black"),
main="Gráfico de Dispersão: \nDesempenho vs Estresse", lty=2, lwd=3)
#Gera a Matriz de Correlação
library(corrplot)
## corrplot 0.84 loaded
MC <- cor(df_estresse[,c("Desempenho","Estresse")], use="complete")
corrplot.mixed(MC, lower.col="black", upper="square")
Analisando a relação das variáveis “trabalha” e “horas de estudo” por meio do diagrama boxplot, nota-se que a mediana é de 30 horas de estudo semanais tanto para os estudantes que trabalham, quanto para aqueles que não trabalham. Os estudantes que trabalham apresentam uma distribuição de horas de estudo de levemente assimétrica e negativa, enquanto aqueles não trabalham apresentam distribuição fortemente assimétrica e positiva. O boxplot ainda indica uma variabilidade maior nos dados dos estudantes que não trabalham, bem como a ocorrência de outliers com 59 horas de estudo entre os estudantes que trabalham, e 60 horas entre aqueles que não trabalham.
Após a exclusão dos outliers, o resumo numérico indica que os valores mínimos de horas de estudo foram de 19 horas entre os estudantes que trabalham, e 20 horas entre os que não trabalham. Já os máximos registrados foram de 40 horas entre os que trabalham e 44 horas entre os que não trabalham. Desta maneira, conclui-se que a amplitude das horas de estudo entre os que trabalham é de 21 horas, contra 24 horas daqueles que não trabalham, reforçando assim, a maior variabilidade no tempo de estudo deste segundo grupo.
Analisando a relação entre as variáveis “desempenho” e “estresse” por meio do diagrama de dispersão, nota-se a ocorrência de uma correlação positiva fraca, indicando a tendência de uma leve melhora de desempenho a medida que o estresse do estudante aumenta. Os boxplots marginais indicam valores de mediana em torno de 8,8 para o desempenho, e 27 para o nível de estresse dos estudantes. O boxplot de desempenho ainda indica a ocorrência de 9 outliers*, os quais atingiram um rendimento acadêmico inferior aos demais estudantes.
Por fim, os resultados apresentados pela matriz de dispersão revelam um coeficiente de correlação de 0,08 entre o desempenho e o estresse, o que justifica a baixa interferência do estresse na melhoria de rendimento dos alunos.
Obs: Existem 2 outliers sobrepostos com desempenho igual a 7.