#Introdução

#carregando base de dados
library(readxl)
Questionario_Estresse <- read_excel("Base_de_dados-master/Questionario_Estresse.xls")
View(Questionario_Estresse)

#Transformação

#Transformando base de dados
Questionario_Estresse$Mora_pais <-ifelse(Questionario_Estresse$Mora_pais==1,"Mora","Não Mora")
Questionario_Estresse$RJ <-ifelse(Questionario_Estresse$RJ==1,"sim","não")
Questionario_Estresse$Namorado_a <-ifelse(Questionario_Estresse$Namorado_a==1,"namora","não namora")
Questionario_Estresse$Trabalha <-ifelse(Questionario_Estresse$Trabalha==1,"sim","não")

#Hipótese

#Os alunos que moram com os pais teriam um desempenho melhor?

#Média, mediana e desvio padrão (Desempenho X Moram com os pais)

library(dplyr)
library(flextable)
library(reactable)

Questionario_Estresse %>% select(Desempenho,Mora_pais) %>% group_by(Mora_pais) %>% summarise(Mínimo=min(Desempenho),Mediana=median(Desempenho),Media=round(mean(Desempenho),2),desvio_padrão=round(sd(Desempenho),2),Máximo= max(Desempenho)) %>% flextable() %>% theme_zebra()

#BOX-PLOT

summary(Questionario_Estresse$Desempenho)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   5.820   8.500   8.700   8.594   9.050   9.700
summary(Questionario_Estresse$Mora_pais)
##    Length     Class      Mode 
##        95 character character
boxplot(Questionario_Estresse$Desempenho~Questionario_Estresse$Mora_pais, col=c("lightgreen","lightblue"),main= "Desempenho X Mora/pais",xlab = "Moram com os pais",ylab = "Desempenho")

#Conclusão

Analisando a base de dados “Questionário estresse” sobre variáveis quantitativas X qualitativas, podemos observar alguns resultados estatísticos. Partindo por uma hipótese de que, os alunos que morassem junto com os seus pais teriam um maior desempenho, visto que, alguns serviços domésticos seriam divididos entre seus familiares, diferentemente de um estudante que mora sozinho.

Em um primeiro momento foi retirada a média, mediana e o desvio padrão em cima das variáveis de “desempenho” e “mora_pais”. Observa-se que a média entre elas é quase que a mesma e tendo um desvio padrão bem próximo. Desta maneira, conseguimos perceber que morar com os pais não influencia totalmente no desempenho do aluno.

Para uma melhor interpretação do resultado foi criado um Box-Plot. No qual, no eixo X temos a variável “mora com os pais” e no eixo Y a variável “Desempenho”. Com isso, temos duas medianas bem próximas. Também temos alguns Outliers, que são pontos fora da curva.