#cARREGANDO BASE DE DADOS

library(readxl)
Questionario_Estresse <- read_excel("C:/Users/npm25/Desktop/Base_de_dados-master/Questionario_Estresse.xls")

#TRANSFORMANDO VARIAVEL

Questionario_Estresse$Mora_pais<-ifelse(Questionario_Estresse$Mora_pais==1,"sim","nao")
Questionario_Estresse$Trabalha<-ifelse(Questionario_Estresse$Trabalha==1,"sim","nao")

##Hipotese #1- OS ALUNOS QUE TRABALHAM TEM DESEMPENHO MENOR

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(flextable)

Questionario_Estresse %>% select(Trabalha,Desempenho) %>%
 group_by(Trabalha) %>%
  summarise(
    Mediana=median(Desempenho),
    Média=round(mean(Desempenho),2),
    Desvio_Padrao=round(sd(Desempenho),2)) %>%
  flextable() %>% theme_alafoli()

NESSE BANCO DE DADOS, OS ALUNOS QUE TRABALHAM TEM DESEMPENHO MENOR

#BOXPLOT

boxplot(Questionario_Estresse$Desempenho ~ Questionario_Estresse$Trabalha,
        col=c("GREEN","RED"), main="Gráfico 1 - Relação Trabalho/Desempenho",
        xlab ="DESEMPENHO",
        ylab ="TRABALHA")

PRIMEIRAMENTE, CARREGUEI A BASE DE DADOS DO EXCEL;LOGO APÓS TRANSFORMEI AS VARIAVEIS ´´TRABALHA´´ E ´´DESEMPENHO´´. MINHA HIPOTESE É DE QUE ALUNOS QUE TRABALHAM TEM DESEMPENHO MENOR DO QUE AQUELES QUE NÃO TRABALHAM.PARA COMPROVAR OU NÃO SEGUI ALGUNS PASSOS:CALCULEI A MÉDIA,A MEDIANA E O DESVIO PADRÃO.A HIPOTESE CITADA SE COMPROVOU, POIS A MÉDIA DOS QUE TRABALHAM É MENOR (8,54), COMPARADA A MÉDIA DOS QUE NÃO TRABALHAM (8,63).A DIFERENÇA DO DESVIO PADRÃO DE UM PARA O OUTRO É DE 0,2. PARA FINALIZAR, CRIEI UM GRÁFICO BOXPLOT, ONDE ELUCIDA ESSA VARIAÇÃO.