#cARREGANDO BASE DE DADOS
library(readxl)
Questionario_Estresse <- read_excel("C:/Users/npm25/Desktop/Base_de_dados-master/Questionario_Estresse.xls")
#TRANSFORMANDO VARIAVEL
Questionario_Estresse$Mora_pais<-ifelse(Questionario_Estresse$Mora_pais==1,"sim","nao")
Questionario_Estresse$Trabalha<-ifelse(Questionario_Estresse$Trabalha==1,"sim","nao")
##Hipotese #1- OS ALUNOS QUE TRABALHAM TEM DESEMPENHO MENOR
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(flextable)
Questionario_Estresse %>% select(Trabalha,Desempenho) %>%
group_by(Trabalha) %>%
summarise(
Mediana=median(Desempenho),
Média=round(mean(Desempenho),2),
Desvio_Padrao=round(sd(Desempenho),2)) %>%
flextable() %>% theme_alafoli()
Trabalha | Mediana | Média | Desvio_Padrao |
nao | 8.8 | 8.63 | 0.7 |
sim | 8.7 | 8.54 | 0.9 |
#BOXPLOT
boxplot(Questionario_Estresse$Desempenho ~ Questionario_Estresse$Trabalha,
col=c("GREEN","RED"), main="Gráfico 1 - Relação Trabalho/Desempenho",
xlab ="DESEMPENHO",
ylab ="TRABALHA")
PRIMEIRAMENTE, CARREGUEI A BASE DE DADOS DO EXCEL;LOGO APÓS TRANSFORMEI AS VARIAVEIS ´´TRABALHA´´ E ´´DESEMPENHO´´. MINHA HIPOTESE É DE QUE ALUNOS QUE TRABALHAM TEM DESEMPENHO MENOR DO QUE AQUELES QUE NÃO TRABALHAM.PARA COMPROVAR OU NÃO SEGUI ALGUNS PASSOS:CALCULEI A MÉDIA,A MEDIANA E O DESVIO PADRÃO.A HIPOTESE CITADA SE COMPROVOU, POIS A MÉDIA DOS QUE TRABALHAM É MENOR (8,54), COMPARADA A MÉDIA DOS QUE NÃO TRABALHAM (8,63).A DIFERENÇA DO DESVIO PADRÃO DE UM PARA O OUTRO É DE 0,2. PARA FINALIZAR, CRIEI UM GRÁFICO BOXPLOT, ONDE ELUCIDA ESSA VARIAÇÃO.