library(readxl)
QE <- read_excel("Desktop/Materia de estatistica/Base_de_dados-master/Questionario_Estresse.xls")
QE$Mora_pais <-ifelse(QE$Mora_pais==1,'Sim','Não')
QE$RJ <-ifelse(QE$RJ==1,'Sim','Não')
QE$Namorado_a <-ifelse(QE$Namorado_a==1,'Sim','Não')
QE$Trabalha <-ifelse(QE$Trabalha==1,'Sim','Não')
QE$Turma <-as.factor(QE$Turma)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
# Não é natural do RJ precisa trabalhar
tabela1 <- QE %>% select(RJ, Trabalha) %>% table()
round(prop.table(tabela1,1)*100,1)
## Trabalha
## RJ Não Sim
## Não 64.5 35.5
## Sim 57.6 42.4
round(prop.table(tabela1,2)*100,1)
## Trabalha
## RJ Não Sim
## Não 67.8 61.1
## Sim 32.2 38.9
#mora_pais não precisa trabalhar
tabela2 <- QE %>% select(Mora_pais,Trabalha) %>% table()
prop.table(tabela2,1)*100
## Trabalha
## Mora_pais Não Sim
## Não 62.74510 37.25490
## Sim 61.36364 38.63636
barplot(tabela1,beside=TRUE,
col=c('pink','blue'),
main='Análise bivariada',
horiz=TRUE,
legend=TRUE)
library(dplyr)
QE %>% group_by(Trabalha) %>%
summarise(media=mean(Desempenho),
desvio_padrao=sd(Desempenho),
tamanho=n())
## # A tibble: 2 x 4
## Trabalha media desvio_padrao tamanho
## <chr> <dbl> <dbl> <int>
## 1 Não 8.63 0.698 59
## 2 Sim 8.54 0.896 36
# Horas de estudo
# Trabalha
QE %>% group_by(Trabalha) %>%
summarise(media=mean(Horas_estudo),
mediana=median(Horas_estudo),
DP=sd(Horas_estudo),
tamanho=n())
## # A tibble: 2 x 5
## Trabalha media mediana DP tamanho
## <chr> <dbl> <dbl> <dbl> <int>
## 1 Não 31.6 30 6.93 59
## 2 Sim 29.4 30 7.72 36
Devemos permitir que o aluno trabalhe