library(readxl)
QE <- read_excel("C:/Users/thaya/Desktop/Base_de_dados-master/Questionario_Estresse.xls")
View(QE)
QE$Mora_pais <- ifelse(QE$Mora_pais==1, "Sim", "Não")
QE$RJ <- ifelse(QE$RJ==1, "Sim", "Não")
QE$Namorado_a <-ifelse(QE$Namorado_a==1, "Sim", "Não")
QE$Trabalha <- ifelse(QE$Trabalha==1, "Sim", "Não")
QE$Turma <- as.factor(QE$Turma)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
# Primeira hipótese: quem não é natural do RJ precisa trabalhar
tabela1 <- QE %>% select(RJ, Trabalha) %>% table()
tabela1
## Trabalha
## RJ Não Sim
## Não 40 22
## Sim 19 14
round (prop.table(tabela1,1)*100,1) #com o ",1" soma de 100% na linha
## Trabalha
## RJ Não Sim
## Não 64.5 35.5
## Sim 57.6 42.4
round(prop.table(tabela1,2)*100,1) #com o "2" soma de 100% na coluna
## Trabalha
## RJ Não Sim
## Não 67.8 61.1
## Sim 32.2 38.9
#Segunda hipótese: quem mora com os pais não precisa trabalhar
tabela2 <- QE %>% select(Mora_pais, Trabalha) %>% table()
tabela2
## Trabalha
## Mora_pais Não Sim
## Não 32 19
## Sim 27 17
prop.table(tabela2,1)*100
## Trabalha
## Mora_pais Não Sim
## Não 62.74510 37.25490
## Sim 61.36364 38.63636
barplot(tabela1, beside = TRUE,
col = c("red", "blue"),
main = "análise bivariada",
horiz = TRUE,
legend=TRUE)
library(dplyr)
QE %>% group_by(Trabalha) %>%
summarise(media=mean(Desempenho),
desvio_padrao=sd(Desempenho),
tamanho=n())
## # A tibble: 2 x 4
## Trabalha media desvio_padrao tamanho
## <chr> <dbl> <dbl> <int>
## 1 Não 8.63 0.698 59
## 2 Sim 8.54 0.896 36
QE %>% group_by(Trabalha) %>%
summarise(media=mean(Horas_estudo),
mediana=median(Horas_estudo),
dp=sd(Horas_estudo),
tamanho = n() )
## # A tibble: 2 x 5
## Trabalha media mediana dp tamanho
## <chr> <dbl> <dbl> <dbl> <int>
## 1 Não 31.6 30 6.93 59
## 2 Sim 29.4 30 7.72 36
Devemos permitir que o alune trabalhe.