passo 1 - carregar o banco de dados

library(readxl)
QE <- read_excel("C:/Users/thaya/Desktop/Base_de_dados-master/Questionario_Estresse.xls")
View(QE)

passo 2 - transformação de variáveis

QE$Mora_pais <- ifelse(QE$Mora_pais==1, "Sim", "Não")
QE$RJ <- ifelse(QE$RJ==1, "Sim", "Não")
QE$Namorado_a <-ifelse(QE$Namorado_a==1, "Sim", "Não")
QE$Trabalha <- ifelse(QE$Trabalha==1, "Sim", "Não")
QE$Turma <- as.factor(QE$Turma)

passo 3 - construção das tabelas

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
# Primeira hipótese: quem não é natural do RJ precisa trabalhar 
tabela1 <- QE %>% select(RJ, Trabalha) %>% table()
tabela1
##      Trabalha
## RJ    Não Sim
##   Não  40  22
##   Sim  19  14
round (prop.table(tabela1,1)*100,1) #com o ",1" soma de 100% na linha
##      Trabalha
## RJ     Não  Sim
##   Não 64.5 35.5
##   Sim 57.6 42.4
round(prop.table(tabela1,2)*100,1) #com o "2" soma de 100% na coluna
##      Trabalha
## RJ     Não  Sim
##   Não 67.8 61.1
##   Sim 32.2 38.9
#Segunda hipótese: quem mora com os pais não precisa trabalhar

tabela2 <- QE %>% select(Mora_pais, Trabalha) %>% table()
tabela2
##          Trabalha
## Mora_pais Não Sim
##       Não  32  19
##       Sim  27  17
prop.table(tabela2,1)*100
##          Trabalha
## Mora_pais      Não      Sim
##       Não 62.74510 37.25490
##       Sim 61.36364 38.63636

passo 4 - construção do gráfico

barplot(tabela1, beside = TRUE,
        col = c("red", "blue"),
        main = "análise bivariada",
        horiz = TRUE,
        legend=TRUE)

Análise de uma variável quantitativa e uma variável categórica

library(dplyr)
QE %>% group_by(Trabalha) %>%
  summarise(media=mean(Desempenho),
            desvio_padrao=sd(Desempenho), 
            tamanho=n())
## # A tibble: 2 x 4
##   Trabalha media desvio_padrao tamanho
##   <chr>    <dbl>         <dbl>   <int>
## 1 Não       8.63         0.698      59
## 2 Sim       8.54         0.896      36
QE %>% group_by(Trabalha) %>%
  summarise(media=mean(Horas_estudo),
            mediana=median(Horas_estudo),
            dp=sd(Horas_estudo),
            tamanho = n() )
## # A tibble: 2 x 5
##   Trabalha media mediana    dp tamanho
##   <chr>    <dbl>   <dbl> <dbl>   <int>
## 1 Não       31.6      30  6.93      59
## 2 Sim       29.4      30  7.72      36

Conclusão

Devemos permitir que o alune trabalhe.