Passo 1 - Carregar o banco de dados

library(readxl)
QE <- read_excel("Desktop/Materia de estatistica/Base_de_dados-master/Questionario_Estresse.xls")

Passo 2 - Transformação das variáveis

QE$Mora_pais <-ifelse(QE$Mora_pais==1,'Sim','Não')
QE$RJ <-ifelse(QE$RJ==1,'Sim','Não')
QE$Namorado_a <-ifelse(QE$Namorado_a==1,'Sim','Não')
QE$Trabalha <-ifelse(QE$Trabalha==1,'Sim','Não')
QE$Turma <-as.factor(QE$Turma)

Passo 3 - Construção das Tabelas

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
# Não é natural do RJ precisa trabalhar
tabela1 <- QE %>% select(RJ, Trabalha) %>% table()
round(prop.table(tabela1,1)*100,1)
##      Trabalha
## RJ     Não  Sim
##   Não 64.5 35.5
##   Sim 57.6 42.4
round(prop.table(tabela1,2)*100,1)
##      Trabalha
## RJ     Não  Sim
##   Não 67.8 61.1
##   Sim 32.2 38.9
#mora_pais não precisa trabalhar
tabela2 <- QE %>% select(Mora_pais,Trabalha) %>% table()
prop.table(tabela2,1)*100
##          Trabalha
## Mora_pais      Não      Sim
##       Não 62.74510 37.25490
##       Sim 61.36364 38.63636

Passo 4 - Construção Gráfico

barplot(tabela1,beside=TRUE,
        col=c('pink','blue'),
        main='Análise bivariada',
        horiz=TRUE,
        legend=TRUE)

Análise de uma variável quatidade e uma variável categórica

library(dplyr)
QE %>% group_by(Trabalha) %>%
  summarise(media=mean(Desempenho),
            desvio_padrao=sd(Desempenho),
            tamanho=n())
## # A tibble: 2 x 4
##   Trabalha media desvio_padrao tamanho
##   <chr>    <dbl>         <dbl>   <int>
## 1 Não       8.63         0.698      59
## 2 Sim       8.54         0.896      36
# Horas de estudo
# Trabalha

QE %>% group_by(Trabalha) %>%
  summarise(media=mean(Horas_estudo),
            mediana=median(Horas_estudo),
            DP=sd(Horas_estudo),
            tamanho=n())
## # A tibble: 2 x 5
##   Trabalha media mediana    DP tamanho
##   <chr>    <dbl>   <dbl> <dbl>   <int>
## 1 Não       31.6      30  6.93      59
## 2 Sim       29.4      30  7.72      36

Conclusão

Devemos permitir que o aluno trabalhe