Passo carregar banco de dados

 library(readxl)
     QE <- read_excel("C:/Users/andre/Desktop/Unirio 2020.1/5f - Estatistica - Steven/Base_de_dados-master/Questionario_Estresse.xls")
     summary(QE)
##      Aluno          Turma         Mora_pais           RJ          Namorado_a   
##  Min.   : 1.0   Min.   :1.000   Min.   :1.000   Min.   :1.000   Min.   :1.000  
##  1st Qu.:24.5   1st Qu.:1.000   1st Qu.:1.000   1st Qu.:1.000   1st Qu.:1.000  
##  Median :48.0   Median :2.000   Median :2.000   Median :2.000   Median :2.000  
##  Mean   :48.0   Mean   :2.074   Mean   :1.537   Mean   :1.653   Mean   :1.505  
##  3rd Qu.:71.5   3rd Qu.:3.000   3rd Qu.:2.000   3rd Qu.:2.000   3rd Qu.:2.000  
##  Max.   :95.0   Max.   :3.000   Max.   :2.000   Max.   :2.000   Max.   :2.000  
##                                                                                
##     Trabalha       Desempenho       Estresse        Créditos    
##  Min.   :1.000   Min.   :5.820   Min.   :12.00   Min.   :15.00  
##  1st Qu.:1.000   1st Qu.:8.500   1st Qu.:22.50   1st Qu.:23.00  
##  Median :2.000   Median :8.700   Median :27.00   Median :24.00  
##  Mean   :1.621   Mean   :8.594   Mean   :27.82   Mean   :24.95  
##  3rd Qu.:2.000   3rd Qu.:9.050   3rd Qu.:33.00   3rd Qu.:27.00  
##  Max.   :2.000   Max.   :9.700   Max.   :44.00   Max.   :49.00  
##                                                  NA's   :1      
##   Horas_estudo  
##  Min.   :19.00  
##  1st Qu.:25.00  
##  Median :30.00  
##  Mean   :30.73  
##  3rd Qu.:35.00  
##  Max.   :60.00  
## 

Passo 2 - transformação de variáveis

QE$Mora_pais <-ifelse(QE$Mora_pais==1,"Sim","Não")
     QE$RJ <-ifelse(QE$RJ==1,"Sim","Não")
     QE$Namorado_a <-ifelse(QE$Namorado_a==1,"Sim","Não")
     QE$Trabalha <-ifelse(QE$Trabalha==1,"Sim","Não")
     QE$Turma <-as.factor(QE$Turma) # como variavel qualitativa for
     summary(QE) # resumo
##      Aluno      Turma   Mora_pais              RJ             Namorado_a       
##  Min.   : 1.0   1:28   Length:95          Length:95          Length:95         
##  1st Qu.:24.5   2:32   Class :character   Class :character   Class :character  
##  Median :48.0   3:35   Mode  :character   Mode  :character   Mode  :character  
##  Mean   :48.0                                                                  
##  3rd Qu.:71.5                                                                  
##  Max.   :95.0                                                                  
##                                                                                
##    Trabalha           Desempenho       Estresse        Créditos    
##  Length:95          Min.   :5.820   Min.   :12.00   Min.   :15.00  
##  Class :character   1st Qu.:8.500   1st Qu.:22.50   1st Qu.:23.00  
##  Mode  :character   Median :8.700   Median :27.00   Median :24.00  
##                     Mean   :8.594   Mean   :27.82   Mean   :24.95  
##                     3rd Qu.:9.050   3rd Qu.:33.00   3rd Qu.:27.00  
##                     Max.   :9.700   Max.   :44.00   Max.   :49.00  
##                                                     NA's   :1      
##   Horas_estudo  
##  Min.   :19.00  
##  1st Qu.:25.00  
##  Median :30.00  
##  Mean   :30.73  
##  3rd Qu.:35.00  
##  Max.   :60.00  
## 

Passo 3 - Construção de tabelas

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
# Não é natural do RJ precisa trabalhar
tabela1 <- QE %>% select(RJ, Trabalha) %>% table() 
round(prop.table(tabela1,1)*100,1)
##      Trabalha
## RJ     Não  Sim
##   Não 64.5 35.5
##   Sim 57.6 42.4
#mora_pais não precisa trabalhar
tabela2 <- QE%>% select(Mora_pais,Trabalha) %>% table

round(prop.table(tabela2,1)*100,1)
##          Trabalha
## Mora_pais  Não  Sim
##       Não 62.7 37.3
##       Sim 61.4 38.6

Passo 4 - Contrução de gráfico

barplot(tabela1, beside=TRUE,
        col=c("red","blue"),
        main="análise bivariada",
        horiz = TRUE,
        legend =TRUE)

png("meu_grafico_de_barras2.png",width = 800, height = 600, units = "px")
barplot(tabela2)

Análise de uma variável quantitativa e uma variável categórica

QE %>% group_by(Trabalha) %>%
   summarise(media=mean(Horas_estudo),
             mediana= median(Horas_estudo),
             DP=sd(Horas_estudo),
             tamanho=n())
## # A tibble: 2 x 5
##   Trabalha media mediana    DP tamanho
##   <chr>    <dbl>   <dbl> <dbl>   <int>
## 1 Não       31.6      30  6.93      59
## 2 Sim       29.4      30  7.72      36

Conclusão

Devemos permitir que o aluno trabalhe, pois realizar atividades fora das aulas não interfere no rendimento e nas notas finais.