Desenvolvimento da Aula

1) Carregar base

library(readxl)
QE <- read_excel("C:/Users/loren/Downloads/Estatistica/Base_de_dados-master/Questionario_Estresse.xls")

2) Transformando dados

Usamos a função Summary para trazer um detalhados dos dados presente na nossa base. Através dela identificamos as variáveis que são qualitativas e transformamos em quantitativas.

summary(QE)
##      Aluno          Turma         Mora_pais           RJ          Namorado_a   
##  Min.   : 1.0   Min.   :1.000   Min.   :1.000   Min.   :1.000   Min.   :1.000  
##  1st Qu.:24.5   1st Qu.:1.000   1st Qu.:1.000   1st Qu.:1.000   1st Qu.:1.000  
##  Median :48.0   Median :2.000   Median :2.000   Median :2.000   Median :2.000  
##  Mean   :48.0   Mean   :2.074   Mean   :1.537   Mean   :1.653   Mean   :1.505  
##  3rd Qu.:71.5   3rd Qu.:3.000   3rd Qu.:2.000   3rd Qu.:2.000   3rd Qu.:2.000  
##  Max.   :95.0   Max.   :3.000   Max.   :2.000   Max.   :2.000   Max.   :2.000  
##                                                                                
##     Trabalha       Desempenho       Estresse        Créditos    
##  Min.   :1.000   Min.   :5.820   Min.   :12.00   Min.   :15.00  
##  1st Qu.:1.000   1st Qu.:8.500   1st Qu.:22.50   1st Qu.:23.00  
##  Median :2.000   Median :8.700   Median :27.00   Median :24.00  
##  Mean   :1.621   Mean   :8.594   Mean   :27.82   Mean   :24.95  
##  3rd Qu.:2.000   3rd Qu.:9.050   3rd Qu.:33.00   3rd Qu.:27.00  
##  Max.   :2.000   Max.   :9.700   Max.   :44.00   Max.   :49.00  
##                                                  NA's   :1      
##   Horas_estudo  
##  Min.   :19.00  
##  1st Qu.:25.00  
##  Median :30.00  
##  Mean   :30.73  
##  3rd Qu.:35.00  
##  Max.   :60.00  
## 
#Transformando Quali em Quanti
QE$Mora_pais <-ifelse(QE$Mora_pais==1,"Sim","Não") #ifeslse = função SE no excel
QE$RJ <-ifelse(QE$RJ==1,"Sim","Não")
QE$Namorado_a <-ifelse(QE$Namorado_a==1,"Sim","Não")
QE$Trabalha <-ifelse(QE$Trabalha==1,"Sim","Não")
QE$Turma <- as.factor(QE$Turma)

3) Contruindo as tabelas

Depois de ajustarmos as conversões, começamos a contruir as tabelas. Para esse passo antes instalamos o pacote Dplyr.

Feito essa instalação, nós usamos uma nova forma de chamar tabela e aprendemos a função piper (%>%).

library(dplyr)
## Warning: package 'dplyr' was built under R version 4.0.5
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
# Tese 01, quem não é natural do Rio de Janeiro, precisa trabalhar
tabela1 <- QE %>% select(RJ, Trabalha) %>% table()

round(prop.table(tabela1,1)*100,1) 
##      Trabalha
## RJ     Não  Sim
##   Não 64.5 35.5
##   Sim 57.6 42.4
#Tabela de proporção, o vírgula 1 indica que dará 100% na linha.
#Round = Arredondar

round(prop.table(tabela1,2)*100,1) 
##      Trabalha
## RJ     Não  Sim
##   Não 67.8 61.1
##   Sim 32.2 38.9
#Tabela de proporção, o vírgula 2 indica que dará 100% na coluna.
#Round = Arredondar

# Tese 02, quem mora com os pais não precisa trabalahr
tabela2 <- QE %>% select(Mora_pais, Trabalha) %>% table()
tabela2
##          Trabalha
## Mora_pais Não Sim
##       Não  32  19
##       Sim  27  17
prop.table(tabela2,1)
##          Trabalha
## Mora_pais       Não       Sim
##       Não 0.6274510 0.3725490
##       Sim 0.6136364 0.3863636
round(prop.table(tabela2,1)*100,1) 
##          Trabalha
## Mora_pais  Não  Sim
##       Não 62.7 37.3
##       Sim 61.4 38.6
prop.table(tabela2,2)
##          Trabalha
## Mora_pais       Não       Sim
##       Não 0.5423729 0.5277778
##       Sim 0.4576271 0.4722222
round(prop.table(tabela2,2)*100,1) 
##          Trabalha
## Mora_pais  Não  Sim
##       Não 54.2 52.8
##       Sim 45.8 47.2

4) Contruindo os gráficos

Após a contrução das tabelas cehgou a hra se montar os nossos gráficos:

# Tese 01, quem não é natural do Rio de Janeiro, precisa trabalhar
tabela1 <- QE %>% select(RJ, Trabalha) %>% table()

round(prop.table(tabela1,1)*100,1) 
##      Trabalha
## RJ     Não  Sim
##   Não 64.5 35.5
##   Sim 57.6 42.4
#Tabela de proporção, o vírgula 1 indica que dará 100% na linha.
#Round = Arredondar

round(prop.table(tabela1,2)*100,1) 
##      Trabalha
## RJ     Não  Sim
##   Não 67.8 61.1
##   Sim 32.2 38.9
#Tabela de proporção, o vírgula 2 indica que dará 100% na coluna.
#Round = Arredondar

barplot(tabela1,beside= TRUE,
        col=c("purple", "navy"),
        main= "Análise Bivariada",
        horiz = TRUE,
        legend = TRUE)

# Tese 02, quem mora com os pais não precisa trabalahr
tabela2 <- QE %>% select(Mora_pais, Trabalha) %>% table()
tabela2
##          Trabalha
## Mora_pais Não Sim
##       Não  32  19
##       Sim  27  17
prop.table(tabela2,1)
##          Trabalha
## Mora_pais       Não       Sim
##       Não 0.6274510 0.3725490
##       Sim 0.6136364 0.3863636
round(prop.table(tabela2,1)*100,1) 
##          Trabalha
## Mora_pais  Não  Sim
##       Não 62.7 37.3
##       Sim 61.4 38.6
prop.table(tabela2,2)
##          Trabalha
## Mora_pais       Não       Sim
##       Não 0.5423729 0.5277778
##       Sim 0.4576271 0.4722222
round(prop.table(tabela2,2)*100,1) 
##          Trabalha
## Mora_pais  Não  Sim
##       Não 54.2 52.8
##       Sim 45.8 47.2
barplot(tabela2,beside= TRUE,
        col=c("purple", "navy"),
        main= "Análise Bivariada - tabela 2",
        legend = TRUE)

Análise de uma variável Quantitativa e uma variável Catagórica

QE %>% group_by(Trabalha) %>% 
  summarise(media=mean(Desempenho),
            desvio_padrao=sd(Desempenho),
            tamanho=n())
## # A tibble: 2 x 4
##   Trabalha media desvio_padrao tamanho
##   <chr>    <dbl>         <dbl>   <int>
## 1 Não       8.63         0.698      59
## 2 Sim       8.54         0.896      36
QE %>% group_by(Trabalha) %>% 
  summarise(media=mean(Horas_estudo),
            mediana=median(Horas_estudo),
            desvio_padrao=sd(Horas_estudo),
            tamanho=n())
## # A tibble: 2 x 5
##   Trabalha media mediana desvio_padrao tamanho
##   <chr>    <dbl>   <dbl>         <dbl>   <int>
## 1 Não       31.6      30          6.93      59
## 2 Sim       29.4      30          7.72      36

Conclusão:

Devemos permitri que o aluno trabalhe.

FIM