Aula 05

 

1. gráfico barplot;   
2. média e mediana;   
3. tabelas   
4. função %>%  
5. Quali x Quali

  

Nessa aula utilizamos a base de dados Titanic para provar duas teses, usando variáveis Quali x Quali.

No Titanic:

- É válida a tese "mulheres e crianças primeiro";  
- Há uma desigualdade social da sobrevivência.  

Variável-chave: Sobreviência.
Variável de interesse, variável resposta.

 

Passo 1: carregando base de dados

load("C:/Users/julia/Base_de_dados-master/Titanic.RData")

Passo 2: análise dos quartis das variáveis quantitativas da base pokemon

summary(Titanic)
##         Classe        Idade             Sexo               Sobreviveu  
##  Tripulação:885   criança: 109   Feminino : 470   Não sobreviveu:1490  
##  Primeira  :324   adulto :2091   Masculino:1730   Sobreviveu    : 710  
##  Segunda   :285                                                        
##  Terceira  :706

Passo 3 - Inspecionar os dados

str(Titanic)
## 'data.frame':    2200 obs. of  4 variables:
##  $ Classe    : Factor w/ 4 levels "Tripulação","Primeira",..: 2 2 2 2 2 2 2 2 2 2 ...
##  $ Idade     : Factor w/ 2 levels "criança","adulto": 2 2 2 2 2 2 2 2 2 2 ...
##  $ Sexo      : Factor w/ 2 levels "Feminino","Masculino": 2 2 2 2 2 2 2 2 2 2 ...
##  $ Sobreviveu: Factor w/ 2 levels "Não sobreviveu",..: 2 2 2 2 2 2 2 2 2 2 ...

Passo 4 - gráfico de pizza

pie(table(Titanic$Sobreviveu))

Passo 5 - tabelas

tabela_sexo <- table(Titanic$Sexo,Titanic$Sobreviveu)
tabela_idade <- table(Titanic$Idade, Titanic$Sobreviveu)
tabela_sexo
##            
##             Não sobreviveu Sobreviveu
##   Feminino             126        344
##   Masculino           1364        366
tabela_idade
##          
##           Não sobreviveu Sobreviveu
##   criança             52         57
##   adulto            1438        653

Passo 6 - tabela de proporção

prop.table(tabela_sexo,1)
##            
##             Não sobreviveu Sobreviveu
##   Feminino       0.2680851  0.7319149
##   Masculino      0.7884393  0.2115607
prop.table(tabela_sexo,2)
##            
##             Não sobreviveu Sobreviveu
##   Feminino      0.08456376 0.48450704
##   Masculino     0.91543624 0.51549296
prop.table(tabela_idade,1)*100
##          
##           Não sobreviveu Sobreviveu
##   criança       47.70642   52.29358
##   adulto        68.77092   31.22908
prop.table(tabela_idade,2)*100
##          
##           Não sobreviveu Sobreviveu
##   criança       3.489933   8.028169
##   adulto       96.510067  91.971831

Passo 7: gráfico de barras (barplot)

Primeira tese:
Iremos criar os gráficos para verificar que é válido a tese “mulheres e crianças primeiro”.

Criando o gráfico relacionando a sobrevivência por sexo.

library(RColorBrewer)
brewer.pal(5,"Blues")
## [1] "#EFF3FF" "#BDD7E7" "#6BAED6" "#3182BD" "#08519C"
brewer.pal(2, "Greens")
## Warning in brewer.pal(2, "Greens"): minimal value for n is 3, returning requested palette with 3 different levels
## [1] "#E5F5E0" "#A1D99B" "#31A354"
display.brewer.all() 

Cor <- brewer.pal(2,"Greens")
## Warning in brewer.pal(2, "Greens"): minimal value for n is 3, returning requested palette with 3 different levels
barplot(tabela_sexo, main = "Gráfico 1 - Sobrevivência por sexo",
        col= c(Cor))

COR <- c("#1B9E77", "#D95F02","#1B9E77", "#D95F02")
barplot(tabela_sexo, main = "Gráfico 1 - Sobrevivência por sexo",
        col= COR,
        horiz= FALSE, beside = TRUE,
        legend = rownames(tabela_sexo))

Criando o gráfico relacionando a sobrevivência por idade.

COR2 <- c("red", "blue","red", "blue")
barplot(tabela_idade, main = "Gráfico 2 - Sobrevivência por idade",
        col= COR2,
        horiz= FALSE, beside = TRUE, ylim=c(0,2000),
        legend = rownames(tabela_idade))

Segunda tese: Iremos criar os gráficos para verificar a tese da desigualdade da sobrevivência.

Criamos o gráfico relacionando a sobrevivência as classes.

modo clássico para criar gráfico, tabela e tabela de proporção.

barplot(round(prop.table(table(Titanic$Classe, Titanic$Sobreviveu),1),1))*100

## [1]  70 190

Usando a função %>%

Criando uma tabela em números absolutos com a função %>%

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
tabela_classe <- Titanic %>% select(Classe,Sobreviveu)%>% table()
tabela_classe
##             Sobreviveu
## Classe       Não sobreviveu Sobreviveu
##   Tripulação            673        212
##   Primeira              122        202
##   Segunda               167        118
##   Terceira              528        178

Criando uma tabela de proporção com a função %>%

tabela_classe_prop <- Titanic %>% select(Classe,Sobreviveu)%>% table()%>%
  prop.table(1)%>%round(2)
tabela_classe_prop
##             Sobreviveu
## Classe       Não sobreviveu Sobreviveu
##   Tripulação           0.76       0.24
##   Primeira             0.38       0.62
##   Segunda              0.59       0.41
##   Terceira             0.75       0.25

Criando o barplot por grupos

Usando a função %>% para criar o barplot

COR3 <- brewer.pal(4, "Set2")
tabela_classe %>% barplot(beside=T,
                          col=COR3,
                          main= "Gráfico 3", 
                          legend=rownames(tabela_classe),
                          ylim=c(0,1000),
                          args.legend = list(x =  "topright"))

 

Conclusão

Conforme os dados revelam, as duas teses são reais, de fato ocorreu a ordem “mulheres e crianças primeiro” e houve desigualdade da sobrevivência no Titanic.