Aula_05
1. gráfico barplot;
2. média e mediana;
3. tabelas
4. função %>%
5. Quali x Quali
Nessa aula utilizamos a base de dados Titanic para provar duas teses, usando variáveis Quali x Quali.
No Titanic:
- É válida a tese "mulheres e crianças primeiro";
- Há uma desigualdade social da sobrevivência.
Variável-chave: Sobreviência.
Variável de interesse, variável resposta.
load("C:/Users/julia/Base_de_dados-master/Titanic.RData")
summary(Titanic)
## Classe Idade Sexo Sobreviveu
## Tripulação:885 criança: 109 Feminino : 470 Não sobreviveu:1490
## Primeira :324 adulto :2091 Masculino:1730 Sobreviveu : 710
## Segunda :285
## Terceira :706
str(Titanic)
## 'data.frame': 2200 obs. of 4 variables:
## $ Classe : Factor w/ 4 levels "Tripulação","Primeira",..: 2 2 2 2 2 2 2 2 2 2 ...
## $ Idade : Factor w/ 2 levels "criança","adulto": 2 2 2 2 2 2 2 2 2 2 ...
## $ Sexo : Factor w/ 2 levels "Feminino","Masculino": 2 2 2 2 2 2 2 2 2 2 ...
## $ Sobreviveu: Factor w/ 2 levels "Não sobreviveu",..: 2 2 2 2 2 2 2 2 2 2 ...
pie(table(Titanic$Sobreviveu))
tabela_sexo <- table(Titanic$Sexo,Titanic$Sobreviveu)
tabela_idade <- table(Titanic$Idade, Titanic$Sobreviveu)
tabela_sexo
##
## Não sobreviveu Sobreviveu
## Feminino 126 344
## Masculino 1364 366
tabela_idade
##
## Não sobreviveu Sobreviveu
## criança 52 57
## adulto 1438 653
prop.table(tabela_sexo,1)
##
## Não sobreviveu Sobreviveu
## Feminino 0.2680851 0.7319149
## Masculino 0.7884393 0.2115607
prop.table(tabela_sexo,2)
##
## Não sobreviveu Sobreviveu
## Feminino 0.08456376 0.48450704
## Masculino 0.91543624 0.51549296
prop.table(tabela_idade,1)*100
##
## Não sobreviveu Sobreviveu
## criança 47.70642 52.29358
## adulto 68.77092 31.22908
prop.table(tabela_idade,2)*100
##
## Não sobreviveu Sobreviveu
## criança 3.489933 8.028169
## adulto 96.510067 91.971831
Primeira tese:
Iremos criar os gráficos para verificar que é válido a tese “mulheres e crianças primeiro”.
Criando o gráfico relacionando a sobrevivência por sexo.
library(RColorBrewer)
brewer.pal(5,"Blues")
## [1] "#EFF3FF" "#BDD7E7" "#6BAED6" "#3182BD" "#08519C"
brewer.pal(2, "Greens")
## Warning in brewer.pal(2, "Greens"): minimal value for n is 3, returning requested palette with 3 different levels
## [1] "#E5F5E0" "#A1D99B" "#31A354"
display.brewer.all()
Cor <- brewer.pal(2,"Greens")
## Warning in brewer.pal(2, "Greens"): minimal value for n is 3, returning requested palette with 3 different levels
barplot(tabela_sexo, main = "Gráfico 1 - Sobrevivência por sexo",
col= c(Cor))
COR <- c("#1B9E77", "#D95F02","#1B9E77", "#D95F02")
barplot(tabela_sexo, main = "Gráfico 1 - Sobrevivência por sexo",
col= COR,
horiz= FALSE, beside = TRUE,
legend = rownames(tabela_sexo))
Criando o gráfico relacionando a sobrevivência por idade.
COR2 <- c("red", "blue","red", "blue")
barplot(tabela_idade, main = "Gráfico 2 - Sobrevivência por idade",
col= COR2,
horiz= FALSE, beside = TRUE, ylim=c(0,2000),
legend = rownames(tabela_idade))
Segunda tese: Iremos criar os gráficos para verificar a tese da desigualdade da sobrevivência.
Criamos o gráfico relacionando a sobrevivência as classes.
modo clássico para criar gráfico, tabela e tabela de proporção.
barplot(round(prop.table(table(Titanic$Classe, Titanic$Sobreviveu),1),1))*100
## [1] 70 190
Criando uma tabela em números absolutos com a função %>%
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
tabela_classe <- Titanic %>% select(Classe,Sobreviveu)%>% table()
tabela_classe
## Sobreviveu
## Classe Não sobreviveu Sobreviveu
## Tripulação 673 212
## Primeira 122 202
## Segunda 167 118
## Terceira 528 178
Criando uma tabela de proporção com a função %>%
tabela_classe_prop <- Titanic %>% select(Classe,Sobreviveu)%>% table()%>%
prop.table(1)%>%round(2)
tabela_classe_prop
## Sobreviveu
## Classe Não sobreviveu Sobreviveu
## Tripulação 0.76 0.24
## Primeira 0.38 0.62
## Segunda 0.59 0.41
## Terceira 0.75 0.25
Usando a função %>% para criar o barplot
COR3 <- brewer.pal(4, "Set2")
tabela_classe %>% barplot(beside=T,
col=COR3,
main= "Gráfico 3",
legend=rownames(tabela_classe),
ylim=c(0,1000),
args.legend = list(x = "topright"))
Conforme os dados revelam, as duas teses são reais, de fato ocorreu a ordem “mulheres e crianças primeiro” e houve desigualdade da sobrevivência no Titanic.