knitr::opts_chunk$set(echo = TRUE)
library(forcats)
library(ggplot2)
library(ggpubr)
load(url("https://github.com/DATAUNIRIO/Base_de_dados/raw/master/Titanic.RData"))
ls()
## [1] "Titanic"
summary (Titanic)
## Classe Idade Sexo Sobreviveu
## Tripula\xe7\xe3o:885 criança: 109 Feminino : 470 Não sobreviveu:1490
## Primeira :324 adulto :2091 Masculino:1730 Sobreviveu : 710
## Segunda :285
## Terceira :706
dim(Titanic)
## [1] 2200 4
R: Haviam 2200 pessoas no Titanic.
table(Titanic$Classe)
##
## Tripula\xe7\xe3o Primeira Segunda Terceira
## 885 324 285 706
table(Titanic$Idade)
##
## criança adulto
## 109 2091
table(Titanic$Sexo)
##
## Feminino Masculino
## 470 1730
table(Titanic$Sobreviveu)
##
## Não sobreviveu Sobreviveu
## 1490 710
R: Existem 4 variáveis
table(Titanic$Sobreviveu)
##
## Não sobreviveu Sobreviveu
## 1490 710
R: Sobreviveram 710 pessoas
tabela<- table(Titanic$Sobreviveu)
prop.table(tabela)*100
##
## Não sobreviveu Sobreviveu
## 67.72727 32.27273
R: Aproximadamente 32% sobreviveram
table(Titanic$Sobreviveu,Titanic$Sexo)
##
## Feminino Masculino
## Não sobreviveu 126 1364
## Sobreviveu 344 366
R: Sobreviveram 344 mulheres
table(Titanic$Sobreviveu,Titanic$Idade)
##
## criança adulto
## Não sobreviveu 52 1438
## Sobreviveu 57 653
R: Sobreviveram 57 crianças
table(Titanic$Sobreviveu,Titanic$Classe)
##
## Tripula\xe7\xe3o Primeira Segunda Terceira
## Não sobreviveu 673 122 167 528
## Sobreviveu 212 202 118 178
R: Sobreviveram 178 pessoas da terceira classe
tabela2<- table(Titanic$Sobreviveu,Titanic$Sexo)
prop.table(tabela2,2)*100
##
## Feminino Masculino
## Não sobreviveu 26.80851 78.84393
## Sobreviveu 73.19149 21.15607
R: Aprox. 73% das mulheres sobreviveram
tabela3<- table(Titanic$Sobreviveu,Titanic$Idade)
prop.table(tabela3,2)*100
##
## criança adulto
## Não sobreviveu 47.70642 68.77092
## Sobreviveu 52.29358 31.22908
R: 52% das crianças sobreviveram
tabela4<- table(Titanic$Sobreviveu,Titanic$Classe)
prop.table(tabela4,2)*100
##
## Tripula\xe7\xe3o Primeira Segunda Terceira
## Não sobreviveu 76.04520 37.65432 58.59649 74.78754
## Sobreviveu 23.95480 62.34568 41.40351 25.21246
R: 25% das pessoas da terceira classe sobreviveram
R: Podemos utilizar gráficos de balões, de barras e de mosaico. Porque são ideias para apresentar o cruzamento das informações das variáveis.
barplot(tabela,
beside=TRUE,
col=c("skyblue","royalblue"),
main = "Gráfico em barras - Sobreviventes",
ylim = c(0,2200),ylab="Tripulantes",legend.text = TRUE)
barplot(tabela2,
beside=TRUE,
col=c("skyblue","royalblue"),
main = "Gráfico em barras - Sobreviventes",
ylim = c(0,2200),ylab="Tripulantes",legend.text = TRUE)
Balloonplot:
tabela5<-table(Titanic$Classe,Titanic$Sobreviveu)
tabela5<-data.frame(tabela5)
ggballoonplot(tabela5, fill = "value")+
ggtitle("Sobreviventes do Titanic")
Mosaicplot:
mosaicplot(table(Titanic$Classe,Titanic$Sobreviveu),
main = "Sobreviventes do Titanic",
color = c("skyblue","royalblue"))
ggplot(Titanic) +
aes(x = Sobreviveu) +
geom_bar(aes(fill = Sexo)) +
labs(x="", y="", title="Sobreviventes por Sexo")
R: Gráfico de barras sobrepostos
R: Podemos perceber atrávés dos gráficos que o número de pessoas que não sobreviviu foi em sua maioria da tripulação e de pessoas da terceira classe. E que mais sobreviveu foram as pessoas da primeira classe, proporcionalmente.
R: Analisando os gráficos e números, a primeira recomendação (REALISTA - de amigo) seria, não aceite viajar no Titanic, principalmente se for fazer parte da tripulação. Fazendo um Pitch de venda, recomendaria para uma família (Homem, Mulher e 2 filhos) irem de Primeira classe. Além de poderem usufluir da melhor suíte do Navio, em uma emergência, seriam prioridades de salvamento.