knitr::opts_chunk$set(echo = TRUE)

Pacotes necessários

library(forcats)
library(ggplot2)
library(ggpubr)

Carregar os dados

load(url("https://github.com/DATAUNIRIO/Base_de_dados/raw/master/Titanic.RData"))
ls()
## [1] "Titanic"

Summmary

summary (Titanic)
##   Classe                    Idade             Sexo               Sobreviveu  
##  Tripula\xe7\xe3o:885   criança: 109   Feminino : 470   Não sobreviveu:1490  
##  Primeira        :324   adulto :2091   Masculino:1730   Sobreviveu    : 710  
##  Segunda         :285                                                        
##  Terceira        :706

Perguntas

Atividade 01: Quantas pessoas tinha no Titanic?

dim(Titanic)
## [1] 2200    4

R: Haviam 2200 pessoas no Titanic.

Quantas informações (variáveis) existem no banco de dados?

table(Titanic$Classe)
## 
## Tripula\xe7\xe3o         Primeira          Segunda         Terceira 
##              885              324              285              706
table(Titanic$Idade)
## 
## criança  adulto 
##     109    2091
table(Titanic$Sexo)
## 
##  Feminino Masculino 
##       470      1730
table(Titanic$Sobreviveu)
## 
## Não sobreviveu     Sobreviveu 
##           1490            710

R: Existem 4 variáveis

Atividade 02: Quantas pessoas sobreviveram ao Titanic?

table(Titanic$Sobreviveu)
## 
## Não sobreviveu     Sobreviveu 
##           1490            710

R: Sobreviveram 710 pessoas

Atividade 03: Qual é a proporção de pessoas que sobreviveram ao Titanic?

tabela<- table(Titanic$Sobreviveu)
prop.table(tabela)*100
## 
## Não sobreviveu     Sobreviveu 
##       67.72727       32.27273

R: Aproximadamente 32% sobreviveram

Atividade 04:Quantas mulheres sobreviveram?

table(Titanic$Sobreviveu,Titanic$Sexo)
##                 
##                  Feminino Masculino
##   Não sobreviveu      126      1364
##   Sobreviveu          344       366

R: Sobreviveram 344 mulheres

Atividade 05: Quantas crianças sobreviveram?

table(Titanic$Sobreviveu,Titanic$Idade)
##                 
##                  criança adulto
##   Não sobreviveu      52   1438
##   Sobreviveu          57    653

R: Sobreviveram 57 crianças

Atividade 06: Quantas pessoas da terceira classe sobreviveram?

table(Titanic$Sobreviveu,Titanic$Classe)
##                 
##                  Tripula\xe7\xe3o Primeira Segunda Terceira
##   Não sobreviveu              673      122     167      528
##   Sobreviveu                  212      202     118      178

R: Sobreviveram 178 pessoas da terceira classe

Atividade 07: Qual o percentual de mulheres que sobreviveu?

tabela2<- table(Titanic$Sobreviveu,Titanic$Sexo)
prop.table(tabela2,2)*100
##                 
##                  Feminino Masculino
##   Não sobreviveu 26.80851  78.84393
##   Sobreviveu     73.19149  21.15607

R: Aprox. 73% das mulheres sobreviveram

Atividade 08: Qual o percentual de crianças que sobreviveu?

tabela3<- table(Titanic$Sobreviveu,Titanic$Idade)
prop.table(tabela3,2)*100
##                 
##                   criança   adulto
##   Não sobreviveu 47.70642 68.77092
##   Sobreviveu     52.29358 31.22908

R: 52% das crianças sobreviveram

Atividade 09: Qual o percentual da terceira classe que sobreviveu?

tabela4<- table(Titanic$Sobreviveu,Titanic$Classe)
prop.table(tabela4,2)*100
##                 
##                  Tripula\xe7\xe3o Primeira  Segunda Terceira
##   Não sobreviveu         76.04520 37.65432 58.59649 74.78754
##   Sobreviveu             23.95480 62.34568 41.40351 25.21246

R: 25% das pessoas da terceira classe sobreviveram

Atividade 10: Que tipo de gráfico você pode utilizar nesse tipo de dado? Por quê?

R: Podemos utilizar gráficos de balões, de barras e de mosaico. Porque são ideias para apresentar o cruzamento das informações das variáveis.

Atividade 11: Você poderia construir um gráfico para a variável “sobreviveu”?

barplot(tabela,
        beside=TRUE,
        col=c("skyblue","royalblue"),
        main = "Gráfico em barras - Sobreviventes",
        ylim = c(0,2200),ylab="Tripulantes",legend.text = TRUE)

Atividade 12: Você poderia construir um gráfico da variável “sobreviveu” por “sexo”?

barplot(tabela2,
        beside=TRUE,
        col=c("skyblue","royalblue"),
        main = "Gráfico em barras - Sobreviventes",
        ylim = c(0,2200),ylab="Tripulantes",legend.text = TRUE)

Balloonplot:

tabela5<-table(Titanic$Classe,Titanic$Sobreviveu)
tabela5<-data.frame(tabela5)
ggballoonplot(tabela5, fill = "value")+
  ggtitle("Sobreviventes do Titanic") 

Mosaicplot:

mosaicplot(table(Titanic$Classe,Titanic$Sobreviveu), 
           main = "Sobreviventes do Titanic", 
           color = c("skyblue","royalblue"))

Atividade 13: Você poderia construir uma outra visualização de dados (além dessas duas)? Qual gráfico você sugere?

ggplot(Titanic) +
  aes(x = Sobreviveu) +
  geom_bar(aes(fill = Sexo)) +
  labs(x="", y="", title="Sobreviventes por Sexo")

R: Gráfico de barras sobrepostos

Atividade 14: Você consegue interpretar esses dois gráficos? o que eles estão dizendo?

R: Podemos perceber atrávés dos gráficos que o número de pessoas que não sobreviviu foi em sua maioria da tripulação e de pessoas da terceira classe. E que mais sobreviveu foram as pessoas da primeira classe, proporcionalmente.

Atividade 15: Se você fosse fazer um Pitch (apresentação de 03 a 05 minutos) com recomendações sobre o Titanic a partir dos dados. Qual ideia você passaria? Quero um posicionamento!

R: Analisando os gráficos e números, a primeira recomendação (REALISTA - de amigo) seria, não aceite viajar no Titanic, principalmente se for fazer parte da tripulação. Fazendo um Pitch de venda, recomendaria para uma família (Homem, Mulher e 2 filhos) irem de Primeira classe. Além de poderem usufluir da melhor suíte do Navio, em uma emergência, seriam prioridades de salvamento.