Passo 1 - Carregar base de dados

load(url("https://github.com/DATAUNIRIO/Base_de_dados/raw/master/Titanic.RData"))

library(ggpubr)
## Carregando pacotes exigidos: ggplot2
library(ggplot2)

Passo 2 - Observar as bases de dados

summary(Titanic)
##   Classe                    Idade             Sexo               Sobreviveu  
##  Tripula\xe7\xe3o:885   criança: 109   Feminino : 470   Não sobreviveu:1490  
##  Primeira        :324   adulto :2091   Masculino:1730   Sobreviveu    : 710  
##  Segunda         :285                                                        
##  Terceira        :706
str(Titanic)
## 'data.frame':    2200 obs. of  4 variables:
##  $ Classe    : Factor w/ 4 levels "Tripula\xe7\xe3o",..: 2 2 2 2 2 2 2 2 2 2 ...
##  $ Idade     : Factor w/ 2 levels "criança","adulto": 2 2 2 2 2 2 2 2 2 2 ...
##  $ Sexo      : Factor w/ 2 levels "Feminino","Masculino": 2 2 2 2 2 2 2 2 2 2 ...
##  $ Sobreviveu: Factor w/ 2 levels "Não sobreviveu",..: 2 2 2 2 2 2 2 2 2 2 ...

Passo 3 - Corrigir informações erradas. Limpeza dos dados

Titanic$Classe <- iconv(Titanic$Classe, "latin1","UTF-8")

Atividade 1 - Quantas pessoas tinha no Titanic? Quantas informações (variáveis) existem no banco de dados?

Resposta: 2.200 pessoas. Os dados estão distribuídos em 4 variáveis informativas.

summary(Titanic)
##     Classe              Idade             Sexo               Sobreviveu  
##  Length:2200        criança: 109   Feminino : 470   Não sobreviveu:1490  
##  Class :character   adulto :2091   Masculino:1730   Sobreviveu    : 710  
##  Mode  :character
str(Titanic)
## 'data.frame':    2200 obs. of  4 variables:
##  $ Classe    : chr  "Primeira" "Primeira" "Primeira" "Primeira" ...
##  $ Idade     : Factor w/ 2 levels "criança","adulto": 2 2 2 2 2 2 2 2 2 2 ...
##  $ Sexo      : Factor w/ 2 levels "Feminino","Masculino": 2 2 2 2 2 2 2 2 2 2 ...
##  $ Sobreviveu: Factor w/ 2 levels "Não sobreviveu",..: 2 2 2 2 2 2 2 2 2 2 ...

Atividade 2 - Quantas pessoas sobreviveram ao Titanic?

Resposta: O número de sobreviventes foi de 710 pessoas.

Tabela1 = table(Titanic$Sobreviveu)
Tabela1
## 
## Não sobreviveu     Sobreviveu 
##           1490            710

Atividade 3 - Qual é a proporção de pessoas que sobreviveram ao Titanic?

Resposta: 67,73% não sobreviveram a tragédia, enquanto que 32,27% foram se salvaram ou foram resgatadas.

prop.table(Tabela1)*100
## 
## Não sobreviveu     Sobreviveu 
##       67.72727       32.27273

Atividade 4 - Quantas mulheres sobreviveram?

Resposta: Ao todo, 344 mulheres sobreviveram ao acidente.

table(Titanic$Sexo,Titanic$Sobreviveu)
##            
##             Não sobreviveu Sobreviveu
##   Feminino             126        344
##   Masculino           1364        366

Atividade 5 - Quantas crianças sobreviveram?

Resposta: 57 crianças sobreviveram ao naufrágio.

table(Titanic$Idade,Titanic$Sobreviveu)
##          
##           Não sobreviveu Sobreviveu
##   criança             52         57
##   adulto            1438        653

Atividade 6 - Quantas pessoas da terceira classe sobreviveram?

Resposta: De acordo com os dados, entre as 710 pessoas que sobreviveram ao acidente, somente 178 eram da terceira classe.

table(Titanic$Classe,Titanic$Sobreviveu)
##             
##              Não sobreviveu Sobreviveu
##   Primeira              122        202
##   Segunda               167        118
##   Terceira              528        178
##   Tripulação            673        212

Atividade 7 - Qual o percentual de mulheres que sobreviveu?

Resposta: Entre as mulheres, 73,19% sobreviveram.

Tabela2 = table(Titanic$Sexo,Titanic$Sobreviveu)
prop.table(Tabela2)*100
##            
##             Não sobreviveu Sobreviveu
##   Feminino        5.727273  15.636364
##   Masculino      62.000000  16.636364
round(prop.table(Tabela2,1)*100,digits = 2)
##            
##             Não sobreviveu Sobreviveu
##   Feminino           26.81      73.19
##   Masculino          78.84      21.16

Atividade 8 - Qual o percentual de crianças que sobreviveu?

Resposta: O percentual de crianças que sobreviveu ao acidente ocorrido em abril de 1912 foi de 47,71%. Ou seja, quase metade do total de crianças a bordo do navio.

Tabela3 = table(Titanic$Idade,Titanic$Sobreviveu)
prop.table(Tabela3)*100
##          
##           Não sobreviveu Sobreviveu
##   criança       2.363636   2.590909
##   adulto       65.363636  29.681818
round(prop.table(Tabela3,1)*100,digits = 2)
##          
##           Não sobreviveu Sobreviveu
##   criança          47.71      52.29
##   adulto           68.77      31.23

Atividade 9 - Qual o percentual da terceira classe que sobreviveu?

Resposta: Entre os viajantes da terceira classe, apenas 25,21% sobreviveram

Tabela4 = table(Titanic$Classe,Titanic$Sobreviveu)
prop.table(Tabela4)*100
##             
##              Não sobreviveu Sobreviveu
##   Primeira         5.545455   9.181818
##   Segunda          7.590909   5.363636
##   Terceira        24.000000   8.090909
##   Tripulação      30.590909   9.636364
round(prop.table(Tabela4,1)*100,digits = 2)
##             
##              Não sobreviveu Sobreviveu
##   Primeira            37.65      62.35
##   Segunda             58.60      41.40
##   Terceira            74.79      25.21
##   Tripulação          76.05      23.95

Atividade 10 - Que tipo de gráfico você pode utilizar nesse tipo de dado? Por quê?

Resposta: Pode-se utilizar os gráficos de barra, coluna, pizza.

Atividade 11 - Você poderia construir um gráfico para a variável “sobreviveu”?

Resposta: Pode-se utilizar os gráficos de barra, coluna, pizza.

Tabela5 = table(Titanic$Sobreviveu)

bp5 <- barplot(Tabela5,col=c("lightblue","red"),
               main = "Sobreviventes do Titanic",
               ylim = c(0,2000),ylab="Quantidade de viajantes")

percentual5 <- round(prop.table(Tabela5,1)*100,digits = 2)
percentual5
## 
## Não sobreviveu     Sobreviveu 
##            100            100

Atividade 12 - Você poderia construir um gráfico da variável “sobreviveu” por “sexo”?

Resposta: O gráfico nos informa a proporção de sobreviventes em ambos os sexos. É possível notar que a maioria dos homens morreram, enquanto 73,2% das mulheres sobreviveram ao acidente.

Tabela6 = table(Titanic$Sobreviveu,Titanic$Sexo)
Tabela6
##                 
##                  Feminino Masculino
##   Não sobreviveu      126      1364
##   Sobreviveu          344       366
bp6 <- barplot(Tabela6,col=c("lightblue","red"),
               main = "Sobreviventes do Titanic por Sexo",
               beside = TRUE,
               legend.text = rownames(Tabela6),
               ylim = c(0,2300),ylab="Quantidade de sobreviventes",
               xlab = "Sexo dos sobreviventes")
              
percentual6 <- round(prop.table(Tabela6,2)*100,digits = 1)
percentual6
##                 
##                  Feminino Masculino
##   Não sobreviveu     26.8      78.8
##   Sobreviveu         73.2      21.2
rotulo <- paste0(percentual6,"%")
rotulo
## [1] "26.8%" "73.2%" "78.8%" "21.2%"
text(bp6, 0, rotulo,cex=1.6,pos=3,col = "black")

Uma nova visualização de dados - Gráfico Ballonplot

tabela<-table(Titanic$Classe,Titanic$Sobreviveu)
tabela<-data.frame(tabela)
ggballoonplot(tabela, fill = "value")+
ggtitle("Sobreviventes do Titanic")

Uma nova visualização de dados - Gráfico Mosaicplot

mosaicplot(table(Titanic$Classe,Titanic$Sobreviveu), 
           main = "Sobreviventes do Titanic", 
           color = c("red","blue"))

Atividade 13 - Você poderia construir uma outra visualização de dados (além dessas duas)? Qual gráfico você sugere?

library(ggpubr)
library(ggplot2)
library(waffle)

tabela_Sexo = table(Titanic$Sexo)
tabela_Sexo 
## 
##  Feminino Masculino 
##       470      1730
round(prop.table(tabela_Sexo)*100,2)
## 
##  Feminino Masculino 
##     21.36     78.64
Sexo <- c("Feminino"=21.36,"Masculino"=78.64)

waffle(Sexo,colors = c("gold","blue"))

## Resposta: Conforme apresentado, é possível observar que a esmagadora maioria dos viajantes a bordo são do sexo masculino. Pode-se comparar com o número elevado de membros da tripulação, que na sua maioria era composto por homens.

Atividade 14 - Você consegue interpretar esses dois gráficos? O que eles estão dizendo?

Resposta: Ambos os gráficos disponibilizam a mesma informação, porem com uma visualização diferente. O primeiro diagrama, em formato de gráfico de bolha, nos fornece uma visão comparativa entre os pontos de intersecção do quadro, onde cada bolha tem sua intensidade proporcional a ocorrência de uma variável, neste caso, o de sobrevivência. Com uma breve análise do quadro, é possível observar que a maior taxa de não sobreviventes está presente na classe da tripulação, enquanto a menor está nos passageiros da primeira classe. Já no segundo gráfico, a informação principal a que se poderia chegar é de que o número de mortes foi maior de que sobreviventes. Os quadrados em vermelho (não sobreviventes) são significativamente maiores do que os quadrados azuis, o que de imediato nos informa um número bem expressivo sobre mortes causadas pelo acidente.

Atividade 15 - Se você fosse fazer um Pitch (apresentação de 03 a 05 minutos) com recomendações sobre o Titanic a partir dos dados. Qual ideia você passaria? Quero um posicionamento!

Resposta: Algumas recomendações:

1 - Bote salva-vidas: a quantidade deve ser suficente para TODOS os passageiros, sem exceção. Diante de circunstâncias tão adversas é necessário estar preparado para o pior.

2 - De acordo com relatos dos fatos noticiados à época da tragédia e os dados informados por essa fonte estudada, pode-se questionar o nível de conhecimento técnico da tripulação do navio e ainda a quantidade de membros da guarnição. É possível que diante de uma tripulação tão numerosa, a organização das equipes e distribuição de trabalhadores tenha sido inadequada.