Análise da Base de Dados do Titanic

Packages Necessários:

load("C:/Users/furta/OneDrive/Área de Trabalho/Base_de_dados-master/Titanic.RData")
library(forcats)
## Warning: pacote 'forcats' foi compilado no R versão 4.4.1
library(ggplot2)
## Warning: pacote 'ggplot2' foi compilado no R versão 4.4.1
library(ggpubr)
## Warning: pacote 'ggpubr' foi compilado no R versão 4.4.1

Váriaveis:

Classe (tripulação, primeira, segunda, terceira)

Idade (adulto, criança)

Sexo (masculino, feminino)

Sobreviveu (sim, não)

Corrigindo a BDD:

Titanic$Classe = iconv(Titanic$Classe, "latin1", "UTF-8")

Questão 1: Quantas pessoas tinha no Titanic? Quantas informações (variáveis) existem no banco de dados?

Número de Pessoas no Titanic: 2.220

Váriaveis: 14

Questão 2 - Quantas pessoas sobreviveram ao Titanic?

tabela_sobrevivencia = table(Titanic$Sobreviveu)
tabela_sobrevivencia
## 
## Não sobreviveu     Sobreviveu 
##           1490            710

Nota: O baixo número de sobreviventes é notorio pela falta de preparo em segurança, conhecida pelo grande público. Afinal, a famosa frase: “Nem Deus derruba esse barco” deixa nítido a confiança no barco e a falta de preparo para situações como a tragédia.

Questão 3 - Qual é a proporção de pessoas que sobreviveram ao Titanic?

round(prop.table(tabela_sobrevivencia)*100,2)
## 
## Não sobreviveu     Sobreviveu 
##          67.73          32.27

Nota: Menos de 40% porcento dos passageiros e tripulantes sobreviveram. Isso reflete a falta de preparo do barco para situações de emergência.

Questão 4 - Quantas mulheres sobreviveram?

tabela_sobrevivencia_sexo <- table(Titanic$Sexo, Titanic$Sobreviveu)
tabela_sobrevivencia_sexo
##            
##             Não sobreviveu Sobreviveu
##   Feminino             126        344
##   Masculino           1364        366

Nota: Os números refletem a verdade sem a interpretação. Na época, muleres tinham menos acesso a tudo. Portanto, mesmo o número de mulheres sobreviventes tenha sido menor, não significa que morreram mais. Pelo contrário, foram bem menos mulheres na embarcação.

Questão 5 - Quantas crianças sobreviveram?

tabela_sobrevivencia_idade <- table(Titanic$Idade, Titanic$Sobreviveu)
tabela_sobrevivencia_idade
##          
##           Não sobreviveu Sobreviveu
##   criança             52         57
##   adulto            1438        653

Nota: Percebe que poucas crianças sobreviveram, o que mostra o nível do acidente mesmo elas sendo prioridade no resgate.

Questão 6 - Quantas pessoas da terceira classe sobreviveram?

tabela_sobrevivencia_classe <- table(Titanic$Classe, Titanic$Sobreviveu)
tabela_sobrevivencia_classe
##             
##              Não sobreviveu Sobreviveu
##   Primeira              122        202
##   Segunda               167        118
##   Terceira              528        178
##   Tripulação            673        212

Nota: Os números refletem a desigualdade na embarcação. As classes mais baixas eram evacuadas mais tarde que as classes mais abastadas.

Questão 7 - Qual o percentual de mulheres que sobreviveu?

tabela_sobrevivencia_sexo <- table(Titanic$Sexo, Titanic$Sobreviveu)
tabela_sobrevivencia_sexo
##            
##             Não sobreviveu Sobreviveu
##   Feminino             126        344
##   Masculino           1364        366
round(prop.table(tabela_sobrevivencia_sexo)*100,2)
##            
##             Não sobreviveu Sobreviveu
##   Feminino            5.73      15.64
##   Masculino          62.00      16.64

Questão 8 - Qual o percentual de crianças que sobreviveu?

tabela_sobrevivencia_idade <- table(Titanic$Idade, Titanic$Sobreviveu)
tabela_sobrevivencia_idade
##          
##           Não sobreviveu Sobreviveu
##   criança             52         57
##   adulto            1438        653
round(prop.table(tabela_sobrevivencia_idade)*100,2)
##          
##           Não sobreviveu Sobreviveu
##   criança           2.36       2.59
##   adulto           65.36      29.68

Questão 9 - Qual o percentual da terceira classe que sobreviveu?

tabela_sobrevivencia_classe <- table(Titanic$Classe, Titanic$Sobreviveu)
tabela_sobrevivencia_classe
##             
##              Não sobreviveu Sobreviveu
##   Primeira              122        202
##   Segunda               167        118
##   Terceira              528        178
##   Tripulação            673        212
round(prop.table(tabela_sobrevivencia_classe)*100,2)
##             
##              Não sobreviveu Sobreviveu
##   Primeira             5.55       9.18
##   Segunda              7.59       5.36
##   Terceira            24.00       8.09
##   Tripulação          30.59       9.64

Questao 10

Gráfico Torta para acomodar as 4 variáveis que temos para analisar.

Questão 11

tabela_sobrevivencia <- table(Titanic$Sobreviveu, useNA = "no")
pie(tabela_sobrevivencia, main = "Gráfico 1 - Sobreviventes Titanic", col = c("yellow", "orange"))

Questão 12

tabela_sexo <- table(Titanic$Sexo, Titanic$Sobreviveu)
pie(tabela_sexo[, 2], 
    labels = rownames(tabela_sexo), 
    main = "Gráfico 2 - Sobreviventes Titanic por Sexo", 
    col = c("lightyellow", "lightgreen"))

Ultimo desafio!

tabela = table(Titanic$Classe, Titanic$Sobreviveu) 
tabela = as.data.frame(tabela)

ggballoonplot(tabela, fill = "Freq") + ggtitle("Sobreviventes do
Titanic")

Questão 13 - Você poderia construir uma outra visualização de dados (além dessas duas)? Qual gráfico você sugere?

library(flextable)
## Warning: pacote 'flextable' foi compilado no R versão 4.4.1
## 
## Anexando pacote: 'flextable'
## Os seguintes objetos são mascarados por 'package:ggpubr':
## 
##     border, font, rotate
tabela_sobrevivencia
## 
## Não sobreviveu     Sobreviveu 
##           1490            710
class(tabela_sobrevivencia)
## [1] "table"
tabela_sobrevivencia2 = data.frame(tabela_sobrevivencia)
class(tabela_sobrevivencia2)
## [1] "data.frame"
tabela_sobrevivencia <- as.data.frame(tabela_sobrevivencia)

library(dplyr)
## Warning: pacote 'dplyr' foi compilado no R versão 4.4.1
## 
## Anexando pacote: 'dplyr'
## Os seguintes objetos são mascarados por 'package:stats':
## 
##     filter, lag
## Os seguintes objetos são mascarados por 'package:base':
## 
##     intersect, setdiff, setequal, union
flextable(tabela_sobrevivencia) %>% theme_vader()

Var1

Freq

Não sobreviveu

1,490

Sobreviveu

710

Questão 14 - Você consegue interpretar esses dois gráficos? o que eles estão dizendo?

O ballonplot serviu para analisar o número de pessoas que sobreviveram ou não atráves de balões de frenquência.

O mosaicoplot é a mesma coisa de uma forma diferente, e pra mim, mais difícil pela falta de números para comparar.

Questão 15 - Se você fosse fazer um Pitch (apresentação de 03 a 05 minutos) com recomendações sobre o Titanic a partir dos dados. Qual ideia você passaria? Quero um posicionamento!

Recomendações:

Primeiro: Foco em instrumentos de segurança e equipe preparada para acidentes.

A total conifança na embarcação fez com que desleixa-sem dos métodos de segurança; Não tinham equipamentos suficentes e equipe despreparada.

Segundo: Resolver disparidade social

Muito pelo despreparo da equipe, não teve botes e coletes salva vidas para todos e por ordem de “prioridade” resolveram salvar as pessoas com mais dinheiro primeiro. Assim, muitos tripulantes do navio morreram e pessoas de classes mais baixas.

Terceiro: Sistema de luzes externos

Todos sabem que o Titanic bateu pois estava de noite e não foi visto o iceberg chegando. Luzes ou métodos de iluminação no exterior do navio, provavelmente, denunciariam a posição do Iceberg, fazendo mudar a rota com antecedência. Evitando o desastre.