Pacotes necessários

library(forcats)
library(ggplot2)
library(ggpubr)

Carregar a base de dados

O usuário não é meu, pois precisei usar o computador do meu pai a para fazer o trabalho.

load("C:/Users/Mamede/Desktop/Base_de_dados-master/Titanic.RData")

Corrigir e verificar a base de dados

Titanic$Classe = iconv(Titanic$Classe, "latin1", "UTF-8")
str(Titanic)
## 'data.frame':    2200 obs. of  4 variables:
##  $ Classe    : chr  "Primeira" "Primeira" "Primeira" "Primeira" ...
##  $ Idade     : Factor w/ 2 levels "criança","adulto": 2 2 2 2 2 2 2 2 2 2 ...
##  $ Sexo      : Factor w/ 2 levels "Feminino","Masculino": 2 2 2 2 2 2 2 2 2 2 ...
##  $ Sobreviveu: Factor w/ 2 levels "Não sobreviveu",..: 2 2 2 2 2 2 2 2 2 2 ...
head(Titanic$Classe)
## [1] "Primeira" "Primeira" "Primeira" "Primeira" "Primeira" "Primeira"
tail(Titanic$Classe)
## [1] "Tripulação" "Tripulação" "Tripulação" "Tripulação" "Tripulação"
## [6] "Tripulação"

Questões relacionadas aos dados

1 - Quantas pessoas tinha no Titanic? Quantas informações (variáveis) existem no banco de dados?

R: De acordo com a quantidade de linhas presente na tabela da base de dados, havia 2.200 pessoas a bordo do Titanic. Além disso, as colunas revelam quatro variáveis: Classe, Idade, Sexo e Sobreviveu.

2- Quantas pessoas sobreviveram ao Titanic?

tabela_sobrevivencia = table(Titanic$Sobreviveu)
tabela_sobrevivencia
## 
## Não sobreviveu     Sobreviveu 
##           1490            710

R: Analisando os dados do naufrágio do Titanic, 710 pessoas sobreviveram, enquanto 1.490 não conseguiram sobreviver. Esses números evidenciam a gravidade da tragédia e levantam questões sobre os fatores que influenciaram a sobrevivência.

3- Qual é a proporção de pessoas que sobreviveram ao Titanic?

round(prop.table(tabela_sobrevivencia)*100,2)
## 
## Não sobreviveu     Sobreviveu 
##          67.73          32.27

R: De acordo com os dados apresentados, 32,27% dos passageiros sobreviveram, esse número indica que a maioria dos passageiros não conseguiu escapar da tragédia, o que é consistente com a narrativa histórica do evento. A taxa de sobrevivência relativamente baixa pode ser atribuída a diversos fatores, como a falta de botes salva-vidas suficientes, as condições caóticas durante o naufrágio e as políticas de embarque que priorizavam determinadas classes sociais.

4- Quantas mulheres sobreviveram?

T1 = table(Titanic$Sexo,Titanic$Sobreviveu)
T1
##            
##             Não sobreviveu Sobreviveu
##   Feminino             126        344
##   Masculino           1364        366

R: O total foi de 344 mulheres que sobreviveram ao naufrágio.

5-Quantas crianças sobreviveram?

tabela_sobrevivencia_Idade = table(Titanic$Idade, Titanic$Sobreviveu)
tabela_sobrevivencia_Idade
##          
##           Não sobreviveu Sobreviveu
##   criança             52         57
##   adulto            1438        653

R: A análise dos dados de sobrevivência no naufrágio do Titanic mostra que, entre as crianças, 57 sobreviveram.

6- Quantas pessoas da terceira classe sobreviveram?

tabela_sobrevivencia_Classe = table(Titanic$Classe, Titanic$Sobreviveu)
tabela_sobrevivencia_Classe
##             
##              Não sobreviveu Sobreviveu
##   Primeira              122        202
##   Segunda               167        118
##   Terceira              528        178
##   Tripulação            673        212

R: Segundo os dados, entre os passageiros da terceira classe, 178 sobreviveram.

7- Qual o percentual de mulheres que sobreviveu?

round(prop.table(T1,1) * 100,2)
##            
##             Não sobreviveu Sobreviveu
##   Feminino           26.81      73.19
##   Masculino          78.84      21.16
round(prop.table(T1) * 100,2)
##            
##             Não sobreviveu Sobreviveu
##   Feminino            5.73      15.64
##   Masculino          62.00      16.64

R:O percentual de mulheres que sobreviveu no naufrágio do Titanic é de 73,19%, o que representa a proporção de mulheres que conseguiram escapar da tragédia em relação ao total de mulheres a bordo, destacando uma alta proporção de sobreviventes entre o gênero feminino,que indica que as mulheres tinham significativamente mais chances de sobreviver ao naufrágio do que os homens. Além disso, é possível calcular a porcentagem de mulheres sobreviventes em relação ao total de passageiros do navio, que resulta em 15,64%, essa métrica fornece uma perspectiva mais ampla sobre a sobrevivência feminina no contexto geral do desastre.

8- Qual o percentual de crianças que sobreviveu?

round(prop.table(tabela_sobrevivencia_Idade,1) * 100,2)
##          
##           Não sobreviveu Sobreviveu
##   criança          47.71      52.29
##   adulto           68.77      31.23

R: O resultado é que o percentual de crianças que sobreviveu é de 52,29% , o que é significativamente mais alto do que a taxa de sobrevivência para adultos, isso sugere que, embora as crianças enfrentassem riscos elevados, sua taxa de sobrevivência foi relativamente favorável em comparação com a dos adultos.

9- Qual o percentual da terceira classe que sobreviveu?

round(prop.table(tabela_sobrevivencia_Classe,1)*100,2)
##             
##              Não sobreviveu Sobreviveu
##   Primeira            37.65      62.35
##   Segunda             58.60      41.40
##   Terceira            74.79      25.21
##   Tripulação          76.05      23.95

R: A terceira classe teve uma taxa de sobrevivência de 25,21%, uma taxa consideravelmente inferior à das classes superiores; por exemplo, a primeira classe teve uma taxa de sobrevivência de 62,34% e a segunda classe de 41,33%. Esses resultados indicam que os passageiros da terceira classe enfrentaram desafios significativos durante a evacuação, possivelmente devido à sua localização no navio e à falta de acesso imediato aos botes salva-vidas.

10- Que tipo de gráfico você pode utilizar nesse tipo de dado? Por quê?

R: O gráfico de barras é uma das opções, pois permite visualizar e comparar diferentes categorias de forma clara e eficaz. Cada barra representa uma categoria específica, com a altura ou comprimento da barra indicando a relevância dos dados associados, sendo mais úteis quando os dados que ilustram apresentam diferenças importantes. Essa visualização facilita a identificação de padrões e tendências, além de tornar mais simples a comparação entre as diferentes categorias. A disposição das barras pode ser feita de forma horizontal ou vertical, conforme a preferência ou a quantidade de categorias, tornando o gráfico de barras uma ferramenta versátil e intuitiva para análise de dados.

11- Você poderia construir um gráfico para a variável “sobreviveu”?

tabela_sobrevivencia = table(Titanic$Sobreviveu)
tabela_sobrevivencia
## 
## Não sobreviveu     Sobreviveu 
##           1490            710
pie(tabela_sobrevivencia, 
    col = c("#3e69b3","#a6c7ff"),
    main = "Gráfico 1 - Sobrevivência do Titanic")

12- Você poderia construir um gráfico da variável “sobreviveu” por “sexo”?

T2 = table(Titanic$Sobreviveu,Titanic$Sexo)
T2
##                 
##                  Feminino Masculino
##   Não sobreviveu      126      1364
##   Sobreviveu          344       366
bp <- barplot(T2,
              col=c("#bdeff2","#19999f"),
              main = "Gráfico 2 - Sobreviventes por sexo",
              horiz = FALSE,beside=TRUE,
              legend.text = rownames(T2), 
              args.legend = list(x = "topleft"))

Desafio balloonplot

tabela<-table(Titanic$Classe,Titanic$Sobreviveu)
tabela<-data.frame(tabela)
ggballoonplot(tabela, fill = "value")+
ggtitle("Sobreviventes do Titanic") 

Desafio mosaicplot

mosaicplot(table(Titanic$Classe,Titanic$Sobreviveu), main = "Sobreviventes do Titanic", color = c("#f16ba6","#5a70b1"))

13- Você poderia construir uma outra visualização de dados (além dessas duas)? Qual gráfico você sugere?

R: Sugiro a criação de um gráfico de barras (barplot) para representar quem sobreviveu em relação às classes dos passageiros. Ele seria eficaz porque permite visualizar claramente a comparação das taxas de sobrevivência entre as diferentes classes, facilitando a identificação de padrões e disparidades. Utilizando cores distintas para cada classe, poderíamos destacar as proporções de sobreviventes e não sobreviventes de forma intuitiva. Essa visualização ajudaria a transmitir rapidamente a informação sobre as desigualdades nas taxas de sobrevivência, reforçando as conclusões sobre como a classe social influenciou as chances de escapar da tragédia.

bp <- barplot(tabela_sobrevivencia_Classe,
              col=c("#ff8f86","#ff5050","#0071bc","#00468b"),
              main = "Gráfico 3 - Sobreviventes por Classe",
              horiz = FALSE,beside=TRUE,
              legend.text = rownames(tabela_sobrevivencia_Classe), 
              args.legend = list(x = "topright"))

14- Você consegue interpretar esses dois gráficos? o que eles estão dizendo?

R: Sim, os dois gráficos indicam a proporção de classes e de sobrevivência entre os passageiros do Titanic. Os dados mostram que o maior número de pessoas que não sobreviveram era composto por tripulantes, seguido por passageiros da Terceira Classe, que também apresentaram uma alta taxa de não sobreviventes. A Segunda Classe se posiciona em um nível intermediário, onde o número de sobreviventes está mais equilibrado em relação ao número de não sobreviventes. Por outro lado, a Primeira Classe destacou-se como a classe com a maior taxa de sobrevivência, com o número de sobreviventes superando o de não sobreviventes. Conclui-se que é feita uma correlação entre a classe social e as chances de sobrevivência, indicando que os membros das classes mais altas, especialmente da Primeira Classe, tiveram maiores oportunidades de escapar do naufrágio.

15- Se você fosse fazer um Pitch (apresentação de 03 a 05 minutos) com recomendações sobre o Titanic a partir dos dados. Qual ideia você passaria? Quero um posicionamento!

R: Os dados revelam que apenas 32,27% dos passageiros sobreviveram, mas essa estatística esconde uma realidade ainda mais alarmante. Quando olhamos mais de perto, percebemos que a taxa de sobrevivência estava intimamente ligada à classe social, os passageiros da primeira classe apresentaram uma taxa de sobrevivência de 62,34%, enquanto os da terceira classe tiveram apenas 25,23%. Essa discrepância inegável reflete um sistema que favoreceu aqueles com maior status econômico e social, enquanto os mais vulneráveis, muitas vezes relegados ao fundo do navio, enfrentaram desafios insuperáveis para escapar da tragédia.

Além disso, a análise da sobrevivência de gênero reforça essa crítica. Enquanto 73,15% das mulheres sobreviveram, apenas 21,97% dos homens conseguiram escapar. Essa proteção das mulheres pode parecer positiva à primeira vista, mas é, na verdade, um reflexo das normas sociais que priorizavam a proteção de um grupo em detrimento de outro, revelando um padrão de privilégio que não deveria existir em uma situação de emergência.

Dessa forma, não existem muitas recomendações positivas a serem feitas a respeito do Titanic, já que apesar de inicialmente parecer ser uma inovação extraordinária, terminou em uma grande tragédia e expos uma falha ética em como as vidas foram avaliadas, ressaltando que em momentos de crise, as desigualdades sociais se tornam ainda mais evidentes.