Title: “Analise Titanic” Author: “Daiana Cecilia Vega” Date: “2024-10-31” output: html_document html_document: theme: cerulean highlight: tango toc: true toc_float: true code_folding: hide

Introdução

Este relatório realiza uma análise aprofundada dos dados de sobrevivência do Titanic, com o objetivo de identificar os principais fatores que influenciaram as chances de sobrevivência dos passageiros. A partir de uma investigação cuidadosa das informações demográficas e de viagem, exploramos o impacto de variáveis como a classe de cabine, o gênero e a idade dos ocupantes. Esses fatores permitem examinar como as desigualdades sociais e culturais influenciaram as decisões e os resultados de resgate, refletindo padrões que vão além do evento histórico em si. Com esta análise, buscamos não apenas entender as estatísticas por trás das taxas de sobrevivência, mas também explorar como essas variáveis se inter-relacionam para pintar um quadro mais completo das dinâmicas sociais a bordo do Titanic.

{r library(dplyr) library(ggplot2) library(ggpubr)


6. Conhecendo os dados a serem analisados

Conhecer os dados a serem analisados é uma etapa essencial em qualquer estudo, pois permite compreender as variáveis disponíveis e suas possíveis relações com o fenômeno investigado. No caso dos dados do Titanic, as variáveis incluem informações detalhadas sobre cada passageiro, como classe de cabine, gênero, idade (classificados como adultos e crianças) e status de sobrevivência. Essas características ajudam a estruturar uma análise que considera tanto os aspectos demográficos quanto as condições sociais dos ocupantes do navio. Este conhecimento prévio fornece uma base sólida para interpretar os dados com maior precisão, além de auxiliar na escolha de métodos estatísticos e gráficos que melhor representam as dinâmicas envolvidas na tragédia.

Atividade 1: Quantas pessoas tinha no Titanic?

{r num_pessoas <- nrow(Titanic) cat("Número de pessoas no Titanic:", num_pessoas, "\n")

1.1. Quantas informações (variáveis) existem no banco de dados?

{r num_variaveis <- ncol(Titanic) cat("Número de variáveis no banco de dados:", num_variaveis) colnames(Titanic) colnames(Titanic)[which(colnames(Titanic) == "Classe")[2]] <- "Sobreviveu" colnames(Titanic)

Atividade 2: Quantas pessoas sobreviveram ao Titanic?

{r library(dplyr) unique(Titanic$Sobreviveu) num_sobreviventes <- sum(Titanic$Sobreviveu == "Sobreviveu") cat("Número de pessoas que sobreviveram ao Titanic:", num_sobreviventes)

Atividade 3: Qual é a proporção de pessoas que sobreviveram ao Titanic?

{r num_total <- nrow(Titanic) num_total num_sobreviventes <- sum(Titanic$Sobreviveu == "Sobreviveu") num_sobreviventes proporcao_sobreviventes <- num_sobreviventes / num_total cat("A Porcentagem de pessoas que sobreviveram ao Titanic é:", proporcao_sobreviventes*100)


7. Análises descritivas dos dados

As análises descritivas dos dados são fundamentais para obter uma visão geral das características dos passageiros do Titanic e das taxas de sobrevivência. Esse tipo de análise envolve a aplicação de estatísticas básicas, como médias, medianas, e frequências, que ajudam a resumir e organizar as informações disponíveis. No contexto dos dados do Titanic, as análises descritivas podem revelar padrões importantes, como a proporção de sobreviventes em diferentes classes de cabine, a distribuição de idades entre os passageiros, e as taxas de sobrevivência conforme o gênero.

Atividade 4: Quantas mulheres sobreviveram?

{r library(dplyr) num_mulheres_sobreviventes <- Titanic %>% filter(Sexo == "Feminino" & Sobreviveu == "Sobreviveu") %>% summarise(total = n()) num_mulheres_sobreviventes

Atividade 5: Quantas crianças sobreviveram?

{r num_criancas_sobreviventes <- Titanic %>% filter(Idade == "criança" & Sobreviveu == "Sobreviveu") %>% summarise(total = n()) num_criancas_sobreviventes

Atividade 6: Quantas pessoas da terceira classe sobreviveram?

{r num_terceira_classe_sobreviventes <- Titanic %>% filter(Classe == "Terceira" & Sobreviveu == "Sobreviveu") %>% summarise(total = n()) num_terceira_classe_sobreviventes

Atividade 7: Qual o percentual de mulheres que sobreviveu?

{r percentual_mulheres_sobreviventes <- Titanic %>% summarise(total_mulheres = sum(Sexo == "Feminino"), mulheres_sobreviventes = sum(Sexo == "Feminino" & Sobreviveu == "Sobreviveu"), percentual = (mulheres_sobreviventes / total_mulheres) * 100) percentual_mulheres_sobreviventes

Atividade 8: Qual o percentual de crianças que sobreviveu?

{r percentual_criancas_sobreviventes <- Titanic %>% summarise( total_criancas = sum(Idade == "criança"), criancas_sobreviventes = sum(Idade == "criança" & Sobreviveu == "Sobreviveu"), percentual = (criancas_sobreviventes / total_criancas) * 100) percentual_criancas_sobreviventes

Atividade 9: Qual o percentual da terceira classe que sobreviveu?

{r percentual_terceira_classe_sobreviventes <- Titanic %>% summarise( total_terceira_classe = sum(Classe == "Terceira"), terceira_classe_sobreviventes = sum(Classe == "Terceira" & Sobreviveu == "Sobreviveu"), percentual = (terceira_classe_sobreviventes / total_terceira_classe) * 100) percentual_terceira_classe_sobreviventes


8. Mais Dados

As análises gráficas são uma poderosa ferramenta para visualizar e interpretar dados, permitindo identificar padrões, tendências e relações que podem não ser imediatamente evidentes em tabelas ou estatísticas numéricas. No contexto dos dados do Titanic, a utilização de gráficos diversos, como gráficos de barras, gráficos de pizza, e mosaicos, proporciona uma representação visual clara das informações relacionadas à sobrevivência dos passageiros.

Atividade 10: Que tipo de gráfico você pode utilizar nesse tipo de dado? Por quê?

  1. Gráfico de Barras Um gráfico de barras pode mostrar o número de sobreviventes por classe.

  2. Gráfico de Pizza Um gráfico de pizza pode ilustrar a proporção de sobreviventes entre homens e mulheres.

  3. Gráfico de Colunas Empilhadas Um gráfico de colunas empilhadas pode mostrar a composição de sobreviventes e não sobreviventes por classe.

  4. Gráfico de Boxplot Um boxplot pode ilustrar a distribuição das idades entre sobreviventes e não sobreviventes.

  5. Gráfico de Dispersão Um gráfico de dispersão pode mostrar a relação entre idade e tarifa paga.

Atividade 11: Você poderia construir um gráfico para a variável “sobreviveu”?

{r library(dplyr) install.packages("ggplot2") library(ggplot2) {r sobreviventes_resumo <- Titanic %>% group_by(Sobreviveu) %>% summarise(total = n()) sobreviventes_resumo {r ggplot(sobreviventes_resumo, aes(x = Sobreviveu, y = total, fill = Sobreviveu)) + geom_bar(stat = "identity") + labs(title = "Quantidade de Sobreviventes no Titanic", x = "Sobreviveu", y = "Total") + scale_fill_manual(values = c("Sobreviveu" = "lightblue", "Não Sobreviveu" = "lightgreen")) + theme_minimal()

http://127.0.0.1:26761/graphics/97666023-dc6f-462a-897a-654e225ed3cc.png

Atividade 12: Você poderia construir um gráfico da variável “sobreviveu” por “sexo”?

{r sobreviventes_por_sexo <- Titanic %>% group_by(Sexo, Sobreviveu) %>% summarise(total = n(), .groups = 'drop') ggplot(sobreviventes_por_sexo, aes(x = Sexo, y = total, fill = Sobreviveu)) + geom_bar(stat = "identity", position = "dodge") + labs(title = "Sobrevivência por Sexo no Titanic", x = "Sexo", y = "Total") + scale_fill_manual(values = c("Sobreviveu" = "lightblue", "Não sobreviveu" = "salmon"), name = "Sobreviveu") + theme_minimal()

9. Nova visualização de dados.

Instalar e carregar o pacote ggpubr

{r install.packages("ggpubr") library(ggpubr)

Criar a tabela de contingência

Balloonplot

{r tabela <- table(Titanic$Classe, Titanic$Sobreviveu) tabela <- data.frame(tabela)

{r ggballoonplot(tabela, x = "Var1", y = "Var2", fill = "Freq") + ggtitle("Sobreviventes do Titanic") + labs(x = "Classe", y = "Sobreviveu") + scale_fill_gradient(low = "lightblue", high = "pink") + theme_minimal()

http://127.0.0.1:26761/graphics/1ae6c6d5-cc70-41e4-b49c-406c3d4138c6.png

Mosaicplot

{r tabela <- table(Titanic$Classe, Titanic$Sobreviveu) mosaicplot(tabela, main = "Sobreviventes do Titanic", color = c("red", "blue"), xlab = "Classe", ylab = "Sobreviveu")

http://127.0.0.1:26761/graphics/918caf5e-a2c8-42c3-82bc-0bb1bc2b1ecd.png

Atividade 13: Você poderia construir uma outra visualização de dados (além dessas duas)? Qual gráfico você sugere?

{r library(dplyr) library(ggplot2) sobrevivencia_por_classe <- Titanic %>% group_by(Classe, Sobreviveu) %>% summarise(total = n(), .groups = 'drop') ggplot(sobrevivencia_por_classe, aes(x = Classe, y = total, fill = Sobreviveu)) + geom_bar(stat = "identity") + labs(title = "Sobrevivência por Classe no Titanic", x = "Classe", y = "Total de Pessoas") + scale_fill_manual(values = c("Sobreviveu" = "lightblue", "Não sobreviveu" = "pink"), name = "Sobreviveu") + theme_minimal()

Atividade 14: Você consegue interpretar esses dois gráficos? o que eles estão dizendo?

O gráfico de mosaico exibe a proporção de sobreviventes e não sobreviventes dentro de cada classe. Cada retângulo representa um grupo específico de passageiros (por classe e status de sobrevivência), com a área proporcional ao número de pessoas nesse grupo.

O gráfico de barras empilhadas organiza as barras por classe e empilha a quantidade de sobreviventes e não sobreviventes. A altura total da barra representa o total de pessoas em cada classe, enquanto as seções coloridas mostram a quantidade de sobreviventes e não sobreviventes.

Atividade 15: Se você fosse fazer um Pitch (apresentação de 03 a 05 minutos) com recomendações sobre o Titanic a partir dos dados. Qual ideia você passaria? Quero um posicionamento!

Boa tarde a todos! Imagine o impacto de uma tragédia como o naufrágio do Titanic. Temos a chance de analisar dados reais desse evento e aprender lições valiosas que podem melhorar as práticas de segurança marítima e salvar vidas. Hoje, vou compartilhar insights críticos que esses dados revelam, com algumas recomendações práticas.”

Principais Achados:

Desigualdade na Sobrevivência por Classe:

Nossos dados mostram que passageiros da Primeira Classe tinham uma taxa de sobrevivência significativamente maior que os da Terceira Classe. Isso sugere que, na prática, o status social e o preço do bilhete determinaram as chances de sobrevivência, com passageiros de classe mais baixa ficando com menos acesso a botes salva-vidas. Diferença de Sobrevivência por Gênero e Idade:

Mulheres e crianças tiveram uma taxa de sobrevivência mais alta que homens, em parte pela implementação do protocolo “mulheres e crianças primeiro”. No entanto, essa regra não foi aplicada de forma uniforme entre as classes. Mulheres e crianças da Terceira Classe ainda tiveram uma taxa de sobrevivência menor em comparação com suas contrapartes da Primeira Classe.

Recomendações:

Acesso Igualitário aos Equipamentos de Segurança:

Garantir que os botes salva-vidas sejam distribuídos e acessíveis a todos os passageiros, independentemente da classe. Isso pode envolver a reformulação das áreas de resgate para facilitar o acesso. Treinamento de Emergência para Passageiros e Tripulação:

Implementar treinamentos regulares para passageiros e tripulação, especialmente para as classes mais baixas e áreas de serviço. Uma estratégia eficaz seria realizar simulações antes de cada partida, cobrindo as rotas de evacuação e pontos de encontro.

Revisão de Protocolos de Resgate:

Estabelecer normas que garantam que protocolos, como “mulheres e crianças primeiro,” sejam aplicados de forma igualitária para todos a bordo, assegurando um procedimento mais justo e seguro. Conclusão: “Essas mudanças poderiam ter evitado uma perda significativa de vidas no Titanic. Ao implementar esses protocolos, garantiríamos mais segurança em viagens futuras. Não se trata apenas de melhorar números, mas de valorizar cada vida a bordo. Obrigada!”