Trabalho Estatística Titanic

Feito por: Luiza Porto Felix da Silva

Matrícula: 20241520030

Email:

#Carregando dados

load(url("https://github.com/DATAUNIRIO/Base_de_dados/raw/master/Titanic.RData"))
ls()
## [1] "Titanic"

#1: Quantas pessoas tinha no Titanic? Quantas informações (variáveis) existem no banco de dados?

num_pessoas <- nrow(Titanic)
print(num_pessoas)
## [1] 2200

Resposta: O total de pessoas presentes no itanic, de acordo com o banco de dados apresentado, é 2200.

num_variaveis <- ncol(Titanic)
print(num_variaveis)
## [1] 4

Resposta: Há 4 variáveis existentes nesse banco, que são: Classe, Idade, Sexo e Sobreviveu.

#2:Quantas pessoas sobreviveram ao Titanic?

num_sobreviventes <- sum(Titanic$Sobreviveu == "Sobreviveu")
print(num_sobreviventes)
## [1] 710

Resposta: De acordo com o banco de dados, 710 pessoas conseguiram sobreviver ao Titanic.

#3:Qual é a proporção de pessoas que sobreviveram ao Titanic?

num_total <- nrow(Titanic)
proporcao_sobreviventes <- num_sobreviventes / num_total
print(proporcao_sobreviventes)
## [1] 0.3227273
proporcao_sobreviventes_percentual <- proporcao_sobreviventes * 100
print(proporcao_sobreviventes_percentual)
## [1] 32.27273

Resposta: Fazendo a proporção, encontra-se que 32.27273% das pessoas que estavam presentes sobreviveram ao Titanic.

#4:Quantas mulheres sobreviveram?

num_mulheres_sobreviventes <- sum(Titanic$Sexo == "Feminino" & Titanic$Sobreviveu == "Sobreviveu")
print(num_mulheres_sobreviventes)
## [1] 344

Resposta: De acordo com a base de dados, 344 mulheres sobreviveram ao Titanic.

#5:Quantas crianças sobreviveram?

num_criancas_sobreviventes <- sum(Titanic$Idade == "criança" & Titanic$Sobreviveu == "Sobreviveu")
print(num_criancas_sobreviventes)
## [1] 57

Resposta: De acordo com a base de dados, 57 crianças sobreviveram ao Titanic.

#6:Quantas pessoas da terceira classe sobreviveram?

num_terceira_classe_sobreviventes <- sum(Titanic$Classe == "Terceira" & Titanic$Sobreviveu == "Sobreviveu")
print(num_terceira_classe_sobreviventes)
## [1] 178

Resposta: De acordo com a base de dados, 178 pessoas da terceira classe sobreviveram.

#7:Qual o percentual de mulheres que sobreviveu?

num_total_mulheres <- sum(Titanic$Sexo == "Feminino")
percentual_mulheres_sobreviventes <- (num_mulheres_sobreviventes / num_total_mulheres) * 100
print(percentual_mulheres_sobreviventes)
## [1] 73.19149

Resposta: Fazendo o percentual, encontra-se que 73.19149% das mulheres que estavam no Titanic sobreviveram.

#8:Qual o percentual de crianças que sobreviveu?

num_total_criancas <- sum(Titanic$Idade == "criança")
percentual_criancas_sobreviventes <- (num_criancas_sobreviventes / num_total_criancas) * 100
print(percentual_criancas_sobreviventes)
## [1] 52.29358

Resposta: Fazendo o percentual, encontra-se que 52.29358% das crianças que estavam presentes no Titanic sobreviveram.

#9:Qual o percentual da terceira classe que sobreviveu?

num_total_terceira_classe <- sum(Titanic$Classe == "Terceira")
percentual_terceira_classe_sobreviventes <- (num_terceira_classe_sobreviventes / num_total_terceira_classe) * 100
print(percentual_terceira_classe_sobreviventes)
## [1] 25.21246

Resposta: Fazendo o percentual, encontra-se que 25.21246% de pessoas da terceira classe sobreviveram.

#10: Que tipo de gráfico você pode utilizar nesse tipo de dado? Por quê? Resposta: Como foi aprendido na aula do dia 11/10, o histograma e o gráfico de pizza são ideais para variáveis quantitativas, que é o caso do exercício. Entre esses dois, eu escolho o histograma pela quantidade de variáveis presentes, uma vez que, na minha opinião, não iria ficar legal no gráfico de pizza.

#11: Você poderia construir um gráfico para a variável “sobreviveu”?

library(ggplot2)
ggplot(Titanic, aes(x= Sobreviveu)) +
  geom_bar(fill = "skyblue") +
  labs(title = "Distribuição de Sobreviventes", x = "Situação", y = "Número de Pessoas") +
  theme_minimal()

#12:Você poderia construir um gráfico da variável “sobreviveu” por “sexo”?

ggplot(Titanic, aes(x= Sobreviveu, fill = Sexo)) +
  geom_bar(position = "dodge") +
  labs(title = "Distribuição de Sobreviventes por Sexo", x = "Situação", y = "Número de Pessoas") +
  theme_minimal() +
  scale_fill_manual(values = c("Feminino" = "lightpink", "Masculino" = "lightblue"))

#13: Você poderia construir uma outra visualização de dados (além dessas duas)? Qual gráfico você sugere?

Resposta: Eu pesquisei bastante sobre outras formas de visualização de dados, e encontrei o Heatmap, que utiliza cores para indicar a intensidade ou a frequência de valores em um conjunto de dados. Para ser sincera, em uma apresentação ou trabalho sobre Titanic eu não utilizaria ele, pois acho que perde os detalhes e dificulta um pouco o entendimento, mas dentre as opções que eu pesquisei, achei que essa foi a mais criativa e coerente com esse caso.

tabela_contingencia_idade <- table(Titanic$Idade, Titanic$Sobreviveu)
print(tabela_contingencia_idade)
##          
##           Não sobreviveu Sobreviveu
##   criança             52         57
##   adulto            1438        653
tabela_df_idade <- as.data.frame(tabela_contingencia_idade)
str(tabela_df_idade)
## 'data.frame':    4 obs. of  3 variables:
##  $ Var1: Factor w/ 2 levels "criança","adulto": 1 2 1 2
##  $ Var2: Factor w/ 2 levels "Não sobreviveu",..: 1 1 2 2
##  $ Freq: int  52 1438 57 653
ggplot(tabela_df_idade, aes(x = Var1, y = Var2, fill = Freq)) +
  geom_tile(color = "red") +
  scale_fill_gradient(low = "red", high = "blue") +
  labs(title = "Heatmap de Sobreviventes por Idade", x = "Idade", y = "Sobreviveu") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

#14: Você consegue interpretar esses dois gráficos? O que eles estão dizendo?

Resposta: Os dois gráficos indicam sobre o número de sobreviventes do Titanic, os dividindo em classes e se sobreviveram ou não. Fazendo um resumo dos gráficos, pode-se chegar à conclusão que passageiros da primeira classe apresentaram mais sobreviventes, enquanto os da segunda e da terceira apresentaram menos.

#15: Se você fosse fazer um Pitch (apresentação de 03 a 05 minutos) com recomendações sobre o Titanic a partir dos dados. Qual ideia você passaria? Quero um posicionamento!

Resposta: Através da análise estatística dos dados do Titanic, é possível extrair informações significativas que revelam como se organizaram, o que foi feito de forma correta/eficaz e o que podia ter sido crucial.

Uma das primeiras impressões é a clara disparidade nas taxas de sobrevivência entre os gêneros. As visualizações indicam que as mulheres tiveram uma probabilidade significativamente maior de sobreviver em comparação aos homens. Foi possível visualizar esse dado através de gráficos de barra que mostram a contagem de sobreviventes em relação ao sexo, destacando o impacto de políticas de resgate que priorizavam mulheres e crianças. Além disso, a análise da classe social também revela que os passageiros da primeira classe apresentaram uma taxa de sobrevivência superior em relação aos das classes inferiores. Isso evidencia como as desigualdades estão enraizadas na sociedade até mesmo em uma situação de emergência.

A visualização dos dados relacionados à idade dos passageiros nos mostra outro ponto importante: a diferença entre crianças e adultos. Os dados mostram que as crianças tiveram uma taxa de sobrevivência considerável. Essa descoberta reforça a necessidade de um planejamento de evacuação que considere as características dos passageiros, garantindo que grupos mais vulneráveis sejam adequadamente atendidos durante emergências.

Como eu falei no início, essas visualizações não apenas fornecem um entendimento mais profundo sobre os fatores que influenciaram a sobrevivência, mas também destacam áreas em que melhorias podem ser feitas. A análise dos dados sugere que, em situações de crise, é fundamental ter protocolos de evacuação que priorizem a segurança de mulheres, crianças e grupos vulneráveis, independentemente de sua classe social. Além disso, a comunicação eficaz durante emergências é crucial.

Em resumo, as impressões obtidas a partir das análises revelam a importância de uma abordagem inclusiva e equitativa em situações de emergência.