library(forcats)
library(ggplot2)
library(ggpubr)
load(url("https://github.com/DATAUNIRIO/Base_de_dados/raw/master/Titanic.RData"))
ls()
## [1] "Titanic"
str(Titanic)
## 'data.frame': 2200 obs. of 4 variables:
## $ Classe : Factor w/ 4 levels "Tripula\xe7\xe3o",..: 2 2 2 2 2 2 2 2 2 2 ...
## $ Idade : Factor w/ 2 levels "criança","adulto": 2 2 2 2 2 2 2 2 2 2 ...
## $ Sexo : Factor w/ 2 levels "Feminino","Masculino": 2 2 2 2 2 2 2 2 2 2 ...
## $ Sobreviveu: Factor w/ 2 levels "Não sobreviveu",..: 2 2 2 2 2 2 2 2 2 2 ...
head(Titanic$Classe)
## [1] Primeira Primeira Primeira Primeira Primeira Primeira
## Levels: Tripula\xe7\xe3o Primeira Segunda Terceira
tail(Titanic$Classe)
## [1] Tripula\xe7\xe3o Tripula\xe7\xe3o Tripula\xe7\xe3o Tripula\xe7\xe3o
## [5] Tripula\xe7\xe3o Tripula\xe7\xe3o
## Levels: Tripula\xe7\xe3o Primeira Segunda Terceira
#Tripulação está escrita de forma errada
Titanic$Classe = iconv(Titanic$Classe, "latin1", "UTF-8")
str(Titanic)
## 'data.frame': 2200 obs. of 4 variables:
## $ Classe : chr "Primeira" "Primeira" "Primeira" "Primeira" ...
## $ Idade : Factor w/ 2 levels "criança","adulto": 2 2 2 2 2 2 2 2 2 2 ...
## $ Sexo : Factor w/ 2 levels "Feminino","Masculino": 2 2 2 2 2 2 2 2 2 2 ...
## $ Sobreviveu: Factor w/ 2 levels "Não sobreviveu",..: 2 2 2 2 2 2 2 2 2 2 ...
tail(Titanic$Classe)
## [1] "Tripulação" "Tripulação" "Tripulação" "Tripulação" "Tripulação"
## [6] "Tripulação"
View(Titanic)
#resolvido
#1- Quantas pessoas tinha no Titanic? Quantas informações (variáveis) existem no banco de dados? 2200, 4
quantidade_pessoas <- nrow(Titanic)
print(paste("Quantidade de pessoas no Titanic:", quantidade_pessoas))
## [1] "Quantidade de pessoas no Titanic: 2200"
quantidade_variaveis <- ncol(Titanic)
print(paste("Quantidade de variáveis no banco de dados:", quantidade_variaveis))
## [1] "Quantidade de variáveis no banco de dados: 4"
nota: As informações também podem ser encontradas ao final da tabela, onde cada linha representa uma pessoa, referida como “entry” (entrada), e cada coluna representa uma variável específica, chamada de “column” (coluna). Essa organização é fundamental, pois proporciona uma estrutura clara que facilita a análise dos dados. Poder visualizar as entradas e suas respectivas variáveis me permitiu não apenas entender melhor a composição do conjunto de dados, mas também confirmar que estava no caminho certo em minha análise.
#2- Quantas pessoas sobreviveram ao Titanic? 710
tabela_sobrevivencia = table(Titanic$Sobreviveu)
tabela_sobrevivencia
##
## Não sobreviveu Sobreviveu
## 1490 710
#3- Qual é a proporção de pessoas que sobreviveram ao Titanic? 32,27%
round(prop.table(tabela_sobrevivencia)*100,2)
##
## Não sobreviveu Sobreviveu
## 67.73 32.27
nota: A proporção de pessoas que sobreviveram ao Titanic pode ser calculada dividindo o número de sobreviventes pelo número total de pessoas a bordo. Nesse caso, a proporção é aproximadamente 0,32, o que significa que um terço dos ocupantes sobreviveu ao naufrágio.
#4- Quantas mulheres sobreviveram? 344
tabela_sobrevivencia_sexo <- table(Titanic$Sexo, Titanic$Sobreviveu)
tabela_sobrevivencia_sexo
##
## Não sobreviveu Sobreviveu
## Feminino 126 344
## Masculino 1364 366
#5- Quantas crianças sobreviveram? 57
tabela_sobrevivencia_idade <- table(Titanic$Idade, Titanic$Sobreviveu)
tabela_sobrevivencia_idade
##
## Não sobreviveu Sobreviveu
## criança 52 57
## adulto 1438 653
#6- Quantas pessoas da terceira classe sobreviveram? 178
tabela_sobrevivencia_classe <- table(Titanic$Classe, Titanic$Sobreviveu)
tabela_sobrevivencia_classe
##
## Não sobreviveu Sobreviveu
## Primeira 122 202
## Segunda 167 118
## Terceira 528 178
## Tripulação 673 212
#7- Qual o percentual de mulheres que sobreviveu? 15.64%
tabela_sobrevivencia_sexo <- table(Titanic$Sexo, Titanic$Sobreviveu)
tabela_sobrevivencia_sexo
##
## Não sobreviveu Sobreviveu
## Feminino 126 344
## Masculino 1364 366
round(prop.table(tabela_sobrevivencia_sexo)*100,2)
##
## Não sobreviveu Sobreviveu
## Feminino 5.73 15.64
## Masculino 62.00 16.64
#8- Qual o percentual de crianças que sobreviveu? 2.59%
tabela_sobrevivencia_idade <- table(Titanic$Idade, Titanic$Sobreviveu)
tabela_sobrevivencia_idade
##
## Não sobreviveu Sobreviveu
## criança 52 57
## adulto 1438 653
round(prop.table(tabela_sobrevivencia_idade)*100,2)
##
## Não sobreviveu Sobreviveu
## criança 2.36 2.59
## adulto 65.36 29.68
nota: Essa parte das questões me exigiu um pouco mais de tempo, pois precisei testar diferentes combinações para entender como unir informações de duas variáveis em um único percentual. Esse processo de experimentação foi fundamental, pois envolveu a análise cuidadosa dos dados disponíveis e a aplicação de diferentes funções em R para calcular as proporções corretas. Ao tentar diversas abordagens, consegui encontrar a maneira mais eficaz de representar essas informações, o que não só me ajudou a esclarecer os dados, mas também proporcionou um entendimento mais profundo sobre as relações entre as variáveis.
#9- Qual o percentual da terceira classe que sobreviveu? 8.09%
tabela_sobrevivencia_classe <- table(Titanic$Classe, Titanic$Sobreviveu)
tabela_sobrevivencia_classe
##
## Não sobreviveu Sobreviveu
## Primeira 122 202
## Segunda 167 118
## Terceira 528 178
## Tripulação 673 212
round(prop.table(tabela_sobrevivencia_classe)*100,2)
##
## Não sobreviveu Sobreviveu
## Primeira 5.55 9.18
## Segunda 7.59 5.36
## Terceira 24.00 8.09
## Tripulação 30.59 9.64
#10- Que tipo de gráfico você pode utilizar nesse tipo de dado? Por quê?
Para visualizar os dados sobre a sobrevivência no Titanic, gráficos de barras são bastante eficazes, pois permitem comparar claramente as categorias, como sexo e classe social. Gráficos de pizza também podem ser usados, mas são menos eficazes para comparações diretas entre categorias, enquanto gráficos de barras destacam as diferenças de forma mais clara.
#11- Você poderia construir um gráfico para a variável “sobreviveu”?
pie(tabela_sobrevivencia)
pie(tabela_sobrevivencia, main = "Gráfico 1 - Sobreviventes Titanic")
pie(tabela_sobrevivencia, col = c("green", "pink"),
main = "Gráfico 1 - Sobreviventes do Titanic")
nota: Esse gráfico foi inspirado na representação feita pelo professor na segunda aula, que utilizou uma paleta de cores vibrantes e características da escola de samba Mangueira, como foma de descontração durante a aula, tendo em vista que nesse momento todos começaram a usar suas cores favoritas e juntar combinações que faziam referência a algo que gostavam.
#12- Você poderia construir um gráfico da variável “sobreviveu” por “sexo”?
T1 = table(Titanic$Sexo, Titanic$Sobreviveu)
T1
##
## Não sobreviveu Sobreviveu
## Feminino 126 344
## Masculino 1364 366
barplot(T1)
bp = barplot(T1,
col=c("deeppink","skyblue"),
main= "Relação entre sobreviventes por sexo",
horiz = FALSE, beside=TRUE,
legend.text = rownames(T1),
args.legend = list(x = "topleft"))
percentual <- round(prop.table(tabela_sobrevivencia_sexo)*100,2)
percentual
##
## Não sobreviveu Sobreviveu
## Feminino 5.73 15.64
## Masculino 62.00 16.64
rotulo <-paste0(percentual,"%")
rotulo
## [1] "5.73%" "62%" "15.64%" "16.64%"
text(bp,1, rotulo,cex=1.6,pos=3, col ="black")
nota: Nesse eu tive uma dificuldade maior por ter começado a realizar o trabalho antes da aula que foi de fato, apresentado esse comando. Em primeiro momento, utilizei do gráfico de pizza, unindo as quatro categorias, o que dificultou a vizualização para interpretar esses dados já que é preciso levar em consideração o conhecimento adiquirido em uma das primeiras aulas, onde foram apontadas as diferenças entre variável quantitativa e qualitativa
#13- Você poderia construir uma outra visualização de dados (além dessas duas)? Qual gráfico você sugere?
T2 = table(Titanic$Classe, Titanic$Sobreviveu)
T2
##
## Não sobreviveu Sobreviveu
## Primeira 122 202
## Segunda 167 118
## Terceira 528 178
## Tripulação 673 212
barplot(T2)
bp = barplot(T2,
col=c("violet","lightgreen", "darkblue", "yellow"),
main= "Relação entre sobreviventes por classe",
horiz = FALSE, beside=TRUE,
legend.text = rownames(T2),
args.legend = list(x = "topleft"))
#14- Você consegue interpretar esses dois gráficos? o que eles estão dizendo?
Primeiro Gráfico (Mosaico) O gráfico de mosaico ilustra a proporção de sobreviventes e não sobreviventes do Titanic, divididos entre tripulação e classes de passageiros. A maioria da tripulação e da Terceira Classe não sobreviveu, enquanto uma parcela significativa da Primeira Classe sobreviveu, destacando uma diferença nas chances de sobrevivência entre as classes sociais.
Segundo Gráfico (Bolhas) O gráfico de bolhas mostra a frequência de sobreviventes e não sobreviventes do Titanic. As bolhas maiores e mais claras representam um número maior de pessoas. Observa-se que a tripulação e a Terceira Classe têm as maiores bolhas na categoria de “Não sobreviveu”, indicando que essas categorias foram as mais impactadas em termos de mortalidade.
O gráfico de mosaico destaca as proporções de sobreviventes e não sobreviventes por grupo, mostrando que a Primeira Classe teve mais sobreviventes em relação à Terceira Classe e à tripulação. Já o gráfico de bolhas foca nas frequências absolutas, com bolhas maiores indicando um maior número de não sobreviventes na tripulação e na Terceira Classe. Ambos revelam a disparidade nas taxas de sobrevivência entre as classes e a tripulação.
#15- Se você fosse fazer um Pitch (apresentação de 03 a 05 minutos) com recomendações sobre o Titanic a partir dos dados. Qual ideia você passaria? Quero um posicionamento!
Pitch: Lições do Titanic para uma Segurança Mais Justa e Inclusiva
Os dados de sobrevivência do Titanic mostram algo alarmante: a chance de sobreviver ao naufrágio dependia mais da classe social do que de qualquer outro fator. Passageiros da Primeira Classe tiveram uma taxa de sobrevivência significativamente maior do que os da Terceira Classe e a tripulação. Esta desigualdade no acesso aos recursos de resgate levanta uma questão crucial: como podemos aprender com isso para garantir que, em emergências futuras, todos tenham a mesma oportunidade de sobrevivência, independentemente de sua posição social?
A tragédia do Titanic não foi apenas uma falha de engenharia, mas também uma falha social. Naquele navio, a organização de resgate priorizou os mais ricos, deixando muitos passageiros de classes mais baixas e membros da tripulação em desvantagem. Isso evidencia que, em situações de emergência, as desigualdades pré-existentes se amplificam. Assim, precisamos garantir que a segurança seja uma prioridade universal, não um privilégio para poucos.
A partir dos dados, recomendo três ações principais para uma resposta mais justa e efetiva em futuras situações de emergência:
Treinamento de Tripulação e Procedimentos de Resgate Uniformes: É fundamental que a tripulação esteja treinada para resgatar de forma igualitária, com protocolos que assegurem informações e suporte para todos os passageiros, independentemente da classe.
Redistribuição de Recursos de Resgate: A estrutura interna dos navios e espaços públicos deve permitir acesso igualitário aos botes e saídas de emergência para todas as classes, evitando barreiras de acesso aos recursos.
Prioridade Baseada em Vulnerabilidade: Em vez de priorizar passageiros pela classe social, os procedimentos de emergência deveriam considerar a vulnerabilidade, como crianças, idosos e pessoas com limitações físicas, para assegurar que o resgate seja humanitário e justo.
A lição que o Titanic nos deixou vai além da necessidade de construir embarcações seguras. Precisamos de um sistema de segurança inclusivo, onde todos tenham as mesmas chances em caso de emergência. Se não aprendermos com esses erros do passado, corremos o risco de repetir injustiças que poderiam ser evitadas. Que a segurança seja um direito universal, e não um privilégio para poucos.