#Antes devemos baixar a base de dados
load(url("https://github.com/DATAUNIRIO/Base_de_dados/raw/master/Titanic.RData"))
ls()
## [1] "Titanic"
#Depois corrigi-la
Titanic$Classe = iconv(Titanic$Classe, "latin1", "UTF-8")
#Questão 1 - Quantas pessoas tinha no Titanic? Quantas informações (variáveis) existem no banco de dados? |
R: Após baixar e corrigir a base dados podemos dizer que haviam 2200 pessoas a bordo da embarcação.Existem apenas 4 variáveis (classe,sexo,idade e sobreviveu).
#Questão 2 - Quantas pessoas sobreviveram ao Titanic? |
tabela_sobrevivencia = table(Titanic$Sobreviveu)
tabela_sobrevivencia
##
## Não sobreviveu Sobreviveu
## 1490 710
R: Pela análise da tabela conseguimos descobrir que 710 pessoas sobreviveram ao acidente.
#Questão 3 - Qual é a proporção de pessoas que sobreviveram ao Titanic? |
prop.table(tabela_sobrevivencia)
##
## Não sobreviveu Sobreviveu
## 0.6772727 0.3227273
round(prop.table(tabela_sobrevivencia)*100,1)
##
## Não sobreviveu Sobreviveu
## 67.7 32.3
R: Feita a análise descobrimos que a proporção é de 32.3% para sobreviventes.
#Questão 4 - Quantas mulheres sobreviveram? |
#Vamos ter que mesclar as variáveis “sobreviveu” e “sexo”
table(Titanic$Sobreviveu,Titanic$Sexo)
##
## Feminino Masculino
## Não sobreviveu 126 1364
## Sobreviveu 344 366
R: Pela tabela vizualizamos que o número de mulheres que sobreviveram foi de 344.
#Questão 5 - Quantas crianças sobreviveram? |
#Vamos mesclar as variáveis “sobreviveu” e “idade”
table(Titanic$Sobreviveu,Titanic$Idade)
##
## criança adulto
## Não sobreviveu 52 1438
## Sobreviveu 57 653
R: Pela tabela encontramos que 57 crianças sobreviveram.
#Questão 6 - Quantas pessoas da terceira classe sobreviveram? |
#Vamos mesclar as variáveis “sobreviveu” e “classe”
table(Titanic$Sobreviveu,Titanic$Classe)
##
## Primeira Segunda Terceira Tripulação
## Não sobreviveu 122 167 528 673
## Sobreviveu 202 118 178 212
R: Após análise dos dados é determinado que 178 pesssoas da terceira classe sobreviveram.
#Questão 7 - Qual o percentual de mulheres que sobreviveu? |
T7 = table(Titanic$Sobreviveu,Titanic$Sexo)
T7
##
## Feminino Masculino
## Não sobreviveu 126 1364
## Sobreviveu 344 366
round(prop.table(T7,2)*100,1)
##
## Feminino Masculino
## Não sobreviveu 26.8 78.8
## Sobreviveu 73.2 21.2
R: Pelos dados obtidos na tabela o percentual de mulheres que sobreviveu ao acidente foi de 73.2%.
#Questão 8 - Qual o percentual de crianças que sobreviveu? |
T2 = table(Titanic$Sobreviveu,Titanic$Idade)
round(prop.table(T2,2)*100,1)
##
## criança adulto
## Não sobreviveu 47.7 68.8
## Sobreviveu 52.3 31.2
R: Pela análise dos dados econtramos que o percentual de crianças que sobreviveram foi de 52.3%.
#Questão 9 - Qual o percentual da terceira classe que sobreviveu? |
T3 = table(Titanic$Sobreviveu,Titanic$Classe)
round(prop.table(T3,2)*100,1)
##
## Primeira Segunda Terceira Tripulação
## Não sobreviveu 37.7 58.6 74.8 76.0
## Sobreviveu 62.3 41.4 25.2 24.0
R: Por meio da tebela descobrimos que o percentual de sobreviventes na terceira classe foi de 25.2%.
#Questão 10 - Que tipo de gráfico você pode utilizar nesse tipo de dado? Por quê? |
R: Acredito que o gráfico mais apropriado seria o de barra, pois ele me permite detalhar, vizualizar e comparar os diferentes pontos quantitativos e qualitativos de diferentes variáveis,em suas devidas proporções. Me possibilitando traçar um paralelo bem claro no momento de evidênciar as diversas possibilidades de informações no banco de dados, sobre o Titanic.
#Questão 11 - Você poderia construir um gráfico para a variável “sobreviveu”? |
R: Claro!
T6 = table(Titanic$Sobreviveu)
bp6 <- barplot(T6,col=c("red","lightgreen"),
main = "Tabela sobrevivência",
ylim = c(0,2300), ylab = "Quantidade de sobreviventes")
percentual6 <- round(prop.table(T6)*100,digits = 1)
percentual6
##
## Não sobreviveu Sobreviveu
## 67.7 32.3
rotulo <- paste0(percentual6,"%")
rotulo
## [1] "67.7%" "32.3%"
text(bp6, 0, rotulo,cex=1.6,pos=3,col = "black")
#Questão 12 - Você poderia construir um gráfico da variável “sobreviveu” por “sexo”? |
R: Claro!
T7 = table(Titanic$Sobreviveu,Titanic$Sexo)
bp <- barplot(T7,col=c("deeppink","cyan"),
main = "Tabela sobrevivência por sexo",
horiz = FALSE, beside = TRUE,
legend.text = rownames(T7),
ylim = c(0,2300), ylab = "Quantidade de sobreviventes",
xlab = "Sexo dos sobreviventes",
args.legend = list(x = "topleft"))
percentual <- round(prop.table(T7,2)*100,digits=1)
percentual
##
## Feminino Masculino
## Não sobreviveu 26.8 78.8
## Sobreviveu 73.2 21.2
rotulo <- paste0(percentual,"%")
rotulo
## [1] "26.8%" "73.2%" "78.8%" "21.2%"
text(bp, 0, rotulo,cex=0.8,pos=3,col = "black")
#Questão 13 - Você poderia construir uma outra visualização de dados (além dessas duas)? Qual gráfico você sugere? |
R: Claro! Eu iria sugerir o gráfico de pizza que é bem simples e intuitivo.
tabela_sexo = table(Titanic$Sexo)
tabela_sexo
##
## Feminino Masculino
## 470 1730
pie(tabela_sexo,
col = c("gray", "darkgoldenrod1"),
main = "Gráfico de Pizza - Sobrevivência do Titanic")
#Questão 14 - Você consegue interpretar esses dois gráficos? o que eles estão dizendo? |
R: Sim. Ambos os gráficos tratam do mesmo assunto, a proporção entre os sobreviventes e não sobreviventes nas diferentes classes, deixando claro que os mais afetados foram os passageiros da terceira classe e tribulação, que pelo seu alto contingente de pessoas tiveram um número muito elevado de não sobreviventes. Dessa forma, os gráficos evidenciam que quanto maior a classe menor é a taxa de mortos.
#Questão 15 - Se você fosse fazer um Pitch (apresentação de 03 a 05 minutos) com recomendações sobre o Titanic a partir dos dados. Qual ideia você passaria? Quero um posicionamento! |
R: Nesse contexto, acredito que assuntos como o nível de segurança e estratégias de emergência em caso de evacuação deveriam ser amplamente discutidas. Por essa ótica, após as diversas análises de dados é evidente que a taxa de mortos foi concentrada em grande parte na ala mais pobre do navio e na tripulação, já que muito provavelmente quando o caos se instaurou na embarcação não deviam existir sáidas de emergência suficientes e apropriadas para comportar o grande número de pessoas e assim privilegiando as classes mais altas que por esse fator tiveram um acesso maior e mais fácil ao meios de segurança e emergência do navio.Portanto, é de suma a irresponsabilidade da empresa que fabricou o Titanic, pois não levou em consideração em nenhum momento a integridade física de seus tripulantes e embarcados mais pobres que por um erro de projeto sofreram demasiadamente com o ocorrido. Ademais, alem disso, um outro fator a se levar em conta é a presença de crianças na embarcação que como visto nas análises tiveram um índice muito alto de não sobreviventes. Por esse contexto, acredito que a empresa que fretou o Titanic deveria ter alertado seus embarcados do risco de exercer uma viagem marítima com crianças, para dessa maneira diminuir ou até evitar de ter crianças a bordo, já que em caso de acidente elas fariam parte de um grupo de risco que estaria completamente indefeso e a deriva dos adultos para sobreviverem. Logo, limitar a ou até proibir a entratada de crianças no Titanic poderia tanto ter evitado a alta taxa de jovens não sobreviventes, quanto aumentar a taxa de adultos que por não terem essa responsabilidade atrelada a eles facilitaria as chances de sobreviveência. Portanto, projetar uma embarcação que não estava preparada para comportar esse alto contigente de pessoas foi o principal erro do Titanic.