Atividades do Titanic

Atividade 1

Quantas pessoas tinha no Titanic? Quantas informações (variáveis) existem no banco de dados?

Ao carregar e olhar a base de dados nota-se que ela possui 2200 observações e 4 variáveis. Portanto haviam Titanic 2200 pessoas no Titanic e o banco fornece 4 informações sobre cada uma delas.

load("~/Aulas de Estatística/Base_de_dados-master/Titanic.RData")
View(Titanic)

Ao olhar a base de dados nota-se que existe um erro na variável Classe, a palavra Tripulação aparece de forma estranha por conta dos acentos existentes na palavra.

tail(Titanic$Classe)
## [1] Tripula\xe7\xe3o Tripula\xe7\xe3o Tripula\xe7\xe3o Tripula\xe7\xe3o
## [5] Tripula\xe7\xe3o Tripula\xe7\xe3o
## Levels: Tripula\xe7\xe3o Primeira Segunda Terceira

Para concertar isso informamos ao R que ele deve ler essa variável como UTF-8, então a palavra Tripulação passa a aparecer da forma correta.

Titanic$Classe = iconv(Titanic$Classe, "latin1", "UTF-8")
tail(Titanic$Classe)
## [1] "Tripulação" "Tripulação" "Tripulação" "Tripulação" "Tripulação"
## [6] "Tripulação"

Atividade 2

Quantas pessoas sobreviveram ao Titanic?

Ao criar uma variável que chamada TS que contém uma tabela só com a informação de sobrevivência o R cria uma tabela que mostra quantas pessoas sobreviveram e quantas não sobreviveram, dessa forma, podemos ver que sobreviveram 710 pessoas e morreram 1490 pessoas. Por consequência podemos também notar facilmente que menos da metade das pessoas que estavam no navio conseguiram se salvar.

TS = table(Titanic$Sobreviveu)
TS
## 
## Não sobreviveu     Sobreviveu 
##           1490            710

Atividade 3

Qual é a proporção de pessoas que sobreviveram ao Titanic?

A função prop.table nos mostra as distribuição das informações da tabela criada anteriormente em porcentagem, quantos porcento das pessoas sobreviveram e quantos porcento não sobreviveram. Assim, vemos que apenas 32,27% das pessoas sobreviveram ao naufrágio do Titanic, bem como que 67,73% não sobreviveram, reforçando o que já haviamos notado antes, que menos da metade das pessoas sobreviveram, mais precisamente aproximadamente um terço.

round(prop.table(TS)*100,2)
## 
## Não sobreviveu     Sobreviveu 
##          67.73          32.27

Atividade 4

Quantas mulheres sobreviveram?

Com a criação de uma tabela que mostra a relação entre sobreviventes e o sexo das pessoas, vemos que 344 mulheres sobreviveram. Em relação ao total de mulheres, isso é mais da metade. Porém, comparando com o total de pessoas que sobreviveram, podemos ver que o número de mulheres sobreviventes se aproxima de metade.

TS_sexo = table(Titanic$Sexo, Titanic$Sobreviveu)
TS_sexo
##            
##             Não sobreviveu Sobreviveu
##   Feminino             126        344
##   Masculino           1364        366

Atividade 5

Quantas crianças sobreviveram?

Na tabela de sobrevivência por idade vemos que apenas uma pequena parcela dos passageiros do Titanic eram crianças e pouco mais da metade, 57 no total, sobreviveram.

TS_idade = table(Titanic$Idade, Titanic$Sobreviveu)
TS_idade
##          
##           Não sobreviveu Sobreviveu
##   criança             52         57
##   adulto            1438        653

Atividade 6

Quantas pessoas da terceira classe sobreviveram?

Para saber quantas pessoas sobreviveram, assim como nas duas questões anteriores, fazemos uma tabela com as informações de sobrevivência, porém agora distribuída pela classe dos indivíduos. Ao olhar para a terceira classe vemos que 178 pessoas sobreviveram, o que é um número bem pequeno tendo em vista quantas faleceram, 528, é notório que houve uma grande incidência de morte entre quem pertencia a esta classe.

TS_classe = table(Titanic$Classe, Titanic$Sobreviveu)
TS_classe
##             
##              Não sobreviveu Sobreviveu
##   Primeira              122        202
##   Segunda               167        118
##   Terceira              528        178
##   Tripulação            673        212

Atividade 7

Qual o percentual de mulheres que sobreviveu?

Mais uma vez usando a função prop.table, agora com a tabela criada na questão 4, o R mostra o mesmo resultado, só que agora em porcentagem com relação á identificação de gênero. Dentre as pessoas indentificadas com o sexo feminino, 73,19% sobreviveu, um número que pode ser considerado alto e, como constatadona questão 4, significa que mais de metade das mulheres sobreviveram.

round(prop.table(TS_sexo,1)*100,2)
##            
##             Não sobreviveu Sobreviveu
##   Feminino           26.81      73.19
##   Masculino          78.84      21.16

Atividade 8

Qual o percentual de crianças que sobreviveu?

Repetindo o mesmo processo da questão anterior, conseguimos ver que 52,29% das crianças sobreviveram, como ja haviamos constatado na questão 5, significa pouco mais de metade das crianças, porém com a porcentagem isso fica bem mais óbvio.

round(prop.table(TS_idade,1)*100,2)
##          
##           Não sobreviveu Sobreviveu
##   criança          47.71      52.29
##   adulto           68.77      31.23

Atividade 9

Qual o percentual da terceira classe que sobreviveu?

Analisando a tabela de porcentagens de sobrevivência por classe temos que 25,21% das pessoas que estavam na terceira classe sobreviveram. Assim como constatado na questão 6, é não é uma quantidade grande do total de pessoas na terceira classe, mas, mais uma vez, a porcentagem torna isso mais fácil de perceber.

round(prop.table(TS_classe,1)*100,2)
##             
##              Não sobreviveu Sobreviveu
##   Primeira            37.65      62.35
##   Segunda             58.60      41.40
##   Terceira            74.79      25.21
##   Tripulação          76.05      23.95

Atividade 10

Que tipo de gráfico você pode utilizar nesse tipo de dado? Por quê?

Gráfico de pizza é uma boa opção uma vez que esse tipo de gráfico serve para mostrar um número estático, que representa as parcelas de um todo. Ele apresenta os valores em percentuais e a soma de todos é igual a 100%, assim é fácil ver a porcentagem que cada parte representa, que é o que é pedido nas questões 7, 8 e 9. Abaixo vemos os gráficos que representam estas três questões.

pie(table(Titanic$Sexo, exclude = "Masculino", Titanic$Sobreviveu),
    col = c("#8337a4", "#d488f7"),
    main = "Gráfico de sobrevivência entre as mulheres",
    labels = c("Não sobreviveu", "Sobreviveu"))

pie(table(Titanic$Idade, exclude = "adulto", Titanic$Sobreviveu),
    col = c("#a63756", "#ff7da2"),
    main = "Gráfico de sobreviência entre as crianças",
    labels = c("Não sobreviveu", "Sobreviveu"))

pie(table(Titanic$Classe, exclude = c("Primeira", "Segunda", "Tripulação"), Titanic$Sobreviveu),
    col = c("#ba631c", "#ffb77d"),
    main = "Gráfico de sobrevivência entre a terceira classe",
    labels = c("Não sobreviveu", "Sobreviveu"))

Atividade 11

Você poderia construir um gráfico para a variável “sobreviveu”?

Utilizando a função barplot, é possível criar um gráfico em barras que fornece uma representação visual das informações encontradas nas questões 2 e 3, a quantidade de pessoas que não sobreviveram é aproximadamente o dobro das que ficaram vivas, ou seja, dois terços do todo.

barplot(TS, col = c("skyblue3", "lightblue"), 
        ylim = c(0, 1500),
        main = "Gráfico de sobrevivência do Titanic",
        horiz = FALSE,
        legend.text = rownames(TS),
        args.legend = list(x = "topright"))

Atividade 12

Você poderia construir um gráfico da variável “sobreviveu” por “sexo”?

Neste gráfico, também em barras, percebemos que entre os sobreviventes o número de homens e mulheres é bem próximo, quase meio a meio. Já entre as pessoas que não sobreviveram a grande maioria era do sexo masculino. Os homens claramente eram maioria no navio, mas parece ter havido uma priorização das mulheres nos esforços para salvar as pessoas.

barplot(TS_sexo, col = c("pink", "lightblue"), 
        ylim = c(0, 1300),
        main = "Gráfico de sobrevivência do Titanic por sexo",
        horiz = FALSE, beside = TRUE,
        legend.text = rownames(TS_sexo),
        args.legend = list(x = "topright"))

Nova vizualização de dados

baloonplot

Não consegui fazer esse.

mosaicplot

mosaicplot(table(Titanic$Classe,Titanic$Sobreviveu), 
           main = "Sobreviventes do Titanic", 
           color = c("mediumaquamarine","lightgreen"))

Atividade 13

Você poderia construir uma outra visualização de dados (além dessas duas)? Qual gráfico você sugere?

O gráfico de barras é um dos melhores para esse tipo de variável pois nele é possível ver, assim como nos outros, claramente informações como: a primeira classe foi a única que teve mais sobreviventes que mortos, o que indica um possível privilegiamento dessa classe. Além disso, a maioria dos mortos pertenciam à terceira classe ou à tripulação.

barplot(TS_classe, ylim = c(0, 700),
        col = c("gold","grey","orange3","brown"), 
        main = "Gráfico de sobrevivência do Titanic por classe",
        horiz = FALSE, beside = TRUE,
        legend.text = rownames(TS_classe),
        args.legend = list(x = "topright"))

Atividade 14

Você consegue interpretar esses dois gráficos? o que eles estão dizendo?

Assim como no gráfico de barras, é possível ver que existe uma concentraçao de não sobreviventes entre a terceira classe e a tripulação, possivelmente por terem sido “deixados para trás”, já que, dado que a primeira classe é a única que tem mais sobreviventes que mortos, esta parece ter sido privilegiada em questão de acesso a botes salva vidas.

Também é notório que não existe uma discrepância tão grande entre sobreviventes e não sobrevieventes na primeira e segunda classes como existe na terceira classe e na tripulação, mais um indício de que as classes mais baixas não conseguiram salvar muito.

Atividade 15

Se você fosse fazer um Pitch (apresentação de 03 a 05 minutos) com recomendações sobre o Titanic a partir dos dados. Qual ideia você passaria? Quero um posicionamento!

O Titanic era um navio grande com uma estrutura enorme que levava cerca de 2.200 pessoas e marcou a história como uma das maiores catástrofes marítimas que já aconteceram. Com uma taxa de sobrevivência de apenas 32,27%, o desastre é apresenta lições valiosas sobre a importância de ter uma estrutura segura e de como desigualdade afeta situações de crise.

Dentre as mulheres a taxa de sobrevivência foi de 73,19% enquanto entre os homens foi de 21,16%. Dividindo por classe social temos que: Na primeira classe a taxa de sobrevivência foi de 62,35%, na segunda classe foi de 41,40%, na terceira classe tivemos 25,21% de sobrevivência e na tripulação somente 23,95% sobreviveram. Esses dados mostram que a sobrevivência estava diretamente ligada ao gênero e classe social, mostrando que, até mesmo em moentos de crises tais fatores se demonstram fortes.

Diante do disposto, fica claro que a tragédia do Titanic não foi apenas um evento de fatalidade, mas também um espelho das desigualdades sociais da época. As mulheres tiveram taxas de sobrevivência expressiavmente mais altas que os homens, principalmente os que pertenciam à terceira classe e à tripulação. Isso levanta questões éticas sobre como foi feita a evacuação e como foram tomadas as decisões, visto que a elite claramente teve prioridade.

Em conclusão, fica claro que é muito importante que todos os sistemas de transporte de passageiros implementem protocolos de segurança e treinamento adequados para a tripulação. Tmabém é essencial manter a equidade em situações de emergência para não sejam baseados em preconceitos sociais ou de gênero.