Atividade 1 - Perguntas sobre o Titanic

Aluna: Sophia Escodine Gomes

Matrícula: 20241520021

Professor: Steven Dutt-Ross

#Passo 1: Abrir a base de dados chamada “Titanic.RData”.

load("C:/Users/Sophia Gomes/Desktop/Base_de_dados-master/Titanic.RData") View(Titanic)

#Passo 2 - Olhar a base de dados

str(Titanic) head(Titanic$Classe) tail(Titanic$Classe)

#A palavra Tripulação está escrita de forma errada

#Passo 3 - Corrigir o problema

Titanic$Classe = iconv(Titanic$Classe, "latin1", "UTF-8")

#Passo 4 - Verificar se o problema foi corrigido

str(Titanic) tail(Titanic$Classe) View(Titanic)

#Problema resolvido!

#Passo 5- Baixar os pacotes que serão necessários para essa atividade

library(forcats) library(ggplot2) library(ggpubr)

#Hora de começar a atividade!

#1- Conheça os seus dados:

#Pergunta 1: Quantas pessoas tinham no Titanic? Quantas informações (variáveis) existem no banco de dados?

#Resposta: Podemos observar a partir do número de linhas que haviam 2200 pessoas no Titanic. Já se observarmos o número de colunas, vemos que existem 4 variáveis no banco de dados.

#Pergunta 2: Quantas pessoas sobreviveram ao Titanic?

tabela_sobrevivencia = table(Titanic$Sobreviveu) tabela_sobrevivencia

#Resposta: Ao executar o comando acima, é mostrado quantas pessoas sobreviveram e quantas não sobreviveram. Pode-se observar que 710 pessoas sobreviveram ao Titanic.

#Pegunta 3: Qual é a proporção de pessoas que sobreviveram ao Titanic?

round(prop.table(tabela_sobrevivencia)*100,2)

#Resposta: O comando acima, quando executado nos mostra a porcentagem de pessoas que sobreviveram e que não sobreviveram ao Titanic. A proporção de sobreviventes é 32.27%.

#2- Análises descritivas dos dados:

#Pergunta 4: Quantas mulheres sobreviveram?

T1 = table(Titanic$Sexo,Titanic$Sobreviveu) T1

#Resposta: O comando acima mostra quantas pessoas de cada sexo sobreviveram e não sobreviveram. A partir desse resultado, pude constatar que 344 mulheres sobreviveram.

#Pergunta 5: Quantas crianças sobreviveram?

T2 = table(Titanic$Idade,Titanic$Sobreviveu) T2

#Resposta: O comando acima nos mostra a quantidade de adultos e crianças que sobreviveram e que não sobreviveram. Ao executa-lo pude ver que 57 crianças sobreviveram.

#Pergunta 6: Quantas pessoas da terceira classe sobreviveram?

T3 = table(Titanic$Classe,Titanic$Sobreviveu) T3

#Resposta: Esse comando nos mostra quantas pessoas sobreviveram e não sobreviveram em cada parte do navio, (primeira classe, segunda clasee, terceira classe e tripulação). A partir desses dados, constatei que 178 pessoas da terceira classe sobreviveram.

#Pergunta 7: Qual o percentual de mulheres que sobreviveu?

percentual <- round(prop.table(T1,1)*100,digits = 1) percentual

#Resposta: O comando acima nos mostra o percentual de mulheres e homens que sobreviveram e não sobreviveram. A partir dessas informações, observei que 73,2% das mulheres sobreviveram a essa tragédia.

#Pergunta 8: Qual o percentual de crianças que sobreviveu?

percentual2 <- round(prop.table(T2,1)*100,digits = 1) percentual2

#Resposta: Esse comando nos mostra o percentual de crianças e adultos que sobreviveram e que não sobreviveram. Ao observar esses dados, pude constatar que 52,3% das crianças sobreviveram ao Titanic.

#Pergunta 9: Qual o percentual da terceira classe que sobreviveu?

percentual3 <- round(prop.table(T3,1)*100,digits = 1) percentual3

#Resposta: O comando acima nos mostra o percentual de pessoas que sobreviveram e não sobreviveram em cada parte do navio, (primeira classe, segunda clasee, terceira classe e tripulação).Pode-se observar que 25,2% da terceira classe sobreviveu.

#3- Se você quiser mais:

#Pergunta 10: Que tipo de gráfico você pode utilizar nesse tipo de dado? Por quê?

#Resposta: Para esse tipo de dado, o ideal seria utilizar o gráfico de barras, pois o mesmo é ideal para comparar essa quantidade de variáveis. Consegui chegar nessa conclusão por conta dos aprendizados que adiquiri nas aulas. Aprendi que as variáveis qualitativas nominais são quando não há ordem específica, por exemplo, cores, sexo, bairro. Já a variável qualitativa ordinal é quando há representação de hierarquia, ou seja, tem uma ordem, por exemplo: soldado, cabo, sargento. Ainda existem as variáveis quantitativas, que podem ser discretas (ex: quantidade de filhos, cachorros, números inteiros em geral.) ou podem ser contínuas (ex: renda, nota, podem ser números quebrados). Diante disso, conclui-se que o gráfico de barras é o melhor a ser utilizado nesse caso, já que engloba compararação de valores. Esse tipo de gráfico apresenta colunas com tamanhos proporcionais aos valores que as representam.

#Pergunta 11: Você poderia construir um gráfico para a variável “sobreviveu”?

T4 = table(Titanic$Sobreviveu) T4

bp <- barplot(T4, col=c("violet" , "darkblue"), main = "Gráfico 1 - Variável Sobreviveu", horiz = FALSE,beside = TRUE, legend.text = rownames(T4), args.legend = list(x = "topright"))

#A junção dos comandos acima cria uma tabela que fica salva na aba “Environment”, e também cria em “Plots” um gráfico de barras completo que mostra a quantidade de pessoas que sobreviveram e não sobreviveram ao Titanic.

#Pergunta 12: Você poderia construir um gráfico da variável “sobreviveu” por “sexo”?

T5 = table(Titanic$Sobreviveu,Titanic$Sexo) T5 bp2 <- barplot(T5, col=c("#2876eb","#40036e","yellow","#fc9608"), main = "Gráfico 2 - Variável Sobreviveu por Sexo", horiz = FALSE,beside = TRUE, legend.text = rownames(T5), args.legend = list(x = "topleft"))

#Assim como na questão anterior, a junção dos comandos acima cria uma tabela que fica salva na aba “Environment”, e também cria em “Plots” um gráfico de barras completo que mostra a quantidade de pessoas que sobreviveram e não sobreviveram ao Titanic. A diferença é que nessa tabela a quantidade de sobreviventes e não sobreviventes está dividida entre “feminino” e “masculino”.

#4- Último Desafio: Fazer uma nova visualização de dados :

#1 -Balloonplot:

tabela<-table(Titanic$Classe,Titanic$Sobreviveu) tabela<-data.frame(tabela) ggballoonplot(tabela, fill = "value")+ ggtitle("Sobreviventes do Titanic")

#2 -Mosaicplot:

mosaicplot(table(Titanic$Classe,Titanic$Sobreviveu), main = "Sobreviventes do Titanic", color = c("#fa0276","#02fa6e"))

#Pergunta 13: Você poderia construir uma outra visualização de dados (além dessas duas)? Qual gráfico você sugere?

#Resposta: Sim. Para construir uma visualização diferente das anteriores, sugiro fazer um gráfico de pizza destinado à variável “sobreviveu”.

```tabela6<-table(Titanic$Sobreviveu)

table(Titanic$Sobreviveu)```

pie(tabela6,col = c("#fa4002","#faac02"), main = "Gráfico da Variável Sobreviveu")

#Pergunta 14: Você consegue interpretar esses dois gráficos? o que eles estão dizendo?

#Resposta: Sim. O primeiro gráfico é chamado de balloonplot, já o segundo se chama mosaicplot. Ambos os gráficos nos informam as mesmas coisas, o que muda é o tipo de representação gráfica. Entretanto, nos é mostrado que a maioria das pessoas que se encontravam na tripulação não sobreviveram, foi onde teve mais mortos. Já na primeira classe, foi o único lugar em que o número de sobreviventes foi maior do que o de mortos. Na segunda classe, houve um número de sobreviventes inferior ao número de mortos. Já na terceira classe, o número de mortos foi bem superior ao número de sobreviventes. Houve uma quantidade de mortos semelhante para os membros da tripulação e da terceira classe.

#Pergunta 15: Se você fosse fazer um Pitch (apresentação de 03 a 05 minutos) com recomendações sobre o Titanic a partir dos dados. Qual ideia você passaria? Quero um posicionamento!

#Resposta: Primeiramente, eu destacaria a problemática da desigualdade social dentro do návio, se pressupõe que as pessoas com mais dinheiro estavam no setor mais caro (primeira classe). Eu acreditava que as pessoas pagavam valores diferentes visando o conforto, mas aparentemente o quanto você pode pagar também interfere na sua segurança. Como pudemos observar no decorrer desse trabalho, o único lugar da embarcação que teve mais sobreviventes do que mortos foi a primeira classe. Enquanto isso, a tripulação foi onde teve o maior número de mortos, que é onde se encontravam os funcionários e pessoas em geral que estavam trabalhando no navio.Eu recomendaria que as embarcações futuras tenham um cuidado maior com os seus funcionários e com o restante das pessoas que estão embarcando. Nada mais justo do que quem está pagando mais caro ter por exemplo uma vista melhor e uma cabine maior, mas acho inadimissível quem não está pagando o setor mais caro ter sua segurança comprometida. Infelizmente não tem como mudar o que já ocorreu, mas podemos aprender com os erros cometidos e construir um futuro melhor a partir dos mesmos.Todos devem ter direito à segurança e de tentarem se salvar!