load(url("https://github.com/DATAUNIRIO/Base_de_dados/raw/master/Titanic.RData"))
ls()
## [1] "Titanic"
str(Titanic)
## 'data.frame': 2200 obs. of 4 variables:
## $ Classe : Factor w/ 4 levels "Tripula\xe7\xe3o",..: 2 2 2 2 2 2 2 2 2 2 ...
## $ Idade : Factor w/ 2 levels "criança","adulto": 2 2 2 2 2 2 2 2 2 2 ...
## $ Sexo : Factor w/ 2 levels "Feminino","Masculino": 2 2 2 2 2 2 2 2 2 2 ...
## $ Sobreviveu: Factor w/ 2 levels "Não sobreviveu",..: 2 2 2 2 2 2 2 2 2 2 ...
#——————————————————————– #Limpeza da palavra tripulação #——————————————————————–
names(Titanic)
## [1] "Classe" "Idade" "Sexo" "Sobreviveu"
names(Titanic)[1] <- "Classe"
Titanic$Classe <- iconv(Titanic$Classe, "latin1", "UTF-8")
#——————————————————————– # 1. Quantas pessoas tinha no Titanic? Quantas informações (variáveis) existem no banco de dados? #——————————————————————–
library(dplyr)
##
## Anexando pacote: 'dplyr'
## Os seguintes objetos são mascarados por 'package:stats':
##
## filter, lag
## Os seguintes objetos são mascarados por 'package:base':
##
## intersect, setdiff, setequal, union
total_passengers <- nrow (Titanic)
total_variables <- ncol(Titanic)
#Resposta: 2.200 pessoas estavam no titanic e temos 4 variáveis.
#——————————————————————– #2. Quantas pessoas sobreviveram ao Titanic? #——————————————————————–
Tabela1 = table(Titanic$Sobreviveu)
Tabela1
##
## Não sobreviveu Sobreviveu
## 1490 710
#Resposta: 710 Sobreviveram pessoas ao desastre.
#———————————————————————- #3. Qual é a proporção de pessoas que sobreviveram ao Titanic? #——————————————————————–
prop.table(Tabela1)*100
##
## Não sobreviveu Sobreviveu
## 67.72727 32.27273
#Resposta: 67.72 % não sobreviveram e 32.27% sobreviveram ao desastre.
#——————————————————————– #4. Quantas mulheres sobreviveram? #——————————————————————–
Tabela2 = table(Titanic$Sexo)
Tabela2
##
## Feminino Masculino
## 470 1730
#——————————————————————– # 5.Quantas crianças sobreviveram? #——————————————————————–
Tabela3= table(Titanic$Idade)
Tabela3
##
## criança adulto
## 109 2091
#——————————————————————– # 6. Quantas pessoas da terceira classe sobreviveram? #——————————————————————–
Tabela4 = table(Titanic$Sobreviveu,Titanic$Classe)
Tabela4
##
## Primeira Segunda Terceira Tripulação
## Não sobreviveu 122 167 528 673
## Sobreviveu 202 118 178 212
#Resposta: 178 pessoas da terceira classe sobreviveram ao desastre.
#——————————————————————– # 7. Qual o percentual de mulheres que sobreviveu? #——————————————————————–
Tabela2 = table(Titanic$Sexo,Titanic$Sobreviveu)
Tabela2
##
## Não sobreviveu Sobreviveu
## Feminino 126 344
## Masculino 1364 366
round(prop.table(Tabela2,1)*100,1)
##
## Não sobreviveu Sobreviveu
## Feminino 26.8 73.2
## Masculino 78.8 21.2
#Resposta: 73.19% das mulheres sobreviveram ao desastre.
#——————————————————————– #8. Qual o percentual de crianças que sobreviveu? #——————————————————————–
Tabela3 = table(Titanic$Idade,Titanic$Sobreviveu)
prop.table(Tabela3)*100
##
## Não sobreviveu Sobreviveu
## criança 2.363636 2.590909
## adulto 65.363636 29.681818
round(prop.table(Tabela3,1)*100,digits = 2)
##
## Não sobreviveu Sobreviveu
## criança 47.71 52.29
## adulto 68.77 31.23
#Resposta: 52.29% das crianças sobreviveram ao desastre.
#——————————————————————– #9. Qual o percentual da terceira classe que sobreviveu? #——————————————————————–
Tabela4 = table(Titanic$Classe,Titanic$Sobreviveu)
prop.table(Tabela4)*100
##
## Não sobreviveu Sobreviveu
## Primeira 5.545455 9.181818
## Segunda 7.590909 5.363636
## Terceira 24.000000 8.090909
## Tripulação 30.590909 9.636364
round(prop.table(Tabela4,1)*100,digits = 2)
##
## Não sobreviveu Sobreviveu
## Primeira 37.65 62.35
## Segunda 58.60 41.40
## Terceira 74.79 25.21
## Tripulação 76.05 23.95
#———————————————————————— # 10. Que tipo de gráfico você pode utilizar nesse tipo de dado? Por quê? #————————————————————————
#Respoa: Gráfco de barras. Foi utilizado este modelo de gráfico devido a possibilidade de cruzar dados que tenham algum tipo de relação e que, quando confrontados, expressam um determinado desempenho.
#———————————————————————— #11. Você poderia construir um gráfico para a variável “sobreviveu”? #————————————————————————
Tabela1 = table(Titanic$Sobreviveu)
Tabela1
##
## Não sobreviveu Sobreviveu
## 1490 710
barplot(Tabela1)
bp <- barplot(Tabela1, col=c("blue", "black"),
main = "Gráfico 1 - Sobreviventes do Titanic",
horiz = FALSE,beside=TRUE,
legend.text = rownames(Tabela1),
args.legend = list(x = "topleft"))
percentual <- round(prop.table(Tabela1)*100, digits =1)
percentual
##
## Não sobreviveu Sobreviveu
## 67.7 32.3
rotulo <- paste0(percentual,"%")
rotulo
## [1] "67.7%" "32.3%"
text(bp, 0, rotulo,cex=1.6,pos=3,col = "white")
#————————————————————————– #12. Você poderia construir um gráfico da variável “sobreviveu” por “sexo”? #————————————————————————–
Tabela2 = table(Titanic$Sexo, Titanic$Sobreviveu)
Tabela2
##
## Não sobreviveu Sobreviveu
## Feminino 126 344
## Masculino 1364 366
bp <- barplot(Tabela2, col=c("blue", "black"),
main = "Gráfico 2- Sobreviventes do Titanic por Sexo",
horiz = FALSE,beside=TRUE,
legend.text = rownames(Tabela2),
args.legend = list(x = "topleft"))
percentual <- round(prop.table(Tabela2, 1)*100, digits = 2)
percentual
##
## Não sobreviveu Sobreviveu
## Feminino 26.81 73.19
## Masculino 78.84 21.16
rotulo <- paste0(percentual,"%")
rotulo
## [1] "26.81%" "78.84%" "73.19%" "21.16%"
text (bp, 2, rotulo, cex = 1.6, pos = 3, col = "white")
#———————————————————————— #13. Você poderia construir uma outra visualização de dados (além dessas duas)? Qual gráfico você sugere? #————————————————————————
library(ggplot2)
tabela_idade = table(Titanic$Idade)
tabela_idade
##
## criança adulto
## 109 2091
round(prop.table(tabela_idade)*100,2)
##
## criança adulto
## 4.95 95.05
pie(tabela_idade,
col = c("black", "blue"),
main = "Gráfico 3 - Sobreviventes por Idade")
prop.table(tabela_idade)
##
## criança adulto
## 0.04954545 0.95045455
#resposta: O gráfico de pizza foi escolhido para ilustrar a relação entre idade e sobrevivência, proporcionando uma visualização clara e direta dessas variáveis. Este tipo de gráfico destaca as proporções de cada faixa etária em relação à sobrevivência, tornando mais fácil a compreensão dos dados de forma intuitiva e eficaz.
#—————————————————————————- #14. Você consegue interpretar esses dois gráficos? o que eles estão dizendo? #—————————————————————————-
#Resposta: Ambos os gráficos nos fornecem as mesmas informações porém de maneiras distintas. O primeiro temos como visualização barras diferenciadas por cores e tamanhos de pontos, facilitando a compreendimento dos dados. No segundo gráfico temos a mesma distrubição porém com barras vermelhas que representam os não sobreviventes e a azuis os sobreviventes. Em ambos os gráficos percebe-se que na categoria “Tripulação”, grande parte veio a óbito, apenas com uma pequena parcela sobrevivento. Na primeira classe percebe-se que obteve o maior número de sobreviventes; Na segunda classa temos, apesar de maior a proporção de não sobreviventes é evidente que teve-se um numero significativo se sobreviventes; Na terceira classe a maioria veio a óbito, com uma pequena porção de sobreviventes.
#———————————————————————— #15. Se você fosse fazer um Pitch (apresentação de 03 a 05 minutos) com recomendações sobre o Titanic a partir dos dados. Qual ideia você passaria? Quero um posicionamento!
#Resposta: Observa-se que houve uma discrepância enorme em relação aos sobreviventes e suas classes sociais, sendo assim, temos uma importante informação para que eventuais tragédias não se repitam. É imprescindível o preparo da equipe, com treinamentos adequados para situações emergenciais, com protocolos de segurança bem estipulados, para que assim não haja diferenciação advindo de preconceitos e sendo assim qualquer tripulante, independente de sua classe, tenha seus direitos resguardados. #Ademais, todos os navios devem estar preparados para eventuais acidentes, sendo assim se faz necessário a atualização constante em relação à contagem e estado dos botes salva vidas e coletes. #Nos tempos atuais a tecnologia deve ser utilizada da melhor maneira possível, sendo assim deve-se investir nos sistemas de comunicação a bordo, para que assim os passageiros estejam cientes da situação que está ocorrendo e possam agir da melhor maneira, evitando caos e pânico em situações emergenciais e contento danos maiores.