load("C:/Users/Che Guevara Jr/Documents/Bernardo/Estatistica/Base_de_dados-master/Titanic.RData")
library(forcats)
## Warning: package 'forcats' was built under R version 4.0.3
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.0.3
library(ggpubr)
## Warning: package 'ggpubr' was built under R version 4.0.3
Quantas pessoas tinha no Titanic? Quantas informações (variáveis) existem no banco de dados?
R:Haviam 2200 pessoas no Titanic e existem 4 variáveis no banco de dados.
Quantas pessoas sobreviveram ao Titanic?
sum(Titanic$Sobreviveu == "Sobreviveu")
## [1] 710
R: 710 pessoas sobreviveram so Titanic.
Qual é a proporção de pessoas que sobreviveram ao Titanic?
round(prop.table(table(Titanic$Sobreviveu)), 2)
##
## Não sobreviveu Sobreviveu
## 0.68 0.32
R: Aproximadamente 32% das pessoas sobreviveram ao Titanic
Quantas mulheres sobreviveram?
table(Titanic$Sexo , Titanic$Sobreviveu)
##
## Não sobreviveu Sobreviveu
## Feminino 126 344
## Masculino 1364 366
R: 344 mulheres sobreviveram.
Quantas crianças sobreviveram?
table(Titanic$Idade , Titanic$Sobreviveu)
##
## Não sobreviveu Sobreviveu
## criança 52 57
## adulto 1438 653
R: 57 Crianças sobreviveram.
Quantas pessoas da terceira classe sobreviveram?
table(Titanic$Classe , Titanic$Sobreviveu)
##
## Não sobreviveu Sobreviveu
## Tripulação 673 212
## Primeira 122 202
## Segunda 167 118
## Terceira 528 178
R: 178 pessoas da terceira classe sobreviveram
Qual o percentual de mulheres que sobreviveu?
Mulheres <- Titanic[!(Titanic$Sexo == "Masculino"),]
round(prop.table(table(Mulheres$Sobreviveu)), 2)
##
## Não sobreviveu Sobreviveu
## 0.27 0.73
R: Aproximadamente 73% das mulheres sobreviveram.
Qual o percentual de crianças que sobreviveu?
Crianças <- Titanic[!(Titanic$Idade == "adulto"),]
round(prop.table(table(Crianças$Sobreviveu)), 2)
##
## Não sobreviveu Sobreviveu
## 0.48 0.52
R: Aproximadamente 52% das crianças sobreviveram.
Qual o percentual da terceira classe que sobreviveu?
Classe3 <- Titanic[Titanic$Classe == "Terceira", ]
round(prop.table(table(Classe3$Sobreviveu)), 2)
##
## Não sobreviveu Sobreviveu
## 0.75 0.25
R: Aproximadamente 25% das pessoas da terceira classe sobreviveram.
Que tipo de gráfico você pode utilizar nesse tipo de dado? Por quê?
R: Eu utilizaria o gráfico de barras, pois, se tratando de variáveis categóricas, a visualização é melhor.
Você poderia construir um gráfico para a variável “sobreviveu”?
barplot(table(Titanic$Sobreviveu), main = "Titanic", ylab = "nº de pessoas", col = c("red", "blue"))
grid(nx=1, ny=NULL)
Você poderia construir um gráfico da variável “sobreviveu” por “sexo”?
barplot(table(Titanic$Sobreviveu, Titanic$Sexo), beside = T, main = "Titanic", ylab = "nº de pessoas", legend.text = c("Não Sobreviveu", "Sobreviveu"), args.legend = list(x="topleft", bty="n"), col = c("red", "blue"))
grid(nx=1, ny=NULL)
R: Sim, só não consegui que a legenda tivesse os valores que a variável “Sobreviveu” assume, então tive que colocar manualmente.
Você poderia construir uma outra visualização de dados (além dessas duas)? Qual gráfico você sugere?
R:
tabela<-table(Titanic$Classe,Titanic$Sobreviveu)
tabela<-data.frame(tabela)
ggplot(tabela, aes(x=Var2, y=Freq))+
geom_bar(
aes(fill = Var1), stat = "identity", color = "white",
position = position_dodge(0.9)
)+
fill_palette("jco")
Você consegue interpretar esses dois gráficos? o que eles estão dizendo?
R: Os gráficos nos mostram que apenas a primeira classe, em sua maior parte, sobreviveu, enquanto nas demais classe, tripulação incluída, a maior parte das pessoas não sobreviveu.
Se você fosse fazer um Pitch (apresentação de 03 a 05 minutos) com recomendações sobre o Titanic a partir dos dados. Qual ideia você passaria? Quero um posicionamento!
R: Minha recomendação seria estudar as condições relevantes disponíveis à primeira classe de modo que a taxa de mortalidade foi muito menor nela e fornecer às demais classes as mesmas condições de sobrevivência.