Carregar base dados

load("C:/Users/victo/Desktop/Base_de_dados-master/Titanic.RData")

1 - Quantas pessoas tinha no Titanic? Quantas informações (variáveis) existem no banco de dados?

2.200 pessoas e 4 variáveis no banco de dados

2 - Quantas pessoas sobreviveram ao Titanic?

710 pessoas sobreviveram

summary(Titanic$Sobreviveu)
## Não sobreviveu     Sobreviveu 
##           1490            710

3 - Qual é a proporção de pessoas que sobreviveram ao Titanic?

32,27% das pessoas sobreviveram

tabela_sobreviveu<-table(Titanic$Sobreviveu)
tabela_sobreviveu
## 
## Não sobreviveu     Sobreviveu 
##           1490            710
round(prop.table(tabela_sobreviveu)*100,2)
## 
## Não sobreviveu     Sobreviveu 
##          67.73          32.27

4 - Quantas mulheres sobreviveram?

344 mulheres sobreviveram

tabela1<-table(Titanic$Sexo,Titanic$Sobreviveu)
tabela1
##            
##             Não sobreviveu Sobreviveu
##   Feminino             126        344
##   Masculino           1364        366

5 - Quantas crianças sobreviveram?

57 crianças sobreviveram

tabela2<-table(Titanic$Sobreviveu,Titanic$Idade)
tabela2
##                 
##                  criança adulto
##   Não sobreviveu      52   1438
##   Sobreviveu          57    653

6 - Quantas pessoas da terceira classe sobreviveram?

178 pessoas da terceira classe sobreviveram

tabela3<-table(Titanic$Classe,Titanic$Sobreviveu)
tabela3
##             
##              Não sobreviveu Sobreviveu
##   Tripulação            673        212
##   Primeira              122        202
##   Segunda               167        118
##   Terceira              528        178

7 - Qual o percentual de mulheres que sobreviveu?

73,19% das mulheres sobreviveram

round(prop.table(tabela1,1)*100,2)
##            
##             Não sobreviveu Sobreviveu
##   Feminino           26.81      73.19
##   Masculino          78.84      21.16

8 - Qual o percentual de crianças que sobreviveu?

52,29% das crianças sobreviveram

round(prop.table(tabela2,2)*100,2)
##                 
##                  criança adulto
##   Não sobreviveu   47.71  68.77
##   Sobreviveu       52.29  31.23

9 - Qual o percentual da terceira classe que sobreviveu?

25,21% da terceira classe sobreviveu

round(prop.table(tabela3,1)*100,2)
##             
##              Não sobreviveu Sobreviveu
##   Tripulação          76.05      23.95
##   Primeira            37.65      62.35
##   Segunda             58.60      41.40
##   Terceira            74.79      25.21

10 - Que tipo de gráfico você pode utilizar nesse tipo de dado? Por quê?

Para este tipo de dado, pode-se usar o gráfico de barras, uma vez que assim pode-se apresentar em uma única representação uma série de dados, sendo possível o cruzamento entre eles.

11 - Você poderia construir um gráfico para a variável “sobreviveu”?

tabela4<-table(Titanic$Sobreviveu)
tabela4
## 
## Não sobreviveu     Sobreviveu 
##           1490            710
barplot(tabela4,
        col=c("pink","skyblue"),
        main = "Grafico 1 - Sobreviventes",
        ylim = c(0,2000))

12 - Você poderia construir um gráfico da variável “sobreviveu” por “sexo”?

tabela_sexo<-table(Titanic$Sobreviveu,Titanic$Sexo)
tabela_sexo
##                 
##                  Feminino Masculino
##   Não sobreviveu      126      1364
##   Sobreviveu          344       366
barplot(tabela_sexo,
        beside=T,
        col=c("red","blue"),
        main = "Grafico 2 - Sobreviventes por sexo",
        ylim = c(0,2000),
        ylab = "Quantidade",
        legend.text = TRUE)

13 - Você poderia construir uma outra visualização de dados (além dessas duas)? Qual gráfico você sugere?

Sim. Pode-se construir gráficos que cruzem os dados de idade com sobrivência e também da informação sexo com sobrevivência ou, ainda, um gráfico de barras da tripulação sobrevivente e não sobrevivente, como segue:

library(forcats)
library(ggpubr)
## Loading required package: ggplot2
library(ggplot2)

tabela5<-table(Titanic$Sexo,Titanic$Sobreviveu)
tabela5<-data.frame(tabela5)

ggballoonplot(tabela5, fill = "value")+
  ggtitle("Sobreviventes do Titanic de acordo com o Sexo") 

tabela6<-table(Titanic$Idade,Titanic$Sobreviveu)
tabela6<-data.frame(tabela6)

ggballoonplot(tabela6, fill = "value")+
  ggtitle("Sobreviventes do Titanic por Idade")

mosaicplot(tabela1, main = "Sobreviventes do Titanic de acordo com o Sexo", color = c("gray","blue"))

mosaicplot(tabela2, main = "Sobreviventes do Titanic de acordo com a Idade", color = c("skyblue","blue"))

vetorcor<-c("red", "blue", "green", "yellow")

barplot(tabela3,
        beside = T,
        col = vetorcor,
        ylim = c(0,800),
        ylab = "Quantidade",
        legend.text = TRUE,
        main = "Sobreviventes por classe")

14 - Você consegue interpretar esses dois gráficos? o que eles estão dizendo?

Sim. Pelos gráficos apresentados é possível verificar que o maior número de não sobreviventes fazia parte da tripulação. Já a maioria dos que faziam parte da primeira classe sobreviveu, mesmo estando em menor número.Enquanto a maioria da terceira classe não sobreviveu, mesmo estando em maior número que a primeira e a segunda classe.

15 - Se você fosse fazer um Pitch (apresentação de 03 a 05 minutos) com recomendações sobre o Titanic a partir dos dados. Qual ideia você passaria? Quero um posicionamento!

É possível que as características das pessoas a bordo do Titanic tenha influenciado na prioridade de salvamento durante o naufrágio, levando em consideração o sexo, a idade e a renda (classe).

Pelo dados apresentados, é possível concluir que entre os homens o índice de sobrevivência é menor do que para as mulheres, mesmo elas estando em menor quantidade.

Quanto a idade, observa-se que crianças tiveram um índice de sobrevivência maior do que de adultos,entretanto elas estavam em número muito menor.

Observa-se que a primeira classe teve maior número de sobreviventes que a terceira classe, mesmo tendo um número inferior de pessoas.