Carregar banco de dados

load("C:/Users/Aline/Desktop/Base_de_dados-master/Titanic.RData")

Carregar pacotes necessários

library(forcats)
library(ggplot2)
library(ggpubr)

Atividade 1

Quantas pessoas tinha no Titanic? Quantas informações (variáveis) existem no banco de dados?

dim(Titanic)
## [1] 2200    4

Haviam 2.200 pessoas no Titanic.

Existem 4 variáveis no banco de dados titanic, a saber: Classe, Idade, Sexo e Sobreviveu.

Atividade 2

Quantas pessoas sobreviveram ao Titanic?

table(Titanic$Sobreviveu)
## 
## Não sobreviveu     Sobreviveu 
##           1490            710

710 pessoas sobreviveram e 1490 pessoas não sobreviveram ao acidente do Titanic.

Atividade 3

Qual é a proporção de pessoas que sobreviveram ao Titanic?

tabela1 <- table(Titanic$Sobreviveu)
round(prop.table(tabela1)*100,2)
## 
## Não sobreviveu     Sobreviveu 
##          67.73          32.27

710 das 2200 pessoas que estavam no Titanic sobreviveram ao acidente, o que equivale à aproximadamente 32,27%.

Atividade 4

Quantas mulheres sobreviveram?

table(Titanic$Sobreviveu,Titanic$Sexo)
##                 
##                  Feminino Masculino
##   Não sobreviveu      126      1364
##   Sobreviveu          344       366

344 mulheres sobreviveram ao acidente no Titanic.

Atividade 5

Quantas crianças sobreviveram?

table(Titanic$Sobreviveu,Titanic$Idade)
##                 
##                  criança adulto
##   Não sobreviveu      52   1438
##   Sobreviveu          57    653

57 crianças sobreviveram ao acidente no Titanic.

Atividade 6

Quantas pessoas da terceira classe sobreviveram?

table(Titanic$Sobreviveu,Titanic$Classe)
##                 
##                  Tripulação Primeira Segunda Terceira
##   Não sobreviveu        673      122     167      528
##   Sobreviveu            212      202     118      178

178 pessoas da terceira classe sobreviveram ao acidente no Titanic.

Atividade 7

Qual o percentual de mulheres que sobreviveu?

tabela2<-table(Titanic$Sexo,Titanic$Sobreviveu)
prop.table(tabela2)*100
##            
##             Não sobreviveu Sobreviveu
##   Feminino        5.727273  15.636364
##   Masculino      62.000000  16.636364
round(prop.table(tabela2,1)*100,2)
##            
##             Não sobreviveu Sobreviveu
##   Feminino           26.81      73.19
##   Masculino          78.84      21.16

Aproximadamente 73,19% das mulheres que estavam presentes no Titanic sobreviveram ao acidente.

Atividade 8

Qual o percentual de crianças que sobreviveu?

tabela3<-table(Titanic$Idade,Titanic$Sobreviveu)
prop.table(tabela3)*100
##          
##           Não sobreviveu Sobreviveu
##   criança       2.363636   2.590909
##   adulto       65.363636  29.681818
round(prop.table(tabela3,1)*100,2)
##          
##           Não sobreviveu Sobreviveu
##   criança          47.71      52.29
##   adulto           68.77      31.23

52,29% das crianças que estavam presentes no Titanic sobreviveram ao acidente.

Atividade 9

Qual o percentual da terceira classe que sobreviveu?

tabela4<-table(Titanic$Classe,Titanic$Sobreviveu)
prop.table(tabela4)*100
##             
##              Não sobreviveu Sobreviveu
##   Tripulação      30.590909   9.636364
##   Primeira         5.545455   9.181818
##   Segunda          7.590909   5.363636
##   Terceira        24.000000   8.090909
round(prop.table(tabela4,1)*100,2)
##             
##              Não sobreviveu Sobreviveu
##   Tripulação          76.05      23.95
##   Primeira            37.65      62.35
##   Segunda             58.60      41.40
##   Terceira            74.79      25.21

25,21% das pessoas da terceira classe sobreviveram ao acidente do Titanic.

Atividade 10

Que tipo de gráfico você pode utilizar nesse tipo de dado? Por quê?

O gráfico de barras consiste em alternativa recomendável em função do número de variáveis.

Atividade 11

Você poderia construir um gráfico para a variável “sobreviveu”?

barplot(tabela1,
        beside=TRUE,
        col=c("grey","red"),
        main = "GRÁFICO I - SOBREVIVENTES",
        ylim = c(0,2200),ylab="Qtde de Pessoas",legend.text = TRUE)

Atividade 12

Você poderia construir um gráfico da variável “sobreviveu” por “sexo”?

barplot(tabela2,
        beside=TRUE,
        col=c("blue","skyblue"),
        main = "GRÁFICO II - SOBREVIVENTES POR SEXO",
        ylim = c(0,2200),ylab="Qtde de Pessoas",legend.text = TRUE)

Atividade 13

Vamos tentar criar uma nova visualização de dados. Para isso, vamos gerar dois gráficos: 1 - o balloonplot e o 2 - mosaicplot.

tabela<-table(Titanic$Classe,Titanic$Sobreviveu)

tabela<-data.frame(tabela)

ggballoonplot(tabela, fill = "value")+
  ggtitle("Sobreviventes do Titanic")

tabela<-table(Titanic$Classe,Titanic$Sobreviveu)

mosaicplot(tabela, main = "Sobreviventes (Titanic)",
           color = c("red","blue"))

ggplot(Titanic, aes(Sobreviveu, fill = factor(Sexo))) + labs(fill = "Sexo") + geom_bar() 

Atividade 14

Você consegue interpretar esses dois gráficos? o que eles estão dizendo?

O balloonplot evidencia que a tripulação e a terceira classe foram as classes com mais vítimas.

O mosaicplot mostra, no primeiro mosaico, a mesma evidência do balloonplot.

Atividade 15

Se você fosse fizer um Pitch (apresentação de 03 a 05 minutos) com recomendações sobre o Titanic a partir dos dados. Qual ideia você passaria? Quero um posicionamento!

Consideradas as estatisticas de sobrevivencia obtidas no banco de dados podemos especular que: mulheres podem ter tido alguma prioridade no salvamento, uma vez que os percentuais de sobreviventes foram maiores. Pode-se imaginar também que os passageiros de primeira classe tenham se beneficiado de facilidades(logística ou prioridade) de forma que também tiveram notavelmente maior percentual de sobreviventes.