Carregar pacotes adicionais

library(forcats)
library(ggplot2)
library(ggpubr)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(flextable)
## 
## Attaching package: 'flextable'
## The following objects are masked from 'package:ggpubr':
## 
##     border, font, rotate

Carregar base de dados

load ("D:/_Mestrado Civil UFF/Estatistica_Aplicada/Base_de_dados-master/Titanic.RData")

Olhando a estrutura de dados

View(Titanic)
glimpse(Titanic)
## Rows: 2,200
## Columns: 4
## $ Classe     <fct> Primeira, Primeira, Primeira, Primeira, Primeira, Primeira,~
## $ Idade      <fct> adulto, adulto, adulto, adulto, adulto, adulto, adulto, adu~
## $ Sexo       <fct> Masculino, Masculino, Masculino, Masculino, Masculino, Masc~
## $ Sobreviveu <fct> Sobreviveu, Sobreviveu, Sobreviveu, Sobreviveu, Sobreviveu,~
head(Titanic)
##     Classe  Idade      Sexo Sobreviveu
## 1 Primeira adulto Masculino Sobreviveu
## 2 Primeira adulto Masculino Sobreviveu
## 3 Primeira adulto Masculino Sobreviveu
## 4 Primeira adulto Masculino Sobreviveu
## 5 Primeira adulto Masculino Sobreviveu
## 6 Primeira adulto Masculino Sobreviveu
str(Titanic)
## 'data.frame':    2200 obs. of  4 variables:
##  $ Classe    : Factor w/ 4 levels "Tripulação","Primeira",..: 2 2 2 2 2 2 2 2 2 2 ...
##  $ Idade     : Factor w/ 2 levels "criança","adulto": 2 2 2 2 2 2 2 2 2 2 ...
##  $ Sexo      : Factor w/ 2 levels "Feminino","Masculino": 2 2 2 2 2 2 2 2 2 2 ...
##  $ Sobreviveu: Factor w/ 2 levels "Não sobreviveu",..: 2 2 2 2 2 2 2 2 2 2 ...
summary(Titanic)
##         Classe        Idade             Sexo               Sobreviveu  
##  Tripulação:885   criança: 109   Feminino : 470   Não sobreviveu:1490  
##  Primeira  :324   adulto :2091   Masculino:1730   Sobreviveu    : 710  
##  Segunda   :285                                                        
##  Terceira  :706

Desenvolvimento das atividades propostas

Atividade 1

Quantas pessoas tinha no Titanic?

Haviam 2200 passageiros no navio.
count(Titanic)
##      n
## 1 2200

Quantas informações (variáveis) existem no banco de dados?

Existem 4 variáveis: Classe, Idade, Sexo e Sobreviveu.
str(Titanic)
## 'data.frame':    2200 obs. of  4 variables:
##  $ Classe    : Factor w/ 4 levels "Tripulação","Primeira",..: 2 2 2 2 2 2 2 2 2 2 ...
##  $ Idade     : Factor w/ 2 levels "criança","adulto": 2 2 2 2 2 2 2 2 2 2 ...
##  $ Sexo      : Factor w/ 2 levels "Feminino","Masculino": 2 2 2 2 2 2 2 2 2 2 ...
##  $ Sobreviveu: Factor w/ 2 levels "Não sobreviveu",..: 2 2 2 2 2 2 2 2 2 2 ...

Atividade 2

Quantas pessoas sobreviveram ao Titanic?

Sobreviveram ao naufrágio, 710 passageiros.
tabela_sobreviveu <-table(Titanic$Sobreviveu)
tabela_sobreviveu
## 
## Não sobreviveu     Sobreviveu 
##           1490            710

Atividade 3

Qual é a proporção de pessoas que sobreviveram ao Titanic?

Os 710 sobreviventes representam 32,27% dos passageiros.
round(prop.table(tabela_sobreviveu)*100,2)
## 
## Não sobreviveu     Sobreviveu 
##          67.73          32.27

Atividade 4

Quantas mulheres sobreviveram?

Dos 710 sobreviventes, 344 eram mulheres.
table(Titanic$Sexo,Titanic$Sobreviveu)
##            
##             Não sobreviveu Sobreviveu
##   Feminino             126        344
##   Masculino           1364        366

Atividade 5

Quantas crianças sobreviveram?

Dos 710 sobreviventes, 57 eram crianças.
table(Titanic$Idade,Titanic$Sobreviveu)
##          
##           Não sobreviveu Sobreviveu
##   criança             52         57
##   adulto            1438        653

Atividade 6

Quantas pessoas da terceira classe sobreviveram?

Dos 710 sobreviventes, 178 eram da terceira classe.
table(Titanic$Classe,Titanic$Sobreviveu)
##             
##              Não sobreviveu Sobreviveu
##   Tripulação            673        212
##   Primeira              122        202
##   Segunda               167        118
##   Terceira              528        178

Atividade 7

Qual o percentual de mulheres que sobreviveu?

As 344 mulheres que se salavaram representam 15,64% do total de sobreviventes.
tabela_sob_SX <- table(Titanic$Sexo,Titanic$Sobreviveu)
tabela_sob_SX
##            
##             Não sobreviveu Sobreviveu
##   Feminino             126        344
##   Masculino           1364        366
round(prop.table(tabela_sob_SX)*100,2)
##            
##             Não sobreviveu Sobreviveu
##   Feminino            5.73      15.64
##   Masculino          62.00      16.64

Atividade 8

Qual o percentual de crianças que sobreviveu?

As 57 crianças que se salvaram representam 2,59% do total de sobreviventes.
tabela_sob_ID <- table(Titanic$Idade,Titanic$Sobreviveu)
tabela_sob_ID
##          
##           Não sobreviveu Sobreviveu
##   criança             52         57
##   adulto            1438        653
round(prop.table(tabela_sob_ID)*100,2)
##          
##           Não sobreviveu Sobreviveu
##   criança           2.36       2.59
##   adulto           65.36      29.68

Atividade 9

Qual o percentual da terceira classe que sobreviveu?

Os 178 passageiros da terceira classe que se salvaram representam 8,09% do total de sobreviventes.
tabela_sob_CLS <- table(Titanic$Classe,Titanic$Sobreviveu)
tabela_sob_CLS
##             
##              Não sobreviveu Sobreviveu
##   Tripulação            673        212
##   Primeira              122        202
##   Segunda               167        118
##   Terceira              528        178
round(prop.table(tabela_sob_CLS)*100,2)
##             
##              Não sobreviveu Sobreviveu
##   Tripulação          30.59       9.64
##   Primeira             5.55       9.18
##   Segunda              7.59       5.36
##   Terceira            24.00       8.09

Atividade 10

Que tipo de gráfico você pode utilizar nesse tipo de dado? Por quê?

Nessa atividade são trabalhadas variáveis categóricas, sendo assim, os gráficos mais recomendados devem apresentar o cruzamento das informações dessas variáveis de modo que permita uma comparaçãpo entre elas. Como veremos na sequência, os gráficos de balões, de barras e de mosaico são perfeitamente aplicáveis nesses casos.

Atividade 11

Você poderia construir um gráfico para a variável “sobreviveu”?

bplot1 <- barplot(tabela_sobreviveu,
                 beside=TRUE,
                 col=c("blue","lightblue"),
                 main = "Sobreviventes Titanic",
                 ylim = c(0,1800),ylab="Qtd Passageiros",legend.text = TRUE)

rotulo1 <- paste0(round(prop.table(tabela_sobreviveu)*100,2),"%")
text (bplot1, 0, rotulo1, cex = 0.7, pos = 3, col = "black")

Atividade 12

Você poderia construir um gráfico da variável “sobreviveu” por “sexo”?

bplot2 <- barplot(tabela_sob_SX,
                   beside=TRUE,
                   col=c("blue","lightblue"),
                   main = "Sobreviventes Titanic por sexo",
                   ylim = c(0,1500),ylab="Qtd Passageiros",legend.text = TRUE)

rotulo2 <- paste0(round(prop.table(tabela_sob_SX)*100,2),"%")
text (bplot2, 0, rotulo2, cex = 0.7, pos = 3, col = "black")

Atividade 13

Gráfico de Balões

tabela_blplot<-data.frame(tabela_sob_CLS)

ggballoonplot(tabela_blplot, fill = "value")+
  ggtitle("Sobreviventes Titanic por classe")

Gráfico Mosaico

mosaicplot(table(Titanic$Classe,Titanic$Sobreviveu),
           main = "Sobreviventes Titanic por classe",
           color = c("blue","lightblue"))

Gráfico de barrras sobrepostas

ggplot(Titanic) +
  aes(x = Sobreviveu) +
  geom_bar(aes(fill = Classe)) +
  labs(x="", y="", title="Sobreviventes por Classe")

Atividade 14

Você consegue interpretar esses dois gráficos? o que eles estão dizendo?

Numa visão geral, ambos apresentam maior concentração de pessoas na tribulação e na terceira classe, o que deve ser considerado na avaliação desses gráficos.
No primeiro gráfico (Baloonplot), é possível visualizar uma equidade entre o número de sobreviventes entre os tripulantes e os passageiros da primeira classe. Porém, quando olhamos para o número de vítimas dessas mesmas classes, é visível que houve muito mais mortes entre os tripulanntes e que na primeira classe se concentra o menor número de vítimas entre todas as classes.
No segundo gráfico (mosaicplot), é possivel visualizar claramente a proporcionalidade entre mortes e salvamentos em cada um das classes, confirmando o que foi descrito no parágrafo anterior.
Tais informações levam ao entendimento de uma priorização no salvamento dos passageiros das primeira e segunda classes, o que levaria a esse número elevado nas demais classes.

Atividade 15

Se você fosse fazer um Pitch (apresentação de 03 a 05 minutos)com recomendações sobre o Titanic a partir dos dados. Qual ideia você passaria? Quero um posicionamento!

Numa ánálise muito superficial, é possível notar que o maior número de vítimas estavam nas classes dos trabalhadores da embarcação (tripulação) e na terceira classe, podendo nos levar a algumas observações:
1. Houve prioridade no salvamento dos passageiros das primeira e segunda classes;
2. Não haviam equipamentos de salvamento para atender a todos os passageiros;
3. Não foram previstos procedimentos de evacuação e pânico para caso de um incidente;
Nesse sentido, a crença na robustez e magnitude do navio se sobrepôs às necessidades de segurança. Caso tivessem se atentado para os requisitos de segurança, o número de vítimas poderia ter sido reduzido significativamente.