Carregar pacotes adicionais
library(forcats)
library(ggplot2)
library(ggpubr)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(flextable)
##
## Attaching package: 'flextable'
## The following objects are masked from 'package:ggpubr':
##
## border, font, rotate
Carregar base de dados
load ("D:/_Mestrado Civil UFF/Estatistica_Aplicada/Base_de_dados-master/Titanic.RData")
Olhando a estrutura de dados
View(Titanic)
glimpse(Titanic)
## Rows: 2,200
## Columns: 4
## $ Classe <fct> Primeira, Primeira, Primeira, Primeira, Primeira, Primeira,~
## $ Idade <fct> adulto, adulto, adulto, adulto, adulto, adulto, adulto, adu~
## $ Sexo <fct> Masculino, Masculino, Masculino, Masculino, Masculino, Masc~
## $ Sobreviveu <fct> Sobreviveu, Sobreviveu, Sobreviveu, Sobreviveu, Sobreviveu,~
head(Titanic)
## Classe Idade Sexo Sobreviveu
## 1 Primeira adulto Masculino Sobreviveu
## 2 Primeira adulto Masculino Sobreviveu
## 3 Primeira adulto Masculino Sobreviveu
## 4 Primeira adulto Masculino Sobreviveu
## 5 Primeira adulto Masculino Sobreviveu
## 6 Primeira adulto Masculino Sobreviveu
str(Titanic)
## 'data.frame': 2200 obs. of 4 variables:
## $ Classe : Factor w/ 4 levels "Tripulação","Primeira",..: 2 2 2 2 2 2 2 2 2 2 ...
## $ Idade : Factor w/ 2 levels "criança","adulto": 2 2 2 2 2 2 2 2 2 2 ...
## $ Sexo : Factor w/ 2 levels "Feminino","Masculino": 2 2 2 2 2 2 2 2 2 2 ...
## $ Sobreviveu: Factor w/ 2 levels "Não sobreviveu",..: 2 2 2 2 2 2 2 2 2 2 ...
summary(Titanic)
## Classe Idade Sexo Sobreviveu
## Tripulação:885 criança: 109 Feminino : 470 Não sobreviveu:1490
## Primeira :324 adulto :2091 Masculino:1730 Sobreviveu : 710
## Segunda :285
## Terceira :706
Desenvolvimento das atividades propostas
Atividade 1
Quantas pessoas tinha no Titanic?
Haviam 2200 passageiros no navio.
count(Titanic)
## n
## 1 2200
Atividade 2
Quantas pessoas sobreviveram ao Titanic?
Sobreviveram ao naufrágio, 710 passageiros.
tabela_sobreviveu <-table(Titanic$Sobreviveu)
tabela_sobreviveu
##
## Não sobreviveu Sobreviveu
## 1490 710
Atividade 3
Qual é a proporção de pessoas que sobreviveram ao Titanic?
Os 710 sobreviventes representam 32,27% dos passageiros.
round(prop.table(tabela_sobreviveu)*100,2)
##
## Não sobreviveu Sobreviveu
## 67.73 32.27
Atividade 4
Quantas mulheres sobreviveram?
Dos 710 sobreviventes, 344 eram mulheres.
table(Titanic$Sexo,Titanic$Sobreviveu)
##
## Não sobreviveu Sobreviveu
## Feminino 126 344
## Masculino 1364 366
Atividade 5
Quantas crianças sobreviveram?
Dos 710 sobreviventes, 57 eram crianças.
table(Titanic$Idade,Titanic$Sobreviveu)
##
## Não sobreviveu Sobreviveu
## criança 52 57
## adulto 1438 653
Atividade 6
Quantas pessoas da terceira classe sobreviveram?
Dos 710 sobreviventes, 178 eram da terceira classe.
table(Titanic$Classe,Titanic$Sobreviveu)
##
## Não sobreviveu Sobreviveu
## Tripulação 673 212
## Primeira 122 202
## Segunda 167 118
## Terceira 528 178
Atividade 7
Qual o percentual de mulheres que sobreviveu?
As 344 mulheres que se salavaram representam 15,64% do total de sobreviventes.
tabela_sob_SX <- table(Titanic$Sexo,Titanic$Sobreviveu)
tabela_sob_SX
##
## Não sobreviveu Sobreviveu
## Feminino 126 344
## Masculino 1364 366
round(prop.table(tabela_sob_SX)*100,2)
##
## Não sobreviveu Sobreviveu
## Feminino 5.73 15.64
## Masculino 62.00 16.64
Atividade 8
Qual o percentual de crianças que sobreviveu?
As 57 crianças que se salvaram representam 2,59% do total de sobreviventes.
tabela_sob_ID <- table(Titanic$Idade,Titanic$Sobreviveu)
tabela_sob_ID
##
## Não sobreviveu Sobreviveu
## criança 52 57
## adulto 1438 653
round(prop.table(tabela_sob_ID)*100,2)
##
## Não sobreviveu Sobreviveu
## criança 2.36 2.59
## adulto 65.36 29.68
Atividade 9
Qual o percentual da terceira classe que sobreviveu?
Os 178 passageiros da terceira classe que se salvaram representam 8,09% do total de sobreviventes.
tabela_sob_CLS <- table(Titanic$Classe,Titanic$Sobreviveu)
tabela_sob_CLS
##
## Não sobreviveu Sobreviveu
## Tripulação 673 212
## Primeira 122 202
## Segunda 167 118
## Terceira 528 178
round(prop.table(tabela_sob_CLS)*100,2)
##
## Não sobreviveu Sobreviveu
## Tripulação 30.59 9.64
## Primeira 5.55 9.18
## Segunda 7.59 5.36
## Terceira 24.00 8.09
Atividade 10
Que tipo de gráfico você pode utilizar nesse tipo de dado? Por quê?
Nessa atividade são trabalhadas variáveis categóricas, sendo assim, os gráficos mais recomendados devem apresentar o cruzamento das informações dessas variáveis de modo que permita uma comparaçãpo entre elas. Como veremos na sequência, os gráficos de balões, de barras e de mosaico são perfeitamente aplicáveis nesses casos.
Atividade 11
Você poderia construir um gráfico para a variável “sobreviveu”?
bplot1 <- barplot(tabela_sobreviveu,
beside=TRUE,
col=c("blue","lightblue"),
main = "Sobreviventes Titanic",
ylim = c(0,1800),ylab="Qtd Passageiros",legend.text = TRUE)
rotulo1 <- paste0(round(prop.table(tabela_sobreviveu)*100,2),"%")
text (bplot1, 0, rotulo1, cex = 0.7, pos = 3, col = "black")

Atividade 12
Você poderia construir um gráfico da variável “sobreviveu” por “sexo”?
bplot2 <- barplot(tabela_sob_SX,
beside=TRUE,
col=c("blue","lightblue"),
main = "Sobreviventes Titanic por sexo",
ylim = c(0,1500),ylab="Qtd Passageiros",legend.text = TRUE)
rotulo2 <- paste0(round(prop.table(tabela_sob_SX)*100,2),"%")
text (bplot2, 0, rotulo2, cex = 0.7, pos = 3, col = "black")

Atividade 13
Gráfico de Balões
tabela_blplot<-data.frame(tabela_sob_CLS)
ggballoonplot(tabela_blplot, fill = "value")+
ggtitle("Sobreviventes Titanic por classe")

Gráfico Mosaico
mosaicplot(table(Titanic$Classe,Titanic$Sobreviveu),
main = "Sobreviventes Titanic por classe",
color = c("blue","lightblue"))

Gráfico de barrras sobrepostas
ggplot(Titanic) +
aes(x = Sobreviveu) +
geom_bar(aes(fill = Classe)) +
labs(x="", y="", title="Sobreviventes por Classe")

Atividade 14
Você consegue interpretar esses dois gráficos? o que eles estão dizendo?
Numa visão geral, ambos apresentam maior concentração de pessoas na tribulação e na terceira classe, o que deve ser considerado na avaliação desses gráficos.
No primeiro gráfico (Baloonplot), é possível visualizar uma equidade entre o número de sobreviventes entre os tripulantes e os passageiros da primeira classe. Porém, quando olhamos para o número de vítimas dessas mesmas classes, é visível que houve muito mais mortes entre os tripulanntes e que na primeira classe se concentra o menor número de vítimas entre todas as classes.
No segundo gráfico (mosaicplot), é possivel visualizar claramente a proporcionalidade entre mortes e salvamentos em cada um das classes, confirmando o que foi descrito no parágrafo anterior.
Tais informações levam ao entendimento de uma priorização no salvamento dos passageiros das primeira e segunda classes, o que levaria a esse número elevado nas demais classes.