Atividade 4

Análise bi-variada -Titanic

1ª Fase -Carregando base de dados

load("C:/Users/welington/Desktop/POSCIVIL/Base_de_dados-master/Titanic.RData")
View(Titanic)

2ª Fase- Variávesis da Base de Dados Titanic

A-Classe B-Idade C-Sexo D-Sobreviveu

Trabalhando a base de dados

table(Titanic$Classe)
## 
## Tripulação   Primeira    Segunda   Terceira 
##        885        324        285        706
table(Titanic$Idade)
## 
## criança  adulto 
##     109    2091
table(Titanic$Sexo)
## 
##  Feminino Masculino 
##       470      1730
table(Titanic$Sobreviveu)
## 
## Não sobreviveu     Sobreviveu 
##           1490            710
table(Titanic$Classe,Titanic$Sobreviveu)
##             
##              Não sobreviveu Sobreviveu
##   Tripulação            673        212
##   Primeira              122        202
##   Segunda               167        118
##   Terceira              528        178
table(Titanic$Idade,Titanic$Sobreviveu)
##          
##           Não sobreviveu Sobreviveu
##   criança             52         57
##   adulto            1438        653
table(Titanic$Sexo,Titanic$Sobreviveu)
##            
##             Não sobreviveu Sobreviveu
##   Feminino             126        344
##   Masculino           1364        366
tabela1<-table(Titanic$Classe,Titanic$Sobreviveu)
tabela2<-table(Titanic$Idade,Titanic$Sobreviveu)
tabela3<-table(Titanic$Sexo,Titanic$Sobreviveu)
tabela4<-table(Titanic$Sobreviveu)
tabela5<-table(Titanic$Sobreviveu,Titanic$Sexo)
tabela6<-table(Titanic$Idade,Titanic$Sobreviveu)
tabela6<-data.frame(tabela1)

Atividade 1- Quantas pessoas haviam no Titanic? quantas variáveis existem no banco de dados Titanic?

Resposta: No Titanic haviam 2.200 pessoas incluindo a tripulação,

R:São 4 variaveis (classe, idade, sexo, sobrevivieu)

primeira, segunda e terceira classe. No questinário analisado existem 4 variáveis conforme descrito acima.

table(Titanic$Classe,Titanic$Sobreviveu)
##             
##              Não sobreviveu Sobreviveu
##   Tripulação            673        212
##   Primeira              122        202
##   Segunda               167        118
##   Terceira              528        178

Atividade 2- Quantas pessoas sobreviveram no Titanic?

R: Sobreviveram 710 pessoas ao naufrágio

summary(Titanic$Sobreviveu)
## Não sobreviveu     Sobreviveu 
##           1490            710

Atividade 3- Qual é a proporção de pessoas que sobreviveram ao Titanic?

R: Sobreviveram aproximadamente 32,27% de pessoas

round(prop.table(tabela4)*100,2)
## 
## Não sobreviveu     Sobreviveu 
##          67.73          32.27

Atividade 4- Quantas mulheres Sobreviveram?

R: 344 mulheres Sobreviveram

table(Titanic$Sexo,Titanic$Sobreviveu)
##            
##             Não sobreviveu Sobreviveu
##   Feminino             126        344
##   Masculino           1364        366

#Atividade 5- Quantas crianças Sobreviveram? R: Sobreviveram 57 crianças.

table(Titanic$Idade,Titanic$Sobreviveu)
##          
##           Não sobreviveu Sobreviveu
##   criança             52         57
##   adulto            1438        653

Atividade 6- Quantas pessoas da terceira classe sobreviveram

R: Sobreviveram 178 pessoas da 3ª classe

table(Titanic$Classe,Titanic$Sobreviveu)
##             
##              Não sobreviveu Sobreviveu
##   Tripulação            673        212
##   Primeira              122        202
##   Segunda               167        118
##   Terceira              528        178

Atividade 7- Qual percentual de mulheres que sobreviveu?

R: Sobreviveram aproximadamente, 15,63% do total de tripulantes, na amostra temos 73,19% de mulheres sobreviventes

prop.table(tabela2,1)*100
##          
##           Não sobreviveu Sobreviveu
##   criança       47.70642   52.29358
##   adulto        68.77092   31.22908
round(prop.table(tabela2,1)*100,2)
##          
##           Não sobreviveu Sobreviveu
##   criança          47.71      52.29
##   adulto           68.77      31.23

Atividade 8 - Qual o percentual de crianças que sobreviveu?

Resposta: Sobreviveram aproximadamente 2,59% dos 100% dos tripulantes,

passageiros e da amostra somente das crianças 52,29% sobreviveram.

prop.table(tabela2)*100
##          
##           Não sobreviveu Sobreviveu
##   criança       2.363636   2.590909
##   adulto       65.363636  29.681818
round(prop.table(tabela2,1)*100,2)
##          
##           Não sobreviveu Sobreviveu
##   criança          47.71      52.29
##   adulto           68.77      31.23

Atividade 9- Qual percentual da terceira classe que sobreviveu?

R 8,09% sobreviveram,pertenciam a 3ª classe ,no total da amostra da terceira classe 25,21 % sobreviveram.

prop.table(tabela1)*100
##             
##              Não sobreviveu Sobreviveu
##   Tripulação      30.590909   9.636364
##   Primeira         5.545455   9.181818
##   Segunda          7.590909   5.363636
##   Terceira        24.000000   8.090909
round(prop.table(tabela1,1)*100,2)
##             
##              Não sobreviveu Sobreviveu
##   Tripulação          76.05      23.95
##   Primeira            37.65      62.35
##   Segunda             58.60      41.40
##   Terceira            74.79      25.21

Atividade 10- Que tipo de gráfico você pode utilizar nesse tipo de dado? Por quê?

R: O gráfico de barras é recomendavel em função do numero de variaveis.

Atividade 11- Você poderia construir um gráfico para a variável “sobreviveu”?

R.:Segue abaixo o grafico

barplot(tabela4,
        beside=TRUE,
        col=c("yellow","green"),
        main = "GRÁFICO I - Variáveis Sobreviventes",
        ylim = c(0,2100),ylab="Pessoas",legend.text = TRUE)

Atividade 12-Você poderia construir um gráfico da variável “sobreviveu” por “sexo”?

R: Gráfico Sobreviventes por sexo

barplot(tabela3,
        beside=TRUE,
        col=c("pink","blue"),
        main = "GRÁFICO II - SOBREVIVENTES POR SEXO",
        ylim = c(0,2200),ylab="Qtde de Pessoas",legend.text = TRUE)

Construir uma outra visualização de dados (além dessas duas)? Qual gráfico você sugere?

Criando uma nova visualização dos dados gráficos

library(forcats)
## Warning: package 'forcats' was built under R version 4.0.5
library(ggpubr)
## Warning: package 'ggpubr' was built under R version 4.0.5
## Loading required package: ggplot2
library(ggplot2)

1- ballonplot

tabela6<-table(Titanic$Idade,Titanic$Sobreviveu)
tabela6<-data.frame(tabela1)
ggballoonplot(tabela6, fill = "value")+
  ggtitle("Sobreviventes do Titanic por Idade")

MOSAICPLOT

mosaicplot(tabela1,main = "Titanic- Sobreviventes por Classe",color = c("Yellow","green"))

mosaicplot(tabela2, main = " Titanic sobreviventes por Idade", color = c("red","blue"))

vetorcor<-c("red", "blue", "green", "yellow")

Atividade 14- Você consegue interpretar esses dois gráficos? o que eles estão dizendo?

R: No balloonplot podemos identificar que houve mais vitimas.

Mosaicplot)

a visulaização é como se fosse um moisaico e dá para visualizar os dados citados anteriormente de uma forma mais clara.

O mosaicplot mostra, a mesma observância do balloonplot enquanto o segundo mostra que as crianças tiveram um % (percentual maior aos adultos,podendo evidênciar uma amostra menos das crianças.

Atividade 15 - Se você fosse fazer um Pitch (apresentação de 03 a 05 minutos) com recomendações sobre o Titanic a partir dos dados. Qual ideia você passaria?

#Analizadas as informações estatisticas de sobrevivencia obtidas no banco de dados podemos especular que : Sexo feminino e crianças tiveram prioridades no salvamento,pois os dados informam maior percentual de sobreviventes femininos e criança, pode-se imaginar também que os passageiros de primeira classe tenham se beneficiado de facilidades.