Revisar os conceitos de análise bi-variada.

Fase 1 - Carregando a base de dados

Nesta fase iremos carregar o banco de dados para ser realizada as análises.

load("C:/Users/Cristiane/Desktop/Estatistica aplicada a engenharia I/Base_de_dados-master/Titanic.RData")

Fase 2 - Trabalhando com os seus dados:

summary(Titanic$Sobreviveu)
## Não sobreviveu     Sobreviveu 
##           1490            710
tabela1<-table(Titanic$Classe,Titanic$Sobreviveu)
tabela2<-table(Titanic$Sexo,Titanic$Sobreviveu)
tabela3<-table(Titanic$Sobreviveu)
tabela4<-table(Titanic$Idade,Titanic$Sobreviveu)
tabela5<-table(Titanic$Sobreviveu,Titanic$Sexo)

library(ggplot2)
library(forcats)
library(ggpubr)

Atividade 1 - Quantas pessoas tinham no Titanic? Quantas informações (variáveis) existem no banco de dados?

Resposta: No Titanic haviam 2.200 pessoas incluindo a tripulação, primeira, segunda e terceira classe.No questinário analisado existem 4 variáveis conforme descrito acima.

table(Titanic$Classe,Titanic$Sobreviveu)
##             
##              Não sobreviveu Sobreviveu
##   Tripulação            673        212
##   Primeira              122        202
##   Segunda               167        118
##   Terceira              528        178

Atividade 2 - Quantas pessoas sobreviveram ao Titanic? 710 pessoas sobreviveram

Resposta:Sobreviveram 710 pessoas.

tabela_sobreviveu<-table(Titanic$Sobreviveu)
tabela_sobreviveu
## 
## Não sobreviveu     Sobreviveu 
##           1490            710

Atividade 3 - Qual é a proporção de pessoas que sobreviveram ao Titanic?

Resposta: Sobreviveram aproximadamente 32,27% pessoas.

round(prop.table(tabela_sobreviveu)*100,2)
## 
## Não sobreviveu     Sobreviveu 
##          67.73          32.27

Fase 3 - Análise descritivas dos dados

Atividade 4 - Quantas mulheres sobreviveram?

Resposta: Sobreviveram 344 mulheres.

table(Titanic$Sexo,Titanic$Sobreviveu)
##            
##             Não sobreviveu Sobreviveu
##   Feminino             126        344
##   Masculino           1364        366

Atividade 5 - Quantas crianças sobreviveram?

Resposta: Sobreviveram 57 crianças.

table(Titanic$Idade,Titanic$Sobreviveu)
##          
##           Não sobreviveu Sobreviveu
##   criança             52         57
##   adulto            1438        653

Atividade 6 - Quantas pessoas da terceira classe sobreviveram?

Resposta: Sobreviveram 178 pessoas da terceira classe.

table(Titanic$Classe,Titanic$Sobreviveu)
##             
##              Não sobreviveu Sobreviveu
##   Tripulação            673        212
##   Primeira              122        202
##   Segunda               167        118
##   Terceira              528        178

Atividade 7 - Qual o percentual de mulheres que sobreviveu?

Resposta: Sobreviveram aproximadamente 15,63% mulheres dos 100% dos tripulantes/passageiros e da amostra das mulheres 73,19% sobreviveram.

prop.table(tabela2,1)*100
##            
##             Não sobreviveu Sobreviveu
##   Feminino        26.80851   73.19149
##   Masculino       78.84393   21.15607
round(prop.table(tabela2,1)*100,2)
##            
##             Não sobreviveu Sobreviveu
##   Feminino           26.81      73.19
##   Masculino          78.84      21.16

Atividade 8 - Qual o percentual de crianças que sobreviveu?

Resposta: Sobreviveram aproximadamente 2,59% dos 100% dos tripulantes/passageiros e da amostra somente das crianças 52,29% sobreviveram. .

prop.table(tabela4)*100
##          
##           Não sobreviveu Sobreviveu
##   criança       2.363636   2.590909
##   adulto       65.363636  29.681818
round(prop.table(tabela4,1)*100,2)
##          
##           Não sobreviveu Sobreviveu
##   criança          47.71      52.29
##   adulto           68.77      31.23

Atividade 9 - Qual o percentual da terceira classe que sobreviveu?

Resposta: Sobreviveram aproximadamente 8,09% da terceira classe dos 100% dos tripulantes/passageiros e da amostra somente da terceira classe 25,21% sobreviveram. .

prop.table(tabela1)*100
##             
##              Não sobreviveu Sobreviveu
##   Tripulação      30.590909   9.636364
##   Primeira         5.545455   9.181818
##   Segunda          7.590909   5.363636
##   Terceira        24.000000   8.090909
round(prop.table(tabela1,1)*100,2)
##             
##              Não sobreviveu Sobreviveu
##   Tripulação          76.05      23.95
##   Primeira            37.65      62.35
##   Segunda             58.60      41.40
##   Terceira            74.79      25.21

Fase 4 - Gerar gráficos de base de dados:

Atividade 10 - Que tipo de gráfico você pode utilizar nesse tipo de dado? Por quê?

Resposta: Podemos utilizar o gráfico de barras, porque ele é indicado quando estamos fazendo a análise de poucas variáveis.

Atividade 11 - Você poderia construir um gráfico para a variável “sobreviveu”?

Resposta: Segue abaixo o gráfico I sobreviventes.

Atividade 12 - Você poderia construir um gráfico da variável “sobreviveu” por “sexo”?

Resposta: Segue abaixo o gráfico de sobreviventes por sexo.

barplot(tabela5,
        beside=TRUE,
        col=c("#1fd9ed","#ed1fed"),
        main = "GRÁFICO II - SOBREVIVENTES POR SEXO",
        ylim = c(0,2200),ylab="Qtde de Pessoas",xlab="Sexo",legend.text = TRUE)

Fase 5 - Criar uma nova visualização de dados gerando dois gráficos:

1 - balloonplot

tabela<-table(Titanic$Classe,Titanic$Sobreviveu)
tabela<-data.frame(tabela1)
ggballoonplot(tabela, fill = "value")+
        ggtitle("             GRÁFICO III - SOBREVIVENTES DI TITANIC")

2 - mosaicplot.

mosaicplot(table(Titanic$Classe,Titanic$Sobreviveu),main = " GRÁFICO IV - SOBREVIVENTES DO TITANIC",color = c("#6e665d","#c2acf2"))

Atividade 13 - Você poderia construir uma outra visualização de dados (além dessas duas)? Qual gráfico você sugere?

Resposta: Sim, segue o gráfico de barras por sobreviventes por sexo e total de sobreviventes.

barplot(tabela4,
        beside=TRUE,
        col=c("yellow","red"),
        main = "GRÁFICO V - SOBREVIVENTES POR IDADE",
        ylim = c(0,2000),ylab="Qtde de Pessoas",xlab = "IDADE",legend.text = TRUE)

barplot(tabela1,
        beside=TRUE,
        col=c("#acf2f0","#ecf2ac","Blue","red"),
        main = "GRÁFICO VI - SOBREVIVENTES POR CLASSE",
        ylim = c(0,1500),ylab="Qtde de Pessoas",xlab = "Classe",legend.text = TRUE)

Atividade 14 - Você consegue interpretar esses dois gráficos? o que eles estão dizendo?

Resposta: O gráfico III (ballonplot) demonstra a frequencia e que o número de não sobreviventes foi bem maior na tripulação e na terceira classe contudo o numero de sobreviventes foi quase igual na tripulação e na primeira classe.

Já no gráfico IV (Mosaicplot) a visulaização é como se fosse um moisaico e dá para visualizar os dados citados anteriormente de uma forma mais clara.

Atividade 15 - Se você fosse fazer um Pitch (apresentação de 03 a 05 minutos) com recomendações sobre o Titanic a partir dos dados. Qual ideia você passaria?

Resposta:De acordo com os dados analisados pode se verificar que a tripulação e a terceira classe foram as que tiveram o maior indice de não sobreviventes e que a primeira classe teve o maior indice de sobreviventes. Esses indices demonstram que a tripulação como ficou ajudando aos passageiros não conseguiram se salvar e por não terem botes e salva vidas para todos deram preferencia a primeira classe. Isso tambem se verifica quando analisamos os dados pelo sexo onde o percentual feminino que não sobreviveu foi em torno de 5,7%.