knitr::opts_chunk$set(echo = TRUE)
options(digits=2)

Passo 0 - Carregando as bases de dados:

Passo 1 - Apresentando as variáveis da base de dados:

Trabalhando com a base de dados Titanic e com várias variáveis ao mesmo tempo:
Eis as variáveis:

variável: classe
variável: idade
variável: sexo
variável: sobreviveu

Passo 2 - Tabelas inerentes às variáveis de interesse:

Tabela das 4 variáveis:

table(Titanic$Classe,Titanic$Sobreviveu)
##             
##              Não sobreviveu Sobreviveu
##   Tripulação            673        212
##   Primeira              122        202
##   Segunda               167        118
##   Terceira              528        178
table(Titanic$Sexo,Titanic$Sobreviveu)
##            
##             Não sobreviveu Sobreviveu
##   Feminino             126        344
##   Masculino           1364        366
table(Titanic$Sobreviveu)
## 
## Não sobreviveu     Sobreviveu 
##           1490            710
table(Titanic$Idade,Titanic$Sobreviveu)
##          
##           Não sobreviveu Sobreviveu
##   criança             52         57
##   adulto            1438        653
table(Titanic$Sobreviveu,Titanic$Sexo)
##                 
##                  Feminino Masculino
##   Não sobreviveu      126      1364
##   Sobreviveu          344       366
tabela1<-table(Titanic$Classe,Titanic$Sobreviveu)
tabela2<-table(Titanic$Sexo,Titanic$Sobreviveu)
tabela3<-table(Titanic$Sobreviveu)
tabela4<-table(Titanic$Idade,Titanic$Sobreviveu)
tabela5<-table(Titanic$Sobreviveu,Titanic$Sexo)

Passo 3 - Respondendo algumas perguntas envolvendo as variáveis contidas na base de dados Titanic:

Perguntas:

CONHECENDO OS DADOS:

  1. Quantas pessoas tinham no Titanic? Quantas informações (variáveis) existem no banco de dados?

R: 2200 pessoas estavam no navio. São 2200 informações distribuidas em 4 variáveis distintas.

table(Titanic$Sobreviveu)
## 
## Não sobreviveu     Sobreviveu 
##           1490            710
  1. Quantas pessoas sobreviveram ao Titanic?

R: 710 pessoas sobreviveram ao desastre.

table(Titanic$Sobreviveu)
## 
## Não sobreviveu     Sobreviveu 
##           1490            710
  1. Qual é a proporção de pessoas que sobreviveram ao Titanic?

R: Eram 2200 pessoas presente no navio. Sendo assim, de acordo com a tabela 3: 0,32 sobreviveram e 0,68 não sobreviveram. Sendo assim, aproximadamente 32% das pessoas a bordo sobreviveram ao desastre.

prop.table(tabela3)
## 
## Não sobreviveu     Sobreviveu 
##           0.68           0.32

Passo 4: Respondendo perguntas que envolvem a Análise Descritiva de Dados:

ANÁLISE DESCRITIVA DOS DADOS:

  1. Quantas mulheres sobreviveram?

R: 344 mulheres sobreviveram a essa tragédia.

table(Titanic$Sexo,Titanic$Sobreviveu)
##            
##             Não sobreviveu Sobreviveu
##   Feminino             126        344
##   Masculino           1364        366
  1. Quantas crianças sobreviveram?

R: 57 crianças sobreviventes.

table(Titanic$Idade,Titanic$Sobreviveu)
##          
##           Não sobreviveu Sobreviveu
##   criança             52         57
##   adulto            1438        653
  1. Quantas pessoas da terceira classe sobreviveram?

R: 178 pessoas alojadas na terceira classe sobreviveram a essa tragédia.

table(Titanic$Classe,Titanic$Sobreviveu)
##             
##              Não sobreviveu Sobreviveu
##   Tripulação            673        212
##   Primeira              122        202
##   Segunda               167        118
##   Terceira              528        178
  1. Qual o percentual de mulheres que sobreviveu?

R: Pela tabela 2, aproximadamente 15,6% das mulheres sobreviveram.

table(Titanic$Sexo,Titanic$Sobreviveu)
##            
##             Não sobreviveu Sobreviveu
##   Feminino             126        344
##   Masculino           1364        366
prop.table(tabela2)*100
##            
##             Não sobreviveu Sobreviveu
##   Feminino             5.7       15.6
##   Masculino           62.0       16.6
  1. Qual o percentual de crianças que sobreviveu?

R: Pela tabela 4, aproximadamente 2,6% das crianças sobreviveram.

table(Titanic$Idade,Titanic$Sobreviveu)
##          
##           Não sobreviveu Sobreviveu
##   criança             52         57
##   adulto            1438        653
prop.table(tabela4)*100
##          
##           Não sobreviveu Sobreviveu
##   criança            2.4        2.6
##   adulto            65.4       29.7
  1. Qual o percentual da terceira classe que sobreviveu?

R: Pela tabela 1, aproximadamente 8,1% de passageiros da terceira classe sobreviveram ao desastre.

table(Titanic$Classe,Titanic$Sobreviveu)
##             
##              Não sobreviveu Sobreviveu
##   Tripulação            673        212
##   Primeira              122        202
##   Segunda               167        118
##   Terceira              528        178
prop.table(tabela1)*100
##             
##              Não sobreviveu Sobreviveu
##   Tripulação           30.6        9.6
##   Primeira              5.5        9.2
##   Segunda               7.6        5.4
##   Terceira             24.0        8.1
  1. Que tipo de gráfico você pode utilizar nesse tipo de dado? Por quê?

R: Seria possível utilizar o gráfico de barras.Tem-se poucas variáveis nessa distribuição de dados,no caso, 4 variáveis, o que favorece o uso do gráfico de barras. Esse tipo de gráfico é indicado para casos em que se está trabalhando com baixo número de variáveis.

  1. Você poderia construir um gráfico para a variável “sobreviveu”?

R: Será construído um gráfico de barras para a variável solicitada.

barplot(tabela3,
        beside=TRUE,
        col=c("pink","skyblue"),
        main = "Gráfico 1 - Sobreviventes do Titanic",
        ylim = c(0,2500),ylab="quantidade de viajantes",xlab="sobreviventes e não sobreviventes",legend.text = TRUE)

  1. Você poderia construir um gráfico da variável “sobreviveu” por “sexo”?

R: Será construído um gráfico de barras para a variável solicitada.

barplot(tabela5,
        beside=TRUE,
        col=c("yellow","green"),
        main = "Gráfico 2 - Sobreviventes por sexo",
        ylim = c(0,2300),ylab="quantidade de sobreviventes",xlab="sexo dos sobreviventes",legend.text = TRUE)

Passo 5 - Outras possibilidades de visualização de alguns dados:

Analisando novas possibilidades de visualização de dados:

Gerando dois gráficos solicitados(balloonplot e mosaicplot),que destacam os sobreviventes da tragédia:

Criando os gráficos balloonplot e mosaicplot para a variável “sobreviveu”:

Gráfico para duas variáveis categóricas: Sobreviventes e Classe

Gráfico 3: balloonplot

library(ggplot2)
library(forcats)
library(ggpubr)

tabela<-table(Titanic$Classe,Titanic$Sobreviveu)
tabela<-data.frame(tabela1)
ggballoonplot(tabela, fill = "value")+
        ggtitle(" Gráfico 3 - Sobreviventes do Titanic")

Gráfico para duas variáveis categóricas: Sobreviventes e Classe

Gráfico 4: mosaicplot

mosaicplot(table(Titanic$Classe,Titanic$Sobreviveu),main = " Gráfico 4 - Sobreviventes do Titanic",color = c("red","blue"))

Analisando novas possibilidades de visualização de dados:

  1. Você poderia construir uma outra visualização de dados (além dessas duas)? Qual gráfico você sugere?

R:Sugiro fazer um gráfico de setores como outra possibilidade de visualização de uma determinada variável. Fazendo um gráfico de setores para a variável sobreviveu, tem-se:

Construção das Estatísticas: Tabela e Gráfico de Setores da variável “Sobreviveu”:

tabela3<-table(Titanic$Sobreviveu)

table(Titanic$Sobreviveu)
## 
## Não sobreviveu     Sobreviveu 
##           1490            710
pie(tabela3,col = c("blue","brown"), main = "Gráfico 5: Gráfico de setores da Variável Quantitativa:Sobreviventes")

Passo 6 - Interpretação de dois modelos gráficos dados(balloonplot e mosaicplot):

  1. Você consegue interpretar esses dois gráficos? o que eles estão dizendo?

R: O primeiro gráfico dado na publicação, chamado de balloonplot, mostra a frequência de sobreviventes, ou seja, a quantidade de sobreviventes de acordo com o local ocupado no navio. Pelo gráfico tem-se as seguintes informações:
No caso da tripulação, a maioria das pessoas não sobreviveram. Já para aqueles que estavam acomodados na primeira classe, o número de sobreviventes foi maior que o de mortos. Para os que estavam acomodados na segunda classe, houve um número bem menor de sobreviventes, que, nesse caso, foi inferior ao número de mortos dessa classe. Já para aqueles que estavam acomodados na terceira classe, o número de mortos foi bem superior ao número de sobreviventes.

Já o segundo gráfico mostrado na publicação, chamado de mosaicplot, mostra que houve maior quantidade de sobreviventes dentre os ocupantes da primeira classe e quantidade de mortos semelhante para os membros da tripulação e ocupantes da terceira classe.

Passo 7 - Recomendações/Posicionamento pessoal sobre a base de dados Titanic:

  1. Se você fosse fazer um Pitch (apresentação de 03 a 05 minutos) com recomendações sobre o Titanic a partir dos dados. Qual ideia você passaria? Quero um posicionamento!

R: Nessa apresentação eu destacaria a maior quantidade de sobreviventes dentre os ocupantes da primeira classe, talvez porque nesse local, por ser geralmente mais caro, houvesse melhores itens de segurança e maiores possibilidades de ventilação, refúgio ou acesso mais rápido a bote salva-vidas. Destacaria também o fato de o maior número de vítimas estarem entre os ocupantes da terceira classe e membros da tripulação, em que se supõe, que deveriam ser locais de difícil acesso e com poucos itens de segurança, o que provocou esse alto número de vítimas.