knitr::opts_chunk$set(echo = TRUE)
options(digits=2)
Trabalhando com a base de dados Titanic e com várias variáveis ao mesmo tempo:
Eis as variáveis:
variável: classe
variável: idade
variável: sexo
variável: sobreviveu
Tabela das 4 variáveis:
table(Titanic$Classe,Titanic$Sobreviveu)
##
## Não sobreviveu Sobreviveu
## Tripulação 673 212
## Primeira 122 202
## Segunda 167 118
## Terceira 528 178
table(Titanic$Sexo,Titanic$Sobreviveu)
##
## Não sobreviveu Sobreviveu
## Feminino 126 344
## Masculino 1364 366
table(Titanic$Sobreviveu)
##
## Não sobreviveu Sobreviveu
## 1490 710
table(Titanic$Idade,Titanic$Sobreviveu)
##
## Não sobreviveu Sobreviveu
## criança 52 57
## adulto 1438 653
table(Titanic$Sobreviveu,Titanic$Sexo)
##
## Feminino Masculino
## Não sobreviveu 126 1364
## Sobreviveu 344 366
tabela1<-table(Titanic$Classe,Titanic$Sobreviveu)
tabela2<-table(Titanic$Sexo,Titanic$Sobreviveu)
tabela3<-table(Titanic$Sobreviveu)
tabela4<-table(Titanic$Idade,Titanic$Sobreviveu)
tabela5<-table(Titanic$Sobreviveu,Titanic$Sexo)
Perguntas:
CONHECENDO OS DADOS:
R: 2200 pessoas estavam no navio. São 2200 informações distribuidas em 4 variáveis distintas.
table(Titanic$Sobreviveu)
##
## Não sobreviveu Sobreviveu
## 1490 710
R: 710 pessoas sobreviveram ao desastre.
table(Titanic$Sobreviveu)
##
## Não sobreviveu Sobreviveu
## 1490 710
R: Eram 2200 pessoas presente no navio. Sendo assim, de acordo com a tabela 3: 0,32 sobreviveram e 0,68 não sobreviveram. Sendo assim, aproximadamente 32% das pessoas a bordo sobreviveram ao desastre.
prop.table(tabela3)
##
## Não sobreviveu Sobreviveu
## 0.68 0.32
ANÁLISE DESCRITIVA DOS DADOS:
R: 344 mulheres sobreviveram a essa tragédia.
table(Titanic$Sexo,Titanic$Sobreviveu)
##
## Não sobreviveu Sobreviveu
## Feminino 126 344
## Masculino 1364 366
R: 57 crianças sobreviventes.
table(Titanic$Idade,Titanic$Sobreviveu)
##
## Não sobreviveu Sobreviveu
## criança 52 57
## adulto 1438 653
R: 178 pessoas alojadas na terceira classe sobreviveram a essa tragédia.
table(Titanic$Classe,Titanic$Sobreviveu)
##
## Não sobreviveu Sobreviveu
## Tripulação 673 212
## Primeira 122 202
## Segunda 167 118
## Terceira 528 178
R: Pela tabela 2, aproximadamente 15,6% das mulheres sobreviveram.
table(Titanic$Sexo,Titanic$Sobreviveu)
##
## Não sobreviveu Sobreviveu
## Feminino 126 344
## Masculino 1364 366
prop.table(tabela2)*100
##
## Não sobreviveu Sobreviveu
## Feminino 5.7 15.6
## Masculino 62.0 16.6
R: Pela tabela 4, aproximadamente 2,6% das crianças sobreviveram.
table(Titanic$Idade,Titanic$Sobreviveu)
##
## Não sobreviveu Sobreviveu
## criança 52 57
## adulto 1438 653
prop.table(tabela4)*100
##
## Não sobreviveu Sobreviveu
## criança 2.4 2.6
## adulto 65.4 29.7
R: Pela tabela 1, aproximadamente 8,1% de passageiros da terceira classe sobreviveram ao desastre.
table(Titanic$Classe,Titanic$Sobreviveu)
##
## Não sobreviveu Sobreviveu
## Tripulação 673 212
## Primeira 122 202
## Segunda 167 118
## Terceira 528 178
prop.table(tabela1)*100
##
## Não sobreviveu Sobreviveu
## Tripulação 30.6 9.6
## Primeira 5.5 9.2
## Segunda 7.6 5.4
## Terceira 24.0 8.1
R: Seria possível utilizar o gráfico de barras.Tem-se poucas variáveis nessa distribuição de dados,no caso, 4 variáveis, o que favorece o uso do gráfico de barras. Esse tipo de gráfico é indicado para casos em que se está trabalhando com baixo número de variáveis.
R: Será construído um gráfico de barras para a variável solicitada.
barplot(tabela3,
beside=TRUE,
col=c("pink","skyblue"),
main = "Gráfico 1 - Sobreviventes do Titanic",
ylim = c(0,2500),ylab="quantidade de viajantes",xlab="sobreviventes e não sobreviventes",legend.text = TRUE)
R: Será construído um gráfico de barras para a variável solicitada.
barplot(tabela5,
beside=TRUE,
col=c("yellow","green"),
main = "Gráfico 2 - Sobreviventes por sexo",
ylim = c(0,2300),ylab="quantidade de sobreviventes",xlab="sexo dos sobreviventes",legend.text = TRUE)
Analisando novas possibilidades de visualização de dados:
Gerando dois gráficos solicitados(balloonplot e mosaicplot),que destacam os sobreviventes da tragédia:
Criando os gráficos balloonplot e mosaicplot para a variável “sobreviveu”:
library(ggplot2)
library(forcats)
library(ggpubr)
tabela<-table(Titanic$Classe,Titanic$Sobreviveu)
tabela<-data.frame(tabela1)
ggballoonplot(tabela, fill = "value")+
ggtitle(" Gráfico 3 - Sobreviventes do Titanic")
mosaicplot(table(Titanic$Classe,Titanic$Sobreviveu),main = " Gráfico 4 - Sobreviventes do Titanic",color = c("red","blue"))
Analisando novas possibilidades de visualização de dados:
R:Sugiro fazer um gráfico de setores como outra possibilidade de visualização de uma determinada variável. Fazendo um gráfico de setores para a variável sobreviveu, tem-se:
Construção das Estatísticas: Tabela e Gráfico de Setores da variável “Sobreviveu”:
tabela3<-table(Titanic$Sobreviveu)
table(Titanic$Sobreviveu)
##
## Não sobreviveu Sobreviveu
## 1490 710
pie(tabela3,col = c("blue","brown"), main = "Gráfico 5: Gráfico de setores da Variável Quantitativa:Sobreviventes")
R: O primeiro gráfico dado na publicação, chamado de balloonplot, mostra a frequência de sobreviventes, ou seja, a quantidade de sobreviventes de acordo com o local ocupado no navio. Pelo gráfico tem-se as seguintes informações:
No caso da tripulação, a maioria das pessoas não sobreviveram. Já para aqueles que estavam acomodados na primeira classe, o número de sobreviventes foi maior que o de mortos. Para os que estavam acomodados na segunda classe, houve um número bem menor de sobreviventes, que, nesse caso, foi inferior ao número de mortos dessa classe. Já para aqueles que estavam acomodados na terceira classe, o número de mortos foi bem superior ao número de sobreviventes.
Já o segundo gráfico mostrado na publicação, chamado de mosaicplot, mostra que houve maior quantidade de sobreviventes dentre os ocupantes da primeira classe e quantidade de mortos semelhante para os membros da tripulação e ocupantes da terceira classe.
R: Nessa apresentação eu destacaria a maior quantidade de sobreviventes dentre os ocupantes da primeira classe, talvez porque nesse local, por ser geralmente mais caro, houvesse melhores itens de segurança e maiores possibilidades de ventilação, refúgio ou acesso mais rápido a bote salva-vidas. Destacaria também o fato de o maior número de vítimas estarem entre os ocupantes da terceira classe e membros da tripulação, em que se supõe, que deveriam ser locais de difícil acesso e com poucos itens de segurança, o que provocou esse alto número de vítimas.