#Base de dados
load("C:/Users/User/Desktop/Base_de_dados-master/Titanic.RData")
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
#Tabela de contigência
tabela5 <-Titanic %>% select(Classe,Sobreviveu) %>% table()
tabela5
## Sobreviveu
## Classe Não sobreviveu Sobreviveu
## Tripulação 673 212
## Primeira 122 202
## Segunda 167 118
## Terceira 528 178
Com a tabela de contigência conseguimos observar a relação entre as duas variáveis categóricas, classe e sobrevivência, em com isso conseguimos observar a relação entre elas. Por exemplo, é possível concluir que a classe de tripulantes e a terceira possuem uma quantidade de mortos muito superior a primeira e a segunda, totalizando um total de 1201 mortos,contra 289 da primeira e da segunda classe. Já quanto a sobrevivência conseguimos observar que a tripulação teve 212 sobreviventes ( o maior número), enquanto a classe com menor número foi a segunda. Porém, toda essa análise não nos concede fidedignidade com a exata relação entre as duas variáveis analisadas. A pergunta que deve ser feita é a seguinte: quantas pessoas estavam em cada classe e qual o percentual de sobrevivência dentro de cada classe? Com isso, podemos analisar de forma proporcional qual classe teve um percentual de sobreviventes maior e a qual teve um percentual menor.A tabela abaixo mostra a relação entre as variáveis e a proporção entre os dados coletados.
#Tabela de proporções
prop.table(tabela5,1)*100
## Sobreviveu
## Classe Não sobreviveu Sobreviveu
## Tripulação 76.04520 23.95480
## Primeira 37.65432 62.34568
## Segunda 58.59649 41.40351
## Terceira 74.78754 25.21246
round(prop.table(tabela5,1)*100,1)
## Sobreviveu
## Classe Não sobreviveu Sobreviveu
## Tripulação 76.0 24.0
## Primeira 37.7 62.3
## Segunda 58.6 41.4
## Terceira 74.8 25.2
#Gráfico de barras da análise
barplot(tabela5,beside = TRUE,col =c("red", "black", "green", "pink"), main = "Análise Bivariada",legend.text = TRUE,ylim =c (0,800))
No gráfico de barras podemos vizualizar que a tripulação por estar em maior número e em condições mais adversas do que os outros passageiros, teve um total de mortos três vezes maior do de sobreviventes. Na terceira classe também conseguimos vizualizar que a quantidade de mortos foi quase o triplo do que a de sobreviventes. Na segunda classe ainda é possível concluir que mais da metade dos passageiros morreram no naufrágio. Por fim, a primeira classe , por ser a mais privilegiada em relação aos botes, coletes salva-vidas e rotas de saída, obteve um percentual de sobrevivÊncia maior do que as demais se analizarmos em termos proporionais, totalizando 62,3% de sobreviventes.