Gráfico de barras, tabela de contingência e tabela de proporções das variáveis “Sobreviveu” e “Sexo”, da base de dados Titanic.Rdata.
Carregando base de dados:
load("C:/Users/dinho/Desktop/Base_de_dados-master/Titanic.RData")
Carregando a biblioteca do pacote dplyr que é usado para manipulação de variáveis:
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
Tabela de contingência:
Titanic %>% select(Sobreviveu,Sexo) %>% table()
## Sexo
## Sobreviveu Feminino Masculino
## Não sobreviveu 126 1364
## Sobreviveu 344 366
Fazendo uma correlação entre as variáveis podemos ver que, quatitativamente, morreram mais do que sobreviveram, e dentre os sobreviventes, quantitativamente, os homens foram a maioria.
Fazendo uma análise entre os sexos, quantitativamente, sobreviveu mais mulheres do que morreram, enquanto o contrário aconteceu entre os homens.
Tabela de proporções:
tabela1 <- Titanic %>% select(Sobreviveu,Sexo) %>% table()
round(prop.table(tabela1,1)*100,1)
## Sexo
## Sobreviveu Feminino Masculino
## Não sobreviveu 8.5 91.5
## Sobreviveu 48.5 51.5
Das pessoas que não sobreviveram: 8,5% foram do sexo feminino e 91,5% foram do sexo masculino.
Vemos que proporcionalmente dentre os sobreviventes, os homens obtiveram maior taxa, no entanto, também representaram a maior taxa de óbito, haja vista o grande número de homens na amostra.
Gráfico de barras:
barplot(tabela1,beside=TRUE,
col=c("red","darkgreen"),
main= "analise bivariada",
legend=TRUE,
ylim=c(0,1800))
Nesse gráfico podemos ver que dentre a quantidade total de mulheres, sobreviveram mais do que morreram. Enquanto aconteceu o inverso dentre os homens.
Observa-se também que, devido o número de homens que não sobreviveram ter sido muito grande, houve uma distorção no tamanho das barras.