Vamos trabalhar duas variáveis qualitativas, mas antes vamos fazer um gráfico de waffle
load("C:/Users/esthe/OneDrive/Área de Trabalho/Base_de_dados-master/Titanic.RData")
Titanic$Classe = iconv(Titanic$Classe, "latin1" , "UTF-8")
tabela1 = table(Titanic$Sobreviveu)
tabela1
##
## Não sobreviveu Sobreviveu
## 1490 710
library(waffle)
## Carregando pacotes exigidos: ggplot2
pedacos = c(Não_sobreviveu=68, Sobreviveu=32)
waffle(pedacos)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(flextable)
head(Titanic) %>% flextable() %>% theme_vanilla()
Classe | Idade | Sexo | Sobreviveu |
|---|---|---|---|
Primeira | adulto | Masculino | Sobreviveu |
Primeira | adulto | Masculino | Sobreviveu |
Primeira | adulto | Masculino | Sobreviveu |
Primeira | adulto | Masculino | Sobreviveu |
Primeira | adulto | Masculino | Sobreviveu |
Primeira | adulto | Masculino | Sobreviveu |
Necessário olhar natureza da variável
Teve uma desigualdade da sobrevivencia? Hipótese: desigualdade da sobrevivencia,
Foi valida a expressão “mulheres e crianças primeiro”?
Variável resposta/ Variavel de interesse: Sobrevivencia
Variaveis explicativas/ Preditores Lineares: o sexo, a idade e a classe
##Análise de dados
tabela3 = table(Titanic$Sobreviveu,Titanic$Classe)
tabela3
##
## Primeira Segunda Terceira Tripulação
## Não sobreviveu 122 167 528 673
## Sobreviveu 202 118 178 212
# Tabela melhorada
library(janitor)
##
## Attaching package: 'janitor'
## The following objects are masked from 'package:stats':
##
## chisq.test, fisher.test
tabyl(Titanic,Sobreviveu,Classe) %>% flextable() %>% theme_booktabs()
Sobreviveu | Primeira | Segunda | Terceira | Tripulação |
|---|---|---|---|---|
Não sobreviveu | 122 | 167 | 528 | 673 |
Sobreviveu | 202 | 118 | 178 | 212 |
#Tabela de proporção
prop.table(tabela3,1)*100
##
## Primeira Segunda Terceira Tripulação
## Não sobreviveu 8.187919 11.208054 35.436242 45.167785
## Sobreviveu 28.450704 16.619718 25.070423 29.859155
prop.table(tabela3,2)*100
##
## Primeira Segunda Terceira Tripulação
## Não sobreviveu 37.65432 58.59649 74.78754 76.04520
## Sobreviveu 62.34568 41.40351 25.21246 23.95480
Teve uma desigualdade dado que 62% da primeira classe sobreviveu e 76% da tripulação não sobreviveu. Trabalhador sempre é prejudicado.
barplot(tabela3)
barplot(tabela3,col = c("yellow","green"),beside = TRUE,legend.text = rownames(tabela3),
args.legend = list(x = "topleft"))
#Criança em relação a adulto
tabela4 = table(Titanic$Sobreviveu,Titanic$Idade)
tabela4
##
## criança adulto
## Não sobreviveu 52 1438
## Sobreviveu 57 653
prop.table(tabela4,2)*100
##
## criança adulto
## Não sobreviveu 47.70642 68.77092
## Sobreviveu 52.29358 31.22908
library(janitor)
tabyl(Titanic,Sobreviveu,Idade) %>% flextable() %>% theme_booktabs()
Sobreviveu | criança | adulto |
|---|---|---|
Não sobreviveu | 52 | 1,438 |
Sobreviveu | 57 | 653 |
barplot(tabela4)
barplot(tabela4,col = c("pink","purple"),beside = TRUE,legend.text = rownames(tabela3),
args.legend = list(x = "topleft"))
52% das crianças sobreviveram e apenas 31% dos adultos sobreviveram.
As crianças tiveram prioridade! Hipótese veridicada em parte!
#Conclusão
#Conclusão