Introdução

Vamos trabalhar duas variáveis qualitativas, mas antes vamos fazer um gráfico de waffle

Carregar a base de dados

load("C:/Users/esthe/OneDrive/Área de Trabalho/Base_de_dados-master/Titanic.RData")

Limpeza de dados

Titanic$Classe = iconv(Titanic$Classe, "latin1" , "UTF-8")

Fazer o waffle

tabela1 = table(Titanic$Sobreviveu)
tabela1
## 
## Não sobreviveu     Sobreviveu 
##           1490            710
library(waffle)
## Carregando pacotes exigidos: ggplot2
pedacos = c(Não_sobreviveu=68, Sobreviveu=32)
waffle(pedacos)

Flextable

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(flextable)

head(Titanic) %>% flextable() %>% theme_vanilla()

Classe

Idade

Sexo

Sobreviveu

Primeira

adulto

Masculino

Sobreviveu

Primeira

adulto

Masculino

Sobreviveu

Primeira

adulto

Masculino

Sobreviveu

Primeira

adulto

Masculino

Sobreviveu

Primeira

adulto

Masculino

Sobreviveu

Primeira

adulto

Masculino

Sobreviveu

Duas variáveis

Necessário olhar natureza da variável

  1. Qualitativa x qualitativa
  2. Qualitativa x quantitativa
  3. Quantitativa x quantitativa

Questões de pesquisa

Teve uma desigualdade da sobrevivencia? Hipótese: desigualdade da sobrevivencia,

Foi valida a expressão “mulheres e crianças primeiro”?

Desenho de pesquisa

Variável resposta/ Variavel de interesse: Sobrevivencia

Variaveis explicativas/ Preditores Lineares: o sexo, a idade e a classe

##Análise de dados

tabela3 = table(Titanic$Sobreviveu,Titanic$Classe)
tabela3
##                 
##                  Primeira Segunda Terceira Tripulação
##   Não sobreviveu      122     167      528        673
##   Sobreviveu          202     118      178        212
# Tabela melhorada
library(janitor)
## 
## Attaching package: 'janitor'
## The following objects are masked from 'package:stats':
## 
##     chisq.test, fisher.test
tabyl(Titanic,Sobreviveu,Classe) %>% flextable() %>% theme_booktabs()

Sobreviveu

Primeira

Segunda

Terceira

Tripulação

Não sobreviveu

122

167

528

673

Sobreviveu

202

118

178

212

#Tabela de proporção

prop.table(tabela3,1)*100
##                 
##                   Primeira   Segunda  Terceira Tripulação
##   Não sobreviveu  8.187919 11.208054 35.436242  45.167785
##   Sobreviveu     28.450704 16.619718 25.070423  29.859155
prop.table(tabela3,2)*100
##                 
##                  Primeira  Segunda Terceira Tripulação
##   Não sobreviveu 37.65432 58.59649 74.78754   76.04520
##   Sobreviveu     62.34568 41.40351 25.21246   23.95480

Teve uma desigualdade dado que 62% da primeira classe sobreviveu e 76% da tripulação não sobreviveu. Trabalhador sempre é prejudicado.

Gráfico para duas variáveis

barplot(tabela3)

barplot(tabela3,col = c("yellow","green"),beside = TRUE,legend.text = rownames(tabela3),
        args.legend = list(x = "topleft"))

#Criança em relação a adulto

tabela4 = table(Titanic$Sobreviveu,Titanic$Idade)
tabela4
##                 
##                  criança adulto
##   Não sobreviveu      52   1438
##   Sobreviveu          57    653
prop.table(tabela4,2)*100
##                 
##                   criança   adulto
##   Não sobreviveu 47.70642 68.77092
##   Sobreviveu     52.29358 31.22908
library(janitor)
tabyl(Titanic,Sobreviveu,Idade) %>% flextable() %>% theme_booktabs()

Sobreviveu

criança

adulto

Não sobreviveu

52

1,438

Sobreviveu

57

653

Gráfico crianças e adultos

barplot(tabela4)

barplot(tabela4,col = c("pink","purple"),beside = TRUE,legend.text = rownames(tabela3),
        args.legend = list(x = "topleft"))

52% das crianças sobreviveram e apenas 31% dos adultos sobreviveram.

As crianças tiveram prioridade! Hipótese veridicada em parte!

#Conclusão

  1. Teve muita desilguadade entre as classes no que tange a sobrevivência
  2. As crianças

#Conclusão