# Carregar a base de dados Titanic
load("C:/Users/19411906770/Desktop/Base_de_dados-master/Titanic.RData")

Limpeza de dados

Titanic$Classe = iconv(Titanic$Classe, "latin1", "UTF-8")

# Verificando se o problema foi corrigido
tail(Titanic$Classe)
## [1] "Tripulação" "Tripulação" "Tripulação" "Tripulação" "Tripulação"
## [6] "Tripulação"
tabela1 = table(Titanic$Sobreviveu)
tabela1
## 
## Não sobreviveu     Sobreviveu 
##           1490            710
prop.table(tabela1)*100
## 
## Não sobreviveu     Sobreviveu 
##       67.72727       32.27273
barplot(tabela1, col = c ("red","blue"))

# Para fazer grafico em waffle, primeiro vai em packages no canto inferior direito, e depois install e digite WAFFLE
library(waffle)
?waffle

pegamos parts <- c(80, 30, 20, 10) chart <- waffle(parts, rows=8) do packages, para pegar o jeito de fazer/escrever e depois substituimos pelos nomes e valores desejados

pedaços <- c(Não_sobreviveu = 68, Sobreviveu = 32)
waffle(pedaços)

tail(Titanic$Sexo)
## [1] Feminino Feminino Feminino Feminino Feminino Feminino
## Levels: Feminino Masculino
tabela2 = table(Titanic$Sexo)
prop.table(tabela2)*100
## 
##  Feminino Masculino 
##  21.36364  78.63636
pedaços2 <- c(Masculino=78, feminino=22)
waffle(pedaços2)

parts <- c(80, 30, 20, 10)

#flextable

  library(dplyr)
library(flextable)

# %>% operador pipe

head(Titanic) %>% flextable()

Classe

Idade

Sexo

Sobreviveu

Primeira

adulto

Masculino

Sobreviveu

Primeira

adulto

Masculino

Sobreviveu

Primeira

adulto

Masculino

Sobreviveu

Primeira

adulto

Masculino

Sobreviveu

Primeira

adulto

Masculino

Sobreviveu

Primeira

adulto

Masculino

Sobreviveu

head(Titanic) %>% flextable() %>% theme_vader()

Classe

Idade

Sexo

Sobreviveu

Primeira

adulto

Masculino

Sobreviveu

Primeira

adulto

Masculino

Sobreviveu

Primeira

adulto

Masculino

Sobreviveu

Primeira

adulto

Masculino

Sobreviveu

Primeira

adulto

Masculino

Sobreviveu

Primeira

adulto

Masculino

Sobreviveu

Duas variáveis

Olhar a natureza da variável

  1. qualitativa x qualitativa

  2. qualitativa x quantitativa

  3. quantitativa x quantitativa

Questões de pesquisa

Teve uma desigualdade da sobrevivencia? Hipotese : desigualdade da sobrevivencia

Foi válida a expressão “mulheres e crianças primeiro”?

Desenho de pesquisa

Variável resposta/ de interesse: Sobrevivência Variáveis explicativa / Preditores lineares: o sexo, idade e a classe

Análise de dados

#Tabela simples

tabela3 = table(Titanic$Sobreviveu, Titanic$Classe)
tabela3
##                 
##                  Primeira Segunda Terceira Tripulação
##   Não sobreviveu      122     167      528        673
##   Sobreviveu          202     118      178        212
library(janitor)
## Warning: package 'janitor' was built under R version 4.2.3
## 
## Attaching package: 'janitor'
## The following objects are masked from 'package:stats':
## 
##     chisq.test, fisher.test
tabyl(Titanic,Sobreviveu,Classe) %>% flextable() %>%
 theme_vader

Sobreviveu

Primeira

Segunda

Terceira

Tripulação

Não sobreviveu

122

167

528

673

Sobreviveu

202

118

178

212

Tabela de proporção (1 linha, 2 coluna)

prop.table(tabela3,1)*100
##                 
##                   Primeira   Segunda  Terceira Tripulação
##   Não sobreviveu  8.187919 11.208054 35.436242  45.167785
##   Sobreviveu     28.450704 16.619718 25.070423  29.859155
prop.table(tabela3,2)*100
##                 
##                  Primeira  Segunda Terceira Tripulação
##   Não sobreviveu 37.65432 58.59649 74.78754   76.04520
##   Sobreviveu     62.34568 41.40351 25.21246   23.95480

Teve uma desigualdade dado que 62% da primeira classe sobreviveu e 76% da tripulação nao sobreviveu.

Gráfico para duas variáveis

barplot(tabela3)

barplot(tabela3, col = c("red","blue"), beside = TRUE, legend.text = rownames(tabela3), args.legend = list(x = "topleft"))

tabela4 = table(Titanic$Idade, Titanic$Sobreviveu)
theme_vader
## function (x, ...) 
## {
##     if (!inherits(x, "flextable")) {
##         stop(sprintf("Function `%s` supports only flextable objects.", 
##             "theme_vader()"))
##     }
##     x <- border_remove(x)
##     x <- bg(x, bg = "#242424", part = "all")
##     x <- color(x, color = "#dfdfdf", part = "all")
##     x <- bold(x = x, bold = FALSE, part = "all")
##     x <- bold(x = x, bold = TRUE, part = "header")
##     x <- italic(x = x, italic = FALSE, part = "all")
##     big_border <- fp_border(color = "#ff0000", width = flextable_global$defaults$border.width * 
##         2)
##     h_nrow <- nrow_part(x, "header")
##     b_nrow <- nrow_part(x, "body")
##     f_nrow <- nrow_part(x, "footer")
##     if (h_nrow > 0) {
##         x <- hline_bottom(x, border = big_border, part = "header")
##     }
##     if (b_nrow > 0 || h_nrow < 1) {
##         x <- hline_top(x, border = big_border, part = "body")
##     }
##     if (f_nrow > 0) {
##         x <- hline_top(x, border = big_border, part = "footer")
##     }
##     x <- align_text_col(x, align = "left", header = TRUE)
##     x <- align_nottext_col(x, align = "right", header = TRUE)
##     fix_border_issues(x)
## }
## <bytecode: 0x000002c099d88c78>
## <environment: namespace:flextable>
prop.table(tabela4,1)*100
##          
##           Não sobreviveu Sobreviveu
##   criança       47.70642   52.29358
##   adulto        68.77092   31.22908
prop.table(tabela4,2)*100
##          
##           Não sobreviveu Sobreviveu
##   criança       3.489933   8.028169
##   adulto       96.510067  91.971831
barplot(tabela4,col = c("yellow","purple"), beside = TRUE, legend.text = rownames(tabela4), args.legend = list(x="topright"))

52% das crianças sobreviveram e apenas 31% dos adultos sobreviveram As criançsa tiveram prioridade!

Conclusão

  1. Teve muita desigualdade entre as classes no que tange a sobrevivencia
  2. As crianças tiveram prioridade

Bibliografia