Vamos trabalhar com duas variáveis quantitativas, mas antes vamos fazer um gráfico de waffle
#Base de dados Titanic
load("C:/Users/18014219783/Desktop/Base_de_dados-master/Titanic.RData")
#olhar base de dados
#tail(Titanic$Classe)
#mudança do encoding
Titanic$Classe = iconv(Titanic$Classe, "latin1", "UTF-8")
tabela1 = table(Titanic$Sobreviveu)
#tabela1
#prop.table(tabela1)*100
barplot(tabela1,col = c("red" , "blue"))
#baixar package waffle
library(waffle)
## Warning: package 'waffle' was built under R version 4.2.3
## Carregando pacotes exigidos: ggplot2
## Warning: package 'ggplot2' was built under R version 4.2.3
#?waffle
pedacos = c(Não_Sobreviveu=68,Sobreviveu=32)
waffle(pedacos)
tabela2 = table(Titanic$Sexo)
#tabela2
prop.table(tabela2)*100
##
## Feminino Masculino
## 21.36364 78.63636
pedacos2 = c(Feminino=21,Masculino=79)
waffle(pedacos2,colors=c("pink", "lightblue"))
library(dplyr)
#manipular dados
library(flextable)
#tranformar o objeto em interativo
head(Titanic) %>% flextable()
Classe | Idade | Sexo | Sobreviveu |
|---|---|---|---|
Primeira | adulto | Masculino | Sobreviveu |
Primeira | adulto | Masculino | Sobreviveu |
Primeira | adulto | Masculino | Sobreviveu |
Primeira | adulto | Masculino | Sobreviveu |
Primeira | adulto | Masculino | Sobreviveu |
Primeira | adulto | Masculino | Sobreviveu |
head(Titanic) %>% flextable() %>% theme_tron()
Classe | Idade | Sexo | Sobreviveu |
|---|---|---|---|
Primeira | adulto | Masculino | Sobreviveu |
Primeira | adulto | Masculino | Sobreviveu |
Primeira | adulto | Masculino | Sobreviveu |
Primeira | adulto | Masculino | Sobreviveu |
Primeira | adulto | Masculino | Sobreviveu |
Primeira | adulto | Masculino | Sobreviveu |
olhar a natureza da variável
Houve uma desigualdade de sobrevivência? Hipótese: desigualdade de sobrevivência
Foi válida a expressão “mulheres e crianças primeiro”?
Variável resposta/ Variável de interesse: Sobrevivência
Variáveis explicativas/ preditores lineares: sexo, idade, e classe
#Tabela simples
tabela3 = table(Titanic$Sobreviveu, Titanic$Classe)
tabela3
##
## Primeira Segunda Terceira Tripulação
## Não sobreviveu 122 167 528 673
## Sobreviveu 202 118 178 212
#Tabela melhorada
library(janitor)
## Warning: package 'janitor' was built under R version 4.2.3
##
## Attaching package: 'janitor'
## The following objects are masked from 'package:stats':
##
## chisq.test, fisher.test
tabyl(Titanic,Sobreviveu,Classe) %>% flextable() %>% theme_vader()
Sobreviveu | Primeira | Segunda | Terceira | Tripulação |
|---|---|---|---|---|
Não sobreviveu | 122 | 167 | 528 | 673 |
Sobreviveu | 202 | 118 | 178 | 212 |
prop.table(tabela3,1)
##
## Primeira Segunda Terceira Tripulação
## Não sobreviveu 0.08187919 0.11208054 0.35436242 0.45167785
## Sobreviveu 0.28450704 0.16619718 0.25070423 0.29859155
prop.table(tabela3,2)
##
## Primeira Segunda Terceira Tripulação
## Não sobreviveu 0.3765432 0.5859649 0.7478754 0.7604520
## Sobreviveu 0.6234568 0.4140351 0.2521246 0.2395480
Teve uma desigualdade dado que 62% da priemira classe sobreviveu e 76% da tripulação não sobreviveu.
barplot(tabela3, col=c("lightpink","lightblue"))
barplot(tabela3, col=c("red","lightgreen"), beside = TRUE,
legend.text = rownames(tabela3),
args.legend = list(x="topleft"))
#Tabela simples
tabela4 = table(Titanic$Sobreviveu, Titanic$Idade)
tabela4
##
## criança adulto
## Não sobreviveu 52 1438
## Sobreviveu 57 653
#Tabela de proporção
prop.table(tabela4,2)
##
## criança adulto
## Não sobreviveu 0.4770642 0.6877092
## Sobreviveu 0.5229358 0.3122908
barplot(tabela4, col=c("lightpink","lightblue"))
barplot(tabela4, col=c("red","lightgreen"), beside = TRUE,
legend.text = rownames(tabela3),
args.legend = list(x="topleft"))