introdução

vamos fazer a analise de duas variaveis qualitativas. vamos carregar, olhar limpar e depois criar uma tabela de proporção dos sobreviventes do titanic.

fase 1 - carregar a base de dados

# passo 1 - carregara base de dados 
load("C:/Users/14086606798/Downloads/Titanic.RData")

#fase 2 - inspecionar a base de dados

#passo 2 - 
tail(Titanic$Classe)
## [1] Tripula\xe7\xe3o Tripula\xe7\xe3o Tripula\xe7\xe3o Tripula\xe7\xe3o
## [5] Tripula\xe7\xe3o Tripula\xe7\xe3o
## Levels: Tripula\xe7\xe3o Primeira Segunda Terceira

#passo 3 - limpeza na base de dados

podemos perceber um problema no ~ e no ç podemos resolver isso no comando incov

#paso 3

Titanic$Classe <- iconv(Titanic$Classe, "latin1", "UTF-8")

passo 4 - desenho de pesquisa

variavel explicada - sobreviveu.

variavel explicativa - idade, sexo, classe.

passo 5 analise bi-variada (duas variaveis qualitativas)

carregar as blibliotecas

#blibliotecas
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.2.3
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(flextable)
## Warning: package 'flextable' was built under R version 4.2.3
library(janitor)
## Warning: package 'janitor' was built under R version 4.2.3
## 
## Attaching package: 'janitor'
## The following objects are masked from 'package:stats':
## 
##     chisq.test, fisher.test

passo 6 - fazer a tabela

#Titanic %>% select(Classe,Sobreviveu) %>%
#  adorn_percentage("row") %>%
#  adorn_pct_formatting(digits = 2) %>%
#  adorn_ns %>% flextable() %>% theme_zebra

##conclusão - reoria da desigualdade

teoria da desigualdade verificada! a primeira classe sobreviveu mais. a tripulação morreu em maior quantidade.

tabela_classe = table(Titanic$Sobreviveu, Titanic$Classe)
tabela_classe
##                 
##                  Primeira Segunda Terceira Tripulação
##   Não sobreviveu      122     167      528        673
##   Sobreviveu          202     118      178        212
barplot(tabela_classe)

barplot(tabela_classe, main = "sobreviventes do titanic por classe",
        col=c("tan","blue"), beside = TRUE, 
        legend.text = rownames(tabela_classe),
        args.legend = list(x = "topleft"))