vamos fazer a analise de duas variaveis qualitativas. vamos carregar, olhar limpar e depois criar uma tabela de proporção dos sobreviventes do titanic.
# passo 1 - carregara base de dados
load("C:/Users/14086606798/Downloads/Titanic.RData")
#fase 2 - inspecionar a base de dados
#passo 2 -
tail(Titanic$Classe)
## [1] Tripula\xe7\xe3o Tripula\xe7\xe3o Tripula\xe7\xe3o Tripula\xe7\xe3o
## [5] Tripula\xe7\xe3o Tripula\xe7\xe3o
## Levels: Tripula\xe7\xe3o Primeira Segunda Terceira
#passo 3 - limpeza na base de dados
podemos perceber um problema no ~ e no ç podemos resolver isso no comando incov
#paso 3
Titanic$Classe <- iconv(Titanic$Classe, "latin1", "UTF-8")
variavel explicada - sobreviveu.
variavel explicativa - idade, sexo, classe.
carregar as blibliotecas
#blibliotecas
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.2.3
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(flextable)
## Warning: package 'flextable' was built under R version 4.2.3
library(janitor)
## Warning: package 'janitor' was built under R version 4.2.3
##
## Attaching package: 'janitor'
## The following objects are masked from 'package:stats':
##
## chisq.test, fisher.test
#Titanic %>% select(Classe,Sobreviveu) %>%
# adorn_percentage("row") %>%
# adorn_pct_formatting(digits = 2) %>%
# adorn_ns %>% flextable() %>% theme_zebra
##conclusão - reoria da desigualdade
teoria da desigualdade verificada! a primeira classe sobreviveu mais. a tripulação morreu em maior quantidade.
tabela_classe = table(Titanic$Sobreviveu, Titanic$Classe)
tabela_classe
##
## Primeira Segunda Terceira Tripulação
## Não sobreviveu 122 167 528 673
## Sobreviveu 202 118 178 212
barplot(tabela_classe)
barplot(tabela_classe, main = "sobreviventes do titanic por classe",
col=c("tan","blue"), beside = TRUE,
legend.text = rownames(tabela_classe),
args.legend = list(x = "topleft"))