load("C:/Users/17325701756/Desktop/Base_de_dados-master/Titanic.RData")
#VARIÁVEIS #Variácel resposta (explicada, endogena) - Sobreviveu #Variáveis explicativas (preditores lineares, exogena)- sexo, idade(segunda hipótese) e classe(primeira hipótese)
#ANÁLISE DE DADOS #Duas variáveis qualitativas
tabela_sexo = table(Titanic$Sexo, Titanic$Sobreviveu)
tabela_sexo
##
## Não sobreviveu Sobreviveu
## Feminino 126 344
## Masculino 1364 366
tabela_idade = table(Titanic$Idade, Titanic$Sobreviveu)
tabela_idade
##
## Não sobreviveu Sobreviveu
## criança 52 57
## adulto 1438 653
prop.table(tabela_sexo, 1)
##
## Não sobreviveu Sobreviveu
## Feminino 0.2680851 0.7319149
## Masculino 0.7884393 0.2115607
prop.table(tabela_sexo, 2)
##
## Não sobreviveu Sobreviveu
## Feminino 0.08456376 0.48450704
## Masculino 0.91543624 0.51549296
prop.table(tabela_idade,1)
##
## Não sobreviveu Sobreviveu
## criança 0.4770642 0.5229358
## adulto 0.6877092 0.3122908
prop.table(tabela_idade,2)
##
## Não sobreviveu Sobreviveu
## criança 0.03489933 0.08028169
## adulto 0.96510067 0.91971831
#Transformando o dado em porcentagem com *100
prop.table(tabela_idade,2) *100
##
## Não sobreviveu Sobreviveu
## criança 3.489933 8.028169
## adulto 96.510067 91.971831
#Transformando o dado em porcentagem com round (fica sem muitas casas decimais)
round(prop.table(tabela_idade,2)*100,2)
##
## Não sobreviveu Sobreviveu
## criança 3.49 8.03
## adulto 96.51 91.97
round(prop.table(tabela_idade,1)*100,2)
##
## Não sobreviveu Sobreviveu
## criança 47.71 52.29
## adulto 68.77 31.23
tabela_classe = table(Titanic$Classe, Titanic$Sobreviveu)
tabela_classe
##
## Não sobreviveu Sobreviveu
## Tripula\xe7\xe3o 673 212
## Primeira 122 202
## Segunda 167 118
## Terceira 528 178
#Corrigindo o nome “Tripula3o” por “tripulacao”
Titanic$Classe= gsub("Tripula\xe7\xe3o", "Tripulacao", Titanic$Classe)
prop.table(tabela_classe,1) *100
##
## Não sobreviveu Sobreviveu
## Tripula\xe7\xe3o 76.04520 23.95480
## Primeira 37.65432 62.34568
## Segunda 58.59649 41.40351
## Terceira 74.78754 25.21246
#instalando novo pacote - ir até tela do lado direito, em “packages” e “install”, depois digitar nome do pacote
library(janitor)
## Warning: package 'janitor' was built under R version 4.2.1
##
## Attaching package: 'janitor'
## The following objects are masked from 'package:stats':
##
## chisq.test, fisher.test
library(flextable)
## Warning: package 'flextable' was built under R version 4.2.1
tabyl(Titanic$Sexo)
## Titanic$Sexo n percent
## Feminino 470 0.2136364
## Masculino 1730 0.7863636
#Com o “tabyl” ele nos traz o número absoluto e o percentual
tabyl(Titanic$Idade)
## Titanic$Idade n percent
## criança 109 0.04954545
## adulto 2091 0.95045455
Titanic %>% tabyl(Classe, Sobreviveu) %>%
flextable() %>% theme_vader()
Classe | Não sobreviveu | Sobreviveu |
Primeira | 122 | 202 |
Segunda | 167 | 118 |
Terceira | 528 | 178 |
Tripulacao | 673 | 212 |
#Por linha
Titanic %>% tabyl(Classe,Sobreviveu) %>%
adorn_percentages("row") %>%
adorn_pct_formatting(digits = 2) %>%
flextable() %>% bg(bg="red", part = "all")
Classe | Não sobreviveu | Sobreviveu |
Primeira | 37.65% | 62.35% |
Segunda | 58.60% | 41.40% |
Terceira | 74.79% | 25.21% |
Tripulacao | 76.05% | 23.95% |
library(RColorBrewer)
#Criando tabela quantos sobreviveram por classe
cor = brewer.pal(4,"Dark2")
cor
## [1] "#1B9E77" "#D95F02" "#7570B3" "#E7298A"
barplot(tabela_classe,beside = T,
col = cor)
display.brewer.all()
cor= brewer.pal(2,"Set1")
## Warning in brewer.pal(2, "Set1"): minimal value for n is 3, returning requested palette with 3 different levels
cor
## [1] "#E41A1C" "#377EB8" "#4DAF4A"
barplot(tabela_idade, beside = T,
col= cor)