Passo 1 - Carregar o banco de dados

load("C:/Users/17325701756/Desktop/Base_de_dados-master/Titanic.RData")

HIPÓSTESES

Teve uma desigualdade da sObrevivência

Mulheres e crianças primeiro (será que elas sobreviveram mais do que os homens?)

#VARIÁVEIS #Variácel resposta (explicada, endogena) - Sobreviveu #Variáveis explicativas (preditores lineares, exogena)- sexo, idade(segunda hipótese) e classe(primeira hipótese)

#ANÁLISE DE DADOS #Duas variáveis qualitativas

tabela_sexo = table(Titanic$Sexo, Titanic$Sobreviveu)
tabela_sexo
##            
##             Não sobreviveu Sobreviveu
##   Feminino             126        344
##   Masculino           1364        366
tabela_idade = table(Titanic$Idade, Titanic$Sobreviveu)
tabela_idade
##          
##           Não sobreviveu Sobreviveu
##   criança             52         57
##   adulto            1438        653
prop.table(tabela_sexo, 1)
##            
##             Não sobreviveu Sobreviveu
##   Feminino       0.2680851  0.7319149
##   Masculino      0.7884393  0.2115607

Dado que é do gênero feminino, 73% sobreviveu

prop.table(tabela_sexo, 2)
##            
##             Não sobreviveu Sobreviveu
##   Feminino      0.08456376 0.48450704
##   Masculino     0.91543624 0.51549296

Dado que sobreviveu, 48% é do sexo feminino

Quantas crianças sobreviveram?

prop.table(tabela_idade,1)
##          
##           Não sobreviveu Sobreviveu
##   criança      0.4770642  0.5229358
##   adulto       0.6877092  0.3122908

Das pessoas que sobreviveram, quantas eram crianças?

prop.table(tabela_idade,2)
##          
##           Não sobreviveu Sobreviveu
##   criança     0.03489933 0.08028169
##   adulto      0.96510067 0.91971831

#Transformando o dado em porcentagem com *100

prop.table(tabela_idade,2) *100
##          
##           Não sobreviveu Sobreviveu
##   criança       3.489933   8.028169
##   adulto       96.510067  91.971831

#Transformando o dado em porcentagem com round (fica sem muitas casas decimais)

round(prop.table(tabela_idade,2)*100,2)
##          
##           Não sobreviveu Sobreviveu
##   criança           3.49       8.03
##   adulto           96.51      91.97
round(prop.table(tabela_idade,1)*100,2)
##          
##           Não sobreviveu Sobreviveu
##   criança          47.71      52.29
##   adulto           68.77      31.23

Carregando a tabela por classe

tabela_classe = table(Titanic$Classe, Titanic$Sobreviveu)
tabela_classe
##                   
##                    Não sobreviveu Sobreviveu
##   Tripula\xe7\xe3o            673        212
##   Primeira                    122        202
##   Segunda                     167        118
##   Terceira                    528        178

#Corrigindo o nome “Tripula3o” por “tripulacao”

Titanic$Classe= gsub("Tripula\xe7\xe3o", "Tripulacao", Titanic$Classe)

De cada classe, quantos % sobreviveram?

prop.table(tabela_classe,1) *100
##                   
##                    Não sobreviveu Sobreviveu
##   Tripula\xe7\xe3o       76.04520   23.95480
##   Primeira               37.65432   62.34568
##   Segunda                58.59649   41.40351
##   Terceira               74.78754   25.21246

#instalando novo pacote - ir até tela do lado direito, em “packages” e “install”, depois digitar nome do pacote

library(janitor)
## Warning: package 'janitor' was built under R version 4.2.1
## 
## Attaching package: 'janitor'
## The following objects are masked from 'package:stats':
## 
##     chisq.test, fisher.test
library(flextable)
## Warning: package 'flextable' was built under R version 4.2.1
tabyl(Titanic$Sexo)
##  Titanic$Sexo    n   percent
##      Feminino  470 0.2136364
##     Masculino 1730 0.7863636

#Com o “tabyl” ele nos traz o número absoluto e o percentual

tabyl(Titanic$Idade)
##  Titanic$Idade    n    percent
##        criança  109 0.04954545
##         adulto 2091 0.95045455
Titanic %>% tabyl(Classe, Sobreviveu) %>% 
  flextable()  %>% theme_vader()

#Por linha

Titanic %>% tabyl(Classe,Sobreviveu) %>% 
  adorn_percentages("row") %>%
  adorn_pct_formatting(digits = 2) %>%
  flextable() %>% bg(bg="red", part = "all")

Instalando pacote de cores RColorBrewer

library(RColorBrewer)

#Criando tabela quantos sobreviveram por classe

cor = brewer.pal(4,"Dark2")
cor
## [1] "#1B9E77" "#D95F02" "#7570B3" "#E7298A"
barplot(tabela_classe,beside = T,
        col = cor)

pARA VER AS CORES

display.brewer.all()

Tabela por idade

cor= brewer.pal(2,"Set1")
## Warning in brewer.pal(2, "Set1"): minimal value for n is 3, returning requested palette with 3 different levels
cor
## [1] "#E41A1C" "#377EB8" "#4DAF4A"
barplot(tabela_idade, beside = T,
        col= cor)