Passo 1 - Carregar a base de dados

load("~/Base_de_dados-master/Base_de_dados-master/Titanic.RData")

Passo 2 - Analise dos quartis

summary(Titanic)
##         Classe        Idade             Sexo               Sobreviveu  
##  Tripulação:885   criança: 109   Feminino : 470   Não sobreviveu:1490  
##  Primeira  :324   adulto :2091   Masculino:1730   Sobreviveu    : 710  
##  Segunda   :285                                                        
##  Terceira  :706

Passo 3 - Inspecionar elementos

str(Titanic)
## 'data.frame':    2200 obs. of  4 variables:
##  $ Classe    : Factor w/ 4 levels "Tripulação","Primeira",..: 2 2 2 2 2 2 2 2 2 2 ...
##  $ Idade     : Factor w/ 2 levels "criança","adulto": 2 2 2 2 2 2 2 2 2 2 ...
##  $ Sexo      : Factor w/ 2 levels "Feminino","Masculino": 2 2 2 2 2 2 2 2 2 2 ...
##  $ Sobreviveu: Factor w/ 2 levels "Não sobreviveu",..: 2 2 2 2 2 2 2 2 2 2 ...

Passo 4 - Grafico de pizza

pie(table(Titanic$Sobreviveu))

Passo 5 - Analise de variaveis

é valida a ese mulher e crianças primeiro? - sim, aconteceu há uma desigualdade social da sobrevivencia? - sim, a classe masi alta sobreviveu bem mais do que as demais classes

variavel chave - sobrevivencia variaveis explicativas: sexo, idade e classe do titanic

Passo 6 - Tabelas

tabela_sexo = table(Titanic$Sexo,Titanic$Sobreviveu)

tabela_idade = table(Titanic$Idade,Titanic$Sobreviveu)

tabela_sexo
##            
##             Não sobreviveu Sobreviveu
##   Feminino             126        344
##   Masculino           1364        366
tabela_idade
##          
##           Não sobreviveu Sobreviveu
##   criança             52         57
##   adulto            1438        653
prop.table(tabela_sexo,1) 
##            
##             Não sobreviveu Sobreviveu
##   Feminino       0.2680851  0.7319149
##   Masculino      0.7884393  0.2115607
prop.table(tabela_sexo,2)  
##            
##             Não sobreviveu Sobreviveu
##   Feminino      0.08456376 0.48450704
##   Masculino     0.91543624 0.51549296
prop.table(tabela_idade,1)*100
##          
##           Não sobreviveu Sobreviveu
##   criança       47.70642   52.29358
##   adulto        68.77092   31.22908
prop.table(tabela_idade,2)*100
##          
##           Não sobreviveu Sobreviveu
##   criança       3.489933   8.028169
##   adulto       96.510067  91.971831

Passo 6 - Grafico das tabelas em barras

barplot(tabela_sexo, col = c("navyblue","blue","purple","pink"), main = "Sobrevivencia por sexo", horiz = FALSE,beside = TRUE)

barplot(tabela_idade, col = c("green","orange","purple","pink"), main = "Sobrevivencia por idade", horiz = FALSE,beside = TRUE, legend = rownames(tabela_idade),ylim = c(0,2000))

library(RColorBrewer)
brewer.pal(5, "Blues")
## [1] "#EFF3FF" "#BDD7E7" "#6BAED6" "#3182BD" "#08519C"
cor = brewer.pal(3, "Reds")
display.brewer.all()

cor2 = brewer.pal(4,"Dark2")

Verificar as desigualdades

round(prop.table(table(Titanic$Classe,Titanic$Sobreviveu),1),1)*100
##             
##              Não sobreviveu Sobreviveu
##   Tripulação             80         20
##   Primeira               40         60
##   Segunda                60         40
##   Terceira               70         30
library(dplyr) 
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
cor3 = brewer.pal(4, "Set2")

tabela_classe = Titanic %>% select(Classe,Sobreviveu) %>%table %>%prop.table(1) %>%round(2)
tabela_classe
##             Sobreviveu
## Classe       Não sobreviveu Sobreviveu
##   Tripulação           0.76       0.24
##   Primeira             0.38       0.62
##   Segunda              0.59       0.41
##   Terceira             0.75       0.25
tabela_classe %>% barplot(beside=T,col=cor3,main= "Gráfico de sobrevivencia de classe",legend = row.names(tabela_classe), ylim=c(0,1))