Passo a passo como olhar a base de dados

Passo 1: carregar a base dados

load(url("https://github.com/DATAUNIRIO/Base_de_dados/raw/master/Titanic.RData"))

#Passo 2 - OLhar a base de dados

str(Titanic)
## 'data.frame':    2200 obs. of  4 variables:
##  $ Classe    : Factor w/ 4 levels "Tripula\xe7\xe3o",..: 2 2 2 2 2 2 2 2 2 2 ...
##  $ Idade     : Factor w/ 2 levels "criança","adulto": 2 2 2 2 2 2 2 2 2 2 ...
##  $ Sexo      : Factor w/ 2 levels "Feminino","Masculino": 2 2 2 2 2 2 2 2 2 2 ...
##  $ Sobreviveu: Factor w/ 2 levels "Não sobreviveu",..: 2 2 2 2 2 2 2 2 2 2 ...
head(Titanic$Classe)
## [1] Primeira Primeira Primeira Primeira Primeira Primeira
## Levels: Tripula\xe7\xe3o Primeira Segunda Terceira
tail(Titanic$Classe)
## [1] Tripula\xe7\xe3o Tripula\xe7\xe3o Tripula\xe7\xe3o Tripula\xe7\xe3o
## [5] Tripula\xe7\xe3o Tripula\xe7\xe3o
## Levels: Tripula\xe7\xe3o Primeira Segunda Terceira

#Tripulação está escrita de forma errada

#Passo 3: Corrigir o problema

Titanic$Classe = iconv(Titanic$Classe, "latin1", "UTF-8")

#Passo 4 - Verificar se o problema foi resolvido

str(Titanic)
## 'data.frame':    2200 obs. of  4 variables:
##  $ Classe    : chr  "Primeira" "Primeira" "Primeira" "Primeira" ...
##  $ Idade     : Factor w/ 2 levels "criança","adulto": 2 2 2 2 2 2 2 2 2 2 ...
##  $ Sexo      : Factor w/ 2 levels "Feminino","Masculino": 2 2 2 2 2 2 2 2 2 2 ...
##  $ Sobreviveu: Factor w/ 2 levels "Não sobreviveu",..: 2 2 2 2 2 2 2 2 2 2 ...
tail(Titanic$Classe)
## [1] "Tripulação" "Tripulação" "Tripulação" "Tripulação" "Tripulação"
## [6] "Tripulação"
View(Titanic)

#resolvido

Questões de pesquisa:

-Quantas pessoas sobreviveram?

-Quantas pessoas de primeira classe?

-Qual a proporção de mulheres no Titanic?

Variáveis de interesse:

Sobreviveu, Classe e Sexo

Passo 5 - Tabela de Frequência

tabela_sobrevivencia = table(Titanic$Sobreviveu)
tabela_sobrevivencia
## 
## Não sobreviveu     Sobreviveu 
##           1490            710
tabela_classe = table(Titanic$Classe)
tabela_classe
## 
##   Primeira    Segunda   Terceira Tripulação 
##        324        285        706        885
tabela_sexo = table(Titanic$Sexo)
tabela_sexo
## 
##  Feminino Masculino 
##       470      1730

Passo 6 - proporções

round(prop.table(tabela_sobrevivencia)*100,2)
## 
## Não sobreviveu     Sobreviveu 
##          67.73          32.27
round(prop.table(tabela_sexo)*100,2)
## 
##  Feminino Masculino 
##     21.36     78.64
round(prop.table(tabela_classe)*100,2)
## 
##   Primeira    Segunda   Terceira Tripulação 
##      14.73      12.95      32.09      40.23

Passo 7 - Grafico de Pizza

pie(tabela_sobrevivencia)

pie(tabela_sobrevivencia, main = "Gráfico 1 - Sobreviventes Titanic")

Passo 8 - Mudar a cor

pie(tabela_sobrevivencia, col = c("green", "pink"),
    main = "Gráfico 1 - Sobreviventes do Titanic")

pie(tabela_classe)

pie(tabela_classe, main = "Gráfico 2 - Classes do Titanic")

pie (tabela_classe, col = c("lightblue", "white" , "pink" , "red"),
     main = "Grafico 2 - Classes do Titanic")

pie(tabela_sexo)

pie(tabela_sexo, main = "Gráfico 3 - Gêneros do Titanic")

pie (tabela_sexo, col = c("darkgreen" , "firebrick1" ),
     main = "Grafico 3 - Gêneros do Titanic")

Passo 9 - Gráfico de qualitativa ordinal

pie(tabela_classe)

pie(tabela_classe, main = "Gráfico 3 - Gêneros do Titanic")

pie (tabela_sexo, col = c("darkgreen" , "firebrick1" ),
     main = "Grafico 3 - Gêneros do Titanic")

barplot (tabela_classe,  col = c("lightblue", "white" , "pink" , "red"),
         main = "Grafico 4 - Classes do Titanic")

Passo 10 - Novo Gráfico

library(waffle)
## Carregando pacotes exigidos: ggplot2
fatias <- c(feminino=21, masculino=30)
waffle(fatias)

waffle(fatias,colors = c("pink", "royalblue"))

Passo 11 - Tabelas

library(flextable)

tabela_classe
## 
##   Primeira    Segunda   Terceira Tripulação 
##        324        285        706        885
class(tabela_classe)
## [1] "table"
tabela_classe2 = data.frame(tabela_classe)
class(tabela_classe2)
## [1] "data.frame"
library(dplyr)
## 
## Anexando pacote: 'dplyr'
## Os seguintes objetos são mascarados por 'package:stats':
## 
##     filter, lag
## Os seguintes objetos são mascarados por 'package:base':
## 
##     intersect, setdiff, setequal, union
flextable(tabela_classe2) %>% theme_vader()

Var1

Freq

Primeira

324

Segunda

285

Terceira

706

Tripulação

885