Aula 2 de R

Author

Aula 2

Primeiro passo: carregar a base dados

load("C:/Users/alons/Base_de_dados-master/Titanic.RData")

#Passo 2 - Olhar a base de dados

str(Titanic)
'data.frame':   2200 obs. of  4 variables:
 $ Classe    : Factor w/ 4 levels "Tripula\xe7\xe3o",..: 2 2 2 2 2 2 2 2 2 2 ...
 $ Idade     : Factor w/ 2 levels "criança","adulto": 2 2 2 2 2 2 2 2 2 2 ...
 $ Sexo      : Factor w/ 2 levels "Feminino","Masculino": 2 2 2 2 2 2 2 2 2 2 ...
 $ Sobreviveu: Factor w/ 2 levels "Não sobreviveu",..: 2 2 2 2 2 2 2 2 2 2 ...
head(Titanic$Classe)
[1] Primeira Primeira Primeira Primeira Primeira Primeira
Levels: Tripula\xe7\xe3o Primeira Segunda Terceira
tail(Titanic$Classe)
[1] Tripula\xe7\xe3o Tripula\xe7\xe3o Tripula\xe7\xe3o Tripula\xe7\xe3o
[5] Tripula\xe7\xe3o Tripula\xe7\xe3o
Levels: Tripula\xe7\xe3o Primeira Segunda Terceira
# Tripulação está escrito de forma errada

#Passo 3 - Corrigir o problema

Titanic$Classe = iconv(Titanic$Classe, "latin1", "UTF-8")

#Passo 4 - Verificar se o problema foi corrigido

str(Titanic)
'data.frame':   2200 obs. of  4 variables:
 $ Classe    : chr  "Primeira" "Primeira" "Primeira" "Primeira" ...
 $ Idade     : Factor w/ 2 levels "criança","adulto": 2 2 2 2 2 2 2 2 2 2 ...
 $ Sexo      : Factor w/ 2 levels "Feminino","Masculino": 2 2 2 2 2 2 2 2 2 2 ...
 $ Sobreviveu: Factor w/ 2 levels "Não sobreviveu",..: 2 2 2 2 2 2 2 2 2 2 ...
tail(Titanic)
         Classe  Idade     Sexo     Sobreviveu
2195 Tripulação adulto Feminino     Sobreviveu
2196 Tripulação adulto Feminino     Sobreviveu
2197 Tripulação adulto Feminino     Sobreviveu
2198 Tripulação adulto Feminino Não sobreviveu
2199 Tripulação adulto Feminino Não sobreviveu
2200 Tripulação adulto Feminino Não sobreviveu
View(Titanic)
# problema resolvido!

# Questões de pesquisa
#Quantas pessoas sobreviveram?
#Quantas pessoas da primeira classe?
#Qual apporporção de mulheres no Titanic?

# Variáveis de interesse
# Sobreviveu, classes e sexo

#Passo 5 - Tabela de frequência

tabela_sobrevivencia = table(Titanic$Sobreviveu)
tabela_sobrevivencia

Não sobreviveu     Sobreviveu 
          1490            710 
tabela_clsse = table(Titanic$Classe)
tabela_clsse

  Primeira    Segunda   Terceira Tripulação 
       324        285        706        885 
tabela_sexo = table(Titanic$Sexo)
tabela_sexo

 Feminino Masculino 
      470      1730 

#Passo 6 - Proporções

prop.table(tabela_sobrevivencia)*100

Não sobreviveu     Sobreviveu 
      67.72727       32.27273 
round(prop.table(tabela_sobrevivencia)*100,2)

Não sobreviveu     Sobreviveu 
         67.73          32.27 
round(prop.table(tabela_clsse)*100,2)

  Primeira    Segunda   Terceira Tripulação 
     14.73      12.95      32.09      40.23 
round(prop.table(tabela_sexo)*100,2)

 Feminino Masculino 
    21.36     78.64 

#Passo 7 - Gráfico de pizza

pie(tabela_sobrevivencia)

pie(tabela_sobrevivencia, main = "Gráfico 1 - sobrevivência do Titanic")

pie(tabela_sobrevivencia, col = c("aquamarine2","pink"),
    main = "Gráfico 1 - sobrevivência do Titanic com as cores da Mangueira")

#colors() 

pie(tabela_clsse, main = "Gráfico 2 - clsse do titanic")

pie(tabela_clsse, col = c("purple","paleturquoise1","palegreen","lightyellow2"),
    main = "Gráfico 2 - clsse do Titanic com as cores da Mangueira")

#colors()

pie(tabela_sexo,main = "Gráfico 3 - sexo do titanic")

pie(tabela_sexo, col = c("#183bba","blanchedalmond"),
    main = "Gráfico 3 - sexo do Titanic com as cores da Mangueira")

# obs: usar o seletor de cores do google(mais cores)

#Passo 8 - Gráfico de barras para variáveis ordinais

barplot(tabela_clsse, main = "Gráfico 2 - clsse do titanic")

barplot(tabela_clsse, col = c("purple","paleturquoise1","palegreen","lightyellow2"),
  main = "Gráfico 2 - clsse do Titanic")

#Passo 9 - Novo gráfico

prop.table(tabela_sexo)

 Feminino Masculino 
0.2136364 0.7863636 
library(waffle)
Carregando pacotes exigidos: ggplot2
?waffle
inicializando servidor httpd de ajuda ...
 concluído
Fatias <- c(Feminino=21, Masculino=79)
waffle(Fatias)

waffle(Fatias,colors = c("mediumaquamarine","khaki"))

#Passo 10 - Tabelas

library(flextable)

tabela_clsse

  Primeira    Segunda   Terceira Tripulação 
       324        285        706        885 
class(tabela_clsse)
[1] "table"
tabela_classe2 = data.frame(tabela_clsse)
class(tabela_classe2)
[1] "data.frame"
library(reactable)
reactable(tabela_classe2)

Conclusão

1- Importante identificar o tipo de variável para fazer as estatísticas

2- Gráficos de pizza são feitos com o comando pie( )

3- Gráficos de barras são feitos com o comando barplot()

4- O R é demais!