Introdução

Nessa atividade, realizaremos a construção de uma tabela com duas variáveis qualitativas, tabelas de proporção das variáveis, gráficos de barras e as análises estatísticas de cada um sobre a base de dados “personagens_livro” obtida dentro do objeto “Game of Thrones.RData”.

Carregando a base de dados

load("C:/Users/eduar/Base_de_dados-master/Game of Thrones.RData")

Resumo da base de dados

summary(personagens_livro)
##      nome             lealdade             sexo               nobre       
##  Length:917         Length:917         Length:917         Min.   :0.0000  
##  Class :character   Class :character   Class :character   1st Qu.:0.0000  
##  Mode  :character   Mode  :character   Mode  :character   Median :0.0000  
##                                                           Mean   :0.4689  
##                                                           3rd Qu.:1.0000  
##                                                           Max.   :1.0000  
##                                                                           
##  Guerra_dos_Tronos Furia_dos_Reis   Tormenta_de_Espadas Festim_dos_Corvos
##  Min.   :0.0000    Min.   :0.0000   Min.   :0.0000      Min.   :0.0000   
##  1st Qu.:0.0000    1st Qu.:0.0000   1st Qu.:0.0000      1st Qu.:0.0000   
##  Median :0.0000    Median :0.0000   Median :0.0000      Median :0.0000   
##  Mean   :0.2726    Mean   :0.3533   Mean   :0.4242      Mean   :0.2726   
##  3rd Qu.:1.0000    3rd Qu.:1.0000   3rd Qu.:1.0000      3rd Qu.:1.0000   
##  Max.   :1.0000    Max.   :1.0000   Max.   :1.0000      Max.   :1.0000   
##                                                                          
##  Danca_dos_Dragoes capitulo_apresentacao   ano_morte     livro inteiro da morte
##  Min.   :0.0000    Min.   : 0.00         Min.   :297.0   Min.   :1.000         
##  1st Qu.:0.0000    1st Qu.:11.00         1st Qu.:299.0   1st Qu.:2.000         
##  Median :0.0000    Median :27.00         Median :299.0   Median :3.000         
##  Mean   :0.2846    Mean   :28.86         Mean   :299.2   Mean   :2.928         
##  3rd Qu.:1.0000    3rd Qu.:43.00         3rd Qu.:300.0   3rd Qu.:4.000         
##  Max.   :1.0000    Max.   :80.00         Max.   :300.0   Max.   :5.000         
##                    NA's   :12            NA's   :612     NA's   :610           
##  capitulo_morte 
##  Min.   : 0.00  
##  1st Qu.:25.50  
##  Median :39.00  
##  Mean   :40.07  
##  3rd Qu.:57.00  
##  Max.   :80.00  
##  NA's   :618

Classificando as variáveis

class(personagens_livro$nome)
## [1] "character"
class(personagens_livro$lealdade)
## [1] "character"
class(personagens_livro$sexo)
## [1] "character"
class(personagens_livro$nobre)
## [1] "numeric"
class(personagens_livro$Guerra_dos_Tronos)
## [1] "numeric"
class(personagens_livro$Furia_dos_Reis)
## [1] "numeric"
class(personagens_livro$Tormenta_de_Espadas)
## [1] "numeric"
class(personagens_livro$Festim_dos_Corvos)
## [1] "numeric"
class(personagens_livro$Danca_dos_Dragoes)
## [1] "numeric"
class(personagens_livro$capitulo_apresentacao)
## [1] "numeric"
class(personagens_livro$ano_morte)
## [1] "numeric"
class(personagens_livro$`livro inteiro da morte`)
## [1] "numeric"
class(personagens_livro$capitulo_morte)
## [1] "numeric"

Detectando erros na classificação de algumas variáveis

Existem variaveis qualitativas que estao sendo classificadas como quantitativas, vamos resolver esse problema

Consertando as variáveis

personagens_livro$nobre = ifelse(personagens_livro$nobre==0, "nobre", "nao")
class(personagens_livro$nobre)
## [1] "character"

Problema resolvido

personagens_livro$Guerra_dos_Tronos = ifelse(personagens_livro$Guerra_dos_Tronos==0, "sim", "nao")
class(personagens_livro$Guerra_dos_Tronos)
## [1] "character"

Problema resolvido

personagens_livro$Furia_dos_Reis = ifelse(personagens_livro$Furia_dos_Reis==0, "sim", "nao")
class(personagens_livro$Furia_dos_Reis)
## [1] "character"

Problema resolvido

personagens_livro$Tormenta_de_Espadas = ifelse(personagens_livro$Tormenta_de_Espadas==0, "sim", "nao")
class(personagens_livro$Tormenta_de_Espadas)
## [1] "character"

Problema resolvido

personagens_livro$Festim_dos_Corvos = ifelse(personagens_livro$Festim_dos_Corvos ==0, "sim", "nao")
class(personagens_livro$Festim_dos_Corvos)
## [1] "character"

Problema resolvido

personagens_livro$Danca_dos_Dragoes = ifelse(personagens_livro$Danca_dos_Dragoes==0, "sim", "nao")
class(personagens_livro$Danca_dos_Dragoes)
## [1] "character"

Problema resolvido

personagens_livro$capitulo_apresentacao = ifelse(personagens_livro$capitulo_apresentacao==0, "sim", "nao")
class(personagens_livro$capitulo_apresentacao)
## [1] "character"

Problema resolvido

personagens_livro$`livro inteiro da morte` = ifelse(personagens_livro$`livro inteiro da morte`==0, "Game of Thrones", "Clash of Kings, etc.")
class(personagens_livro$`livro inteiro da morte`)
## [1] "character"

Problema resolvido

Limpeza de dados

Consertando uma informacao na variavel sexo

personagens_livro$sexo = gsub("femenino", "Feminino", personagens_livro$sexo)
class(personagens_livro$sexo)
## [1] "character"

Refazendo o resumo da base de dados

summary(personagens_livro)
##      nome             lealdade             sexo              nobre          
##  Length:917         Length:917         Length:917         Length:917        
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##                                                                             
##  Guerra_dos_Tronos  Furia_dos_Reis     Tormenta_de_Espadas Festim_dos_Corvos 
##  Length:917         Length:917         Length:917          Length:917        
##  Class :character   Class :character   Class :character    Class :character  
##  Mode  :character   Mode  :character   Mode  :character    Mode  :character  
##                                                                              
##                                                                              
##                                                                              
##                                                                              
##  Danca_dos_Dragoes  capitulo_apresentacao   ano_morte    
##  Length:917         Length:917            Min.   :297.0  
##  Class :character   Class :character      1st Qu.:299.0  
##  Mode  :character   Mode  :character      Median :299.0  
##                                           Mean   :299.2  
##                                           3rd Qu.:300.0  
##                                           Max.   :300.0  
##                                           NA's   :612    
##  livro inteiro da morte capitulo_morte 
##  Length:917             Min.   : 0.00  
##  Class :character       1st Qu.:25.50  
##  Mode  :character       Median :39.00  
##                         Mean   :40.07  
##                         3rd Qu.:57.00  
##                         Max.   :80.00  
##                         NA's   :618

Escolhendo as variáveis

As variaveis escolhidas foram sexo e nobre, que sao qualitativas nominais

Tabelas de valores absolutos da variável sexo

tabela_sexo = table(personagens_livro$sexo)
tabela_sexo
## 
##  Feminino masculino 
##       157       760

Tabelas de proporção da variável sexo

prop.table(tabela_sexo)*100
## 
##  Feminino masculino 
##  17.12105  82.87895

Construindo o gráfico de barras da variável sexo

barplot(tabela_sexo, col = c("yellow", "orange"))

Carregando o pacote waffle

library(waffle)

Construindo o gráfico de waffle da variável sexo

pedacos = c(masculino=83, Feminino=18)
waffle(pedacos, col = c("red", "lemonchiffon"))

### Tabela de valores absolutos da variável nobre
### Duas variáveis Olhar a natureza da variável
1. quali x quali sexo x nobre
### Questões de pesquisa 1. Qual sexo predomina no quesito de ser nobre?
2. Qual casa tem mais personagens nobres?
## Desenho de pesquisa Variável resposta/ Variável de interesse: nobre
Variáveis explicativas / preditores lineares: sexo, lealdade

Análise de dados

Tabela simples nobre x sexo

tabela3 = table(personagens_livro$nobre, personagens_livro$sexo)
tabela3
##        
##         Feminino masculino
##   nao         84       346
##   nobre       73       414

Análise estatística

Constatamos que há 84 personagens do sexo feminino que não são nobres e 73 do mesmo sexo que são nobres

Constatamos que há 346 não nobres e 414 nobres do sexo masculino.

Tabela melhorada nobre x sexo

library(janitor)

tabyl(personagens_livro, nobre, sexo) %>% flextable() %>% theme_tron_legacy()

nobre

Feminino

masculino

nao

84

346

nobre

73

414

prop.table(tabela3,1)*100
##        
##         Feminino masculino
##   nao   19.53488  80.46512
##   nobre 14.98973  85.01027
prop.table(tabela3,2)*100
##        
##         Feminino masculino
##   nao   53.50318  45.52632
##   nobre 46.49682  54.47368

Análise estatística

Há bem mais personagens do sexo masculino nobres sendo eles 54% e não nobres do sexo feminino sendo eles 53%.

Gráfico para duas variáveis nobre x sexo

barplot(tabela3,col=c("hotpink","blue"),beside = TRUE,
        legend.text = rownames(tabela3),
        args.legend = list(x="topleft"))

# Análise estatística No grafico de barras conseguimos visualizar a diferença na uqantidade de personagens de forma mais perceptível onde claramente o lado masculino possui a maior quantidade de pessoas, sendo elas nobres ou não.

Tabela simples nobre x lealdade

tabela4 = table(personagens_livro$nobre, personagens_livro$lealdade)
tabela4
##        
##         Arryn Baratheon Greyjoy Guardia de la Noche Lannister Martell Ninguna
##   nao      20        47      37                  11        66      25      93
##   nobre    10        17      38                 105        36      12     160
##        
##         Salvajes Stark Targaryen Tully Tyrell
##   nao         10    69        10    21     21
##   nobre       30    39        26     9      5

Análise estatística

Há mais personagens nobres que são leais à casa Ninguna possuindo 160 pessoas do que a casa Tyrell que possui apenas 5.

Os personagens não nobres estão mais concentrados na casa Ninguna também, contendo 93 pessoas, diferente das casas Salvajes e Targaryen com apenas 10.

É possivel destacar que a maior parte dos personagens está concentrada na casa Ninguna, sendo eles nobres ou não.

Tabela melhorada nobre x lealdade

tabyl(personagens_livro, nobre, lealdade) %>% flextable() %>% theme_tron_legacy()

nobre

Arryn

Baratheon

Greyjoy

Guardia de la Noche

Lannister

Martell

Ninguna

Salvajes

Stark

Targaryen

Tully

Tyrell

nao

20

47

37

11

66

25

93

10

69

10

21

21

nobre

10

17

38

105

36

12

160

30

39

26

9

5

prop.table(tabela4,1)*100
##        
##             Arryn Baratheon   Greyjoy Guardia de la Noche Lannister   Martell
##   nao    4.651163 10.930233  8.604651            2.558140 15.348837  5.813953
##   nobre  2.053388  3.490760  7.802875           21.560575  7.392197  2.464066
##        
##           Ninguna  Salvajes     Stark Targaryen     Tully    Tyrell
##   nao   21.627907  2.325581 16.046512  2.325581  4.883721  4.883721
##   nobre 32.854209  6.160164  8.008214  5.338809  1.848049  1.026694
prop.table(tabela4,2)*100
##        
##             Arryn Baratheon   Greyjoy Guardia de la Noche Lannister   Martell
##   nao   66.666667 73.437500 49.333333            9.482759 64.705882 67.567568
##   nobre 33.333333 26.562500 50.666667           90.517241 35.294118 32.432432
##        
##           Ninguna  Salvajes     Stark Targaryen     Tully    Tyrell
##   nao   36.758893 25.000000 63.888889 27.777778 70.000000 80.769231
##   nobre 63.241107 75.000000 36.111111 72.222222 30.000000 19.230769

Análise estatística

90% dos personagens leais a casa La Noche são nobres, em comparação, apenas 19% dos personagens leais a casa Tyrell são nobres.

80% dos personagens leais a casa Tyrell não são nobres, em comparação, apenas 9% dos personagens leais a casa La Noche não são nobres.

É perceptivel que a maior porcentagem de nobres está concentrada na casa La Noche e a maior porcentagem de não nobres está concentrada na casa Tyrell.

Gráfico para duas variáveis nobre x lealdade

barplot(tabela4, col = c("green", "salmon4"), beside = TRUE,
        legend.text = rownames(tabela4),
        args.legend = list(x="right"))

Conclusão das questões

Conseguimos destacar que o sexo que predomina no quesito ser nobre é o sexo masculino

A casa Ninguna tem a maior cquantidade de personagens nobres.

Com os dados obtidos em todas as tabelas e gráficos, conseguimos realizar todas as análises estatísticas necessárias para entender melhor a base de dados e responder às questões levantadas ao comparar duas variáveis qualitativas.