Nessa atividade, realizaremos a construção de uma tabela com duas variáveis qualitativas, tabelas de proporção das variáveis, gráficos de barras e as análises estatísticas de cada um sobre a base de dados “personagens_livro” obtida dentro do objeto “Game of Thrones.RData”.
load("C:/Users/eduar/Base_de_dados-master/Game of Thrones.RData")
summary(personagens_livro)
## nome lealdade sexo nobre
## Length:917 Length:917 Length:917 Min. :0.0000
## Class :character Class :character Class :character 1st Qu.:0.0000
## Mode :character Mode :character Mode :character Median :0.0000
## Mean :0.4689
## 3rd Qu.:1.0000
## Max. :1.0000
##
## Guerra_dos_Tronos Furia_dos_Reis Tormenta_de_Espadas Festim_dos_Corvos
## Min. :0.0000 Min. :0.0000 Min. :0.0000 Min. :0.0000
## 1st Qu.:0.0000 1st Qu.:0.0000 1st Qu.:0.0000 1st Qu.:0.0000
## Median :0.0000 Median :0.0000 Median :0.0000 Median :0.0000
## Mean :0.2726 Mean :0.3533 Mean :0.4242 Mean :0.2726
## 3rd Qu.:1.0000 3rd Qu.:1.0000 3rd Qu.:1.0000 3rd Qu.:1.0000
## Max. :1.0000 Max. :1.0000 Max. :1.0000 Max. :1.0000
##
## Danca_dos_Dragoes capitulo_apresentacao ano_morte livro inteiro da morte
## Min. :0.0000 Min. : 0.00 Min. :297.0 Min. :1.000
## 1st Qu.:0.0000 1st Qu.:11.00 1st Qu.:299.0 1st Qu.:2.000
## Median :0.0000 Median :27.00 Median :299.0 Median :3.000
## Mean :0.2846 Mean :28.86 Mean :299.2 Mean :2.928
## 3rd Qu.:1.0000 3rd Qu.:43.00 3rd Qu.:300.0 3rd Qu.:4.000
## Max. :1.0000 Max. :80.00 Max. :300.0 Max. :5.000
## NA's :12 NA's :612 NA's :610
## capitulo_morte
## Min. : 0.00
## 1st Qu.:25.50
## Median :39.00
## Mean :40.07
## 3rd Qu.:57.00
## Max. :80.00
## NA's :618
class(personagens_livro$nome)
## [1] "character"
class(personagens_livro$lealdade)
## [1] "character"
class(personagens_livro$sexo)
## [1] "character"
class(personagens_livro$nobre)
## [1] "numeric"
class(personagens_livro$Guerra_dos_Tronos)
## [1] "numeric"
class(personagens_livro$Furia_dos_Reis)
## [1] "numeric"
class(personagens_livro$Tormenta_de_Espadas)
## [1] "numeric"
class(personagens_livro$Festim_dos_Corvos)
## [1] "numeric"
class(personagens_livro$Danca_dos_Dragoes)
## [1] "numeric"
class(personagens_livro$capitulo_apresentacao)
## [1] "numeric"
class(personagens_livro$ano_morte)
## [1] "numeric"
class(personagens_livro$`livro inteiro da morte`)
## [1] "numeric"
class(personagens_livro$capitulo_morte)
## [1] "numeric"
Existem variaveis qualitativas que estao sendo classificadas como quantitativas, vamos resolver esse problema
personagens_livro$nobre = ifelse(personagens_livro$nobre==0, "nobre", "nao")
class(personagens_livro$nobre)
## [1] "character"
Problema resolvido
personagens_livro$Guerra_dos_Tronos = ifelse(personagens_livro$Guerra_dos_Tronos==0, "sim", "nao")
class(personagens_livro$Guerra_dos_Tronos)
## [1] "character"
Problema resolvido
personagens_livro$Furia_dos_Reis = ifelse(personagens_livro$Furia_dos_Reis==0, "sim", "nao")
class(personagens_livro$Furia_dos_Reis)
## [1] "character"
Problema resolvido
personagens_livro$Tormenta_de_Espadas = ifelse(personagens_livro$Tormenta_de_Espadas==0, "sim", "nao")
class(personagens_livro$Tormenta_de_Espadas)
## [1] "character"
Problema resolvido
personagens_livro$Festim_dos_Corvos = ifelse(personagens_livro$Festim_dos_Corvos ==0, "sim", "nao")
class(personagens_livro$Festim_dos_Corvos)
## [1] "character"
Problema resolvido
personagens_livro$Danca_dos_Dragoes = ifelse(personagens_livro$Danca_dos_Dragoes==0, "sim", "nao")
class(personagens_livro$Danca_dos_Dragoes)
## [1] "character"
Problema resolvido
personagens_livro$capitulo_apresentacao = ifelse(personagens_livro$capitulo_apresentacao==0, "sim", "nao")
class(personagens_livro$capitulo_apresentacao)
## [1] "character"
Problema resolvido
personagens_livro$`livro inteiro da morte` = ifelse(personagens_livro$`livro inteiro da morte`==0, "Game of Thrones", "Clash of Kings, etc.")
class(personagens_livro$`livro inteiro da morte`)
## [1] "character"
Problema resolvido
Consertando uma informacao na variavel sexo
personagens_livro$sexo = gsub("femenino", "Feminino", personagens_livro$sexo)
class(personagens_livro$sexo)
## [1] "character"
summary(personagens_livro)
## nome lealdade sexo nobre
## Length:917 Length:917 Length:917 Length:917
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
##
## Guerra_dos_Tronos Furia_dos_Reis Tormenta_de_Espadas Festim_dos_Corvos
## Length:917 Length:917 Length:917 Length:917
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
##
## Danca_dos_Dragoes capitulo_apresentacao ano_morte
## Length:917 Length:917 Min. :297.0
## Class :character Class :character 1st Qu.:299.0
## Mode :character Mode :character Median :299.0
## Mean :299.2
## 3rd Qu.:300.0
## Max. :300.0
## NA's :612
## livro inteiro da morte capitulo_morte
## Length:917 Min. : 0.00
## Class :character 1st Qu.:25.50
## Mode :character Median :39.00
## Mean :40.07
## 3rd Qu.:57.00
## Max. :80.00
## NA's :618
As variaveis escolhidas foram sexo e nobre, que sao qualitativas nominais
tabela_sexo = table(personagens_livro$sexo)
tabela_sexo
##
## Feminino masculino
## 157 760
prop.table(tabela_sexo)*100
##
## Feminino masculino
## 17.12105 82.87895
barplot(tabela_sexo, col = c("yellow", "orange"))
library(waffle)
pedacos = c(masculino=83, Feminino=18)
waffle(pedacos, col = c("red", "lemonchiffon"))
| ### Tabela de valores absolutos da variável nobre |
|---|
| ### Duas variáveis Olhar a natureza da variável |
| 1. quali x quali sexo x nobre |
| ### Questões de pesquisa 1. Qual sexo predomina no quesito de ser nobre? |
| 2. Qual casa tem mais personagens nobres? |
| ## Desenho de pesquisa Variável resposta/ Variável de interesse: nobre |
| Variáveis explicativas / preditores lineares: sexo, lealdade |
tabela3 = table(personagens_livro$nobre, personagens_livro$sexo)
tabela3
##
## Feminino masculino
## nao 84 346
## nobre 73 414
Constatamos que há 84 personagens do sexo feminino que não são nobres e 73 do mesmo sexo que são nobres
Constatamos que há 346 não nobres e 414 nobres do sexo masculino.
library(janitor)
tabyl(personagens_livro, nobre, sexo) %>% flextable() %>% theme_tron_legacy()
nobre | Feminino | masculino |
|---|---|---|
nao | 84 | 346 |
nobre | 73 | 414 |
prop.table(tabela3,1)*100
##
## Feminino masculino
## nao 19.53488 80.46512
## nobre 14.98973 85.01027
prop.table(tabela3,2)*100
##
## Feminino masculino
## nao 53.50318 45.52632
## nobre 46.49682 54.47368
Há bem mais personagens do sexo masculino nobres sendo eles 54% e não nobres do sexo feminino sendo eles 53%.
barplot(tabela3,col=c("hotpink","blue"),beside = TRUE,
legend.text = rownames(tabela3),
args.legend = list(x="topleft"))
# Análise estatística No grafico de barras conseguimos visualizar a
diferença na uqantidade de personagens de forma mais perceptível onde
claramente o lado masculino possui a maior quantidade de pessoas, sendo
elas nobres ou não.
tabela4 = table(personagens_livro$nobre, personagens_livro$lealdade)
tabela4
##
## Arryn Baratheon Greyjoy Guardia de la Noche Lannister Martell Ninguna
## nao 20 47 37 11 66 25 93
## nobre 10 17 38 105 36 12 160
##
## Salvajes Stark Targaryen Tully Tyrell
## nao 10 69 10 21 21
## nobre 30 39 26 9 5
Há mais personagens nobres que são leais à casa Ninguna possuindo 160 pessoas do que a casa Tyrell que possui apenas 5.
Os personagens não nobres estão mais concentrados na casa Ninguna também, contendo 93 pessoas, diferente das casas Salvajes e Targaryen com apenas 10.
É possivel destacar que a maior parte dos personagens está concentrada na casa Ninguna, sendo eles nobres ou não.
tabyl(personagens_livro, nobre, lealdade) %>% flextable() %>% theme_tron_legacy()
nobre | Arryn | Baratheon | Greyjoy | Guardia de la Noche | Lannister | Martell | Ninguna | Salvajes | Stark | Targaryen | Tully | Tyrell |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
nao | 20 | 47 | 37 | 11 | 66 | 25 | 93 | 10 | 69 | 10 | 21 | 21 |
nobre | 10 | 17 | 38 | 105 | 36 | 12 | 160 | 30 | 39 | 26 | 9 | 5 |
prop.table(tabela4,1)*100
##
## Arryn Baratheon Greyjoy Guardia de la Noche Lannister Martell
## nao 4.651163 10.930233 8.604651 2.558140 15.348837 5.813953
## nobre 2.053388 3.490760 7.802875 21.560575 7.392197 2.464066
##
## Ninguna Salvajes Stark Targaryen Tully Tyrell
## nao 21.627907 2.325581 16.046512 2.325581 4.883721 4.883721
## nobre 32.854209 6.160164 8.008214 5.338809 1.848049 1.026694
prop.table(tabela4,2)*100
##
## Arryn Baratheon Greyjoy Guardia de la Noche Lannister Martell
## nao 66.666667 73.437500 49.333333 9.482759 64.705882 67.567568
## nobre 33.333333 26.562500 50.666667 90.517241 35.294118 32.432432
##
## Ninguna Salvajes Stark Targaryen Tully Tyrell
## nao 36.758893 25.000000 63.888889 27.777778 70.000000 80.769231
## nobre 63.241107 75.000000 36.111111 72.222222 30.000000 19.230769
90% dos personagens leais a casa La Noche são nobres, em comparação, apenas 19% dos personagens leais a casa Tyrell são nobres.
80% dos personagens leais a casa Tyrell não são nobres, em comparação, apenas 9% dos personagens leais a casa La Noche não são nobres.
É perceptivel que a maior porcentagem de nobres está concentrada na casa La Noche e a maior porcentagem de não nobres está concentrada na casa Tyrell.
barplot(tabela4, col = c("green", "salmon4"), beside = TRUE,
legend.text = rownames(tabela4),
args.legend = list(x="right"))
Conseguimos destacar que o sexo que predomina no quesito ser nobre é o sexo masculino
A casa Ninguna tem a maior cquantidade de personagens nobres.
Com os dados obtidos em todas as tabelas e gráficos, conseguimos realizar todas as análises estatísticas necessárias para entender melhor a base de dados e responder às questões levantadas ao comparar duas variáveis qualitativas.