Atividade 5 e 6 - Base de Dados “Game of Thrones.RData”

Atividade proposta, fazer e interpretar as estatíticas abaixo:

Semana 5
  1. Média, Variância e/ou Desvio-Padrão para uma variável quantitativa,
  2. Box-plot para uma variável quantitativa.
Semana 6
  1. Gráfico de barras para duas variáveis qualitativas,
  2. Tabela para duas variáveis qualitativas,
  3. Tabela de proporção para duas variáveis qualitativas.

Passo 1 - Importar a Base de Dados

load("C:/Users/loren/Downloads/Estatistica/Base_de_dados-master/Game of Thrones.RData")

A base Game of Thrones possui três bancos de dados dentro dela, para cumprir o exercício solicitado é importante explorar essa base antes de começarmos as análises. Para isso vamos usar a função “Summary” que mostra geralmente um resumo estatístico da base.

load("C:/Users/loren/Downloads/Estatistica/Base_de_dados-master/Game of Thrones.RData")

# Base 1 - Mudancas_Aliancas 
summary(mudancas_aliancas)
     nome              origem           Lealdade1          Lealdade1        
 Length:488         Length:488         Length:488         Length:488        
 Class :character   Class :character   Class :character   Class :character  
 Mode  :character   Mode  :character   Mode  :character   Mode  :character  
                                                                            
                                                                            
                                                                            
  Lealdade2          Lealdade3          Lealdade4          Lealdade5        
 Length:488         Length:488         Length:488         Length:488        
 Class :character   Class :character   Class :character   Class :character  
 Mode  :character   Mode  :character   Mode  :character   Mode  :character  
                                                                            
                                                                            
                                                                            
  Lealdade6          Lealdade7           episodios     
 Length:488         Length:488         Min.   : 1.000  
 Class :character   Class :character   1st Qu.: 1.000  
 Mode  :character   Mode  :character   Median : 2.000  
                                       Mean   : 6.043  
                                       3rd Qu.: 6.000  
                                       Max.   :61.000  
#head(mudancas_aliancas)

Através da “Summary” percebemos que a primeira base possui variáveis predominantemente qualitativas, onde correlaciona a personagem a sua “Casa” e mostra a variabilidade da sua lealdade ao longo das temporadas. A única variável quantitativa nos informa a quantidade de vezes que o personagem apareceu ao longo das 7 temporadas da série.

Continuando a explorar, a segunda base de dados é uma base mista com informações quali e quanti. Para aumentar a nosso conhecimento utilizarei a função “Head” que mostrar as primeiras linhas da nossa base.

load("C:/Users/loren/Downloads/Estatistica/Base_de_dados-master/Game of Thrones.RData")

# Base 2 - Personagens_livro
summary(personagens_livro)
     nome             lealdade             sexo               nobre       
 Length:917         Length:917         Length:917         Min.   :0.0000  
 Class :character   Class :character   Class :character   1st Qu.:0.0000  
 Mode  :character   Mode  :character   Mode  :character   Median :0.0000  
                                                          Mean   :0.4689  
                                                          3rd Qu.:1.0000  
                                                          Max.   :1.0000  
                                                                          
 Guerra_dos_Tronos Furia_dos_Reis   Tormenta_de_Espadas Festim_dos_Corvos
 Min.   :0.0000    Min.   :0.0000   Min.   :0.0000      Min.   :0.0000   
 1st Qu.:0.0000    1st Qu.:0.0000   1st Qu.:0.0000      1st Qu.:0.0000   
 Median :0.0000    Median :0.0000   Median :0.0000      Median :0.0000   
 Mean   :0.2726    Mean   :0.3533   Mean   :0.4242      Mean   :0.2726   
 3rd Qu.:1.0000    3rd Qu.:1.0000   3rd Qu.:1.0000      3rd Qu.:1.0000   
 Max.   :1.0000    Max.   :1.0000   Max.   :1.0000      Max.   :1.0000   
                                                                         
 Danca_dos_Dragoes capitulo_apresentacao   ano_morte     livro inteiro da morte
 Min.   :0.0000    Min.   : 0.00         Min.   :297.0   Min.   :1.000         
 1st Qu.:0.0000    1st Qu.:11.00         1st Qu.:299.0   1st Qu.:2.000         
 Median :0.0000    Median :27.00         Median :299.0   Median :3.000         
 Mean   :0.2846    Mean   :28.86         Mean   :299.2   Mean   :2.928         
 3rd Qu.:1.0000    3rd Qu.:43.00         3rd Qu.:300.0   3rd Qu.:4.000         
 Max.   :1.0000    Max.   :80.00         Max.   :300.0   Max.   :5.000         
                   NA's   :12            NA's   :612     NA's   :610           
 capitulo_morte 
 Min.   : 0.00  
 1st Qu.:25.50  
 Median :39.00  
 Mean   :40.07  
 3rd Qu.:57.00  
 Max.   :80.00  
 NA's   :618    

Essa função nos permite perceber que para facilitar a nossa análise, será preciso converter alguns dados quantitativos da base.

load("C:/Users/loren/Downloads/Estatistica/Base_de_dados-master/Game of Thrones.RData")

# Base 2 - Personagens_livro
#summary(personagens_livro)
head(personagens_livro)
                     nome  lealdade      sexo nobre Guerra_dos_Tronos
1          Addam Marbrand Lannister masculino     1                 1
2 Aegon Frey (Jinglebell)   Ninguna masculino     1                 0
3         Aegon Targaryen Targaryen masculino     1                 0
4           Adrack Humble   Greyjoy masculino     1                 0
5          Aemon Costayne Lannister masculino     1                 0
6         Aemon Estermont Baratheon masculino     1                 0
  Furia_dos_Reis Tormenta_de_Espadas Festim_dos_Corvos Danca_dos_Dragoes
1              1                   1                 1                 0
2              0                   1                 0                 0
3              0                   0                 0                 1
4              0                   0                 0                 1
5              0                   1                 0                 0
6              1                   1                 0                 0
  capitulo_apresentacao ano_morte livro inteiro da morte capitulo_morte
1                    56        NA                     NA             NA
2                    49       299                      3             51
3                     5        NA                     NA             NA
4                    20       300                      5             20
5                    NA        NA                     NA             NA
6                    NA        NA                     NA             NA

Passo 1.1 - Transformando Dados

Ajustando a base

Comecei a transformar as variáveis e aproveitei para corrigir a resposta da variável sexo que apresentava o nome “femenino” ao invés de “feminino”. Para testar se estava no caminho correto aproveitei para montar uma tabela e plotar o gráfico barplot.

Com essa primeira tentativa, foi possível perceber que meus códigos estavam corretos. Sobre análise, através do primeiro gráfico podemos correlacionar o gênero a classe social das personagens da série.

load("C:/Users/loren/Downloads/Estatistica/Base_de_dados-master/Game of Thrones.RData")

# Base 2 - Personagens_livro
#summary(personagens_livro)
#head(personagens_livro)

#Transformando variáveis:
nobre_ajustado <- personagens_livro$nobre <- ifelse(personagens_livro$nobre==0,"Não","Nobre")
#Corrigindo erro de português na variável Sexo
personagens_livro$sexo <- ifelse(personagens_livro$sexo=="femenino","feminino","masculino")

#Formatando Tabela
library(dplyr)

Attaching package: 'dplyr'
The following objects are masked from 'package:stats':

    filter, lag
The following objects are masked from 'package:base':

    intersect, setdiff, setequal, union
library(flextable)
personagens_livro %>% select(sexo,nobre) %>% table() %>% data.frame() %>% flextable()
#Primeiro Gráfico
personagens_livro %>% select(sexo,nobre) %>% table() %>% barplot(legend = TRUE,
                                                                 main= "Barplot Gênero x Classe Social")

Observando rapidamente o gráfico, é possível tirar três informações:

  1. É evidente que a série possui mais personagens do gênero masculino do que feminino,
  2. O núcleo nobre é menor em comparação com os outros núcleos da série
  3. Temos mais personagens femininas dentro da nobreza em comparação com o grupo feminino de outros núcleos.

Uma vez realizada essa pequena análise, vamos continuar os ajustes para as concluir as atividades.

As cinco variáveis seguintes são os livros da série e buscam informar se a personagem aparece ou não no volume. Uma vez que a base apresenta a informação em formato binário (0 “Não”,1 “Sim”), transformaremos os dados para facilitar a interpretação.

load("C:/Users/loren/Downloads/Estatistica/Base_de_dados-master/Game of Thrones.RData")

# Base 2 - Personagens_livro
#summary(personagens_livro)
#head(personagens_livro)

#Transformando variáveis:

personagens_livro$Guerra_dos_Tronos <- ifelse(personagens_livro$Guerra_dos_Tronos==0,"Não","Sim")
library(dplyr)
library(flextable)
personagens_livro %>% select(Guerra_dos_Tronos) %>% table() %>% data.frame() %>% flextable()
#table(personagens_livro$Guerra_dos_Tronos)

personagens_livro$Furia_dos_Reis <- ifelse(personagens_livro$Furia_dos_Reis==0,"Não","Sim")
personagens_livro %>% select(Furia_dos_Reis) %>% table() %>% data.frame() %>% flextable()
#table(personagens_livro$Furia_dos_Reis)

personagens_livro$Tormenta_de_Espadas <- ifelse(personagens_livro$Tormenta_de_Espadas==0,"Não","Sim")

personagens_livro %>% select(Tormenta_de_Espadas) %>% table() %>% data.frame() %>% flextable()
#table(personagens_livro$Tormenta_de_Espadas)

personagens_livro$Festim_dos_Corvos <- ifelse(personagens_livro$Festim_dos_Corvos==0,"Não","Sim")
personagens_livro %>% select(Festim_dos_Corvos) %>% table() %>% data.frame() %>% flextable()
#table(personagens_livro$Festim_dos_Corvos)

personagens_livro$Danca_dos_Dragoes <- ifelse(personagens_livro$Danca_dos_Dragoes==0,"Não","Sim")
personagens_livro %>% select(Danca_dos_Dragoes) %>% table() %>% data.frame() %>% flextable()
#table(personagens_livro$Danca_dos_Dragoes)

A terceira e última base é Tempo de Tela, e é uma base quantitativa.

load("C:/Users/loren/Downloads/Estatistica/Base_de_dados-master/Game of Thrones.RData")

# Base 3 - Tempo_de_tela
summary(mudancas_aliancas)
     nome              origem           Lealdade1          Lealdade1        
 Length:488         Length:488         Length:488         Length:488        
 Class :character   Class :character   Class :character   Class :character  
 Mode  :character   Mode  :character   Mode  :character   Mode  :character  
                                                                            
                                                                            
                                                                            
  Lealdade2          Lealdade3          Lealdade4          Lealdade5        
 Length:488         Length:488         Length:488         Length:488        
 Class :character   Class :character   Class :character   Class :character  
 Mode  :character   Mode  :character   Mode  :character   Mode  :character  
                                                                            
                                                                            
                                                                            
  Lealdade6          Lealdade7           episodios     
 Length:488         Length:488         Min.   : 1.000  
 Class :character   Class :character   1st Qu.: 1.000  
 Mode  :character   Mode  :character   Median : 2.000  
                                       Mean   : 6.043  
                                       3rd Qu.: 6.000  
                                       Max.   :61.000  
head(tempo_de_tela)
# A tibble: 6 x 3
  nome               minutos episodios
  <chr>                <dbl>     <dbl>
1 Tyrion Lannister      293.        54
2 Jon Nieve             268.        49
3 Daenerys Targaryen    221.        49
4 Cersei Lannister      201.        52
5 Sansa Stark           199.        47
6 Arya Stark            189.        47

Passo 2 - Iniciando as análises

Atividade Semana 5
  1. Box-plot para uma variável quantitativa.

Para realizar a primeira atividade escolhi a base “Tempo de Tela” e a variável episódios, que correlaciona a personagem a quantidade de episódios que ela participou.

O gráfico já evidencia que a variável escolhida possui muitos outliers. Devido a quantidade de personagens presentes na base, é possível concluir que os outliers são os personagens principais pois apenas eles configuram maior participação em episódios.

  1. Média, Variância e/ou Desvio-Padrão para uma variável quantitativa:

Como senti muita dificuldade nessa análise, e não consegui desenvolver com a mesma base, optei por trabalhar com a base “Personagens dos Livros”.

Usei as funções para comparar a mudança de personagens entre livros 1, 3 e 5.

Livro 1 - Guerra dos Tronos

Como explicado antes, a variável que selecionei correlaciona a personagem a participação ou não dele no livro. Não tivemos mediana para nenhuma das variáveis, mas para as outras 3 cheguei a segunte análise:

A média de personagens que aparecem nesse livros é 0.27 com uma variância de 0,19 e desvio padrão de 0.44. Devido a ampla amostragem, o desvio padrão está muito alto e distante da média.

load("C:/Users/loren/Downloads/Estatistica/Base_de_dados-master/Game of Thrones.RData")

part_1 <- personagens_livro$Guerra_dos_Tronos
mean(part_1)
[1] 0.2726281
#median(part_1)
var(part_1)
[1] 0.1985185
sd(part_1)
[1] 0.4455542
Livro 3 - Tomenta de Espadas

Escolhi o livro três, pois dado o espaço entre os livro, considero que nesse livro temos o meio da trama. Analisando a mesma variável, temos uma média de 0.42 e um desvio padrão de 0.49. PErcemos uma aproximação entre a amostra (personagens) e o desvio, é possível dizer que nesse livro tevemos uma menos dispersão de personagens.

load("C:/Users/loren/Downloads/Estatistica/Base_de_dados-master/Game of Thrones.RData")

part_3 <- personagens_livro$Tormenta_de_Espadas
mean(part_3)
[1] 0.4242094
#median(part_3)
var(part_3)
[1] 0.2445224
sd(part_3)
[1] 0.4944921
Livro 5 - Dança dos Dragões

Já no livro cinco, último publicado, temos uma média de 0.28 e um desvio padrão de 0.45. Esses números nos apresentam um crescimento na variedade de personagens (amostra) o que caracteriza o desvio padrão muito distante da média.

load("C:/Users/loren/Downloads/Estatistica/Base_de_dados-master/Game of Thrones.RData")

part_5 <- personagens_livro$Danca_dos_Dragoes
mean(part_5)
[1] 0.2846238
#median(part_5)
var(part_5)
[1] 0.2038354
sd(part_5)
[1] 0.4514813
Atividade Semana 6
  1. Gráfico de barras para duas variáveis qualitativas,
load("C:/Users/loren/Downloads/Estatistica/Base_de_dados-master/Game of Thrones.RData")

library(RColorBrewer)
COR <- brewer.pal(2,"Dark2")
COR
[1] "#1B9E77" "#D95F02" "#7570B3"
#Transformando variáveis:
nobre_ajustado <- personagens_livro$nobre <- ifelse(personagens_livro$nobre==0,"Não","Nobre")

library(dplyr)
library(flextable)
#Corrigindo erro de português na variável Sexo
personagens_livro$sexo <- ifelse(personagens_livro$sexo=="femenino","feminino","masculino")
personagens_livro %>% select(sexo,nobre) %>% table() %>% barplot(legend = TRUE,
                                                                 col= COR,
                                                               main= "Barplot Sexo x Nobreza")

  1. Tabela para duas variáveis qualitativas,
load("C:/Users/loren/Downloads/Estatistica/Base_de_dados-master/Game of Thrones.RData")
library(flextable)
#Corrigindo erro de português na variável Sexo
personagens_livro$sexo <- ifelse(personagens_livro$sexo=="femenino","feminino","masculino")
#Transformando variáveis:
nobre_ajustado <- personagens_livro$nobre <- ifelse(personagens_livro$nobre==0,"Não","Nobre")
personagens_livro %>% select(sexo,nobre) %>% table() %>% data.frame() %>% flextable()
  1. Tabela de proporção para duas variáveis qualitativas.
load("C:/Users/loren/Downloads/Estatistica/Base_de_dados-master/Game of Thrones.RData")

library(flextable)

#Corrigindo erro de português na variável Sexo
personagens_livro$sexo <- ifelse(personagens_livro$sexo=="femenino","feminino","masculino")

#Transformando variáveis:
nobre_ajustado <- personagens_livro$nobre <- ifelse(personagens_livro$nobre==0,"Não","Nobre")
personagens_livro %>% select(sexo,nobre) %>% table() %>% data.frame() %>% flextable()
#Tabela de PRoporção
personagens_livro %>% select(sexo,nobre) %>% 
  table() %>% prop.table(2)*100
           nobre
sexo             Não    Nobre
  feminino  14.98973 19.53488
  masculino 85.01027 80.46512

Despedida

Concluímos de forma unânime que o fim dessa série foi….

: