Atividade proposta, fazer e interpretar as estatíticas abaixo:
load("C:/Users/loren/Downloads/Estatistica/Base_de_dados-master/Game of Thrones.RData")A base Game of Thrones possui três bancos de dados dentro dela, para cumprir o exercício solicitado é importante explorar essa base antes de começarmos as análises. Para isso vamos usar a função “Summary” que mostra geralmente um resumo estatístico da base.
load("C:/Users/loren/Downloads/Estatistica/Base_de_dados-master/Game of Thrones.RData")
# Base 1 - Mudancas_Aliancas
summary(mudancas_aliancas) nome origem Lealdade1 Lealdade1
Length:488 Length:488 Length:488 Length:488
Class :character Class :character Class :character Class :character
Mode :character Mode :character Mode :character Mode :character
Lealdade2 Lealdade3 Lealdade4 Lealdade5
Length:488 Length:488 Length:488 Length:488
Class :character Class :character Class :character Class :character
Mode :character Mode :character Mode :character Mode :character
Lealdade6 Lealdade7 episodios
Length:488 Length:488 Min. : 1.000
Class :character Class :character 1st Qu.: 1.000
Mode :character Mode :character Median : 2.000
Mean : 6.043
3rd Qu.: 6.000
Max. :61.000
#head(mudancas_aliancas)Através da “Summary” percebemos que a primeira base possui variáveis predominantemente qualitativas, onde correlaciona a personagem a sua “Casa” e mostra a variabilidade da sua lealdade ao longo das temporadas. A única variável quantitativa nos informa a quantidade de vezes que o personagem apareceu ao longo das 7 temporadas da série.
Continuando a explorar, a segunda base de dados é uma base mista com informações quali e quanti. Para aumentar a nosso conhecimento utilizarei a função “Head” que mostrar as primeiras linhas da nossa base.
load("C:/Users/loren/Downloads/Estatistica/Base_de_dados-master/Game of Thrones.RData")
# Base 2 - Personagens_livro
summary(personagens_livro) nome lealdade sexo nobre
Length:917 Length:917 Length:917 Min. :0.0000
Class :character Class :character Class :character 1st Qu.:0.0000
Mode :character Mode :character Mode :character Median :0.0000
Mean :0.4689
3rd Qu.:1.0000
Max. :1.0000
Guerra_dos_Tronos Furia_dos_Reis Tormenta_de_Espadas Festim_dos_Corvos
Min. :0.0000 Min. :0.0000 Min. :0.0000 Min. :0.0000
1st Qu.:0.0000 1st Qu.:0.0000 1st Qu.:0.0000 1st Qu.:0.0000
Median :0.0000 Median :0.0000 Median :0.0000 Median :0.0000
Mean :0.2726 Mean :0.3533 Mean :0.4242 Mean :0.2726
3rd Qu.:1.0000 3rd Qu.:1.0000 3rd Qu.:1.0000 3rd Qu.:1.0000
Max. :1.0000 Max. :1.0000 Max. :1.0000 Max. :1.0000
Danca_dos_Dragoes capitulo_apresentacao ano_morte livro inteiro da morte
Min. :0.0000 Min. : 0.00 Min. :297.0 Min. :1.000
1st Qu.:0.0000 1st Qu.:11.00 1st Qu.:299.0 1st Qu.:2.000
Median :0.0000 Median :27.00 Median :299.0 Median :3.000
Mean :0.2846 Mean :28.86 Mean :299.2 Mean :2.928
3rd Qu.:1.0000 3rd Qu.:43.00 3rd Qu.:300.0 3rd Qu.:4.000
Max. :1.0000 Max. :80.00 Max. :300.0 Max. :5.000
NA's :12 NA's :612 NA's :610
capitulo_morte
Min. : 0.00
1st Qu.:25.50
Median :39.00
Mean :40.07
3rd Qu.:57.00
Max. :80.00
NA's :618
Essa função nos permite perceber que para facilitar a nossa análise, será preciso converter alguns dados quantitativos da base.
load("C:/Users/loren/Downloads/Estatistica/Base_de_dados-master/Game of Thrones.RData")
# Base 2 - Personagens_livro
#summary(personagens_livro)
head(personagens_livro) nome lealdade sexo nobre Guerra_dos_Tronos
1 Addam Marbrand Lannister masculino 1 1
2 Aegon Frey (Jinglebell) Ninguna masculino 1 0
3 Aegon Targaryen Targaryen masculino 1 0
4 Adrack Humble Greyjoy masculino 1 0
5 Aemon Costayne Lannister masculino 1 0
6 Aemon Estermont Baratheon masculino 1 0
Furia_dos_Reis Tormenta_de_Espadas Festim_dos_Corvos Danca_dos_Dragoes
1 1 1 1 0
2 0 1 0 0
3 0 0 0 1
4 0 0 0 1
5 0 1 0 0
6 1 1 0 0
capitulo_apresentacao ano_morte livro inteiro da morte capitulo_morte
1 56 NA NA NA
2 49 299 3 51
3 5 NA NA NA
4 20 300 5 20
5 NA NA NA NA
6 NA NA NA NA
Comecei a transformar as variáveis e aproveitei para corrigir a resposta da variável sexo que apresentava o nome “femenino” ao invés de “feminino”. Para testar se estava no caminho correto aproveitei para montar uma tabela e plotar o gráfico barplot.
Com essa primeira tentativa, foi possível perceber que meus códigos estavam corretos. Sobre análise, através do primeiro gráfico podemos correlacionar o gênero a classe social das personagens da série.
load("C:/Users/loren/Downloads/Estatistica/Base_de_dados-master/Game of Thrones.RData")
# Base 2 - Personagens_livro
#summary(personagens_livro)
#head(personagens_livro)
#Transformando variáveis:
nobre_ajustado <- personagens_livro$nobre <- ifelse(personagens_livro$nobre==0,"Não","Nobre")
#Corrigindo erro de português na variável Sexo
personagens_livro$sexo <- ifelse(personagens_livro$sexo=="femenino","feminino","masculino")
#Formatando Tabela
library(dplyr)
Attaching package: 'dplyr'
The following objects are masked from 'package:stats':
filter, lag
The following objects are masked from 'package:base':
intersect, setdiff, setequal, union
library(flextable)
personagens_livro %>% select(sexo,nobre) %>% table() %>% data.frame() %>% flextable()sexo | nobre | Freq |
feminino | Não | 73 |
masculino | Não | 414 |
feminino | Nobre | 84 |
masculino | Nobre | 346 |
#Primeiro Gráfico
personagens_livro %>% select(sexo,nobre) %>% table() %>% barplot(legend = TRUE,
main= "Barplot Gênero x Classe Social")Observando rapidamente o gráfico, é possível tirar três informações:
Uma vez realizada essa pequena análise, vamos continuar os ajustes para as concluir as atividades.
As cinco variáveis seguintes são os livros da série e buscam informar se a personagem aparece ou não no volume. Uma vez que a base apresenta a informação em formato binário (0 “Não”,1 “Sim”), transformaremos os dados para facilitar a interpretação.
load("C:/Users/loren/Downloads/Estatistica/Base_de_dados-master/Game of Thrones.RData")
# Base 2 - Personagens_livro
#summary(personagens_livro)
#head(personagens_livro)
#Transformando variáveis:
personagens_livro$Guerra_dos_Tronos <- ifelse(personagens_livro$Guerra_dos_Tronos==0,"Não","Sim")
library(dplyr)
library(flextable)
personagens_livro %>% select(Guerra_dos_Tronos) %>% table() %>% data.frame() %>% flextable(). | Freq |
Não | 667 |
Sim | 250 |
#table(personagens_livro$Guerra_dos_Tronos)
personagens_livro$Furia_dos_Reis <- ifelse(personagens_livro$Furia_dos_Reis==0,"Não","Sim")
personagens_livro %>% select(Furia_dos_Reis) %>% table() %>% data.frame() %>% flextable(). | Freq |
Não | 593 |
Sim | 324 |
#table(personagens_livro$Furia_dos_Reis)
personagens_livro$Tormenta_de_Espadas <- ifelse(personagens_livro$Tormenta_de_Espadas==0,"Não","Sim")
personagens_livro %>% select(Tormenta_de_Espadas) %>% table() %>% data.frame() %>% flextable(). | Freq |
Não | 528 |
Sim | 389 |
#table(personagens_livro$Tormenta_de_Espadas)
personagens_livro$Festim_dos_Corvos <- ifelse(personagens_livro$Festim_dos_Corvos==0,"Não","Sim")
personagens_livro %>% select(Festim_dos_Corvos) %>% table() %>% data.frame() %>% flextable(). | Freq |
Não | 667 |
Sim | 250 |
#table(personagens_livro$Festim_dos_Corvos)
personagens_livro$Danca_dos_Dragoes <- ifelse(personagens_livro$Danca_dos_Dragoes==0,"Não","Sim")
personagens_livro %>% select(Danca_dos_Dragoes) %>% table() %>% data.frame() %>% flextable(). | Freq |
Não | 656 |
Sim | 261 |
#table(personagens_livro$Danca_dos_Dragoes)A terceira e última base é Tempo de Tela, e é uma base quantitativa.
load("C:/Users/loren/Downloads/Estatistica/Base_de_dados-master/Game of Thrones.RData")
# Base 3 - Tempo_de_tela
summary(mudancas_aliancas) nome origem Lealdade1 Lealdade1
Length:488 Length:488 Length:488 Length:488
Class :character Class :character Class :character Class :character
Mode :character Mode :character Mode :character Mode :character
Lealdade2 Lealdade3 Lealdade4 Lealdade5
Length:488 Length:488 Length:488 Length:488
Class :character Class :character Class :character Class :character
Mode :character Mode :character Mode :character Mode :character
Lealdade6 Lealdade7 episodios
Length:488 Length:488 Min. : 1.000
Class :character Class :character 1st Qu.: 1.000
Mode :character Mode :character Median : 2.000
Mean : 6.043
3rd Qu.: 6.000
Max. :61.000
head(tempo_de_tela)# A tibble: 6 x 3
nome minutos episodios
<chr> <dbl> <dbl>
1 Tyrion Lannister 293. 54
2 Jon Nieve 268. 49
3 Daenerys Targaryen 221. 49
4 Cersei Lannister 201. 52
5 Sansa Stark 199. 47
6 Arya Stark 189. 47
Para realizar a primeira atividade escolhi a base “Tempo de Tela” e a variável episódios, que correlaciona a personagem a quantidade de episódios que ela participou.
O gráfico já evidencia que a variável escolhida possui muitos outliers. Devido a quantidade de personagens presentes na base, é possível concluir que os outliers são os personagens principais pois apenas eles configuram maior participação em episódios.
Como senti muita dificuldade nessa análise, e não consegui desenvolver com a mesma base, optei por trabalhar com a base “Personagens dos Livros”.
Usei as funções para comparar a mudança de personagens entre livros 1, 3 e 5.
Como explicado antes, a variável que selecionei correlaciona a personagem a participação ou não dele no livro. Não tivemos mediana para nenhuma das variáveis, mas para as outras 3 cheguei a segunte análise:
A média de personagens que aparecem nesse livros é 0.27 com uma variância de 0,19 e desvio padrão de 0.44. Devido a ampla amostragem, o desvio padrão está muito alto e distante da média.
load("C:/Users/loren/Downloads/Estatistica/Base_de_dados-master/Game of Thrones.RData")
part_1 <- personagens_livro$Guerra_dos_Tronos
mean(part_1)[1] 0.2726281
#median(part_1)
var(part_1)[1] 0.1985185
sd(part_1)[1] 0.4455542
Escolhi o livro três, pois dado o espaço entre os livro, considero que nesse livro temos o meio da trama. Analisando a mesma variável, temos uma média de 0.42 e um desvio padrão de 0.49. PErcemos uma aproximação entre a amostra (personagens) e o desvio, é possível dizer que nesse livro tevemos uma menos dispersão de personagens.
load("C:/Users/loren/Downloads/Estatistica/Base_de_dados-master/Game of Thrones.RData")
part_3 <- personagens_livro$Tormenta_de_Espadas
mean(part_3)[1] 0.4242094
#median(part_3)
var(part_3)[1] 0.2445224
sd(part_3)[1] 0.4944921
Já no livro cinco, último publicado, temos uma média de 0.28 e um desvio padrão de 0.45. Esses números nos apresentam um crescimento na variedade de personagens (amostra) o que caracteriza o desvio padrão muito distante da média.
load("C:/Users/loren/Downloads/Estatistica/Base_de_dados-master/Game of Thrones.RData")
part_5 <- personagens_livro$Danca_dos_Dragoes
mean(part_5)[1] 0.2846238
#median(part_5)
var(part_5)[1] 0.2038354
sd(part_5)[1] 0.4514813
load("C:/Users/loren/Downloads/Estatistica/Base_de_dados-master/Game of Thrones.RData")
library(RColorBrewer)
COR <- brewer.pal(2,"Dark2")
COR[1] "#1B9E77" "#D95F02" "#7570B3"
#Transformando variáveis:
nobre_ajustado <- personagens_livro$nobre <- ifelse(personagens_livro$nobre==0,"Não","Nobre")
library(dplyr)
library(flextable)
#Corrigindo erro de português na variável Sexo
personagens_livro$sexo <- ifelse(personagens_livro$sexo=="femenino","feminino","masculino")
personagens_livro %>% select(sexo,nobre) %>% table() %>% barplot(legend = TRUE,
col= COR,
main= "Barplot Sexo x Nobreza")load("C:/Users/loren/Downloads/Estatistica/Base_de_dados-master/Game of Thrones.RData")
library(flextable)
#Corrigindo erro de português na variável Sexo
personagens_livro$sexo <- ifelse(personagens_livro$sexo=="femenino","feminino","masculino")
#Transformando variáveis:
nobre_ajustado <- personagens_livro$nobre <- ifelse(personagens_livro$nobre==0,"Não","Nobre")
personagens_livro %>% select(sexo,nobre) %>% table() %>% data.frame() %>% flextable()sexo | nobre | Freq |
feminino | Não | 73 |
masculino | Não | 414 |
feminino | Nobre | 84 |
masculino | Nobre | 346 |
load("C:/Users/loren/Downloads/Estatistica/Base_de_dados-master/Game of Thrones.RData")
library(flextable)
#Corrigindo erro de português na variável Sexo
personagens_livro$sexo <- ifelse(personagens_livro$sexo=="femenino","feminino","masculino")
#Transformando variáveis:
nobre_ajustado <- personagens_livro$nobre <- ifelse(personagens_livro$nobre==0,"Não","Nobre")
personagens_livro %>% select(sexo,nobre) %>% table() %>% data.frame() %>% flextable()sexo | nobre | Freq |
feminino | Não | 73 |
masculino | Não | 414 |
feminino | Nobre | 84 |
masculino | Nobre | 346 |
#Tabela de PRoporção
personagens_livro %>% select(sexo,nobre) %>%
table() %>% prop.table(2)*100 nobre
sexo Não Nobre
feminino 14.98973 19.53488
masculino 85.01027 80.46512