O ponto de partida foi carregar a base de dados:
load("C:/Users/tauan/Desktop/Base_de_dados-master/Game of Thrones.RData")
Em seguida, escolhi uma variável quantitativa para análise. Dentre as opções, selecionei o Tempo de Tela.
A partir disso puxei o summary, mean e sd. Tendo os seguintes resultados:
summary(tempo_de_tela$minutos)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.150 4.375 10.300 27.261 27.650 293.300
media_tt <- mean(tempo_de_tela$minutos)
media_tt
## [1] 27.26099
desvio_tt <- sd(tempo_de_tela$minutos)
desvio_tt
## [1] 46.03292
A média foi de 27.26 minutos de tela, entretanto há um outlier, com 293 minutos. O desvio padrão foi de 46.03 pontos, o que demonstra uma grande variação entre os tempos de tela de cada personagem.
O primeiro quarto mostra que 25% das amostras estava entre 1.150 minutos (mínimo) e 4.375 minutos. A mediana foi de 10.0 e o terceiro quarto de 27.650 minutos.
Olhando pro BoxPlot é possível perceber o grande número de ourliers. Personagens que apareceram tanto na série que deixam de fazer parte do bolo e que se incluídos na estatística daria resultados tendenciosos.
boxplot(tempo_de_tela$minutos, mean = "BoxPlot de tempo de tela dos personagens", col = "skyblue")
Foi pedido pra plotar gráficos de barras de dados qualitativos. As variáveis escolhidas foram a lealdade inicial e final, mostrando como cada aliança começou e terminou.
lealdade <- table(personagens_livro$lealdade)
barplot(lealdade, main = "Lealdade inicial dos personagens", col = "skyblue")
lealdade7 <- table(mudancas_aliancas$Lealdade7)
barplot(lealdade7, main = "Lealdade final dos personagens", col = "Skyblue")
Na parte 4 foram pedidas duas tabelas qualitativas. Há dois modos de fazer: a primeira maneira usando o DPLYR e a seguinte criando uma “variável” e pedindo a tabela/contagem dessa variável
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
personagens_livro$nobre <- ifelse(personagens_livro$nobre == 0, "Nobre", "Plebeu")
nobreza <- table(personagens_livro$nobre)
Uma observação: deu um erro que não consegui entender, que não mudou nessa tabela os nomes “Nobre” e Plebeu" na linha título. Mas na segunda parte (exercício 5) mudou sem problemas.
personagens_livro %>% pull(nobre) %>% table %>% table()
## .
## 430 487
## 1 1
origem <- table(mudancas_aliancas$origem)
origem
##
## Casa Arryn Casa Baratheon Casa Greyjoy Casa Lannister Casa Martell
## 19 34 14 31 11
## Casa Stark Casa Targaryen Casa Tully Casa Tyrell Essos
## 66 6 24 13 123
## Salvajes Westeros White Walkers
## 41 101 5
O exercício 5 pedia a tabela em proporção. Aqui basta usar a função pop.table. O resultado sai em decimais, então é interessante multiplicar por 100 pra ter a tabela em termos percentuais.
library(dplyr)
personagens_livro %>% pull(nobre) %>% table %>% prop.table()*100
## .
## Nobre Plebeu
## 53.10796 46.89204
origem <- table(mudancas_aliancas$origem)
prop.table(origem)*100
##
## Casa Arryn Casa Baratheon Casa Greyjoy Casa Lannister Casa Martell
## 3.893443 6.967213 2.868852 6.352459 2.254098
## Casa Stark Casa Targaryen Casa Tully Casa Tyrell Essos
## 13.524590 1.229508 4.918033 2.663934 25.204918
## Salvajes Westeros White Walkers
## 8.401639 20.696721 1.024590