#### Carregando a base de dados
load("C:/Users/Maria Clara Queiroz/Downloads/df_pokemon.RData")
summary(df)
## id pokemon species_id height
## Min. : 1.0 Length:718 Min. : 1.0 Min. : 1.00
## 1st Qu.:180.2 Class :character 1st Qu.:180.2 1st Qu.: 6.00
## Median :359.5 Mode :character Median :359.5 Median : 10.00
## Mean :359.5 Mean :359.5 Mean : 11.41
## 3rd Qu.:538.8 3rd Qu.:538.8 3rd Qu.: 14.00
## Max. :718.0 Max. :718.0 Max. :145.00
## weight base_experience type_1 type_2
## Min. : 1.0 Min. : 36.00 Length:718 Length:718
## 1st Qu.: 95.0 1st Qu.: 65.25 Class :character Class :character
## Median : 280.0 Median :147.00 Mode :character Mode :character
## Mean : 568.2 Mean :141.55
## 3rd Qu.: 609.5 3rd Qu.:177.00
## Max. :9500.0 Max. :608.00
## attack defense hp special_attack
## Min. : 5.00 Min. : 5.00 Min. : 1.00 Min. : 10.00
## 1st Qu.: 53.00 1st Qu.: 50.00 1st Qu.: 50.00 1st Qu.: 45.00
## Median : 73.00 Median : 65.00 Median : 65.00 Median : 65.00
## Mean : 74.85 Mean : 70.67 Mean : 68.37 Mean : 68.47
## 3rd Qu.: 95.00 3rd Qu.: 85.00 3rd Qu.: 80.00 3rd Qu.: 90.00
## Max. :165.00 Max. :230.00 Max. :255.00 Max. :154.00
## special_defense speed color_1 color_2
## Min. : 20.00 Min. : 5.00 Length:718 Length:718
## 1st Qu.: 50.00 1st Qu.: 45.00 Class :character Class :character
## Median : 65.00 Median : 65.00 Mode :character Mode :character
## Mean : 69.09 Mean : 65.72
## 3rd Qu.: 85.00 3rd Qu.: 85.00
## Max. :230.00 Max. :160.00
## color_f egg_group_1 egg_group_2 url_image
## Length:718 Length:718 Length:718 Length:718
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
## x y
## Min. :-49.152 Min. :-45.793
## 1st Qu.:-17.695 1st Qu.:-17.293
## Median : 0.705 Median : -0.628
## Mean : 0.000 Mean : 0.000
## 3rd Qu.: 15.905 3rd Qu.: 18.155
## Max. : 53.142 Max. : 46.593
Para observar a quantidade dos dados qualitativos.
#Tabela tipo 1:
table(df$type_1)
##
## bug dark dragon electric fairy fighting fire flying
## 63 28 24 36 17 25 46 3
## ghost grass ground ice normal poison psychic rock
## 23 66 30 23 93 28 46 40
## steel water
## 22 105
#Tabela tipo 2:
table(df$type_2)
##
## bug dark dragon electric fairy fighting fire flying
## 3 16 14 6 17 19 9 87
## ghost grass ground ice normal poison psychic rock
## 11 18 30 10 4 31 27 14
## steel water
## 19 12
#Tabelas de cores:
table(df$color_1)
##
## #6890F0 #7038F8 #705848 #705898 #78C850 #98D8D8 #A040A0 #A890F0 #A8A878 #A8B820
## 105 24 28 23 66 23 28 3 93 63
## #B8A038 #B8B8D0 #C03028 #E0C068 #EE99AC #F08030 #F85888 #F8D030
## 40 22 25 30 17 46 46 36
table(df$color_2)
##
## #6890F0 #7038F8 #705848 #705898 #78C850 #98D8D8 #A040A0 #A890F0 #A8A878 #A8B820
## 12 14 16 11 18 10 31 87 4 3
## #B8A038 #B8B8D0 #C03028 #E0C068 #EE99AC #F08030 #F85888 #F8D030
## 14 19 19 30 17 9 27 6
table(df$color_f)
##
## #6890F0 #697AF1 #6982C7 #6982DA #6B9DC9 #7038F8 #705072 #7050AF #705848 #70585B
## 57 2 4 2 3 11 3 1 9 1
## #705884 #705898 #717386 #73A1EA #757CDC #76AC4E #7790F0 #78C850 #795EF0 #79776A
## 1 9 4 3 3 3 7 33 1 2
## #7B5299 #7B93C3 #7B99E8 #7D4DF6 #7D6570 #7D65AD #7D78BF #7FCB70 #816F68 #81A763
## 3 4 1 4 5 2 2 2 2 14
## #834E40 #83BA76 #859BCF #87C46F #8892DF #89A346 #8A82D6 #8A9FC1 #8B58D5 #8CC6DD
## 2 4 9 2 2 3 4 2 4 3
## #8EB8C8 #8F49C7 #8F6142 #8F617E #903FDC #905857 #905CC7 #91C655 #9253B3 #943EB5
## 1 1 2 3 2 2 1 1 1 1
## #94458A #94BC66 #97AC5D #98A295 #98AE52 #98D8D8 #9A7AF1 #9AA03D #9BC6DD #9CAF6E
## 3 2 2 1 1 12 2 1 2 2
## #9CBB2B #A040A0 #A153B3 #A15D80 #A49C64 #A68666 #A68E3B #A698D9 #A69A3F #A6A0C2
## 6 15 3 1 6 2 1 1 11 3
## #A73C82 #A890F0 #A8A295 #A8A878 #A8A93D #A8AE52 #A8B820 #A9D2BC #ABB225 #ABB84A
## 2 1 23 60 2 13 17 3 3 5
## #AC392F #AD9721 #AF5F92 #AFB8C4 #B0AD5E #B49C64 #B4A532 #B4AED7 #B5AD74 #B5B931
## 1 1 2 2 2 3 2 1 1 1
## #B8A038 #B8A484 #B8A55C #B8B2AB #B8B8D0 #B98434 #B997A7 #B9AA23 #BA4758 #BB947B
## 9 4 3 3 4 1 1 2 1 2
## #BBBD23 #BE5050 #C03028 #C1A743 #C1B9B6 #C49F8A #C4A660 #C4A673 #C59E54 #C5B0C7
## 2 1 20 6 1 2 3 2 1 2
## #C78E4B #C7A0BE #CD393F #D2B488 #D6B85C #D6BE81 #D7B249 #D8737A #DD96BC #DE835E
## 2 6 2 3 3 1 1 1 2 5
## #DE8941 #E0C068 #E28731 #E28D56 #E465A1 #E46C2E #E4C05E #E4C641 #E5A66F #E5C35A
## 2 13 1 1 6 6 3 2 2 1
## #E8CA56 #EA4E70 #EC8F3D #EE99AC #F08030 #F17645 #F56790 #F5C24E #F66172 #F85888
## 3 1 2 15 28 1 5 1 1 32
## #F8D030
## 26
#Tabelas de grupos de ovos:
table(df$egg_group_1)
##
## bug ditto dragon fairy flying
## 66 1 9 32 46
## ground humanshape indeterminate mineral monster
## 167 37 41 46 75
## no-eggs plant water1 water2 water3
## 70 25 74 15 14
table(df$egg_group_2)
##
## bug dragon fairy flying ground
## 2 36 15 4 33
## humanshape indeterminate mineral plant water1
## 15 8 8 34 13
## water2 water3
## 8 15
media_altura = mean(df$height)
media_altura
## [1] 11.40669
media_peso = mean(df$weight)
media_peso
## [1] 568.1657
media_experiencia = mean(df$base_experience)
media_experiencia
## [1] 141.5474
media_ataque = mean(df$attack)
media_ataque
## [1] 74.85376
media_defesa = mean(df$defense)
media_defesa
## [1] 70.6727
media_vida = mean(df$hp)
media_vida
## [1] 68.37326
media_ataqueespecial = mean(df$special_attack)
media_ataqueespecial
## [1] 68.46797
media_defespecial = mean(df$special_defense)
media_defespecial
## [1] 69.09331
media_velocidade = mean(df$speed)
media_velocidade
## [1] 65.72423
A mediana mostra o valor central dos dados, em que 50% dos dados estão antes desse valor central e os outros 50% estão depois dele. Primeiro se ordena os números de forma crescente ou decrescente para que haja a seleção do valor central. Esse método não é afetado por outliers, diferente da média.
# Altura
median(df$height)
## [1] 10
# Peso
median(df$weight)
## [1] 280
# Experiência
median(df$base_experience)
## [1] 147
# Ataque
median(df$attack)
## [1] 73
# Defesa
median(df$defense)
## [1] 65
# Vida
median(df$hp)
## [1] 65
# Ataque especial
median(df$special_attack)
## [1] 65
# Defesa especial
median(df$special_defense)
## [1] 65
# Velocidade
median(df$speed)
## [1] 65
Quanto menor for a variância significa que mais próximos os valores da variável estão da média. E quanto maiores forem, maior será a distância dos valores da variável com relação à média.
#----------------------------------
# Calculando a variância
#----------------------------------
var_altura = var(df$height)
var_altura
## [1] 106.501
var_peso = var(df$weight)
var_peso
## [1] 811992.3
var_exp = var(df$base_experience)
var_exp
## [1] 5488.552
var_ataque = var(df$attack)
var_ataque
## [1] 837.3524
var_defesa = var(df$defense)
var_defesa
## [1] 851.763
var_vida = var(df$hp)
var_vida
## [1] 670.0808
var_ataqueespecial = var(df$special_attack)
var_ataqueespecial
## [1] 814.0345
var_defespecial = var(df$special_defense)
var_defespecial
## [1] 720.319
var_velocidade = var(df$speed)
var_velocidade
## [1] 746.8025
É a raiz quadrada da variãncia.
----------------------------
# Desvio Padrão
----------------------------
# Altura
sd(df$height)
## [1] 10.31993
# Peso
dp_peso = sd(df$weight)
dp_peso
## [1] 901.1062
# Experiência
dp_exp = sd(df$base_experience)
dp_exp
## [1] 74.08476
# Ataque
dp_atq = sd(df$attack)
dp_atq
## [1] 28.93704
# Defesa
dp_def = sd(df$defense)
dp_def
## [1] 29.18498
# Vida
dp_vida = sd(df$hp)
dp_vida
## [1] 25.88592
# Ataque especial
dp_atqesp = sd(df$special_attack)
dp_atqesp
## [1] 28.53129
# Defesa especial
dp_defesp = sd(df$special_defense)
dp_defesp
## [1] 26.83876
# Velocidade
dp_vel = sd(df$speed)
dp_vel
## [1] 27.32769
hist(df$weight, col = c("blue4", "tomato", "tomato", "tomato", "tomato", "tomato", "tomato", "tomato", "tomato"), xlab = "Peso", ylab = "Numero de pokemons", main = "Histograma do numero de pokemons")
hist(df$height, col = c("pink", "hotpink", "hotpink2"),
ylab = "Numero de Pokemons",
xlab = "Altura",
main = "Histograma da altura dos pokemons")
Com as informações obtidas acima podemos concluir que:
O peso foi a variável que mais se destacou, pois tem um grande outlier presente. Ao fazer o cálculo da média, percebemos que ela foi alta, de 568. Entretanto, ao observar qual é a mediana, percebemos que ao menos 50% dos pokemóns pesa menos do que 280. O cálculo da variância e do desvio-padrão mostram com maior clareza a existência de um outlier, com os resultados exorbitantes da variância de 811992.3 e do desvio-padrão de 901.1. Com o uso do Histograma esse fenômeno fica visualmente perceptível, como foi apontado no primeiro gráfico.
Em contrapartida com a variável peso, a altura foi a com menor discrepância de valores com relação à média. Apesar de ainda apresentar pontos fora da curva que são os pokemóns com a altura acima de 40.
É possível perceber - quem for mais atento - uma sutil diferença entre os histogramas do peso e o da altura. O do peso fica visivelmente mais concentrado ao lado esquerdo, o que faz com que uma única barra tenha mais destaque. Por outro lado o Histograma da altura tem mais de uma barra em destaque, o que mostra que ele é mais uniforme do que o Histograma do peso.
Ao observar a tabela abaixo, é possível perceber uma padronização de cores com relação ao tipo do pokemón, para isso foram usados a cor 1 e o tipo 1 para a análise.
A partir da observação, pode-se concluir as cores primárias mais comuns nos tipos de pokemón a seguir:
bug: #A8B820 (63) dark:#705848 (28) dragon: #7038F8 (24) electric:
#F8D030 (36) fairy: #EE99AC (17) fighting: #C03028 (25) fire: #F08030
(46) flying: #A890F0 (3) ghost: #705898 (23) grass: #78C850 (66) ground:
#E0C068 (30) ice: #98D8D8 (23) normal: #A8A878 (93)
poison: #A040A0 (28) psychic: #F85888 (46) rock: #B8A038 (40) steel:
#B8B8D0 (22) water: #6890F0 (105)
table(df$type_1, df$color_1)
##
## #6890F0 #7038F8 #705848 #705898 #78C850 #98D8D8 #A040A0 #A890F0
## bug 0 0 0 0 0 0 0 0
## dark 0 0 28 0 0 0 0 0
## dragon 0 24 0 0 0 0 0 0
## electric 0 0 0 0 0 0 0 0
## fairy 0 0 0 0 0 0 0 0
## fighting 0 0 0 0 0 0 0 0
## fire 0 0 0 0 0 0 0 0
## flying 0 0 0 0 0 0 0 3
## ghost 0 0 0 23 0 0 0 0
## grass 0 0 0 0 66 0 0 0
## ground 0 0 0 0 0 0 0 0
## ice 0 0 0 0 0 23 0 0
## normal 0 0 0 0 0 0 0 0
## poison 0 0 0 0 0 0 28 0
## psychic 0 0 0 0 0 0 0 0
## rock 0 0 0 0 0 0 0 0
## steel 0 0 0 0 0 0 0 0
## water 105 0 0 0 0 0 0 0
##
## #A8A878 #A8B820 #B8A038 #B8B8D0 #C03028 #E0C068 #EE99AC #F08030
## bug 0 63 0 0 0 0 0 0
## dark 0 0 0 0 0 0 0 0
## dragon 0 0 0 0 0 0 0 0
## electric 0 0 0 0 0 0 0 0
## fairy 0 0 0 0 0 0 17 0
## fighting 0 0 0 0 25 0 0 0
## fire 0 0 0 0 0 0 0 46
## flying 0 0 0 0 0 0 0 0
## ghost 0 0 0 0 0 0 0 0
## grass 0 0 0 0 0 0 0 0
## ground 0 0 0 0 0 30 0 0
## ice 0 0 0 0 0 0 0 0
## normal 93 0 0 0 0 0 0 0
## poison 0 0 0 0 0 0 0 0
## psychic 0 0 0 0 0 0 0 0
## rock 0 0 40 0 0 0 0 0
## steel 0 0 0 22 0 0 0 0
## water 0 0 0 0 0 0 0 0
##
## #F85888 #F8D030
## bug 0 0
## dark 0 0
## dragon 0 0
## electric 0 36
## fairy 0 0
## fighting 0 0
## fire 0 0
## flying 0 0
## ghost 0 0
## grass 0 0
## ground 0 0
## ice 0 0
## normal 0 0
## poison 0 0
## psychic 46 0
## rock 0 0
## steel 0 0
## water 0 0