#### Carregando a base de dados

load("C:/Users/Maria Clara Queiroz/Downloads/df_pokemon.RData")
summary(df)
##        id          pokemon            species_id        height      
##  Min.   :  1.0   Length:718         Min.   :  1.0   Min.   :  1.00  
##  1st Qu.:180.2   Class :character   1st Qu.:180.2   1st Qu.:  6.00  
##  Median :359.5   Mode  :character   Median :359.5   Median : 10.00  
##  Mean   :359.5                      Mean   :359.5   Mean   : 11.41  
##  3rd Qu.:538.8                      3rd Qu.:538.8   3rd Qu.: 14.00  
##  Max.   :718.0                      Max.   :718.0   Max.   :145.00  
##      weight       base_experience     type_1             type_2         
##  Min.   :   1.0   Min.   : 36.00   Length:718         Length:718        
##  1st Qu.:  95.0   1st Qu.: 65.25   Class :character   Class :character  
##  Median : 280.0   Median :147.00   Mode  :character   Mode  :character  
##  Mean   : 568.2   Mean   :141.55                                        
##  3rd Qu.: 609.5   3rd Qu.:177.00                                        
##  Max.   :9500.0   Max.   :608.00                                        
##      attack          defense             hp         special_attack  
##  Min.   :  5.00   Min.   :  5.00   Min.   :  1.00   Min.   : 10.00  
##  1st Qu.: 53.00   1st Qu.: 50.00   1st Qu.: 50.00   1st Qu.: 45.00  
##  Median : 73.00   Median : 65.00   Median : 65.00   Median : 65.00  
##  Mean   : 74.85   Mean   : 70.67   Mean   : 68.37   Mean   : 68.47  
##  3rd Qu.: 95.00   3rd Qu.: 85.00   3rd Qu.: 80.00   3rd Qu.: 90.00  
##  Max.   :165.00   Max.   :230.00   Max.   :255.00   Max.   :154.00  
##  special_defense      speed          color_1            color_2         
##  Min.   : 20.00   Min.   :  5.00   Length:718         Length:718        
##  1st Qu.: 50.00   1st Qu.: 45.00   Class :character   Class :character  
##  Median : 65.00   Median : 65.00   Mode  :character   Mode  :character  
##  Mean   : 69.09   Mean   : 65.72                                        
##  3rd Qu.: 85.00   3rd Qu.: 85.00                                        
##  Max.   :230.00   Max.   :160.00                                        
##    color_f          egg_group_1        egg_group_2         url_image        
##  Length:718         Length:718         Length:718         Length:718        
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##        x                 y          
##  Min.   :-49.152   Min.   :-45.793  
##  1st Qu.:-17.695   1st Qu.:-17.293  
##  Median :  0.705   Median : -0.628  
##  Mean   :  0.000   Mean   :  0.000  
##  3rd Qu.: 15.905   3rd Qu.: 18.155  
##  Max.   : 53.142   Max.   : 46.593

Tabelas

Para observar a quantidade dos dados qualitativos.

#Tabela tipo 1:
table(df$type_1)
## 
##      bug     dark   dragon electric    fairy fighting     fire   flying 
##       63       28       24       36       17       25       46        3 
##    ghost    grass   ground      ice   normal   poison  psychic     rock 
##       23       66       30       23       93       28       46       40 
##    steel    water 
##       22      105
#Tabela tipo 2:
table(df$type_2)
## 
##      bug     dark   dragon electric    fairy fighting     fire   flying 
##        3       16       14        6       17       19        9       87 
##    ghost    grass   ground      ice   normal   poison  psychic     rock 
##       11       18       30       10        4       31       27       14 
##    steel    water 
##       19       12
#Tabelas de cores:

table(df$color_1)
## 
## #6890F0 #7038F8 #705848 #705898 #78C850 #98D8D8 #A040A0 #A890F0 #A8A878 #A8B820 
##     105      24      28      23      66      23      28       3      93      63 
## #B8A038 #B8B8D0 #C03028 #E0C068 #EE99AC #F08030 #F85888 #F8D030 
##      40      22      25      30      17      46      46      36
table(df$color_2)
## 
## #6890F0 #7038F8 #705848 #705898 #78C850 #98D8D8 #A040A0 #A890F0 #A8A878 #A8B820 
##      12      14      16      11      18      10      31      87       4       3 
## #B8A038 #B8B8D0 #C03028 #E0C068 #EE99AC #F08030 #F85888 #F8D030 
##      14      19      19      30      17       9      27       6
table(df$color_f)
## 
## #6890F0 #697AF1 #6982C7 #6982DA #6B9DC9 #7038F8 #705072 #7050AF #705848 #70585B 
##      57       2       4       2       3      11       3       1       9       1 
## #705884 #705898 #717386 #73A1EA #757CDC #76AC4E #7790F0 #78C850 #795EF0 #79776A 
##       1       9       4       3       3       3       7      33       1       2 
## #7B5299 #7B93C3 #7B99E8 #7D4DF6 #7D6570 #7D65AD #7D78BF #7FCB70 #816F68 #81A763 
##       3       4       1       4       5       2       2       2       2      14 
## #834E40 #83BA76 #859BCF #87C46F #8892DF #89A346 #8A82D6 #8A9FC1 #8B58D5 #8CC6DD 
##       2       4       9       2       2       3       4       2       4       3 
## #8EB8C8 #8F49C7 #8F6142 #8F617E #903FDC #905857 #905CC7 #91C655 #9253B3 #943EB5 
##       1       1       2       3       2       2       1       1       1       1 
## #94458A #94BC66 #97AC5D #98A295 #98AE52 #98D8D8 #9A7AF1 #9AA03D #9BC6DD #9CAF6E 
##       3       2       2       1       1      12       2       1       2       2 
## #9CBB2B #A040A0 #A153B3 #A15D80 #A49C64 #A68666 #A68E3B #A698D9 #A69A3F #A6A0C2 
##       6      15       3       1       6       2       1       1      11       3 
## #A73C82 #A890F0 #A8A295 #A8A878 #A8A93D #A8AE52 #A8B820 #A9D2BC #ABB225 #ABB84A 
##       2       1      23      60       2      13      17       3       3       5 
## #AC392F #AD9721 #AF5F92 #AFB8C4 #B0AD5E #B49C64 #B4A532 #B4AED7 #B5AD74 #B5B931 
##       1       1       2       2       2       3       2       1       1       1 
## #B8A038 #B8A484 #B8A55C #B8B2AB #B8B8D0 #B98434 #B997A7 #B9AA23 #BA4758 #BB947B 
##       9       4       3       3       4       1       1       2       1       2 
## #BBBD23 #BE5050 #C03028 #C1A743 #C1B9B6 #C49F8A #C4A660 #C4A673 #C59E54 #C5B0C7 
##       2       1      20       6       1       2       3       2       1       2 
## #C78E4B #C7A0BE #CD393F #D2B488 #D6B85C #D6BE81 #D7B249 #D8737A #DD96BC #DE835E 
##       2       6       2       3       3       1       1       1       2       5 
## #DE8941 #E0C068 #E28731 #E28D56 #E465A1 #E46C2E #E4C05E #E4C641 #E5A66F #E5C35A 
##       2      13       1       1       6       6       3       2       2       1 
## #E8CA56 #EA4E70 #EC8F3D #EE99AC #F08030 #F17645 #F56790 #F5C24E #F66172 #F85888 
##       3       1       2      15      28       1       5       1       1      32 
## #F8D030 
##      26
#Tabelas de grupos de ovos:

table(df$egg_group_1)
## 
##           bug         ditto        dragon         fairy        flying 
##            66             1             9            32            46 
##        ground    humanshape indeterminate       mineral       monster 
##           167            37            41            46            75 
##       no-eggs         plant        water1        water2        water3 
##            70            25            74            15            14
table(df$egg_group_2)
## 
##           bug        dragon         fairy        flying        ground 
##             2            36            15             4            33 
##    humanshape indeterminate       mineral         plant        water1 
##            15             8             8            34            13 
##        water2        water3 
##             8            15

Cálculo das médias

media_altura = mean(df$height)
media_altura
## [1] 11.40669
media_peso = mean(df$weight)
media_peso
## [1] 568.1657
media_experiencia = mean(df$base_experience)
media_experiencia
## [1] 141.5474
media_ataque = mean(df$attack)
media_ataque
## [1] 74.85376
media_defesa = mean(df$defense)
media_defesa
## [1] 70.6727
media_vida = mean(df$hp)
media_vida
## [1] 68.37326
media_ataqueespecial = mean(df$special_attack)
media_ataqueespecial
## [1] 68.46797
media_defespecial = mean(df$special_defense)
media_defespecial
## [1] 69.09331
media_velocidade = mean(df$speed)
media_velocidade
## [1] 65.72423

Mediana

A mediana mostra o valor central dos dados, em que 50% dos dados estão antes desse valor central e os outros 50% estão depois dele. Primeiro se ordena os números de forma crescente ou decrescente para que haja a seleção do valor central. Esse método não é afetado por outliers, diferente da média.

# Altura
median(df$height)
## [1] 10
# Peso
median(df$weight)
## [1] 280
# Experiência
median(df$base_experience)
## [1] 147
# Ataque
median(df$attack)
## [1] 73
# Defesa
median(df$defense)
## [1] 65
# Vida
median(df$hp)
## [1] 65
# Ataque especial
median(df$special_attack)
## [1] 65
# Defesa especial
median(df$special_defense)
## [1] 65
# Velocidade
median(df$speed)
## [1] 65

Cálculo da variância

Quanto menor for a variância significa que mais próximos os valores da variável estão da média. E quanto maiores forem, maior será a distância dos valores da variável com relação à média.

#----------------------------------
# Calculando a variância
#----------------------------------

var_altura = var(df$height)
var_altura
## [1] 106.501
var_peso = var(df$weight)
var_peso
## [1] 811992.3
var_exp = var(df$base_experience)
var_exp
## [1] 5488.552
var_ataque = var(df$attack)
var_ataque
## [1] 837.3524
var_defesa = var(df$defense)
var_defesa
## [1] 851.763
var_vida = var(df$hp)
var_vida
## [1] 670.0808
var_ataqueespecial = var(df$special_attack)
var_ataqueespecial
## [1] 814.0345
var_defespecial = var(df$special_defense)
var_defespecial
## [1] 720.319
var_velocidade = var(df$speed)
var_velocidade
## [1] 746.8025

Desvio-Padrão

É a raiz quadrada da variãncia.

----------------------------
# Desvio Padrão
----------------------------
  
# Altura
sd(df$height)
## [1] 10.31993
# Peso
dp_peso = sd(df$weight)
dp_peso
## [1] 901.1062
# Experiência
dp_exp = sd(df$base_experience)
dp_exp
## [1] 74.08476
# Ataque
dp_atq = sd(df$attack)
dp_atq
## [1] 28.93704
# Defesa
dp_def = sd(df$defense)
dp_def
## [1] 29.18498
# Vida
dp_vida = sd(df$hp)
dp_vida
## [1] 25.88592
# Ataque especial
dp_atqesp = sd(df$special_attack)
dp_atqesp
## [1] 28.53129
# Defesa especial
dp_defesp = sd(df$special_defense)
dp_defesp
## [1] 26.83876
# Velocidade
dp_vel = sd(df$speed)
dp_vel
## [1] 27.32769

Histograma

Peso

hist(df$weight, col = c("blue4", "tomato", "tomato", "tomato", "tomato", "tomato", "tomato", "tomato", "tomato"), xlab = "Peso", ylab = "Numero de pokemons", main = "Histograma do numero de pokemons")

Altura

hist(df$height, col = c("pink", "hotpink", "hotpink2"),
     ylab = "Numero de Pokemons",
     xlab = "Altura",
     main = "Histograma da altura dos pokemons")

Conclusão

Com as informações obtidas acima podemos concluir que:

O peso foi a variável que mais se destacou, pois tem um grande outlier presente. Ao fazer o cálculo da média, percebemos que ela foi alta, de 568. Entretanto, ao observar qual é a mediana, percebemos que ao menos 50% dos pokemóns pesa menos do que 280. O cálculo da variância e do desvio-padrão mostram com maior clareza a existência de um outlier, com os resultados exorbitantes da variância de 811992.3 e do desvio-padrão de 901.1. Com o uso do Histograma esse fenômeno fica visualmente perceptível, como foi apontado no primeiro gráfico.

Em contrapartida com a variável peso, a altura foi a com menor discrepância de valores com relação à média. Apesar de ainda apresentar pontos fora da curva que são os pokemóns com a altura acima de 40.

É possível perceber - quem for mais atento - uma sutil diferença entre os histogramas do peso e o da altura. O do peso fica visivelmente mais concentrado ao lado esquerdo, o que faz com que uma única barra tenha mais destaque. Por outro lado o Histograma da altura tem mais de uma barra em destaque, o que mostra que ele é mais uniforme do que o Histograma do peso.

Bônus

Tipo 1 do Pokemón X Cor 1 do Pokemón

Ao observar a tabela abaixo, é possível perceber uma padronização de cores com relação ao tipo do pokemón, para isso foram usados a cor 1 e o tipo 1 para a análise.

A partir da observação, pode-se concluir as cores primárias mais comuns nos tipos de pokemón a seguir:

bug: #A8B820 (63) dark:#705848 (28) dragon: #7038F8 (24) electric: #F8D030 (36) fairy: #EE99AC (17) fighting: #C03028 (25) fire: #F08030 (46) flying: #A890F0 (3) ghost: #705898 (23) grass: #78C850 (66) ground: #E0C068 (30) ice: #98D8D8 (23) normal: #A8A878 (93)
poison: #A040A0 (28) psychic: #F85888 (46) rock: #B8A038 (40) steel: #B8B8D0 (22) water: #6890F0 (105)

table(df$type_1, df$color_1)
##           
##            #6890F0 #7038F8 #705848 #705898 #78C850 #98D8D8 #A040A0 #A890F0
##   bug            0       0       0       0       0       0       0       0
##   dark           0       0      28       0       0       0       0       0
##   dragon         0      24       0       0       0       0       0       0
##   electric       0       0       0       0       0       0       0       0
##   fairy          0       0       0       0       0       0       0       0
##   fighting       0       0       0       0       0       0       0       0
##   fire           0       0       0       0       0       0       0       0
##   flying         0       0       0       0       0       0       0       3
##   ghost          0       0       0      23       0       0       0       0
##   grass          0       0       0       0      66       0       0       0
##   ground         0       0       0       0       0       0       0       0
##   ice            0       0       0       0       0      23       0       0
##   normal         0       0       0       0       0       0       0       0
##   poison         0       0       0       0       0       0      28       0
##   psychic        0       0       0       0       0       0       0       0
##   rock           0       0       0       0       0       0       0       0
##   steel          0       0       0       0       0       0       0       0
##   water        105       0       0       0       0       0       0       0
##           
##            #A8A878 #A8B820 #B8A038 #B8B8D0 #C03028 #E0C068 #EE99AC #F08030
##   bug            0      63       0       0       0       0       0       0
##   dark           0       0       0       0       0       0       0       0
##   dragon         0       0       0       0       0       0       0       0
##   electric       0       0       0       0       0       0       0       0
##   fairy          0       0       0       0       0       0      17       0
##   fighting       0       0       0       0      25       0       0       0
##   fire           0       0       0       0       0       0       0      46
##   flying         0       0       0       0       0       0       0       0
##   ghost          0       0       0       0       0       0       0       0
##   grass          0       0       0       0       0       0       0       0
##   ground         0       0       0       0       0      30       0       0
##   ice            0       0       0       0       0       0       0       0
##   normal        93       0       0       0       0       0       0       0
##   poison         0       0       0       0       0       0       0       0
##   psychic        0       0       0       0       0       0       0       0
##   rock           0       0      40       0       0       0       0       0
##   steel          0       0       0      22       0       0       0       0
##   water          0       0       0       0       0       0       0       0
##           
##            #F85888 #F8D030
##   bug            0       0
##   dark           0       0
##   dragon         0       0
##   electric       0      36
##   fairy          0       0
##   fighting       0       0
##   fire           0       0
##   flying         0       0
##   ghost          0       0
##   grass          0       0
##   ground         0       0
##   ice            0       0
##   normal         0       0
##   poison         0       0
##   psychic       46       0
##   rock           0       0
##   steel          0       0
##   water          0       0