Pokédex em perspectiva – Descobrindo padrões e variedades taxonômicas

Autores: Anna Beatriz Jorge de Jesus Guimarães; Bruno Cipriano Diniz; Jullie Pereira de Figueiredo Moreira; Lucas Passos Marcicano. Maria Fernanda Hasselmann

Resumo

Este estudo exploratório empregou técnicas estatísticas que incluem gráficos, testes de hipóteses e regressão linear para investigar padrões e relações no banco de dados “Pokémon with stats”, analisando individualmente as características e atributos de cada tipo de pokémon, buscando uma compreensão mais profunda desse universo fictício por meio do software “RStudio” na versão 4.3.1 com a linguagem de programação R que revelou padrões notáveis entre os atributos dos Pokémon, destacando-se as diferenças nos ataques especiais de pokémons lendários e não-lendários, a correlação proporcional entre vida e defesa, a importância do atributo de “vida” para certos pokémons, bem como a associação da presença de um 2º tipo ou diferença da força (pontuação) dos ataques especiais dentre as gerações 1-6 de pokémons. Concluindo, essas informações se mostraram definitivamente valiosas para aqueles que desejam compreender as capacidades individuais dos pokémons.

Palavras chave: Pokémon; Geração Pokémon; Pokédex; Variedade taxonômica; Análise estatística bivariada; Linguagem R;

1. Introdução

“Pokémon”, abreviação de “Pocket Monsters”, é uma franquia de mídia e entretenimento japonesa criada em 1995 pela desenvolvedora de jogos eletrônicos “Game Freak”, fundada por Satoshi Tajiri e ilustrado de Ken Sugimori, co-fundador. O lançamento e distribuição da marca foi realizado pela “Nintendo”, com os jogos “Pokémon: Red version” e “Pokémon: Green version” para o console da época, o Gameboy original, em 1996. No mesmo ano, em outubro, estreou-se um jogo de cartas colecionáveis que alavancou a obra e conquistou cada vez mais o público.

A historia desenvolve-se a partir da adaptação para uma obra audiovisual de animação, chamada “Pokémon”, criada em 1997, e televisionado pela “TV Tokyo” no Japão, onde o conceito gira em torno da ideia de que criaturas fantasiosas, chamadas de “Pokémons”, e humanos, coexistem em um mundo fictício. Acompanhamos a trajetoria de Ash Ketchum e seus amigos que almejam se tornar “mestres pokémons”, conquistando o maior número de títulos como treinadores Pókemon, competindo contra outros treinadores e capturando pokémons para fortalecê-los e desenvolvê-los através da experiência em batalhas, evoluindo-os para formas mais fortes e especializadas. A premissa central decorre através de diversas gerações de Pokémons, estendendo-se em 20 temporadas até os dias atuais.

Os pokémons possuem uma imensa variedade de traços distintos, resumidos por seus tipos, cada um associado a características físicas e habilidades específicas. As cores também desempenham um papel notável na identificação dos tipos de Pokémon. Por exemplo, pokémons do tipo “Planta” geralmente exibem tons verdes e apresentam habilidades de regeneração, ataques de grama e controle sobre plantas, enquanto os do tipo “Fogo” frequentemente apresentam tons vermelhos e alaranjados, e suas habilidades se resumem em poderes de queimadura e resistência ao calor.

Cada um dos pokémons, de maneira geral, possuem atributos que os diferem. Esses atributos em conjunto dão origem ao “status base” de um pokémon, atributos esses que variam entre seus pontos de vida, ataque, ataque especial, defesa, defesa espeical, e até mesmo velocidade. Além do mais, esses seres podem ser típicos, comuns, bem como especiais e raros, os chamados “pokémons lendários”.

No universo de Pokémon, existe a “Pokédex”, um pequeno aparelho que auxilia os treinadores Pokémon a entenderem melhor sobre as criaturas deste mundo, apresentando informações gerais e descritivas sobre eles. De modo geral, neste trabalho foram examinados os atributos mencionados utilizando técnicas específicas durante a visualização e análise de um banco de dados que, permitiu a identificação de tendências e relações.

1.1. Objetivos

O objetivo no presente estudo é observar os dados e adicionar novos conhecimentos sob uma nova perspectiva sobre os padrões e variedade taxonômica dos Pokémons, através, principalmente, da estatística e da biologia advindas da fantasia, trazendo informações mais técnicas aos fãs da franquia, coletando informações da própria “Pokédex”.

1.2. Objetivos específicos

O trabalho irá abordar e aprofundar-se nos seguintes tópicos:

  • Existe associação entre a geração e a presença de um 2° tipo?

    Procura-se entender se, conforme as gerações Pokémons, crescem, diminuem, ou mantêem a proporção daqueles Pokémons que, além de possuírem o “Tipo 1”, também apresentam um “Tipo 2”.

  • Há relação entre o pokemón ser caracterizado como lendário, e a proporção do seu ataque especial em comparação a um pokémon normal?

    Pokémons lendários são tipicamente mais evoluídos durante a história de “Pokémon” do que aqueles pokémons comuns. Sendo assim, a possível tendência é de que seus ataques especiais sejam mais poderosos, e aqui, será plausível avaliar se essa hipótese é válida.

  • A vida e a defesa têm correlação?

    No universo “Pokémon”, a vida é um atributo intrinsecamente dependente à defesa no sentido de que, conforme a defesa de um pokémon aumenta ou diminuí, é possível que ele seja mais ou menos resistente, e possa preservar seus pontos de vida. No entanto, a vida e a defesa possuem alguma correlação, de fato? Conforme uma se altera, a outra pode se alterar de maneira direta ou inversamente proporcional?

  • A defesa dos pokémons que possuem tipo 2 é superior em comparação os que possuam apenas tipo 1?

    Pressupôem-se que pokémons que possuem mais de um tipo talvez possam ser evolutivamente superiores em relação a sua defesa do que àqueles que apresentam um único tipo. Nesse contexto, será avaliada a credibilidade dessa suposição.

  • Qual a progressão da força dos ataques especiais conforme as gerações?

    De maneira simples e objetiva, avalia-se a maneira como a potência ou eficácia dos ataques especiais dos Pokémon evolui ao longo das diferentes gerações. Isso pode ser relevante para jogadores e fãs da franquia que desejam compreender a evolução das mecânicas das criaturas ao longo do tempo.

2. Metodologia

Para o estudo foi realizada uma análise estatística bivariada pelo software “RStudio” na versão 4.3.1 com a linguagem de programação R, a partir de dados provenientes da escolha do banco de dados “Pokemon with stats” criado e publicado por Alberto Barradas na plataforma “Kaggle” no ano de 2016. O banco de dados reune informações sobre 800 pokémons baseadas na “pokédex”, como mencionado anteriormente, possuindo inicialmente as seguintes variáveis, distribuídas entre qualitativas e quantitativas, e já traduzidas (do inglês, para o português): “Tipo 1”, “Tipo 2”, “Status base”, “Vida”, “Ataque”, “Defesa”, “Ataque especial”, “Defesa especial”, “Velocidade”, “Geração” e “Lendário”. Para atender os critérios do estudo, foram utilizadas apenas 7 variáveis: “Tipo 1”, “Tipo 2”, “Vida”, “Ataque especial’, ‘Defesa’, ’Lendário” e “Geração”.

A análise geral dos dados foi feita juntamente com a por meio da formulação de gráficos e a avaliação de diferentes testes de hipóteses, cujo o nível de confiança adotado foi de 95%, com 5% de significância, proporcionalmente. Os testes de hipóteses utilizados foram os testes de Shapiro-Wilk, o teste qui-quadrado de Pearson, teste de Mann-Whitne, teste de correlação de Spearman, e por fim, o teste de Kruskal-Wallis.

O “Tipo” representa a categorização de um pokémon baseado em suas habilidades e natureza. Os tipos são atributos associados a cada pokémon, e cada pokémon pode apresentar um (Tipo 1) ou dois (Tipo 2) tipos, o que influencia diretamente em sua fraqueza, resistência e habilidades especiais durante a batalha. Variam entre “Inseto”, “Sombrio”, “Dragão”, “Elétrico”, “Fada”, “Lutador”, “Fogo”, “Voador”, “Fantasma”, “Planta”, “Terrestre”, “Gelo”, “Normal”, “Venenoso”, “Psíquico”, “Pedra”, “Aço”, e “Água”. 

Com a finalidade de facilitar a análise do banco de tatos, agrupamos os tipos em “Tipos de combate”, que abrange pokémons do tipo lutador, normal, pedra e aço; “Tipos elementais” com pokémons do tipo elétrico, fogo, planta, gelo e água; “Tipos místicos e sobrenaturais” com pokémons do tipo sombrio, dragão, fada, fantasma e psíquico; e “Tipos de habitat”que incluem pokémons do tipo inseto, voador, terrestre e venenoso.

A “vida”, muitas vezes representada pela sigla “HP” (Hit Points), é o indicador da saúde do Pokémon. Cada Pokémon tem uma quantidade específica de HP, e quando é atingido por ataques de um oponente, perde pontos de HP correspondentes ao dano recebido. Se os pontos de HP de um Pokémon chegam a zero, ele desmaia (perde a batalha). Portanto, HP é um reflexo da capacidade de um Pokémon sobreviver em uma batalha, e Pokémon com uma alta quantidade de HP pode resistir a ataques por mais tempo.

O “ataque especial” representa a capacidade de um Pokémon causar dano com seus ataques que envolvem poderes especiais, como golpes elementais, ataques puramente psíquicos, ou técnicas que não dependem do contato físico direto com o oponente. Um Pokémon com um alto valor de ataque especial será mais eficaz ao usar ataques especiais, infligindo mais dano.

A “defesa” refere-se à capacidade de um Pokémon de resistir a danos físicos causados por ataques diretos. Pokémons com alta defesa sofrem menos dano físico quando são atingidos por ataques físicos, como socos, chutes ou mordidas. Portanto, um Pokémon com uma alta defesa é mais resiliente contra ataques físicos adversários, tornando-o menos vulnerável a ser derrotado por esse tipo de ataque.

Os pokémons lendários são um grupo especial de Pokémon dentro da franquia. Eles são caracterizados por serem únicos, raros e, muitas vezes, possuírem um papel significativo na mitologia do mundo Pokémon. Eles geralmente têm designs impressionantes e habilidades poderosas.

A geração de um Pokémon se refere à geração de jogos principal da franquia Pokémon em que esse Pokémon foi introduzido pela primeira vez. Cada geração representa uma nova série de jogos ou até mesmo uma nova região no mundo de Pokémon.

3. Resultados e Discussão

Tabela 1. Características dos pokémons.
Variáveis N = 8001
Tipo 1
    Tipos de habitat 133 (17%)
    Tipos místicos e sobrenaturais 169 (21%)
    Tipos elementais 302 (38%)
    Tipos de combate 196 (25%)
Tipo 2
    Não 386 (48%)
    Sim 414 (52%)
Vida 65 (50, 80)
Defesa 70 (50, 90)
Ataque especial 65 (50, 95)
Geração
    1 166 (21%)
    2 106 (13%)
    3 160 (20%)
    4 121 (15%)
    5 165 (21%)
    6 82 (10%)
Lendário
    Não 735 (92%)
    Sim 65 (8.1%)
1 n (%); Median (IQR)

➜ Tipo 1

Em “Tipo 1”, após o agrupamento, os pokémons com tipo 1 de habitat, místicos e sobrenaturais, elementais e de combate representaram, dentre os 800 pokémons, respectivamente: 17%; 21%; 38% e 25%. Com isso, é possível facilmente perceber que os pokémons com tipo 1 de habitat são minoria, enquanto os tipo 1 elementais dão parte a maior porção de pokémons.

➜ Tipo 2

O “Tipo 2” é intrinsecamente ligado ao “Tipo 1”, isso porque para que um pokémon apresente um segundo tipo ele necessariamente precisa possuir o tipo 1. Dito isso, a maioria dos pokémons presentes no banco de dados possuem um segundo tipo (52%), enquanto nos outros 48% esse fator é ausente. Apesar disso, a quantidade de pokémons com e sem um segundo tipo é bem distribuída.

➜ Variável “Vida”

Na variável “Vida”, podemos assumir, com a tabela, que a mediana de vida dos pokémons do banco de dados foi de 65, ou seja, assim como anteriormente, 50% acima de 65 e 50% abaixo de 65, com IQR 50 - 80. Isso significa que 25% dos valores da “Vida” estão até 50, em contrapartida que 75% dos valores estão abaixo de 80.

➜ Defesa

Em “defesa”, a tabela nos diz que o valor que divide é o 70. Em outras palavras, sendo essa a mediana, todos os valores estão 50% acima desse, e também abaixo. Com o IQR 50 - 90, podemos assumir que os valores são 25% até 50, ou 75% acima de 50, bem como 75% abaixo de 90, ou 25% acima.

➜ Ataque especial

A tabela nos diz que, a respeito da variável “Ataque especial”, a mediana foi de 65 (IQR 50 - 95). Ou seja, 25% dos dados são até 50 pontos de ataque especial, 75% acima disso, e, simultaneamente, 75% dos dados estão abaixo de 95 pontos, e 25% acima deste, além de que 65 é o que divide os valores em até 65 e acima de 65, 50/50.

➜ Geração

Na variável “Geração”, qualitativa ordinal que categoriza temporalmente os pokémons, uma das primeiras coisas que podemos observar é que a 6ª geração foi a única a não possuir mais que 100 pokémons, carregando consigo apens 82, o que corresponde a apenas 10% do total de pokémons do banco de dados escolhido.

➜ Lendário

A variável “Lendário” diz respeito à pokémons incomuns, sendo assim, os resultados cumprem as expectativas: Em 800 tipos diferentes de pokémons, apenas 65 (8.1%) são considerados pokémons lendários, sendo a maioria (92%) apenas comum.

› Existe associação entre a geração e a presença de um 2° tipo?

Ao avaliarmos superficialmente o gráfico de barras, a frequência relativa da presença do tipo 2 conforme as subcategorias da variável geração não parece ser significativa. No entanto, ao não podermos assumir apenas pela visualização, geram-se duas hipóteses possíveis: H0 – Não há associação entre a geração e a presença de um 2° tipo; e H1 – Há associação entre a geração e a presença de um 2° tipo. Para respondermos essa questão, conforme a classificação das variáveis, foi implementado o teste estatístico qui-quadrado:

Cross-Tabulation, Row Proportions  
Geração * Tipo_2_2  
Data Frame: Pokemon2_sub  

--------- ---------- ------------- ------------- --------------
            Tipo_2_2           Não           Sim          Total
  Geração                                                      
        1               88 (53.0%)    78 (47.0%)   166 (100.0%)
        2               51 (48.1%)    55 (51.9%)   106 (100.0%)
        3               78 (48.8%)    82 (51.2%)   160 (100.0%)
        4               54 (44.6%)    67 (55.4%)   121 (100.0%)
        5               83 (50.3%)    82 (49.7%)   165 (100.0%)
        6               32 (39.0%)    50 (61.0%)    82 (100.0%)
    Total              386 (48.2%)   414 (51.7%)   800 (100.0%)
--------- ---------- ------------- ------------- --------------

    Pearson's Chi-squared test

data:  Pokemon2_sub$Tipo_2_2 and Pokemon2_sub$Geração
X-squared = 5.2337, df = 5, p-value = 0.388

Adotado o nível de significância de 5%, com o valor-p sendo 0,388, conclue-se que não se rejeita a hipótese nula. Ou seja, confirmando que não existe associação entre a presença de um 2° tipo conforme as gerações. Podemos perceber isso previamente ao analisar a porcentagem da presença do 2º tipo dentre as gerações, que não mostram quaisquer tipo de padrão.

› Existe diferença na pontuação do ataque especial quando comparados os pokémons lendários ou não (comuns)?

Descriptive Statistics  
Ataque_especial by Lendário  
Data Frame: Pokemon2  
N: 735  

                       Não      Sim
----------------- -------- --------
             Mean    68.45   122.18
          Std.Dev    29.09    31.10
              Min    10.00    50.00
               Q1    45.00   100.00
           Median    65.00   120.00
               Q3    85.00   150.00
              Max   175.00   194.00
              MAD    29.65    37.06
              IQR    40.00    50.00
               CV     0.42     0.25
         Skewness     0.65     0.12
      SE.Skewness     0.09     0.30
         Kurtosis     0.15    -0.58
          N.Valid   735.00    65.00
        Pct.Valid   100.00   100.00

➜ Pokémons não-lendários

O gráfico nos permite notar que a mediana do ataque de pokemons não-lendários é inferior a 75, exatamente 65 como é mostrado na descrição estatística. Além disso, a diferença entre o terceiro quartil (Q3) e o primeiro quartil (Q1) foi de 40 pontos em pokémons não-lendários. O primeiro quartil é de 45 pontos de ataque especial, o que significa que pelo menos até 25% dos pokémons não-lendários apresentam pontuação de ataque especial de até 45 pontos, enquanto o terceiro quartil nos sinaliza que pelo menos 75% dos pokémons não-lendários possuem ataque inferior a 85 pontos.

O coeficiente de variação foi de 0,42, dado pela divisão do desvio-padrão (29,09) pela média (68,45). Isso significa que a variação precisa dos dados dessa relação, e sendo eles acima de 30% (0,30), são considerados dados heterogêneos.

“Skewness” se refere a assimetria da distribuição dos dados, que quanto mais próxima de 0, sugere dados simétricos. No caso dos pokémons não-lendários, ela é de 0,65, o que permite avaliarmos uma assimetria positiva, ou seja, com a cauda da distribuição tendendo a direita, o que também pode ser percebido unicamente na avaliação do gráfico, principalmente pela presença de 5 outliers nessa mesma direção.

➜ Pokémons lendários

Os pokémons lendários, por sua vez, possuem uma mediana próxima a 125, confirmado na descrição estatística, que achou o valor de 120. Prosseguindo, a diferença entre o terceiro quartil (Q3) e o primeiro quartil (Q1) foi de 50 pontos nos pokémons lendários. O primeiro quartil foi de 100 pontos de ataque especial, o que significa que pelo menos até 25% dos pokémons lendários apresentam pontuação de ataque especial de até 100 pontos, enquanto o terceiro quartil nos sinaliza que pelo menos 75% dos pokémons lendários possuem ataque inferior a 150 pontos.

O coeficiente de variação foi de 0,25, dado pela divisão do desvio-padrão (31,10) pela média (122,18). Isso significa que a variação precisa dos dados dessa relação, e sendo eles abaixo de 30% (0,30), são considerados dados homogêneos.

Nos pokémons lendários, “skewness” é de 0,12, o que permite avaliarmos uma assimetria positiva, ou seja, com a cauda da distribuição tendendo a direita, o que também pode ser percebido unicamente na avaliação do gráfico, principalmente pela posição da mediana.

Observados os dados, surgiu um questionamento: Existe, de fato, relação entre os pokémon serem ou não lendários e apresentarem um ataque especial maior ou menor? Ou esse critério não os define? Para isso, foram aplicados testes estatísticos, a começar pela avaliação da normalidade dos dados com o teste de Shapiro-Wilk, onde H0: Os dados apresentam distribuição normal e H1: Os dados não apresentam distribuição normal.


    Shapiro-Wilk normality test

data:  Pokemon2$Ataque_especial[Pokemon2$Lendário == "Sim"]
W = 0.98509, p-value = 0.624

    Shapiro-Wilk normality test

data:  Pokemon2$Ataque_especial[Pokemon2$Lendário == "Não"]
W = 0.96755, p-value = 1.074e-11

Um dos grupos passou pelo teste de normalidade, apresentando valor-p maior que 0,05. No entanto, o segundo teste nos mostrou que o valor-p foi de 1.074 ×10−11, ou 0.00000000001074, significando que pelo menos um dos grupos não apresenta distribuição normal, rejeitando assim a hipótese nula. Seguindo, quando não apresentada a normalidade, avaliaremos se existe, de fato, diferença entre o ataque especial de pokémons lendários e não-lendários pelo teste de Mann-Whitney, levantadas as hipóteses: H0 – Não há diferença entre o ataque especial de pokemons lendários e não-lendários; H1 — Há diferença entre o ataque especial de pokémons lendários e não-lendários.


    Wilcoxon rank sum test with continuity correction

data:  Pokemon2$Ataque_especial by Pokemon2$Lendário
W = 5095, p-value < 2.2e-16
alternative hypothesis: true location shift is not equal to 0

Dado valor-p igual a 2.2 × 10−16 ou 0.00000000000000022, menor que 0,05, rejeitamos a hipótese nula, o que significa que adotaremos a hipótese alternativa, provando que certamente há diferença entre o ataque especial de pokémons lendários e não-lendários.

› Existe correlação entre a vida e a defesa?

Existe correlação entre a vida e a defesa? Relembrando: A variável “Vida” representa a resistência de um pokemon, ou seja, o quanto de dano ele pode receber, e a variável “Defesa” representa a capacidade de resistir a danos físicos, logo, ao primeiro contato, essas variáveis podem parecer correlacionadas. E ainda mais, ao olharmos o gráfico, sugere uma correlação positiva. Primeiro, devemos verificar a normalidade com o teste de Shapiro-Wilk onde as hipóteses são H0: “Os dados apresentam distribuição normal” e H1: ” Os dados não apresentam distribuição normal”.


    Shapiro-Wilk normality test

data:  Pokemon2$Vida
W = 0.91583, p-value < 2.2e-16

    Shapiro-Wilk normality test

data:  Pokemon2$Defesa
W = 0.93806, p-value < 2.2e-16

Dados os valores-p < 0,05 em ambas as variáveis, podemos assumir que os dados não apresentam normalidade, logo, aplicaremos o teste de correlação de Spearman que nos responderá pelas hipóteses: H0 – Não existe correlação entre as pontuações de “vida” e “defesa”; H1 — Existe correlação entre as pontuações de “vida” e “defesa”.


    Spearman's rank correlation rho

data:  Pokemon2$Vida and Pokemon2$Defesa
S = 48349642, p-value < 2.2e-16
alternative hypothesis: true rho is not equal to 0
sample estimates:
      rho 
0.4334017 

Ao realizar o teste de correlação de Spearman, foi obtido um valor-p < 0,001, indicando haver uma correlação entre as variáveis (consequentemente, rejeitando a hipótese nula). O coeficiente de correlação, “rho”, foi igual a 0.43, indicando que a correlação é positiva e, ainda, de força moderada.

Logo, podemos concluir que definitivamente existe uma correlação entre a vida e a defesa dos pokémons, ou seja, as variáveis tendem a aumentar juntas, porém, dada a força moderada, essa tendência não é constante.

› A defesa do pokémon apresenta diferença conforme os grupos do tipo 1?

Descriptive Statistics  
Defesa by Tipo_1_2  
Data Frame: Pokemon2  
N: 133  

                    Tipos de habitat   Tipos místicos e sobrenaturais   Tipos elementais
----------------- ------------------ -------------------------------- ------------------
             Mean              73.59                            74.05              70.47
          Std.Dev              31.51                            27.93              26.47
              Min              25.00                            15.00              15.00
               Q1              50.00                            53.00              50.00
           Median              69.00                            70.00              69.00
               Q3              90.00                            90.00              85.00
              Max             230.00                           160.00             184.00
              MAD              29.65                            29.65              23.72
              IQR              40.00                            37.00              35.00
               CV               0.43                             0.38               0.38
         Skewness               1.29                             0.45               0.94
      SE.Skewness               0.21                             0.19               0.14
         Kurtosis               3.32                            -0.27               1.91
          N.Valid             133.00                           169.00             302.00
        Pct.Valid             100.00                           100.00             100.00

Table: Table continues below

 

                    Tipos de combate
----------------- ------------------
             Mean              79.04
          Std.Dev              38.91
              Min               5.00
               Q1              50.00
           Median              70.00
               Q3              98.50
              Max             230.00
              MAD              29.65
              IQR              47.75
               CV               0.49
         Skewness               1.14
      SE.Skewness               0.17
         Kurtosis               1.91
          N.Valid             196.00
        Pct.Valid             100.00

➜ Tipos de combate

O gráfico nos permite notar que a mediana da defesa dos pokémons cujo tipo 1 é de combate é inferior a 75, exatamente 70 como é mostrado na descrição estatística. Além disso, a diferença entre o terceiro quartil (Q3) e o primeiro quartil (Q1) foi de 47.75 pontos. O primeiro quartil é de 50 pontos de defesa, o que significa que pelo menos até 25% dos pokémons de tipo primário de combate apresentam defesa de até 50 pontos, enquanto o terceiro quartil nos sinaliza que pelo menos 75% deles possuem defesa inferior a 98.50 pontos.

O coeficiente de variação foi de 0,49, dado pela divisão do desvio-padrão (38,91) pela média (79,04). Isso significa que a variação precisa dos dados dessa relação, e sendo eles acima de 30% (0,30), são considerados dados heterogêneos.

Nos pokémons com tipo 1 de combate, “skewness” é de 1,14, o que permite avaliarmos uma assimetria positiva, ou seja, com a cauda da distribuição tendendo a direita, o que também pode ser percebido unicamente na avaliação do gráfico, principalmente pela presença de 3 outliers nessa mesma direção.

➜ Tipos elementais

O gráfico nos permite notar que a mediana da defesa dos pokémons cujo tipo 1 é elemental é inferior a 75, exatamente 69 como é mostrado na descrição estatística. Além disso, a diferença entre o terceiro quartil (Q3) e o primeiro quartil (Q1) foi de 35 pontos. O primeiro quartil é de 50 pontos de defesa, o que significa que pelo menos até 25% dos pokémons de tipo primário elemental apresentam defesa de até 50 pontos, enquanto o terceiro quartil nos sinaliza que pelo menos 75% deles possuem defesa inferior a 85 pontos.

O coeficiente de variação foi de 0,38, dado pela divisão do desvio-padrão (26,47) pela média (70,47). Isso significa que a variação precisa dos dados dessa relação, e sendo eles acima de 30% (0,30), são considerados dados heterogêneos.

Nos pokémons com tipo 1 elemental, “skewness” é de 0,94, o que permite avaliarmos uma assimetria positiva, ou seja, com a cauda da distribuição tendendo a direita, o que também pode ser percebido unicamente na avaliação do gráfico, principalmente pela presença de 3 outliers nessa mesma direção.

➜ Tipos místicos e sobrenaturais

O gráfico nos permite notar que a mediana da defesa dos pokémons cujo tipo 1 são místicos e sobrenaturais é inferior a 75, exatamente 70 como é mostrado na descrição estatística. Além disso, a diferença entre o terceiro quartil (Q3) e o primeiro quartil (Q1) foi de 37 pontos. O primeiro quartil é de 53 pontos de defesa, o que significa que pelo menos até 25% dos pokémons de tipo primário místico e sobrenatural apresentam defesa de até 53 pontos, enquanto o terceiro quartil nos sinaliza que pelo menos 75% deles possuem defesa inferior a 90 pontos.

O coeficiente de variação foi de 0,38, dado pela divisão do desvio-padrão (27,93) pela média (74,05). Isso significa que a variação precisa dos dados dessa relação, e sendo eles acima de 30% (0,30), são considerados dados heterogêneos.

Nos pokémons com tipo 1 místicos e sobrenaturais, “skewness” é de 0,45, o que permite avaliarmos uma assimetria positiva, ou seja, com a cauda da distribuição tendendo a direita, o que também pode ser percebido unicamente na avaliação do gráfico, principalmente pela presença de 1 outlier nessa mesma direção.

➜ Tipos de habitat

Por fim, este gráfico nos permite notar que a mediana da defesa dos pokémons cujo tipo 1 é de habitat é inferior a 75, exatamente 69 como é mostrado na descrição estatística. Além disso, a diferença entre o terceiro quartil (Q3) e o primeiro quartil (Q1) foi de 40 pontos. O primeiro quartil é de 50 pontos de defesa, o que significa que pelo menos até 25% dos pokémons de tipo primário de habitat apresentam defesa de até 50 pontos, enquanto o terceiro quartil nos sinaliza que pelo menos 75% deles possuem defesa inferior a 90 pontos.

O coeficiente de variação foi de 0,43, dado pela divisão do desvio-padrão (31,51) pela média (73,49). Isso significa que a variação precisa dos dados dessa relação, e sendo eles acima de 30% (0,30), são considerados dados heterogêneos.

Nos pokémons com tipo 1 de habitat, “skewness” é de 1,29, o que permite avaliarmos uma assimetria positiva, ou seja, com a cauda da distribuição tendendo a direita, o que também pode ser percebido unicamente na avaliação do gráfico, principalmente pela presença de 2 outliers nessa mesma direção.

Com essa análise prévia, deve-se buscar métodos para enfim responder uma pergunta: Existe alguma relação entre a defesa conforme os tipos primários do pokémon? Essa defesa apresenta alguma diferença? Para isso, primeiramente, verifica-se se todos os grupos apresentam uma distribuição normal de dados a partir do teste de Shapiro-Wilk, adotando mais uma vez as hipóteses a seguir: H0 – Os dados apresentam normalidade; H1 – Os dados não apresentam normalidade.


    Shapiro-Wilk normality test

data:  Pokemon2$Defesa[Pokemon2$Tipo_1_2 == "Tipos de combate"]
W = 0.92955, p-value = 4.018e-08

    Shapiro-Wilk normality test

data:  Pokemon2$Defesa[Pokemon2$Tipo_1_2 == "Tipos elementais"]
W = 0.95225, p-value = 2.368e-08

    Shapiro-Wilk normality test

data:  Pokemon2$Defesa[Pokemon2$Tipo_1_2 == "Tipos místicos e sobrenaturais"]
W = 0.9768, p-value = 0.006222

    Shapiro-Wilk normality test

data:  Pokemon2$Defesa[Pokemon2$Tipo_1_2 == "Tipos de habitat"]
W = 0.9126, p-value = 2.965e-07

Respectivamente, o valor-p de cada subcategoria do tipo 1 foi de: 4.018 ×10−8 ou 0.00000004018; 2.368 ×10−8 ou 0.00000002368; 0.006222; e 2.965 ×10−7 ou 0.0000002965. Resumidamente, nenhum dos grupos apresentou normalidade, ou seja, todos os valores-p foram menores que 0,05. Sendo assim, o caminho a ser tomado é o teste de Kruskal-Wallis, usado quando pelo menos um dos grupos não apresenta normalidade em variáveis que apresentam 3 ou mais grupos. As hipóteses são: H0 – Não há diferença significativa na defesa entre os tipos de combate, elementais, místicos e sobrenaturais e de habitat; H1 – Há diferença significativa na defesa entre os tipos de combate, elementais, místicos e sobrenaturais e de habitat.


    Kruskal-Wallis rank sum test

data:  Pokemon2$Defesa by Pokemon2$Tipo_1_2
Kruskal-Wallis chi-squared = 4.1987, df = 3, p-value = 0.2408

Feito o teste de Kruskal-Wallis, é apresentado valor-p igual a 0,24. Sendo 0,24 maior que 0,05, conclui-se que não rejeita a hipótese nula. Isto é, não há diferença significativa na defesa entre os tipos primários agrupados de pokémon.

› O ataque especial difere conforme as gerações?

Descriptive Statistics  
Ataque_especial by Geração  
Data Frame: Pokemon2  
N: 166  

                         1        2        3        4        5        6
----------------- -------- -------- -------- -------- -------- --------
             Mean    71.82    65.94    75.81    76.40    71.99    74.29
          Std.Dev    34.44    27.81    35.41    31.91    31.89    31.79
              Min    15.00    10.00    10.00    10.00    15.00    27.00
               Q1    45.00    40.00    50.00    54.00    45.00    50.00
           Median    65.00    65.00    70.00    71.00    65.00    65.00
               Q3    95.00    85.00    95.00   100.00    95.00    97.00
              Max   194.00   165.00   180.00   150.00   170.00   170.00
              MAD    31.13    29.65    34.10    35.58    29.65    27.43
              IQR    50.00    44.50    45.00    46.00    50.00    45.25
               CV     0.48     0.42     0.47     0.42     0.44     0.43
         Skewness     0.87     0.65     0.80     0.29     0.63     0.94
      SE.Skewness     0.19     0.23     0.19     0.22     0.19     0.27
         Kurtosis     0.62     0.52     0.39    -0.73    -0.37     0.41
          N.Valid   166.00   106.00   160.00   121.00   165.00    82.00
        Pct.Valid   100.00   100.00   100.00   100.00   100.00   100.00

➜ Geração 1

O gráfico nos permite notar que a mediana do ataque especial da geração 1 de pokémons é inferior a 75, exatamente 65 como é mostrado na descrição estatística. Além disso, a diferença entre o terceiro quartil (Q3) e o primeiro quartil (Q1) foi de 50 pontos. O primeiro quartil é de 45 pontos de ataque especial, o que significa que pelo menos até 25% dos pokémons da 1ª geração apresentam ataque especial de até 45 pontos, enquanto o terceiro quartil nos sinaliza que pelo menos 75% deles possuem ataque especial inferior a 95 pontos.

O coeficiente de variação foi de 0,48, dado pela divisão do desvio-padrão (34,44) pela média (71,82). Isso significa que a variação precisa dos dados dessa relação, e sendo eles acima de 30% (0,30), são considerados dados heterogêneos.

Nos pokémons da 1ª geração, “skewness” é de 0,87, o que permite avaliarmos uma assimetria positiva, ou seja, com a cauda da distribuição tendendo a direita, o que também pode ser percebido unicamente na avaliação do gráfico, principalmente pela presença de 2 outliers nessa mesma direção.

➜ Geração 2

O gráfico nos permite notar que a mediana do ataque especial da geração 2 de pokémons é inferior a 75, exatamente 65 como é mostrado na descrição estatística. Além disso, a diferença entre o terceiro quartil (Q3) e o primeiro quartil (Q1) foi de 44,50 pontos. O primeiro quartil é de 40 pontos de ataque especial, o que significa que pelo menos até 25% dos pokémons da 2ª geração apresentam ataque especial de até 40 pontos, enquanto o terceiro quartil nos sinaliza que pelo menos 75% deles possuem ataque especial inferior a 85 pontos.

O coeficiente de variação foi de 0,42, dado pela divisão do desvio-padrão (27,81) pela média (65,94). Isso significa que a variação precisa dos dados dessa relação, e sendo eles acima de 30% (0,30), são considerados dados heterogêneos.

Nos pokémons da 2ª geração, “skewness” é de 0,65, o que permite avaliarmos uma assimetria positiva, ou seja, com a cauda da distribuição tendendo a direita, o que também pode ser percebido unicamente na avaliação do gráfico, principalmente pela presença de 1 outlier nessa mesma direção.

➜ Geração 3

O gráfico nos permite notar que a mediana do ataque especial da geração 3 de pokémons é inferior a 75, exatamente 70 como é mostrado na descrição estatística. Além disso, a diferença entre o terceiro quartil (Q3) e o primeiro quartil (Q1) foi de 45 pontos. O primeiro quartil é de 50 pontos de ataque especial, o que significa que pelo menos até 25% dos pokémons da 3ª geração apresentam ataque especial de até 50 pontos, enquanto o terceiro quartil nos sinaliza que pelo menos 75% deles possuem ataque especial inferior a 95 pontos.

O coeficiente de variação foi de 0,47, dado pela divisão do desvio-padrão (35,41) pela média (75,81). Isso significa que a variação precisa dos dados dessa relação, e sendo eles acima de 30% (0,30), são considerados dados heterogêneos.

Nos pokémons da 3ª geração, “skewness” é de 0,80, o que permite avaliarmos uma assimetria positiva, ou seja, com a cauda da distribuição tendendo a direita, o que também pode ser percebido unicamente na avaliação do gráfico, principalmente pela presença de 2 outliers nessa mesma direção.

➜ Geração 4

O gráfico nos permite notar que a mediana do ataque especial da geração 4 de pokémons é inferior a 75, exatamente 71 como é mostrado na descrição estatística. Além disso, a diferença entre o terceiro quartil (Q3) e o primeiro quartil (Q1) foi de 46 pontos. O primeiro quartil é de 54 pontos de ataque especial, o que significa que pelo menos até 25% dos pokémons da 4ª geração apresentam ataque especial de até 54 pontos, enquanto o terceiro quartil nos sinaliza que pelo menos 75% deles possuem ataque especial inferior a 100 pontos.

O coeficiente de variação foi de 0,42, dado pela divisão do desvio-padrão (31,91) pela média (76,40). Isso significa que a variação precisa dos dados dessa relação, e sendo eles acima de 30% (0,30), são considerados dados heterogêneos.

Nos pokémons da 4ª geração, “skewness” é de 0,29, o que permite avaliarmos uma assimetria positiva, ou seja, com a cauda da distribuição tendendo a direita, o que também pode ser percebido unicamente na avaliação do gráfico, principalmente pela posição da mediana.

➜ Geração 5

O gráfico nos permite notar que a mediana do ataque especial da geração 5 de pokémons é inferior a 75, exatamente 65 como é mostrado na descrição estatística. Além disso, a diferença entre o terceiro quartil (Q3) e o primeiro quartil (Q1) foi de 50 pontos. O primeiro quartil é de 45 pontos de ataque especial, o que significa que pelo menos até 25% dos pokémons da 5ª geração apresentam ataque especial de até 45 pontos, enquanto o terceiro quartil nos sinaliza que pelo menos 75% deles possuem ataque especial inferior a 95 pontos.

O coeficiente de variação foi de 0,44, dado pela divisão do desvio-padrão (31,89) pela média (71,99). Isso significa que a variação precisa dos dados dessa relação, e sendo eles acima de 30% (0,30), são considerados dados heterogêneos.

Nos pokémons da 5ª geração, “skewness” é de 0,63, o que permite avaliarmos uma assimetria positiva, ou seja, com a cauda da distribuição tendendo a direita, o que também pode ser percebido unicamente na avaliação do gráfico, principalmente pela posição da mediana.

➜ Geração 6

O gráfico nos permite notar que a mediana do ataque especial da geração 6 de pokémons é inferior a 75, exatamente 65 como é mostrado na descrição estatística. Além disso, a diferença entre o terceiro quartil (Q3) e o primeiro quartil (Q1) foi de 45,25 pontos. O primeiro quartil é de 50 pontos de ataque especial, o que significa que pelo menos até 25% dos pokémons da 6ª geração apresentam ataque especial de até 50 pontos, enquanto o terceiro quartil nos sinaliza que pelo menos 75% deles possuem ataque especial inferior a 97 pontos.

O coeficiente de variação foi de 0,43, dado pela divisão do desvio-padrão (31,79) pela média (74,29). Isso significa que a variação precisa dos dados dessa relação, e sendo eles acima de 30% (0,30), são considerados dados heterogêneos.

Nos pokémons da 6ª geração, “skewness” é de 0,94, o que permite avaliarmos uma assimetria positiva, ou seja, com a cauda da distribuição tendendo a direita, o que também pode ser percebido unicamente na avaliação do gráfico, principalmente pela presença de 1 outlier nessa mesma direção.

Com base nessa análise prévia dos resultados, procura-se entender se o ataque especial realmente difere conforme as gerações. Para tal, deve-se verificar novamente a normalidade dos dados, dada H0: Os dados apresentam distribuição normal e H1: Os dados não apresentam distribuição normal.


    Shapiro-Wilk normality test

data:  Pokemon2$Ataque_especial[Pokemon2$Geração == "1"]
W = 0.94624, p-value = 6.015e-06

    Shapiro-Wilk normality test

data:  Pokemon2$Ataque_especial[Pokemon2$Geração == "2"]
W = 0.96593, p-value = 0.007969

    Shapiro-Wilk normality test

data:  Pokemon2$Ataque_especial[Pokemon2$Geração == "3"]
W = 0.95197, p-value = 2.67e-05

    Shapiro-Wilk normality test

data:  Pokemon2$Ataque_especial[Pokemon2$Geração == "4"]
W = 0.97734, p-value = 0.03891

    Shapiro-Wilk normality test

data:  Pokemon2$Ataque_especial[Pokemon2$Geração == "5"]
W = 0.95172, p-value = 1.905e-05

    Shapiro-Wilk normality test

data:  Pokemon2$Ataque_especial[Pokemon2$Geração == "6"]
W = 0.92778, p-value = 0.0001875

Pelo menos um dos grupos não apresentou normalidade, dados os resultados, respectivamente, sendo: 6.015×10−6 ou 0.000006015; 0.007969; 2.67×10−5 ou 0.0000267; 0.03891; 1.905×10−5 ou 0.00001905; e 0.0001875. Logo, mais uma vez, utiliza-se o teste de Kruskal-Wallis. Considerada as hipóteses H0: Não existe diferença significativa entre os ataques especiais das gerações de pokémons e H1: Existe diferença significativa entre os ataques especiais das gerações de pokémons.


    Kruskal-Wallis rank sum test

data:  Pokemon2$Ataque_especial by Pokemon2$Geração
Kruskal-Wallis chi-squared = 7.4189, df = 5, p-value = 0.1913

Uma vez que o teste de Kruskal-Wallis apresentou valor p igual a 0,19, não rejeita a hipótese nula, concluindo então que não existe uma diferença significativa entre os ataques especiais das gerações de pokémons.

Após realizar diversos testes estatísticos, a fim de explorar a quantificar as relações entre as variáveis, construiremos um modelo de regressão, linear, desenvolvendo previsões e estimativas de uma variável resposta quantitativa e contínua com base nos valores de outras variáveis independentes já conhecidas anteriormente.

A análise feita pelo modelo de regressão linear sempre se dá através da comparações das variáveis independentes em relação a uma variável-referência. A variável resposta escolhida para esse estudo foi a variável “vida”.

Characteristic Beta 95% CI1 p-value
Tipo_1_2
    Tipos de habitat
    Tipos místicos e sobrenaturais 1.2 -5.2, 7.5 0.7
    Tipos elementais 3.7 -1.9, 9.3 0.2
    Tipos de combate 1.6 -4.2, 7.5 0.6
Tipo_2_2
    Tipos de habitat
    Tipos místicos e sobrenaturais -1.8 -6.9, 3.3 0.5
    Tipos elementais -1.4 -7.2, 4.3 0.6
    Tipos de combate -3.6 -9.7, 2.5 0.2
Defesa 0.12 0.05, 0.18 <0.001
Ataque_especial 0.23 0.16, 0.30 <0.001
Geração
    1
    2 5.1 -1.8, 12 0.15
    3 -2.0 -8.3, 4.4 0.5
    4 4.4 -2.2, 11 0.2
    5 7.7 1.3, 14 0.019
    6 0.10 -7.4, 7.6 >0.9
Lendário
    Não
    Sim 13 5.4, 21 <0.001
1 CI = Confidence Interval

Realizado o teste de regressão linear para estabelecer uma relação entre os pontos de vida com outras variáveis, as variáveis que se mostraram relevantes ápos o procedimento foram: “defesa”, “ataque especial”, “geração” – grupo da geração 5 – e “lendário” – grupo lendário. Os valores-p, sequencialmente, de cada uma foram: <0,001; <0,001; 0,019 e <0,001 — ainda adotando o grau de significância de 5% (0,05).

Quando analisado o coeficiente de regressão (β), conclui-se que:

⇾ Quando 1 ponto de “defesa” aumenta, gera-se um aumento médio de 0,12 na pontuação de “vida”.

⇾ Quando 1 ponto de “ataque especial* aumenta, gera-se um aumento médio de 0,23 na pontuação de”vida”.

⇾ Quando comparados “pokémons da 1ª geração” (variável referência) com “pokémons da 5ª geração”, eles possuem, em média, 7,7 pontos de vida a mais.

⇾ Quando comparados “pokémons não-lendários” (variável referência) com “pokémons lendários”, eles possuem, em média, 13 pontos de vida a mais.


Call:
lm(formula = Vida ~ Tipo_1_2 + Tipo_2_2 + Defesa + Ataque_especial + 
    Geração + Lendário, data = Pokemon2)

Residuals:
    Min      1Q  Median      3Q     Max 
-51.862 -11.455  -2.597  10.874  79.298 

Coefficients:
                                       Estimate Std. Error t value Pr(>|t|)    
(Intercept)                            39.23355    4.17649   9.394  < 2e-16 ***
Tipo_1_2Tipos místicos e sobrenaturais  1.16008    3.24140   0.358 0.720612    
Tipo_1_2Tipos elementais                3.67303    2.84984   1.289 0.198196    
Tipo_1_2Tipos de combate                1.63688    2.97576   0.550 0.582578    
Tipo_2_2Tipos místicos e sobrenaturais -1.76485    2.59709  -0.680 0.497184    
Tipo_2_2Tipos elementais               -1.44091    2.92962  -0.492 0.623103    
Tipo_2_2Tipos de combate               -3.59381    3.11159  -1.155 0.248793    
Defesa                                  0.11521    0.03288   3.504 0.000511 ***
Ataque_especial                         0.23118    0.03622   6.382 4.85e-10 ***
Geração2                                5.13555    3.52183   1.458 0.145572    
Geração3                               -1.96293    3.23270  -0.607 0.544057    
Geração4                                4.43274    3.35919   1.320 0.187729    
Geração5                                7.72073    3.28828   2.348 0.019364 *  
Geração6                                0.10155    3.80652   0.027 0.978730    
LendárioSim                            12.99247    3.86766   3.359 0.000857 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 19.7 on 399 degrees of freedom
  (386 observations deleted due to missingness)
Multiple R-squared:  0.2851,    Adjusted R-squared:   0.26 
F-statistic: 11.37 on 14 and 399 DF,  p-value: < 2.2e-16

A maior parte dos gráficos gerados pela análise da regressão linear não foram relevantes para os resultados por apresentarem dispersões aleatórias. Por exemplo, através do gráfico 1, pôde-se observar que a linearidade não foi um padrão respeitado. Ou seja, não há normalidade pois existem muitos valores fugindo da reta próxima ao zero.

Apesar disso, o gráfico 2, por sua vez, compara a quantidade dos resíduos com os da quantidade teórica de uma distribuição normal. Visto isso, podemos perceber que a distribuição da pontuação de vida dentre as variáveis não apresenta distribuição totalmente normal, visto a sua desordem residual na extremidade superior direita indicando uma cauda no gráfico da normalidade. O ideal é que os resíduos estejam alinhados na reta tracejada. No entanto, durante certos momentos, o gráfico apresentou um grau de normalidade estável.

4. Conclusão

Os dados obtidos durante a análise estatística do banco de dados “Pokémon with stats” apontam padrões e conexões notáveis entre distintos atributos dentre os pokémons.

Encontram-se diferenças relevantes nos ataques especiais de pokémons lendários, estes apresentando pontuações maiores que aqueles não-lendários. Indubitavelmente, ao examinar as atividades de regressão linear, destacou-se a importância da variável “vida”, indicando que pokémons que possuem pontuações de defesa maiores tendem a ter mais pontos de vida, além de durante os testes essas duas variáveis terem apresentado uma correlação de força moderada, sugerindo realmente uma tendência a proporcionalidade. No entanto, por meio de outros testes, não observamos diferenças significativas no atributo de defesa entre tipos específicos de pokémon.

Ainda sobre a variável “vida”, a 5ª geração, quando comparada a 1ª geração, têm uma média de vida mais alta, bem como pokémons lendários em relação aos não-lendários. Além disso, descobriu-se que não existe associação entre a presença de um segundo tipo dentre as diferentes gerações de pokémons. Por fim, também não foi apresentada uma diferença significativa entre os ataques especiais e as gerações dos pokémons.

Esses resultados forneceram informações valiosas e contribuíram para uma compreensão mais profunda do universo de “Pokémon”, dando respostas precisas sobre as relações entre os diferentes tipos desses animais fictícios e seus atributos, tornando possível uma comparação com maior exatidão para que os fãs dessa franquia possam melhor entender as capacidades e habilidades únicas de cada pokémon.

5. Referências bibliográficas