Passo 1 - Carregar Base de Dados

Comandos usados - load

load("C:/Users/User/Desktop/Faculdade/Adm P/8 Periodo/Estatistica/Base_de_dados-master/Base_de_dados-master/df_pokemon.RData")

Neste relátório abordarei algumas representações de dados de atributos de uma amostra de 718 Pokemons. Dentre eles Defesa, Defesa Especial, Ataque, Ataque Especial e Experiencia Base

Passo 2 - Inspecionar os dados

Comandos usados - str

str(df)
tibble [718 x 22] (S3: tbl_df/tbl/data.frame)
 $ id             : num [1:718] 1 2 3 4 5 6 7 8 9 10 ...
 $ pokemon        : chr [1:718] "bulbasaur" "ivysaur" "venusaur" "charmander" ...
 $ species_id     : int [1:718] 1 2 3 4 5 6 7 8 9 10 ...
 $ height         : int [1:718] 7 10 20 6 11 17 5 10 16 3 ...
 $ weight         : int [1:718] 69 130 1000 85 190 905 90 225 855 29 ...
 $ base_experience: int [1:718] 64 142 236 62 142 240 63 142 239 39 ...
 $ type_1         : chr [1:718] "grass" "grass" "grass" "fire" ...
 $ type_2         : chr [1:718] "poison" "poison" "poison" NA ...
 $ attack         : int [1:718] 49 62 82 52 64 84 48 63 83 30 ...
 $ defense        : int [1:718] 49 63 83 43 58 78 65 80 100 35 ...
 $ hp             : int [1:718] 45 60 80 39 58 78 44 59 79 45 ...
 $ special_attack : int [1:718] 65 80 100 60 80 109 50 65 85 20 ...
 $ special_defense: int [1:718] 65 80 100 50 65 85 64 80 105 20 ...
 $ speed          : int [1:718] 45 60 80 65 80 100 43 58 78 45 ...
 $ color_1        : chr [1:718] "#78C850" "#78C850" "#78C850" "#F08030" ...
 $ color_2        : chr [1:718] "#A040A0" "#A040A0" "#A040A0" NA ...
 $ color_f        : chr [1:718] "#81A763" "#81A763" "#81A763" "#F08030" ...
 $ egg_group_1    : chr [1:718] "monster" "monster" "monster" "monster" ...
 $ egg_group_2    : chr [1:718] "plant" "plant" "plant" "dragon" ...
 $ url_image      : chr [1:718] "1.png" "2.png" "3.png" "4.png" ...
 $ x              : num [1:718] 32.8 33.3 33.9 -24.4 -24.6 ...
 $ y              : num [1:718] 17.2 16.7 16.2 30.8 30.6 ...

Aqui podemos dizer que esse grupo de variaveis são do tipo int

Passo 3 - Modificar parâmetros gráficos

Comandos utlizados - par

par(bg = "#FFBF00")

Passo 4 - Criar Boxplot e vizualizar a variância e o desvio-padrão dos dados

Comandos Usados - Boxplot, sd e var

Defesa

Summary de Defesa

summary(df$defense)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
   5.00   50.00   65.00   70.67   85.00  230.00 

Boxplot de Defesa

par(bg = "#FFBF00")
boxplot(df$defense,main = "Boxplot de Defesa x Nº de Pokemons", col = "blue", outpch = 2,  outcol = "blue", outbg = "black",  labels = TRUE,xlab = "Valor de Defesa", ylab = "Número de Pokemons")

Variânica de Defesa

var(df$defense)
[1] 851.763

Desvio Padrão de Defesa

sd(df$defense)
[1] 29.18498

Defesa Especial

summary de Defesa Especial

summary(df$special_defense)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  20.00   50.00   65.00   69.09   85.00  230.00 

Boxplot de Defesa Especial

par(bg = "#FFBF00")
boxplot(df$special_defense,main = "Boxplot de Defesa Especial x Nº de Pokemons", col = "sky blue", outcol = "blue", outpch = 2, outbg = "orange", labels = TRUE, xlab = "Valor de Defesa Especial", ylab = "Número de Pokemons")

Variância de Defesa Especial

var(df$special_defense)
[1] 720.319

Desvio Padrão de Defesa Especial

sd(df$special_defense)
[1] 26.83876

Ataque

summary de Ataque

summary(df$attack)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
   5.00   53.00   73.00   74.85   95.00  165.00 

Boxplot de Ataque

par(bg = "#FFBF00")
boxplot(df$attack,main = "Boxplot de Ataque x Nº de Pokemons", col = "red", outcol = "blue", outpch = 2, outbg = "black", labels = TRUE, xlab = "Valor do Ataque", ylab = "Número de Pokemons")

Variânica de Ataque

var(df$attack)
[1] 837.3524

Desvio Padrão de Ataque

sd(df$attack)
[1] 28.93704

Ataque Especial

summary de Ataque Especial

summary(df$special_attack)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  10.00   45.00   65.00   68.47   90.00  154.00 

Boxplot de Ataque Especial

par(bg = "#FFBF00")
boxplot(df$special_attack,main = "Boxplot de Ataque Especial x Nº de Pokemons", col = "dark red", outcol = "blue", outpch = 2,outbg = "yellow", labels = TRUE, xlab = "Valor de Ataque Especial", ylab = "Número de Pokemons")

Variânica de Ataque Especial

var(df$special_attack)
[1] 814.0345

Desvio Padrão de Ataque Especial

sd(df$special_attack)
[1] 28.53129

Experiência Base

summary de Experiência Base

summary(df$base_experience)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  36.00   65.25  147.00  141.55  177.00  608.00 

Boxplot de Experiência Base

par(bg = "#FFBF00")
boxplot(df$base_experience,main = "Boxplot de XP Base x Nº de Pokemons", col = "yellow", outpch = 2,  outcol = "blue", outbg = "yellow", labels = TRUE, xlab = "Valor de XP Base", ylab = "Número de Pokemons")

Variânica de Experiência Base

var(df$base_experience)
[1] 5488.552

Variânica de Experiência Base

sd(df$base_experience)
[1] 74.08476

Conclusões

Posso concluir pela análise feita por mim e por esclarecimentos que os primeiros 4 atributos tem seus 3ºs Quartis maiores em primeira análise, sendo a exceção o atributo de experiência base. As medianas se encontram num intervalo entre os valores de 65-147, o que é razoavel se tratando de um jogo onde voce precisa equilibrar os atributos de Pokemons, para evitar que o jogador fique preso em algum trecho do jogo.

Outro ponto interessante é que as médias dos atributos se encontram na faixa de 68.47-141.55. Em relação a Outliers, nós temos de todos os atributos um total de 20 outliers. Do total destes atributos somente o atributo de Ataque Especial não possui outlier. O que possui a maior distância entre outliers se encontra na Experiência Base, possuindo 3 outliers. O que possui a menor distância entre os outliers se encontra no Boxplot de Ataque, sendo que este possui 2 outliers. O que possui o maior número de Outliers é o Boxplot de Defesa, possuindo 9 outliers.

Aqui podemos dizer que apesar da Experiência Base possuir o outlier mais discrepante é perceptível que a Defesa possui o maior número de pokemons que estão fora da curva média de atributos, o que significa que é mais fácil investir em pokemons com defesa e defesa especial alta pois existem maiores chances de vencer um oponente pela defesa do que ataque e ataque especial já que os atributos de ataque e ataque especial são menores e mais coesos

Fazer esse relatório foi interessante pois me mostrou como os status de pokemons e suas relações númericas nos diz que existem atributos com maior equilibrio de dados(boxplot de Ataque Especial), normalemnte a defesa, defesa especial, ataque e ataque especial abarcam um maior e mais frequente número de pokemons com valores de atributos a partir dos valores de 50-75. Além disso nós temos que esses boxplots possuem um nível de heterogeinidade alto e um indice de outliers frequente.