load("C:/Users/User/Desktop/Faculdade/Adm P/8 Periodo/Estatistica/Base_de_dados-master/Base_de_dados-master/df_pokemon.RData")
Neste relátório abordarei algumas representações de dados de atributos de uma amostra de 718 Pokemons. Dentre eles Defesa, Defesa Especial, Ataque, Ataque Especial e Experiencia Base
str(df)
tibble [718 x 22] (S3: tbl_df/tbl/data.frame)
$ id : num [1:718] 1 2 3 4 5 6 7 8 9 10 ...
$ pokemon : chr [1:718] "bulbasaur" "ivysaur" "venusaur" "charmander" ...
$ species_id : int [1:718] 1 2 3 4 5 6 7 8 9 10 ...
$ height : int [1:718] 7 10 20 6 11 17 5 10 16 3 ...
$ weight : int [1:718] 69 130 1000 85 190 905 90 225 855 29 ...
$ base_experience: int [1:718] 64 142 236 62 142 240 63 142 239 39 ...
$ type_1 : chr [1:718] "grass" "grass" "grass" "fire" ...
$ type_2 : chr [1:718] "poison" "poison" "poison" NA ...
$ attack : int [1:718] 49 62 82 52 64 84 48 63 83 30 ...
$ defense : int [1:718] 49 63 83 43 58 78 65 80 100 35 ...
$ hp : int [1:718] 45 60 80 39 58 78 44 59 79 45 ...
$ special_attack : int [1:718] 65 80 100 60 80 109 50 65 85 20 ...
$ special_defense: int [1:718] 65 80 100 50 65 85 64 80 105 20 ...
$ speed : int [1:718] 45 60 80 65 80 100 43 58 78 45 ...
$ color_1 : chr [1:718] "#78C850" "#78C850" "#78C850" "#F08030" ...
$ color_2 : chr [1:718] "#A040A0" "#A040A0" "#A040A0" NA ...
$ color_f : chr [1:718] "#81A763" "#81A763" "#81A763" "#F08030" ...
$ egg_group_1 : chr [1:718] "monster" "monster" "monster" "monster" ...
$ egg_group_2 : chr [1:718] "plant" "plant" "plant" "dragon" ...
$ url_image : chr [1:718] "1.png" "2.png" "3.png" "4.png" ...
$ x : num [1:718] 32.8 33.3 33.9 -24.4 -24.6 ...
$ y : num [1:718] 17.2 16.7 16.2 30.8 30.6 ...
Aqui podemos dizer que esse grupo de variaveis são do tipo int
par(bg = "#FFBF00")
summary(df$defense)
Min. 1st Qu. Median Mean 3rd Qu. Max.
5.00 50.00 65.00 70.67 85.00 230.00
par(bg = "#FFBF00")
boxplot(df$defense,main = "Boxplot de Defesa x Nº de Pokemons", col = "blue", outpch = 2, outcol = "blue", outbg = "black", labels = TRUE,xlab = "Valor de Defesa", ylab = "Número de Pokemons")
var(df$defense)
[1] 851.763
sd(df$defense)
[1] 29.18498
summary(df$special_defense)
Min. 1st Qu. Median Mean 3rd Qu. Max.
20.00 50.00 65.00 69.09 85.00 230.00
par(bg = "#FFBF00")
boxplot(df$special_defense,main = "Boxplot de Defesa Especial x Nº de Pokemons", col = "sky blue", outcol = "blue", outpch = 2, outbg = "orange", labels = TRUE, xlab = "Valor de Defesa Especial", ylab = "Número de Pokemons")
var(df$special_defense)
[1] 720.319
sd(df$special_defense)
[1] 26.83876
summary(df$attack)
Min. 1st Qu. Median Mean 3rd Qu. Max.
5.00 53.00 73.00 74.85 95.00 165.00
par(bg = "#FFBF00")
boxplot(df$attack,main = "Boxplot de Ataque x Nº de Pokemons", col = "red", outcol = "blue", outpch = 2, outbg = "black", labels = TRUE, xlab = "Valor do Ataque", ylab = "Número de Pokemons")
var(df$attack)
[1] 837.3524
sd(df$attack)
[1] 28.93704
summary(df$special_attack)
Min. 1st Qu. Median Mean 3rd Qu. Max.
10.00 45.00 65.00 68.47 90.00 154.00
par(bg = "#FFBF00")
boxplot(df$special_attack,main = "Boxplot de Ataque Especial x Nº de Pokemons", col = "dark red", outcol = "blue", outpch = 2,outbg = "yellow", labels = TRUE, xlab = "Valor de Ataque Especial", ylab = "Número de Pokemons")
var(df$special_attack)
[1] 814.0345
sd(df$special_attack)
[1] 28.53129
summary(df$base_experience)
Min. 1st Qu. Median Mean 3rd Qu. Max.
36.00 65.25 147.00 141.55 177.00 608.00
par(bg = "#FFBF00")
boxplot(df$base_experience,main = "Boxplot de XP Base x Nº de Pokemons", col = "yellow", outpch = 2, outcol = "blue", outbg = "yellow", labels = TRUE, xlab = "Valor de XP Base", ylab = "Número de Pokemons")
var(df$base_experience)
[1] 5488.552
sd(df$base_experience)
[1] 74.08476
Posso concluir pela análise feita por mim e por esclarecimentos que os primeiros 4 atributos tem seus 3ºs Quartis maiores em primeira análise, sendo a exceção o atributo de experiência base. As medianas se encontram num intervalo entre os valores de 65-147, o que é razoavel se tratando de um jogo onde voce precisa equilibrar os atributos de Pokemons, para evitar que o jogador fique preso em algum trecho do jogo.
Outro ponto interessante é que as médias dos atributos se encontram na faixa de 68.47-141.55. Em relação a Outliers, nós temos de todos os atributos um total de 20 outliers. Do total destes atributos somente o atributo de Ataque Especial não possui outlier. O que possui a maior distância entre outliers se encontra na Experiência Base, possuindo 3 outliers. O que possui a menor distância entre os outliers se encontra no Boxplot de Ataque, sendo que este possui 2 outliers. O que possui o maior número de Outliers é o Boxplot de Defesa, possuindo 9 outliers.
Aqui podemos dizer que apesar da Experiência Base possuir o outlier mais discrepante é perceptível que a Defesa possui o maior número de pokemons que estão fora da curva média de atributos, o que significa que é mais fácil investir em pokemons com defesa e defesa especial alta pois existem maiores chances de vencer um oponente pela defesa do que ataque e ataque especial já que os atributos de ataque e ataque especial são menores e mais coesos
Fazer esse relatório foi interessante pois me mostrou como os status de pokemons e suas relações númericas nos diz que existem atributos com maior equilibrio de dados(boxplot de Ataque Especial), normalemnte a defesa, defesa especial, ataque e ataque especial abarcam um maior e mais frequente número de pokemons com valores de atributos a partir dos valores de 50-75. Além disso nós temos que esses boxplots possuem um nível de heterogeinidade alto e um indice de outliers frequente.