Neste relátório abordarei algumas representações de dados de atributos de uma amostra de 718 Pokemons. Dentre eles Defesa, Defesa Especial, Ataque, Ataque Especial e Experiencia Base
load("C:/Users/Michel/Desktop/Felipe/Estatistica/Base de Dados/Base_de_dados-master/Base_de_dados-master/df_pokemon.RData")
head(df)
Aqui nós temos um resumo de alguns parâmetros como Média, 1º Quartil e 3ºQuartil, Máximo e Mínimo do Valor de Defesa dos Pokemons.
hist(df$defense,main = "Histograma de Defesa x Nº de Pokemons", col = "blue", labels = TRUE, ylim = c(0,250), xlim = c(0,250),xlab = "Valor de Defesa", ylab = "Número de Pokemons")
summary(df$defense)
Min. 1st Qu. Median Mean 3rd Qu. Max.
5.00 50.00 65.00 70.67 85.00 230.00
Nesse caso temos como valores de Minimo(5.00), 1º Quartil(50.00), Mediana(65), Média(70.67), 3ºQuartil(85.00) e Máximo(230)
Aqui temos um resumo de parâmetros como os citados anteriormente, porém para Defesa Especial
hist(df$special_defense,main = "Histograma de Defesa Especial x Nº de Pokemons", col = "sky blue", labels = TRUE, ylim = c(0,250), xlim = c(0,275), xlab = "Valor de Defesa Especial", ylab = "Número de Pokemons")
summary(df$special_defense)
Min. 1st Qu. Median Mean 3rd Qu. Max.
20.00 50.00 65.00 69.09 85.00 230.00
Aqui temos o Mínimo(20), 1ºQuartil(50), Mediana(65), Média(69.09), 3ºQuartil(85.00) e Máximo(230)
Agora temos o resumo dos valores para Ataque, sendo esse um caso interessante de constância de dados
hist(df$attack,main = "Historgrama de Ataque x Nº de Pokemons", col = "red", labels = TRUE, ylim = c(0,250), xlim = c(0,200), xlab = "Valor do Ataque", ylab = "Número de Pokemons")
summary(df$attack)
Min. 1st Qu. Median Mean 3rd Qu. Max.
5.00 53.00 73.00 74.85 95.00 165.00
Já aqui os valores são Mínimo(5), 1ºQuartil(53), Mediana(73.00), Média(74.85), 3ºQuartil(95) e Máximo(165)
Em seguida, temos os dados para Ataque Especial que também possui uma constância de dados, não tanto quanto ao atributo Ataque, mas que existe de fato
hist(df$special_attack,main = "Histograma de Ataque Especial x Nº de Pokemons", col = "dark red", labels = TRUE, ylim = c(0,250), xlim = c(0,200), xlab = "Valor de Ataque Especial", ylab = "Número de Pokemons")
summary(df$special_attack)
Min. 1st Qu. Median Mean 3rd Qu. Max.
10.00 45.00 65.00 68.47 90.00 154.00
Aqui temos os valores de Mínimo(10), 1º Quartil(45), Mediana(65), Média(68.47), 3ºQuartil(90) e Máximo(154)
Por fim temos o Atributo Experiencia Base que possui um caso particular de dados Bi-Modais
hist(df$base_experience,main = "Histograma de XP Base x Nº de Pokemons", col = "yellow", labels = TRUE, ylim = c(0,250), xlim = c(0,675), xlab = "Valor de XP Base", ylab = "Número de Pokemons")
summary(df$base_experience)
Min. 1st Qu. Median Mean 3rd Qu. Max.
36.00 65.25 147.00 141.55 177.00 608.00
Aqui os dados são Mínimo(36), 1ºQuartil(65.25), Mediana(147.00), Média(141.55), 3ºQuartil(177) e Máximo(608)
Posso concluir pela análise feita por mim e por esclarecimentos que dentre esses dados temos amostras com uma estrtura Bi-Modal(histograma de XP Base), com outliners presentes(Histograma de XP Base, Defesa e Defesa Especial), temos também estruturas amostrais com números com menor intervalo entre a média e a mediana(Histograma de Ataque) e com Máximas Iguais(Histograma de Defesa e Defesa Especial) e Mínimos Iguais(Histograma de defesa e ataque)
Fazer esse relatório foi interessante pois me mostrou como os status de pokemons e suas relações númericas nos diz que existem atributos onde existe um equilibrio maior de dados(Histograma de Ataque Especial), normalemnte a defesa, defesa especial, ataque e ataque especial abarcam um maior e mais frequente número de pokemons com valores de atributos a partir dos valores de 50-75. Além disso nós temos que esses histogramas possuem um nível de heterogeinidade alto