UTILIZEI A BASE POKEMON PARA RESOLVER A ATIVIDADE
pokemon = df
hist(pokemon$attack,main="Histograma Variável Ataque")
O histograma da variável ataque mostra a distribuição da variável por meio de faixas/classes criadas, analisando a frequência em cada uma dessas faixas/classes. Também é possível analisar um histograma não só por meio da frequência em cada faixa/classe, mas também pela densidade em cada uma. A distribuição da variável ataque é semelhante ao gráfico de uma distribuição normal. Os valores extremos, tanto para baixo quanto para cima, são mais raros; enquanto valores mais centrais são mais frequentes. A maioria dos personagens do desenho Pokemon possui a variável ataque com valores entre 50 e 100.
boxplot(pokemon$attack,main="Boxplot Variável Ataque")
O gráfico de boxplot da variável ataque nos fornece indiretamente o valor mínimo, máximo e os quartis dos valores encontrados na variável. Digo indiretamente pois não é possível determinar exatamente o valor apenas analisando o gráfico separadamente. A função summary usada posteriormente nos fornece os valores exatos destas grandezas. Por meio de um boxplot notamos se há assimetria dos dados, o que parece não haver aqui, pois não há aglomeração de dados em uma faixa específica de valores. A assimetria ocorre quando a distância entre o primeiro quartil e a mediana é diferente da distância entre mediana e terceiro quartil. Também notamos a presença de dois outliers, valores acima do limite superior representado pelo boxplot. O valor máximo dos outliers também é encontrado pela função summary.
summary(pokemon$attack)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 5.00 53.00 73.00 74.85 95.00 165.00
A função summary acima tem como resultado o valor mínimo encontrado na variável, valor máximo e os quartis citados anteriormente na análise do boxplot feito para a mesma variável. Pela função summary temos o valor de um dos outliers presentes no boxplot, com o valor de 165. A função summary fornece de forma mais objetiva a distribuição da variável.