Atividade 5 - Média, desvio padrão e boxplot

Para começar, o carregamento da base de dados

load("~/Documentos/Base_de_dados-master/df_pokemon.RData")

O desvio padrão

var(df$attack)
## [1] 837.3524
sd(df$attack)
## [1] 28.93704
mean(df$attack)
## [1] 74.85376

Cruzamento de uma qualitativa com uma quantitativa

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(flextable)
library(reactable)

Média e desvio padrão

df %>% select(attack, type_1) %>%
  group_by(type_1) %>%
  summarise(Media=round(mean(attack),2),
            Desvio.padrao=round(sd(attack),2)) %>%
  flextable() %>% theme_vader()

A média de ataques é bem despersa, contendo números bem distantes ao decorrer da tabela do tipo 1. Enquanto que no desvio padrão os números estão mais próximos e entorno de 20 com excessão do bug, flying, rock e psychic com valores superiores e o poison com valor inferior.

Box-plot

boxplot(attack~type_1, data=df,
        col=c("purple", "orange", "blue", "green", "red", "pink"),
        horizontal = F,
        main= "Bloxplot do attack por type_1")

O gráfico de boxplot demonstra os valores: mínimo, primeiro quartil, mediana, terceiro quartil e máximo. Ao mesmo tempo em que a maioria das amostras são assimétricas, a maioria possui a mediana no intervalo entre 50 e 100 pontos de ataque.

Através da representação do gráfico é possível perceber que existem seis pontos fora das linhas. Eles representam outliers, que são valores muito diferentes da distribuição de dados e em quatro casos eles são números maiores que o da distribuição de dados e apenas dois são menores.