load("C:/Users/Igor/Desktop/Base_de_dados-master/df_pokemon.RData")
Aqui escolho as variáveis para testar as médias, onde considero o ataque do pokemon e o tipo deles.
summary(df$attack)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 5.00 53.00 73.00 74.85 95.00 165.00
summary(df$type_1)
## Length Class Mode
## 718 character character
var(df$attack)
## [1] 837.3524
sd(df$attack)
## [1] 28.93704
mean(df$attack)
## [1] 74.85376
library(reactable)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(flextable)
df %>% select(attack, type_1) %>%
group_by (type_1) %>%
summarise(media= round(mean(attack),2),
Desvio_Padrao=round(sd(attack),2)) %>% reactable()
Aqui vemos o cruzamento dos dados quantitativos e qualitativos. Podemos notar que o maior desvio-padrão, ou seja, o conjunto que apresenta menos uniformidade, é o dos pokemons do tipo “flying”, onde o desvio-padrão é de 42.52, e o menor desvio-padrão é observado no conjunto poison, com 19.63 de desvio. Na média, a maior fica para o conjunto “dragon”, enquanto a menor é observada no grupo “psychic” (jurava que seria bugs!).
boxplot(attack~type_1, data = df,
col=c("white", "blue"),
main= "BOXTPLOT - ATAQUE X TIPO DE POKEMON")
Podemos observar de cara a presença de outliers nos conjuntos fairy, poison, rock e water.
Além disso, há grande assimetria ao analisar e comparar os terceiro quartil e as máximas dos retângulos.
Ademais, a distribuição não é simétrica na maioria dos casos, fato observado pela posição da linha da mediana não presente no meio/centro do retângulo.