Vamos fazer um resumo quantitativa por grupos de uma variável qualitativa
load("C:/Users/Kim Fonseca Coquet/Base_de_dados-master/df_pokemon.RData")
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(flextable)
df %>% select(type_1,speed) %>%
group_by(type_1) %>%
summarise(média=mean(speed),
mediana=median(speed),
desvio_padrao=sd(speed)) %>%
flextable()
type_1 | média | mediana | desvio_padrao |
|---|---|---|---|
bug | 60.06349 | 57.0 | 32.23396 |
dark | 75.39286 | 70.0 | 25.05156 |
dragon | 76.66667 | 80.0 | 22.41053 |
electric | 83.52778 | 93.0 | 27.36367 |
fairy | 48.58824 | 45.0 | 23.30520 |
fighting | 62.88000 | 60.0 | 24.26815 |
fire | 74.47826 | 78.5 | 24.57798 |
flying | 96.33333 | 111.0 | 36.29509 |
ghost | 60.82609 | 56.0 | 27.54443 |
grass | 59.89394 | 56.5 | 25.81480 |
ground | 62.13333 | 60.0 | 27.44868 |
ice | 61.86957 | 59.0 | 23.75118 |
normal | 69.65591 | 70.0 | 26.98731 |
poison | 63.57143 | 62.5 | 22.63139 |
psychic | 72.63043 | 71.0 | 32.56198 |
rock | 51.97500 | 50.0 | 25.71589 |
steel | 54.18182 | 50.0 | 25.47760 |
water | 65.00952 | 65.0 | 22.61147 |
boxplot(df$speed ~ df$type_1,
col=c("darkred","darkgreen"),
main="Boxplot: velocidade x tipo",
ylab = "velocidade",
xlab="tipo")
Conseguimos ver a média, mediana e desvio padrão da velocidade em relação ao tipo 1.
Podemos concluir que a média maior da velocidade é o dragon com 78.04167 enquanto a menor média é o bug com 55.95238.
Já o maior desvio padrão é o ghost com 31.91868 e o menor desvio padrão acaba sendo novamente o bug com 16.66504.