Vamos fazer um resumo (média, mediana, desvio-padrão) de uma variável quantitativa por grupos de uma variável qualitativa.
load("~/aula_estatistica/Base_de_dados-master/df_pokemon.RData")
library(readxl)
library(flextable)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
head(df) %>% flextable() %>% theme_tron()
id | pokemon | species_id | height | weight | base_experience | type_1 | type_2 | attack | defense | hp | special_attack | special_defense | speed | color_1 | color_2 | color_f | egg_group_1 | egg_group_2 | url_image | x | y |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 | bulbasaur | 1 | 7 | 69 | 64 | grass | poison | 49 | 49 | 45 | 65 | 65 | 45 | #78C850 | #A040A0 | #81A763 | monster | plant | 1.png | 32.82239 | 17.21614 |
2 | ivysaur | 2 | 10 | 130 | 142 | grass | poison | 62 | 63 | 60 | 80 | 80 | 60 | #78C850 | #A040A0 | #81A763 | monster | plant | 2.png | 33.32643 | 16.71226 |
3 | venusaur | 3 | 20 | 1,000 | 236 | grass | poison | 82 | 83 | 80 | 100 | 100 | 80 | #78C850 | #A040A0 | #81A763 | monster | plant | 3.png | 33.93778 | 16.17232 |
4 | charmander | 4 | 6 | 85 | 62 | fire | 52 | 43 | 39 | 60 | 50 | 65 | #F08030 | #F08030 | monster | dragon | 4.png | -24.36338 | 30.78973 | ||
5 | charmeleon | 5 | 11 | 190 | 142 | fire | 64 | 58 | 58 | 80 | 65 | 80 | #F08030 | #F08030 | monster | dragon | 5.png | -24.57820 | 30.60161 | ||
6 | charizard | 6 | 17 | 905 | 240 | fire | flying | 84 | 78 | 78 | 109 | 85 | 100 | #F08030 | #A890F0 | #DE835E | monster | dragon | 6.png | -25.50657 | 29.77037 |
df %>% select(egg_group_1,speed) %>%
group_by(egg_group_1) %>%
summarise(média=mean(speed),
mediana=median(speed),
desvio_padrão=sd(speed)) %>% flextable()
egg_group_1 | média | mediana | desvio_padrão |
|---|---|---|---|
bug | 61.21212 | 60.0 | 32.74071 |
ditto | 48.00000 | 48.0 | |
dragon | 63.77778 | 58.0 | 23.46155 |
fairy | 62.78125 | 57.5 | 25.62601 |
flying | 81.30435 | 80.0 | 23.65011 |
ground | 72.98802 | 70.0 | 24.36321 |
humanshape | 67.18919 | 65.0 | 25.61883 |
indeterminate | 54.60976 | 50.0 | 24.75164 |
mineral | 52.73913 | 47.5 | 26.18943 |
monster | 54.98667 | 50.0 | 21.89934 |
no-eggs | 81.64286 | 90.0 | 32.01586 |
plant | 43.40000 | 40.0 | 17.83255 |
water1 | 60.31081 | 60.0 | 22.23469 |
water2 | 76.20000 | 68.0 | 14.04177 |
water3 | 64.92857 | 69.0 | 24.97218 |
boxplot(df$speed ~ df$egg_group_1,
col=c("yellow","red"),
main="Boxplot: Grupo_de_Ovos_1 x Velocidade",
ylab = "Velocidade",
xlab = "Grupo_de_Ovos_1")
A base de dados analisada possui 718 linhas e 22 colunas, para realizar esse relatória foi escolhida a variável qualitativa “Grupo_de_Ovos_1” e a variável quantitativa “Velocidade”.
Analisando os gráficos gerados á partir das variáveis escolhidas, pode-se avaliar que …