**A atividade da semana pedia dois exercícios: 1. Média e Desvio-Padrão para uma variável quantitativa por grupos de uma variável qualitativa. 2. Box-plot para uma variável quantitativa por grupos de uma variável qualitativa. Obrigatória a interpretação dos resultados encontrados. Fazer em pelo menos 03 parágrafos no RPUBS.
O passo a passo:
Primeiro, importação de bibliotecas e data base:
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(RColorBrewer)
library(flextable)
library(reactable)
load("C:/Users/tauan/Desktop/Base_de_dados-master/df_pokemon.RData")
As variáveis escolhidas, Ataque e Tipo de Pokemon não exige manipulação dos dados, então é possível ir direto para o calculo de médias e desvio padrão.
tbl1 <- df %>% select(type_1, attack) %>%
group_by(type_1) %>%
summarise(mediaAtaque = mean((attack), 2),
desvioPadraoAtaque = sd((attack), 2),
quantidade = n()) %>%
data.frame() %>% flextable()
Pra ficar com melhor visual, foi aplicado um tema:
tbl1 %>% theme_vader()
type_1 | mediaAtaque | desvioPadraoAtaque | quantidade |
bug | 63.0 | 30.74161 | 63 |
dark | 86.5 | 24.33657 | 28 |
dragon | 97.5 | 29.64253 | 24 |
electric | 61.5 | 25.15223 | 36 |
fairy | 52.0 | 29.75130 | 17 |
fighting | 100.0 | 27.66394 | 25 |
fire | 82.5 | 25.29776 | 46 |
flying | 70.0 | 42.52450 | 3 |
ghost | 65.0 | 25.28674 | 23 |
grass | 68.0 | 24.07790 | 66 |
ground | 83.5 | 28.62498 | 30 |
ice | 65.0 | 25.93600 | 23 |
normal | 70.0 | 29.30096 | 93 |
poison | 74.0 | 19.63001 | 28 |
psychic | 52.5 | 30.76933 | 46 |
rock | 86.5 | 32.57566 | 40 |
steel | 82.5 | 24.60687 | 22 |
water | 70.0 | 25.03013 | 105 |
A partir da tabela foi criado o boxplot:
boxplot(attack~type_1, data = df,
main = "Ataque por Tipo de Pokemon",
col = c("#6efdfd", "#6565bf"))
A interpretação dos dados através da tabela e do boxplot é que a média de ataque dos Pokes do tipo Fighting é a maior, entretanto o pokemon com ataque mais alto é um outlier do tipo normal, que excede os 150 pontos. O pokemon com ataque mais baixo também é um outlier do tipo normal.
Os pokemons do tipo Grass têm o menor desvio padrão, ou seja, o ataque deles é o mais alinhado em relação a média. Já na ponta oposta, com apenas 3 exemplares, os do tipo Flying apresentam o maior desvio padrão.
É interessante observar também que mesmo entre uma amostra de mais 700 casos, os dados apresentam apenas 5 outliers, e a mediana em geral está abaixo das médias. E os tipos bug, normal e water apresentam os intervalos mais simétricos na distribuição do ataque.