**A atividade da semana pedia dois exercícios: 1. Média e Desvio-Padrão para uma variável quantitativa por grupos de uma variável qualitativa. 2. Box-plot para uma variável quantitativa por grupos de uma variável qualitativa. Obrigatória a interpretação dos resultados encontrados. Fazer em pelo menos 03 parágrafos no RPUBS.

O passo a passo:

Primeiro, importação de bibliotecas e data base:

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(RColorBrewer)
library(flextable)
library(reactable)

load("C:/Users/tauan/Desktop/Base_de_dados-master/df_pokemon.RData")

As variáveis escolhidas, Ataque e Tipo de Pokemon não exige manipulação dos dados, então é possível ir direto para o calculo de médias e desvio padrão.

tbl1 <- df %>% select(type_1, attack) %>% 
        group_by(type_1) %>%
        summarise(mediaAtaque = mean((attack), 2),
                 desvioPadraoAtaque = sd((attack), 2),
                 quantidade = n()) %>%
        data.frame() %>% flextable()

Pra ficar com melhor visual, foi aplicado um tema:

tbl1 %>% theme_vader()

A partir da tabela foi criado o boxplot:

boxplot(attack~type_1, data = df, 
        main = "Ataque por Tipo de Pokemon",
        col = c("#6efdfd", "#6565bf"))

A interpretação dos dados através da tabela e do boxplot é que a média de ataque dos Pokes do tipo Fighting é a maior, entretanto o pokemon com ataque mais alto é um outlier do tipo normal, que excede os 150 pontos. O pokemon com ataque mais baixo também é um outlier do tipo normal.

Os pokemons do tipo Grass têm o menor desvio padrão, ou seja, o ataque deles é o mais alinhado em relação a média. Já na ponta oposta, com apenas 3 exemplares, os do tipo Flying apresentam o maior desvio padrão.

É interessante observar também que mesmo entre uma amostra de mais 700 casos, os dados apresentam apenas 5 outliers, e a mediana em geral está abaixo das médias. E os tipos bug, normal e water apresentam os intervalos mais simétricos na distribuição do ataque.