Introdução

A proposta dessa atividade é interpretar uma variável qualitativa com uma quantitativa da base de dados pokemon, sendo o primeiro passo fazer média e desvio padrão da variável quantitativa por grupos de uma variável qualitativa, e em seguida fazer o boxplot. Primeiro eu carrego sempre todas bibliotecas e depois faço a importação da base de dados:

#Passo 0 - Carregar as bibliotecas:
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(flextable)
library(reactable)
library(RColorBrewer)

# Passo 1 - carregar base de dados
load("C:/Users/luuan/Desktop/UNIRIO/estatistica/Base_de_dados-master/df_pokemon.RData")
head(df)
## # A tibble: 6 x 22
##      id pokemon    species_id height weight base_experience type_1 type_2 attack
##   <dbl> <chr>           <int>  <int>  <int>           <int> <chr>  <chr>   <int>
## 1     1 bulbasaur           1      7     69              64 grass  poison     49
## 2     2 ivysaur             2     10    130             142 grass  poison     62
## 3     3 venusaur            3     20   1000             236 grass  poison     82
## 4     4 charmander          4      6     85              62 fire   <NA>       52
## 5     5 charmeleon          5     11    190             142 fire   <NA>       64
## 6     6 charizard           6     17    905             240 fire   flying     84
## # ... with 13 more variables: defense <int>, hp <int>, special_attack <int>,
## #   special_defense <int>, speed <int>, color_1 <chr>, color_2 <chr>,
## #   color_f <chr>, egg_group_1 <chr>, egg_group_2 <chr>, url_image <chr>,
## #   x <dbl>, y <dbl>

Cruzamento das variáveis e Média/Desvio Padrão

As variáveis que eu escolhi são o tipo1 e o ataque dos pokemons É possível afirmar que possui 18 tipos de pokemon, o dragon é o tipo de pokemon com a média de maior ataque(102.62500), e psychic é o tipo com a menor média de ataque(60.21739). Já sobre o desvio padrão temos flying sendo o tipo com o maior valor de desvio padrão de ataque(42.52450).

library(dplyr)
library(flextable)

# Passo 2 - Cruzamento de uma variável quatitativa e uma vareável quanlitativa


ft <- df %>% select(type_1, attack) %>% group_by(type_1) %>% summarise(Média_att=mean(attack),
                                                                        Desvio_att=sd(attack),
                                                                        Quantidade_Tipo_1=n()) %>% 
  
  data.frame() %>% flextable()


ft <- bg(ft, bg = "royalblue", part = "header")
ft <- bg(ft, bg = "gray", part = "body")
ft

Boxplot

A segunda etapa do trabalho é fazer o boxplot e aqui veremos um boxplot com os 18 tipos de pokemons relacionados com o ataque: Existem 4 tipos so de pokemons que possuem outliers, havendo 6 outliers no total do boxplot. A linha preta em cada um dos tipos representa a mediana deles. os valores mais equilibrados de primeiro e terceiro quartil são os tipos: Normal, Fighting, Flying e Water.

library(dplyr)
library(RColorBrewer)
library(flextable)
# Boxplot do ataque dos tipos de pokemon 

boxplot(attack~type_1, data = df,
        col=c("violet","gray","red","blue","green","yellow","pink", "orange","#FF7F50","#7ffaf2", "#BA55D3","#d1133f", "#7eafd6", "#FFDAB9","#DAA520","#00BFFF","#5d7985", "#00FA9A"), main="Gráfico de ataque dos tipos de Pokemon",
        xlab = "Tipos de Pokemon",
        ylab = "Ataque" )