Introdução

Atividade referente à disciplina de estatística aplicada às ciências humanas e sociais, da turma de administração pública, 2021.2.

 

Atividade 05: Fazer uma publicação do RMarkdown, interpretar as estatísticas abaixo e fazer uma publicação no rpubs:

1. Média e Desvio-Padrão para uma variável quantitativa por grupos de uma variável qualitativa;    
2. Box-plot para uma variável quantitativa por grupos de uma variável qualitativa.    
 

 

Carregando base de dados

Carregando a base de dados df_pokemon que será utilizada para análise.

load("C:/Users/julia/Base_de_dados-master/df_pokemon.RData")

Análise descritiva dos dados

summary(df)
##        id          pokemon            species_id        height      
##  Min.   :  1.0   Length:718         Min.   :  1.0   Min.   :  1.00  
##  1st Qu.:180.2   Class :character   1st Qu.:180.2   1st Qu.:  6.00  
##  Median :359.5   Mode  :character   Median :359.5   Median : 10.00  
##  Mean   :359.5                      Mean   :359.5   Mean   : 11.41  
##  3rd Qu.:538.8                      3rd Qu.:538.8   3rd Qu.: 14.00  
##  Max.   :718.0                      Max.   :718.0   Max.   :145.00  
##      weight       base_experience     type_1             type_2         
##  Min.   :   1.0   Min.   : 36.00   Length:718         Length:718        
##  1st Qu.:  95.0   1st Qu.: 65.25   Class :character   Class :character  
##  Median : 280.0   Median :147.00   Mode  :character   Mode  :character  
##  Mean   : 568.2   Mean   :141.55                                        
##  3rd Qu.: 609.5   3rd Qu.:177.00                                        
##  Max.   :9500.0   Max.   :608.00                                        
##      attack          defense             hp         special_attack  
##  Min.   :  5.00   Min.   :  5.00   Min.   :  1.00   Min.   : 10.00  
##  1st Qu.: 53.00   1st Qu.: 50.00   1st Qu.: 50.00   1st Qu.: 45.00  
##  Median : 73.00   Median : 65.00   Median : 65.00   Median : 65.00  
##  Mean   : 74.85   Mean   : 70.67   Mean   : 68.37   Mean   : 68.47  
##  3rd Qu.: 95.00   3rd Qu.: 85.00   3rd Qu.: 80.00   3rd Qu.: 90.00  
##  Max.   :165.00   Max.   :230.00   Max.   :255.00   Max.   :154.00  
##  special_defense      speed          color_1            color_2         
##  Min.   : 20.00   Min.   :  5.00   Length:718         Length:718        
##  1st Qu.: 50.00   1st Qu.: 45.00   Class :character   Class :character  
##  Median : 65.00   Median : 65.00   Mode  :character   Mode  :character  
##  Mean   : 69.09   Mean   : 65.72                                        
##  3rd Qu.: 85.00   3rd Qu.: 85.00                                        
##  Max.   :230.00   Max.   :160.00                                        
##    color_f          egg_group_1        egg_group_2         url_image        
##  Length:718         Length:718         Length:718         Length:718        
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##        x                 y          
##  Min.   :-49.152   Min.   :-45.793  
##  1st Qu.:-17.695   1st Qu.:-17.293  
##  Median :  0.705   Median : -0.628  
##  Mean   :  0.000   Mean   :  0.000  
##  3rd Qu.: 15.905   3rd Qu.: 18.155  
##  Max.   : 53.142   Max.   : 46.593

Cruzamento de variável quantitativa x qualitativa

variáveis utilizadas: special_attack e type_1.
Estarei utilizando essas váriaveis para criar a tabela de ataque especial por tipo de pokemon, encontrando os valores da média e do desvio padrão.

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(flextable)
library(reactable)

df %>% select(special_attack, type_1) %>%
    group_by(type_1) %>%
    summarise(Média=round(mean(special_attack),2),
              Desvio_Padrao=round(sd(special_attack),2)) %>%
    flextable() %>% theme_tron()

Resultados:

Ataque especial por tipo de pokemon:

Dos 18 tipos de pokemons apresentados na variável type_1, em média os pokemons do tipo psychic têm ataque especial de 89.30, são mais fortes, enquanto que os pokemons do tipo fighting, em média, têm ataque especial de 48.56, são o tipo mais fraco.

Variabilidade dos tipos de pokemon por ataque especial:

Os pokemons do tipo psychic apresentam maior dispersão nos dados do desvio padrão do que os do tipo fighting. Nesse sentido, há uma variabilidade maior de pokemons do tipo psychic do que do tipo fighting. Entre todos os 18 tipos de pokemons, o que apresenta maior variabilidade é o do tipo flying, enquanto que o tipo poison é o que apresenta menor variabilidade, pois os dados são mais concentrados.

 

BOXPLOT

Estarei criando o gráfico com o comando boxplot para visualização dos dados da tabela.

par(cex=0.5)  
boxplot(special_attack~type_1, data=df,
        col=c("purple","pink"),
        horizontal = F,
        ylim = c(0,160),
        main="Boxplot de ataque especial por tipo de pokemon")

Resultados:

- Os pontos de distribuição da máxima, minima, primeiro quartil, mediana e  o terceiro quartil do pokemon tipo flying são maiores que dos outros 17 tipos de pokemons, porém a máxima do tipo flying é menor do que do tipo psychic;    
- A máxima do pokemon tipo psychic é maior que de todos os outros 17 tipos de pokemons;    
- O pokemon do tipo grass tem a distribuição simétrica, enquanto que os outros 17 tipos de pokemons tem a distribuição assimétrica;    
- Os pokemons do tipo bug, fighting, ground, normal, rock, steel e water possuem outliers, implica em dizer que há discrepância na distribuição de dados.     
 

 

Conclusão:

Essa atividade tem como finalidade a análise do cruzamento de uma variável quantitativa por grupos de uma variável qualitativa, a criação de uma tabela desses dados e a visualização da tabela utilizando o gráfico boxplot.