Introdução
Atividade referente à disciplina de estatística aplicada às ciências humanas e sociais, da turma de administração pública, 2021.2.
Atividade 05: Fazer uma publicação do RMarkdown, interpretar as estatísticas abaixo e fazer uma publicação no rpubs:
1. Média e Desvio-Padrão para uma variável quantitativa por grupos de uma variável qualitativa;
2. Box-plot para uma variável quantitativa por grupos de uma variável qualitativa.
Carregando base de dados
Carregando a base de dados df_pokemon que será utilizada para análise.
load("C:/Users/julia/Base_de_dados-master/df_pokemon.RData")Análise descritiva dos dados
summary(df)## id pokemon species_id height
## Min. : 1.0 Length:718 Min. : 1.0 Min. : 1.00
## 1st Qu.:180.2 Class :character 1st Qu.:180.2 1st Qu.: 6.00
## Median :359.5 Mode :character Median :359.5 Median : 10.00
## Mean :359.5 Mean :359.5 Mean : 11.41
## 3rd Qu.:538.8 3rd Qu.:538.8 3rd Qu.: 14.00
## Max. :718.0 Max. :718.0 Max. :145.00
## weight base_experience type_1 type_2
## Min. : 1.0 Min. : 36.00 Length:718 Length:718
## 1st Qu.: 95.0 1st Qu.: 65.25 Class :character Class :character
## Median : 280.0 Median :147.00 Mode :character Mode :character
## Mean : 568.2 Mean :141.55
## 3rd Qu.: 609.5 3rd Qu.:177.00
## Max. :9500.0 Max. :608.00
## attack defense hp special_attack
## Min. : 5.00 Min. : 5.00 Min. : 1.00 Min. : 10.00
## 1st Qu.: 53.00 1st Qu.: 50.00 1st Qu.: 50.00 1st Qu.: 45.00
## Median : 73.00 Median : 65.00 Median : 65.00 Median : 65.00
## Mean : 74.85 Mean : 70.67 Mean : 68.37 Mean : 68.47
## 3rd Qu.: 95.00 3rd Qu.: 85.00 3rd Qu.: 80.00 3rd Qu.: 90.00
## Max. :165.00 Max. :230.00 Max. :255.00 Max. :154.00
## special_defense speed color_1 color_2
## Min. : 20.00 Min. : 5.00 Length:718 Length:718
## 1st Qu.: 50.00 1st Qu.: 45.00 Class :character Class :character
## Median : 65.00 Median : 65.00 Mode :character Mode :character
## Mean : 69.09 Mean : 65.72
## 3rd Qu.: 85.00 3rd Qu.: 85.00
## Max. :230.00 Max. :160.00
## color_f egg_group_1 egg_group_2 url_image
## Length:718 Length:718 Length:718 Length:718
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
## x y
## Min. :-49.152 Min. :-45.793
## 1st Qu.:-17.695 1st Qu.:-17.293
## Median : 0.705 Median : -0.628
## Mean : 0.000 Mean : 0.000
## 3rd Qu.: 15.905 3rd Qu.: 18.155
## Max. : 53.142 Max. : 46.593
Cruzamento de variável quantitativa x qualitativa
variáveis utilizadas: special_attack e type_1.
Estarei utilizando essas váriaveis para criar a tabela de ataque especial por tipo de pokemon, encontrando os valores da média e do desvio padrão.
library(dplyr)##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(flextable)
library(reactable)
df %>% select(special_attack, type_1) %>%
group_by(type_1) %>%
summarise(Média=round(mean(special_attack),2),
Desvio_Padrao=round(sd(special_attack),2)) %>%
flextable() %>% theme_tron()type_1 | Média | Desvio_Padrao |
bug | 54.03 | 27.31 |
dark | 70.50 | 31.38 |
dragon | 82.46 | 36.41 |
electric | 83.08 | 26.46 |
fairy | 78.53 | 28.55 |
fighting | 48.56 | 22.20 |
fire | 82.46 | 25.11 |
flying | 89.00 | 40.60 |
ghost | 80.43 | 28.34 |
grass | 74.33 | 24.57 |
ground | 51.73 | 20.98 |
ice | 75.70 | 25.58 |
normal | 54.45 | 22.87 |
poison | 60.43 | 19.32 |
psychic | 89.30 | 29.90 |
rock | 59.05 | 23.67 |
steel | 63.55 | 28.29 |
water | 71.71 | 25.98 |
Resultados:
Ataque especial por tipo de pokemon:
Dos 18 tipos de pokemons apresentados na variável type_1, em média os pokemons do tipo psychic têm ataque especial de 89.30, são mais fortes, enquanto que os pokemons do tipo fighting, em média, têm ataque especial de 48.56, são o tipo mais fraco.
Variabilidade dos tipos de pokemon por ataque especial:
Os pokemons do tipo psychic apresentam maior dispersão nos dados do desvio padrão do que os do tipo fighting. Nesse sentido, há uma variabilidade maior de pokemons do tipo psychic do que do tipo fighting. Entre todos os 18 tipos de pokemons, o que apresenta maior variabilidade é o do tipo flying, enquanto que o tipo poison é o que apresenta menor variabilidade, pois os dados são mais concentrados.
BOXPLOT
Estarei criando o gráfico com o comando boxplot para visualização dos dados da tabela.
par(cex=0.5)
boxplot(special_attack~type_1, data=df,
col=c("purple","pink"),
horizontal = F,
ylim = c(0,160),
main="Boxplot de ataque especial por tipo de pokemon")Resultados:
- Os pontos de distribuição da máxima, minima, primeiro quartil, mediana e o terceiro quartil do pokemon tipo flying são maiores que dos outros 17 tipos de pokemons, porém a máxima do tipo flying é menor do que do tipo psychic;
- A máxima do pokemon tipo psychic é maior que de todos os outros 17 tipos de pokemons;
- O pokemon do tipo grass tem a distribuição simétrica, enquanto que os outros 17 tipos de pokemons tem a distribuição assimétrica;
- Os pokemons do tipo bug, fighting, ground, normal, rock, steel e water possuem outliers, implica em dizer que há discrepância na distribuição de dados.
Conclusão:
Essa atividade tem como finalidade a análise do cruzamento de uma variável quantitativa por grupos de uma variável qualitativa, a criação de uma tabela desses dados e a visualização da tabela utilizando o gráfico boxplot.