Aqui vamos carregar a base de dados e fazer um pequeno resumo dos dados que temos na base (Considerando a altura dos pokemons)
load("C:/Users/jheni/Base_de_dados-master/df_pokemon.RData")
summary(df$height)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.00 6.00 10.00 11.41 14.00 145.00
var(df$height)
## [1] 106.501
sd(df$height)
## [1] 10.31993
mean(df$height)
## [1] 11.40669
Aqui carregamos as bases da biblioteca -> dplyr, flextable e reactable
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.1.1
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(flextable)
## Warning: package 'flextable' was built under R version 4.1.2
library(reactable)
## Warning: package 'reactable' was built under R version 4.1.2
Aqui consideramos a média e desvio padrão pedidos na atividade. Nela consideramos a altura e o tipo dos pokemons. Como resultado podemos perceber que o tipo bug tem média 8.6 e desvio padrão de 4.93, o tipo dark tem media de 11.46 e desvio padrão 10.03, o tipo dragon tem média 20.38 e devio 15.47, entre outros. Com essa análise pode-se perceber que a maior média é de 20.38, do tipo dragon e o maior desvio padrão é de 20.33 do tipo steel em relação à altura dos personagens. Já o a menor media é de 8.35 do tipo fairy e o menor desvio padrão é de 4.62 do tipo fighting.
df %>% select(height, type_1) %>%
group_by (type_1) %>%
summarise(media= round(mean(height),2),
Desvio_Padrao=round(sd(height),2)) %>% reactable()
Aqui temos um boxplot explicando em gráficos as análises anteriores da relação entre tipo e altura. Pode-se entender que a maioria dos tipos apresentam outilier, ou seja, alguns pokemons apresentam altura acima da altura máxima comparado aos outros pokemons daquele tipo.
boxplot(height~ type_1, data=df,
col=c("red","royalblue"),
horizontal =F,main="Boxplot da altura e tipo")
O boxplot é um gráfico fundamental para a interpretação dos desvios e da médias, pois através dele podemos perceber se há alguns dados incomuns em comparação aos outros.