# Passo 1 - Carregar do RData
load("C:/Users/isabe/Desktop/Base_de_dados-master/df_pokemon.RData")
View(df)
names(df)
## [1] "id" "pokemon" "species_id" "height"
## [5] "weight" "base_experience" "type_1" "type_2"
## [9] "attack" "defense" "hp" "special_attack"
## [13] "special_defense" "speed" "color_1" "color_2"
## [17] "color_f" "egg_group_1" "egg_group_2" "url_image"
## [21] "x" "y"
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(flextable)
library(reactable)
# Passo 2 - Cruzamento de uma variável quantitativa por um grupo de variável qualitativa
# Qual tipo de pokemon é o mais pesado? O mais leve? Grupo com pesos mais uniformes.
df %>% select(weight,type_1) %>%
group_by(type_1) %>%
summarise(Média=round(mean(weight),2),
Desvio_Padrao=round(sd(weight),2),
Mediana=median(weight)) %>% flextable()%>% theme_vader()
type_1 | Média | Desvio_Padrao | Mediana |
bug | 292.51 | 400.29 | 170.0 |
dark | 398.50 | 449.22 | 290.0 |
dragon | 1,149.12 | 1,131.44 | 775.0 |
electric | 374.47 | 459.36 | 227.5 |
fairy | 249.24 | 513.26 | 75.0 |
fighting | 549.24 | 533.84 | 400.0 |
fire | 611.28 | 773.29 | 325.0 |
flying | 520.00 | 396.61 | 630.0 |
ghost | 570.09 | 1,546.95 | 125.0 |
grass | 381.09 | 542.15 | 156.5 |
ground | 1,047.27 | 1,812.77 | 437.5 |
ice | 1,032.61 | 1,237.88 | 554.0 |
normal | 431.65 | 731.63 | 244.0 |
poison | 366.21 | 287.67 | 300.0 |
psychic | 300.54 | 391.57 | 165.0 |
rock | 1,030.58 | 955.47 | 643.0 |
steel | 1,569.00 | 1,881.43 | 707.5 |
water | 535.76 | 725.39 | 280.0 |
# Passo 3 - Box-plot da tabela peso-modelo de pokemon
color <- colorRampPalette(c("red","yellow", "green"))
color(18)
## [1] "#FF0000" "#FF1E00" "#FF3C00" "#FF5900" "#FF7800" "#FF9600" "#FFB300"
## [8] "#FFD200" "#FFF000" "#F0FF00" "#D2FF00" "#B3FF00" "#96FF00" "#78FF00"
## [15] "#5AFF00" "#3CFF00" "#1EFF00" "#00FF00"
boxplot(weight~type_1, data=df,
col=color(18),
horizontal =F,main="Gráfico - Peso e os tipos de Pokemon")
?color()
## starting httpd help server ... done
Vamos analisar os modelos de pokemon que tiveram mais relevancia nos resultados da média, mediana e desvio padrão. O modelo com maior média de peso é o steel, que não é visível no gráfico reduzido, mas é a segunda barra da direta para a esquerda, quer dizer que dentre todos os modelos de pokemons, a soma de seus pesos divido pela quantidade de tipos steel’s é a maior de todas, o que nos diz que é o modelo mais pesado entre todos. Sua mediana é 707.5, um pouco menos que a metade da média que é 1.569, o que quer dizer que dentro do seu grupo o steel nem pesado e nem leve tem sua numeração 707.5.
Entretanto seu desvio padrão é alto (1.881,43) o que significa que o valor do peso apresentado pela média, está longe da média real, ou seja, os valores somados para fazer a média não são harmônicos, podendo conter muitos steel’s com peso baixo ou médio e alguns com peso acima mas que na média acabam elevando o valor geral. Quanto mais próximo do valor zero o desvio padrão estiver, mais próximo está da média real, poison é o modelo com menor desvio padrão, a possibilidade estão dos valores harmônicos nesse grupo. Podemos ver isso na mediana que há pouca diferença com a média: Mediana (300); Média(366,21).
Essas comparações servem para nos mostrar, que no caso do gráfico peso relação modelo de pokemon, os valores das médias nem sempre serão precisas.O modelo com maior média de peso não quer dizer necessariamente o mais pesado, o que pode significar poucos do grupo com peso muito além da média. E o grupo com menor média de pesos, pode não ser os mais leves, mas sim que há pesos muito abaixo da média, levando o grupo para uma média baixa. Portanto, com a interpretação cosciente e detalhada do gráfico, conseguimos enxergar informações mais precisas.