load("~/BASE DE DADOS UNIRIO/df_pokemon.RData")Atividade 2
Pokémon
Carregar a base de dados
Mudar o nome da base de dados e excluir a antiga
df<-data.frame(df)
Pokemon<-df
rm(df)Olhar/inspecionar a base de dados
head(Pokemon) id pokemon species_id height weight base_experience type_1 type_2 attack
1 1 bulbasaur 1 7 69 64 grass poison 49
2 2 ivysaur 2 10 130 142 grass poison 62
3 3 venusaur 3 20 1000 236 grass poison 82
4 4 charmander 4 6 85 62 fire <NA> 52
5 5 charmeleon 5 11 190 142 fire <NA> 64
6 6 charizard 6 17 905 240 fire flying 84
defense hp special_attack special_defense speed color_1 color_2 color_f
1 49 45 65 65 45 #78C850 #A040A0 #81A763
2 63 60 80 80 60 #78C850 #A040A0 #81A763
3 83 80 100 100 80 #78C850 #A040A0 #81A763
4 43 39 60 50 65 #F08030 <NA> #F08030
5 58 58 80 65 80 #F08030 <NA> #F08030
6 78 78 109 85 100 #F08030 #A890F0 #DE835E
egg_group_1 egg_group_2 url_image x y
1 monster plant 1.png 32.82239 17.21614
2 monster plant 2.png 33.32643 16.71226
3 monster plant 3.png 33.93778 16.17232
4 monster dragon 4.png -24.36338 30.78973
5 monster dragon 5.png -24.57820 30.60161
6 monster dragon 6.png -25.50657 29.77037
Limpar a base de dados
Pokemon$type_2[is.na(Pokemon$type_2)]="não possui"
Pokemon$color_2[is.na(Pokemon$color_2)]="#F8D02F"
Pokemon$color_f=gsub("#F08030","#DE835E",Pokemon$color_f)
Pokemon$egg_group_2[is.na(Pokemon$egg_group_2)]="não informado"Fazer um resumo envolvendo variável quantitativa vs qualitativa
Carregar o pacote
library(dplyr)
Anexando pacote: 'dplyr'
Os seguintes objetos são mascarados por 'package:stats':
filter, lag
Os seguintes objetos são mascarados por 'package:base':
intersect, setdiff, setequal, union
Fazer de fato o resumo de forma encadeada
Pokemon%>%group_by(type_1)%>%
summarise(
média_ataque=mean(attack),
mediana_ataque=median(attack),
desvio_padrao_ataque=sd(attack))# A tibble: 18 × 4
type_1 média_ataque mediana_ataque desvio_padrao_ataque
<chr> <dbl> <dbl> <dbl>
1 bug 65.2 63 30.7
2 dark 86.2 86.5 24.3
3 dragon 103. 97.5 29.6
4 electric 67.8 61.5 25.2
5 fairy 61.5 52 29.8
6 fighting 94.7 100 27.7
7 fire 81.6 82.5 25.3
8 flying 71.7 70 42.5
9 ghost 66.7 65 25.3
10 grass 70.9 68 24.1
11 ground 91.3 83.5 28.6
12 ice 70.7 65 25.9
13 normal 71.7 70 29.3
14 poison 74.7 74 19.6
15 psychic 60.2 52.5 30.8
16 rock 88.2 86.5 32.6
17 steel 83.5 82.5 24.6
18 water 71.0 70 25.0
Fazer um gráfico boxplot das estatísticas anteriores
boxplot(attack ~ type_1, data = Pokemon,col="violet",
main="Graphic 1 - Attack x Type 1", cex.names = 0.5, las = 2,col.lab = "#8B008B")Fazer um diagrama de dispersão. Lembrando que para isso precisamos trabalhar com variáveis quantitativas
plot(Pokemon$attack,Pokemon$defense,col="pink2",pch=19,
main="Scatter Diagram - attack vs defense",
xlab = "attack",
ylab = "defense")
abline(lsfit(Pokemon$attack,Pokemon$defense),
col="purple",lwd=5)Fazer uma correlação
cor(Pokemon$attack, Pokemon$defense)[1] 0.4317745
Interpretação dos Resultados:
Média do ataque: fornece uma ideia geral de como os Pokémon de cada tipo se comparam em termos de poder ofensivo. O dragon tem a maior média de ataque (103), o que sugere que os Pokémon desse tipo possuem um ataque mais forte.O psychic tem a menor média de ataque (60.2), indicando que, em média, os Pokémon do tipo psíquico têm um ataque mais fraco em comparação com outros tipos.
Mediana do ataque: contribui para verificar a simetria ou assimetria. Quando a média e a mediana estão próximas, a distribuição é mais simétrica. Quando há uma grande diferença entre as duas, isso indica uma distribuição assimétrica (por exemplo, fairy tem uma média de 61.5 e uma mediana de 52, sugerindo uma distribuição assimétrica com muitos Pokémon desse tipo tendo ataques baixos).
Desvio padrão do ataque: mostra a variação dentro de cada tipo de Pokémon. Quanto maior o desvio padrão, maior a variação nos valores de ataque.Por exemplo: o tipo poison tem o menor desvio padrão (19.6), o que sugere que os valores de ataque dos Pokémon desse tipo são mais consistentes, com menos variação.
Boxplot:
Existe outliers nos tipos fairy, normal, psychic e steel, o que indica possíveis valores discrepantes de ataque dentro de cada tipo;
Ao fazer um pequeno recorte e observar os tipos dragon, electric e fairy, conclui-se: dragon possui a maior mediana se comparado com os outro dois tipos; fairy possui a menor variação absoluta (ou seja, menor diferença entre o maior e menor valor); Já o tipo dragon apresenta a maior amplitude interquartil (ou seja, a caixa mais alta).
- Correlação ataque x defesa: Como visto anteriormente, as variáveis obtiveram uma correlação de 0,4317745. Isso indica uma correlação positiva moderada entre elas, ou seja,à medida que uma variável aumenta, a outra também tende a aumentar, mas essa relação não é muito forte, visto não se tratar de uma relação perfeita.