Atividade 2

Author

Larissa Ramos

Pokémon

Carregar a base de dados

load("~/BASE DE DADOS UNIRIO/df_pokemon.RData")

Mudar o nome da base de dados e excluir a antiga

df<-data.frame(df)
Pokemon<-df
rm(df)

Olhar/inspecionar a base de dados

head(Pokemon)
  id    pokemon species_id height weight base_experience type_1 type_2 attack
1  1  bulbasaur          1      7     69              64  grass poison     49
2  2    ivysaur          2     10    130             142  grass poison     62
3  3   venusaur          3     20   1000             236  grass poison     82
4  4 charmander          4      6     85              62   fire   <NA>     52
5  5 charmeleon          5     11    190             142   fire   <NA>     64
6  6  charizard          6     17    905             240   fire flying     84
  defense hp special_attack special_defense speed color_1 color_2 color_f
1      49 45             65              65    45 #78C850 #A040A0 #81A763
2      63 60             80              80    60 #78C850 #A040A0 #81A763
3      83 80            100             100    80 #78C850 #A040A0 #81A763
4      43 39             60              50    65 #F08030    <NA> #F08030
5      58 58             80              65    80 #F08030    <NA> #F08030
6      78 78            109              85   100 #F08030 #A890F0 #DE835E
  egg_group_1 egg_group_2 url_image         x        y
1     monster       plant     1.png  32.82239 17.21614
2     monster       plant     2.png  33.32643 16.71226
3     monster       plant     3.png  33.93778 16.17232
4     monster      dragon     4.png -24.36338 30.78973
5     monster      dragon     5.png -24.57820 30.60161
6     monster      dragon     6.png -25.50657 29.77037

Limpar a base de dados

Pokemon$type_2[is.na(Pokemon$type_2)]="não possui"
Pokemon$color_2[is.na(Pokemon$color_2)]="#F8D02F"
Pokemon$color_f=gsub("#F08030","#DE835E",Pokemon$color_f)
Pokemon$egg_group_2[is.na(Pokemon$egg_group_2)]="não informado"

Fazer um resumo envolvendo variável quantitativa vs qualitativa

Carregar o pacote

library(dplyr)

Anexando pacote: 'dplyr'
Os seguintes objetos são mascarados por 'package:stats':

    filter, lag
Os seguintes objetos são mascarados por 'package:base':

    intersect, setdiff, setequal, union

Fazer de fato o resumo de forma encadeada

Pokemon%>%group_by(type_1)%>%
summarise(
  média_ataque=mean(attack),
  mediana_ataque=median(attack),
  desvio_padrao_ataque=sd(attack))
# A tibble: 18 × 4
   type_1   média_ataque mediana_ataque desvio_padrao_ataque
   <chr>           <dbl>          <dbl>                <dbl>
 1 bug              65.2           63                   30.7
 2 dark             86.2           86.5                 24.3
 3 dragon          103.            97.5                 29.6
 4 electric         67.8           61.5                 25.2
 5 fairy            61.5           52                   29.8
 6 fighting         94.7          100                   27.7
 7 fire             81.6           82.5                 25.3
 8 flying           71.7           70                   42.5
 9 ghost            66.7           65                   25.3
10 grass            70.9           68                   24.1
11 ground           91.3           83.5                 28.6
12 ice              70.7           65                   25.9
13 normal           71.7           70                   29.3
14 poison           74.7           74                   19.6
15 psychic          60.2           52.5                 30.8
16 rock             88.2           86.5                 32.6
17 steel            83.5           82.5                 24.6
18 water            71.0           70                   25.0

Fazer um gráfico boxplot das estatísticas anteriores

boxplot(attack ~ type_1, data = Pokemon,col="violet",
        main="Graphic 1 - Attack x Type 1", cex.names = 0.5, las = 2,col.lab = "#8B008B")

Fazer um diagrama de dispersão. Lembrando que para isso precisamos trabalhar com variáveis quantitativas

plot(Pokemon$attack,Pokemon$defense,col="pink2",pch=19,
     main="Scatter Diagram - attack vs defense",
     xlab = "attack",
     ylab = "defense")

abline(lsfit(Pokemon$attack,Pokemon$defense),
       col="purple",lwd=5)

Fazer uma correlação

cor(Pokemon$attack, Pokemon$defense)
[1] 0.4317745

Interpretação dos Resultados:

  • Média do ataque: fornece uma ideia geral de como os Pokémon de cada tipo se comparam em termos de poder ofensivo. O dragon tem a maior média de ataque (103), o que sugere que os Pokémon desse tipo possuem um ataque mais forte.O psychic tem a menor média de ataque (60.2), indicando que, em média, os Pokémon do tipo psíquico têm um ataque mais fraco em comparação com outros tipos.

  • Mediana do ataque: contribui para verificar a simetria ou assimetria. Quando a média e a mediana estão próximas, a distribuição é mais simétrica. Quando há uma grande diferença entre as duas, isso indica uma distribuição assimétrica (por exemplo, fairy tem uma média de 61.5 e uma mediana de 52, sugerindo uma distribuição assimétrica com muitos Pokémon desse tipo tendo ataques baixos).

  • Desvio padrão do ataque: mostra a variação dentro de cada tipo de Pokémon. Quanto maior o desvio padrão, maior a variação nos valores de ataque.Por exemplo: o tipo poison tem o menor desvio padrão (19.6), o que sugere que os valores de ataque dos Pokémon desse tipo são mais consistentes, com menos variação.

  • Boxplot:

Existe outliers nos tipos fairy, normal, psychic e steel, o que indica possíveis valores discrepantes de ataque dentro de cada tipo;

Ao fazer um pequeno recorte e observar os tipos dragon, electric e fairy, conclui-se: dragon possui a maior mediana se comparado com os outro dois tipos; fairy possui a menor variação absoluta (ou seja, menor diferença entre o maior e menor valor); Já o tipo dragon apresenta a maior amplitude interquartil (ou seja, a caixa mais alta).

  • Correlação ataque x defesa: Como visto anteriormente, as variáveis obtiveram uma correlação de 0,4317745. Isso indica uma correlação positiva moderada entre elas, ou seja,à medida que uma variável aumenta, a outra também tende a aumentar, mas essa relação não é muito forte, visto não se tratar de uma relação perfeita.