Carregar Base de dados

options(repos = c(CRAN = "https://cran.rstudio.com"))

# Carregar o arquivo baixado manualmente
load("C:/Users/Letícia Colla/Desktop/Luiza - Estatística/Base_de_dados-master/df_pokemon.RData")

Pacotes

library(readxl)
library(flextable)
library(dplyr)
## 
## Anexando pacote: 'dplyr'
## Os seguintes objetos são mascarados por 'package:stats':
## 
##     filter, lag
## Os seguintes objetos são mascarados por 'package:base':
## 
##     intersect, setdiff, setequal, union
library(ggplot2)
library(reactable) 
library(corrplot)
## corrplot 0.95 loaded
df_pokemon <- df

1-Resumo

Média e desvio padrão

df %>% group_by(type_1) %>% summarise(média=mean(attack),
                                      desvio_padrão=sd (attack))
## # A tibble: 18 × 3
##    type_1   média desvio_padrão
##    <chr>    <dbl>         <dbl>
##  1 bug       65.2          30.7
##  2 dark      86.2          24.3
##  3 dragon   103.           29.6
##  4 electric  67.8          25.2
##  5 fairy     61.5          29.8
##  6 fighting  94.7          27.7
##  7 fire      81.6          25.3
##  8 flying    71.7          42.5
##  9 ghost     66.7          25.3
## 10 grass     70.9          24.1
## 11 ground    91.3          28.6
## 12 ice       70.7          25.9
## 13 normal    71.7          29.3
## 14 poison    74.7          19.6
## 15 psychic   60.2          30.8
## 16 rock      88.2          32.6
## 17 steel     83.5          24.6
## 18 water     71.0          25.0

Mediana

df %>% group_by(type_1) %>% summarise(mínimo = min(attack),
                                      quartil1 = quantile(attack, probs=0.25),
                                      mediana=median(attack),
                                      quartil3 = quantile(attack, probs=0.75),
                                      máximo=max(attack)) %>% 
reactable()

2- Boxplot

ggplot(df, aes(x = type_1, y = attack)) +
  geom_boxplot(fill="red") + theme_minimal() + theme(
    plot.background = element_rect(fill = "white")) +
  labs(
    title = "Boxplot",
    subtitle ="Tipo x Ataque",
    x = "Tipo de Pokémon",
    y = "Ataque")

3 - Diagrama de dispersão

plot(df$attack, df$weight, pch=20,col="red",
     main="Diagrama de Disperção", xlab = "attack", ylab = "weight")
abline(lsfit(df$attack, df$weight),col="blue",lwd=5)

4- Correlação

library(corrplot)
M <- cor(df[,c("height","weight","base_experience", "attack","defense","hp","special_attack", "special_defense", "speed")])
corrplot(M, method="circle")

corrplot(M, method="color")

col3 <- colorRampPalette(c("blue", "red", "skyblue"))
corrplot(M, order="hclust", addrect=2, col=col3(20))

 cor(df$attack, df$weight) 
## [1] 0.4605428

nota: A princípio, a análise da média, do desvio padrão e da mediana da variável attack mostrou diversas diferenças entre os Pokémons. A média indicou a força típica de cada grupo, enquanto o desvio padrão destacou a variabilidade dentro deles. Bem como a mediana e os quartis foram fundamentais para compreender a distribuição central do ataque, principalmente em casos com valores extremos que poderiam distorcer a média. Essa variável ajuda a diferenciar tipos mais equilibrados, como os que apresentam menor variação, e aqueles com maior diversidade ou concentração de Pokémons destaques.

Ademais, o boxplot permitiu visualizar de forma nitida a discrepância no ataque entre os tipos de Pokémon, sendo de suma importância para comparar diversos grupos e identificar rapidamente diferenças significativas entre os tipos. A mediana, representada pela linha central de cada caixa, mostrou o valor central do ataque em cada grupo, enquanto a amplitude interquartil destacou a dispersão dos dados. Tipos com caixas mais compactas apresentaram maior consistência, enquanto aqueles com outliers indicaram a presença de Pokémons únicos.

Além disso, o diagrama de dispersão mostrou a relação entre o ataque e o peso dos Pokémons, revelando se tem ou não uma tendência entre essas variáveis. Apesar de que alguns padrões possam induzir o pensamento de que Pokémons mais pesados possuem ataques mais altos, a dispersão dos pontos indica que isso não é uma regra. A adição de uma linha de regressão ajudou a visualizar tendências gerais, mas pontos extremos no gráfico chamam a atenção para Pokémon com combinações atípicas, como alto ataque e baixo peso, que merecem uma análise mais aprofundada.

E conforme a matriz de correlação aponta, existem fatores de relações entre variáveis como ataque, peso, velocidade e outros atributos dos Pokémon. Correlações positivas e fortes, como entre ataque e peso, indicam que esses atributos podem estar relacionados em muitos casos, enquanto as negativas sugerem possíveis trocas, como maior velocidade em detrimento de força ofensiva. O uso de cores e agrupamento através do R, facilitou a interpretação. Desse Modo, variáveis com correlação muito baixa podem indicar independência, o que também pode ser útil em estratégias ou hipóteses sobre os atributos dos Pokémon.