options(repos = c(CRAN = "https://cran.rstudio.com"))
# Carregar o arquivo baixado manualmente
load("C:/Users/Letícia Colla/Desktop/Luiza - Estatística/Base_de_dados-master/df_pokemon.RData")
library(readxl)
library(flextable)
library(dplyr)
##
## Anexando pacote: 'dplyr'
## Os seguintes objetos são mascarados por 'package:stats':
##
## filter, lag
## Os seguintes objetos são mascarados por 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2)
library(reactable)
library(corrplot)
## corrplot 0.95 loaded
df_pokemon <- df
Média e desvio padrão
df %>% group_by(type_1) %>% summarise(média=mean(attack),
desvio_padrão=sd (attack))
## # A tibble: 18 × 3
## type_1 média desvio_padrão
## <chr> <dbl> <dbl>
## 1 bug 65.2 30.7
## 2 dark 86.2 24.3
## 3 dragon 103. 29.6
## 4 electric 67.8 25.2
## 5 fairy 61.5 29.8
## 6 fighting 94.7 27.7
## 7 fire 81.6 25.3
## 8 flying 71.7 42.5
## 9 ghost 66.7 25.3
## 10 grass 70.9 24.1
## 11 ground 91.3 28.6
## 12 ice 70.7 25.9
## 13 normal 71.7 29.3
## 14 poison 74.7 19.6
## 15 psychic 60.2 30.8
## 16 rock 88.2 32.6
## 17 steel 83.5 24.6
## 18 water 71.0 25.0
Mediana
df %>% group_by(type_1) %>% summarise(mínimo = min(attack),
quartil1 = quantile(attack, probs=0.25),
mediana=median(attack),
quartil3 = quantile(attack, probs=0.75),
máximo=max(attack)) %>%
reactable()
ggplot(df, aes(x = type_1, y = attack)) +
geom_boxplot(fill="red") + theme_minimal() + theme(
plot.background = element_rect(fill = "white")) +
labs(
title = "Boxplot",
subtitle ="Tipo x Ataque",
x = "Tipo de Pokémon",
y = "Ataque")
plot(df$attack, df$weight, pch=20,col="red",
main="Diagrama de Disperção", xlab = "attack", ylab = "weight")
abline(lsfit(df$attack, df$weight),col="blue",lwd=5)
library(corrplot)
M <- cor(df[,c("height","weight","base_experience", "attack","defense","hp","special_attack", "special_defense", "speed")])
corrplot(M, method="circle")
corrplot(M, method="color")
col3 <- colorRampPalette(c("blue", "red", "skyblue"))
corrplot(M, order="hclust", addrect=2, col=col3(20))
cor(df$attack, df$weight)
## [1] 0.4605428
nota: A princípio, a análise da média, do desvio padrão e da mediana da variável attack mostrou diversas diferenças entre os Pokémons. A média indicou a força típica de cada grupo, enquanto o desvio padrão destacou a variabilidade dentro deles. Bem como a mediana e os quartis foram fundamentais para compreender a distribuição central do ataque, principalmente em casos com valores extremos que poderiam distorcer a média. Essa variável ajuda a diferenciar tipos mais equilibrados, como os que apresentam menor variação, e aqueles com maior diversidade ou concentração de Pokémons destaques.
Ademais, o boxplot permitiu visualizar de forma nitida a discrepância no ataque entre os tipos de Pokémon, sendo de suma importância para comparar diversos grupos e identificar rapidamente diferenças significativas entre os tipos. A mediana, representada pela linha central de cada caixa, mostrou o valor central do ataque em cada grupo, enquanto a amplitude interquartil destacou a dispersão dos dados. Tipos com caixas mais compactas apresentaram maior consistência, enquanto aqueles com outliers indicaram a presença de Pokémons únicos.
Além disso, o diagrama de dispersão mostrou a relação entre o ataque e o peso dos Pokémons, revelando se tem ou não uma tendência entre essas variáveis. Apesar de que alguns padrões possam induzir o pensamento de que Pokémons mais pesados possuem ataques mais altos, a dispersão dos pontos indica que isso não é uma regra. A adição de uma linha de regressão ajudou a visualizar tendências gerais, mas pontos extremos no gráfico chamam a atenção para Pokémon com combinações atípicas, como alto ataque e baixo peso, que merecem uma análise mais aprofundada.
E conforme a matriz de correlação aponta, existem fatores de relações entre variáveis como ataque, peso, velocidade e outros atributos dos Pokémon. Correlações positivas e fortes, como entre ataque e peso, indicam que esses atributos podem estar relacionados em muitos casos, enquanto as negativas sugerem possíveis trocas, como maior velocidade em detrimento de força ofensiva. O uso de cores e agrupamento através do R, facilitou a interpretação. Desse Modo, variáveis com correlação muito baixa podem indicar independência, o que também pode ser útil em estratégias ou hipóteses sobre os atributos dos Pokémon.