Neste trabalho, trabalharemos com uma variável quantitativa de uma
base de dados, elaborando um gráfico e uma análise descritiva a partir
dela.
Iremos começar carregando a base de dados do RData
load("C:/Users/19801926775/Desktop/Base_de_dados-master/df_pokemon.RData")
Resumo da base de dados
summary(df)
## id pokemon species_id height
## Min. : 1.0 Length:718 Min. : 1.0 Min. : 1.00
## 1st Qu.:180.2 Class :character 1st Qu.:180.2 1st Qu.: 6.00
## Median :359.5 Mode :character Median :359.5 Median : 10.00
## Mean :359.5 Mean :359.5 Mean : 11.41
## 3rd Qu.:538.8 3rd Qu.:538.8 3rd Qu.: 14.00
## Max. :718.0 Max. :718.0 Max. :145.00
## weight base_experience type_1 type_2
## Min. : 1.0 Min. : 36.00 Length:718 Length:718
## 1st Qu.: 95.0 1st Qu.: 65.25 Class :character Class :character
## Median : 280.0 Median :147.00 Mode :character Mode :character
## Mean : 568.2 Mean :141.55
## 3rd Qu.: 609.5 3rd Qu.:177.00
## Max. :9500.0 Max. :608.00
## attack defense hp special_attack
## Min. : 5.00 Min. : 5.00 Min. : 1.00 Min. : 10.00
## 1st Qu.: 53.00 1st Qu.: 50.00 1st Qu.: 50.00 1st Qu.: 45.00
## Median : 73.00 Median : 65.00 Median : 65.00 Median : 65.00
## Mean : 74.85 Mean : 70.67 Mean : 68.37 Mean : 68.47
## 3rd Qu.: 95.00 3rd Qu.: 85.00 3rd Qu.: 80.00 3rd Qu.: 90.00
## Max. :165.00 Max. :230.00 Max. :255.00 Max. :154.00
## special_defense speed color_1 color_2
## Min. : 20.00 Min. : 5.00 Length:718 Length:718
## 1st Qu.: 50.00 1st Qu.: 45.00 Class :character Class :character
## Median : 65.00 Median : 65.00 Mode :character Mode :character
## Mean : 69.09 Mean : 65.72
## 3rd Qu.: 85.00 3rd Qu.: 85.00
## Max. :230.00 Max. :160.00
## color_f egg_group_1 egg_group_2 url_image
## Length:718 Length:718 Length:718 Length:718
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
## x y
## Min. :-49.152 Min. :-45.793
## 1st Qu.:-17.695 1st Qu.:-17.293
## Median : 0.705 Median : -0.628
## Mean : 0.000 Mean : 0.000
## 3rd Qu.: 15.905 3rd Qu.: 18.155
## Max. : 53.142 Max. : 46.593
Depois disso, vamos classificar as suas variáveis
class(df$id)
## [1] "numeric"
class(df$pokemon)
## [1] "character"
class(df$species_id)
## [1] "integer"
class(df$height)
## [1] "integer"
class(df$weight)
## [1] "integer"
class(df$base_experience)
## [1] "integer"
class(df$type_1)
## [1] "character"
class(df$type_2)
## [1] "character"
class(df$attack)
## [1] "integer"
class(df$defense)
## [1] "integer"
class(df$hp)
## [1] "integer"
class(df$special_attack)
## [1] "integer"
class(df$special_defense)
## [1] "integer"
class(df$speed)
## [1] "integer"
class(df$color_1)
## [1] "character"
class(df$color_2)
## [1] "character"
class(df$color_f)
## [1] "character"
class(df$egg_group_1)
## [1] "character"
class(df$egg_group_2)
## [1] "character"
class(df$url_image)
## [1] "character"
class(df$x)
## [1] "numeric"
class(df$y)
## [1] "numeric"
Após classificar todas as variáveis, escolhi trabalhar com a
variável quantitativa “Attack”. Será a partir dela que o restante do
trabalho será redigido.
Portanto, vamos calcular a média dessa variável.
mean(df$attack)
## [1] 74.85376
sd(df$attack)
## [1] 28.93704
A média da variável é de 74.85376, com um desvio padrão de
28.93704.
Boxplot
boxplot(df$attack, col = "salmon",
main= "Meu Boxplot",
horizontal = TRUE)

Com a ajuda do boxplot, podemos verificar mais claramente os dados
anteriormente apresentados. Nota-se que o mínimo esperado é 5, enquanto
o máximo é 165. Além disso, também podemos analisar a partir do Boxplot
os valores dos quartis. No primeiro quartil temos 50, no segundo 73 e no
terceiro 150.
O intervalo interquartílico é 50.
Histograma
hist(df$attack, col = c("seagreen1","seagreen2","springgreen","springgreen","springgreen","seagreen2","springgreen3","springgreen4","olivedrab"),
main = "Histograma da variável",
ylab = "Frequência",
xlab = "Ataque")

O Histograma é simétrico, com uma maior concentração de ataque entre
50 e 100. Nessa base de dados, são poucos aqueles que possuem um ataque
superior a 150. Em relação a frequência, nota-se que raramente ela
ultrapassa 150, na verdade, a maior concentração de frequência se mantém
entre 50 e 150.
Conclusão
Desta forma, após descrever e analisar os dados, concluo a minha
análise quantitativa dessa variável nessa base de dados.