Neste trabalho, trabalharemos com uma variável quantitativa de uma base de dados, elaborando um gráfico e uma análise descritiva a partir dela.

Iremos começar carregando a base de dados do RData

load("C:/Users/19801926775/Desktop/Base_de_dados-master/df_pokemon.RData")

Resumo da base de dados

summary(df)
##        id          pokemon            species_id        height      
##  Min.   :  1.0   Length:718         Min.   :  1.0   Min.   :  1.00  
##  1st Qu.:180.2   Class :character   1st Qu.:180.2   1st Qu.:  6.00  
##  Median :359.5   Mode  :character   Median :359.5   Median : 10.00  
##  Mean   :359.5                      Mean   :359.5   Mean   : 11.41  
##  3rd Qu.:538.8                      3rd Qu.:538.8   3rd Qu.: 14.00  
##  Max.   :718.0                      Max.   :718.0   Max.   :145.00  
##      weight       base_experience     type_1             type_2         
##  Min.   :   1.0   Min.   : 36.00   Length:718         Length:718        
##  1st Qu.:  95.0   1st Qu.: 65.25   Class :character   Class :character  
##  Median : 280.0   Median :147.00   Mode  :character   Mode  :character  
##  Mean   : 568.2   Mean   :141.55                                        
##  3rd Qu.: 609.5   3rd Qu.:177.00                                        
##  Max.   :9500.0   Max.   :608.00                                        
##      attack          defense             hp         special_attack  
##  Min.   :  5.00   Min.   :  5.00   Min.   :  1.00   Min.   : 10.00  
##  1st Qu.: 53.00   1st Qu.: 50.00   1st Qu.: 50.00   1st Qu.: 45.00  
##  Median : 73.00   Median : 65.00   Median : 65.00   Median : 65.00  
##  Mean   : 74.85   Mean   : 70.67   Mean   : 68.37   Mean   : 68.47  
##  3rd Qu.: 95.00   3rd Qu.: 85.00   3rd Qu.: 80.00   3rd Qu.: 90.00  
##  Max.   :165.00   Max.   :230.00   Max.   :255.00   Max.   :154.00  
##  special_defense      speed          color_1            color_2         
##  Min.   : 20.00   Min.   :  5.00   Length:718         Length:718        
##  1st Qu.: 50.00   1st Qu.: 45.00   Class :character   Class :character  
##  Median : 65.00   Median : 65.00   Mode  :character   Mode  :character  
##  Mean   : 69.09   Mean   : 65.72                                        
##  3rd Qu.: 85.00   3rd Qu.: 85.00                                        
##  Max.   :230.00   Max.   :160.00                                        
##    color_f          egg_group_1        egg_group_2         url_image        
##  Length:718         Length:718         Length:718         Length:718        
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##        x                 y          
##  Min.   :-49.152   Min.   :-45.793  
##  1st Qu.:-17.695   1st Qu.:-17.293  
##  Median :  0.705   Median : -0.628  
##  Mean   :  0.000   Mean   :  0.000  
##  3rd Qu.: 15.905   3rd Qu.: 18.155  
##  Max.   : 53.142   Max.   : 46.593

Depois disso, vamos classificar as suas variáveis

class(df$id)
## [1] "numeric"
class(df$pokemon)
## [1] "character"
class(df$species_id)
## [1] "integer"
class(df$height)
## [1] "integer"
class(df$weight)
## [1] "integer"
class(df$base_experience)
## [1] "integer"
class(df$type_1)
## [1] "character"
class(df$type_2)
## [1] "character"
class(df$attack)
## [1] "integer"
class(df$defense)
## [1] "integer"
class(df$hp)
## [1] "integer"
class(df$special_attack)
## [1] "integer"
class(df$special_defense)
## [1] "integer"
class(df$speed)
## [1] "integer"
class(df$color_1)
## [1] "character"
class(df$color_2)
## [1] "character"
class(df$color_f)
## [1] "character"
class(df$egg_group_1)
## [1] "character"
class(df$egg_group_2)
## [1] "character"
class(df$url_image)
## [1] "character"
class(df$x)
## [1] "numeric"
class(df$y)
## [1] "numeric"

Após classificar todas as variáveis, escolhi trabalhar com a variável quantitativa “Attack”. Será a partir dela que o restante do trabalho será redigido.

Portanto, vamos calcular a média dessa variável.

mean(df$attack)
## [1] 74.85376
sd(df$attack)
## [1] 28.93704
A média da variável é de 74.85376, com um desvio padrão de 28.93704.

Calculando a mediana:

mean(df$attack)
## [1] 74.85376
median(df$attack)
## [1] 73
A mediana da variável é 73.

Boxplot

boxplot(df$attack, col = "salmon",
        main= "Meu Boxplot",
        horizontal = TRUE)

Com a ajuda do boxplot, podemos verificar mais claramente os dados anteriormente apresentados. Nota-se que o mínimo esperado é 5, enquanto o máximo é 165. Além disso, também podemos analisar a partir do Boxplot os valores dos quartis. No primeiro quartil temos 50, no segundo 73 e no terceiro 150.

O intervalo interquartílico é 50.

Histograma

hist(df$attack, col = c("seagreen1","seagreen2","springgreen","springgreen","springgreen","seagreen2","springgreen3","springgreen4","olivedrab"),
     main = "Histograma da variável",
     ylab = "Frequência",
     xlab = "Ataque")

O Histograma é simétrico, com uma maior concentração de ataque entre 50 e 100. Nessa base de dados, são poucos aqueles que possuem um ataque superior a 150. Em relação a frequência, nota-se que raramente ela ultrapassa 150, na verdade, a maior concentração de frequência se mantém entre 50 e 150.

Conclusão

Desta forma, após descrever e analisar os dados, concluo a minha análise quantitativa dessa variável nessa base de dados.