R Markdown

Base de dados df_Pokemon

load("C:/Users/julia/Documents/Faculdade/Estatistica/Base_de_dados-master/df_pokemon.RData")

A variável Weight

Qual a speed (velocidade) média dos pokemons nessa base de dados?

mean(df$speed)
## [1] 65.72423
sd(df$speed)
## [1] 27.32769

A Velocidade média é de 65.72423 com desvio médio de 27.32769

A variável Attack

Qual a média de ataque nessa base de dados?

mean(df$attack)
## [1] 74.85376
sd(df$attack)
## [1] 28.93704

A média de ataque é de 74.85376 com desvio médio de 28.93704.

Comparando média com mediana.

conjunto1 = c(7,8,9,10,11,12)
mean(conjunto1)
## [1] 9.5
median(conjunto1)
## [1] 9.5
conjunto2 = c(7,8,9,10,11,120000)
mean(conjunto2)
## [1] 20007.5
median(conjunto2)
## [1] 9.5

No conjunto 1 a média é igual a mediana No conjunto 2 a mediana é muito maior que a média. No conjunto 2 temos um outlier.

Análise dos quartis

summary(df)
##        id          pokemon            species_id        height      
##  Min.   :  1.0   Length:718         Min.   :  1.0   Min.   :  1.00  
##  1st Qu.:180.2   Class :character   1st Qu.:180.2   1st Qu.:  6.00  
##  Median :359.5   Mode  :character   Median :359.5   Median : 10.00  
##  Mean   :359.5                      Mean   :359.5   Mean   : 11.41  
##  3rd Qu.:538.8                      3rd Qu.:538.8   3rd Qu.: 14.00  
##  Max.   :718.0                      Max.   :718.0   Max.   :145.00  
##      weight       base_experience     type_1             type_2         
##  Min.   :   1.0   Min.   : 36.00   Length:718         Length:718        
##  1st Qu.:  95.0   1st Qu.: 65.25   Class :character   Class :character  
##  Median : 280.0   Median :147.00   Mode  :character   Mode  :character  
##  Mean   : 568.2   Mean   :141.55                                        
##  3rd Qu.: 609.5   3rd Qu.:177.00                                        
##  Max.   :9500.0   Max.   :608.00                                        
##      attack          defense             hp         special_attack  
##  Min.   :  5.00   Min.   :  5.00   Min.   :  1.00   Min.   : 10.00  
##  1st Qu.: 53.00   1st Qu.: 50.00   1st Qu.: 50.00   1st Qu.: 45.00  
##  Median : 73.00   Median : 65.00   Median : 65.00   Median : 65.00  
##  Mean   : 74.85   Mean   : 70.67   Mean   : 68.37   Mean   : 68.47  
##  3rd Qu.: 95.00   3rd Qu.: 85.00   3rd Qu.: 80.00   3rd Qu.: 90.00  
##  Max.   :165.00   Max.   :230.00   Max.   :255.00   Max.   :154.00  
##  special_defense      speed          color_1            color_2         
##  Min.   : 20.00   Min.   :  5.00   Length:718         Length:718        
##  1st Qu.: 50.00   1st Qu.: 45.00   Class :character   Class :character  
##  Median : 65.00   Median : 65.00   Mode  :character   Mode  :character  
##  Mean   : 69.09   Mean   : 65.72                                        
##  3rd Qu.: 85.00   3rd Qu.: 85.00                                        
##  Max.   :230.00   Max.   :160.00                                        
##    color_f          egg_group_1        egg_group_2         url_image        
##  Length:718         Length:718         Length:718         Length:718        
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##        x                 y          
##  Min.   :-49.152   Min.   :-45.793  
##  1st Qu.:-17.695   1st Qu.:-17.293  
##  Median :  0.705   Median : -0.628  
##  Mean   :  0.000   Mean   :  0.000  
##  3rd Qu.: 15.905   3rd Qu.: 18.155  
##  Max.   : 53.142   Max.   : 46.593

Boxplot

Criar o data frame com as variáveis de interesse

dados <- data.frame(conjunto1, conjunto2)

criar o boxplot

boxplot(df$weight, col = "yellow",
        main="boxplot weight",
        horizontal = TRUE)

boxplot(df$attack, col = "purple",
        main="boxplot attack",
        horizontal = TRUE)

Histograma

hist(df$weight,col = c("purple","purple","purple","purple","yellow","yellow","yellow","yellow","yellow"),
     main = "histograma weight",
     ylab = "Frequência",
     xlab = "Velocidade dos pokemons")

hist(df$attack, col = c( "gray", "gray", "gray","red","gray", "gray","gray","gray","gray"), 
     main = "Histograma attack", 
     xlab = "Ataque", ylab = "Frequencia") 

Através da análise do arquivo df_pokemon, foram escolhidas 2 váriaveis para a criação de histogramas e comparações de médias e medianas.

No primeiro histograma, histograma speed, é possível análisar que o velocidade (speed) mais frequente/comun estaria entre 0 a 1000 dentre os pokemons que constam no arquivo da base de dados analisada.

No segundo histograma, histograma attack, conseguimos análisar sobre a função ataque,e que a frequência de ataque(attack) mais comum seria entre 74 e 75 de força dos pokemons.