Gráfico para variáveis quantitativas

Fazer uma publicação no RPUBS de um histograma e uma análise descritiva (summary) em uma variável quantitativa da base de dados chamada “df_pokemon.RData”.

OBS - Obrigatória a interpretação dos seus gráficos em pelo menos dois parágrafos.

Passo 1:

Nosso primeiro passo consiste em abrir a base em formato R no programa. Para isso, localizamos o arquivo na pastae com botão direito do mouse selecionaos o abrir com RStudio.

Uma vez que a base apareça no nosso quadrante de Environment, é interessante que você a abra (clique duas vezes na linha que ela abrirá como uma nova guia no quadrante de produção do R) para que você analise as informações que a base trabalha.

load("C:/Users/loren/Downloads/Estatistica/Base_de_dados-master/df_pokemon.RData")
head(df)
##   id    pokemon species_id height weight base_experience type_1 type_2 attack
## 1  1  bulbasaur          1      7     69              64  grass poison     49
## 2  2    ivysaur          2     10    130             142  grass poison     62
## 3  3   venusaur          3     20   1000             236  grass poison     82
## 4  4 charmander          4      6     85              62   fire   <NA>     52
## 5  5 charmeleon          5     11    190             142   fire   <NA>     64
## 6  6  charizard          6     17    905             240   fire flying     84
##   defense hp special_attack special_defense speed color_1 color_2 color_f
## 1      49 45             65              65    45 #78C850 #A040A0 #81A763
## 2      63 60             80              80    60 #78C850 #A040A0 #81A763
## 3      83 80            100             100    80 #78C850 #A040A0 #81A763
## 4      43 39             60              50    65 #F08030    <NA> #F08030
## 5      58 58             80              65    80 #F08030    <NA> #F08030
## 6      78 78            109              85   100 #F08030 #A890F0 #DE835E
##   egg_group_1 egg_group_2 url_image         x        y
## 1     monster       plant     1.png  32.82239 17.21614
## 2     monster       plant     2.png  33.32643 16.71226
## 3     monster       plant     3.png  33.93778 16.17232
## 4     monster      dragon     4.png -24.36338 30.78973
## 5     monster      dragon     5.png -24.57820 30.60161
## 6     monster      dragon     6.png -25.50657 29.77037

Uma vez analisada as nossas variáveis, a proposta do exercício é montar um gráfico de Histograma para analizar um dado quantitativo.

Sendo assim, vamos analizar primeiramente os números da nossa base, através da função “Summary”.

summary(df)
##        id          pokemon            species_id        height      
##  Min.   :  1.0   Length:718         Min.   :  1.0   Min.   :  1.00  
##  1st Qu.:180.2   Class :character   1st Qu.:180.2   1st Qu.:  6.00  
##  Median :359.5   Mode  :character   Median :359.5   Median : 10.00  
##  Mean   :359.5                      Mean   :359.5   Mean   : 11.41  
##  3rd Qu.:538.8                      3rd Qu.:538.8   3rd Qu.: 14.00  
##  Max.   :718.0                      Max.   :718.0   Max.   :145.00  
##      weight       base_experience     type_1             type_2         
##  Min.   :   1.0   Min.   : 36.00   Length:718         Length:718        
##  1st Qu.:  95.0   1st Qu.: 65.25   Class :character   Class :character  
##  Median : 280.0   Median :147.00   Mode  :character   Mode  :character  
##  Mean   : 568.2   Mean   :141.55                                        
##  3rd Qu.: 609.5   3rd Qu.:177.00                                        
##  Max.   :9500.0   Max.   :608.00                                        
##      attack          defense             hp         special_attack  
##  Min.   :  5.00   Min.   :  5.00   Min.   :  1.00   Min.   : 10.00  
##  1st Qu.: 53.00   1st Qu.: 50.00   1st Qu.: 50.00   1st Qu.: 45.00  
##  Median : 73.00   Median : 65.00   Median : 65.00   Median : 65.00  
##  Mean   : 74.85   Mean   : 70.67   Mean   : 68.37   Mean   : 68.47  
##  3rd Qu.: 95.00   3rd Qu.: 85.00   3rd Qu.: 80.00   3rd Qu.: 90.00  
##  Max.   :165.00   Max.   :230.00   Max.   :255.00   Max.   :154.00  
##  special_defense      speed          color_1            color_2         
##  Min.   : 20.00   Min.   :  5.00   Length:718         Length:718        
##  1st Qu.: 50.00   1st Qu.: 45.00   Class :character   Class :character  
##  Median : 65.00   Median : 65.00   Mode  :character   Mode  :character  
##  Mean   : 69.09   Mean   : 65.72                                        
##  3rd Qu.: 85.00   3rd Qu.: 85.00                                        
##  Max.   :230.00   Max.   :160.00                                        
##    color_f          egg_group_1        egg_group_2         url_image        
##  Length:718         Length:718         Length:718         Length:718        
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##        x                 y          
##  Min.   :-49.152   Min.   :-45.793  
##  1st Qu.:-17.695   1st Qu.:-17.293  
##  Median :  0.705   Median : -0.628  
##  Mean   :  0.000   Mean   :  0.000  
##  3rd Qu.: 15.905   3rd Qu.: 18.155  
##  Max.   : 53.142   Max.   : 46.593

Histograma

A primeira variável escolhida foi Ataque:

hist(df$attack, col = c("#f78c28"),
     main = "Histograma de Ataque",
     xlab = "Ataque", ylab = "Frequência")

Ao analisarmos a variável ataque, identificamos um corportamento levemente simétrico similar a curva normal onde o gráfico apresenta uma frequência mais alta concentrada no centro e vai diminuindo com aproximação das bordas a direita e para esquerda. Podemos dizer que a variável ataque demonstra um processo estável e padronizado.A curva nos mostra que os pokemons possuem frequentemente ataques com potencial maior que 50 e menor que 100.

Ao compararmos a variável ataque com a variável Base Experience, pecebemos a mudança no gráfico:

hist(df$base_experience, col = c("#f78c28"),
     main = "Histograma de Base de Experiência",
     xlab = "Base Experience", ylab = "Frequência")

ao escolhermos a variável Base Experience, o gráfico demosntra o comportamento de dois picos. Que como podemos perceber é caracterizado por ter duas frequências mais elevadas do que as demais.

Isso ocorre pois na nossa base temos mais de 700 espécies de Pokemons e eles possuem grande diversidade de experiencias. Para essa variável o gráfico de histograma náo apresenta um bom resultado de análise.

#Conclusão

Esse tipo de gráfico deve ser usado em analises quantitativas onde o objetivo é observar a frequência de ocorrência de uma determinada variável.