Fazer uma publicação no RPUBS de um histograma e uma análise descritiva (summary) em uma variável quantitativa da base de dados chamada “df_pokemon.RData”.
OBS - Obrigatória a interpretação dos seus gráficos em pelo menos dois parágrafos.
Nosso primeiro passo consiste em abrir a base em formato R no programa. Para isso, localizamos o arquivo na pastae com botão direito do mouse selecionaos o abrir com RStudio.
Uma vez que a base apareça no nosso quadrante de Environment, é interessante que você a abra (clique duas vezes na linha que ela abrirá como uma nova guia no quadrante de produção do R) para que você analise as informações que a base trabalha.
load("C:/Users/loren/Downloads/Estatistica/Base_de_dados-master/df_pokemon.RData")
head(df)
## id pokemon species_id height weight base_experience type_1 type_2 attack
## 1 1 bulbasaur 1 7 69 64 grass poison 49
## 2 2 ivysaur 2 10 130 142 grass poison 62
## 3 3 venusaur 3 20 1000 236 grass poison 82
## 4 4 charmander 4 6 85 62 fire <NA> 52
## 5 5 charmeleon 5 11 190 142 fire <NA> 64
## 6 6 charizard 6 17 905 240 fire flying 84
## defense hp special_attack special_defense speed color_1 color_2 color_f
## 1 49 45 65 65 45 #78C850 #A040A0 #81A763
## 2 63 60 80 80 60 #78C850 #A040A0 #81A763
## 3 83 80 100 100 80 #78C850 #A040A0 #81A763
## 4 43 39 60 50 65 #F08030 <NA> #F08030
## 5 58 58 80 65 80 #F08030 <NA> #F08030
## 6 78 78 109 85 100 #F08030 #A890F0 #DE835E
## egg_group_1 egg_group_2 url_image x y
## 1 monster plant 1.png 32.82239 17.21614
## 2 monster plant 2.png 33.32643 16.71226
## 3 monster plant 3.png 33.93778 16.17232
## 4 monster dragon 4.png -24.36338 30.78973
## 5 monster dragon 5.png -24.57820 30.60161
## 6 monster dragon 6.png -25.50657 29.77037
Uma vez analisada as nossas variáveis, a proposta do exercício é montar um gráfico de Histograma para analizar um dado quantitativo.
Sendo assim, vamos analizar primeiramente os números da nossa base, através da função “Summary”.
summary(df)
## id pokemon species_id height
## Min. : 1.0 Length:718 Min. : 1.0 Min. : 1.00
## 1st Qu.:180.2 Class :character 1st Qu.:180.2 1st Qu.: 6.00
## Median :359.5 Mode :character Median :359.5 Median : 10.00
## Mean :359.5 Mean :359.5 Mean : 11.41
## 3rd Qu.:538.8 3rd Qu.:538.8 3rd Qu.: 14.00
## Max. :718.0 Max. :718.0 Max. :145.00
## weight base_experience type_1 type_2
## Min. : 1.0 Min. : 36.00 Length:718 Length:718
## 1st Qu.: 95.0 1st Qu.: 65.25 Class :character Class :character
## Median : 280.0 Median :147.00 Mode :character Mode :character
## Mean : 568.2 Mean :141.55
## 3rd Qu.: 609.5 3rd Qu.:177.00
## Max. :9500.0 Max. :608.00
## attack defense hp special_attack
## Min. : 5.00 Min. : 5.00 Min. : 1.00 Min. : 10.00
## 1st Qu.: 53.00 1st Qu.: 50.00 1st Qu.: 50.00 1st Qu.: 45.00
## Median : 73.00 Median : 65.00 Median : 65.00 Median : 65.00
## Mean : 74.85 Mean : 70.67 Mean : 68.37 Mean : 68.47
## 3rd Qu.: 95.00 3rd Qu.: 85.00 3rd Qu.: 80.00 3rd Qu.: 90.00
## Max. :165.00 Max. :230.00 Max. :255.00 Max. :154.00
## special_defense speed color_1 color_2
## Min. : 20.00 Min. : 5.00 Length:718 Length:718
## 1st Qu.: 50.00 1st Qu.: 45.00 Class :character Class :character
## Median : 65.00 Median : 65.00 Mode :character Mode :character
## Mean : 69.09 Mean : 65.72
## 3rd Qu.: 85.00 3rd Qu.: 85.00
## Max. :230.00 Max. :160.00
## color_f egg_group_1 egg_group_2 url_image
## Length:718 Length:718 Length:718 Length:718
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
## x y
## Min. :-49.152 Min. :-45.793
## 1st Qu.:-17.695 1st Qu.:-17.293
## Median : 0.705 Median : -0.628
## Mean : 0.000 Mean : 0.000
## 3rd Qu.: 15.905 3rd Qu.: 18.155
## Max. : 53.142 Max. : 46.593
A primeira variável escolhida foi Ataque:
hist(df$attack, col = c("#f78c28"),
main = "Histograma de Ataque",
xlab = "Ataque", ylab = "Frequência")
Ao analisarmos a variável ataque, identificamos um corportamento levemente simétrico similar a curva normal onde o gráfico apresenta uma frequência mais alta concentrada no centro e vai diminuindo com aproximação das bordas a direita e para esquerda. Podemos dizer que a variável ataque demonstra um processo estável e padronizado.A curva nos mostra que os pokemons possuem frequentemente ataques com potencial maior que 50 e menor que 100.
Ao compararmos a variável ataque com a variável Base Experience, pecebemos a mudança no gráfico:
hist(df$base_experience, col = c("#f78c28"),
main = "Histograma de Base de Experiência",
xlab = "Base Experience", ylab = "Frequência")
ao escolhermos a variável Base Experience, o gráfico demosntra o comportamento de dois picos. Que como podemos perceber é caracterizado por ter duas frequências mais elevadas do que as demais.
Isso ocorre pois na nossa base temos mais de 700 espécies de Pokemons e eles possuem grande diversidade de experiencias. Para essa variável o gráfico de histograma náo apresenta um bom resultado de análise.
#Conclusão
Esse tipo de gráfico deve ser usado em analises quantitativas onde o objetivo é observar a frequência de ocorrência de uma determinada variável.