Base de dados:

load("C:/Users/natps/Documents/bases_curso_estatistica/Base_de_dados-master/df_pokemon.RData")

Bibliotecas:

library(readxl)
library(flextable)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

Visualizando a base de dados:

str(df)
## tibble [718 x 22] (S3: tbl_df/tbl/data.frame)
##  $ id             : num [1:718] 1 2 3 4 5 6 7 8 9 10 ...
##  $ pokemon        : chr [1:718] "bulbasaur" "ivysaur" "venusaur" "charmander" ...
##  $ species_id     : int [1:718] 1 2 3 4 5 6 7 8 9 10 ...
##  $ height         : int [1:718] 7 10 20 6 11 17 5 10 16 3 ...
##  $ weight         : int [1:718] 69 130 1000 85 190 905 90 225 855 29 ...
##  $ base_experience: int [1:718] 64 142 236 62 142 240 63 142 239 39 ...
##  $ type_1         : chr [1:718] "grass" "grass" "grass" "fire" ...
##  $ type_2         : chr [1:718] "poison" "poison" "poison" NA ...
##  $ attack         : int [1:718] 49 62 82 52 64 84 48 63 83 30 ...
##  $ defense        : int [1:718] 49 63 83 43 58 78 65 80 100 35 ...
##  $ hp             : int [1:718] 45 60 80 39 58 78 44 59 79 45 ...
##  $ special_attack : int [1:718] 65 80 100 60 80 109 50 65 85 20 ...
##  $ special_defense: int [1:718] 65 80 100 50 65 85 64 80 105 20 ...
##  $ speed          : int [1:718] 45 60 80 65 80 100 43 58 78 45 ...
##  $ color_1        : chr [1:718] "#78C850" "#78C850" "#78C850" "#F08030" ...
##  $ color_2        : chr [1:718] "#A040A0" "#A040A0" "#A040A0" NA ...
##  $ color_f        : chr [1:718] "#81A763" "#81A763" "#81A763" "#F08030" ...
##  $ egg_group_1    : chr [1:718] "monster" "monster" "monster" "monster" ...
##  $ egg_group_2    : chr [1:718] "plant" "plant" "plant" "dragon" ...
##  $ url_image      : chr [1:718] "1.png" "2.png" "3.png" "4.png" ...
##  $ x              : num [1:718] 32.8 33.3 33.9 -24.4 -24.6 ...
##  $ y              : num [1:718] 17.2 16.7 16.2 30.8 30.6 ...

Resumo das duas variáveis analisadas:

Resumo de altura

summary(df$height)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    1.00    6.00   10.00   11.41   14.00  145.00

Resumo do tipo 1 de Pokemón

summary(df$type_1)
##    Length     Class      Mode 
##       718 character character

Resumo da média, mediana, desvio-padrão, mínimo e máximo de uma variável quantitativa por grupos de uma variável qualitativa:

df %>% select(height,type_1) %>% group_by(type_1) %>% summarise(Média=mean(height),Mediana=median(height),Desvio_padrão=sd(height),Mínimo=min(height),Máximo=max(height)) %>% flextable() %>% theme_vanilla()

Gráfico boxplot:

boxplot(df$height ~ df$type_1,col=c("tomato","pink"),main="Boxplot comparativo: Altura x Tipo de Pokémon",ylab = "Altura",xlab = "Tipos de Pokémon")

As análises dos dados das tabelas e do gráfico foram retirados da base de dados chamada “df_pokemon”, distribuídas em 22 colunas, contendo 718 informações no total.

Como resultado das análises, podemos ver que os pokémons do tipo “dragon” possuem uma maior variabilidade de altura do que os demais tipos, apresentando uma média de 20,37, mediana de 17,0 e desvio-padrão de 15,46. Ao passo que os do tipo “fairy” possuem uma menor variabilidade de altura, possuindo média de 8,35, mediana de 6,0, e desvio-padrão de 7,08.

No gráfico boxplot, as amostras possuem outliers, ou seja, eles são atípicos, seus valores são discrepantes, principalmente, nos pokémons do tipo “water”. Os dados também são simétricos e assimétricos, dado que alguns boxplots possuem a mediana no centro da caixa e outros mais próximos da base (assimétricos positivos) ou mais próximos do topo (assimétricos negativos).