Atividade 5

Cruzamento de uma variável qualitativa e uma variável quantitativa

Load

load("C:/Users/Igor/Desktop/Base_de_dados-master/df_pokemon.RData")

Escolha das variáveis

Aqui escolho as variáveis para testar as médias, onde considero o ataque do pokemon e o tipo deles.

summary(df$attack)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    5.00   53.00   73.00   74.85   95.00  165.00
summary(df$type_1)
##    Length     Class      Mode 
##       718 character character

Desvio-padrão

var(df$attack)
## [1] 837.3524
sd(df$attack)
## [1] 28.93704
mean(df$attack)
## [1] 74.85376

Quantitativa x Qualitativa

library(reactable)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(flextable)



df %>% select(attack, type_1) %>%
  group_by (type_1) %>% 
  summarise(media= round(mean(attack),2),
            Desvio_Padrao=round(sd(attack),2)) %>% reactable()

Aqui vemos o cruzamento dos dados quantitativos e qualitativos. Podemos notar que o maior desvio-padrão, ou seja, o conjunto que apresenta menos uniformidade, é o dos pokemons do tipo “flying”, onde o desvio-padrão é de 42.52, e o menor desvio-padrão é observado no conjunto poison, com 19.63 de desvio. Na média, a maior fica para o conjunto “dragon”, enquanto a menor é observada no grupo “psychic” (jurava que seria bugs!).

Boxplot

boxplot(attack~type_1, data = df,
        col=c("white", "blue"),
        main= "BOXTPLOT - ATAQUE X TIPO DE POKEMON")

Conclusao e Resultados

Podemos observar de cara a presença de outliers nos conjuntos fairy, poison, rock e water.

Além disso, há grande assimetria ao analisar e comparar os terceiro quartil e as máximas dos retângulos.

Ademais, a distribuição não é simétrica na maioria dos casos, fato observado pela posição da linha da mediana não presente no meio/centro do retângulo.