Introdução

Vamos fazer um resumo (média, mediana, desvio-padrão) de uma variável quantitativa por grupos de uma variável qualitativa.

Carregando a base de dados

load("~/aula_estatistica/Base_de_dados-master/df_pokemon.RData")

Pacotes adicionais

library(readxl)
library(flextable)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

Mostrar tabela

head(df) %>% flextable() %>% theme_tron()

id

pokemon

species_id

height

weight

base_experience

type_1

type_2

attack

defense

hp

special_attack

special_defense

speed

color_1

color_2

color_f

egg_group_1

egg_group_2

url_image

x

y

1

bulbasaur

1

7

69

64

grass

poison

49

49

45

65

65

45

#78C850

#A040A0

#81A763

monster

plant

1.png

32.82239

17.21614

2

ivysaur

2

10

130

142

grass

poison

62

63

60

80

80

60

#78C850

#A040A0

#81A763

monster

plant

2.png

33.32643

16.71226

3

venusaur

3

20

1,000

236

grass

poison

82

83

80

100

100

80

#78C850

#A040A0

#81A763

monster

plant

3.png

33.93778

16.17232

4

charmander

4

6

85

62

fire

52

43

39

60

50

65

#F08030

#F08030

monster

dragon

4.png

-24.36338

30.78973

5

charmeleon

5

11

190

142

fire

64

58

58

80

65

80

#F08030

#F08030

monster

dragon

5.png

-24.57820

30.60161

6

charizard

6

17

905

240

fire

flying

84

78

78

109

85

100

#F08030

#A890F0

#DE835E

monster

dragon

6.png

-25.50657

29.77037

Média, Mediana, Desvio Padrão

df %>% select(egg_group_1,speed) %>% 
  group_by(egg_group_1) %>% 
  summarise(média=mean(speed),
            mediana=median(speed),
            desvio_padrão=sd(speed)) %>% flextable()

egg_group_1

média

mediana

desvio_padrão

bug

61.21212

60.0

32.74071

ditto

48.00000

48.0

dragon

63.77778

58.0

23.46155

fairy

62.78125

57.5

25.62601

flying

81.30435

80.0

23.65011

ground

72.98802

70.0

24.36321

humanshape

67.18919

65.0

25.61883

indeterminate

54.60976

50.0

24.75164

mineral

52.73913

47.5

26.18943

monster

54.98667

50.0

21.89934

no-eggs

81.64286

90.0

32.01586

plant

43.40000

40.0

17.83255

water1

60.31081

60.0

22.23469

water2

76.20000

68.0

14.04177

water3

64.92857

69.0

24.97218

Boxplot

boxplot(df$speed ~ df$egg_group_1,
        col=c("yellow","red"), 
        main="Boxplot: Grupo_de_Ovos_1 x Velocidade",
        ylab = "Velocidade",
        xlab = "Grupo_de_Ovos_1")

Conclusão

A base de dados analisada possui 718 linhas e 22 colunas, para realizar esse relatória foi escolhida a variável qualitativa “Grupo_de_Ovos_1” e a variável quantitativa “Velocidade”.

Analisando os gráficos gerados á partir das variáveis escolhidas, pode-se avaliar que …