Primeiros passos

Devemos, em primeiro lugar, importar a base de dados e carregar as bibliotecas necessárias para o funcionamento das funções utilizadas.

load("C:\\Users\\Lenovo\\Base_de_dados-master\\df_pokemon.RData")

library(dplyr)
library(flextable)

Análise de dados

Tabela 1

A tabela a seguir é um resumo dos valores da variável attack, que mostra o nível de ataque de cada tipo de pokemon.

df %>% select(type_1,attack) %>%
  group_by(type_1) %>% summarise(média=mean(attack),
                                 desvio_padrão= sd(attack), mediana=median(attack), mínimo=min(attack), máximo=max(attack), variancia=var(attack)) %>%
  flextable() %>% theme_zebra()

type_1

média

desvio_padrão

mediana

mínimo

máximo

variancia

bug

65.22222

30.74161

63.0

10

135

945.0466

dark

86.25000

24.33657

86.5

50

131

592.2685

dragon

102.62500

29.64253

97.5

50

150

878.6793

electric

67.77778

25.15223

61.5

30

123

632.6349

fairy

61.52941

29.75130

52.0

20

131

885.1397

fighting

94.72000

27.66394

100.0

35

140

765.2933

fire

81.60870

25.29776

82.5

40

140

639.9768

flying

71.66667

42.52450

70.0

30

115

1,808.3333

ghost

66.65217

25.28674

65.0

30

115

639.4190

grass

70.90909

24.07790

68.0

27

130

579.7455

ground

91.30000

28.62498

83.5

40

150

819.3897

ice

70.69565

25.93600

65.0

30

130

672.6759

normal

71.73118

29.30096

70.0

5

160

858.5465

poison

74.67857

19.63001

74.0

43

106

385.3373

psychic

60.21739

30.76933

52.5

20

150

946.7517

rock

88.17500

32.57566

86.5

40

165

1,061.1737

steel

83.54545

24.60687

82.5

24

135

605.4978

water

71.04762

25.03013

70.0

10

130

626.5073

Tabela 2

A segunda tabela exibe os valores referentes a defesa de cada tipo de pokemon.

df %>% select(type_1,defense) %>%
  group_by(type_1) %>% summarise(média=mean(defense),
                                   desvio_padrão= sd(defense), mediana=median(defense), mínimo=min(defense), máximo=max(defense), variancia=var(defense)) %>%
  flextable() %>% theme_zebra()

type_1

média

desvio_padrão

mediana

mínimo

máximo

variancia

bug

67.69841

32.22333

55.0

30

230

1,038.3431

dark

67.92857

23.79687

67.5

30

115

566.2910

dragon

79.12500

22.61841

85.0

35

121

511.5924

electric

59.08333

20.35313

58.5

15

115

414.2500

fairy

65.70588

18.97948

66.0

28

95

360.2206

fighting

64.28000

18.32012

62.0

30

95

335.6267

fire

63.69565

21.34673

59.0

37

140

455.6831

flying

61.66667

23.62908

70.0

35

80

558.3333

ghost

76.82609

34.80028

65.0

30

145

1,211.0593

grass

69.36364

23.95549

65.0

30

131

573.8657

ground

82.16667

31.89323

82.0

25

140

1,017.1782

ice

71.04348

35.11084

70.0

15

184

1,232.7708

normal

57.79570

22.34928

60.0

5

120

499.4904

poison

68.82143

21.06613

67.0

35

120

443.7817

psychic

65.15217

26.43732

62.5

15

130

698.9319

rock

98.50000

36.42132

98.5

40

200

1,326.5128

steel

119.40909

33.28185

115.5

70

200

1,107.6818

water

70.48571

25.57986

68.0

20

180

654.3291

Conclusões

Por meio da análise da tabela de ataque, podemos notar que os valores de ataque estão consideravelmente dispersos, isto é, há grande diferença entre os valores mínimos e máximos da variável defense. Os pokemons do tipo rock possuem o maior valor máximo da tabela, exibindo uma mediana de apenas 86, valor baixo se comparado ao valor 100 da mediana do tipo fighthing. O tipo dragon tem uma média de 102, mas um mínimo de 50. Estes exemplos demonstram o grande intervalo entre os valores, ou seja, possuem um alto desvio padrão, assim como alta variância, valor que indica a distância entre os valores encontrados e o valor médio esperado.

Os valores apresentados indicam que não há significativa associação entre o tipo do pokemon e o seu nível de ataque, já que a alta dispersão de dados não demonstra tendências consistentes entre as diferentes categorias.

A tabela de defesa segue a mesma tendência da anterior, demonstrando valores altos em todas as medidas de dispersão aplicadas. Por isso, podemos concluir que há baixa ou nenhuma associação entre as variáveis tipo e defesa.