Esse trabalho tem como objetivo, trabalhar com alguns conceitos de tabela, uso de duas variáveis qualitativas, uso de variância e desvio padrão. Com isso, mostrarei a base de dados df onde são mostradas algumas variáveis selecioandas como: defense, attack e type_1
load("C:/Users/Michel/Desktop/Felipe/Estatistica/Base de Dados/Base_de_dados-master/Base_de_dados-master/df_pokemon.RData")
View(df)
Realizei uma tabela onde existe relação entre valor de defesa e ataque(quantitativo) por grupos de Tipos de Pokemon(qualitativo). Existem 18 tipos de pokemon que estão listados na variável type_1 com: bug, dark, dragon, electric, fairy, fighting, fire, flying, ghost, grass, ground, ice, normal, poison, psychic, rock, steel e water
library(dplyr)
Attaching package: 'dplyr'
The following objects are masked from 'package:stats':
filter, lag
The following objects are masked from 'package:base':
intersect, setdiff, setequal, union
library(flextable)
ft <- df %>% select(type_1, defense, attack) %>% group_by(type_1) %>% summarise(Média_Def=mean(defense),
Desvio_DF=sd(defense),
Média_Attk=mean(attack),
Desvio_Attk=sd(attack),
Quantidade_Tipo_1=n()) %>%
data.frame() %>% flextable()
ft <- bg(ft, bg = "#DFFF00", part = "header")
ft <- bg(ft, bg = "#DFFF00", part = "body")
ft <- color(ft, color = "#301934", part = "all")
ft <- bold(ft, bold = TRUE, part = "all")
ft
type_1 | Média_Def | Desvio_DF | Média_Attk | Desvio_Attk | Quantidade_Tipo_1 |
bug | 67.69841 | 32.22333 | 65.22222 | 30.74161 | 63 |
dark | 67.92857 | 23.79687 | 86.25000 | 24.33657 | 28 |
dragon | 79.12500 | 22.61841 | 102.62500 | 29.64253 | 24 |
electric | 59.08333 | 20.35313 | 67.77778 | 25.15223 | 36 |
fairy | 65.70588 | 18.97948 | 61.52941 | 29.75130 | 17 |
fighting | 64.28000 | 18.32012 | 94.72000 | 27.66394 | 25 |
fire | 63.69565 | 21.34673 | 81.60870 | 25.29776 | 46 |
flying | 61.66667 | 23.62908 | 71.66667 | 42.52450 | 3 |
ghost | 76.82609 | 34.80028 | 66.65217 | 25.28674 | 23 |
grass | 69.36364 | 23.95549 | 70.90909 | 24.07790 | 66 |
ground | 82.16667 | 31.89323 | 91.30000 | 28.62498 | 30 |
ice | 71.04348 | 35.11084 | 70.69565 | 25.93600 | 23 |
normal | 57.79570 | 22.34928 | 71.73118 | 29.30096 | 93 |
poison | 68.82143 | 21.06613 | 74.67857 | 19.63001 | 28 |
psychic | 65.15217 | 26.43732 | 60.21739 | 30.76933 | 46 |
rock | 98.50000 | 36.42132 | 88.17500 | 32.57566 | 40 |
steel | 119.40909 | 33.28185 | 83.54545 | 24.60687 | 22 |
water | 70.48571 | 25.57986 | 71.04762 | 25.03013 | 105 |
Podemos perbercer pela tabela que temos alguns dados interessantes. 1º - O Tipo de Pokemons com maior quantidade de pokemons é o tipo water(com 105 pokemons); 2ª - O tipo de Pokemons com menor quantidade é o tipo flying(com 3 Pokemons); 3ª - O Tipo de Pokemon com a maior média de defesa é o tipo rock(com valor de 119.40909); 4ª - O tipo com a menor média de defesa é o tipo normal(com valor de 57.79570); 5º - O tipo de pokemon com o maior valor de desvio padrão de defesa é o tipo ice(com valor de 36.42132); 6º - O tipo de pokemon com o menor valor de desvio padrão de defesa é o tipo fighting(com valor de 18.32012); 7º - O Tipo de Pokemon com a maior média de ataque é o tipo dragon(com valor de 102.62500); 8º - O tipo com a menor média de ataque é o tipo psychic(com valor de 60.21739); 9º - O tipo de pokemon com o maior valor de desvio padrão de ataque é o tipo flying(com valor de 42.52450); 10º - O tipo de pokemon com o menor valor de desvio padrão de defesa é o tipo poison(com valor de 19.63001);
Aqui temos um Boxplot com os 18 respectivos tipos de Pokemons. Temos alguns fatos interessantes.
1º - O Nº de Tipos de Pokemons com Outliers presentes é de 7 Tipos e o Nº de outliers total é de 8 Pokemons 2º - O Nº de Boxplots com 3ºQuartil maior que o 1º é de 8 boxplots 3º - O Nº de Boxplots com 1ºQuartil maior que o 3º é de 9 boxplots 4º - O Nº de Boxplots com 1º e 3º Quartil próximos é de 1 boxplots 5º - Maior parte dos boxplots possuem intervalo com valores de 50-100, tendo alguns pouco estando na casa dos 100-120 6º - O Boxplot Fire, Grass, Water, Ground and Steel são os Boxplots com os valores mais equilibrados de 1º e 3º Quartil
library(RColorBrewer)
COL <- brewer.pal(9, "Paired")
COL
[1] "#A6CEE3" "#1F78B4" "#B2DF8A" "#33A02C" "#FB9A99" "#E31A1C" "#FDBF6F"
[8] "#FF7F00" "#CAB2D6"
par(bg="#301934")
par(col.lab="#DFFF00")
par(col.main= "#DFFF00")
par(col.axis= "#DFFF00")
par(cex.axis= 0.45)
par(cex.lab= 1.2)
boxplot(defense~type_1, data = df,
col=COL, main="Gráfico de defesa dos tipos de Pokemon",
xlab = "Tipos de Pokemon",
ylab = "Defesa",
outcol = "#DFFF00",
outpch= c(18)
)
Aqui temos um Boxplot com os 18 respectivos tipos de Pokemons. Temos alguns fatos interessantes.
1º - O Nº de Tipos de Pokemons com Outliers presentes é de 4 Tipos e o Nº de outliers total é de 6 Pokemons 2º - O Nº de Boxplots com 3ºQuartil maior que o 1º é de 10 boxplots 3º - O Nº de Boxplots com 1ºQuartil maior que o 3º é de 4 boxplots 4º - O Nº de Boxplots com 1º e 3º Quartil próximos é de 4 boxplots 5º - Maior parte dos boxplots possuem intervalo com valores de 60-90, tendo alguns pouco estando na casa dos 50 e um único na casa dos 100 6º - O Boxplot Fighting, Normal, Flying e Water são os Boxplots com os valores mais equilibrados de 1º e 3º Quartil
library(RColorBrewer)
COL <- brewer.pal(9, "Paired")
COL
[1] "#A6CEE3" "#1F78B4" "#B2DF8A" "#33A02C" "#FB9A99" "#E31A1C" "#FDBF6F"
[8] "#FF7F00" "#CAB2D6"
par(bg="#301934")
par(col.lab="#DFFF00")
par(col.main= "#DFFF00")
par(col.axis= "#DFFF00")
par(cex.axis= 0.45)
par(cex.lab= 1.2)
boxplot(attack~type_1, data = df,
col=COL, main="Gráfico de defesa dos tipos de Pokemon",
xlab = "Tipos de Pokemon",
ylab = "Defesa",
outcol = "#DFFF00",
outpch= c(18)
)
Se você pudesse escolher somente um pokemon de um tipo só, teremos que avaliar as variavéis analisadas. As médias de defesa mais alta vem do tipo steel e a média mais baixa vem do tipo normal, enquato que o desvio padrão mais alto vem do tipo rock e o desvio padrão de valor menor vem do tipo figthing. Olhando esse cenário o ideal para escolher um pokemon único avaliando por atributo defesa, seria pegar um pokemon do tipo dragon já que além dele possui um valor ainda alto, ele possui um desvio padrão mais equilibrado, o que permitiria escolher um pokemon com atributos fortes com maiores chances de nao variar muito o atributo no universo de amostra
Agora se fossemos avaliar por ataque, temos que o maior valor de média de ataque vem do tipo dragon, enquanto que o menos vem do tipo psychic, já os valores mais altos de desvio padrão vem do tipo flying enquando que o menor vem do tipo poison. Olhando esse cenário podemos pensar que o tipo mais adequado de escolher pelo atributo ataque seria o tipo steel