#MANIPULAÇÃO DAS DIMENSÕES DO GRÁFICO#
knitr::opts_chunk$set(fig.width=14, fig.height=8)
#CARREGAMENTO DO BANCO DE DADOS DE ENTENSÃO .RDATA#
load("C:/Users/Esdras/Desktop/Mestrado/Estatística Aplicada a Engenharia/Base_de_dados-master/df_pokemon.RData")
pok<-df
#CONSTRUÇÃO DO GRÁFICO BOXPLOT#
boxplot(pok$defense~pok$type_1, pch=19, xlab="Tipo de Pokémon", ylab="Defesa",
main="Gráfico: Defesa x Tipo de Pokémon",
col=c("#A6B91A","#705746","#6F35FC","#F7D02C",
"#D685AD","#C22E28","#EE8130","#A98FF3",
"#735797","#7AC74C","#E2BF65","#96D9D6",
"#A8A77A","#A33EA1","#F95587","#B6A136",
"#B7B7CE","#6390F0"), cex.lab=1.5, cex.main=2.5
#COMANDOS BOXPLOT#
# boxplot(pok$defense~pok$type_1): Constrói gráfico boxplot através da correlação entre as variáveis "defense" e "type_1";#
# pch=19: Altera o modelo dos pontos do gráfico para o tipo círculo com interior preenchido;#
# xlab="...": Nomeia o eixo x do gráfico;#
# ylab="...": Nomeia o eixo y do gráfico;#
# main="...": Nomeia o título do gráfico;#
# col=c("x","y",...): Altera a cor de cada boxplot na sequência da esquerda para a direita.#
# cex.lab=x: Aumenta o tamanho do título dos eixos do gráfico;#
# cex.main=y: Aumenta o tamanho do título do gráfico.#
)
#ACENDE AS GRID-LINES#
(grid(nx = NA, ny = NULL, col = "lightgray", lty = 5)
#COMANDOS GRID-LINES#
# nx: número de linhas a ser inseridas no eixo x (NA=0,NULL=Marcações do eixo x ou inserir quantidade desejada: 1,2,...);#
# ny: número de linhas a ser inseridas no eixo y (NA=0,NULL=Marcações do eixo y ou inserir quantidade desejada: 1,2,...);#
# col="...": define a cor da linha grid;#
# lty=x: modelo de linha grid.#
)
## NULL
#CARREGAMENTO DA BIBLIOTECA "RcmdrMisc" PARA APLICAÇÃO DA FUNÇÃO "numSummary"#
library(RcmdrMisc)
## Loading required package: car
## Loading required package: carData
## Loading required package: sandwich
#CHAMADA DE RESUMO NUMÉRICO DA BASE DE DADOS EM ESTUDO#
numSummary(pok[,"defense"], groups=pok$type_1,
statistics=c("mean", "sd", "quantiles"),
quantiles=c(0,.25,.5,.75,1))
## mean sd 0% 25% 50% 75% 100% defense:n
## bug 67.69841 32.22333 30 47.50 55.0 85.00 230 63
## dark 67.92857 23.79687 30 50.00 67.5 88.50 115 28
## dragon 79.12500 22.61841 35 63.75 85.0 91.25 121 24
## electric 59.08333 20.35313 15 40.00 58.5 70.00 115 36
## fairy 65.70588 18.97948 28 50.00 66.0 75.00 95 17
## fighting 64.28000 18.32012 30 53.00 62.0 78.00 95 25
## fire 63.69565 21.34673 37 45.75 59.0 71.75 140 46
## flying 61.66667 23.62908 35 52.50 70.0 75.00 80 3
## ghost 76.82609 34.80028 30 51.50 65.0 99.00 145 23
## grass 69.36364 23.95549 30 50.00 65.0 83.00 131 66
## ground 82.16667 31.89323 25 51.25 82.0 108.75 140 30
## ice 71.04348 35.11084 15 47.50 70.0 85.00 184 23
## normal 57.79570 22.34928 5 43.00 60.0 70.00 120 93
## poison 68.82143 21.06613 35 52.75 67.0 82.25 120 28
## psychic 65.15217 26.43732 15 45.75 62.5 75.75 130 46
## rock 98.50000 36.42132 40 69.25 98.5 118.25 200 40
## steel 119.40909 33.28185 70 96.25 115.5 140.00 200 22
## water 70.48571 25.57986 20 52.00 68.0 85.00 180 105
Do gráfico construído infere-se que cada tipo de pokémon é representado pela sua coloração, definida conforme estabelecido pelos seus desenvolvedores. O topo de cada retângulo ilustra o terceiro quartil da amostra de dados analisada, sua base aponta para o primeiro quartil da mesma e a linha grossa no interior dos retângulos representa a mediana dos valores de defesa de cada tipo de pokémon. As linhas horizontais localizadas em cima e em baixo de cada retângulo representam os valores de máximo e mínimo de cada valor de defesa para os diversos tipos de pokémon. Finalmente, os círculos pretos ilustram os outliers contidos nas amostras e as linhas trassejadas dos retângulos representam a variabilidade dos valores de defesa de cada amostra (tipo de pokémon).
Com base nessas informações conclui-se que, os pokémons do tipo “steel” são mais fortes em termos de defesa quando comparados aos outros, visto que a mediana dos seus valores de defesa (115, vide resumo numérico) encontra-se superior a todas as outras medianas. Além disso, vale ressaltar que o primeiro quartil do mesmo (96,25) é superior a mediana de praticamente todos os outros pokémons, perdendo somente para os pokémons do tipo “rock” (98,5).
#ATRIBUIÇÃO DE VALORES ÀS VARIÁVEIS "HP" E "Defense"#
x <- pok$hp
y <- pok$defense
#MUDANÇA DE COR DO PLANO DE FUNDO#
par(bg="#FEF3A1")
#CONSTRUÇÃO DO DIAGRAMA DE DISPERSÃO#
scatterplot(x, y, regLine=TRUE, smooth=FALSE, main="Diagrama de dispersão HP x Defesa",
boxplots='xy', xlab="HP", ylab="Defesa",
col=rgb(25, 71, 135,100,maxColorValue=255), pch=19,
cex=1.2, cex.lab=1.5, cex.main=2.5
#COMANDOS CONSTRUÇÃO DO DIAGRAMA#
# regLine=TRUE: traça uma linha dos quadrados mínimos#
# smooth=FALSE: remove as linhas smooth#
# col=rgb(x,y,z,w): define uma coloração em rgb, sendo x=red, y=green, z=blue e w=transparência#
# maxColorValue=255: valor máximo para coloração em rgb#
# cex=1.2: tamanho dos pontos marcados no gráfico#
)
#CARREGAMENTO BIBLIOTECA "corrplot" PARA CONSTRUÇÃO DA MATRIZ#
library(corrplot)
## corrplot 0.84 loaded
#CONSTRUÇÃO DA MATRIZ#
MC<-cor(df[,c("hp","defense","attack","special_attack",
"special_defense","speed")], use="complete")
corrplot(MC,addCoef.col=TRUE,number.cex=.9, tl.cex=1.2)
O diagrama de dispersão construído apresenta os valores de HP e defesa de cada pokémon representados por um círculo preenchido por uma coloração intensa ou esmaecida. Círculos com coloração mais intensa ilustram a sobreposição de valores de defesa/hp para mais de um pokémon (mais de um pokémon), enquanto que círculos mais esmaecidos representam outliers ou pokémons isolados. O diagrama tem mostra boxplots de cada variável com suas respectivas indicações de mediana e, primeiro e terceiro quartis. A linha crescente em diagonal indica que as variáveis possuem correlação e que a mesma é fraca devido a inclinação da reta resultante. Conclui-se então que, quanto maior o HP ou healthpower (vida) do pokémon, maior tende a ser sua defesa e que, a grande maioria dos pokémons possuem praticamente os mesmos valores de hp e defesa.
Já de posse da matriz de correlação das variáveis da amostra em estudo, verfica-se que o coeficiente de correlação entre as variáveis defesa e hp ilustradas no diagrama de dispersão anteriormente comentado, possui valor de 0,24, o que confirma a análise feita através do diagrama, onde concluiu-se que a correlação entre ambas era fraca. Também pode-se verificar o coeficiente de correlação entre outras variáveis, porém todas apresentam correlação fraca entre si (vide código de cores).