Inicialmente será carregado a base de dados denominada df, referente aos dados das variáveis que serão correlacionadas e analisadas futuramente.
load("C:/Users/ferre/Desktop/Base_de_dados-master/df_pokemon.RData")
Em seguida, foi carregado o pacote de dados dplyr para manipular os dados obtidos.
library(dplyr)
Attaching package: 'dplyr'
The following objects are masked from 'package:stats':
filter, lag
The following objects are masked from 'package:base':
intersect, setdiff, setequal, union
Estabeleceu-se um resumo das variáveis que serão tratadas e as mesmas foram alocadas em um grupo chamado ‘resumo’ para que as médias e desvios padrões referentes as variáveis analisadas pudessem ser chamadas em seguida.
DT::datatable(resumo <-df %>% summarise(media_velocidade=mean(speed),
media_altura=mean(height),
media_peso=mean(weight),
ataque_medio=mean(attack),
defesa_media=mean(defense),
dp_altura=sd(height),
dp_peso=sd(weight),
dp_velocidade=sd(speed),
dp_ataque=sd(attack),
dp_defesa=sd(defense)))
par(bg="#f7ed92")
plot(df$speed,df$height, pch=20, col="red", main = "Diagrama de dispersão Altura x Velocidade",
xlab="Altura (Decimetros)",ylab = "Velocidade (Km/h)")
abline(lsfit(df$speed,df$height), col='blue', lwd=3)
cor(df$speed,df$height)
[1] 0.2249439
Depois de definida uma cor para o plano de fundo, foram feitas as seguintes análises do gráfico:
Verifica-se que a velocidade não tende a aumentar de forma exponencial. A altura e a velocidade possuem uma associação frágil, quase horizontal.
Há um concentração muito forte de pokemons com altura até 100 decimetros (10 metros) com uma grande variação de velocidade.
O gráfico, a priori, apresenta 3 outliers, sendo o mais discrepante o pokemon wailord, que possui altura acima de 140 decimetros(14 metros) e velocidade um pouco superior a 50(km/h).
A correlação obtida pelo comando ‘cor’ demonstra um valor aproximado de 0,225, ou seja, a linha de tendência indica um leve crescimento positivo, porém fraco ou inexistênte.
Logo, de acordo com os dados, torna-se mais vantajoso possuir um pokemon relativamente pequeno ou mediano, mas com velocidade de movimento alto.Ademais a velocidade de deslocamento do pokemon sofre pouca ou nenhuma infuência pelo seu tamanho.
Um bom exemplo seria o pokemon Serperior, que possui tamanho médio de 33 decimetros (3,3 metros) e velocidade por volta de 113 Km/h.
par(bg="#f7ed92")
plot(df$weight,df$speed, pch=20, col="blue", main = "Diagrama de dispersão Peso x Velocidade",
xlab="Peso (Decigramas)",ylab = "Velocidade (Km/h)")
abline(lsfit(df$weight,df$speed), col='darkred', lwd=3)
cor(df$weight,df$speed)
[1] 0.1081207
Nota-se que, assim como no gráfico anteior, o peso do pokemon tem uma variabilidade pouco influênte em sua velocidade, ainda que o primeiro possua uma grande variação.
Podemos estabelecer esse comparativo com os pokemons groudon, que possui velocidade e peso equivalentes a 90 e 9500, respectivamente (90Km/h e 950Kg); e o pokemon flabebe que possui velocidade e peso equivalentes a 5 e 205 (50Km/h e 20,5Kg)
Nesse caso existe uma associação quase horizontal, declarando que o peso do pokemon tem pouca ou nenhuma influência em sua velocidade.
A correlação obtida pelo comando cor demonstra um valor de de 0,108, ou seja, a linha de tendência está muito próxima do zero, logo indica um leve crescimento positivo, porém fraco ou inexistênte.
par(bg="#f7ed92")
plot(df$attack,df$defense, pch=20, col='red', main="Diagrama de dispersão Ataque x Defesa",
xlab='Ataque', ylab='Defesa')
abline(lsfit(df$attack,df$defense), col='blue', lwd=3)
cor(df$attack,df$defense)
[1] 0.4317745
Percebe-se que a dispersão do gráfico atende um padrão de crescimento leve, determinando-o como um gráfico de correlação positivo fraco.
Ao observar a congruência entre ambas as variáveis, pode-se afirmar que ainda que seja um crescimento leve, quanto maior a força de ataque do pokemon, mais equivalente tende ser o seu poder de defesa.
O gráfico possui um outlier referente ao pokemon shuckle, que embora possua força de ataque bem baixa, possui uma defesa por volta de 230 pontos.
A correlaçõ obtida pelo comando ‘cor’ demonstra um valor de 0,431 , ou seja, a linha de tendência indica um leve crescimento positivo, porém mediano/fraco.
par(bg="#f7ed92")
plot(df$attack,df$height, pch=20, col='blue', main="Diagrama de dispersão Ataque x Altura",
xlab='Ataque', ylab='Altura')
abline(lsfit(df$attack,df$height), col='darkred', lwd=3)
cor(df$attack,df$height)
[1] 0.4088367
Inicialmente. nota-se no gráfico que sua dispesão atende um padrão de crescimento fraco ou moderado, determinando-o como um gráfico de correlação positivo fraco ou médio.
Existem 3 outliers referentes à pokemons com alturas fora da curva, um exemplo seria o wailord, medindo cerca de 145 decimetros (14,5 métros).
Ao observar a congruência entre ambas as variáveis, pode-se afirmar que ainda que exista uma grande concentração de pokemons com a mesma altura, quanto maior o pokemon maior tende a ser sua força de ataque, ainda que seja pequena.
A variância obtida demonstra um valor de 0,408 , ou seja, a linha de tendência indica um leve crescimento positivo, porém fraco.
Depois de carregada a função corrplot, definiu-se novamente uma tabela de correlação dos valores entre as variáveis.
library(corrplot)
Warning: package 'corrplot' was built under R version 4.0.5
corrplot 0.84 loaded
df_quanti <- df %>% select("speed", "height","weight", "attack" , "defense")
DT::datatable(cor(df_quanti))
Finalmente, a partir dos dados obtidos, foi elaborado uma Matriz de Correlação.
MCorr <- cor(df_quanti)
corrplot(MCorr,addCoef.col=TRUE,number.cex=0.7, bg="#ffe08c")