Carregamento da Base de Dados

 

Inicialmente será carregado a base de dados denominada df, referente aos dados das variáveis que serão correlacionadas e analisadas futuramente.

load("C:/Users/ferre/Desktop/Base_de_dados-master/df_pokemon.RData")

Em seguida, foi carregado o pacote de dados dplyr para manipular os dados obtidos.

library(dplyr)

Attaching package: 'dplyr'
The following objects are masked from 'package:stats':

    filter, lag
The following objects are masked from 'package:base':

    intersect, setdiff, setequal, union

Resumo das Variáveis

 

Estabeleceu-se um resumo das variáveis que serão tratadas e as mesmas foram alocadas em um grupo chamado ‘resumo’ para que as médias e desvios padrões referentes as variáveis analisadas pudessem ser chamadas em seguida.

DT::datatable(resumo <-df %>% summarise(media_velocidade=mean(speed),
                 media_altura=mean(height),
                 media_peso=mean(weight),
                 ataque_medio=mean(attack),
                 defesa_media=mean(defense),
                 dp_altura=sd(height),
                 dp_peso=sd(weight),
                 dp_velocidade=sd(speed),
                 dp_ataque=sd(attack),
                 dp_defesa=sd(defense)))

Gráfico 1.1 - Diagrama de Dispersão

A velocidade de deslocamento do pokemon sofre infuência pelo seu tamanho?

par(bg="#f7ed92")

plot(df$speed,df$height, pch=20, col="red", main = "Diagrama de dispersão Altura x Velocidade",
     xlab="Altura (Decimetros)",ylab = "Velocidade (Km/h)")

abline(lsfit(df$speed,df$height), col='blue', lwd=3)

cor(df$speed,df$height)
[1] 0.2249439

Depois de definida uma cor para o plano de fundo, foram feitas as seguintes análises do gráfico:

  • Verifica-se que a velocidade não tende a aumentar de forma exponencial. A altura e a velocidade possuem uma associação frágil, quase horizontal.

  • Há um concentração muito forte de pokemons com altura até 100 decimetros (10 metros) com uma grande variação de velocidade.

  • O gráfico, a priori, apresenta 3 outliers, sendo o mais discrepante o pokemon wailord, que possui altura acima de 140 decimetros(14 metros) e velocidade um pouco superior a 50(km/h).

  • A correlação obtida pelo comando ‘cor’ demonstra um valor aproximado de 0,225, ou seja, a linha de tendência indica um leve crescimento positivo, porém fraco ou inexistênte.

  • Logo, de acordo com os dados, torna-se mais vantajoso possuir um pokemon relativamente pequeno ou mediano, mas com velocidade de movimento alto.Ademais a velocidade de deslocamento do pokemon sofre pouca ou nenhuma infuência pelo seu tamanho.

  • Um bom exemplo seria o pokemon Serperior, que possui tamanho médio de 33 decimetros (3,3 metros) e velocidade por volta de 113 Km/h.

     

Gráfico 1.2 - Diagrama de Dispersão

Pokemons mais pesados são essencialmente mais lentos?

par(bg="#f7ed92")

plot(df$weight,df$speed, pch=20, col="blue", main = "Diagrama de dispersão Peso x Velocidade",
     xlab="Peso (Decigramas)",ylab = "Velocidade (Km/h)")

abline(lsfit(df$weight,df$speed), col='darkred', lwd=3)

cor(df$weight,df$speed)
[1] 0.1081207
  • Nota-se que, assim como no gráfico anteior, o peso do pokemon tem uma variabilidade pouco influênte em sua velocidade, ainda que o primeiro possua uma grande variação.

  • Podemos estabelecer esse comparativo com os pokemons groudon, que possui velocidade e peso equivalentes a 90 e 9500, respectivamente (90Km/h e 950Kg); e o pokemon flabebe que possui velocidade e peso equivalentes a 5 e 205 (50Km/h e 20,5Kg)

  • Nesse caso existe uma associação quase horizontal, declarando que o peso do pokemon tem pouca ou nenhuma influência em sua velocidade.

  • A correlação obtida pelo comando cor demonstra um valor de de 0,108, ou seja, a linha de tendência está muito próxima do zero, logo indica um leve crescimento positivo, porém fraco ou inexistênte.

     

Gráfico 1.3 - Diagrama de Dispersão

Pokemons com maior poder de ataque são mais vulneráveis em sua defesa?

par(bg="#f7ed92")

plot(df$attack,df$defense, pch=20, col='red', main="Diagrama de dispersão Ataque x Defesa",
     xlab='Ataque', ylab='Defesa')

abline(lsfit(df$attack,df$defense), col='blue', lwd=3)

cor(df$attack,df$defense)
[1] 0.4317745
  • Percebe-se que a dispersão do gráfico atende um padrão de crescimento leve, determinando-o como um gráfico de correlação positivo fraco.

  • Ao observar a congruência entre ambas as variáveis, pode-se afirmar que ainda que seja um crescimento leve, quanto maior a força de ataque do pokemon, mais equivalente tende ser o seu poder de defesa.

  • O gráfico possui um outlier referente ao pokemon shuckle, que embora possua força de ataque bem baixa, possui uma defesa por volta de 230 pontos.

  • A correlaçõ obtida pelo comando ‘cor’ demonstra um valor de 0,431 , ou seja, a linha de tendência indica um leve crescimento positivo, porém mediano/fraco.

     

Gráfico 1.4 - Diagrama de Dispersão

Pokemons com maior força de ataque tendem a ser os maiores?

par(bg="#f7ed92")

plot(df$attack,df$height, pch=20, col='blue', main="Diagrama de dispersão Ataque x Altura",
     xlab='Ataque', ylab='Altura')
abline(lsfit(df$attack,df$height), col='darkred', lwd=3)

cor(df$attack,df$height)
[1] 0.4088367
  • Inicialmente. nota-se no gráfico que sua dispesão atende um padrão de crescimento fraco ou moderado, determinando-o como um gráfico de correlação positivo fraco ou médio.

  • Existem 3 outliers referentes à pokemons com alturas fora da curva, um exemplo seria o wailord, medindo cerca de 145 decimetros (14,5 métros).

  • Ao observar a congruência entre ambas as variáveis, pode-se afirmar que ainda que exista uma grande concentração de pokemons com a mesma altura, quanto maior o pokemon maior tende a ser sua força de ataque, ainda que seja pequena.

  • A variância obtida demonstra um valor de 0,408 , ou seja, a linha de tendência indica um leve crescimento positivo, porém fraco.

     

Matriz de Correlação

Depois de carregada a função corrplot, definiu-se novamente uma tabela de correlação dos valores entre as variáveis.

library(corrplot)
Warning: package 'corrplot' was built under R version 4.0.5
corrplot 0.84 loaded
df_quanti <- df %>% select("speed", "height","weight", "attack" , "defense")
DT::datatable(cor(df_quanti))

Gráfico 2.1 - Matriz de Correlação

Finalmente, a partir dos dados obtidos, foi elaborado uma Matriz de Correlação.

MCorr <- cor(df_quanti)
corrplot(MCorr,addCoef.col=TRUE,number.cex=0.7, bg="#ffe08c")

  • Foi escolhida uma formatação partindo do intermédio entre valores numéricos e concentração de resultados.
  • Essa matriz pode ser classificada como triangular e simétrica.Sua diagonal será sempre equivalente a um, ou seja quando as mesmas variáveis são tratadas juntas, seu resultado é sempre 1.
  • Ambas as variáveis, defense e speed, quando correlacionadas, tendem a explicitar valores negativos bem próximos de zero.
  • Por fim, a correlação mais forte está entre as variáveis Height e Weight. De certa forma, quanto maior o pokemon, maior tende ser o seu peso.