Carregando base de dados

load("/Users/carol/Desktop/Materia de estatistica/Base_de_dados-master/df_pokemon.RData")

Carregando biblioteca dplyr

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

Hipótese

Pokemons mais leves são mais velozes.

Diagrama de dispersão

par(bg='#f5f4c1') 
plot(df$weight,df$speed,pch=17, col='orange',
     main='Diagrama de dispersão',
     xlab='Peso',
     ylab='Velocidade')
abline(lsfit(df$weight,df$speed), col='blue')

Matriz de correlação

cor(df$weight,df$speed)
## [1] 0.1081207
names(df)
##  [1] "id"              "pokemon"         "species_id"      "height"         
##  [5] "weight"          "base_experience" "type_1"          "type_2"         
##  [9] "attack"          "defense"         "hp"              "special_attack" 
## [13] "special_defense" "speed"           "color_1"         "color_2"        
## [17] "color_f"         "egg_group_1"     "egg_group_2"     "url_image"      
## [21] "x"               "y"
df_quanti <- df %>% select(weight,speed)
df_quanti <- na.omit(df_quanti)
cor(df_quanti)
##           weight     speed
## weight 1.0000000 0.1081207
## speed  0.1081207 1.0000000
library(corrplot)
## corrplot 0.84 loaded
Mcorr <- cor(df_quanti)
corrplot(Mcorr, method = 'number')

Conclusão

Com base na análise do diagrama de dispersão, percebe-se que há uma relação linear positiva entre as duas variáveis, visto que a linha de tendência está subindo; pode-se notar também a existência de alguns outliers. Já em relação a correlação, nota-se que existe uma correlação linear fraca entre as duas variáveis. Desta maneira, a interferência do peso correlacionado a velocidade não é muito significativa, não podendo afirmar que os mais leves são mais velozes. Percebe-se que é uma matriz simétrica e com 0.11 de correlação entre as quantitativas peso e velocidade.