load("/Users/carol/Desktop/Materia de estatistica/Base_de_dados-master/df_pokemon.RData")
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
Pokemons mais leves são mais velozes.
par(bg='#f5f4c1')
plot(df$weight,df$speed,pch=17, col='orange',
main='Diagrama de dispersão',
xlab='Peso',
ylab='Velocidade')
abline(lsfit(df$weight,df$speed), col='blue')
cor(df$weight,df$speed)
## [1] 0.1081207
names(df)
## [1] "id" "pokemon" "species_id" "height"
## [5] "weight" "base_experience" "type_1" "type_2"
## [9] "attack" "defense" "hp" "special_attack"
## [13] "special_defense" "speed" "color_1" "color_2"
## [17] "color_f" "egg_group_1" "egg_group_2" "url_image"
## [21] "x" "y"
df_quanti <- df %>% select(weight,speed)
df_quanti <- na.omit(df_quanti)
cor(df_quanti)
## weight speed
## weight 1.0000000 0.1081207
## speed 0.1081207 1.0000000
library(corrplot)
## corrplot 0.84 loaded
Mcorr <- cor(df_quanti)
corrplot(Mcorr, method = 'number')
Com base na análise do diagrama de dispersão, percebe-se que há uma relação linear positiva entre as duas variáveis, visto que a linha de tendência está subindo; pode-se notar também a existência de alguns outliers. Já em relação a correlação, nota-se que existe uma correlação linear fraca entre as duas variáveis. Desta maneira, a interferência do peso correlacionado a velocidade não é muito significativa, não podendo afirmar que os mais leves são mais velozes. Percebe-se que é uma matriz simétrica e com 0.11 de correlação entre as quantitativas peso e velocidade.