O diagrama de dispersão
Mostra a relação entre duas variáveis quantitativas.
Passo 1 carregando base de dados
load("C:/Users/julia/Base_de_dados-master/CARROS.RData")
load("C:/Users/julia/Base_de_dados-master/df_pokemon.RData")#Passo 2 - Transformar dados
CARROS$Tipodecombustivel <- ifelse(CARROS$Tipodecombustivel ==0, "Gas", "Alcool")
CARROS$TipodeMarcha <- ifelse(CARROS$TipodeMarcha==0, "Auto","Manual")Passo 3 - Visualização de dados
variaveis: preço por km/l.
teoria: Quanto mais econômico no consumo de km/l, menor o preço.
par(bg ="lightyellow")
par(cex = 1.0)
plot(CARROS$Kmporlitro, CARROS$Preco, pch=16, col="blue",
main = "Gráfico 1 - Diagrama de dispersão entre \n Km/l e preço do carro",
ylab = "Preço do carro", xlab = "Km/l")
abline(lsfit(CARROS$Kmporlitro,CARROS$Preco),col="darkred")Variaveis: Preço e HP.
teoria: quanto maior o HP, maior o preço do carro.
par(bg="skyblue")
plot(CARROS$HP, CARROS$Preco, pch=16, col="darkred",
main="Gráfico 2 - Diagrama de dispersão entre \n HP e Preço do carro",
ylab = "preço", xlab= "HP potência do motor")
abline(lsfit(CARROS$HP, CARROS$Preco), col="red")variaveis: Preço com peso do carro.
teoria: carro pesado é caro (ex: land rover vs fiat uno).
par(bg="lightyellow")
plot(CARROS$Peso, CARROS$Preco, pch=16, col="purple",
main= "Gráfico 3 - Diagrama de dispersão entre \n peso e preço do carro",
ylab= "preço", xlab= "peso (em toneladas)")
abline(lsfit(CARROS$Peso, CARROS$Preco), col="purple")variaveis: ataque e velocidade do pokemon.
teoria 1: mais rápido, maior o ataque;
teoria 2: mais rápido, mais fraco o ataque.
par(bg="yellow")
plot(df$speed, df$attack, col="darkblue",
main= "Gráfico 4 - Velocidade e ataque do pokemon",
pch=16, xlab= "velocidade", ylab="ataque")
abline(lsfit(df$speed, df$attack), col="darkblue")variaveis: velocidade e defesa.
teoria: quanto mais rápido, menor a defesa (relação negativa)
par(bg="lightyellow")
plot(df$speed, df$defense, col="darkblue",
main= "Gráfico 5 - Velocidade e defesa do pokemon",
pch=19, xlab= "velocidade", ylab="defesa")
abline(lsfit(df$speed, df$defense), col="darkblue")Passo 4 - Correlação
cor(df$speed, df$defense)## [1] -0.00597676
cor(df$speed, df$attack)## [1] 0.3356615
cor(CARROS$Kmporlitro, CARROS$Preco)## [1] -0.8475514
cor(CARROS$HP, CARROS$Preco)## [1] 0.7909486
cor(CARROS$Peso, CARROS$Preco)## [1] 0.8879799
Passo 5 - matriz de correlação
selecao <- c("Kmporlitro","Cilindros","Preco",
"HP","Amperagem_circ_eletrico", "Peso",
"RPM","NumdeMarchas","NumdeValvulas")
selecao2 <-c("height","weight","base_experience",
"attack","defense","hp","special_attack" ,
"special_defense", "speed")
cor_carros <- cor(CARROS[,selecao])
cor_carros## Kmporlitro Cilindros Preco HP
## Kmporlitro 1.0000000 -0.8521620 -0.8475514 -0.7761684
## Cilindros -0.8521620 1.0000000 0.9020329 0.8324475
## Preco -0.8475514 0.9020329 1.0000000 0.7909486
## HP -0.7761684 0.8324475 0.7909486 1.0000000
## Amperagem_circ_eletrico 0.6811719 -0.6999381 -0.7102139 -0.4487591
## Peso -0.8676594 0.7824958 0.8879799 0.6587479
## RPM 0.4186840 -0.5912421 -0.4336979 -0.7082234
## NumdeMarchas 0.4802848 -0.4926866 -0.5555692 -0.1257043
## NumdeValvulas -0.5509251 0.5269883 0.3949769 0.7498125
## Amperagem_circ_eletrico Peso RPM
## Kmporlitro 0.68117191 -0.8676594 0.41868403
## Cilindros -0.69993811 0.7824958 -0.59124207
## Preco -0.71021393 0.8879799 -0.43369788
## HP -0.44875912 0.6587479 -0.70822339
## Amperagem_circ_eletrico 1.00000000 -0.7124406 0.09120476
## Peso -0.71244065 1.0000000 -0.17471588
## RPM 0.09120476 -0.1747159 1.00000000
## NumdeMarchas 0.69961013 -0.5832870 -0.21268223
## NumdeValvulas -0.09078980 0.4276059 -0.65624923
## NumdeMarchas NumdeValvulas
## Kmporlitro 0.4802848 -0.5509251
## Cilindros -0.4926866 0.5269883
## Preco -0.5555692 0.3949769
## HP -0.1257043 0.7498125
## Amperagem_circ_eletrico 0.6996101 -0.0907898
## Peso -0.5832870 0.4276059
## RPM -0.2126822 -0.6562492
## NumdeMarchas 1.0000000 0.2740728
## NumdeValvulas 0.2740728 1.0000000
cor_pokemon <- cor(df[,selecao2])
cor_pokemon## height weight base_experience attack defense
## height 1.0000000 0.6465813 0.4804062 0.4088367 0.35995909
## weight 0.6465813 1.0000000 0.4874248 0.4605428 0.48171259
## base_experience 0.4804062 0.4874248 1.0000000 0.5891011 0.50577735
## attack 0.4088367 0.4605428 0.5891011 1.0000000 0.43177454
## defense 0.3599591 0.4817126 0.5057773 0.4317745 1.00000000
## hp 0.4401011 0.4314012 0.6849912 0.4298658 0.23521065
## special_attack 0.3330252 0.2793074 0.6630866 0.3278213 0.19828306
## special_defense 0.3239820 0.3403940 0.6723205 0.2008107 0.48187370
## speed 0.2249439 0.1081207 0.5021202 0.3356615 -0.00597676
## hp special_attack special_defense speed
## height 0.4401011 0.3330252 0.3239820 0.22494390
## weight 0.4314012 0.2793074 0.3403940 0.10812069
## base_experience 0.6849912 0.6630866 0.6723205 0.50212021
## attack 0.4298658 0.3278213 0.2008107 0.33566149
## defense 0.2352107 0.1982831 0.4818737 -0.00597676
## hp 1.0000000 0.3678422 0.3838715 0.16941766
## special_attack 0.3678422 1.0000000 0.4867300 0.44706699
## special_defense 0.3838715 0.4867300 1.0000000 0.23825607
## speed 0.1694177 0.4470670 0.2382561 1.00000000
Visualização da matriz
library(corrplot)## corrplot 0.92 loaded
par(cex=0.7)
corrplot(cor_carros)par(cex = 0.8)
corrplot(cor_pokemon)par(cex = 0.6)
corrplot(cor_pokemon, method = "number")par(cex=0.6)
corrplot(cor_carros, method="number")corrplot.mixed(cor_carros)corrplot.mixed(cor_pokemon)Conclusão
O coeficiente da relação é para mostrar a associação da relação linear entre as variáveis quantitativas.