AULA GRÁFICO DE DISPERSÃO (SÃO USADAS DUAS VARIÁVEIS QUANTITATIVAS)
Carregamento da base de dados
load("~/Base_de_dados-master/df_pokemon.RData")
load("~/Base_de_dados-master/CARROS.RData")
Construindo gráfico de dispersão
plot(CARROS$HP,CARROS$Preco,col = "darkblue",pch=16)
abline(lsfit(CARROS$HP,CARROS$Preco),col="darkred")

cor(CARROS$HP,CARROS$Preco)
## [1] 0.7909486
## No relatório, colocaria que quanto maior o HP do carro, maior tende a ser o preço.
## Padrão linear (reta) forte com variação positiva.
plot(CARROS$Kmporlitro,CARROS$Preco,col = "darkred",pch=16)
abline(lsfit(CARROS$Kmporlitro,CARROS$Preco),col="darkblue")

cor(CARROS$Kmporlitro,CARROS$Preco)
## [1] -0.8475514
plot(CARROS$Peso,CARROS$Preco,col = "darkred",pch=16)
abline(lsfit(CARROS$Peso,CARROS$Preco),col="darkblue")

cor(CARROS$Peso,CARROS$Preco)
## [1] 0.8879799
plot(CARROS$Amperagem_circ_eletrico,CARROS$Preco,col = "darkred",pch=16)
abline(lsfit(CARROS$Amperagem_circ_eletrico,CARROS$Preco),col="darkblue")

cor(CARROS$Amperagem_circ_eletrico,CARROS$Preco)
## [1] -0.7102139
# Base de dados Pokemon
plot(df$defense,df$attack,col = "darkred",pch=16)
abline(lsfit(df$defense,df$attack),col="darkblue")

## Quanto maior tende a ser o ataque, maior tende a ser a defesa.
plot(df$weight,df$speed,col = "darkred",pch=16)
abline(lsfit(df$weight,df$speed),col="darkblue")

cor(df$weight,df$speed)
## [1] 0.1081207
## Não existe associação linear, a linha é quase horizontal. A relação não existe. Não tem relação entre peso e velocidade.
Correlação de variáveis quantitativas
dados <-data.frame(x=c(2,3,4,5,5,6,7,8),
y=c(4,7,9,10,11,11,13,15))
cor(dados$x,dados$y)
## [1] 0.980871
plot(dados$x,dados$y,col = "darkred",pch=16)
abline(lsfit(dados$x,dados$y),col="darkblue")

## O gráfico e as estatísticas são complementares.O resultado (0.98) indica forte variação linear.
cor(CARROS[,c("Preco","RPM","HP","Kmporlitro","Amperagem_circ_eletrico","Peso")])
## Preco RPM HP Kmporlitro
## Preco 1.0000000 -0.43369788 0.7909486 -0.8475514
## RPM -0.4336979 1.00000000 -0.7082234 0.4186840
## HP 0.7909486 -0.70822339 1.0000000 -0.7761684
## Kmporlitro -0.8475514 0.41868403 -0.7761684 1.0000000
## Amperagem_circ_eletrico -0.7102139 0.09120476 -0.4487591 0.6811719
## Peso 0.8879799 -0.17471588 0.6587479 -0.8676594
## Amperagem_circ_eletrico Peso
## Preco -0.71021393 0.8879799
## RPM 0.09120476 -0.1747159
## HP -0.44875912 0.6587479
## Kmporlitro 0.68117191 -0.8676594
## Amperagem_circ_eletrico 1.00000000 -0.7124406
## Peso -0.71244065 1.0000000
# Mostrar correlação de outra maneira - visualização da matriz
library(corrplot)
## corrplot 0.84 loaded
M <- cor(CARROS[,c("Preco","RPM","HP","Kmporlitro","Peso")])
corrplot(M, method="circle")

corrplot(M, method="square")

corrplot(M, method="number")

corrplot(M, method="color")

corrplot(M, method="pie")

corrplot(M, order="hclust", addrect=2)

corrplot.mixed(M)

corrplot(M,addCoef.col=TRUE,number.cex=0.7)
