AULA GRÁFICO DE DISPERSÃO (SÃO USADAS DUAS VARIÁVEIS QUANTITATIVAS)

Carregamento da base de dados

load("~/Base_de_dados-master/df_pokemon.RData")
load("~/Base_de_dados-master/CARROS.RData")

Construindo gráfico de dispersão

plot(CARROS$HP,CARROS$Preco,col = "darkblue",pch=16)
abline(lsfit(CARROS$HP,CARROS$Preco),col="darkred")

cor(CARROS$HP,CARROS$Preco)
## [1] 0.7909486
## No relatório, colocaria que quanto maior o HP do carro, maior tende a ser o preço.
## Padrão linear (reta) forte com variação positiva.

plot(CARROS$Kmporlitro,CARROS$Preco,col = "darkred",pch=16)
abline(lsfit(CARROS$Kmporlitro,CARROS$Preco),col="darkblue")

cor(CARROS$Kmporlitro,CARROS$Preco)
## [1] -0.8475514
plot(CARROS$Peso,CARROS$Preco,col = "darkred",pch=16)
abline(lsfit(CARROS$Peso,CARROS$Preco),col="darkblue")

cor(CARROS$Peso,CARROS$Preco)
## [1] 0.8879799
plot(CARROS$Amperagem_circ_eletrico,CARROS$Preco,col = "darkred",pch=16)
abline(lsfit(CARROS$Amperagem_circ_eletrico,CARROS$Preco),col="darkblue")

cor(CARROS$Amperagem_circ_eletrico,CARROS$Preco)
## [1] -0.7102139
# Base de dados Pokemon

plot(df$defense,df$attack,col = "darkred",pch=16)
abline(lsfit(df$defense,df$attack),col="darkblue")

## Quanto maior tende a ser o ataque, maior tende a ser a defesa.

plot(df$weight,df$speed,col = "darkred",pch=16)
abline(lsfit(df$weight,df$speed),col="darkblue")

cor(df$weight,df$speed)
## [1] 0.1081207
## Não existe associação linear, a linha é quase horizontal. A relação não existe. Não tem relação entre peso e velocidade.

Correlação de variáveis quantitativas

dados <-data.frame(x=c(2,3,4,5,5,6,7,8),
                   y=c(4,7,9,10,11,11,13,15))
cor(dados$x,dados$y)
## [1] 0.980871
plot(dados$x,dados$y,col = "darkred",pch=16)
abline(lsfit(dados$x,dados$y),col="darkblue")

## O gráfico e as estatísticas são complementares.O resultado (0.98) indica forte variação linear.


cor(CARROS[,c("Preco","RPM","HP","Kmporlitro","Amperagem_circ_eletrico","Peso")])
##                              Preco         RPM         HP Kmporlitro
## Preco                    1.0000000 -0.43369788  0.7909486 -0.8475514
## RPM                     -0.4336979  1.00000000 -0.7082234  0.4186840
## HP                       0.7909486 -0.70822339  1.0000000 -0.7761684
## Kmporlitro              -0.8475514  0.41868403 -0.7761684  1.0000000
## Amperagem_circ_eletrico -0.7102139  0.09120476 -0.4487591  0.6811719
## Peso                     0.8879799 -0.17471588  0.6587479 -0.8676594
##                         Amperagem_circ_eletrico       Peso
## Preco                               -0.71021393  0.8879799
## RPM                                  0.09120476 -0.1747159
## HP                                  -0.44875912  0.6587479
## Kmporlitro                           0.68117191 -0.8676594
## Amperagem_circ_eletrico              1.00000000 -0.7124406
## Peso                                -0.71244065  1.0000000
# Mostrar correlação de outra maneira - visualização da matriz

library(corrplot)
## corrplot 0.84 loaded
M <- cor(CARROS[,c("Preco","RPM","HP","Kmporlitro","Peso")])
corrplot(M, method="circle")

corrplot(M, method="square")

corrplot(M, method="number")

corrplot(M, method="color")

corrplot(M, method="pie")

corrplot(M, order="hclust", addrect=2)

corrplot.mixed(M)

corrplot(M,addCoef.col=TRUE,number.cex=0.7)