dados <- data.frame(x=c(2,3,4,5,5,6,7,8),
y=c(4,7,9,10,11,11,13,15))
plot(dados$x,dados$y)

cor(dados$x,dados$y)
## [1] 0.980871
Passo 1 - Carregar a base de dados
#----------------------------------------------------------
# Passo 1 - Carregar a base de dados
#----------------------------------------------------------
load("C:/Users/Marcus Tulio/Desktop/MESTRADO2022_1/DISCIPLINAS/Estatistica/Mestrado_engenharia/Base_de_dados-master/Base_de_dados-master/CARROS.RData")
Passo 2 - Definiç~so de Variável resposta de Dispersão
HP e Preço do carro
km/l e Preço do carro
Peso e Preço do carro
RPM e Preço do carro
Amperagem e Preço do carro
Variável resposta (desfecho, dependente, endógena): Preço (Y)
Variável explicativa (independente, exógena: As outras quantitativas
(Y)
Os determinantes do preço do carro
Passo 3 - Diagrama de dispersão
#----------------------------------------------------------
# Passo 3 - Diagrama de dispersão
#----------------------------------------------------------
# plot(CARROS$HP,CARROS$Preco)
plot(CARROS$HP,CARROS$Preco,
main = "Correlação entre HP e Preço",
pch=19, col="red",
ylab = "Preço do Carro",
xlab = "HP (Cavalo)")
abline(lsfit(CARROS$HP,CARROS$Preco),col="blue")

cor(CARROS$HP,CARROS$Preco)
## [1] 0.7909486
# plot(CARROS$Km/litro,CARROS$Preco)
plot(CARROS$Kmporlitro,CARROS$Preco,
main = "Correlação entre Km/l e Preço",
pch=21, col="blue",
ylab = "Preço do Carro",
xlab = "Km/litro")
abline(lsfit(CARROS$Kmporlitro,CARROS$Preco),col="red")

cor(CARROS$Kmporlitro,CARROS$Preco)
## [1] -0.8475514
Quanto maior o Km/l menor tende a ser o preço
Tem correlação linear negativa e forte entre o Km/litro e o preço
(cor = -0,85)
Passo 4 - Matriz de Correlação
#----------------------------------------------------------
# Passo 4 - Matriz de Correlação
#----------------------------------------------------------
names(CARROS)
## [1] "Kmporlitro" "Cilindros"
## [3] "Preco" "HP"
## [5] "Amperagem_circ_eletrico" "Peso"
## [7] "RPM" "Tipodecombustivel"
## [9] "TipodeMarcha" "NumdeMarchas"
## [11] "NumdeValvulas"
selecao <- c("Kmporlitro","Preco","HP","Amperagem_circ_eletrico","Peso","RPM",
"Peso","RPM")
selecao
## [1] "Kmporlitro" "Preco"
## [3] "HP" "Amperagem_circ_eletrico"
## [5] "Peso" "RPM"
## [7] "Peso" "RPM"
cor(CARROS[selecao])
## Kmporlitro Preco HP
## Kmporlitro 1.0000000 -0.8475514 -0.7761684
## Preco -0.8475514 1.0000000 0.7909486
## HP -0.7761684 0.7909486 1.0000000
## Amperagem_circ_eletrico 0.6811719 -0.7102139 -0.4487591
## Peso -0.8676594 0.8879799 0.6587479
## RPM 0.4186840 -0.4336979 -0.7082234
## Peso.1 -0.8676594 0.8879799 0.6587479
## RPM.1 0.4186840 -0.4336979 -0.7082234
## Amperagem_circ_eletrico Peso RPM
## Kmporlitro 0.68117191 -0.8676594 0.41868403
## Preco -0.71021393 0.8879799 -0.43369788
## HP -0.44875912 0.6587479 -0.70822339
## Amperagem_circ_eletrico 1.00000000 -0.7124406 0.09120476
## Peso -0.71244065 1.0000000 -0.17471588
## RPM 0.09120476 -0.1747159 1.00000000
## Peso.1 -0.71244065 1.0000000 -0.17471588
## RPM.1 0.09120476 -0.1747159 1.00000000
## Peso.1 RPM.1
## Kmporlitro -0.8676594 0.41868403
## Preco 0.8879799 -0.43369788
## HP 0.6587479 -0.70822339
## Amperagem_circ_eletrico -0.7124406 0.09120476
## Peso 1.0000000 -0.17471588
## RPM -0.1747159 1.00000000
## Peso.1 1.0000000 -0.17471588
## RPM.1 -0.1747159 1.00000000
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
CARROS %>% select (selecao) %>% cor()
## Note: Using an external vector in selections is ambiguous.
## i Use `all_of(selecao)` instead of `selecao` to silence this message.
## i See <https://tidyselect.r-lib.org/reference/faq-external-vector.html>.
## This message is displayed once per session.
## Kmporlitro Preco HP
## Kmporlitro 1.0000000 -0.8475514 -0.7761684
## Preco -0.8475514 1.0000000 0.7909486
## HP -0.7761684 0.7909486 1.0000000
## Amperagem_circ_eletrico 0.6811719 -0.7102139 -0.4487591
## Peso -0.8676594 0.8879799 0.6587479
## RPM 0.4186840 -0.4336979 -0.7082234
## Amperagem_circ_eletrico Peso RPM
## Kmporlitro 0.68117191 -0.8676594 0.41868403
## Preco -0.71021393 0.8879799 -0.43369788
## HP -0.44875912 0.6587479 -0.70822339
## Amperagem_circ_eletrico 1.00000000 -0.7124406 0.09120476
## Peso -0.71244065 1.0000000 -0.17471588
## RPM 0.09120476 -0.1747159 1.00000000
Passo 5 - Visualização de Dados
#----------------------------------------------------------
# Passo 5 - Visualização de Dados
#----------------------------------------------------------
library(corrplot)
## corrplot 0.92 loaded
CARROS %>% select (selecao) %>% cor() %>% corrplot()

CARROS %>% select (selecao) %>% cor() %>% corrplot(method = "square")

CARROS %>% select (selecao) %>% cor() %>% corrplot(method = "pie")

CARROS %>% select (selecao) %>% cor() %>% corrplot(method = "number")

CARROS %>% select (selecao) %>% cor() %>%
corrplot(addCoef.col = TRUE,number.cex = 0.7)

Conclusão
- Todas as varáveis inflenciam o preço do carro;
- HP e peso tem correlação positiva;
- Amperagem e RPM tem correlação negativa;
- RPM tem correlação fraca/moderada de apenas = -0,43;
- Não há correlação entre RPM e peso;
- Não há correlação entre RPM e amperagem.