Diagrama de Dispersao entre duas variáveis quantitativas.

## *Carregando a Base de Dados.*
load("C:/Users/VIC NOTE/Documents/Ciencia Politica/8 Periodo/Estatistica/bases_curso_estatistica/Base_de_dados-master/CARROS.RData")
load("C:/Users/VIC NOTE/Documents/Ciencia Politica/8 Periodo/Estatistica/bases_curso_estatistica/Base_de_dados-master/df_pokemon.RData")

Criando Gráficos de Dispersão com a Base de Dados CARROS.

plot(CARROS$HP,CARROS$Preco, col="darkblue", pch=16)
abline(lsfit(CARROS$HP, CARROS$Preco ), col="red")

cor(CARROS$HP,CARROS$Preco)
## [1] 0.7909486

Quanto maior o HP do carro, maior tende a ser o preco do carro.Quanto maior o valor de X, maior o valor de y.

Nao é para olhar so os pontos mas se atentar com as variaveis. Tem carro carissimo e os cavalos de potencia nao sao o maior.

O padrao linear geral tem relacao positiva.

plot(CARROS$Kmporlitro,CARROS$Preco, col="red", pch=16)
abline(lsfit(CARROS$Kmporlitro, CARROS$Preco ), col="green")

Quanto maior a klometragem por litro, menor é o preco.

cor(CARROS$Kmporlitro,CARROS$Preco)
## [1] -0.8475514

Relacao linear, forte e negativa.

plot(CARROS$Peso,CARROS$Preco, col="darkblue", pch=16)
abline(lsfit(CARROS$Peso, CARROS$Preco ), col="black")

Carro pesado tende a ser mais caro.

plot(CARROS$Amperagem_circ_eletrico,CARROS$Preco, col="yellow", pch=16)
abline(lsfit(CARROS$Amperagem_circ_eletrico, CARROS$Preco ), col="red")

Quanto maior a amperagem, menor o preco do carro.No fim, todas as variaveis interferem no preco do carro.

Criando Gráfico de Dispersão com a Base de Dados Pokemon.

plot(df$attack,df$defense, col="darkblue", pch=16)
abline(lsfit(df$attack,df$defense), col="red")

Tem um outlier com uma defesa extrema mas ataque fraco, no geral quanto maior defesa, maior ataque.

plot(df$weight,df$speed, col="darkblue", pch=16)
abline(lsfit(df$weight,df$speed), col="red")

Nao existe essa relacao.

cor(df$weight,df$speed)
## [1] 0.1081207

Quase proxima de zero, linear.

O que é correlaçao? A correlacao mede a direcao (positivas ou negativas) e a intensidade (força) da relacao linear entre duas variaveis quantitativas ( relacionamento entre duas variaveis).Costuma-se representar a correlacao pela letra “r”.

A correlacao nao faz distincao entre variavel explicativa e variavel resposta.

Valores de referncia para interpretacao:

0<r<0.25 - baixa ou nenhuma associacao

0.25<r<0.5 grau fraco de associacao

0.5<r<0.5 grau moderado ou bom de associaçao

r>0.75 grau bom ou excelente

dados <-data.frame(x=c(2,3,4,5,5,6,7,8), y=c(4,7,9,10,11,11,13,15))
cor(dados$x, dados$y)
## [1] 0.980871
plot(dados$x, dados$y, col="darkblue", pch=16)
abline(lsfit(dados$x, dados$y), col="red")

Tem uma correlacao entre as duas, uma impacta na outra.

Na pratica fazemos uma matriz com todas as correlacoes.

cor(CARROS[,c("Preco","RPM","HP","Kmporlitro","Amperagem_circ_eletrico","Peso")])
##                              Preco         RPM         HP Kmporlitro
## Preco                    1.0000000 -0.43369788  0.7909486 -0.8475514
## RPM                     -0.4336979  1.00000000 -0.7082234  0.4186840
## HP                       0.7909486 -0.70822339  1.0000000 -0.7761684
## Kmporlitro              -0.8475514  0.41868403 -0.7761684  1.0000000
## Amperagem_circ_eletrico -0.7102139  0.09120476 -0.4487591  0.6811719
## Peso                     0.8879799 -0.17471588  0.6587479 -0.8676594
##                         Amperagem_circ_eletrico       Peso
## Preco                               -0.71021393  0.8879799
## RPM                                  0.09120476 -0.1747159
## HP                                  -0.44875912  0.6587479
## Kmporlitro                           0.68117191 -0.8676594
## Amperagem_circ_eletrico              1.00000000 -0.7124406
## Peso                                -0.71244065  1.0000000

Visualizacao da Matriz de Correlaçao.

Correlacao vai do -1 ate o 1. Valores proximos dos eixos 1 e -1, sao fortes e proximas do zero sao nula.

library(corrplot)
## corrplot 0.84 loaded
M <-cor(CARROS[,c("Preco","RPM","HP","Kmporlitro","Amperagem_circ_eletrico","Peso")])
corrplot(M, method="circle")

A correlaco do preco com o HP é linear,forte e positiva, a correlacao do preco com KM/Litro é linear, forte e negativa.

corrplot(M, method="square")

Apenas mudou o metodo de apresentacao para quadrado onde a diagonal é igual a 1e quanto mais escuro o tom, maior e a força dessa correlacao. O vermelho representa a correlacao negativa e o azul a correlacao positiva, o branco é a representacao de que nao existe correlacao entre estas variaveis, proxima do zero.

corrplot(M, method="number")

corrplot(M, method="color")

corrplot(M, method="pie")

corrplot(M, order="hclust", addrect=2)

Ordenando as variaveis por bloco de forma a ficar agrupadas positivo com positivo e negativo com negativo.

corrplot.mixed(M)

Esse tipo de representacao gera um grafico de aparencia mais analitica.