Correlação e Regressão

Roberval Lima

2016-08-22

Local: http://pubs.com/roberval/203616

Exercício 1

  1. Número de anos que a pessoa estudou (x) e número de livros que a pessoa leu (y)
x 3 5 7 9 10 14 16
y 1 2 3 5 7 10 13

Usando o R como calculadora

x<- c(3,5,7,9,10,14,16)
y<- c(1,2,3,5,7,10,13)

#somatorias de x e y
n<-length(x)
somax<-sum(x); somax
## [1] 64
somay<-sum(y); somay
## [1] 41
somaxy<-sum(x*y); somaxy
## [1] 497
somax2<-sum(x^2); somax2
## [1] 716
somaxaoquad<-(sum(x))^2; somaxaoquad
## [1] 4096
somay2<-sum(y^2);somay2
## [1] 357
somayaoquad<-(sum(y))^2; somayaoquad
## [1] 1681
# aplicar na formula
spxy<-somaxy-(somax*somay)/n; spxy
## [1] 122.1429
sqxx<-somax2-(somaxaoquad)/n; sqxx
## [1] 130.8571
sqyy<-somay2-(somayaoquad)/n; sqyy
## [1] 116.8571
sqxy<-somay2-(somayaoquad)/n; sqxy
## [1] 116.8571
# aplicando a formula de r

r<-spxy/sqrt(sqxx*sqyy)
r
## [1] 0.9877379
# aplicando a formula implementada no programa

cor(x,y)
## [1] 0.9877379

Diagrama de dispersão

plot(x,y, main = "Diagrama de dispersão")

Exercício 2

2.Calcule o coeficiente de correlação de Pearson entre retração linear-x1 (%) e resistência mecânica-x2 (MPa) para as 6 primeiras observações apresentadas a seguir.

Ensaio x1 x2
1 8,70 38,42
2 11,68 46,93
3 8,30 38,05
4 12,00 47,04
5 9,50 50,90
6 8,58 34,10
x1<- c(8.70,11.68,8.3,12.0,9.5,8.58)
x2<- c(38.42,46.93,38.05,47.04,50.90,34.1)

x<-x1
y<-x2

#somatorias de x e y
n<-length(x1)
somax<-sum(x); somax
## [1] 58.76
somay<-sum(y); somay
## [1] 255.44
somaxy<-sum(x*y); somaxy
## [1] 2538.819
somax2<-sum(x^2); somax2
## [1] 588.8688
somaxaoquad<-(sum(x))^2; somaxaoquad
## [1] 3452.738
somay2<-sum(y^2);somay2
## [1] 11092.71
somayaoquad<-(sum(y))^2; somayaoquad
## [1] 65249.59
# aplicar na formula
spxy<-somaxy-(somax*somay)/n; spxy
## [1] 37.21033
sqxx<-somax2-(somaxaoquad)/n; sqxx
## [1] 13.41253
sqyy<-somay2-(somayaoquad)/n; sqyy
## [1] 217.7731
sqxy<-somay2-(somayaoquad)/n; sqxy
## [1] 217.7731
# aplicando a formula de r

r<-spxy/sqrt(sqxx*sqyy)
r
## [1] 0.6885033
# aplicando a formula implementada no programa

cor(x,y)
## [1] 0.6885033

Diagrama de dispersão

plot(x,y, main = "Diagrama de dispersão")

Exercício 3

  1. Sejam X = nota na prova do vestibular e Y = nota final na discíplina de cálculo. Estas variáveis foram observadas em 20 alunos, ao final do primeiro período letivo de um curso de engenharia. Os dados são apresentados a seguir:
x y x y x y x y x y
39 65 43 78 21 52 64 82 65 88
57 92 47 89 28 73 75 98 47 71
34 56 52 75 35 50 30 50 28 52
40 70 70 50 80 90 32 58 67 88
  1. Calcule a correlação entre a nota no vestibular e a nota de cálculo. Interprete o resultado.

  2. Construa um diagrama de dispersão e verifique se algum aluno foge ao comportamento geral dos demais (ponto discrepante)

  3. Retire o valor discrepante detectado no item anterior e calcule novamente p coeficiente r. Interprete.

Usando o R como calculadora

x<- c(39,57,34,40,43,47,52,70,21,28,35,80,64,75,30,32,65,47,28,67)
length(x)
## [1] 20
y<- c(65,92,56,70,78,89,75,50,52,73,50,90,82,98,50,58,88,71,52,88)
length(y)
## [1] 20
#somatorias de x e y
n<-length(x)
somax<-sum(x); somax
## [1] 954
somay<-sum(y); somay
## [1] 1427
somaxy<-sum(x*y); somaxy
## [1] 71869
somax2<-sum(x^2); somax2
## [1] 51390
somaxaoquad<-(sum(x))^2; somaxaoquad
## [1] 910116
somay2<-sum(y^2);somay2
## [1] 106913
somayaoquad<-(sum(y))^2; somayaoquad
## [1] 2036329
# aplicar na formula
spxy<-somaxy-(somax*somay)/n; spxy
## [1] 3801.1
sqxx<-somax2-(somaxaoquad)/n; sqxx
## [1] 5884.2
sqyy<-somay2-(somayaoquad)/n; sqyy
## [1] 5096.55
sqxy<-somay2-(somayaoquad)/n; sqxy
## [1] 5096.55
# aplicando a formula de r

r<-spxy/sqrt(sqxx*sqyy)
r
## [1] 0.6941086
# aplicando a formula implementada no programa (letra a)

cor(x,y)
## [1] 0.6941086

Diagrama de dispersão (letra b)

plot(x,y, main = "Diagrama de dispersão")

Letra c

# Retirando o par (70,50)
x<- c(39,57,34,40,43,47,52,21,28,35,80,64,75,30,32,65,47,28,67)
length(x)
## [1] 19
y<- c(65,92,56,70,78,89,75,52,73,50,90,82,98,50,58,88,71,52,88)

#somatorias de x e y
n<-length(x)
somax<-sum(x); somax
## [1] 884
somay<-sum(y); somay
## [1] 1377
somaxy<-sum(x*y); somaxy
## [1] 68369
somax2<-sum(x^2); somax2
## [1] 46490
somaxaoquad<-(sum(x))^2; somaxaoquad
## [1] 781456
somay2<-sum(y^2);somay2
## [1] 104413
somayaoquad<-(sum(y))^2; somayaoquad
## [1] 1896129
# aplicar na formula
spxy<-somaxy-(somax*somay)/n; spxy
## [1] 4302.263
sqxx<-somax2-(somaxaoquad)/n; sqxx
## [1] 5360.737
sqyy<-somay2-(somayaoquad)/n; sqyy
## [1] 4616.737
sqxy<-somay2-(somayaoquad)/n; sqxy
## [1] 4616.737
# aplicando a formula de r

r<-spxy/sqrt(sqxx*sqyy)
r
## [1] 0.864803
# aplicando a formula implementada no programa (letra a)

cor(x,y)
## [1] 0.864803

Diagrama de dispersão (letra c)

plot(x,y, main = "Diagrama de dispersão")