Regresion lineal con R
Se sabe que las tasas de interés (x) son indicadores clave para predecir el número de construcciones (y). Considere los siguientes datos de los valores de tasas de interés en hipotecas y el registro de nuevas construcciones iniciadas entre 1969 y 1976. \[
\begin{array}{|c|c|c|c|c|c|c|c|c|}
\hline
\mbox{Año} & 1969 & 1970 & 1971 & 1972 & 1973 & 1974 & 1975 & 1976 \\
\hline
\mbox{Tasas} & 6,5 & 6,0 & 6,5 & 7,5 & 8,5 & 9,5 & 10,0 & 9,0 \\
\hline
\mbox{Permisos} & 2165 & 2984 & 2780 & 1940 & 1750 & 1535 & 962 & 1310 \\
\hline
\end{array}
\] a) Trace un diagrama de dispersión de los datos y comente las propiedades del mismo.
X <- c(6.5, 6.0, 6.5, 7.5, 8.5, 9.5, 10.0, 9.0)
Y <- c(2165, 2984, 2780, 1940, 1750, 1535, 962, 1310)
n <- length(X)
plot(X,Y, xlab = "Tasa de interés", ylab = "Permisos de construcción", main = "Diagrama de dispersión")

- Estime los parámetros de la recta de regresión.
n <- length(X)
n
[1] 8
Entonces \(n=8\)
Sumas:
sum(X)
[1] 63.5
\[ \sum x = 63,5 \]
sum(X^2)
[1] 520.25
\[ \sum x^2 = 520,25 \]
sum(Y)
[1] 15426
\[ \sum y = 15426 \]
sum(Y^2)
[1] 33143750
\[ \sum y^2 = 33143750 \]
sum(X*Y)
[1] 115464
\[ \sum x y = 115464 \] Calculamos:
SCx <- sum(X^2) - n * mean(X)^2
SCx
[1] 16.21875
\[ SCx = \sum x^2 - n \overline{x} = 16,21875 \]
SCy <- sum( ( Y - mean(Y))^2 )
SCy
[1] 3398566
\[ SCy = \sum y^2 - n \overline{y} = 3398566 \]
SPxy <- sum( (X - mean(X))*(Y - mean(Y)) )
SPxy
[1] -6979.875
\[ SPxy = \sum xy - n \overline{xy} = -6979,875 \]
b1 <- SPxy / SCx
b1
[1] -430.3584
\[ b_1 = \frac{SPxy}{SCx} = -430,3584 \]
b0 <- mean(Y) - b1 * mean(X)
b0
[1] 5344.22
\[ b_0 = \overline{y} - b_1 \overline{x} = 5344,22 \] Entonces la recta de regresión es: \[ y = 5344,22 - 430,36 x\] También podemos hacer que el programa lo calcule:
dispersion <- lm(Y~X)
summary(dispersion)
Call:
lm(formula = Y ~ X)
Residuals:
Min 1Q Median 3Q Max
-381.9 -164.9 -7.4 1 279.2
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5344.22 513.59 10.406 4.62e-05 ***
X -430.36 63.69 -6.757 0.000513 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 256.5 on 6 degrees of freedom
Multiple R-squared: 0.8839, Adjusted R-squared: 0.8645
F-statistic: 45.66 on 1 and 6 DF, p-value: 0.0005125
- Calcule el coeficiente de correlación muestral.
r <- SPxy / sqrt(SCx * SCy)
r
[1] -0.940137
\[ r = \frac{SPxy}{\sqrt{SCx \cdot SCy}} \approx -0,94 \] d) Si los indicadores económicos indican que la tasa de interés para hipotecas será del 8,5% el año próximo, pronostique el número de licencias de construcción que se otorgarán durante el año entrante mediante un intervalo de confianza de 90% \[ \varepsilon = 1 - 0,90 = 0,10 \qquad 1 - \frac{\varepsilon}{2} = 0,95 \qquad gl=8-2=6 \] Calculamos una t-Student 0,95 y 6 grados de libertad
ts <- qt(1-0.1/2, df = 8 - 2)
ts
[1] 1.94318
\[ \Rightarrow t = 1,94318 \]
Se2 <- (SCy - b1^2 * SCx) / (n-2)
Se2
[1] 65786.3
\[ S_e^2 = \frac{SCy - b_1 SCx}{n-2} = 65786,3 \]
x <- 8.5
Vy <- Se2 * (1 + 1/n + (x - mean(X))^2 / SCx)
Vy
[1] 75292.99
\[ \hat{V}(\hat{y}(8,5)) = S_e^2 \left( 1 + \frac{1}{n} + \frac{(x-\overline{x})^2}{SCx} \right) = 75292,99\]
Yx <- b0 + b1*x
Li <- Yx - ts*sqrt(Vy)
Ls <- Yx + ts*sqrt(Vy)
L <- c(Li, Ls)
L
[1] 1152.973 2219.374
\[ \mbox{intervalo} = y(x) \pm t \cdot \sqrt{\hat{V}(\hat{y}(x))} \] El intervalo en \(y(8,5)\) es \([1152,973;2219,374]\)
plot(X,Y, xlab = "Tasa de interés", ylab = "Permisos de construcción", main = "Recta de regresión")
abline(dispersion)
grid()

LS0tCnRpdGxlOiAiUiBOb3RlYm9vayIKb3V0cHV0OiBodG1sX25vdGVib29rCi0tLQojIyBSZWdyZXNpb24gbGluZWFsIGNvbiBSClNlIHNhYmUgcXVlIGxhcyB0YXNhcyBkZSBpbnRlcsOpcyAoeCkgc29uIGluZGljYWRvcmVzIGNsYXZlIHBhcmEgcHJlZGVjaXIgZWwgbsO6bWVybyBkZSBjb25zdHJ1Y2Npb25lcyAoeSkuIENvbnNpZGVyZSBsb3Mgc2lndWllbnRlcyBkYXRvcyBkZSBsb3MgdmFsb3JlcyBkZSB0YXNhcyBkZSBpbnRlcsOpcyBlbiBoaXBvdGVjYXMgeSBlbCByZWdpc3RybyBkZSBudWV2YXMgY29uc3RydWNjaW9uZXMgaW5pY2lhZGFzIGVudHJlIDE5NjkgeSAxOTc2LgokJCAKXGJlZ2lue2FycmF5fXt8Y3xjfGN8Y3xjfGN8Y3xjfGN8fQpcaGxpbmUgClxtYm94e0HDsW99ICYgMTk2OSAmIDE5NzAgJiAxOTcxICYgMTk3MiAmIDE5NzMgJiAxOTc0ICYgMTk3NSAmIDE5NzYgXFwgClxobGluZSAKXG1ib3h7VGFzYXN9ICYgNiw1ICYgNiwwICYgNiw1ICYgNyw1ICYgOCw1ICYgOSw1ICYgMTAsMCAmIDksMCBcXCAKXGhsaW5lIApcbWJveHtQZXJtaXNvc30gJiAyMTY1ICYgMjk4NCAmIDI3ODAgJiAxOTQwICYgMTc1MCAmIDE1MzUgJiA5NjIgJiAxMzEwIFxcIApcaGxpbmUgClxlbmR7YXJyYXl9CiQkCmEpIFRyYWNlIHVuIGRpYWdyYW1hIGRlIGRpc3BlcnNpw7NuIGRlIGxvcyBkYXRvcyB5IGNvbWVudGUgbGFzIHByb3BpZWRhZGVzIGRlbCBtaXNtby4KYGBge3J9ClggPC0gYyg2LjUsIDYuMCwgNi41LCA3LjUsIDguNSwgOS41LCAxMC4wLCA5LjApClkgPC0gYygyMTY1LCAyOTg0LCAyNzgwLCAxOTQwLCAxNzUwLCAxNTM1LCA5NjIsIDEzMTApCm4gPC0gbGVuZ3RoKFgpCnBsb3QoWCxZLCB4bGFiID0gIlRhc2EgZGUgaW50ZXLDqXMiLCB5bGFiID0gIlBlcm1pc29zIGRlIGNvbnN0cnVjY2nDs24iLCBtYWluID0gIkRpYWdyYW1hIGRlIGRpc3BlcnNpw7NuIikKYGBgCmIpIEVzdGltZSBsb3MgcGFyw6FtZXRyb3MgZGUgbGEgcmVjdGEgZGUgcmVncmVzacOzbi4KYGBge3J9Cm4gPC0gbGVuZ3RoKFgpCm4KYGBgCkVudG9uY2VzICRuPTgkCgpTdW1hczoKYGBge3J9CnN1bShYKQpgYGAKJCQgXHN1bSB4ID0gNjMsNSAkJApgYGB7cn0Kc3VtKFheMikKYGBgCiQkIFxzdW0geF4yID0gNTIwLDI1ICQkCmBgYHtyfQpzdW0oWSkKYGBgCiQkIFxzdW0geSA9IDE1NDI2ICQkCmBgYHtyfQpzdW0oWV4yKQpgYGAKJCQgICBcc3VtIHleMiA9IDMzMTQzNzUwICQkCmBgYHtyfQpzdW0oWCpZKQpgYGAKJCQgXHN1bSB4IHkgPSAxMTU0NjQgJCQKQ2FsY3VsYW1vczoKCmBgYHtyfQpTQ3ggPC0gc3VtKFheMikgLSBuICogbWVhbihYKV4yClNDeApgYGAKJCQgU0N4ID0gXHN1bSB4XjIgLSBuIFxvdmVybGluZXt4fSAgPSAxNiwyMTg3NSAkJApgYGB7cn0KU0N5IDwtIHN1bSggKCBZIC0gbWVhbihZKSleMiApClNDeQpgYGAKJCQgU0N5ID0gXHN1bSB5XjIgLSBuIFxvdmVybGluZXt5fSA9IDMzOTg1NjYgJCQKYGBge3J9ClNQeHkgPC0gc3VtKCAoWCAtIG1lYW4oWCkpKihZIC0gbWVhbihZKSkgKQpTUHh5CmBgYAokJCAgU1B4eSA9IFxzdW0geHkgLSBuIFxvdmVybGluZXt4eX0gID0gLTY5NzksODc1ICQkCmBgYHtyfQpiMSA8LSBTUHh5IC8gU0N4CmIxCmBgYAokJCBiXzEgPSBcZnJhY3tTUHh5fXtTQ3h9ID0gLTQzMCwzNTg0ICAkJApgYGB7cn0KYjAgPC0gbWVhbihZKSAtIGIxICogbWVhbihYKQpiMApgYGAKJCQgIGJfMCA9IFxvdmVybGluZXt5fSAtIGJfMSBcb3ZlcmxpbmV7eH0gPSA1MzQ0LDIyICAkJApFbnRvbmNlcyBsYSByZWN0YSBkZSByZWdyZXNpw7NuIGVzOgokJCB5ID0gNTM0NCwyMiAtIDQzMCwzNiB4JCQKVGFtYmnDqW4gcG9kZW1vcyBoYWNlciBxdWUgZWwgcHJvZ3JhbWEgbG8gY2FsY3VsZToKYGBge3J9CmRpc3BlcnNpb24gPC0gbG0oWX5YKQpzdW1tYXJ5KGRpc3BlcnNpb24pCmBgYApjKSBDYWxjdWxlIGVsIGNvZWZpY2llbnRlIGRlIGNvcnJlbGFjacOzbiBtdWVzdHJhbC4KYGBge3J9CnIgPC0gU1B4eSAvIHNxcnQoU0N4ICogU0N5KQpyCmBgYAokJCByID0gXGZyYWN7U1B4eX17XHNxcnR7U0N4IFxjZG90IFNDeX19IFxhcHByb3ggLTAsOTQgICAkJApkKSBTaSBsb3MgaW5kaWNhZG9yZXMgZWNvbsOzbWljb3MgaW5kaWNhbiBxdWUgbGEgdGFzYSBkZSBpbnRlcsOpcyBwYXJhIGhpcG90ZWNhcyBzZXLDoSBkZWwgOCw1JSBlbCBhw7FvIHByw7N4aW1vLCBwcm9ub3N0aXF1ZSBlbCBuw7ptZXJvIGRlIGxpY2VuY2lhcyBkZSBjb25zdHJ1Y2Npw7NuIHF1ZSBzZSBvdG9yZ2Fyw6FuIGR1cmFudGUgZWwgYcOxbyBlbnRyYW50ZSBtZWRpYW50ZSB1biBpbnRlcnZhbG8gZGUgY29uZmlhbnphIGRlIDkwJQokJCBcdmFyZXBzaWxvbiA9IDEgLSAwLDkwID0gMCwxMCBccXF1YWQgMSAtIFxmcmFje1x2YXJlcHNpbG9ufXsyfSA9IDAsOTUgXHFxdWFkIGdsPTgtMj02ICQkCkNhbGN1bGFtb3MgdW5hIHQtU3R1ZGVudCAwLDk1IHkgNiBncmFkb3MgZGUgbGliZXJ0YWQKYGBge3J9CnRzIDwtIHF0KDEtMC4xLzIsIGRmID0gOCAtIDIpCnRzCmBgYAokJCBcUmlnaHRhcnJvdyB0ID0gMSw5NDMxOCAkJApgYGB7cn0KU2UyIDwtIChTQ3kgLSBiMV4yICogU0N4KSAvIChuLTIpClNlMgpgYGAKJCQgU19lXjIgPSBcZnJhY3tTQ3kgLSBiXzEgU0N4fXtuLTJ9ID0gNjU3ODYsMyAkJApgYGB7cn0KeCA8LSA4LjUKVnkgPC0gU2UyICogKDEgKyAxL24gKyAoeCAtIG1lYW4oWCkpXjIgLyBTQ3gpClZ5CmBgYAokJCBcaGF0e1Z9KFxoYXR7eX0oOCw1KSkgPSBTX2VeMiBcbGVmdCggMSArIFxmcmFjezF9e259ICsgXGZyYWN7KHgtXG92ZXJsaW5le3h9KV4yfXtTQ3h9ICAgXHJpZ2h0KSA9IDc1MjkyLDk5JCQKYGBge3J9Cll4IDwtIGIwICsgYjEqeApMaSA8LSBZeCAtIHRzKnNxcnQoVnkpCkxzIDwtIFl4ICsgdHMqc3FydChWeSkKTCA8LSBjKExpLCBMcykKTApgYGAKJCQgXG1ib3h7aW50ZXJ2YWxvfSA9IHkoeCkgXHBtIHQgXGNkb3QgXHNxcnR7XGhhdHtWfShcaGF0e3l9KHgpKX0gICAkJApFbCBpbnRlcnZhbG8gZW4gJHkoOCw1KSQgZXMgJFsxMTUyLDk3MzsyMjE5LDM3NF0kCmBgYHtyfQpwbG90KFgsWSwgeGxhYiA9ICJUYXNhIGRlIGludGVyw6lzIiwgeWxhYiA9ICJQZXJtaXNvcyBkZSBjb25zdHJ1Y2Npw7NuIiwgbWFpbiA9ICJSZWN0YSBkZSByZWdyZXNpw7NuIikKYWJsaW5lKGRpc3BlcnNpb24pCmdyaWQoKQpgYGAK