Parte 2
Dados los siguientes datos realice lo siguiente:
| 250 |
76 |
80 |
13.5 |
| 220 |
61 |
72 |
12.1 |
| 200 |
50 |
70 |
11.6 |
| 350 |
94 |
122 |
12.5 |
| 210 |
55 |
75 |
13.5 |
| 205 |
61 |
95 |
14 |
| 285 |
80 |
120 |
12.5 |
| 190 |
52 |
68 |
14.5 |
Empesemos por crear un dataframe con esta data:
Y <- c(250,220,200,350,210,205,285,190)
X1 <- c(76,61,50,94,55,61,80,52)
X2 <- c(80,72,70,122,75,95,120,68)
X3 <- c(13.5,12.1,11.6,12.5,13.5,14,12.5,14.5)
data <- data.frame(Y, X1, X2, X3)
data
- Muestre una grafica de densidad de cada variable



- Muestre un breve análisis estadístico para cada variable recuerde que puede usar summary()
summary(data)
Y X1 X2 X3
Min. :190.0 Min. :50.00 Min. : 68.00 Min. :11.60
1st Qu.:203.8 1st Qu.:54.25 1st Qu.: 71.50 1st Qu.:12.40
Median :215.0 Median :61.00 Median : 77.50 Median :13.00
Mean :238.8 Mean :66.12 Mean : 87.75 Mean :13.03
3rd Qu.:258.8 3rd Qu.:77.00 3rd Qu.:101.25 3rd Qu.:13.62
Max. :350.0 Max. :94.00 Max. :122.00 Max. :14.50
- Genere la matriz de correlación.
cor(data)
Y X1 X2 X3
Y 1.0000000 0.9663300 0.8599710 -0.3223668
X1 0.9663300 1.0000000 0.8576585 -0.1887073
X2 0.8599710 0.8576585 1.0000000 -0.1728051
X3 -0.3223668 -0.1887073 -0.1728051 1.0000000
- Muestre una gráfica sobre la matriz de correlación.

- Muestre un diagrama de dispersión para cada variable explicatoria (Xi) contra la variable explicada (Y).



Diga su “input” sobre cada variable.
Utilice R para generar un modelo de regresión lineal múltiple utilizando el enfoque matricial, es necesario que muestre todos los pasos que realiza para llegar al resultado.
Utilizando la formula \(y=\beta X+\varepsilon\), procedremos a extraer \(y\) y \(X\)
y <- data$Y
x <- as.matrix(data[,-1])
Ahora agregamos a x un vector de 1s
x <- cbind(rep(1, length(y)), x)
x
X1 X2 X3
[1,] 1 76 80 13.5
[2,] 1 61 72 12.1
[3,] 1 50 70 11.6
[4,] 1 94 122 12.5
[5,] 1 55 75 13.5
[6,] 1 61 95 14.0
[7,] 1 80 120 12.5
[8,] 1 52 68 14.5
Ahora utilizando la formual \(\beta=(X^{T}X)^{-1}X^{T}y\) calculamos los betas:
betas <- solve(t(x) %*% x) %*% t(x) %*% y
betas
[,1]
121.7044878
X1 2.9493235
X2 0.2755696
X3 -7.8433582
Finalmente corroboremos que nuestros calculos estan bien:
lm_regresion <- lm(Y ~ ., data = data)
lm_regresion
Call:
lm(formula = Y ~ ., data = data)
Coefficients:
(Intercept) X1 X2 X3
121.7045 2.9493 0.2756 -7.8434
Como vemos los calculos que hicimos matricialmente y de la regresion automatica de R quedan exactamente igual, excepto por el redondeo de decimales.
LS0tCnRpdGxlOiAiRWNvbm9tZXRyaWEgMjogTGFib3JhdG9yaW8gMSIKb3V0cHV0OiBodG1sX25vdGVib29rCi0tLQoKYGBge3IgZWNobz1GQUxTRX0KbGlicmFyeShjb3JycGxvdCkKYGBgCiMjIyBQYXJ0ZSAxCiFbUGFydGUgMV0oU2VsZWN0aW9uXzAxMi5wbmcpCiFbUGFydGUgMl0oU2VsZWN0aW9uXzAxMy5wbmcpCiFbUGFydGUgM10oU2VsZWN0aW9uXzAxNC5wbmcpCgojIyMgUGFydGUgMgoKRGFkb3MgbG9zIHNpZ3VpZW50ZXMgZGF0b3MgcmVhbGljZSBsbyBzaWd1aWVudGU6Cgp8WSB8IFgxIHwgWDIgfCBYM3wKfC0tLXwtLS18LS0tfC0tLXwKfDI1MCB8IDc2IHwgODAgfCAxMy41fAp8MjIwIHwgNjEgfCA3MiB8IDEyLjF8CnwyMDAgfCA1MCB8IDcwIHwgMTEuNnwKfDM1MCB8IDk0IHwgMTIyIHwgMTIuNXwKfDIxMCB8IDU1IHwgNzUgfCAxMy41fAp8MjA1IHwgNjEgfCA5NSB8IDE0fAp8Mjg1IHwgODAgfCAxMjAgfCAxMi41CnwxOTAgfCA1MiB8IDY4IHwgMTQuNXwKCkVtcGVzZW1vcyBwb3IgY3JlYXIgdW4gZGF0YWZyYW1lIGNvbiBlc3RhIGRhdGE6CmBgYHtyfQpZIDwtIGMoMjUwLDIyMCwyMDAsMzUwLDIxMCwyMDUsMjg1LDE5MCkKWDEgPC0gYyg3Niw2MSw1MCw5NCw1NSw2MSw4MCw1MikKWDIgPC0gYyg4MCw3Miw3MCwxMjIsNzUsOTUsMTIwLDY4KQpYMyA8LSBjKDEzLjUsMTIuMSwxMS42LDEyLjUsMTMuNSwxNCwxMi41LDE0LjUpCgpkYXRhIDwtIGRhdGEuZnJhbWUoWSwgWDEsIFgyLCBYMykKZGF0YQpgYGAKCgoxLiBNdWVzdHJlIHVuYSBncmFmaWNhIGRlIGRlbnNpZGFkIGRlIGNhZGEgdmFyaWFibGUKCmBgYHtyfQpwbG90KGRlbnNpdHkoZGF0YSRYMSkpCmBgYApgYGB7cn0KcGxvdChkZW5zaXR5KGRhdGEkWDIpKQpgYGAKCmBgYHtyfQpwbG90KGRlbnNpdHkoZGF0YSRYMykpCmBgYAoyLiBNdWVzdHJlIHVuIGJyZXZlIGFuw6FsaXNpcyBlc3RhZMOtc3RpY28gcGFyYSBjYWRhIHZhcmlhYmxlIHJlY3VlcmRlIHF1ZSBwdWVkZSB1c2FyIHN1bW1hcnkoKQoKYGBge3J9CnN1bW1hcnkoZGF0YSkKYGBgCgozLiBHZW5lcmUgbGEgbWF0cml6IGRlIGNvcnJlbGFjacOzbi4KCmBgYHtyfQpjb3IoZGF0YSkKYGBgCgo0LiBNdWVzdHJlIHVuYSBncsOhZmljYSBzb2JyZSBsYSBtYXRyaXogZGUgY29ycmVsYWNpw7NuLgoKYGBge3J9CmNvcnJwbG90KGNvcihkYXRhKSkKYGBgCgo1LiBNdWVzdHJlIHVuIGRpYWdyYW1hIGRlIGRpc3BlcnNpw7NuIHBhcmEgY2FkYSB2YXJpYWJsZSBleHBsaWNhdG9yaWEgKFhpKSBjb250cmEgbGEgdmFyaWFibGUgZXhwbGljYWRhIChZKS4KCmBgYHtyfQpwbG90KGRhdGEkWDEsIGRhdGEkWSkKYGBgCgpgYGB7cn0KcGxvdChkYXRhJFgyLCBkYXRhJFkpCmBgYApgYGB7cn0KcGxvdChkYXRhJFgzLCBkYXRhJFkpCmBgYAo2LiBEaWdhIHN1IOKAnGlucHV04oCdIHNvYnJlIGNhZGEgdmFyaWFibGUuCgo3LiBVdGlsaWNlIFIgcGFyYSBnZW5lcmFyIHVuIG1vZGVsbyBkZSByZWdyZXNpw7NuIGxpbmVhbCBtw7psdGlwbGUgdXRpbGl6YW5kbyBlbCBlbmZvcXVlIG1hdHJpY2lhbCwgZXMgbmVjZXNhcmlvIHF1ZSBtdWVzdHJlIHRvZG9zIGxvcyBwYXNvcyBxdWUgcmVhbGl6YSBwYXJhIGxsZWdhciBhbCByZXN1bHRhZG8uCgpVdGlsaXphbmRvIGxhIGZvcm11bGEgJHk9XGJldGEgWCtcdmFyZXBzaWxvbiQsIHByb2NlZHJlbW9zIGEgZXh0cmFlciAkeSQgeSAkWCQKCmBgYHtyfQp5IDwtIGRhdGEkWQp4IDwtIGFzLm1hdHJpeChkYXRhWywtMV0pCmBgYApBaG9yYSBhZ3JlZ2Ftb3MgYSB4IHVuIHZlY3RvciBkZSAxcwoKYGBge3J9CnggPC0gY2JpbmQocmVwKDEsIGxlbmd0aCh5KSksIHgpCngKYGBgCkFob3JhIHV0aWxpemFuZG8gbGEgZm9ybXVhbCAkXGJldGE9KFhee1R9WCleey0xfVhee1R9eSQgY2FsY3VsYW1vcyBsb3MgYmV0YXM6CmBgYHtyfQpiZXRhcyA8LSBzb2x2ZSh0KHgpICUqJSB4KSAlKiUgdCh4KSAlKiUgeQpiZXRhcwpgYGAKCkZpbmFsbWVudGUgY29ycm9ib3JlbW9zIHF1ZSBudWVzdHJvcyBjYWxjdWxvcyBlc3RhbiBiaWVuOgpgYGB7cn0KbG1fcmVncmVzaW9uIDwtIGxtKFkgfiAuLCBkYXRhID0gZGF0YSkKbG1fcmVncmVzaW9uCmBgYAoKQ29tbyB2ZW1vcyBsb3MgY2FsY3Vsb3MgcXVlIGhpY2ltb3MgbWF0cmljaWFsbWVudGUgeSBkZSBsYSByZWdyZXNpb24gYXV0b21hdGljYSBkZSBSIHF1ZWRhbiBleGFjdGFtZW50ZSBpZ3VhbCwgZXhjZXB0byBwb3IgZWwgcmVkb25kZW8gZGUgZGVjaW1hbGVzLgo=