corrplot 0.84 loaded

Parte 1

Parte 1 Parte 2 Parte 3

Parte 2

Dados los siguientes datos realice lo siguiente:

Y X1 X2 X3
250 76 80 13.5
220 61 72 12.1
200 50 70 11.6
350 94 122 12.5
210 55 75 13.5
205 61 95 14
285 80 120 12.5
190 52 68 14.5

Empesemos por crear un dataframe con esta data:

Y <- c(250,220,200,350,210,205,285,190)
X1 <- c(76,61,50,94,55,61,80,52)
X2 <- c(80,72,70,122,75,95,120,68)
X3 <- c(13.5,12.1,11.6,12.5,13.5,14,12.5,14.5)
data <- data.frame(Y, X1, X2, X3)
data
  1. Muestre una grafica de densidad de cada variable

  1. Muestre un breve análisis estadístico para cada variable recuerde que puede usar summary()
summary(data)
       Y               X1              X2               X3       
 Min.   :190.0   Min.   :50.00   Min.   : 68.00   Min.   :11.60  
 1st Qu.:203.8   1st Qu.:54.25   1st Qu.: 71.50   1st Qu.:12.40  
 Median :215.0   Median :61.00   Median : 77.50   Median :13.00  
 Mean   :238.8   Mean   :66.12   Mean   : 87.75   Mean   :13.03  
 3rd Qu.:258.8   3rd Qu.:77.00   3rd Qu.:101.25   3rd Qu.:13.62  
 Max.   :350.0   Max.   :94.00   Max.   :122.00   Max.   :14.50  
  1. Genere la matriz de correlación.
cor(data)
            Y         X1         X2         X3
Y   1.0000000  0.9663300  0.8599710 -0.3223668
X1  0.9663300  1.0000000  0.8576585 -0.1887073
X2  0.8599710  0.8576585  1.0000000 -0.1728051
X3 -0.3223668 -0.1887073 -0.1728051  1.0000000
  1. Muestre una gráfica sobre la matriz de correlación.

  1. Muestre un diagrama de dispersión para cada variable explicatoria (Xi) contra la variable explicada (Y).

  1. Diga su “input” sobre cada variable.

  2. Utilice R para generar un modelo de regresión lineal múltiple utilizando el enfoque matricial, es necesario que muestre todos los pasos que realiza para llegar al resultado.

Utilizando la formula \(y=\beta X+\varepsilon\), procedremos a extraer \(y\) y \(X\)

y <- data$Y
x <- as.matrix(data[,-1])

Ahora agregamos a x un vector de 1s

x <- cbind(rep(1, length(y)), x)
x
       X1  X2   X3
[1,] 1 76  80 13.5
[2,] 1 61  72 12.1
[3,] 1 50  70 11.6
[4,] 1 94 122 12.5
[5,] 1 55  75 13.5
[6,] 1 61  95 14.0
[7,] 1 80 120 12.5
[8,] 1 52  68 14.5

Ahora utilizando la formual \(\beta=(X^{T}X)^{-1}X^{T}y\) calculamos los betas:

betas <- solve(t(x) %*% x) %*% t(x) %*% y
betas
          [,1]
   121.7044878
X1   2.9493235
X2   0.2755696
X3  -7.8433582

Finalmente corroboremos que nuestros calculos estan bien:

lm_regresion <- lm(Y ~ ., data = data)
lm_regresion

Call:
lm(formula = Y ~ ., data = data)

Coefficients:
(Intercept)           X1           X2           X3  
   121.7045       2.9493       0.2756      -7.8434  

Como vemos los calculos que hicimos matricialmente y de la regresion automatica de R quedan exactamente igual, excepto por el redondeo de decimales.

LS0tCnRpdGxlOiAiRWNvbm9tZXRyaWEgMjogTGFib3JhdG9yaW8gMSIKb3V0cHV0OiBodG1sX25vdGVib29rCi0tLQoKYGBge3IgZWNobz1GQUxTRX0KbGlicmFyeShjb3JycGxvdCkKYGBgCiMjIyBQYXJ0ZSAxCiFbUGFydGUgMV0oU2VsZWN0aW9uXzAxMi5wbmcpCiFbUGFydGUgMl0oU2VsZWN0aW9uXzAxMy5wbmcpCiFbUGFydGUgM10oU2VsZWN0aW9uXzAxNC5wbmcpCgojIyMgUGFydGUgMgoKRGFkb3MgbG9zIHNpZ3VpZW50ZXMgZGF0b3MgcmVhbGljZSBsbyBzaWd1aWVudGU6Cgp8WSB8IFgxIHwgWDIgfCBYM3wKfC0tLXwtLS18LS0tfC0tLXwKfDI1MCB8IDc2IHwgODAgfCAxMy41fAp8MjIwIHwgNjEgfCA3MiB8IDEyLjF8CnwyMDAgfCA1MCB8IDcwIHwgMTEuNnwKfDM1MCB8IDk0IHwgMTIyIHwgMTIuNXwKfDIxMCB8IDU1IHwgNzUgfCAxMy41fAp8MjA1IHwgNjEgfCA5NSB8IDE0fAp8Mjg1IHwgODAgfCAxMjAgfCAxMi41CnwxOTAgfCA1MiB8IDY4IHwgMTQuNXwKCkVtcGVzZW1vcyBwb3IgY3JlYXIgdW4gZGF0YWZyYW1lIGNvbiBlc3RhIGRhdGE6CmBgYHtyfQpZIDwtIGMoMjUwLDIyMCwyMDAsMzUwLDIxMCwyMDUsMjg1LDE5MCkKWDEgPC0gYyg3Niw2MSw1MCw5NCw1NSw2MSw4MCw1MikKWDIgPC0gYyg4MCw3Miw3MCwxMjIsNzUsOTUsMTIwLDY4KQpYMyA8LSBjKDEzLjUsMTIuMSwxMS42LDEyLjUsMTMuNSwxNCwxMi41LDE0LjUpCgpkYXRhIDwtIGRhdGEuZnJhbWUoWSwgWDEsIFgyLCBYMykKZGF0YQpgYGAKCgoxLiBNdWVzdHJlIHVuYSBncmFmaWNhIGRlIGRlbnNpZGFkIGRlIGNhZGEgdmFyaWFibGUKCmBgYHtyfQpwbG90KGRlbnNpdHkoZGF0YSRYMSkpCmBgYApgYGB7cn0KcGxvdChkZW5zaXR5KGRhdGEkWDIpKQpgYGAKCmBgYHtyfQpwbG90KGRlbnNpdHkoZGF0YSRYMykpCmBgYAoyLiBNdWVzdHJlIHVuIGJyZXZlIGFuw6FsaXNpcyBlc3RhZMOtc3RpY28gcGFyYSBjYWRhIHZhcmlhYmxlIHJlY3VlcmRlIHF1ZSBwdWVkZSB1c2FyIHN1bW1hcnkoKQoKYGBge3J9CnN1bW1hcnkoZGF0YSkKYGBgCgozLiBHZW5lcmUgbGEgbWF0cml6IGRlIGNvcnJlbGFjacOzbi4KCmBgYHtyfQpjb3IoZGF0YSkKYGBgCgo0LiBNdWVzdHJlIHVuYSBncsOhZmljYSBzb2JyZSBsYSBtYXRyaXogZGUgY29ycmVsYWNpw7NuLgoKYGBge3J9CmNvcnJwbG90KGNvcihkYXRhKSkKYGBgCgo1LiBNdWVzdHJlIHVuIGRpYWdyYW1hIGRlIGRpc3BlcnNpw7NuIHBhcmEgY2FkYSB2YXJpYWJsZSBleHBsaWNhdG9yaWEgKFhpKSBjb250cmEgbGEgdmFyaWFibGUgZXhwbGljYWRhIChZKS4KCmBgYHtyfQpwbG90KGRhdGEkWDEsIGRhdGEkWSkKYGBgCgpgYGB7cn0KcGxvdChkYXRhJFgyLCBkYXRhJFkpCmBgYApgYGB7cn0KcGxvdChkYXRhJFgzLCBkYXRhJFkpCmBgYAo2LiBEaWdhIHN1IOKAnGlucHV04oCdIHNvYnJlIGNhZGEgdmFyaWFibGUuCgo3LiBVdGlsaWNlIFIgcGFyYSBnZW5lcmFyIHVuIG1vZGVsbyBkZSByZWdyZXNpw7NuIGxpbmVhbCBtw7psdGlwbGUgdXRpbGl6YW5kbyBlbCBlbmZvcXVlIG1hdHJpY2lhbCwgZXMgbmVjZXNhcmlvIHF1ZSBtdWVzdHJlIHRvZG9zIGxvcyBwYXNvcyBxdWUgcmVhbGl6YSBwYXJhIGxsZWdhciBhbCByZXN1bHRhZG8uCgpVdGlsaXphbmRvIGxhIGZvcm11bGEgJHk9XGJldGEgWCtcdmFyZXBzaWxvbiQsIHByb2NlZHJlbW9zIGEgZXh0cmFlciAkeSQgeSAkWCQKCmBgYHtyfQp5IDwtIGRhdGEkWQp4IDwtIGFzLm1hdHJpeChkYXRhWywtMV0pCmBgYApBaG9yYSBhZ3JlZ2Ftb3MgYSB4IHVuIHZlY3RvciBkZSAxcwoKYGBge3J9CnggPC0gY2JpbmQocmVwKDEsIGxlbmd0aCh5KSksIHgpCngKYGBgCkFob3JhIHV0aWxpemFuZG8gbGEgZm9ybXVhbCAkXGJldGE9KFhee1R9WCleey0xfVhee1R9eSQgY2FsY3VsYW1vcyBsb3MgYmV0YXM6CmBgYHtyfQpiZXRhcyA8LSBzb2x2ZSh0KHgpICUqJSB4KSAlKiUgdCh4KSAlKiUgeQpiZXRhcwpgYGAKCkZpbmFsbWVudGUgY29ycm9ib3JlbW9zIHF1ZSBudWVzdHJvcyBjYWxjdWxvcyBlc3RhbiBiaWVuOgpgYGB7cn0KbG1fcmVncmVzaW9uIDwtIGxtKFkgfiAuLCBkYXRhID0gZGF0YSkKbG1fcmVncmVzaW9uCmBgYAoKQ29tbyB2ZW1vcyBsb3MgY2FsY3Vsb3MgcXVlIGhpY2ltb3MgbWF0cmljaWFsbWVudGUgeSBkZSBsYSByZWdyZXNpb24gYXV0b21hdGljYSBkZSBSIHF1ZWRhbiBleGFjdGFtZW50ZSBpZ3VhbCwgZXhjZXB0byBwb3IgZWwgcmVkb25kZW8gZGUgZGVjaW1hbGVzLgo=