Taller 1

Estimación de Parámetros - Modelo de Regresión Lineal Simple

Authors

Luis Jiménez

Edwin Rios

Shaday Berastegui

Diego De Leon

Andrea Guzman

1 Problema

A continuación se muestran el peso y la presión arterial sistólica de 26 hombres seleccionados al azar, de entre 25 y 30 años:

Sujeto Peso (libras) Presión sistólica (mm Hg)
1 165 130
2 167 133
3 180 144
4 155 128
5 212 159
6 175 138
7 190 150
8 210 160
9 200 156
10 149 125
11 158 133
12 169 135
13 169 141
14 172 138
15 159 128
16 168 132
17 174 143
18 183 145
19 215 162
20 195 156
21 180 145
22 143 124
23 240 170
24 235 165
25 192 156
26 187 144

1.1 Punto 1

Estime, de manera manual (Excel), mediante mínimos cuadrados, los coeficientes de regresión del modelo.
Muestre cada uno de los pasos, cálculos y ecuaciones usadas para encontrar los parámetros.


1.2 Punto 2

Use R - RStudio para realizar la estimación de los coeficientes de regresión del modelo.
Es necesario en este punto mostrar el código usado y los resultados obtenidos.

2 Solución:

3 Punto 1. Estimación manual por mínimos cuadrados (Excel)

Sujeto Peso (libras) Presión sistólica (mm Hg) xi-xbarra yi-ybarra (xi-xbarra)(yi-ybarra) (xi-xbarra)^2 Ajustados Residuales xi*ei ei*ajustado ei^2
1 165 130 -17.423077 -13.846154 241.2426036 303.563609 134.79035 -4.7909354 -790.41524 -645.69929 22.9478879
2 167 133 -15.423077 -10.846154 167.2810651 237.871032 135.82908 -2.8290854 -472.59472 -384.38621 8.0083892
3 180 144 -2.423077 0.15384615 -0.37252747 5.872601 148.52674 -4.5267369 -436.81338 -372.13502 20.501151
4 155 128 -27.423077 -15.846154 434.5509915 752.025148 129.59283 -1.5928258 -246.86862 -206.41932 2.5371063
5 212 159 29.576923 15.153846 448.2014477 874.794379 154.78109 4.2189077 1246.77851 652.79855 17.798958
6 175 138 -7.423077 -5.8461538 43.384066 55.106532 141.54646 -3.5464585 -130.34674 -100.24724 12.577326
7 190 150 7.5769231 6.1538462 46.6271298 57.407693 147.78490 2.2150971 167.94121 327.44421 4.9072594
8 200 156 17.576923 12.153846 213.6271298 308.948225 152.91817 3.0818253 62.60365 471.77484 9.4996462
9 156 132 -26.423077 -11.846154 312.6271298 698.096148 130.51109 1.4889127 -41.44809 194.87038 2.2168466
10 160 133 -22.423077 -10.846154 243.6271298 502.794379 132.51309 0.4869127 -10.90934 64.48348 0.2370868
11 169 133 -13.423077 -10.846154 145.6271298 180.187802 136.41290 -3.4129044 -229.22554 -465.06344 11.656000
12 145 120 -37.423077 -23.846154 892.8702366 1400.512 123.68730 -3.6872956 136.00867 -455.78292 13.595225
13 163 133 -19.423077 -10.846154 210.6271298 377.287802 134.23290 -1.2329044 -41.29677 -165.48278 1.5200542
14 176 145 -6.423077 1.1538462 -7.4178755 41.273302 142.18038 2.8196173 -113.99222 400.86738 7.9482139
15 189 152 6.5769231 8.1538462 53.6271298 43.232225 147.66472 4.335278 185.10815 640.16428 18.794580
16 162 132 -20.423077 -11.846154 241.6271298 417.120532 133.79597 -1.795971 -366.51393 -241.64635 3.2275157
17 183 146 0.5769231 2.1538462 1.2426036 0.332826 145.14601 0.8539885 105.67924 124.79406 0.7293291
18 174 138 -8.423077 -5.8461538 49.2750098 70.937302 141.26874 -3.2687435 -146.96583 -462.30254 10.688672
19 195 152 12.576923 8.1538462 102.6271298 158.197909 150.38309 1.6169087 20.32913 243.87468 2.6134231
20 159 132 -23.423077 -11.846154 277.6271298 548.599225 131.12490 0.8750964 -204.99481 114.79152 0.7657862
21 188 145 5.5769231 1.1538462 6.4346034 31.106094 147.14410 -2.1440978 12.52059 -314.95916 4.5951499
22 203 156 20.576923 12.153846 250.6271298 423.452694 154.60109 1.3989127 28.80577 216.37984 1.9579613
23 191 144 8.5769231 0.15384615 1.3200581 73.567302 148.82322 -4.8232183 -412.98627 -717.97463 23.270444
24 200 152 17.576923 8.1538462 143.6271298 308.948225 152.91817 -0.9181747 -16.14308 -84.77551 0.8430316
25 192 156 9.5769231 12.153846 116.3964477 91.717545 148.82322 7.1761779 137.18261 1067.98681 51.497805
26 187 144 4.5769231 0.15384615 0.70412422 20.948224 146.22504 -2.2250396 -416.08241 -325.36561 4.9508743
Total 7958.692308 15312.3462 272.80218

Se desea estimar el modelo:

\[ Y_i = \beta_0 + \beta_1 X_i + \varepsilon_i \]

El modelo estimado es:

\[ \hat{Y}_i = \hat{\beta}_0 + \hat{\beta}_1 X_i \]

Para estimar los parámetros se realizaron los siguientes cálculos:

\[ \bar{X} = \frac{\sum X_i}{n} \qquad \bar{Y} = \frac{\sum Y_i}{n} \]

Resultados:

\[ \bar{X} = 182.4230769 \qquad \bar{Y} = 143.8461538 \]

Luego se calcularon las sumatorias necesarias:

\[ S_{xy} = \sum (X_i - \bar{X})(Y_i - \bar{Y}) \qquad S_{xx} = \sum (X_i - \bar{X})^2 \]

Resultados:

\[ S_{xy} = 7958.692308 \qquad S_{xx} = 15312.34615 \]

La pendiente se estimó como:

\[ \hat{\beta}_1 = \frac{S_{xy}}{S_{xx}} = 0.519756556 \]

El intercepto se estimó como:

\[ \hat{\beta}_0 = \bar{Y} - \hat{\beta}_1 \bar{X} = 49.03056357 \]

Modelo final estimado:

\[ \hat{Y} = 49.0306 + 0.5198X \]


4 Punto 2. Estimación usando R - RStudio

Código utilizado:

peso <- c(165, 167, 180, 155, 212, 175, 190, 210, 200, 149, 
          158, 169, 170, 172, 159, 168, 174, 183, 215, 195, 
          180, 143, 240, 235, 192, 187)

presion_sistolica <- c(130, 133, 144, 128, 159, 138, 150, 160, 
                       156, 125, 133, 135, 141, 138, 128, 132, 
                       143, 145, 162, 156, 145, 124, 170, 165, 
                       156, 144)

modelo <- lm(presion_sistolica ~ peso)
summary(modelo)

Call:
lm(formula = presion_sistolica ~ peso)

Residuals:
    Min      1Q  Median      3Q     Max 
-6.1734 -2.1658  0.2126  2.1237  7.1762 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 49.03056    5.01402   9.779 7.60e-10 ***
peso         0.51976    0.02725  19.077 5.22e-16 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.371 on 24 degrees of freedom
Multiple R-squared:  0.9381,    Adjusted R-squared:  0.9356 
F-statistic: 363.9 on 1 and 24 DF,  p-value: 5.221e-16

```

Modelo estimado en R:

\[ \hat{Y} = 49.0306 + 0.5198X \]