Problema
A continuación se muestran el peso y la presión arterial sistólica de 26 hombres seleccionados al azar, de entre 25 y 30 años:
1
165
130
2
167
133
3
180
144
4
155
128
5
212
159
6
175
138
7
190
150
8
210
160
9
200
156
10
149
125
11
158
133
12
169
135
13
169
141
14
172
138
15
159
128
16
168
132
17
174
143
18
183
145
19
215
162
20
195
156
21
180
145
22
143
124
23
240
170
24
235
165
25
192
156
26
187
144
Punto 1
Estime, de manera manual (Excel), mediante mínimos cuadrados, los coeficientes de regresión del modelo.
Muestre cada uno de los pasos, cálculos y ecuaciones usadas para encontrar los parámetros.
Punto 2
Use R - RStudio para realizar la estimación de los coeficientes de regresión del modelo.
Es necesario en este punto mostrar el código usado y los resultados obtenidos.
Punto 1. Estimación manual por mínimos cuadrados (Excel)
1
165
130
-17.423077
-13.846154
241.2426036
303.563609
134.79035
-4.7909354
-790.41524
-645.69929
22.9478879
2
167
133
-15.423077
-10.846154
167.2810651
237.871032
135.82908
-2.8290854
-472.59472
-384.38621
8.0083892
3
180
144
-2.423077
0.15384615
-0.37252747
5.872601
148.52674
-4.5267369
-436.81338
-372.13502
20.501151
4
155
128
-27.423077
-15.846154
434.5509915
752.025148
129.59283
-1.5928258
-246.86862
-206.41932
2.5371063
5
212
159
29.576923
15.153846
448.2014477
874.794379
154.78109
4.2189077
1246.77851
652.79855
17.798958
6
175
138
-7.423077
-5.8461538
43.384066
55.106532
141.54646
-3.5464585
-130.34674
-100.24724
12.577326
7
190
150
7.5769231
6.1538462
46.6271298
57.407693
147.78490
2.2150971
167.94121
327.44421
4.9072594
8
200
156
17.576923
12.153846
213.6271298
308.948225
152.91817
3.0818253
62.60365
471.77484
9.4996462
9
156
132
-26.423077
-11.846154
312.6271298
698.096148
130.51109
1.4889127
-41.44809
194.87038
2.2168466
10
160
133
-22.423077
-10.846154
243.6271298
502.794379
132.51309
0.4869127
-10.90934
64.48348
0.2370868
11
169
133
-13.423077
-10.846154
145.6271298
180.187802
136.41290
-3.4129044
-229.22554
-465.06344
11.656000
12
145
120
-37.423077
-23.846154
892.8702366
1400.512
123.68730
-3.6872956
136.00867
-455.78292
13.595225
13
163
133
-19.423077
-10.846154
210.6271298
377.287802
134.23290
-1.2329044
-41.29677
-165.48278
1.5200542
14
176
145
-6.423077
1.1538462
-7.4178755
41.273302
142.18038
2.8196173
-113.99222
400.86738
7.9482139
15
189
152
6.5769231
8.1538462
53.6271298
43.232225
147.66472
4.335278
185.10815
640.16428
18.794580
16
162
132
-20.423077
-11.846154
241.6271298
417.120532
133.79597
-1.795971
-366.51393
-241.64635
3.2275157
17
183
146
0.5769231
2.1538462
1.2426036
0.332826
145.14601
0.8539885
105.67924
124.79406
0.7293291
18
174
138
-8.423077
-5.8461538
49.2750098
70.937302
141.26874
-3.2687435
-146.96583
-462.30254
10.688672
19
195
152
12.576923
8.1538462
102.6271298
158.197909
150.38309
1.6169087
20.32913
243.87468
2.6134231
20
159
132
-23.423077
-11.846154
277.6271298
548.599225
131.12490
0.8750964
-204.99481
114.79152
0.7657862
21
188
145
5.5769231
1.1538462
6.4346034
31.106094
147.14410
-2.1440978
12.52059
-314.95916
4.5951499
22
203
156
20.576923
12.153846
250.6271298
423.452694
154.60109
1.3989127
28.80577
216.37984
1.9579613
23
191
144
8.5769231
0.15384615
1.3200581
73.567302
148.82322
-4.8232183
-412.98627
-717.97463
23.270444
24
200
152
17.576923
8.1538462
143.6271298
308.948225
152.91817
-0.9181747
-16.14308
-84.77551
0.8430316
25
192
156
9.5769231
12.153846
116.3964477
91.717545
148.82322
7.1761779
137.18261
1067.98681
51.497805
26
187
144
4.5769231
0.15384615
0.70412422
20.948224
146.22504
-2.2250396
-416.08241
-325.36561
4.9508743
Total
7958.692308
15312.3462
272.80218
Se desea estimar el modelo:
\[
Y_i = \beta_0 + \beta_1 X_i + \varepsilon_i
\]
El modelo estimado es:
\[
\hat{Y}_i = \hat{\beta}_0 + \hat{\beta}_1 X_i
\]
Para estimar los parámetros se realizaron los siguientes cálculos:
\[
\bar{X} = \frac{\sum X_i}{n}
\qquad
\bar{Y} = \frac{\sum Y_i}{n}
\]
Resultados:
\[
\bar{X} = 182.4230769
\qquad
\bar{Y} = 143.8461538
\]
Luego se calcularon las sumatorias necesarias:
\[
S_{xy} = \sum (X_i - \bar{X})(Y_i - \bar{Y})
\qquad
S_{xx} = \sum (X_i - \bar{X})^2
\]
Resultados:
\[
S_{xy} = 7958.692308
\qquad
S_{xx} = 15312.34615
\]
La pendiente se estimó como:
\[
\hat{\beta}_1 = \frac{S_{xy}}{S_{xx}} = 0.519756556
\]
El intercepto se estimó como:
\[
\hat{\beta}_0 = \bar{Y} - \hat{\beta}_1 \bar{X} = 49.03056357
\]
Modelo final estimado:
\[
\hat{Y} = 49.0306 + 0.5198X
\]
Punto 2. Estimación usando R - RStudio
Código utilizado:
peso <- c (165 , 167 , 180 , 155 , 212 , 175 , 190 , 210 , 200 , 149 ,
158 , 169 , 170 , 172 , 159 , 168 , 174 , 183 , 215 , 195 ,
180 , 143 , 240 , 235 , 192 , 187 )
presion_sistolica <- c (130 , 133 , 144 , 128 , 159 , 138 , 150 , 160 ,
156 , 125 , 133 , 135 , 141 , 138 , 128 , 132 ,
143 , 145 , 162 , 156 , 145 , 124 , 170 , 165 ,
156 , 144 )
modelo <- lm (presion_sistolica ~ peso)
summary (modelo)
Call:
lm(formula = presion_sistolica ~ peso)
Residuals:
Min 1Q Median 3Q Max
-6.1734 -2.1658 0.2126 2.1237 7.1762
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 49.03056 5.01402 9.779 7.60e-10 ***
peso 0.51976 0.02725 19.077 5.22e-16 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 3.371 on 24 degrees of freedom
Multiple R-squared: 0.9381, Adjusted R-squared: 0.9356
F-statistic: 363.9 on 1 and 24 DF, p-value: 5.221e-16
```
Modelo estimado en R:
\[
\hat{Y} = 49.0306 + 0.5198X
\]