Taller 1: estimación de parámetros modelo regresión lineal simple.

Presentado por:

FRANSISCO LÓPEZ

MARÍA JOSÉ LÓPEZ

DUVAN OTERO

NILSON VILLADIEGO

Problema

A continuación se muestran el peso y la presión arterial sistólica de 26 hombres seleccionados al azar, de entre 25 y 30 años:

sujeto Peso(libras) Presión sistólica(mm Hg)
1 165 130
2 167 133
3 180 144
4 155 128
5 212 159
6 175 138
7 190 150
8 210 160
9 200 156
10 149 125
11 158 133
12 169 135
13 169 141
14 172 138
15 159 128
16 168 132
17 174 143
18 183 145
19 215 162
20 195 156
21 180 145
22 143 124
23 240 170
24 235 165
25 192 156
26 187 144

PUNTO 1

(15%) Verifique de manera gráfica el supuesto de normalidad usando R.

PUNTO 2

(35%) Verifique de manera formal mediante el Test de Kolmogorov - Smirnov el supuesto de normalidad usando R.

PUNTO 3

(15%) Verifique de manera gráfica el supuesto de homogeneidad de la varianza usando R.

PUNTO 4

(35%) Verifique de manera formal mediante el Test de Breuch-Pagan el supuesto de homogeneidad de la varianza usando R.

SOLUCION:

Ecuciones usadas:

  1. \[ e_i = y_i - \hat{y}_i \]

  2. \[ e_i = y_i - E(y_i) \]

  3. \[ y_i = \beta_0 + \beta_1 x_i + \varepsilon_i \]

  4. \[ \bar{e} = \frac{\sum_{i=1}^{n} e_i}{n} = 0 \]

  5. \[ s^2 = \frac{\sum_{i=1}^{n}(e_i - \bar{e})^2}{n - 2} \]

  6. \[ s^2 = \frac{\sum_{i=1}^{n} e_i^2}{n - 2} \]

  7. \[ s^2 = \frac{SSE}{n - 2} \]

  8. \[ s^2 = MSE \]

  9. \[ e_i^* = \frac{e_i - \bar{e}}{\sqrt{MSE}} \]

  10. \[ e_i^* = \frac{e_i}{\sqrt{MSE}} \]

  11. \[ \log_e \sigma_i^2 = \gamma_0 + \gamma_1 x_i \]

  12. \[ BP = nR^2 \]

  13. \[ X^2_{BP} = \frac{SSR^*/2}{\left[\frac{SSE}{n}\right]^2} \]

  14. \[ BP \sim X^2_{\alpha,1} \]

  15. \[ X^2_{BP} \sim X^2_{\alpha,1} \]

  16. \[ X^2_{BP} > X^2_{\alpha,1} \]

PUNTO 1

(15%) Verifique de manera gráfica el supuesto de normalidad usando R.

peso<-c(165, 167, 180, 155, 212, 175, 190, 210, 200, 149, 158, 169, 170, 172, 159, 168, 174, 183, 215, 195, 180, 143, 240, 235, 192, 187)
presion<-c(130, 133, 144, 128, 159, 138, 150, 160, 156, 125, 133, 135, 141, 138, 128, 132, 143, 145, 162, 156, 145, 124, 170, 165, 156, 144)

#Modelo

modelo<-lm(presion~peso)
resumen<-summary(modelo)

#Residuales
Residuales<-modelo$residuals


#QQPLOT
qqnorm(Residuales)
qqline(Residuales)

hipotesis:

\[ H_0 : \gamma_1 = 0 \]

\[ H_1 : \gamma_1 \neq 0 \]

Conclusión:

En el gráfico Q-Q los puntos siguen aproximadamente la línea recta, por lo tanto se acepta la hipótesis nula, indicando que los residuos siguen una distribución normal.

PUNTO 2

(35%) Verifique de manera formal mediante el Test de Kolmogorov - Smirnov el supuesto de normalidad usando R.

modelo <- lm(peso ~ presion)
residuales <- modelo$residuals

# Carga de librería y Test
library(nortest)
lillie.test(residuales)

    Lilliefors (Kolmogorov-Smirnov) normality test

data:  residuales
D = 0.063004, p-value = 0.9975

hipotesis:

\[ H_0 : \gamma_1 = 0 \]

\[ H_1 : \gamma_1 \neq 0 \]

Conclusión:

Como el valor p es mayor a 0.05, se acepta la hipótesis nula, indicando que los residuos siguen una distribución normal.

PUNTO 3

(15%) Verifique de manera gráfica el supuesto de homogeneidad de la varianza usando R.

library(ggplot2)
library(plotly)
#Datos
observacion <- c(1:26)

#Modelo
modelo <- lm(peso~presion)

#Ajustados y residuales
ajustados <- modelo$fitted.values
residuales <- modelo$residuals


#Dataframe
datos <- data.frame(observacion, ajustados, residuales)

# Para líneas horizontales en el gráfico
maximo <-max(residuales) 
minimo <- min(residuales)

#Grafico
grafico <- ggplot(data=datos, aes(x=ajustados, y=residuales)) + geom_point()
grafico <- grafico + xlab("Ajustados") + ylab("Residuales") + ggtitle("Verificación Homocedasticidad")
grafico <- grafico + geom_hline (yintercept = c(maximo+5,minimo-5) )
grafico <- grafico + geom_hline(yintercept=0,linetype="dashed", color="blue")
grafico <- grafico + theme_classic()
ggplotly(grafico)

hipotesis:

\[ H_0 : \gamma_1 = 0 \]

\[ H_1 : \gamma_1 \neq 0 \]

Conclusión:

Se observa que los residuos se distribuyen de forma aleatoria alrededor de cero, por lo tanto se acepta la hipótesis nula, indicando homogeneidad de varianza.

PUNTO 4

(35%) Verifique de manera formal mediante el Test de Breuch-Pagan el supuesto de homogeneidad de la varianza usando R.

#Breuch - Pagan Test
library(lmtest)
bptest(modelo)

    studentized Breusch-Pagan test

data:  modelo
BP = 5.4478, df = 1, p-value = 0.01959

hipotesis:

\[ H_0 : \gamma_1 = 0 \]

\[ H_1 : \gamma_1 \neq 0 \]

Conclusión:

Como el valor p es mayor a 0.05, se acepta la hipótesis nula, indicando que existe homogeneidad de varianza.