peso<-c(165, 167, 180, 155, 212, 175, 190, 210, 200, 149, 158, 169, 170, 172, 159, 168, 174, 183, 215, 195, 180, 143, 240, 235, 192, 187)
presion<-c(130, 133, 144, 128, 159, 138, 150, 160, 156, 125, 133, 135, 141, 138, 128, 132, 143, 145, 162, 156, 145, 124, 170, 165, 156, 144)
#Modelo
modelo<-lm(presion~peso)
resumen<-summary(modelo)
#Residuales
Residuales<-modelo$residuals
#QQPLOT
qqnorm(Residuales)
qqline(Residuales)Taller 1: estimación de parámetros modelo regresión lineal simple.
Presentado por:
FRANSISCO LÓPEZ
MARÍA JOSÉ LÓPEZ
DUVAN OTERO
NILSON VILLADIEGO
Problema
A continuación se muestran el peso y la presión arterial sistólica de 26 hombres seleccionados al azar, de entre 25 y 30 años:
| sujeto | Peso(libras) | Presión sistólica(mm Hg) |
|---|---|---|
| 1 | 165 | 130 |
| 2 | 167 | 133 |
| 3 | 180 | 144 |
| 4 | 155 | 128 |
| 5 | 212 | 159 |
| 6 | 175 | 138 |
| 7 | 190 | 150 |
| 8 | 210 | 160 |
| 9 | 200 | 156 |
| 10 | 149 | 125 |
| 11 | 158 | 133 |
| 12 | 169 | 135 |
| 13 | 169 | 141 |
| 14 | 172 | 138 |
| 15 | 159 | 128 |
| 16 | 168 | 132 |
| 17 | 174 | 143 |
| 18 | 183 | 145 |
| 19 | 215 | 162 |
| 20 | 195 | 156 |
| 21 | 180 | 145 |
| 22 | 143 | 124 |
| 23 | 240 | 170 |
| 24 | 235 | 165 |
| 25 | 192 | 156 |
| 26 | 187 | 144 |
PUNTO 1
(15%) Verifique de manera gráfica el supuesto de normalidad usando R.
PUNTO 2
(35%) Verifique de manera formal mediante el Test de Kolmogorov - Smirnov el supuesto de normalidad usando R.
PUNTO 3
(15%) Verifique de manera gráfica el supuesto de homogeneidad de la varianza usando R.
PUNTO 4
(35%) Verifique de manera formal mediante el Test de Breuch-Pagan el supuesto de homogeneidad de la varianza usando R.
SOLUCION:
Ecuciones usadas:
\[ e_i = y_i - \hat{y}_i \]
\[ e_i = y_i - E(y_i) \]
\[ y_i = \beta_0 + \beta_1 x_i + \varepsilon_i \]
\[ \bar{e} = \frac{\sum_{i=1}^{n} e_i}{n} = 0 \]
\[ s^2 = \frac{\sum_{i=1}^{n}(e_i - \bar{e})^2}{n - 2} \]
\[ s^2 = \frac{\sum_{i=1}^{n} e_i^2}{n - 2} \]
\[ s^2 = \frac{SSE}{n - 2} \]
\[ s^2 = MSE \]
\[ e_i^* = \frac{e_i - \bar{e}}{\sqrt{MSE}} \]
\[ e_i^* = \frac{e_i}{\sqrt{MSE}} \]
\[ \log_e \sigma_i^2 = \gamma_0 + \gamma_1 x_i \]
\[ BP = nR^2 \]
\[ X^2_{BP} = \frac{SSR^*/2}{\left[\frac{SSE}{n}\right]^2} \]
\[ BP \sim X^2_{\alpha,1} \]
\[ X^2_{BP} \sim X^2_{\alpha,1} \]
\[ X^2_{BP} > X^2_{\alpha,1} \]
PUNTO 1
(15%) Verifique de manera gráfica el supuesto de normalidad usando R.
hipotesis:
\[ H_0 : \gamma_1 = 0 \]
\[ H_1 : \gamma_1 \neq 0 \]
Conclusión:
En el gráfico Q-Q los puntos siguen aproximadamente la línea recta, por lo tanto se acepta la hipótesis nula, indicando que los residuos siguen una distribución normal.
PUNTO 2
(35%) Verifique de manera formal mediante el Test de Kolmogorov - Smirnov el supuesto de normalidad usando R.
modelo <- lm(peso ~ presion)
residuales <- modelo$residuals
# Carga de librería y Test
library(nortest)
lillie.test(residuales)
Lilliefors (Kolmogorov-Smirnov) normality test
data: residuales
D = 0.063004, p-value = 0.9975
hipotesis:
\[ H_0 : \gamma_1 = 0 \]
\[ H_1 : \gamma_1 \neq 0 \]
Conclusión:
Como el valor p es mayor a 0.05, se acepta la hipótesis nula, indicando que los residuos siguen una distribución normal.
PUNTO 3
(15%) Verifique de manera gráfica el supuesto de homogeneidad de la varianza usando R.
library(ggplot2)
library(plotly)
#Datos
observacion <- c(1:26)
#Modelo
modelo <- lm(peso~presion)
#Ajustados y residuales
ajustados <- modelo$fitted.values
residuales <- modelo$residuals
#Dataframe
datos <- data.frame(observacion, ajustados, residuales)
# Para líneas horizontales en el gráfico
maximo <-max(residuales)
minimo <- min(residuales)
#Grafico
grafico <- ggplot(data=datos, aes(x=ajustados, y=residuales)) + geom_point()
grafico <- grafico + xlab("Ajustados") + ylab("Residuales") + ggtitle("Verificación Homocedasticidad")
grafico <- grafico + geom_hline (yintercept = c(maximo+5,minimo-5) )
grafico <- grafico + geom_hline(yintercept=0,linetype="dashed", color="blue")
grafico <- grafico + theme_classic()
ggplotly(grafico)hipotesis:
\[ H_0 : \gamma_1 = 0 \]
\[ H_1 : \gamma_1 \neq 0 \]
Conclusión:
Se observa que los residuos se distribuyen de forma aleatoria alrededor de cero, por lo tanto se acepta la hipótesis nula, indicando homogeneidad de varianza.
PUNTO 4
(35%) Verifique de manera formal mediante el Test de Breuch-Pagan el supuesto de homogeneidad de la varianza usando R.
#Breuch - Pagan Test
library(lmtest)
bptest(modelo)
studentized Breusch-Pagan test
data: modelo
BP = 5.4478, df = 1, p-value = 0.01959
hipotesis:
\[ H_0 : \gamma_1 = 0 \]
\[ H_1 : \gamma_1 \neq 0 \]
Conclusión:
Como el valor p es mayor a 0.05, se acepta la hipótesis nula, indicando que existe homogeneidad de varianza.