datos

library(wooldridge)
data(hprice1)
head(force(hprice1),n=5)
##   price assess bdrms lotsize sqrft colonial   lprice  lassess llotsize   lsqrft
## 1   300  349.1     4    6126  2438        1 5.703783 5.855359 8.720297 7.798934
## 2   370  351.5     3    9903  2076        1 5.913503 5.862210 9.200593 7.638198
## 3   191  217.7     3    5200  1374        0 5.252274 5.383118 8.556414 7.225482
## 4   195  231.8     3    4600  1448        1 5.273000 5.445875 8.433811 7.277938
## 5   373  319.1     4    6095  2514        1 5.921578 5.765504 8.715224 7.829630

estimación del modelo

options(scipen = 9999)
# 1. Cargar datos
library(stargazer)
data(hprice1)

# 2. Estimación del modelo (Solo con las variables que te dio el profesor)
# R automáticamente buscará las columnas llamadas 'price', 'lotsize', 'sqrft' y 'bdrms'
modelo_lineal <- lm(price ~ lotsize + sqrft + bdrms, data = hprice1)

# 3. Ver resultados
stargazer(modelo_lineal,type ="text",title="modelo estimado")
## 
## modelo estimado
## ===============================================
##                         Dependent variable:    
##                     ---------------------------
##                                price           
## -----------------------------------------------
## lotsize                      0.002***          
##                               (0.001)          
##                                                
## sqrft                        0.123***          
##                               (0.013)          
##                                                
## bdrms                         13.853           
##                               (9.010)          
##                                                
## Constant                      -21.770          
##                              (29.475)          
##                                                
## -----------------------------------------------
## Observations                    88             
## R2                             0.672           
## Adjusted R2                    0.661           
## Residual Std. Error      59.833 (df = 84)      
## F Statistic           57.460*** (df = 3; 84)   
## ===============================================
## Note:               *p<0.1; **p<0.05; ***p<0.01

CALCULANDO EL ESTADISTICO DE WHITE manualmente

library(stargazer)
u_i<-modelo_lineal$residuals
data_prueba_white<-as.data.frame(cbind(u_i,hprice1))
regresion_auxiliar<-lm(I(u_i^2)~lotsize+sqrft+bdrms+I(lotsize^2)+I(sqrft^2)+I(bdrms^2)+lotsize*sqrft+lotsize*bdrms+sqrft*bdrms,data = data_prueba_white)
sumario<-summary(regresion_auxiliar)
n<-nrow(data_prueba_white)
R_2<-sumario$r.squared
LM_w<-n*R_2
gl=3+3+3
p_value<-1-pchisq(q = LM_w,df = gl)
VC<-qchisq(p = 0.95,df = gl)
salida_white<-c(LM_w,VC,p_value)
names(salida_white)<-c("LMw","Valor Crítico","p value")
stargazer(salida_white,title = "Resultados de la prueba de White",type = "text",digits = 7)
## 
## Resultados de la prueba de White
## ==================================
## LMw        Valor Crítico  p value 
## ----------------------------------
## 33.7316600  16.9189800   0.0000995
## ----------------------------------

#Regla valor critico, dado que Lmw=33.73 > 16.92=v.c entonces se rechaza Ho.

Calculo de la prueba white con lmtest

library(lmtest)
prueba_white <- bptest(modelo_lineal, 
                       ~ lotsize + sqrft + bdrms + 
                         I(lotsize^2) + I(sqrft^2) + I(bdrms^2) + 
                         lotsize*sqrft + lotsize*bdrms + sqrft*bdrms, 
                       data = hprice1)
print(prueba_white)
## 
##  studentized Breusch-Pagan test
## 
## data:  modelo_lineal
## BP = 33.732, df = 9, p-value = 0.00009953

#verificación regla de decisión.regla de p-value #Como 0.00099953<0.05 se se rechaza la H0, por lo tanto hay evidencia de que la varianza de los residuos es heterocedastica

GRÁFICO DE LA PRUEBA WHITE

library(fastGraph)

# 1. Parámetros básicos
alpha_sig <- 0.05
gl_val <- 9 
VC <- qchisq(1 - alpha_sig, df = gl_val) # Esto es 16.919
LMw_val <- as.numeric(salida_white["LMw"])

# 2. Definir el límite del gráfico (Eje X)
# Forzamos a que el gráfico llegue al menos hasta 25 para que se vea la cola
limite_x <- max(25, LMw_val + 5)

# 3. Gráfica con sombreado
shadeDist( xshade = VC, 
           ddist = "dchisq", 
           parm1 = gl_val, 
           lower.tail = FALSE, 
           col = c("black", "red"), 
           xmin = 0,
           xmax = limite_x, # Esto asegura que la zona roja se vea
           main = "Prueba de White",
           sub = "" # Quitamos el sub para ponerlo más claro
           )

# 4. Líneas verticales para identificar los puntos clave
abline(v = VC, col = "red", lwd = 2, lty = 2)      # Línea en el Valor Crítico
abline(v = LMw_val, col = "blue", lwd = 3)         # Línea en tu Estadístico

# 5. Etiquetas de texto con los valores reales
# Ponemos el valor numérico justo encima de las líneas
text(x = VC, y = 0.04, labels = paste("VC:", round(VC, 4)), col = "red", font = 2, pos = 2)
text(x = LMw_val, y = 0.06, labels = paste("Lmw:", round(LMw_val, 3)), col = "blue", font = 1, pos = 2)

#7. decir si se rechaza o se aprueba la hipotesis 
if (LMw_val > VC) {
  print("Resultado: RECHAZO H0. Hay evidencia de Heterocedasticidad.\n")
} else {
  print("Resultado: NO RECHAZO H0. Los errores son Homocedásticos.\n")
}
## [1] "Resultado: RECHAZO H0. Hay evidencia de Heterocedasticidad.\n"