Ejercicio Heterocedasticidad

library(wooldridge)

## Warning: package 'wooldridge' was built under R version 4.5.3

data(hprice1)
head(force(hprice1), n = 5)

##   price assess bdrms lotsize sqrft colonial   lprice  lassess llotsize   lsqrft
## 1   300  349.1     4    6126  2438        1 5.703783 5.855359 8.720297 7.798934
## 2   370  351.5     3    9903  2076        1 5.913503 5.862210 9.200593 7.638198
## 3   191  217.7     3    5200  1374        0 5.252274 5.383118 8.556414 7.225482
## 4   195  231.8     3    4600  1448        1 5.273000 5.445875 8.433811 7.277938
## 5   373  319.1     4    6095  2514        1 5.921578 5.765504 8.715224 7.829630

Estimaciòn del Modelo

library(wooldridge)
data(hprice1)

modelo <- lm(price ~ lotsize + sqrft + bdrms, data = hprice1)

summary(modelo)

## 
## Call:
## lm(formula = price ~ lotsize + sqrft + bdrms, data = hprice1)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -120.026  -38.530   -6.555   32.323  209.376 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -2.177e+01  2.948e+01  -0.739  0.46221    
## lotsize      2.068e-03  6.421e-04   3.220  0.00182 ** 
## sqrft        1.228e-01  1.324e-02   9.275 1.66e-14 ***
## bdrms        1.385e+01  9.010e+00   1.537  0.12795    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 59.83 on 84 degrees of freedom
## Multiple R-squared:  0.6724, Adjusted R-squared:  0.6607 
## F-statistic: 57.46 on 3 and 84 DF,  p-value: < 2.2e-16

2. Use la libreria lmtest para verificar si su varianza residual es homocedástica a través de la prueba de White (incluya los términos cruzados).

Calculo Manual

library(stargazer)

## 
## Please cite as:

##  Hlavac, Marek (2022). stargazer: Well-Formatted Regression and Summary Statistics Tables.

##  R package version 5.2.3. https://CRAN.R-project.org/package=stargazer

resid <- modelo$residuals
data_reg_aux <- as.data.frame(cbind(resid, hprice1))
reg_aux <- lm(I(resid^2) ~ lotsize + sqrft + bdrms +
                           I(lotsize^2) + I(sqrft^2) + I(bdrms^2) +
                           lotsize*sqrft + lotsize*bdrms + sqrft*bdrms,
              data = data_reg_aux)
resumen <- summary(reg_aux)
R_2 <- resumen$r.squared
n <- nrow(data_reg_aux)
LM_W <- n * R_2

gl <- 9  
VC <- qchisq(p = 0.95, df = gl)
p_value <- 1 - pchisq(q = LM_W, df = gl)
salida_prueba <- c(LM_W, VC, p_value)
names(salida_prueba) <- c("LMW", "Valor Critico", "P value")

stargazer(salida_prueba, title = "Prueba de White", type = "text", digits = 6)

## 
## Prueba de White
## ================================
## LMW       Valor Critico P value 
## --------------------------------
## 33.731660   16.918980   0.000100
## --------------------------------

Usando “skedastic”

library(skedastic)

## Warning: package 'skedastic' was built under R version 4.5.3

white(modelo, interactions = TRUE)

## # A tibble: 1 × 5
##   statistic   p.value parameter method       alternative
##       <dbl>     <dbl>     <dbl> <chr>        <chr>      
## 1      33.7 0.0000995         9 White's Test greater

Usando lmtest

library(lmtest)

## Cargando paquete requerido: zoo

## 
## Adjuntando el paquete: 'zoo'

## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric

prueba_white <- bptest(modelo,
                       ~ lotsize + sqrft + bdrms +
                         I(lotsize^2) + I(sqrft^2) + I(bdrms^2) +
                         lotsize*sqrft + lotsize*bdrms + sqrft*bdrms,
                       data = hprice1)
print(prueba_white)

## 
##  studentized Breusch-Pagan test
## 
## data:  modelo
## BP = 33.732, df = 9, p-value = 9.953e-05

La prueba de White (implementada mediante el test de Breusch-Pagan con términos cuadrados e interacciones) arroja un p-value de 9.953e-05, el cual es menor al nivel de significancia del 5%. Por lo tanto, se rechaza la hipótesis nula de homocedasticidad, concluyendo que existe evidencia estadísticamente significativa de heterocedasticidad en el modelo.

Grafica.

residuos <- residuals(modelo)
ajustados <- fitted(modelo)

plot(ajustados, residuos,
     main = "Residuos vs Valores Ajustados",
     xlab = "Valores Ajustados",
     ylab = "Residuos",
     pch = 19)

abline(h = 0, col = "red", lwd = 2)

El gráfico de residuos frente a los valores ajustados muestra que la dispersión de los errores no es constante a lo largo de los valores predichos. En particular, se observa que a medida que aumentan los valores ajustados, la variabilidad de los residuos tiende a incrementarse, lo cual sugiere la presencia de heterocedasticidad en el modelo.