Ejercicio Detección de Heterocedasticidad

Importación de datos.

Utilizando los datos del dataframe hprice1: disponible en el paquete wooldridge use el siguiente código para generar el dataframe:

library(wooldridge)
data(hprice1)
head(force(hprice1),n=5) #mostrar las primeras 5 observaciones
##   price assess bdrms lotsize sqrft colonial   lprice  lassess llotsize   lsqrft
## 1   300  349.1     4    6126  2438        1 5.703783 5.855359 8.720297 7.798934
## 2   370  351.5     3    9903  2076        1 5.913503 5.862210 9.200593 7.638198
## 3   191  217.7     3    5200  1374        0 5.252274 5.383118 8.556414 7.225482
## 4   195  231.8     3    4600  1448        1 5.273000 5.445875 8.433811 7.277938
## 5   373  319.1     4    6095  2514        1 5.921578 5.765504 8.715224 7.829630

1. Estimación del siguiente modelo.

\(price = ˆα + ˆα1(lotsize) + ˆα2(sqrft) + ˆα3(bdrms) + e\)

library(stargazer)
modelo_price1 <- lm( formula = price ~ lotsize + sqrft + bdrms, data = hprice1)
stargazer(modelo_price1, title = 'Modelo estimado', type = 'text')
## 
## Modelo estimado
## ===============================================
##                         Dependent variable:    
##                     ---------------------------
##                                price           
## -----------------------------------------------
## lotsize                      0.002***          
##                               (0.001)          
##                                                
## sqrft                        0.123***          
##                               (0.013)          
##                                                
## bdrms                         13.853           
##                               (9.010)          
##                                                
## Constant                      -21.770          
##                              (29.475)          
##                                                
## -----------------------------------------------
## Observations                    88             
## R2                             0.672           
## Adjusted R2                    0.661           
## Residual Std. Error      59.833 (df = 84)      
## F Statistic           57.460*** (df = 3; 84)   
## ===============================================
## Note:               *p<0.1; **p<0.05; ***p<0.01

a) Use la libreria lmtest para verificar si su varianza residual es homocedástica a través de la prueba de White (incluya los términos cruzados).

Prueba de White Usando lmtest

options(scipen = 999999999)
library(lmtest)
Prueba_white <- bptest(modelo_price1,~I(lotsize^2)+I(sqrft^2)+I(bdrms^2)+lotsize*sqrft+lotsize*bdrms+sqrft*bdrms,data = hprice1)
print(Prueba_white)
## 
##  studentized Breusch-Pagan test
## 
## data:  modelo_price1
## BP = 33.732, df = 9, p-value = 0.00009953

Interpretación: Como resultado de la heteroscedasticidad en los residuos del modelo tenemos que 0.05 > 0.00009953 por lo tanto existe apoyo estadístico para rechazar la hipótesis nula.

Prueba de White con Calculo Manual

library(stargazer)
residuos <- modelo_price1$residuals
PW <- as.data.frame (cbind(residuos,hprice1))
regresion_aux <- lm(I(residuos^2)~lotsize+sqrft+bdrms+I(lotsize^2)+I(sqrft^2)+I(bdrms^2)+lotsize*sqrft+lotsize*bdrms+sqrft*bdrms,data=PW)
sumario <- summary(regresion_aux)
n <- nrow(PW)
R_2 <- sumario$r.squared
LMw <- n*R_2
gl=3+3+3
P_value <- 1-pchisq(q = LMw, df = gl)
VC <- qchisq(p = 0.95,df = gl)
salida_PW <- c(LMw, VC, P_value)
names(salida_PW) <- c("LMw", "Valor Critico", "P_value")

stargazer(salida_PW, title = "Resultados para la prueba White", type = "text", digits = 6) 
## 
## Resultados para la prueba White
## ================================
## LMw       Valor Critico P_value 
## --------------------------------
## 33.731660   16.918980   0.000100
## --------------------------------

Interpretación: Como resultado de la heteroscedasticidad en los residuos del modelo tenemos que 0.05 > 0.000100 por lo tanto existe apoyo estadístico para rechazar la hipótesis nula.

b) Presente sus resultados de forma gráfica a través de la librería fastGraph.

library(fastGraph)
alphan_sig<-0.05
gl<-3+3+3
u_i<-modelo_price1$residuals
data_prueba_white<-as.data.frame(cbind(u_i,hprice1))
regresion_auxiliar<-lm(formula = I(u_i^2)~lotsize+sqrft+bdrms+I(lotsize^2)+I(sqrft^2)+I(bdrms^2)+lotsize*sqrft+lotsize*bdrms+sqrft*bdrms,data = data_prueba_white)
sumario<-summary(regresion_auxiliar)
n<-nrow(data_prueba_white)
R_2<-sumario$r.squared
LM_w<-n*R_2
VC<-qchisq(p = 0.95,df = gl)
shadeDist(LM_w,ddist = "dchisq",
          parm1 = gl,
          lower.tail = FALSE, xmin = 0,
          sub=paste("VC:", round(VC,2)," ","LM_w", round(LM_w,2)))

Interpretación: Se rechaza la Ho. Hay evidencia de que la varianza de los residuos es Heterocedastica, LM_W 33.73 > VC 16.92.