Resuelva los siguientes ejercicios:

1. Sea el conjunto de datos, indicados en el enlace de abajo, tomados en 24 meses correspondientes a los gastos de comercialización (C) de una empresa, el nivel de ventas (V), su coste de personal (P) y los costes de materias primas (M); se trata de estimar el nivel de ventas a partir de las restantes variables.

a) Verifique los supuestos de Heterocedastidad y Autocorrelación para el modelo propuesto.

b) En caso de encontrar evidencia de violación de los supuestos, planteados en el literal anterior, corrija a través de un estimador HAC apropiado, el modelo propuesto.

estimando el modelo

options(scipen = 999)
library(stargazer)
library(readxl)
ventas_empresa <- read_excel("C:/Users/manue/Desktop/Practicas_ECMA/datos_Rdata/Datos_Examen2/ventas_empresa.xlsx")
modelo_ventas<-lm(formula = V~C+P+M,data = ventas_empresa)
stargazer(modelo_ventas,title = "Regresión de Modelo Ventas",type = "html",digits = 6)
Regresión de Modelo Ventas
Dependent variable:
V
C 0.922567***
(0.222733)
P 0.950177***
(0.155845)
M 1.297786***
(0.430729)
Constant 107.443500***
(18.057490)
Observations 24
R2 0.979817
Adjusted R2 0.976789
Residual Std. Error 9.505570 (df = 20)
F Statistic 323.641500*** (df = 3; 20)
Note: p<0.1; p<0.05; p<0.01

Pruebas de Heterocedásticidad y Autocorrelación

Prueba de White de forma manual

library(stargazer)
u_i<-modelo_ventas$residuals
data_prueba_white<-as.data.frame(cbind(u_i,ventas_empresa))
regresion_auxiliar<-lm(I(u_i^2)~C+P+M+I(C^2)+I(P^2)+I(M^2)+C*P+C*M+P*M,data = data_prueba_white)
sumario<-summary(regresion_auxiliar)
n<-nrow(data_prueba_white)
R_2<-sumario$r.squared
LM_w<-n*R_2
gl=3+3+3
p_value<-1-pchisq(q = LM_w,df = gl)
VC<-qchisq(p = 0.95,df = gl)
salida_white<-c(LM_w,VC,p_value)
names(salida_white)<-c("LMw","Valor Crítico","p value")
stargazer(salida_white,title = "Resultados de la prueba de White",type = "html",digits = 6)
Resultados de la prueba de White
LMw Valor Crítico p value
7.122650 16.918980 0.624351

Prueba de White Usando la librería “lmtest”

library(lmtest)
prueba_white<-bptest(modelo_ventas,~I(C^2)+I(P^2)+I(M^2)+C*P+C*M+P*M,data =ventas_empresa)
print(prueba_white)
## 
##  studentized Breusch-Pagan test
## 
## data:  modelo_ventas
## BP = 7.1227, df = 9, p-value = 0.6244

Como 0.624351>0.05(P>alfa) No se rechaza la H0, por lo tanto hay evidencia de que la varianza de los residuos es homocedástica.

De igual forma tomando en cuenta los resultados de LMw, como 7.122650<16.918980(LMw<VC), da evidencia de que la varianza de los residuos es homocedástica.

Pruebas de Autocorrelación

Autocorrelación de 1° orden

Prueba de Durbin – Watson.

Usando libreria “lmtest”

library(lmtest)
dwtest(modelo_ventas,alternative = "two.sided",iterations = 10000)
## 
##  Durbin-Watson test
## 
## data:  modelo_ventas
## DW = 1.2996, p-value = 0.05074
## alternative hypothesis: true autocorrelation is not 0

Usando libreria “car”

library(car)
durbinWatsonTest(modelo_ventas,simulate = TRUE,reps = 10000)
##  lag Autocorrelation D-W Statistic p-value
##    1       0.3013888      1.299572  0.0552
##  Alternative hypothesis: rho != 0

En ambos casos los resultados obtenidos son no concluyentes, pero si tomamos como referencia el p-value,se puede rechazar la presencia de autocorrelación de primer orden (No se rechaza la H0), ya que el pvalue>0.05

Autocorrelación de orden superior (calculo manual)

1.Preparación de datos:

library(dplyr)
library(tidyr)
library(kableExtra)
cbind(u_i,ventas_empresa) %>% 
  as.data.frame() %>% 
  mutate(Lag_1=dplyr::lag(u_i,1),
         Lag_2=dplyr::lag(u_i,2)) %>% 
  replace_na(list(Lag_1=0,Lag_2=0))->data_prueba_BG
kable(head(data_prueba_BG,6))
u_i V C P M Lag_1 Lag_2
10.673678 607 197 173 110 0.000000 0.000000
7.372511 590 208 152 107 10.673678 0.000000
-2.435532 543 181 150 99 7.372511 10.673678
-3.322264 558 194 150 102 -2.435532 7.372511
-9.913932 571 192 163 109 -3.322264 -2.435532
8.704039 615 196 179 114 -9.913932 -3.322264

2.Calculando la regresión auxiliar y el estadístico LMBP

regresion_auxiliar_BG<-lm(u_i~C+P+M+Lag_1+Lag_2,data = data_prueba_BG)
sumario_BG<-summary(regresion_auxiliar_BG)
R_2_BG<-sumario_BG$r.squared
n<-nrow(data_prueba_BG)
LM_BG<-n*R_2_BG
gl=2
p_value<-1-pchisq(q = LM_BG,df = gl)
VC<-qchisq(p = 0.95,df = gl)
salida_bg<-c(LM_BG,VC,p_value)
names(salida_bg)<-c("LMbg","Valor Crítico","p value")
stargazer(salida_bg,title = "Resultados de la prueba de Breusch Godfrey",type = "html",digits = 6)
Resultados de la prueba de Breusch Godfrey
LMbg Valor Crítico p value
3.840869 5.991465 0.146543

Autocorrelación de orden superior usando la librería “lmtest”

library(lmtest)
bgtest(modelo_ventas,order = 2)
## 
##  Breusch-Godfrey test for serial correlation of order up to 2
## 
## data:  modelo_ventas
## LM test = 3.8409, df = 2, p-value = 0.1465

En ambos casos puede concluirse que,como pvalue>0.05 No se rechaza H0, por lo tanto puede concluirse que los residuos del modelo, no siguen autocorrelación de orden “2”

De igual forma por el valor obtenido en LMbg, dado que (LMbg<VC), puede afirmarse de que los residuos del modelo, no siguen autocorrelación de orden “2”

verificando la autocorrelación de 1° orden a travez del test BG:

library(lmtest)
bgtest(modelo_ventas,order = 1)
## 
##  Breusch-Godfrey test for serial correlation of order up to 1
## 
## data:  modelo_ventas
## LM test = 2.5963, df = 1, p-value = 0.1071

utilizando el esquema de evaluación de la prueba DW, el valor obtenido en la prueba nuevamente es NO concluyente, por lo cual La prueba no aporta evidencia, pero si tomamos el p-value como referencia,pvalue>0.05 por lo que se puede rechazar la presencia de autocorrelación de orden 1 (No se rechaza la H0).

2.Se tienen los datos para trabajadores hombres,en el archivo adjunto, con ellos estime un modelo donde educ es años de escolaridad, como variable dependiente, y como regresores sibs (número de hermanos), meduc (años de escolaridad de la madre) y feduc (años de escolaridad del padre)

a) Verifique los supuestos de Heterocedastidad y Autocorrelación para el modelo propuesto.

b) En caso de encontrar evidencia de violación de los supuestos, planteados en el literal anterior, corrija a través de un estimador HAC apropiado, el modelo propuesto.

estimando el modelo

options(scipen = 999)
library(stargazer)
load("C:/Users/manue/Desktop/Practicas_ECMA/datos_Rdata/Datos_Examen2/wage2.rdata")
regresion_lineal<-lm(formula =  educ~sibs+meduc+feduc,data = wage2)
stargazer(regresion_lineal, title = "Modelo Escolaridad", type = "html",digits = 6)
Modelo Escolaridad
Dependent variable:
educ
sibs -0.093636***
(0.034471)
meduc 0.130787***
(0.032689)
feduc 0.210004***
(0.027475)
Constant 10.364260***
(0.358500)
Observations 722
R2 0.214094
Adjusted R2 0.210810
Residual Std. Error 1.987052 (df = 718)
F Statistic 65.198250*** (df = 3; 718)
Note: p<0.1; p<0.05; p<0.01

Pruebas de Heterocedásticidad y Autocorrelación

Prueba de White

load("C:/Users/manue/Desktop/Practicas_ECMA/datos_Rdata/Datos_Examen2/wage2.rdata")
library(lmtest)
prueba_white<-bptest(regresion_lineal,~I(sibs^2)+I(meduc^2)+I(feduc^2)+sibs*meduc+sibs*feduc+meduc*feduc,data = wage2)
print(prueba_white)
## 
##  studentized Breusch-Pagan test
## 
## data:  regresion_lineal
## BP = 15.537, df = 9, p-value = 0.0772

Como 0.0772>0.05 No se rechaza la H0, por lo tanto hay evidencia de que la varianza de los residuos es homocedástica.

Autocorrelación

Autocorrelación de 1° orden

Prueba de Durbin – Watson.

Usando libreria “lmtest”

library(lmtest)
dwtest(regresion_lineal,alternative = "two.sided",iterations = 10000)
## 
##  Durbin-Watson test
## 
## data:  regresion_lineal
## DW = 1.8989, p-value = 0.1705
## alternative hypothesis: true autocorrelation is not 0

Usando libreria “car”

library(car)
durbinWatsonTest(regresion_lineal,simulate = TRUE,reps = 10000)
##  lag Autocorrelation D-W Statistic p-value
##    1      0.05018452      1.898938   0.172
##  Alternative hypothesis: rho != 0

En ambos casos, se puede rechazar la presencia de autocorrelación de orden 1 (No se rechaza la H0), ya que el pvalue>0.05

De igual forma utilizando el esquema de evaluación de la prueba DW, el valor obtenido es cercano a 2, cae en la zona de no rechazo de Ho, por lo que hay evidencia de no autocorrelacion de orden 1.

Autocorrelación de orden superior

library(lmtest)
bgtest(regresion_lineal,order = 2)
## 
##  Breusch-Godfrey test for serial correlation of order up to 2
## 
## data:  regresion_lineal
## LM test = 4.5747, df = 2, p-value = 0.1015

Como pvalue>0.05 No se rechaza H0, por lo tanto puede concluirse que los residuos del modelo, no siguen autocorrelación de orden “2”

verificando la autocorrelación de 1° orden a travez de el test BG

library(lmtest)
bgtest(regresion_lineal,order = 1)
## 
##  Breusch-Godfrey test for serial correlation of order up to 1
## 
## data:  regresion_lineal
## LM test = 1.8207, df = 1, p-value = 0.1772

de igual forma como pvalue>0.05 No se rechaza H0, por lo tanto puede concluirse que los residuos del modelo, no siguen autocorrelación de 1° orden

3. El sueldo inicial medio (salary) para los recién graduados de la Facultad de Economía se determina mediante una función lineal: log(salary)=f(SAT,GPA ,log(libvol),log(cost),rank)

Donde LSAT es la media del puntaje LSAT del grupo de graduados, GPA es la media del GPA (promedio general) del grupo, libvol es el número de volúmenes en la biblioteca de la Facultad de Economía, cost es el costo anual por asistir a dicha facultad y rank es una clasificación de las escuelas de Economía (siendo rank 1 la mejor)

a) Verifique los supuestos de Heterocedastidad y Autocorrelación para el modelo propuesto.

b) En caso de encontrar evidencia de violación de los supuestos, planteados en el literal anterior, corrija a través de un estimador HAC apropiado, el modelo propuesto.

estimando el modelo

options(scipen = 9999)
library(stargazer)
load("C:/Users/manue/Desktop/Practicas_ECMA/datos_Rdata/Datos_Examen2/LAWSCH85.RData")
library(dplyr)
modelo_salary<- lm(formula= lsalary~LSAT+GPA+llibvol+lcost+rank, data = LAWSCH85)
stargazer(modelo_salary,title = " Regresión de modelo Salary",type = "html",digits = 6)
Regresión de modelo Salary
Dependent variable:
lsalary
LSAT 0.004696
(0.004010)
GPA 0.247524***
(0.090037)
llibvol 0.094993***
(0.033254)
lcost 0.037554
(0.032106)
rank -0.003325***
(0.000348)
Constant 8.343226***
(0.532519)
Observations 136
R2 0.841685
Adjusted R2 0.835596
Residual Std. Error 0.112412 (df = 130)
F Statistic 138.229800*** (df = 5; 130)
Note: p<0.1; p<0.05; p<0.01

Pruebas de Heterocedásticidad y Autocorrelación

Prueba de White

load("C:/Users/manue/Desktop/Practicas_ECMA/datos_Rdata/Datos_Examen2/LAWSCH85.RData")
library(lmtest)
prueba_white<-bptest(modelo_salary,~I(LSAT^2)+I(GPA^2)+I(llibvol^2)+I(lcost^2)+I(rank^2)+LSAT*GPA+ LSAT* llibvol+ LSAT* lcost+ LSAT* rank+ GPA* llibvol+ GPA* lcost+ GPA* rank+ llibvol* lcost+ llibvol* rank+ lcost* rank,data = LAWSCH85)
print(prueba_white)
## 
##  studentized Breusch-Pagan test
## 
## data:  modelo_salary
## BP = 34.295, df = 20, p-value = 0.0242

Como 0.0242<0.05 SI se rechaza la H0, por lo tanto hay evidencia de que la varianza de los residuos NO es homocedástica.

Autocorrelación

Autocorrelación de 1° orden

Prueba de Durbin – Watson.

Usando libreria “lmtest”

library(lmtest)
dwtest(modelo_salary,alternative = "two.sided",iterations = 10000)
## 
##  Durbin-Watson test
## 
## data:  modelo_salary
## DW = 1.7058, p-value = 0.07519
## alternative hypothesis: true autocorrelation is not 0

Usando libreria “car”

library(car)
durbinWatsonTest(modelo_salary,simulate = TRUE,reps = 1000)
##  lag Autocorrelation D-W Statistic p-value
##    1        0.144458      1.705846    0.07
##  Alternative hypothesis: rho != 0

Tomando como referencia el esquema, el DW calculado, cae en la zona de No concluyente,por lo que el valor obtenido no aporta evidencia, pero si nos basamos en el pvalue,en ambos casos, se puede rechazar la presencia de autocorrelación de orden 1 (No se rechaza la H0), ya que el pvalue>0.05

Autocorrelación de orden superior

library(lmtest)
bgtest(modelo_salary,order = 2)
## 
##  Breusch-Godfrey test for serial correlation of order up to 2
## 
## data:  modelo_salary
## LM test = 3.2116, df = 2, p-value = 0.2007

Como pvalue>0.05 No se rechaza H0, por lo tanto puede concluirse que los residuos del modelo, no siguen autocorrelación de orden “2”

verificando la autocorrelación de 1° orden, Nuevamente a travez de el test BG:

library(lmtest)
bgtest(modelo_salary,order = 1)
## 
##  Breusch-Godfrey test for serial correlation of order up to 1
## 
## data:  modelo_salary
## LM test = 2.9379, df = 1, p-value = 0.08652

Como pvalue>0.05 No se rechaza H0, por lo tanto puede concluirse que los residuos del modelo, no siguen autocorrelación de 1° orden

Estimadores HAC

Estimación Robusta (uso del estimador HAC)

dado que al realizar las pruebas de Heterocedásticidad y Autocorrelación se evidencio la presencia de Heterocedásticidad procederemos a corregirlo a travez de el estimador HAC

Sin corregir

options(scipen = 99999)
library(lmtest)
#Sin corregir:
coeftest(modelo_salary)
## 
## t test of coefficients:
## 
##                Estimate  Std. Error t value              Pr(>|t|)    
## (Intercept)  8.34322596  0.53251920 15.6675 < 0.00000000000000022 ***
## LSAT         0.00469647  0.00401049  1.1710              0.243722    
## GPA          0.24752388  0.09003704  2.7491              0.006826 ** 
## llibvol      0.09499321  0.03325435  2.8566              0.004988 ** 
## lcost        0.03755380  0.03210608  1.1697              0.244270    
## rank        -0.00332459  0.00034846 -9.5408 < 0.00000000000000022 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Corregido (usando un estimador HAC)

options(scipen = 99999)
library(lmtest)
library(sandwich)
#Corregido
#HC0 Corrige Sólo Heterocedasticidad
estimacion_omega<-vcovHC(modelo_salary,type = "HC0") 

coeftest(modelo_salary,vcov. = estimacion_omega)
## 
## t test of coefficients:
## 
##                Estimate  Std. Error  t value              Pr(>|t|)    
## (Intercept)  8.34322596  0.50982819  16.3648 < 0.00000000000000022 ***
## LSAT         0.00469647  0.00447644   1.0492             0.2960540    
## GPA          0.24752388  0.08861505   2.7932             0.0060073 ** 
## llibvol      0.09499321  0.02703852   3.5133             0.0006095 ***
## lcost        0.03755380  0.03258921   1.1523             0.2512966    
## rank        -0.00332459  0.00030126 -11.0356 < 0.00000000000000022 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1