En este ejercicio vamos a comprobar la consistencia del estimador del vector de cointegración y del R2 cuando hay y no hay cointegración.

Se trata de simular el siguiente PGD: \[ y_t = 0.2+0.7x_t+u_t \] \[ x_t = x_{t-1} + \epsilon_t \] siendo

\[\epsilon_t \to iid \, N(0, 1.5^2)\]

y distinguimos 2 casos:

  1. cuando no hay cointegración \[u_t= u_{t-1}+a_t\]

  2. cuando hay cointegración \[u_t= 0.75u_{t-1}+a_t\]

y suponemos que

\[a_t \to iid \, N(0,1)\] \[cov(\epsilon_t, a_t)=0\]

Tomamos como valores del tamaño muestral T=100,200,500,1000.

Sin Cointegración

T = 100


Call:
lm(formula = y ~ x)

Residuals:
    Min      1Q  Median      3Q     Max 
-4.5293 -1.8380  0.0517  1.6266  4.7967 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  1.51392    0.64436   2.349   0.0208 *  
x            0.28306    0.03401   8.323 5.15e-13 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 2.209 on 98 degrees of freedom
Multiple R-squared:  0.4142,    Adjusted R-squared:  0.4082 
F-statistic: 69.28 on 1 and 98 DF,  p-value: 5.152e-13

T = 200


Call:
lm(formula = y ~ x)

Residuals:
    Min      1Q  Median      3Q     Max 
-8.8029 -2.2023  0.3213  2.5377  5.3601 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  8.58733    0.25649   33.48   <2e-16 ***
x            0.56549    0.02727   20.74   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 3.064 on 198 degrees of freedom
Multiple R-squared:  0.6847,    Adjusted R-squared:  0.6831 
F-statistic:   430 on 1 and 198 DF,  p-value: < 2.2e-16

T = 500


Call:
lm(formula = y ~ x)

Residuals:
     Min       1Q   Median       3Q      Max 
-14.4013  -7.3373  -0.3924   6.4840  17.7102 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) -17.3296     0.7182  -24.13   <2e-16 ***
x             0.6784     0.0287   23.63   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 8.185 on 498 degrees of freedom
Multiple R-squared:  0.5286,    Adjusted R-squared:  0.5277 
F-statistic: 558.5 on 1 and 498 DF,  p-value: < 2.2e-16

T = 1000


Call:
lm(formula = y ~ x)

Residuals:
    Min      1Q  Median      3Q     Max 
-30.304 -15.773  -3.497  12.332  35.087 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) -33.00803    0.54125  -60.98   <2e-16 ***
x             0.54271    0.02967   18.29   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 16.87 on 998 degrees of freedom
Multiple R-squared:  0.251, Adjusted R-squared:  0.2503 
F-statistic: 334.5 on 1 and 998 DF,  p-value: < 2.2e-16

Cuando no hay cointegración podemos ver en las ACF como los retardos decrecen lentamente lo cual nos indica que hay estacionariedad y por tanto siguen un proceso I(1).

Si nos quedamos exclusivamente con los coeficientes de estas simulaciones tenemos:

        Intercept      Beta
T=100    1.513924 0.2830593
T=200    8.587331 0.5654911
T=500  -17.329627 0.6783586
T=1000 -33.008029 0.5427117

Podemos ver como las estimaciones de Beta no tienden a ningún valor cuando no hay cointegración.

Lo mismo ocurre para R2:

       R cuadrado
T=100   0.4141579
T=200   0.6847369
T=500   0.5286286
T=1000  0.2510249

El valor de R2 toma valores aleatorios y tampoco tiende a ningún número.

Veremos a continuación lo que ocurre cuando hay cointegración.

Con Cointegración

T = 100


Call:
lm(formula = y ~ x)

Residuals:
    Min      1Q  Median      3Q     Max 
-3.1295 -0.9783 -0.2195  0.9842  3.3322 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) -0.17760    0.16168  -1.098    0.275    
x            0.69171    0.03644  18.982   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.418 on 98 degrees of freedom
Multiple R-squared:  0.7862,    Adjusted R-squared:  0.784 
F-statistic: 360.3 on 1 and 98 DF,  p-value: < 2.2e-16

T = 200


Call:
lm(formula = y ~ x)

Residuals:
    Min      1Q  Median      3Q     Max 
-4.1061 -1.1742  0.0316  1.1534  3.4016 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  0.02086    0.13723   0.152    0.879    
x            0.69399    0.01541  45.021   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.505 on 198 degrees of freedom
Multiple R-squared:  0.911, Adjusted R-squared:  0.9106 
F-statistic:  2027 on 1 and 198 DF,  p-value: < 2.2e-16

T = 500


Call:
lm(formula = y ~ x)

Residuals:
    Min      1Q  Median      3Q     Max 
-3.5054 -1.0660 -0.0109  1.0072  4.3459 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  0.20222    0.08886   2.276   0.0233 *  
x            0.70282    0.00557 126.170   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.431 on 498 degrees of freedom
Multiple R-squared:  0.9697,    Adjusted R-squared:  0.9696 
F-statistic: 1.592e+04 on 1 and 498 DF,  p-value: < 2.2e-16

T = 1000


Call:
lm(formula = y ~ x)

Residuals:
   Min     1Q Median     3Q    Max 
-4.037 -1.048 -0.039  1.071  5.304 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 0.964200   0.138300   6.972 5.68e-12 ***
x           0.686635   0.002924 234.799  < 2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.477 on 998 degrees of freedom
Multiple R-squared:  0.9822,    Adjusted R-squared:  0.9822 
F-statistic: 5.513e+04 on 1 and 998 DF,  p-value: < 2.2e-16

T = 100000


Call:
lm(formula = y ~ x)

Residuals:
    Min      1Q  Median      3Q     Max 
-6.9165 -1.0210 -0.0001  1.0207  6.2006 

Coefficients:
             Estimate Std. Error  t value Pr(>|t|)    
(Intercept) 1.948e-01  4.915e-03    39.63   <2e-16 ***
x           6.999e-01  3.221e-05 21725.75   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.513 on 99998 degrees of freedom
Multiple R-squared:  0.9998,    Adjusted R-squared:  0.9998 
F-statistic: 4.72e+08 on 1 and 99998 DF,  p-value: < 2.2e-16

Cuando hay cointegración podemos ver en las ACF como los retardos decrecen rápidamente lo cual nos indica que no hay estacionariedad y siguen un proceso I(0).

Si nos quedamos exclusivamente con los coeficientes de estas simulaciones tenemos:

           Intercept      Beta
T=100    -0.17759642 0.6917098
T=200     0.02086077 0.6939882
T=500     0.20222441 0.7028233
T=1000    0.96419965 0.6866353
T=100000  0.19480330 0.6998869

Podemos ver en este caso como los estimadores de Beta tienden claramente a 0.7, lo cual quiere decir que el vector de cointegración es consistente.

Para los R2 tenemos:

         R cuadrado
T=100     0.7861732
T=200     0.9110082
T=500     0.9696656
T=1000    0.9822195
T=100000  0.9997882

En este caso el R2 tiende claramente a 1.

Por último podemos ver como en los gráficos de las series sin cointegración ambas lineas son parecidas pero son independientes entre si y toman caminos distintos mientras que en los gráficos con cointegración se ve una clara dependencia de las series.

