USO Y ANÁLISIS DE LAS VARIABLES INSTRUMENTALES

INTRODUCCIÓN: En este trabajo se tomó en consideración el modelo de variables instrumentales, en el cual se estimará el registro de gastos totales de desembolsos en los medicamentos recetados, cabe señalar que en este modelo la variable es dependiente. Es importante señalar que tomamos datos de la Encuesta del Panel de Gastos Médicos de personas mayores de 65 años de edad. Aquí fue importante detectar nuestras variables independientes por lo que obtuvimos esto: Si la persona tiene seguro de empleador o sindicato patrocinado por salud (hi_empunion); condiciones crónicas (totchr). También tenemos las variables como: edad (edad) mujer (female) color o hispano (blhisp) logaritmo natural del ingreso anual del hogar a miles de dólares (línea).

INSTALACION DE PAQUETES NECESARIOS PARA CREAR ESTE MODELO

library(haven)
library(plm)
library(lmtest)
library(stargazer)
library(AER)

CON ESTE COMANDO, PODREMOS CARGAR LA BASE DE DATOS QUE UTILIZAREMOS

mus06data <- read_dta("~/ESCUELA/mus06data.dta")
View(mus06data)

ESTIMACION DE MINIMOS CUADRADOS ORDINARIOS (MCO)

MCO <- lm(ldrugexp ~ hi_empunion + totchr + age + female + blhisp + linc, data = mus06data)
stargazer(MCO, type = 'text')

## 
## ===============================================
##                         Dependent variable:    
##                     ---------------------------
##                              ldrugexp          
## -----------------------------------------------
## hi_empunion                  0.074***          
##                               (0.026)          
##                                                
## totchr                       0.440***          
##                               (0.010)          
##                                                
## age                           -0.004*          
##                               (0.002)          
##                                                
## female                        0.058**          
##                               (0.025)          
##                                                
## blhisp                       -0.151***         
##                               (0.034)          
##                                                
## linc                           0.010           
##                               (0.014)          
##                                                
## Constant                     5.861***          
##                               (0.153)          
##                                                
## -----------------------------------------------
## Observations                  10,089           
## R2                             0.177           
## Adjusted R2                    0.176           
## Residual Std. Error     1.236 (df = 10082)     
## F Statistic         361.317*** (df = 6; 10082) 
## ===============================================
## Note:               *p<0.1; **p<0.05; ***p<0.01

Ya una vez estimando por el método de Mínimos Cuadrados Ordinarios, podemos decir que: Si una persona tiene un seguro de empleado o sindicato con la prestacion de salud, se estima que va a gastar un 7.4% más en su medicamento, por lo que esta variable es bastante significativa. Si una persona tiene alguna enfermedad o condición crónica también se prevee que gaste un 44% más, esta variable también es altamente significativa. También es importante el dato que dice que si una persona es mayor de 65 años (sabemos que el grupo de estudio son personas de 65 años) gastará un 4% menos en sus medicamentos. Hay que recordar que la variable hi_empunion es endógena, esto puede ser posiblemente por que tener un seguro complementario y un seguro de Medicare para las personas mayores puede ser solo una variable de opción. Sabemos que la mayoría de las personas en la muestran ya son desempleados, pero estos cuando trabajaban pudieron elegir un seguro de salud complementario que fuera correcto en el momento de su jubilación ya que tenían aún más probabilidades para elegir este dicho seguro.

AHORA SE HARÁ USO DE LAS VARIABLES INSTRUMENTALES

VI1 <- lm(hi_empunion ~ ssiratio, data = mus06data)
summary(VI1)

## 
## Call:
## lm(formula = hi_empunion ~ ssiratio, data = mus06data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -0.6636 -0.3963 -0.2577  0.5494  2.8405 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  0.512056   0.007994   64.05   <2e-16 ***
## ssiratio    -0.254310   0.012464  -20.40   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.4759 on 10389 degrees of freedom
## Multiple R-squared:  0.03853,    Adjusted R-squared:  0.03843 
## F-statistic: 416.3 on 1 and 10389 DF,  p-value: < 2.2e-16

VI2 <- lm(hi_empunion ~ lowincome, data = mus06data)
summary(VI2)

## 
## Call:
## lm(formula = hi_empunion ~ lowincome, data = mus06data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -0.4062 -0.4062 -0.2633  0.5938  0.7367 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  0.406169   0.005241   77.49   <2e-16 ***
## lowincome   -0.142820   0.012165  -11.74   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.4822 on 10389 degrees of freedom
## Multiple R-squared:  0.01309,    Adjusted R-squared:  0.013 
## F-statistic: 137.8 on 1 and 10389 DF,  p-value: < 2.2e-16

VI3 <- lm(hi_empunion ~ multlc, data = mus06data)
summary(VI3)

## 
## Call:
## lm(formula = hi_empunion ~ multlc, data = mus06data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -0.6077 -0.3650 -0.3650  0.6350  0.6350 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 0.365014   0.004877   74.85   <2e-16 ***
## multlc      0.242641   0.019853   12.22   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.4819 on 10389 degrees of freedom
## Multiple R-squared:  0.01417,    Adjusted R-squared:  0.01408 
## F-statistic: 149.4 on 1 and 10389 DF,  p-value: < 2.2e-16

VI4 <- lm(hi_empunion ~ firmsz, data = mus06data)
summary(VI4)

## 
## Call:
## lm(formula = hi_empunion ~ firmsz, data = mus06data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -0.8003 -0.3785 -0.3785  0.6215  0.6215 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 0.378504   0.004768  79.390  < 2e-16 ***
## firmsz      0.008435   0.002225   3.792 0.000151 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.485 on 10389 degrees of freedom
## Multiple R-squared:  0.001382,   Adjusted R-squared:  0.001286 
## F-statistic: 14.38 on 1 and 10389 DF,  p-value: 0.0001506

Al estimar la prueba se puede ver que los 4 instrumentos son muy significativos, pero al tratar de asimilar los instrumentos, se puede llegar a deducir que los dos primeros son mejores instrumentos, ya que tienen una correlación negativa al seguro complementario. Mientras que los dos últimos instrumentos hacen referencia a las personas que tiene un seguro complementario a través del trabajo, siendo este totalmente irrelevante para los jubilados.

AHORA, REALIZAREMOS LA REGRESION DE LAS VARIABLES INSTRUMENTALES

MCOVI <- ivreg(ldrugexp ~ hi_empunion + totchr + age + female + blhisp + linc | totchr + age + female + blhisp + linc + ssiratio, data = mus06data)
stargazer(MCOVI, type = 'text')

## 
## ===============================================
##                         Dependent variable:    
##                     ---------------------------
##                              ldrugexp          
## -----------------------------------------------
## hi_empunion                  -0.898***         
##                               (0.208)          
##                                                
## totchr                       0.450***          
##                               (0.010)          
##                                                
## age                          -0.013***         
##                               (0.003)          
##                                                
## female                        -0.020           
##                               (0.032)          
##                                                
## blhisp                       -0.217***         
##                               (0.039)          
##                                                
## linc                         0.087***          
##                               (0.022)          
##                                                
## Constant                     6.787***          
##                               (0.256)          
##                                                
## -----------------------------------------------
## Observations                  10,089           
## R2                             0.064           
## Adjusted R2                    0.063           
## Residual Std. Error     1.318 (df = 10082)     
## ===============================================
## Note:               *p<0.1; **p<0.05; ***p<0.01

Al realizar la regresión, podemos observar que la relación entre el ingreso de seguridad social de un individuo y el ingreso del individuo de todas las fuentes, (que fue determinada a la hora de instrumentar nuestra variable ssratio), tiene un resultado que es altamente positivo y negativo, tal y como se esperaba, lo cual nos dice que si una persona tiene ingresos en seguridad social gasta -89.7% menos que una persona que no cuenta con un seguro. De igual forma podemos observar que la variable age cambio, ahora siendo que a un 1 año más de edad la persona gasta 1.3% menos, lo cual es mucho más significativo.

PRUEBA DE HAUSMAN

summary(MCOVI, diagnostics = 'T')

## 
## Call:
## ivreg(formula = ldrugexp ~ hi_empunion + totchr + age + female + 
##     blhisp + linc | totchr + age + female + blhisp + linc + ssiratio, 
##     data = mus06data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -6.7616 -0.7529  0.1275  0.8959  4.0723 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  6.787170   0.255523  26.562  < 2e-16 ***
## hi_empunion -0.897591   0.207991  -4.316 1.61e-05 ***
## totchr       0.450266   0.010422  43.201  < 2e-16 ***
## age         -0.013218   0.002876  -4.596 4.36e-06 ***
## female      -0.020406   0.031552  -0.647    0.518    
## blhisp      -0.217424   0.038688  -5.620 1.96e-08 ***
## linc         0.087002   0.022022   3.951 7.85e-05 ***
## 
## Diagnostic tests:
##                    df1   df2 statistic  p-value    
## Weak instruments     1 10082    183.98  < 2e-16 ***
## Wu-Hausman           1 10081     25.32 4.93e-07 ***
## Sargan               0    NA        NA       NA    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.318 on 10082 degrees of freedom
## Multiple R-Squared: 0.06395, Adjusted R-squared: 0.0634 
## Wald test: 319.6 on 6 and 10082 DF,  p-value: < 2.2e-16

Al realizar la prueba de Hausman vemos que el valor en p-value es menor a 0.05,lo cual aceptamos la hipótesis alternativa, esto quiere decir que existe endogenidad.

MC2E

MC2E <- ivreg(ldrugexp ~ hi_empunion + totchr + age + female + blhisp + linc | totchr + age + female + blhisp + linc + ssiratio + lowincome, data = mus06data)
stargazer(MC2E, type = 'text')

## 
## ===============================================
##                         Dependent variable:    
##                     ---------------------------
##                              ldrugexp          
## -----------------------------------------------
## hi_empunion                  -0.712***         
##                               (0.191)          
##                                                
## totchr                       0.448***          
##                               (0.010)          
##                                                
## age                          -0.011***         
##                               (0.003)          
##                                                
## female                        -0.005           
##                               (0.030)          
##                                                
## blhisp                       -0.205***         
##                               (0.038)          
##                                                
## linc                         0.072***          
##                               (0.021)          
##                                                
## Constant                     6.610***          
##                               (0.241)          
##                                                
## -----------------------------------------------
## Observations                  10,089           
## R2                             0.103           
## Adjusted R2                    0.103           
## Residual Std. Error     1.290 (df = 10082)     
## ===============================================
## Note:               *p<0.1; **p<0.05; ***p<0.01

Podemos decir que nos indica que una persona de bajos ingresos, pero también con un ingreso en seguridad social gasta 71.1% menos en medicamentos, siendo este altamente significativa.

PRUEBA DE SARGAN

summary(MC2E, diagnostics = 'T')

## 
## Call:
## ivreg(formula = ldrugexp ~ hi_empunion + totchr + age + female + 
##     blhisp + linc | totchr + age + female + blhisp + linc + ssiratio + 
##     lowincome, data = mus06data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -6.6790 -0.7315  0.1408  0.8792  3.9443 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  6.610127   0.240621  27.471  < 2e-16 ***
## hi_empunion -0.711863   0.190571  -3.735 0.000188 ***
## totchr       0.448376   0.010176  44.060  < 2e-16 ***
## age         -0.011365   0.002723  -4.174 3.02e-05 ***
## female      -0.005453   0.030342  -0.180 0.857372    
## blhisp      -0.204784   0.037556  -5.453 5.08e-08 ***
## linc         0.072372   0.020805   3.479 0.000506 ***
## 
## Diagnostic tests:
##                    df1   df2 statistic  p-value    
## Weak instruments     2 10081   105.261  < 2e-16 ***
## Wu-Hausman           1 10081    18.948 1.36e-05 ***
## Sargan               1    NA     6.721  0.00953 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.29 on 10082 degrees of freedom
## Multiple R-Squared: 0.103,   Adjusted R-squared: 0.1025 
## Wald test: 332.6 on 6 and 10082 DF,  p-value: < 2.2e-16

Por lo cual la hipótesis nula nos dice que la sobre identificación es válido, por lo que es preferible usar varios instrumentos, se observa que el valor en p-valué es menor a 0.05 por lo cual rechazamos la nula y decimos que la sobre identificación no es válida por lo cual es preferible usar solo 1 instrumento.

USO Y ANÁLISIS DE LAS VARIABLES INSTRUMENTALES

Trabajo realizado por Romero Mancebo Carlos Eduardo y Gerardo Jimenez Cynthia Guadalupe

30 de noviembre de 2018