INTRODUCCIÓN: En este trabajo se tomó en consideración el modelo de variables instrumentales, en el cual se estimará el registro de gastos totales de desembolsos en los medicamentos recetados, cabe señalar que en este modelo la variable es dependiente. Es importante señalar que tomamos datos de la Encuesta del Panel de Gastos Médicos de personas mayores de 65 años de edad. Aquí fue importante detectar nuestras variables independientes por lo que obtuvimos esto: Si la persona tiene seguro de empleador o sindicato patrocinado por salud (hi_empunion); condiciones crónicas (totchr). También tenemos las variables como: edad (edad) mujer (female) color o hispano (blhisp) logaritmo natural del ingreso anual del hogar a miles de dólares (línea).
INSTALACION DE PAQUETES NECESARIOS PARA CREAR ESTE MODELO
library(haven)
library(plm)
library(lmtest)
library(stargazer)
library(AER)
CON ESTE COMANDO, PODREMOS CARGAR LA BASE DE DATOS QUE UTILIZAREMOS
mus06data <- read_dta("~/ESCUELA/mus06data.dta")
View(mus06data)
ESTIMACION DE MINIMOS CUADRADOS ORDINARIOS (MCO)
MCO <- lm(ldrugexp ~ hi_empunion + totchr + age + female + blhisp + linc, data = mus06data)
stargazer(MCO, type = 'text')
##
## ===============================================
## Dependent variable:
## ---------------------------
## ldrugexp
## -----------------------------------------------
## hi_empunion 0.074***
## (0.026)
##
## totchr 0.440***
## (0.010)
##
## age -0.004*
## (0.002)
##
## female 0.058**
## (0.025)
##
## blhisp -0.151***
## (0.034)
##
## linc 0.010
## (0.014)
##
## Constant 5.861***
## (0.153)
##
## -----------------------------------------------
## Observations 10,089
## R2 0.177
## Adjusted R2 0.176
## Residual Std. Error 1.236 (df = 10082)
## F Statistic 361.317*** (df = 6; 10082)
## ===============================================
## Note: *p<0.1; **p<0.05; ***p<0.01
Ya una vez estimando por el método de Mínimos Cuadrados Ordinarios, podemos decir que: Si una persona tiene un seguro de empleado o sindicato con la prestacion de salud, se estima que va a gastar un 7.4% más en su medicamento, por lo que esta variable es bastante significativa. Si una persona tiene alguna enfermedad o condición crónica también se prevee que gaste un 44% más, esta variable también es altamente significativa. También es importante el dato que dice que si una persona es mayor de 65 años (sabemos que el grupo de estudio son personas de 65 años) gastará un 4% menos en sus medicamentos. Hay que recordar que la variable hi_empunion es endógena, esto puede ser posiblemente por que tener un seguro complementario y un seguro de Medicare para las personas mayores puede ser solo una variable de opción. Sabemos que la mayoría de las personas en la muestran ya son desempleados, pero estos cuando trabajaban pudieron elegir un seguro de salud complementario que fuera correcto en el momento de su jubilación ya que tenían aún más probabilidades para elegir este dicho seguro.
AHORA SE HARÁ USO DE LAS VARIABLES INSTRUMENTALES
VI1 <- lm(hi_empunion ~ ssiratio, data = mus06data)
summary(VI1)
##
## Call:
## lm(formula = hi_empunion ~ ssiratio, data = mus06data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.6636 -0.3963 -0.2577 0.5494 2.8405
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 0.512056 0.007994 64.05 <2e-16 ***
## ssiratio -0.254310 0.012464 -20.40 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.4759 on 10389 degrees of freedom
## Multiple R-squared: 0.03853, Adjusted R-squared: 0.03843
## F-statistic: 416.3 on 1 and 10389 DF, p-value: < 2.2e-16
VI2 <- lm(hi_empunion ~ lowincome, data = mus06data)
summary(VI2)
##
## Call:
## lm(formula = hi_empunion ~ lowincome, data = mus06data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.4062 -0.4062 -0.2633 0.5938 0.7367
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 0.406169 0.005241 77.49 <2e-16 ***
## lowincome -0.142820 0.012165 -11.74 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.4822 on 10389 degrees of freedom
## Multiple R-squared: 0.01309, Adjusted R-squared: 0.013
## F-statistic: 137.8 on 1 and 10389 DF, p-value: < 2.2e-16
VI3 <- lm(hi_empunion ~ multlc, data = mus06data)
summary(VI3)
##
## Call:
## lm(formula = hi_empunion ~ multlc, data = mus06data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.6077 -0.3650 -0.3650 0.6350 0.6350
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 0.365014 0.004877 74.85 <2e-16 ***
## multlc 0.242641 0.019853 12.22 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.4819 on 10389 degrees of freedom
## Multiple R-squared: 0.01417, Adjusted R-squared: 0.01408
## F-statistic: 149.4 on 1 and 10389 DF, p-value: < 2.2e-16
VI4 <- lm(hi_empunion ~ firmsz, data = mus06data)
summary(VI4)
##
## Call:
## lm(formula = hi_empunion ~ firmsz, data = mus06data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.8003 -0.3785 -0.3785 0.6215 0.6215
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 0.378504 0.004768 79.390 < 2e-16 ***
## firmsz 0.008435 0.002225 3.792 0.000151 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.485 on 10389 degrees of freedom
## Multiple R-squared: 0.001382, Adjusted R-squared: 0.001286
## F-statistic: 14.38 on 1 and 10389 DF, p-value: 0.0001506
Al estimar la prueba se puede ver que los 4 instrumentos son muy significativos, pero al tratar de asimilar los instrumentos, se puede llegar a deducir que los dos primeros son mejores instrumentos, ya que tienen una correlación negativa al seguro complementario. Mientras que los dos últimos instrumentos hacen referencia a las personas que tiene un seguro complementario a través del trabajo, siendo este totalmente irrelevante para los jubilados.
AHORA, REALIZAREMOS LA REGRESION DE LAS VARIABLES INSTRUMENTALES
MCOVI <- ivreg(ldrugexp ~ hi_empunion + totchr + age + female + blhisp + linc | totchr + age + female + blhisp + linc + ssiratio, data = mus06data)
stargazer(MCOVI, type = 'text')
##
## ===============================================
## Dependent variable:
## ---------------------------
## ldrugexp
## -----------------------------------------------
## hi_empunion -0.898***
## (0.208)
##
## totchr 0.450***
## (0.010)
##
## age -0.013***
## (0.003)
##
## female -0.020
## (0.032)
##
## blhisp -0.217***
## (0.039)
##
## linc 0.087***
## (0.022)
##
## Constant 6.787***
## (0.256)
##
## -----------------------------------------------
## Observations 10,089
## R2 0.064
## Adjusted R2 0.063
## Residual Std. Error 1.318 (df = 10082)
## ===============================================
## Note: *p<0.1; **p<0.05; ***p<0.01
Al realizar la regresión, podemos observar que la relación entre el ingreso de seguridad social de un individuo y el ingreso del individuo de todas las fuentes, (que fue determinada a la hora de instrumentar nuestra variable ssratio), tiene un resultado que es altamente positivo y negativo, tal y como se esperaba, lo cual nos dice que si una persona tiene ingresos en seguridad social gasta -89.7% menos que una persona que no cuenta con un seguro. De igual forma podemos observar que la variable age cambio, ahora siendo que a un 1 año más de edad la persona gasta 1.3% menos, lo cual es mucho más significativo.
PRUEBA DE HAUSMAN
summary(MCOVI, diagnostics = 'T')
##
## Call:
## ivreg(formula = ldrugexp ~ hi_empunion + totchr + age + female +
## blhisp + linc | totchr + age + female + blhisp + linc + ssiratio,
## data = mus06data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -6.7616 -0.7529 0.1275 0.8959 4.0723
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 6.787170 0.255523 26.562 < 2e-16 ***
## hi_empunion -0.897591 0.207991 -4.316 1.61e-05 ***
## totchr 0.450266 0.010422 43.201 < 2e-16 ***
## age -0.013218 0.002876 -4.596 4.36e-06 ***
## female -0.020406 0.031552 -0.647 0.518
## blhisp -0.217424 0.038688 -5.620 1.96e-08 ***
## linc 0.087002 0.022022 3.951 7.85e-05 ***
##
## Diagnostic tests:
## df1 df2 statistic p-value
## Weak instruments 1 10082 183.98 < 2e-16 ***
## Wu-Hausman 1 10081 25.32 4.93e-07 ***
## Sargan 0 NA NA NA
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.318 on 10082 degrees of freedom
## Multiple R-Squared: 0.06395, Adjusted R-squared: 0.0634
## Wald test: 319.6 on 6 and 10082 DF, p-value: < 2.2e-16
Al realizar la prueba de Hausman vemos que el valor en p-value es menor a 0.05,lo cual aceptamos la hipótesis alternativa, esto quiere decir que existe endogenidad.
MC2E
MC2E <- ivreg(ldrugexp ~ hi_empunion + totchr + age + female + blhisp + linc | totchr + age + female + blhisp + linc + ssiratio + lowincome, data = mus06data)
stargazer(MC2E, type = 'text')
##
## ===============================================
## Dependent variable:
## ---------------------------
## ldrugexp
## -----------------------------------------------
## hi_empunion -0.712***
## (0.191)
##
## totchr 0.448***
## (0.010)
##
## age -0.011***
## (0.003)
##
## female -0.005
## (0.030)
##
## blhisp -0.205***
## (0.038)
##
## linc 0.072***
## (0.021)
##
## Constant 6.610***
## (0.241)
##
## -----------------------------------------------
## Observations 10,089
## R2 0.103
## Adjusted R2 0.103
## Residual Std. Error 1.290 (df = 10082)
## ===============================================
## Note: *p<0.1; **p<0.05; ***p<0.01
Podemos decir que nos indica que una persona de bajos ingresos, pero también con un ingreso en seguridad social gasta 71.1% menos en medicamentos, siendo este altamente significativa.
PRUEBA DE SARGAN
summary(MC2E, diagnostics = 'T')
##
## Call:
## ivreg(formula = ldrugexp ~ hi_empunion + totchr + age + female +
## blhisp + linc | totchr + age + female + blhisp + linc + ssiratio +
## lowincome, data = mus06data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -6.6790 -0.7315 0.1408 0.8792 3.9443
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 6.610127 0.240621 27.471 < 2e-16 ***
## hi_empunion -0.711863 0.190571 -3.735 0.000188 ***
## totchr 0.448376 0.010176 44.060 < 2e-16 ***
## age -0.011365 0.002723 -4.174 3.02e-05 ***
## female -0.005453 0.030342 -0.180 0.857372
## blhisp -0.204784 0.037556 -5.453 5.08e-08 ***
## linc 0.072372 0.020805 3.479 0.000506 ***
##
## Diagnostic tests:
## df1 df2 statistic p-value
## Weak instruments 2 10081 105.261 < 2e-16 ***
## Wu-Hausman 1 10081 18.948 1.36e-05 ***
## Sargan 1 NA 6.721 0.00953 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.29 on 10082 degrees of freedom
## Multiple R-Squared: 0.103, Adjusted R-squared: 0.1025
## Wald test: 332.6 on 6 and 10082 DF, p-value: < 2.2e-16
Por lo cual la hipótesis nula nos dice que la sobre identificación es válido, por lo que es preferible usar varios instrumentos, se observa que el valor en p-valué es menor a 0.05 por lo cual rechazamos la nula y decimos que la sobre identificación no es válida por lo cual es preferible usar solo 1 instrumento.