class:center, middle, .bg_karl background-image: url(logo4.png) background-size: 450px background-position: 50% 95% <style type="text/css"> .bg_karl { position: relative; z-index: 1; opacity: 0.2; } .bg_karl::before { content: ""; background-image: url('logo4.png'); background-size: cover; position: absolute; top: 0px; right: 0px; bottom: 0px; left: 0px; opacity: 0.1; z-index: -1; } </style> _Ciclo_ _de_ _Charlas_ ***MEPOP*** # Introducción a las Variables Instrumentales como Alternativa Metodológica #### Jaquelin M. Morillo Remesnitzky (CICS- UDD) #### jmorillor@udd.cl 30 de septiembre, 2022. --- background-image: url(logo4.png) background-size: 450px background-position: 98% 5% class: left, top # **Contenidos** - ### **Problema de endogeneidad** - #### Supuestos clásicos - ### **Variables instrumentales** - #### Construcción del modelo - #### Estimación - #### Controles y efectos fijos - ### **Ejemplo y resumen** --- class: inverse center middle # Problema de endogeneidad --- background-image: url(logo4.png) background-size: 450px background-position: 98% 5% class: left, top # **Motivación** Uno de los desafíos de las ciencias sociales es estimar causalidad. ###Efecto causal: ####Lo entenderemos como el impacto que se podría medir en un experimento aleatorio controlado. Siendo así, si mi objetivo es estimar ***causalidad***, tiene sentido pensar que deseo incorporar múltiples variables con el objetivo de: - ####Enriquecer el modelo; - ####Estudiar efectos no constantes y/o no lineales; - ####Reducir ***problemas de endogeneidad*** y potenciales sesgos. --- background-image: url(logo4.png) background-size: 450px background-position: 98% 5% class: left, top # **Supuestos clásicos** **Modelo Lineal:** Si bien existen otras alternativas (ej. discontinuas) suele ser el punto de partida; **Muestro Aleatorio:** Procedimiento de muestreo probabilístico que da a cada elemento de la población objetivo y a cada posible muestra de un tamaño determinado, la misma probabilidad de ser seleccionado; **Media Condicionada Nula:** la media o valor esperado de las perturbaciones o errores en la Regresión Lineal es cero para todos los posibles valores de la variables explicativas o "independientes"; **No multicolinealidad Perfecta**: No hay dos o mas variables explicativa que sean una combinación lineal de otras variables independientes de la regresión; **Homocedasticidad:** La varianza de los errores es constante a lo largo del tiempo. ### Bajo estos supuestos se cumple el ***Teorema de Gauss-Markov*** el cual sostiene que el estimador encontrado es el mejor estimador lineal insesgado (MELI - ELIO - BLUE) --- background-image: url(logo4.png) background-size: 450px background-position: 98% 5% class: left, top # **Endogeneidad ¿Qué es?** ### Un coeficiente β asociado a una variable explicativa en una regresión lineal es ***endógeno*** si: - **Existe una variable omitida:** No inclusión de una variable explicativa importante en una regresión. Dados los supuestos de Gauss-Markov, esta omisión provocaría sesgo e inconsistencia en nuestras estimaciones; - **Exisite causalidad reversa:** La variable X afecta a Y pero Y tambien afecta X. β no captura el efecto causal que deseamos; - **Bad control:** Variables de control se ven afectadas por X. Esto implica una interpretación de β diferente a la tradicional; ### Si no hay presencia de ninguna de las características anteriores entonces podemos decir que nuestro coeficiente es exógeno. --- background-image: url(logo4.png) background-size: 450px background-position: 98% 5% class: left, top # **Tips sobre identificación** - Cuando la estimación de un parámetro es consistente, decimos que el parámetro está ***identificado***. A mayor tamaño muestral, menor probabilidad de que el estimador se aleje del valor poblacional (propiedad asintótica). <br> <br> >El conjunto de datos, la especificación y la variación en los datos que se utilizan para estimar el parametro de interés se conoce como ***Estrategia de identificación***. <br> <br> - Si la estrategia de identificación es convincente decimos que se usa ***variación exógena*** para identificar el parámetro. <br> <br> Wooldrige, 2008 (Cap 3, 4 y 5). --- background-image: url(logo4.png) background-size: 450px background-position: 98% 5% class: left, top # **Combatir la endogeneidad** Se desea estimar el efecto causal de una variable X sobre una variable Y a partir del siguiente modelo poblacional: `$$Y_i=\alpha+\beta X_i+\varepsilon_i$$` No obstante, se sospecha que la variable X es ednógena y, por lo tanto, el estimador MCO no tendrá una interpretación causal clara. Entonces, una potencial solución para estimar el efecto causal de interés es utilizar una ***variable instrumental*** Z. Un caso típico es sospechar que existe una variable omitida W que está correlacionada con X y que explica Y: `$$Y_i=\alpha+\beta X_i+\left(\delta W_i+\eta_i\right)$$` Donde el término de error `\(\varepsilon_i\)`esta compuesto por `\(\delta W_i+\eta_i\)`. Dado que W es una variable inobservable, no podemos incluirla como control y, de esta forma, se esta filtrando en `\(\varepsilon_i\)`. Así se cumple que `\(E\left[\varepsilon_i \mid X_i\right] \neq 0\)`. En otras palabras `\(\frac{\partial Y}{\partial X}=\beta+\frac{\partial \varepsilon}{\partial X} \neq \beta\)`. --- class: inverse center middle #La solución: Variables instrumentales --- background-image: url(logo4.png) background-size: 450px background-position: 98% 5% class: left, top # **Construcción del Modelo** <img src="VI_GRAPH.PNG" width="25%" style="display: block; margin: auto;" /> Una variable Instrumental Z debe cumplir con las siguientes condiciones econométrica y teórica: <br> <br> <br> ***Primera etapa (Estadística):*** Z debe explicar de forma suficiente la variación en X `$$\operatorname{cov}(X, Z)\neq 0$$` <br> <br> <br> ***Reestricción de exclusión (Teórica):*** Z debe afectar a Y ***SÓLO*** a través de X. --- background-image: url(logo4.png) background-size: 450px background-position: 98% 5% class: left, top #**Construcción del Modelo II** Bajo las condiciones anteriores, es posible estimar la primer etapa y la forma reducida: $$ \hat{X_i}=\hat{v}+\hat{\gamma} Z_i+\eta_i $$ $$ \hat{Y_i}=\hat{\tau}+\hat{\delta} Z_i+\mu_i $$ <br> <br> <br> De esta forma, queda en evidencia que podemos usar Z para estimar el efecto de interés β de la siguiente forma: $$ \frac{\partial Y}{\partial X}=\frac{\partial Y / \partial Z}{\partial X / \partial Z}=\frac{\delta}{\gamma}=\beta $$ ### Aquí queda en evidencia la importancia de que `\(\gamma\neq 0\)` --- background-image: url(logo4.png) background-size: 450px background-position: 98% 5% class: left, top #**Construcción del Modelo III** <br> En resumen, una variable instrumental Z debe cumplir con las siguientes condiciones teóricas y econométricas. <br> #### ***Primera etapa:*** Z debe explicar suficiente variación en X - Esta condición es econométrica y se puede chequear; - Si explica poca variación el instrumento es débil; - Si explica mucha variación Z no difiere de X y es endógena. <br> #### ***Reestricción de exclusión:*** Z debe afectar a Y sólo a través de X - Esta condición es teórica y corresponde a un supuesto intangible; - Debe defenderse con argumentos; - Evidencia no permite probar pero si apoyar el argumento. --- class: inverse center middle # ¿Cómo estimar? --- background-image: url(logo4.png) background-size: 450px background-position: 98% 5% class: left, top #**Estimación** Desde la notación matricial, en vez de estimar: <br> `$$\widehat{\beta_{MCO}} = \left(X'X\right)^{-1} X'Y$$` <br> Estimamos: <br> `$$\widehat{\beta_{VI}} = \left(Z'X\right)^{-1} Z'Y$$` <br> <br> En caso de utilizar múltiples instrumentos: `$$\widehat{\beta_{2VI}} = \left(\hat{X}\hat{X}\right)^{-1} \hat{X}'Y$$` Dónde `\(\hat{X} =\hat{\tau}+\hat{\gamma} Z\)` --- background-image: url(logo4.png) background-size: 450px background-position: 98% 5% class: left, top #**Código en R** ####En cuanto al código, se puede replicar en Stata, Python o R de manera muy sencilla: En este ejercicio, se buscaba calcular el efecto del retiro del 10% de la AFP en el ingreso de un hogar, para esto se consideró al grupo que realizó el retiro como "tratado" y a los que no hicieron el retiro como el contrafactual. Para calcular el estimador de corte transversal se estimó un modelo de mínimos cuadrados ordinarios con una variable dummy que representa si el hogar hizo el retiro o no (variable "retiro" es 1 si hizo el retiro y 0 si no). ####El modelo a estimar es: $$ \widehat{log(Ingreso)} = \hat{\beta_0} + \hat{\beta_1}retiro + \hat{\beta_2}Niños + \hat{\beta_3}AMayor +\hat{\beta_4}EdadJH + \hat{\beta_5}EscJH + \hat{\beta_6}JHwoman$$ ```r # Preparar el ambiente y cargar packages rm(list=ls()) pacman::p_load(haven,dplyr,fastDummies,lmtest,ggplot2,mfx,nnet,margins,stargazer) # Modelo MCO endógeno Modelo_mco<-lm(logING ~ retiro + Niños + AMayor + EdadJH + EscJH + JHwoman, casen) summary(mco1) ``` --- background-image: url(logo4.png) background-size: 450px background-position: 98% 5% class: left, top #**Código en R II** Puedo realizar un test de Haussman para confirmar la endogeneidad de la variable Retiro en relación al Log Ingreso. Dado que el ingreso y el retiro del 10% se relacionan de manera bidireccional, el estimador objetido en la regresión anterior es endógeno. Por lo tanto, se utilizará como variable instrumental deuda hipotecaria del hogar (1= posee deuda 0= no posee deuda). ```r #Diseño del Instrumento logitVI1<-glm(retiro ~ Niños + AMayor + EdadJH + EscJH + JHwoman + Deuda, data=casen, family = binomial(link = "logit") ) summary(logitVI1) #Estimador de "retiro" y segunda etapa del modelo: X=dplyr::select(casen,Niños,AMayor,EdadJH,EdadJH,JHwoman,Deuda) casen$retiro_gorro <- predict(logitVI1,X) # Modelo MCO usando el estimador de "retiro" que corresponde a la probabilidad de que un hogar realice el retiro del 10%. mco_VI2<-lm(logING ~ retiro_gorro + Niños + AMayor + EdadJH + EscJH + JHwoman, data= casen) summary(mco_VI2) ``` --- background-image: url(logo4.png) background-size: 450px background-position: 98% 5% class: left, top #**Controles y efectos fijos** En las tres regresiones involucradas se deben incorporar los controles considerados. Esta acción no requiere ningún tratamiento especial: <br> $$ \hat{Y_i}=\hat{\alpha}+\hat{\beta}X_i+\hat{\omega}Controles_i+\epsilon_i $$ <br> $$ \hat{X_i}=\hat{\nu}+\hat{\gamma}Z_i+\hat{\omega}Controles_i+\eta_i $$ <br> $$ \hat{Yi}=\hat{\tau}+\hat{\delta}X_i+\hat{\omega}Controles_i+\mu_i $$ <br> Los controles deben incluirse en las tres etapas: Regresión endógena, primera etapa y forma reducida (o segunda etapa). La misma lógica aplica para la incorporación de ***efectos fijos***. --- class: inverse center middle # Ejemplo y resumen --- background-image: url(logo4.png) background-size: 450px background-position: 98% 5% class: left, top #**Ejemplo ** <img src="EJEMPLO1.PNG" width="50%" style="display: block; margin: auto;" /> ####***Pregunta de investigación:*** ¿Tienen las protestas (X) un efecto causal en las políticas de interés? ####***Problema empírico:*** Existen variables omitidas (W) que podrían estar afectando a la aparición de protestas y las políticas de interés. ####***Solución:*** Utilizar "lluvia" como instrumento (Z) de protestas en el contexto del Tea parte Movement en EE.UU. _"(...) ante el mal tiempo también puede ser realmente menos agradable para los participantes de la protesta, energizando menos a los asistentes y el consiguientemente al movimiento.(Corazzini, et. al., 2013)"_ --- background-image: url(logo4.png) background-size: 450px background-position: 98% 5% class: left, top #**Ejemplo Ecuaciones** ***Primera etapa:*** $$ Protesters_c=RainyRally_c\theta'+ProbRain_c\delta'+\mu_r+x_c\gamma'+\epsilon_c $$ ***Fórmula reducida:*** $$ Y_c=RainyRally_ck'+ProbRain_c\delta'+\mu_r+x_c\gamma'+\epsilon_c $$ ***Segunda etapa:*** $$ Y_c=Protesters_c\lambda'+ProbRain_c\delta'+\mu_r+x_c\gamma'+\epsilon_c $$ Protesters es una medida de la asistencia a la manifestación en el condado c; Rainy Rally es una variable ficticia (igual a 1 si hubo más de 0,1 pulgadas de lluvia en el condado el día de la concentración); ProbRain es un conjunto de variables ficticias que controlan la probabilidad de lluvia el día de la manifestación; Además, `\(μ\)` recoge cuatro efectos fijos de la región del censo de EE.UU., y `\(x\)` es un vector de covariables predeterminadas del condado. --- background-image: url(logo4.png) background-size: 450px background-position: 98% 5% class: left, top #**Ejemplo Resultados I** <img src="TABLA1.PNG" width="70%" style="display: block; margin: auto;" /> --- background-image: url(logo4.png) background-size: 450px background-position: 98% 5% class: left, top #**Ejemplo Resultados II** <img src="TABLA2.PNG" width="70%" style="display: block; margin: auto;" /> --- background-image: url(logo4.png) background-size: 450px background-position: 98% 5% class: left, top #**Ejemplo Resultados III** <img src="TABLA3.PNG" width="70%" style="display: block; margin: auto;" /> --- background-image: url(logo4.png) background-size: 450px background-position: 98% 5% class: left, top #**Resumen general** La ***endogeneidad*** es un problema a la hora de estimar efectos causales ya que rompe los postulados del Teorema de Gauss-Markov; Las ***variables instrumentales*** sirven como estrategias para abordar el problema de la endogeneidad; La característica ***Econométrica*** que debe tener una variable instrumental es que la `\(\operatorname{cov}(X, Z)\neq 0\)`; Esta cualidad debe ser precisa, si "explica demasiado" o "muy poco", la variable utilizada podría no ser la adecuada. Esta condición se puede ***testear econométricamente***; La caracterísitica ***teórica*** que debe tener una variable instrumental es que debe afectar a la variable explicada (Y) ***sólo*** a través de X; Esta cualidad debe defenderse con ***argumentos narrativos*** y no es testeable empíricamente; Es posible estimar este tipo de modelos con ***softwares informáticos*** open-sourse; En estos modelos se pueden incluir ***controles y efectos fijos*** sin mayor dificultad. --- background-image: url(logo4.png) background-size: 450px background-position: 50% 90% class: center, top class: inversed, center, middle # ¡Gracias! jmorillor@udd.cl Slide creado con el paquete [**xaringan**](https://github.com/yihui/xaringan). El chakra viene de [remark.js](https://remarkjs.com), [**knitr**](https://yihui.org/knitr/), y [R Markdown](https://rmarkdown.rstudio.com). Agradecimiento especial a Patricio Navia y equipo MEPOP, Melanie Oyarzún (CICS) y Francisco Villarroel (CICS)