Jose Antonio Ortega
Universidad de Salamanca
Sólo algunos estudiantes se van de Erasmus.
Para tomar una decisión de si merece la pena hacerlo, nos interesaría comparar cómo estaríamos después de irnos de Erasmus (\(Y_1\)) con cómo estaríamos si NO nos vamos de Erasmus (\(Y_0\)).
Debemos definir cómo medimos los resultados. Supongamos que nos planteamos los resultados en un examen estandarizado que hacen al final del grado todos los graduados en economía.
i si se queda en la Universidad.i si se va de Erasmus.Efecto del tratamiento (treatment effect) para la persona \(i\).\[ TE_i = Y_{1i} - Y_{0i} \]
Para un individuo concreto podemos conocer \(Y_{0i}\) si se queda o \(Y_{1i}\) si se va.
PERO NO PODEMOS OBSERVAR LOS DOS
Definimos:
Variable de tratamiento
¿Qué podemos observar?
Variable observada: \(Y_i = Y_{0i}+D_i \cdot (Y_{1i}-Y_{0i}) = Y_{0i}+D_i \cdot TE_i\)
Nos podría gustar medir varias magnitudes: La primera, el efecto medio del tratamiento o ATE (Average Treatment Effect):
\[ATE=E(Y_{1i}-Y_{0i})\]
Se trata del promedio entre los distintos individuos del efecto que tendría el tratamiento.
Fuente: Cerulli (2015), Econometric evaluation of socio-economic programs.
También nos podría gustar medir el efecto medio del tratamiento en los tratados o ATET (Average Treatment Effect of the Treated):
\[ATE=E(Y_{1i}-Y_{0i}|D_i=1)\]
Se trata del promedio entre los individuos tratados del efecto del tratamiento. Ej: Si se van de Erasmus los que saben que se beneficiarás más de ello, esperaríamos que \(ATET > ATE\)
También podemos definir ATENT, el efecto esperado del tratamiento en los NO tratados.
Fuente: Cerulli (2015), Econometric evaluation of socio-economic programs.
\(ATE =\) \[Pr(D=1) \cdot ATET + Pr(D=0) \cdot ATENT\]
Pero, como sólo observamos \(Y_0\) para los que se quedan y \(Y_1\) para los que se van, lo que podemos calcular es la diferencia de medias:
\[ DM = Med_n(Y_{i}|D_i=1)-Med_n(Y_{i}|D_i=0) = Med_n(Y_{1i}|D_i=1)-Med_n(Y_{0i}|D_i=0) \]
Donde \(Med_n(Y_{i}|D_i=j)\) es la media aritmética de la variable en la submuestra correspondiente.
¿Es la DM un buen estimador del ATE o del ATET?
DEPENDE
DM funcionará (lo veremos)DM un estimador insesgado?Supongamos la variable tratamiento como dada.
\[DM = Med_n(Y_{1i}|D_i=1)-Med_n(Y_{0i}|D_i=0)\]
¿Cuál será el valor esperado?
\[E(DM) = E(Y_{1i}|D_i=1) - E(Y_{0i}|D_i=0)\]
¿Coincide con \(ATE=E(Y_{1i}-Y_{0i})\)?
Sumamos y restamos \(E(Y_{0i}|D_i=1)\)
\(E(DM) = [E(Y_{1i}|D_i=1) - E(Y_{0i}|D_i=1)] + [E(Y_{0i}|D_i=1) - E(Y_{0i}|D_i=0)]\)
Definimos el Efecto del tratamiento en los tratados, \(ATET\) como \(ATET=[E(Y_{1i}-Y_{01}|D_i=1)\)
Definimos el sesgo de selección como \(\text{Sesgo}=E(Y_{0i}|D_i=1) - E(Y_{0i}|D_i=0)\)
\(E(DM) = ATET + \text{Sesgo}\)
\(\text{Sesgo}=E(Y_{0i}|D_i=1) - E(Y_{0i}|D_i=0)\)
en qué medida son seleccionados los que se vanSI
En un contexto EXPERIMENTAL, no observacional.
Nos planteamos el experimento “ideal” para estimar el efecto causal del tratamiento.
ALEATORIZACIÓN (asignación aleatoria)
Hoy en día las cosas han cambiado.
Existen múltiples aplicaciones de los experimentos en Economía que implican:
Aplicaciones de los experimentos en economía:
Economía del comportamientoEn todos estos casos cambia el tipo de experimento, dónde se realiza, ...
Flip chartsLa idea parecía buena: Donde apenas saben leer una alternativa a los libros eran tarjetas que muestran a los niños los conceptos.
Estudios observacionales prometedores.
En los experimentos NO aumentaban el % de respuestas correctas
| Fecha,curso | Tratados | Control | Efecto | D.Típica |
|---|---|---|---|---|
| Jul 1997,8 | 45.5 | 46.0 | -0.5 | 12.5 |
| Nov 1997,8 | 48.7 | 49.6 | -0.9 | 13.3 |
| Jul 1997,8 | 42.7 | 42.9 | -0.3 | 11.2 |
| Nov 1997,8 | 49.5 | 49.5 | 0.0 | 13.0 |
| Oct 1998,7 | 37.6 | 37.5 | 0.1 | 11.3 |
| Oct 1998,6 | 37.3 | 36.9 | 0.4 | 11.4 |
Fuente: García Montalvo (2013)
Hoy en día tenemos evidencia empírica acumulada de miles de estudios: 3ieimpact
Ejemplo: ¿Cómo deben proporcionarse mosquiteros contra la malaria?
Hay agencias que escalan aquello que hay evidencia de que funciona.
Aunque realizar un experimento aleatorizado es el REFERENTE, existen alternativas.
Estas pasan, por obtener estimaciones del sesgo de selección para recuperar el ATET (o incluso el ATENT y el ATE).
Diferencia de diferencias: Funciona cuando hay selección por variables no observadasRegresión: Incluimos en un modelo las variables asociadas a quién recibe el tratamiento. Funciona para variables observables.Matching: Funciona cuando hay selección por variables observables. Comparar con lo parecido.Variables instrumentales: Funciona cuando hay selección por variables no observadas y existen variables que afectan al tratamiento pero no al output (Instrumentos)Volveremos sobre ellos al final del curso.
diferencia de medias\[E(Y_{0i}) = E(Y_{0i}|D_i=1) = E(Y_{0i}|D_i=0)\]
Diferencias salariales entre hombres y mujeres, ¿son causales?Sesgo de selección: \(E(Y_{0i}|D_i=1) - E(Y_{0i}|D_i=0)\)Educación, experiencia, ...modelos de regresiónATET) sólo si el sesgo de selección es 0.La regresión capta la esperanza condicionada, pero no necesariamente los efectos causales
Otra forma de ver esto: Pensemos en un modelo lineal causal.
SESGO DE SELECCIÓNVamos a repasar los conceptos básicos de la estadística.
¿Por qué en una población la media muestral se acerca (converge) a la media poblacional? LEY DE LOS GRANDES NÚMEROS
¿Por qué al tomar una muestra arbitrariamente grande, la función de distribución empírica se parece a la función de distribución teórica? TEOREMA FUNDAMENTAL DE LA ESTADÍSTICA
¿Qué es un CONTRASTE DE HIPÓTESIS? Comparar el valor muestral con la distribución teórica bajo la nula
¿Qué es un INTERVALO DE CONFIANZA de un parámetro? Una regla que garantiza que en promedio el verdadero valor está en el intervalo un % de veces
Y veremos una forma NO PARAMÉTRICA y sencilla de obtener intervalos de confianza y hacer contrastes de hipótesis: EL MÉTODO BOOTSTRAP.