La correlación negativa entre representación femenina y corrupción puede estar sesgada por variables omitidas que afectan simultáneamente ambas variables. Un ejemplo concreto es el nivel de desarrollo institucional del municipio: los municipios con instituciones más sólidas (prensa libre, mayor competencia electoral, presupuestos más transparentes) tienden a tener mayor representación femenina y menores niveles de corrupción, independientemente del género de sus funcionarios. Si esta variable no se controla, el coeficiente de OLS capturarÃa tanto el posible efecto causal de la representación femenina como el efecto de las mejores instituciones, sobreestimando (en valor absoluto) la relación. Por ello, la estimación OLS debe interpretarse como una correlación descriptiva, no como un efecto causal.
| Variable | Coeficiente | Error estándar | t | p-value |
|---|---|---|---|---|
| Constante | 0.0082 | 0.0021 | 3.843 | 0.0001 |
| Proporción de mujeres 2003–2007 | 0.0344 | 0.0074 | 4.663 | 0.0000 |
El coeficiente principal estimado es \(\hat\beta =\) 0.0344, lo que indica una
asociación positiva entre representación femenina y
corrupción revelada. Este coeficiente sugiere que un aumento de 10
puntos porcentuales en la proporción de mujeres (cambio de 0.10 en
Wshare03) se asocia con un cambio de aproximadamente 0.0034
unidades en corr07. Esta relación no debe interpretarse
causalmente porque la estimación no controla por factores municipales
omitidos que afectan simultáneamente representación femenina y
corrupción.
En este contexto, \(E(Y_{it}^{T}\mid Pop_i=5000)\) representa el nivel esperado de corrupción que tendrÃan los municipios ubicados exactamente en el umbral de 5,000 habitantes si estuvieran sujetos al tratamiento: la regla de cuota que induce un aumento en la representación femenina. Por su parte, \(E(Y_{it}^{C}\mid Pop_i=5000)\) representa el nivel esperado de corrupción que esos mismos municipios tendrÃan si no estuvieran sujetos a la cuota.
La comparación causal de interés es:
\[ \tau = E(Y_{it}^{T}\mid Pop_i=5000)-E(Y_{it}^{C}\mid Pop_i=5000). \]
La regresión discontinua busca estimar esta diferencia comparando municipios justo por encima y justo por debajo del umbral poblacional. La estimación será causal bajo el supuesto de continuidad de los resultados potenciales en el cutoff: en ausencia de la cuota, los municipios apenas por debajo y apenas por encima de 5,000 habitantes habrÃan tenido niveles esperados de corrupción similares. Bajo ese supuesto, cualquier salto discreto en el outcome alrededor del umbral puede atribuirse a la regla de cuota y no a diferencias preexistentes entre municipios.
La gráfica sugiere un salto negativo alrededor del cutoff. Si se aproxima el salto con los polinomios cuadráticos estimados a ambos lados del umbral, el valor visual del parámetro de interés serÃa cercano a \(\hat\tau \approx\) -0.174. Esto anticipa que los municipios sujetos a la cuota tendrÃan menor corrupción revelada que municipios comparables justo por debajo del umbral.
El kernel triangular asigna mayor peso a las observaciones más cercanas al cutoff y menor peso a las observaciones ubicadas cerca del borde del bandwidth. Formalmente, para \(|X_i|\leq h\):
\[ w_i = 1-\frac{|X_i|}{h}, \qquad h=1000. \]
La estimación se obtiene mediante una regresión lineal local ponderada, usando MCO, con una pendiente distinta a cada lado del umbral:
\[ Y_i = \alpha + \tau D_i + \beta X_i + \gamma(D_iX_i)+u_i, \]
donde \(D_i=1[X_i\geq0]\). En esta especificación, \(\tau\) es el salto en el cutoff.
Regresión lineal local del lado izquierdo:
\[ \widehat{Y}_i^{-} = 0.1479 + 0.0002144X_i. \]
Regresión lineal local del lado derecho:
\[ \widehat{Y}_i^{+} = -0.0036 + 0.0000906X_i. \]
Parámetro estimado:
\[ \hat\tau = \widehat{Y}^{+}(0)-\widehat{Y}^{-}(0)=-0.1515. \]
El estimado RDD indica que cruzar el umbral de 5,000 habitantes
—quedar sujeto a la cuota en 2007— se asocia con una reducción
de 0.1515 unidades en corrupción revelada para municipios
cercanos al cutoff. Dado que corr07 es una variable
dicotómica (0/1), este número puede interpretarse como una reducción de
aproximadamente 15.2 puntos porcentuales en la probabilidad de que un
municipio registre un caso de corrupción. En términos de magnitud, el
efecto equivale a 121.1% de una desviación estándar de
corr07. El paper reporta un efecto de magnitud similar
(~61% de la DE), lo que sugiere consistencia con sus resultados.
rdrobust)| Estimador | Tau | Error estándar |
|---|---|---|
| Manual con MCO local | -0.1515 | 0.0600 |
| rdrobust: convencional | -0.1515 | 0.0618 |
Los resultados son equivalentes porque ambos estiman una regresión
lineal local con kernel triangular y bandwidth de 1,000 habitantes. La
diferencia principal es que rdrobust automatiza la
inferencia y ofrece estimaciones corregidas por sesgo, mientras que la
sección anterior muestra de manera explÃcita cómo se obtiene el salto
mediante MCO ponderado.
El tratamiento de interés sustantivo en este paper es la
representación femenina efectiva en el consejo
municipal (la proporción de mujeres electas, Wshare), no
simplemente la sujeción legal a la cuota. Bajo esa definición, el diseño
es fuzzy RD: cruzar el umbral de 5,000 habitantes
aumenta discontinuamente la probabilidad de mayor
representación femenina, pero no la determina perfectamente —como
muestra la Figura 1, hay municipios por debajo del umbral con alta
representación femenina y viceversa.
La cuota actúa entonces como un instrumento: genera
variación exógena en Wshare alrededor del cutoff. La
estimación de la Pregunta 1 es la forma reducida (ITT):
el efecto de estar sujeto a la cuota sobre corrupción. Para
estimar el efecto causal de la representación femenina efectiva, se
divide ese salto entre el salto en Wshare (primera etapa),
obteniendo el LATE de la Pregunta 2.d.
Usar medias condicionales mejora la legibilidad porque reduce el ruido visual de miles de observaciones individuales. En lugar de mostrar todos los municipios, cada punto resume el promedio de municipios dentro de un intervalo poblacional de 100 habitantes. Esto permite observar con mayor claridad el salto en la representación femenina alrededor del umbral de 5,000 habitantes.
El valor principal de la Figura 1 es el salto estimado en la proporción de mujeres electas al cruzar el umbral de 5,000 habitantes. Con la especificación gráfica anterior, el salto estimado es:
\[ \hat\rho = \widehat{Wshare}^{+}(5000)-\widehat{Wshare}^{-}(5000)=0.0467. \]
Este resultado funciona como una primera etapa porque muestra que el
instrumento —estar por encima del umbral poblacional que activa la
cuota— afecta el tratamiento efectivo, es decir, la proporción de
mujeres electas en el consejo municipal. Si no hubiera un salto en
Wshare, no serÃa posible usar el umbral como fuente de
variación exógena para estimar el efecto de la representación femenina
sobre corrupción.
Nota: el salto \(\hat\rho\) se estima aquà con un polinomio de grado 4 para replicar la Figura 1 del paper. En la estimación del LATE (sección 2.d) se usa una especificación lineal local consistente con la forma reducida.
En un fuzzy RD, el parámetro causal relevante se obtiene con un estimador tipo Wald:
\[ \hat\tau^{LATE}=\frac{\hat\tau^{RF}}{\hat\rho}. \]
En este caso:
\[ \hat\tau^{RF}=-0.1515, \qquad \hat\rho=0.0467. \]
Por tanto:
\[ \hat\tau^{LATE}=\frac{-0.1515}{0.0467}=55.377. \]
El LATE indica que un aumento de una unidad en la proporción de
mujeres electas —es decir, pasar de 0 a 1 en Wshare,
inducido por la cuota— cambia la corrupción revelada en aproximadamente
55.377 unidades. En términos de un punto porcentual adicional de mujeres
electas (cambio de 0.01 en Wshare, que está medida en
escala 0–1), el efecto estimado serÃa de aproximadamente 0.5538 unidades
de corrupción revelada. Este parámetro es local: aplica a municipios
cercanos al umbral de 5,000 habitantes cuya representación femenina
cambió por la cuota, no necesariamente a municipios grandes o pequeños
alejados del cutoff.
El RDD en niveles puede estar contaminado por tratamientos compuestos. El umbral de 5,000 habitantes no solo activa la cuota de género; también puede estar relacionado con diferencias administrativas, salariales, fiscales o institucionales entre municipios. Si esas diferencias generan un salto en corrupción independiente de la cuota, la estimación en niveles no aislarÃa únicamente el efecto de la representación femenina.
La solución de regresión discontinua en diferencias consiste en usar como outcome el cambio respecto al periodo base pre-reforma:
\[ \Delta Y_i = Y_{i,07}-Y_{i,03}. \]
El supuesto clave es que los otros factores institucionales asociados al umbral son relativamente constantes en el tiempo. Si esos factores ya existÃan antes de la cuota y afectan de forma similar el outcome antes y después de la reforma, al tomar diferencias se cancelan. AsÃ, el salto restante en \(\Delta Y_i\) puede atribuirse con mayor plausibilidad a la introducción de la cuota.
Si los municipios pudieran alterar estratégicamente su población
reportada para quedar justo arriba o justo abajo del umbral,
observarÃamos una discontinuidad en la densidad de popdiff
alrededor de cero. Por ejemplo, si los municipios quisieran evitar la
cuota, habrÃa una acumulación anormal de observaciones justo por debajo
de 5,000 habitantes y una caÃda justo por encima. En la práctica, esto
implicarÃa manipular el padrón o el registro poblacional oficial, lo
cual serÃa difÃcil porque requiere alterar información censal o
administrativa.
## $Estl
## Call: lpdensity
##
## Sample size 6846
## Polynomial order for point estimation (p=) 2
## Order of derivative estimated (v=) 1
## Polynomial order for confidence interval (q=) 3
## Kernel function triangular
## Scaling factor 0.84362292051756
## Bandwidth method user provided
##
## Use summary(...) to show estimates.
##
## $Estr
## Call: lpdensity
##
## Sample size 1270
## Polynomial order for point estimation (p=) 2
## Order of derivative estimated (v=) 1
## Polynomial order for confidence interval (q=) 3
## Kernel function triangular
## Scaling factor 0.156500308071473
## Bandwidth method user provided
##
## Use summary(...) to show estimates.
##
## $Estplot
| Prueba | p-value | Conclusión |
|---|---|---|
| McCrary / rddensity | 0.9227 | No se rechaza continuidad de la densidad |
El p-value del test de densidad es 0.9227. Al ser mayor a 0.05, no se rechaza la hipótesis nula de continuidad de la densidad alrededor del cutoff. No hay evidencia estadÃstica de que los municipios hayan manipulado su población reportada para quedar por encima o por debajo del umbral de 5,000 habitantes.
corr0703)La figura replica la lógica de regresión discontinua en diferencias
usando corr0703 como variable dependiente. Los puntos
muestran medias condicionales por intervalos de 100 habitantes y las
lÃneas muestran polinomios de cuarto grado estimados por separado a cada
lado del cutoff. Un salto negativo alrededor de cero indica que los
municipios sujetos a la cuota tuvieron una menor variación en corrupción
revelada respecto al periodo base, en comparación con municipios justo
por debajo del umbral.
| Periodo | Outcome | Tau | Error estándar | t | p-value | N | Sig |
|---|---|---|---|---|---|---|---|
| 2007 | urb0703 | -1.027 | 1.044 | -0.984 | 0.326 | 323 | |
| 2011 | urb1103 | -1.162 | 0.502 | -2.317 | 0.021 | 727 | ** |
Para el umbral de 2007, el estimado sobre urb0703 es
\(\hat\tau=\) -1.027 (EE = 1.044, p =
0.326). El signo negativo indica que los municipios justo por encima del
umbral redujeron su expansión de suelo urbano respecto al periodo base,
lo cual es consistente con la hipótesis de que la cuota redujo la
discrecionalidad en decisiones de uso de suelo.
Para el umbral de 2011, el estimado sobre urb1103 es
\(\hat\tau=\) -1.162 (EE = 0.502, p =
0.021). El patrón se replica en la segunda extensión de la cuota,
reforzando la evidencia de un efecto sostenido.
| Periodo | Tipo de outcome | Variable | Tau | Error estándar | t | p-value | N | Sig |
|---|---|---|---|---|---|---|---|---|
| 2007 | Corrupción revelada | corr0703 | -0.208 | 0.088 | -2.359 | 0.019 | 378 | ** |
| 2007 | Desarrollo urbano | urb0703 | -1.027 | 1.044 | -0.984 | 0.326 | 323 | |
| 2011 | Corrupción revelada | corr1103 | 0.042 | 0.042 | 1.002 | 0.317 | 810 | |
| 2011 | Desarrollo urbano | urb1103 | -1.162 | 0.502 | -2.317 | 0.021 | 727 | ** |
Los dos outcomes capturan dimensiones distintas del mismo fenómeno. La corrupción revelada es una medida más directa, pero depende de que los casos sean denunciados, detectados o procesados. En cambio, el desarrollo urbano es una medida indirecta: captura cambios en decisiones municipales de uso de suelo, un ámbito donde la discrecionalidad puede facilitar corrupción local. Por ello, si ambos outcomes muestran saltos negativos alrededor del cutoff, la evidencia es consistente con un mismo mecanismo: la mayor representación femenina inducida por la cuota habrÃa reducido tanto la corrupción observada directamente como una práctica urbana discrecional asociada con corrupción.
| Estimación | Tau | Error estándar | p-value | N |
|---|---|---|---|---|
| Pooled urban development | -1.124 | 0.471 | 0.017 | 1050 |
Sà puede tener sentido hacer una estimación conjunta si se interpreta como un efecto promedio inmediato de la cuota sobre desarrollo urbano alrededor de los dos cutoffs. La interpretación requiere asumir que los efectos de 2007 y 2011 son comparables una vez que cada running variable está centrada en su umbral correspondiente. Sin embargo, esta estimación conjunta debe presentarse como complementaria, no como sustituto de las estimaciones separadas, porque los periodos, los municipios marginales y los cutoffs no son idénticos.
El uso de herramientas de inteligencia artificial, especÃficamente Claude 4.6 y ChatGPT, se empleó como apoyo para la corrección de código y sintaxis, asà como para mejorar la redacción y la interpretación de textos. Además, estas herramientas fueron utilizadas para obtener explicaciones, aclaracion de dudas y retroalimentación sobre las interpretaciones desarrolladas en el trabajo. A continuación, se presenta un ejemplo de apoyo en la corrección de sintaxis e interpretación correspondiente a la pregunta 1.a.