1 Pregunta 1. Estimación simple

1.1 1.a. OLS: representación femenina y corrupción revelada

La correlación negativa entre representación femenina y corrupción puede estar sesgada por variables omitidas que afectan simultáneamente ambas variables. Un ejemplo concreto es el nivel de desarrollo institucional del municipio: los municipios con instituciones más sólidas (prensa libre, mayor competencia electoral, presupuestos más transparentes) tienden a tener mayor representación femenina y menores niveles de corrupción, independientemente del género de sus funcionarios. Si esta variable no se controla, el coeficiente de OLS capturaría tanto el posible efecto causal de la representación femenina como el efecto de las mejores instituciones, sobreestimando (en valor absoluto) la relación. Por ello, la estimación OLS debe interpretarse como una correlación descriptiva, no como un efecto causal.

Estimación OLS: corrupción revelada y representación femenina en el periodo base
Variable Coeficiente Error estándar t p-value
Constante 0.0082 0.0021 3.843 0.0001
Proporción de mujeres 2003–2007 0.0344 0.0074 4.663 0.0000

El coeficiente principal estimado es \(\hat\beta =\) 0.0344, lo que indica una asociación positiva entre representación femenina y corrupción revelada. Este coeficiente sugiere que un aumento de 10 puntos porcentuales en la proporción de mujeres (cambio de 0.10 en Wshare03) se asocia con un cambio de aproximadamente 0.0034 unidades en corr07. Esta relación no debe interpretarse causalmente porque la estimación no controla por factores municipales omitidos que afectan simultáneamente representación femenina y corrupción.

1.2 1.b. Resultados potenciales y comparación causal del RDD

En este contexto, \(E(Y_{it}^{T}\mid Pop_i=5000)\) representa el nivel esperado de corrupción que tendrían los municipios ubicados exactamente en el umbral de 5,000 habitantes si estuvieran sujetos al tratamiento: la regla de cuota que induce un aumento en la representación femenina. Por su parte, \(E(Y_{it}^{C}\mid Pop_i=5000)\) representa el nivel esperado de corrupción que esos mismos municipios tendrían si no estuvieran sujetos a la cuota.

La comparación causal de interés es:

\[ \tau = E(Y_{it}^{T}\mid Pop_i=5000)-E(Y_{it}^{C}\mid Pop_i=5000). \]

La regresión discontinua busca estimar esta diferencia comparando municipios justo por encima y justo por debajo del umbral poblacional. La estimación será causal bajo el supuesto de continuidad de los resultados potenciales en el cutoff: en ausencia de la cuota, los municipios apenas por debajo y apenas por encima de 5,000 habitantes habrían tenido niveles esperados de corrupción similares. Bajo ese supuesto, cualquier salto discreto en el outcome alrededor del umbral puede atribuirse a la regla de cuota y no a diferencias preexistentes entre municipios.

1.3 1.c. Primer acercamiento gráfico al RDD

La gráfica sugiere un salto negativo alrededor del cutoff. Si se aproxima el salto con los polinomios cuadráticos estimados a ambos lados del umbral, el valor visual del parámetro de interés sería cercano a \(\hat\tau \approx\) -0.174. Esto anticipa que los municipios sujetos a la cuota tendrían menor corrupción revelada que municipios comparables justo por debajo del umbral.

1.4 1.d. Estimación RDD con regresión lineal local y kernel triangular

El kernel triangular asigna mayor peso a las observaciones más cercanas al cutoff y menor peso a las observaciones ubicadas cerca del borde del bandwidth. Formalmente, para \(|X_i|\leq h\):

\[ w_i = 1-\frac{|X_i|}{h}, \qquad h=1000. \]

La estimación se obtiene mediante una regresión lineal local ponderada, usando MCO, con una pendiente distinta a cada lado del umbral:

\[ Y_i = \alpha + \tau D_i + \beta X_i + \gamma(D_iX_i)+u_i, \]

donde \(D_i=1[X_i\geq0]\). En esta especificación, \(\tau\) es el salto en el cutoff.

Regresión lineal local del lado izquierdo:

\[ \widehat{Y}_i^{-} = 0.1479 + 0.0002144X_i. \]

Regresión lineal local del lado derecho:

\[ \widehat{Y}_i^{+} = -0.0036 + 0.0000906X_i. \]

Parámetro estimado:

\[ \hat\tau = \widehat{Y}^{+}(0)-\widehat{Y}^{-}(0)=-0.1515. \]

El estimado RDD indica que cruzar el umbral de 5,000 habitantes —quedar sujeto a la cuota en 2007— se asocia con una reducción de 0.1515 unidades en corrupción revelada para municipios cercanos al cutoff. Dado que corr07 es una variable dicotómica (0/1), este número puede interpretarse como una reducción de aproximadamente 15.2 puntos porcentuales en la probabilidad de que un municipio registre un caso de corrupción. En términos de magnitud, el efecto equivale a 121.1% de una desviación estándar de corr07. El paper reporta un efecto de magnitud similar (~61% de la DE), lo que sugiere consistencia con sus resultados.

1.5 1.e. Verificación con comandos de Cattaneo (rdrobust)

Comparación entre la estimación manual y rdrobust
Estimador Tau Error estándar
Manual con MCO local -0.1515 0.0600
rdrobust: convencional -0.1515 0.0618

Los resultados son equivalentes porque ambos estiman una regresión lineal local con kernel triangular y bandwidth de 1,000 habitantes. La diferencia principal es que rdrobust automatiza la inferencia y ofrece estimaciones corregidas por sesgo, mientras que la sección anterior muestra de manera explícita cómo se obtiene el salto mediante MCO ponderado.

2 Pregunta 2. ¿Sharp o Fuzzy?

2.1 2.a. Tipo de diseño RD

El tratamiento de interés sustantivo en este paper es la representación femenina efectiva en el consejo municipal (la proporción de mujeres electas, Wshare), no simplemente la sujeción legal a la cuota. Bajo esa definición, el diseño es fuzzy RD: cruzar el umbral de 5,000 habitantes aumenta discontinuamente la probabilidad de mayor representación femenina, pero no la determina perfectamente —como muestra la Figura 1, hay municipios por debajo del umbral con alta representación femenina y viceversa.

La cuota actúa entonces como un instrumento: genera variación exógena en Wshare alrededor del cutoff. La estimación de la Pregunta 1 es la forma reducida (ITT): el efecto de estar sujeto a la cuota sobre corrupción. Para estimar el efecto causal de la representación femenina efectiva, se divide ese salto entre el salto en Wshare (primera etapa), obteniendo el LATE de la Pregunta 2.d.

2.2 2.b. Figura 1 del paper para 2007 con medias condicionales

Usar medias condicionales mejora la legibilidad porque reduce el ruido visual de miles de observaciones individuales. En lugar de mostrar todos los municipios, cada punto resume el promedio de municipios dentro de un intervalo poblacional de 100 habitantes. Esto permite observar con mayor claridad el salto en la representación femenina alrededor del umbral de 5,000 habitantes.

2.3 2.c. Interpretación de la primera etapa

El valor principal de la Figura 1 es el salto estimado en la proporción de mujeres electas al cruzar el umbral de 5,000 habitantes. Con la especificación gráfica anterior, el salto estimado es:

\[ \hat\rho = \widehat{Wshare}^{+}(5000)-\widehat{Wshare}^{-}(5000)=0.0467. \]

Este resultado funciona como una primera etapa porque muestra que el instrumento —estar por encima del umbral poblacional que activa la cuota— afecta el tratamiento efectivo, es decir, la proporción de mujeres electas en el consejo municipal. Si no hubiera un salto en Wshare, no sería posible usar el umbral como fuente de variación exógena para estimar el efecto de la representación femenina sobre corrupción.

Nota: el salto \(\hat\rho\) se estima aquí con un polinomio de grado 4 para replicar la Figura 1 del paper. En la estimación del LATE (sección 2.d) se usa una especificación lineal local consistente con la forma reducida.

2.4 2.d. Parámetro causal relevante: LATE

En un fuzzy RD, el parámetro causal relevante se obtiene con un estimador tipo Wald:

\[ \hat\tau^{LATE}=\frac{\hat\tau^{RF}}{\hat\rho}. \]

En este caso:

\[ \hat\tau^{RF}=-0.1515, \qquad \hat\rho=0.0467. \]

Por tanto:

\[ \hat\tau^{LATE}=\frac{-0.1515}{0.0467}=55.377. \]

El LATE indica que un aumento de una unidad en la proporción de mujeres electas —es decir, pasar de 0 a 1 en Wshare, inducido por la cuota— cambia la corrupción revelada en aproximadamente 55.377 unidades. En términos de un punto porcentual adicional de mujeres electas (cambio de 0.01 en Wshare, que está medida en escala 0–1), el efecto estimado sería de aproximadamente 0.5538 unidades de corrupción revelada. Este parámetro es local: aplica a municipios cercanos al umbral de 5,000 habitantes cuya representación femenina cambió por la cuota, no necesariamente a municipios grandes o pequeños alejados del cutoff.

3 Pregunta 3. Regresión discontinua en diferencias

3.1 3.a. Limitaciones del RDD en niveles y justificación de diferencias

El RDD en niveles puede estar contaminado por tratamientos compuestos. El umbral de 5,000 habitantes no solo activa la cuota de género; también puede estar relacionado con diferencias administrativas, salariales, fiscales o institucionales entre municipios. Si esas diferencias generan un salto en corrupción independiente de la cuota, la estimación en niveles no aislaría únicamente el efecto de la representación femenina.

La solución de regresión discontinua en diferencias consiste en usar como outcome el cambio respecto al periodo base pre-reforma:

\[ \Delta Y_i = Y_{i,07}-Y_{i,03}. \]

El supuesto clave es que los otros factores institucionales asociados al umbral son relativamente constantes en el tiempo. Si esos factores ya existían antes de la cuota y afectan de forma similar el outcome antes y después de la reforma, al tomar diferencias se cancelan. Así, el salto restante en \(\Delta Y_i\) puede atribuirse con mayor plausibilidad a la introducción de la cuota.

3.2 3.b. Manipulación de la running variable y test de McCrary

3.2.1 3.b.a. Qué esperaríamos ver si hubiera manipulación

Si los municipios pudieran alterar estratégicamente su población reportada para quedar justo arriba o justo abajo del umbral, observaríamos una discontinuidad en la densidad de popdiff alrededor de cero. Por ejemplo, si los municipios quisieran evitar la cuota, habría una acumulación anormal de observaciones justo por debajo de 5,000 habitantes y una caída justo por encima. En la práctica, esto implicaría manipular el padrón o el registro poblacional oficial, lo cual sería difícil porque requiere alterar información censal o administrativa.

3.2.2 3.b.b. Test de McCrary

## $Estl
## Call: lpdensity
## 
## Sample size                                      6846
## Polynomial order for point estimation    (p=)    2
## Order of derivative estimated            (v=)    1
## Polynomial order for confidence interval (q=)    3
## Kernel function                                  triangular
## Scaling factor                                   0.84362292051756
## Bandwidth method                                 user provided
## 
## Use summary(...) to show estimates.
## 
## $Estr
## Call: lpdensity
## 
## Sample size                                      1270
## Polynomial order for point estimation    (p=)    2
## Order of derivative estimated            (v=)    1
## Polynomial order for confidence interval (q=)    3
## Kernel function                                  triangular
## Scaling factor                                   0.156500308071473
## Bandwidth method                                 user provided
## 
## Use summary(...) to show estimates.
## 
## $Estplot

Conclusión del test de densidad en el cutoff
Prueba p-value Conclusión
McCrary / rddensity 0.9227 No se rechaza continuidad de la densidad

El p-value del test de densidad es 0.9227. Al ser mayor a 0.05, no se rechaza la hipótesis nula de continuidad de la densidad alrededor del cutoff. No hay evidencia estadística de que los municipios hayan manipulado su población reportada para quedar por encima o por debajo del umbral de 5,000 habitantes.

3.3 3.c. Figura 3: corrupción revelada en diferencias (corr0703)

La figura replica la lógica de regresión discontinua en diferencias usando corr0703 como variable dependiente. Los puntos muestran medias condicionales por intervalos de 100 habitantes y las líneas muestran polinomios de cuarto grado estimados por separado a cada lado del cutoff. Un salto negativo alrededor de cero indica que los municipios sujetos a la cuota tuvieron una menor variación en corrupción revelada respecto al periodo base, en comparación con municipios justo por debajo del umbral.

3.4 3.d. Desarrollo urbano

3.4.1 3.d.a. Figuras 3b y 5b: desarrollo urbano en 2007 y 2011

3.4.2 3.d.b. Interpretación específica de desarrollo urbano

Estimaciones RDD locales para desarrollo urbano
Periodo Outcome Tau Error estándar t p-value N Sig
2007 urb0703 -1.027 1.044 -0.984 0.326 323
2011 urb1103 -1.162 0.502 -2.317 0.021 727 **

Para el umbral de 2007, el estimado sobre urb0703 es \(\hat\tau=\) -1.027 (EE = 1.044, p = 0.326). El signo negativo indica que los municipios justo por encima del umbral redujeron su expansión de suelo urbano respecto al periodo base, lo cual es consistente con la hipótesis de que la cuota redujo la discrecionalidad en decisiones de uso de suelo.

Para el umbral de 2011, el estimado sobre urb1103 es \(\hat\tau=\) -1.162 (EE = 0.502, p = 0.021). El patrón se replica en la segunda extensión de la cuota, reforzando la evidencia de un efecto sostenido.

3.4.3 3.d.c. Comparación entre corrupción revelada y desarrollo urbano

Comparación entre corrupción revelada y desarrollo urbano
Periodo Tipo de outcome Variable Tau Error estándar t p-value N Sig
2007 Corrupción revelada corr0703 -0.208 0.088 -2.359 0.019 378 **
2007 Desarrollo urbano urb0703 -1.027 1.044 -0.984 0.326 323
2011 Corrupción revelada corr1103 0.042 0.042 1.002 0.317 810
2011 Desarrollo urbano urb1103 -1.162 0.502 -2.317 0.021 727 **

Los dos outcomes capturan dimensiones distintas del mismo fenómeno. La corrupción revelada es una medida más directa, pero depende de que los casos sean denunciados, detectados o procesados. En cambio, el desarrollo urbano es una medida indirecta: captura cambios en decisiones municipales de uso de suelo, un ámbito donde la discrecionalidad puede facilitar corrupción local. Por ello, si ambos outcomes muestran saltos negativos alrededor del cutoff, la evidencia es consistente con un mismo mecanismo: la mayor representación femenina inducida por la cuota habría reducido tanto la corrupción observada directamente como una práctica urbana discrecional asociada con corrupción.

3.4.4 3.d.d. Opcional: estimación conjunta para desarrollo urbano

Estimación conjunta opcional para desarrollo urbano
Estimación Tau Error estándar p-value N
Pooled urban development -1.124 0.471 0.017 1050

Sí puede tener sentido hacer una estimación conjunta si se interpreta como un efecto promedio inmediato de la cuota sobre desarrollo urbano alrededor de los dos cutoffs. La interpretación requiere asumir que los efectos de 2007 y 2011 son comparables una vez que cada running variable está centrada en su umbral correspondiente. Sin embargo, esta estimación conjunta debe presentarse como complementaria, no como sustituto de las estimaciones separadas, porque los periodos, los municipios marginales y los cutoffs no son idénticos.

4 Disclaimer sobre uso de IA

El uso de herramientas de inteligencia artificial, específicamente Claude 4.6 y ChatGPT, se empleó como apoyo para la corrección de código y sintaxis, así como para mejorar la redacción y la interpretación de textos. Además, estas herramientas fueron utilizadas para obtener explicaciones, aclaracion de dudas y retroalimentación sobre las interpretaciones desarrolladas en el trabajo. A continuación, se presenta un ejemplo de apoyo en la corrección de sintaxis e interpretación correspondiente a la pregunta 1.a.