Unificacion Elecciones Nacimientos Defunciones Poblacion
Especificación requerida
NOTA:::
Hice cortes por mes, bimestre, trimestre, semestre y anual correspondientes a año calendario de la elección.
Pero también hice corridas por cortes de mes, bimestre, trimestre, semestre y anual de año natural de la elección, la razón por la que lo hice fue que por que estamos analizando elecciones y por ejemplo, si la elección fue en junio 2016, muy seguramente el efecto de ciclos oportunistas en un periodo por ejemplo anual, será todo 2015 y hasta junio de 2016, despues de 2016 ya no habrá tantas inversiones oportunistas pq las elecciones ya concluyeron, si se hace con año calendario, en este caso el año cero sería 2016 y estaría super contaminado con 6 meses de inversión oportunista y 6 meses sin inversión oportunista
Descripción de los datos
Elecciones
Se recabaron las elecciones estatales desde 1979 y hasta 2022 para las 32 estados, para 20 estados se recabaron 8 elecciones, para 11 estados fueron recabadas 7 elecciones y Ciudad de México tuvo 5 elecciones. (Total elecciones: 20 X 8 + 11 X 7 + 1 X 5 = 242)
Ver tabla detalle en:
Nacimientos
Los registros de nacimientos ocurridos son de 2008 y hasta 2021.
Procedemos a agrupar a nivel mensual, bimestral, trimestral, semestral y anual cada una de las fechas electorales. Por lo que se utilizarán solo las elecciones que estén máximo 3 años antes (2005) o 6 bimestres o 12 trimestres o 18 bimestres o 36 meses antes y las elecciones que están máximo 3 años después (2022) o 5 semestres o 12 trimestres o 17 bimestres o 35 meses.
Ejemplo: supongamos una eleccion que sucedio el 11 de noviembre 2015, las agrupaciones quedan como sigue: a nivel mensual corresponde a noviembre 2015, a nivel bimestral corresponde a noviembre-diciembre 2015, a nivel trimestral corresponde a octubre, noviembre y diciembre 2015, a nivel semestral corresponde a julio-diciembre 2015 y a nivel anual corresponde al año 2015. Después, para cada fecha electoral (despues de agruparla como mencionamos anteriormente) generamos agrupaciones de meses, bimestres, trimestres, semestres y años previos y posteriores. Para cualquiera de las agrupaciones, le llamaremos el periodo cero al periodo donde se agrupó la elección y después generamos agrupaciones de fechas previas y posteriores a la agrupación electoral, por lo que a nivel mensual elegimos 36 periodos previos y 35 periodos posteriores, para así completar los 6 años del periodo electoral (3 años previos y 3 años posteriores), para el bimestral elegimos 18 bimestres previos y 17 bimestres posteriores, para el trimestral elegimos 12 trimestres previos y 11 trimestres posteriores, para el semestral 6 semestres previos y 5 semestres posteriores y para el caso anual elegimos 3 años previos y 2 años posteriores. Para el caso del ejemplo antes citado, en el caso anual, se elegiría años cero sería 2015, año -1 sería 2014, año -2 sería 2013, año -2 sería 2012, año 1 sería 2016 y año 2 sería 2017 (2012-2017), si por ejemplo la siguiente elección sucede 6 años despues (11 de noviembre 2021) los periodos quedarían: año cero = 2021, año -1 = 2020, año -2 = 2019 y año -3 = 2018 y año 1 sería 2022 y año 2 sería 2023 (2018-2023). Similarmente se sigue con semestres y los demás periodos
Siguiendo las agrupaciones anteriormente mencionadas, se creará una tabla de datos para cada agrupación, en donde se agruparán los:
Nacimientos,
Proporción de ELWB,
Promedio de consultas recibidas,
Proporción de los que sí recibieron atención prenatal y
Proporción de madres sobrevivientes
Para el caso de nacimientos mensuales queda como sigue:
Del total de nacimientos, solo nos quedamos con los nacimientos ocurridos desde -36 meses de la eleccion y hasta 35 meses despues de la eleccion, y recordemos como en algunos casos hubo periodos electorales que ocurrieron en menos de 6 años (gobernador pidió licencia, o gobernador se salio o se alinearon con las elecciones federales). Por lo tanto puede haber nacimientos ocurridos en un periodo donde esta a ciertos meses de la elección anterior, pero también está a ciertos meses de la elección posterior y están dentro del rango, este tipo de casos se eliminan y hay otros casos como que están fuera de las fechas electorales y del rango de los 36 meses antes y despues.
DUDA::: (Por lo pronto está bien eliminar esto? En futuras iteraciones haré que corresponda al más próximo a la elección)
Ejemplo:
Para las agrupaciones mensuales solo nos quedaremos con las siguientes elecciones:
Para las agrupaciones bimestrales solo nos quedaremos con las siguientes elecciones:
Para las agrupaciones trimestrales solo nos quedaremos con las siguientes elecciones:
Para las agrupaciones semestrales solo nos quedaremos con las siguientes elecciones:
Para las agrupaciones anuales solo nos quedaremos con las siguientes elecciones:
Total nacimientos SINAC 2008-2021 y nacimientos utilizados en los diferentes cortes mensuales, bimestrales, trimestrales, semestrales y anuales.
Es decir hay aproximadamente 10% de nacimientos que serán descartados de la muestra mensual ya que pertenecen a dos elecciones diferentes
Vease que la mayor razón por la que se eliminarían algunos nacimientos (6%) es porque algunas elecciones duran menos de 6 años y se enciman los periodos. Lo que haremos será pensar que la fecha de eleccion más cercana es la que causa el impacto.
(Esto debe pensarse bien derivado de lo revisado en el Paper de; Sanders & Sanders, 2014)
Se puede identificar que el años 2021 es el año con más registros eliminados, pero en los demás años se ve una eliminnación no demasiado atípica, en 2021 son más debido a que muchas elecciones ya tienen más de 3 años que sucedieron.
En el semestral revisar el año 2013 y el 2018 y en el anual el año 2018.
(Corresponden a registros de Michoacán, Puebla y Veracruz)
DUDA::: (Es importante notar que todavía no registro las elecciones que no han sucedido, pero quizá es buena idea hacerlo ya que por ejemplo en Estado de México y Colima el 2021 ya podría contar como año -1, será buena idea incluirlo?)
Al identificar los estados donde se descarta mayor muestra notamos que Edo Mex y Coahuila se utiliza ~ 90% de los registros. Todos los demás, más del 90% de los nacimientos son utilizados
Identificaremos las razones por las que los estados de Michoacán, Puebla y Veracruz, tienen más observaciones pertenecientes al dos elecciones:
MICHOACAN
Gobernador de Michoacán (2007): titular del Poder Ejecutivo del estado, electo para un periodo extraordinario de cuatro años no reelegibles en ningún caso. El candidato electo fue Leonel Godoy Rangel
Gobernador de Michoacán (2011): titular del Poder Ejecutivo del estado, electo para un periodo extraordinario de tres años y siete meses en ningún caso reelegibles, el candidato electo fue Fausto Vallejo Figueroa.
Gobernador de Michoacán (2015): titular del Poder Ejecutivo del estado, electo para un periodo de seis años en ningún caso reelegibles. El candidato electo fue Silvano Aureoles Conejo
PUEBLA
Las elecciones estatales de Puebla de 2016 se llevaron a cabo el domingo 5 de junio de ese año y en ellas se renovará el cargo de gobernador de Puebla, el cual fungirá como titular del poder ejecutivo estatal durante 20 meses. (Esto provoca que de 2015 a 2019 se encimen las agrupaciones para dos elecciones)
VERACRUZ
Gobernador de Veracruz(2016): titular del Poder Ejecutivo estatal, electo para un periodo de seis años no reelegibles en ningún caso. No obstante, por ocasión excepcional, la Suprema Corte de Justicia de la Nación validó la elección de gobernador para un periodo de dos años, con el objetivo de adecuarse al calendario de las elecciones federales de 2018. El candidato electo fue Miguel Ángel Yunes Linares. (Esto provoca que de 2015 a 2019 se encimen las agrupaciones para dos elecciones)
Elecciones de Michoacan, Puebla y Veracruz sucedieron en:
En el siguiente gráfico, veremos como está repartida la muestra anualmente, (recordenmos que las etiquetas 1 y 2 (azul y verde)) son las que utilizaremos.
Por lo que los cortes mensuales quedan como sigue: Color rojo: Registros que no pertenecen a ninguna agrupación del ciclo electoral Color verde: Registros que pertenecen a dos agrupaciones de dos ciclos electorales consecutivos Color azul: Registros a utilizar
En la siguiente gráfica podemos ver el comportamiento mensual de de los registros de nacimiento para los diferentes años. Como podemos apreciar, solo 2020 y 2021 tienen atrición.
Aqui podemos ver de manera gráfica los datos usables y la atrición por estado de manera anual
Aqui podemos ver de manera gráfica los datos usables y su comportamiento mensual
Ahora veremos los mismos gráficos pero para las agrupaciones de año calendario. (Bimestral, Trimestral, Semestral y Anual)
Mismo comentario que en el mensual, solo 2020 y 2021 tienen un comportamiento raro y se debe a que esos nacimientos en esos meses no alcanzaron alguna eleccion a 18 bimestres de diferencia
Cuando eliminabamos los cohortes que pertenecian a dos elecciones, se veían muchas gráficas con caídas sobre todo en Junio (Ahora se comportan de mejor manera estás gráficas)
Ahora veamos los trimestrales (Misma explicación que antes)
Ahora veamos los semestrales (Misma explicación que antes)
Ahora veamos los anuales (Misma explicación que antes)
Registros usables y su asignación en subgrupos
Se puede observar de que independientemente de que algunos intervalos contienen más registros, en general ningún intervalo se queda sin datos, la muestra está más o menos bien balanceada (solo como excepción del cohorte -36), lo que sí es de notar, es que se nota cierta estacionalidad en la gráfica de abajo, la cual muy posiblemente la hereda de la estacionalidad que se observa en los nacimientos para los algunos meses del año (Agosto, Septiembre y Octubre). Vease la gráfica de los nacimientos mensuales
Estas agrupaciones son en terminos de nacimientos,
Veamos una gráfica de caja por cada cohorte y ver el numero de nacimientos
Veamos una gráfica de caja por cada cohorte por cada estado y ver el numero de nacimientos
Estas agrupaciones son en terminos de meses que hay,
Misma explicación que el mensual
Misma explicación que el mensual
Misma explicación que el mensual
Misma explicación que el mensual
Poblacion de mujeres para la tasa de nacimientos y de niños menores a 4 años para las tasas de mortalidad
DUDA::: (Me preocupa que para las tasas se utilizan datos de población que se actualiza entre 5 y 10 años), existe alguna otra manera de sacar datos más dinamicos al menos anual?
Rows: 992
Columns: 3
$ Entidad_federativa <chr> "AGUASCALIENTES", "AGUASCALIENTES", "AGUASCALIENTES…
$ Mujeres_15_49 <dbl> 184175.0, 230970.0, 256215.0, 290121.0, 327632.0, 3…
$ anio <dbl> 1990, 1995, 2000, 2005, 2010, 2020, 1991, 1992, 199…
Rows: 992
Columns: 3
$ Entidad_federativa <chr> "AGUASCALIENTES", "AGUASCALIENTES", "AGUASCALIENTES…
$ Mujeres <dbl> 369441.0, 440396.0, 487752.0, 550052.0, 608358.0, 7…
$ anio <dbl> 1990, 1995, 2000, 2005, 2010, 2020, 1991, 1992, 199…
Rows: 992
Columns: 3
$ Entidad_federativa <chr> "AGUASCALIENTES", "AGUASCALIENTES", "AGUASCALIENTES…
$ Poblacion <dbl> 719659.0, 862720.0, 944285.0, 1065416.0, 1184996.0,…
$ anio <dbl> 1990, 1995, 2000, 2005, 2010, 2020, 1991, 1992, 199…
Rows: 992
Columns: 3
$ Entidad_federativa <chr> "AGUASCALIENTES", "AGUASCALIENTES", "AGUASCALIENTES…
$ Poblacion_0_4 <dbl> 98013.0, 112429.0, 116137.0, 118536.0, 121557.0, 12…
$ anio <dbl> 1990, 1995, 2000, 2005, 2010, 2020, 1991, 1992, 199…
Otra revisión a la base es ver le numero de nacimientos promedio por cada periodo, solo para ver si hay estacionalidades como se ven en los nacimentos, cabe mencionar que estos promedio son a nivel municipal:
Las regresiones corridas son:
model1_month <- lm(formula = log(1+tasa_nacimiento_mujeres_15_49) ~ periodo_diferencia_months + entidad_nacimiento + anio_nacim_hijo + mes_nacim_hijo + entidad_nacimiento:anio_nacim_hijo_numeric,
feols_clustered_ent_mun_ent_nac_month <-
feols( log(1+total_nacimientos) ~
diff_months +
entidad_nacimiento:anio_nacim_hijo_numeric +
elecciones_federales
| ent_mun +
anio_nacim_hijo_numeric +
mes_nacim_hijo_numeric
,
cluster = ~ ent_elecciones ,
data = resumen_sinac_elecciones_completa_month_cohortes %>%
mutate(ent_elecciones = glue("{entidad_nacimiento_cve}_{anio_mes_eleccion}")) %>%
mutate(ent_mun_elecciones = glue("{entidad_nacimiento_cve}_{municipio_nacimiento_cve}_{anio_mes_eleccion}")) %>%
mutate(ent_mun = glue("{entidad_nacimiento_cve}_{municipio_nacimiento_cve}")) %>%
mutate(elecciones_federales = case_when(
anio_nacim_hijo_numeric %in% c(2006,2012,2018) & mes_nacim_hijo_numeric %in% c(7) ~ 1,
TRUE ~ 0
)) %>%
mutate(periodo_diferencia_months = periodo_diferencia_months %>% as_factor()) %>%
mutate(periodo_diferencia_months = periodo_diferencia_months %>% relevel(ref = "0")) %>%
mutate(diff_months = periodo_diferencia_months) %>%
filter(anio_nacim_hijo_numeric>=2008)
)
Las bases de datos utilizadas son del siguiente tipo:
Rows: 10
Columns: 6
$ entidad_nacimiento_cve <glue> "01", "01", "01", "01", "01", "01", "01…
$ municipio_nacimiento_cve <chr> "001", "003", "006", "007", "001", "003"…
$ anio_nacim_hijo <fct> 2008, 2008, 2008, 2008, 2008, 2008, 2008…
$ mes_nacim_hijo <fct> 1, 1, 1, 1, 2, 2, 2, 2, 3, 3
$ periodo_diferencia_months <fct> -30, -30, -30, -30, -29, -29, -29, -29, …
$ tasa_nacimiento_mujeres_15_49 <dbl> 5.1083142, 0.2558955, 0.3422602, 0.49579…