title: “Determinantes Socioeconómicos de la Fecundidad Femenina en Colombia” output: html_document: toc: true toc_depth: 3 toc_float: true number_sections: true theme: flatly highlight: tango pdf_document: toc: true toc_depth: 3 number_sections: true latex_engine: xelatex date: “2026-05-14” lang: es —


Motivación

En Colombia, la Tasa Global de Fecundidad (TGF) pasó de 7.0 hijos por mujer en 1964 a 2.0 en 2015, según la Encuesta Nacional de Demografía y Salud (ENDS 2015, p. 37). Detrás de ese promedio se esconden brechas persistentes: mujeres sin educación promedian 3.9 hijos frente a 1.6 de quienes alcanzaron educación superior; en el quintil de riqueza más bajo el promedio es 2.8 frente a 1.3 en el más alto; y las mujeres rurales tienen 2.6 hijos frente a 1.8 en zonas urbanas. Comprender qué factores explican esas diferencias es relevante no solo desde el punto de vista demográfico, sino para el diseño de política pública en salud reproductiva, educación y reducción de la pobreza.

El objetivo de este trabajo es estimar los determinantes socioeconómicos del número de hijos nacidos vivos de mujeres de 13 a 49 años en Colombia usando datos de la ENDS 2015. La variable dependiente es Q210, que registra el total de hijos nacidos vivos con valores válidos de 0 a 8 o más.

Los ceros se conservan como respuestas válidas. El promedio muestral es 1.47 (ENDS 2015, p. 38). Los regresores son: nivel educativo (Q106A), edad de la mujer (Q104), zona de residencia (QZONA), quintil de riqueza (QUINTIL), estado conyugal (Q601) y uso actual de anticonceptivos (Q311).

Esa especificación constituye el modelo inicial propuesto, que se evaluó y ajustó en función de los resultados obtenidos, como se describe a continuación.

Distribución de hijos nacidos vivos. ENDS 2015.

Distribución de hijos nacidos vivos. ENDS 2015.

Comparación de la muestra: zona urbana y rural. ENDS 2015.

Comparación de la muestra: zona urbana y rural. ENDS 2015.

Tabla 1. Variables del modelo

Código Variable Tipo Descripción
Q210 Hijos nacidos vivos Dependiente Total de hijos vivos reportados. Promedio: 1.47.
Q106A Nivel educativo Factor (0–11) De Ninguno (0) a Doctorado (11). Categoría base: Ninguno.
Q104 Edad Continua (13–49) Controla el tiempo acumulado de exposición al riesgo.
QZONA Zona Dummy (1=Urbano) Captura diferencias en acceso a servicios y mercado laboral.
QUINTIL Quintil de riqueza Factor (1–5) Proxy de ingreso. Categoría base: Más bajo.
Q601 Estado conyugal Dummy (1=Con pareja) Unida o casada=1; sin pareja estable=0. Mide exposición al riesgo.
Q311 Uso de anticonceptivos Dummy (1=Sí) Mecanismo de control de la fecundidad.

Fuente: ENDS 2015, Profamilia.


Justificación Teórica y Especificación

El fundamento del modelo es la Nueva Economía del Hogar de Gary Becker. En su artículo de 1960 y en A Treatise on the Family (1981), Becker plantea que la decisión de tener hijos resulta de una optimización en la que el hogar maximiza utilidad sobre consumo, número y calidad de los hijos, sujeto a restricciones de tiempo e ingreso. El mecanismo central del tradeoff cantidad-calidad es que un mayor nivel educativo de la madre eleva su salario potencial, encarece el costo de oportunidad de criar y reduce la demanda óptima de hijos. Esto fundamenta la predicción de un coeficiente negativo en educación (\(\beta_1 < 0\)). Doepke et al. (2022, IZA DP No. 15224) actualizan este marco para el siglo XXI, mostrando que el costo de oportunidad del tiempo materno sigue siendo el mecanismo explicativo central en contextos de transición demográfica.


Revisión de Literatura

La economía de la fecundidad tiene sus raíces en Becker (1960, 1981), quien formalizó la decisión reproductiva como un problema de optimización del hogar. Doepke (2015) sintetiza cómo este marco predice una relación negativa entre educación femenina y número de hijos a través del costo de oportunidad del tiempo: a mayor capital humano, mayor salario potencial, mayor precio implícito de criar. Doepke et al. (2022) documentan que este mecanismo sigue siendo el más robusto para explicar la variación en fecundidad entre países y cohortes, aunque señalan que la relación ingreso-fecundidad se ha debilitado en economías avanzadas, lo que motiva controlar por quintil de riqueza de forma separada a la educación.

La evidencia sobre el efecto negativo de la educación femenina sobre la fecundidad es consistente en distintos contextos. Kim (2016), en su revisión para IZA World of Labor, identifica tres vías causales: el aumento del costo de oportunidad de la crianza, la reducción de la mortalidad infantil que disminuye la demanda precautoria de hijos, y el mayor acceso al conocimiento anticonceptivo. Su estimación cuantitativa indica que cada año adicional de educación se asocia con –0.26 hijos en promedio, cifra que sirve como referencia para calibrar la magnitud de los coeficientes del presente modelo. Ángeles y Stubner (2022), usando regresión MCO con efectos fijos de país sobre un panel 1960–2015, estiman un coeficiente de 0.42 hijos por año de educación, y documentan que este resultado es robusto a distintas especificaciones. National Academies of Sciences (2003) sistematiza cómo la educación opera a través de los determinantes próximos de la fecundidad (nupcialidad, uso de anticonceptivos e iniciación sexual) lo que justifica la inclusión simultánea de Q601 y Q311 en el modelo como variables de control, no como variables de tratamiento.

Brand y Davis (2011) introducen un matiz importante: el efecto de la educación universitaria es heterogéneo según la propensión previa al acceso educativo. Las mujeres con menor probabilidad de acceso que logran alcanzar la universidad exhiben los efectos negativos más pronunciados sobre fecundidad. Esto implica que, sin controlar por quintil de riqueza (que determina en parte esa propensión), el coeficiente de educación estaría sesgado hacia arriba.

Vásquez-Neira et al. (2020), en un análisis de 141 países, clasifican los determinantes de la fecundidad por magnitud de efecto y encuentran que la educación es el factor más influyente, seguido por la prevalencia anticonceptiva, el ingreso y la religión. Para América Latina específicamente, la pendiente negativa de la relación educación-fecundidad es más pronunciada que en otras regiones, validando el signo esperado \(\beta_1 < 0\) para Colombia. Penn Wharton Budget Model (2022) cuantifica el efecto del estado conyugal: las mujeres casadas tienen al menos tres puntos porcentuales más de probabilidad de tener un hijo en un período dado, apoyando la inclusión de Q601 como determinante independiente y no sustituto de la educación. Iyer et al. (2025) advierten que los determinantes económicos estándar dejan sin explicar parte de la variación atribuible a factores culturales y religiosos no observados, lo que constituye una limitación reconocida de la especificación propuesta.

Tuman, Ayoub y Roth-Johnson (2007) ofrecen el antecedente más directamente comparable: usando datos de la DHS para Colombia y Perú (equivalente metodológico de la ENDS) con las mismas variables del modelo, confirman que la educación reduce la fecundidad incluso controlando por riqueza, zona y anticoncepción. Sus efectos marginales indican que mujeres con educación secundaria tienen entre 0.3 y 0.8 hijos menos que mujeres sin educación, y con educación superior entre 0.8 y 1.5 menos. Batyra (2015/2016) analiza específicamente el timing de la fecundidad en Colombia y encuentra que las mujeres con educación superior tienen odds de primer hijo 79% menores frente a quienes no tienen educación. En cuanto a zona, documenta que las mujeres rurales enfrentan un 27% más de riesgo de segundo hijo. La UNFPA (2018) ubica la experiencia colombiana en contexto regional y señala que la expansión educativa femenina y la urbanización son los dos factores estructurales que mejor explican el descenso de la fecundidad en América Latina, validando la relevancia de Q106A y QZONA como regresores principales.

Tabla 2. Predicciones por coeficiente según la literatura

Coeficiente Variable Signo esperado Fundamento principal
\(\beta_1\) (Q106A) Nivel educativo Negativo (***) Kim (2016): –0.26/año. Tuman et al. (2007): –0.3 a –1.5 para Colombia.
\(\beta_2\) (Q104) Edad Positivo (***) Mayor tiempo acumulado de exposición al riesgo de embarazo.
\(\beta_3\) (QZONA) Zona (rural=0) Positivo si rural ENDS 2015: TGF rural=2.6 vs. urbano=1.8. Batyra (2015).
\(\beta_4\) (QUINTIL) Quintil de riqueza Negativo ENDS 2015: quintil más bajo=2.8 vs. más alto=1.3.
\(\beta_5\) (Q601) Tiene pareja Positivo (***) Penn Wharton (2022). Mayor exposición al riesgo de embarazo.
\(\beta_6\) (Q311) Usa anticonceptivos Negativo Vásquez-Neira et al. (2020). Mecanismo proximal del efecto educativo.

Datos y Construcción de Variables

Los datos provienen de la Encuesta Nacional de Demografía y Salud (ENDS 2015), realizada por Profamilia y el Ministerio de Salud y Protección Social de Colombia. La muestra cubre mujeres de 13 a 49 años. Tras filtrar observaciones con valores faltantes en las variables del modelo, se obtuvieron 21.000 observaciones válidas.

datos_modelo <- Datos_mujer2015 %>%
  filter(Q210 != "NULL", Q106A != "NULL", Q601 != "NULL",
         Q311 != "NULL", QZONA != "NULL") %>%
  mutate(hijos = as.numeric(as.character(Q210)),
         educ  = as.numeric(as.character(Q106A)),
         edad  = as.numeric(as.character(Q104)), ...)

Las variables categóricas se construyeron de la siguiente manera. La zona de residencia se recodificó como dummy urbana (QZONA=1→1, QZONA=2→0), con rural como categoría de referencia (n=4.828 rural, n=16.172 urbana). El uso de anticonceptivos se construyó como dummy donde 1 indica uso actual y 0 no uso, siendo no uso la referencia (n=7.144 no usa, n=13.856 usa). El estado conyugal se recodificó en una dummy de pareja: casada (ec_raw=1) y unión libre (ec_raw=2) toman valor 1, y no en unión (ec_raw=3) toma valor 0, siendo sin pareja la referencia (n=9.608 sin pareja, n=11.392 con pareja).

El nivel educativo se definió como factor de 12 niveles de 0 a 11, con Ninguno como categoría base; el quintil de riqueza como factor de 5 niveles, con Más bajo como referencia.

Tabla 3. Distribución por nivel educativo (n=21.000)

Nivel educativo N
Ninguno (referencia) 25
Preescolar 6
Primaria 3.604
Secundaria básica 3.668
Media académica 5.458
Media técnica 583
Técnico profesional 2.906
Tecnológica 1.213
Profesional 3.076
Especialización 362
Maestría 96
Doctorado 3

Fuente: ENDS 2015, procesamiento propio en R.

Regresor principal: Nivel educativo (Q106A)

La distribución muestral muestra que los niveles de mayor concentración son Secundaria básica (24.8%), Media académica (24.0%) y Primaria (16.6%). En el caso de Prescolar y Doctorado toman valores de 0% ya que la muestra solo va de mujeres entre 13 y 49 años excluyendo mujeres en primaria y tomando 0% para mujeres en doctorado.

Distribución por nivel educativo más alto alcanzado. ENDS 2015, n=21.000.

Distribución por nivel educativo más alto alcanzado. ENDS 2015, n=21.000.

La gráfica de promedio de hijos nacidos vivos por nivel educativo muestra una pendiente negativa que constituye la hipótesis central del modelo: las mujeres sin educación promedian 3.98 hijos, cifra que desciende de forma drástica hasta 1.07 en el nivel profesional y 0.87 en especialización. El nivel Doctorado registra 1.15, por encima de Maestría (1.20), lo que se explica por el tamaño extremadamente reducido de ese grupo (n=3) y no contradice la tendencia estructural.

Número promedio de hijos por nivel educativo. ENDS 2015.

Número promedio de hijos por nivel educativo. ENDS 2015.

Quintil de riqueza (QUINTIL) y la brecha educación-riqueza

La gráfica sobre la distribución del nivel educativo según el quintil de riqueza muestra una relación importante para el modelo: en el quintil más bajo, el 49.9% de las mujeres tiene solo educación primaria o ninguna educación, mientras que en el quintil más alto el 57.4% alcanza educación superior. Esto indica que el nivel educativo y el quintil de riqueza están relacionados, pero no representan exactamente lo mismo, ya que cada uno refleja una dimensión diferente del nivel socioeconómico. Por eso, tiene sentido incluir ambas variables al mismo tiempo en la especificación del modelo.

Distribución del nivel educativo por quintil de riqueza. ENDS 2015.

Distribución del nivel educativo por quintil de riqueza. ENDS 2015.

La gráfica de promedio de hijos por quintil muestra una relación negativa y decreciente: las mujeres del quintil más bajo promedian 2.07 hijos, cifra que desciende a 1.59 en el quintil Bajo, 1.40 en Medio, 1.19 en Alto y 1.12 en Más alto. La caída es más pronunciada entre los quintiles inferiores y se aplana hacia los superiores, lo que anticipa el resultado del modelo donde la diferencia entre los coeficientes de los quintiles Alto y Más alto es pequeña, sugiriendo que el efecto del ingreso sobre la fecundidad se satura a partir de cierto umbral.

Número promedio de hijos por quintil de riqueza. ENDS 2015.

Número promedio de hijos por quintil de riqueza. ENDS 2015.

Uso de anticonceptivos (Q311)

La gráfica de porcentaje que usa anticonceptivos por nivel educativo muestra una relación positiva y creciente: el uso pasa del 47% en mujeres sin educación al 76% en el nivel doctoral. Esta asociación, que a primera vista sugeriría que mayor uso de anticonceptivos se asocia con menor fecundidad, es precisamente la que genera el problema de endogeneidad por causalidad inversa documentado en el proceso de modelado: no son los anticonceptivos los que reducen los hijos observados en la muestra, sino que las mujeres que ya tienen hijos son quienes más adoptan métodos para no tener más. El coeficiente positivo de usa_anticonceptivo en el modelo 1 (+0.254, p<0.001) es la manifestación estadística de ese mecanismo, y motivó su exclusión en el modelo final.

Porcentaje que usa anticonceptivos por nivel educativo. ENDS 2015.

Porcentaje que usa anticonceptivos por nivel educativo. ENDS 2015.


Proceso del Modelo

Modelo inicial

El modelo inicial incluyó todas las variables descritas en la sección de justificación teórica:

modelo1 <- lm(hijos ~ educ_factor + edad + urbana + quintil_factor +
               tiene_pareja + usa_anticonceptivo, data = datos_modelo)

Al correr esta especificación aparecieron dos coeficientes con signos contrarios a los esperados por la literatura, lo que llevó a revisar la idoneidad de ambas variables.

El coeficiente de usa_anticonceptivo resultó positivo (+0.254, p<0.001), sugiriendo que quienes usan anticonceptivos tendrían más hijos. Esto refleja un problema de endogeneidad por causalidad inversa: no son los anticonceptivos los que generan más hijos, sino que las mujeres que ya tienen hijos son precisamente quienes más adoptan métodos para no tener más. La ENDS 2015 documenta que el número de hijos al momento de iniciar el uso del método es mayor en zona rural (52% lo inicia habiendo tenido ya al menos un hijo), lo que confirma que el uso anticonceptivo está condicionado por la fecundidad previa y no al revés. El coeficiente positivo no tiene interpretación causal válida en esta especificación.

El coeficiente de urbana también resultó positivo (+0.132, p<0.001), contradiciendo la evidencia descriptiva de la ENDS 2015 (TGF rural=2.6 vs. urbano=1.8). Esto se explica por un solapamiento entre zona y quintil: el 97.5% de la población rural se concentra en los dos quintiles de menor riqueza, mientras que en las zonas urbanas esos quintiles suman solo el 22.6% de la población. Una vez que el modelo controla por quintil, la variable urbana pierde su contenido informativo sobre pobreza —que ya está recogido por quintil_factor— y termina capturando otros factores asociados a la urbanización que van en sentido opuesto. Es decir, el efecto de ser rural ya está siendo explicado por los quintiles, por lo que la variable urbana pierde su independencia conceptual dentro del modelo. Esto no es multicolinealidad en sentido estadístico, como confirma el VIF calculado sobre el modelo 3.

Tabla 4. Distribución zona × quintil (n=21.000)

Zona Más bajo Bajo Medio Alto Más alto
Rural (0) 3.682 1.026 80 26 14
Urbana (1) 1.144 5.332 4.407 3.224 2.065

Propio en R.

Refinamiento: modelos 2 y 3

Con base en ese diagnóstico se construyeron dos especificaciones adicionales. El modelo 2 eliminó usa_anticonceptivo. El modelo 3 eliminó adicionalmente la variable urbana, quedando como especificación final:

modelo3 <- lm(hijos ~ educ_factor + edad + quintil_factor +
               tiene_pareja, data = datos_modelo)

Los coeficientes de educación son estables a través de las especificaciones, cambiando muy poco en magnitud al eliminar las dos variables problemáticas. Esto indica que la especificación es robusta: la relación entre educación y fecundidad no depende de que se incluya o excluya ninguno de los otros controles.


Resultados

Tabla comparativa de modelos

Tabla 5. Resultados de los tres modelos (variable dependiente: hijos nacidos vivos)

Variable Completo (1) Sin anti (2) Sin urbana ni anti (3)
educ Preescolar –0.410 (0.499) –0.372 (0.502) –0.366 (0.502)
educ Primaria –1.120*** (0.220) –1.052*** (0.222) –1.052*** (0.222)
educ Sec. básica –1.692*** (0.221) –1.632*** (0.222) –1.623*** (0.222)
educ Media académica –2.006*** (0.220) –1.939*** (0.222) –1.929*** (0.222)
educ Media técnica –2.072*** (0.225) –2.003*** (0.226) –1.994*** (0.226)
educ Técnico profesional –2.197*** (0.221) –2.133*** (0.222) –2.123*** (0.222)
educ Tecnológica –2.274*** (0.222) –2.202*** (0.224) –2.194*** (0.224)
educ Profesional –2.384*** (0.221) –2.319*** (0.222) –2.310*** (0.222)
educ Especialización –2.686*** (0.228) –2.620*** (0.229) –2.611*** (0.229)
educ Maestría –2.638*** (0.247) –2.562*** (0.249) –2.558*** (0.249)
educ Doctorado –3.685*** (0.671) –3.588*** (0.675) –3.578*** (0.675)
edad 0.076*** (0.001) 0.073*** (0.001) 0.073*** (0.001)
urbana 0.132*** (0.026) 0.122*** (0.026)
quintil Bajo –0.419*** (0.027) –0.418*** (0.027) –0.348*** (0.022)
quintil Medio –0.579*** (0.031) –0.569*** (0.031) –0.482*** (0.025)
quintil Alto –0.725*** (0.033) –0.710*** (0.033) –0.622*** (0.028)
quintil Más alto –0.739*** (0.037) –0.716*** (0.037) –0.627*** (0.032)
tiene_pareja 0.457*** (0.017) 0.530*** (0.016) 0.526*** (0.016)
usa_anticonceptivo 0.254*** (0.017)
Constante 1.052*** (0.222) 1.193*** (0.223) 1.221*** (0.223)
Observaciones 21.000 21.000 21.000
R² ajustado 0.480 0.475 0.474
E.E. residual 1.098 1.104 1.105

Nota: Errores estándar entre paréntesis. *** p<0.001. Categorías de referencia: Ninguno (educación), Más bajo (quintil), Sin pareja (conyugal), Rural (zona).

Modelo con edad al cuadrado

El test RESET rechazó la especificación lineal, lo que motivó incorporar un término cuadrático de edad para capturar posibles no linealidades en la relación entre exposición biológica acumulada y fecundidad:

datos_modelo <- datos_modelo %>% mutate(edad_sq = edad^2)

reg2 <- lm(hijos ~ educ_factor + edad + edad_sq + quintil_factor +
            tiene_pareja, data = datos_modelo)

La incorporación de edad² mejoró el R² ajustado de 0.4741 a 0.4794. Los demás coeficientes no cambiaron sustancialmente en dirección ni significancia. El término cuadrático resultó negativo y significativo, indicando que la relación entre edad y fecundidad tiene una pendiente decreciente hacia el final del período fértil.

Tabla 6. Modelo con edad al cuadrado — coeficientes con errores estándar robustos HC1

Variable Coef. E.E. Robusto t-valor Pr(>|t|)
(Intercepto) –0.020 0.512 –0.040 0.969
educ Preescolar –0.289 0.863 –0.335 0.738
educ Primaria –1.020 0.505 –2.019 0.043 *
educ Sec. básica –1.559 0.504 –3.090 0.002 **
educ Media académica –1.930 0.504 –3.828 <0.001 ***
educ Media técnica –1.982 0.505 –3.925 <0.001 ***
educ Técnico profesional –2.159 0.498 –4.336 <0.001 ***
educ Tecnológica –2.237 0.504 –4.438 <0.001 ***
educ Profesional –2.360 0.506 –4.665 <0.001 ***
educ Especialización –2.657 0.524 –5.071 <0.001 ***
educ Maestría –2.620 0.513 –5.105 <0.001 ***
educ Doctorado –3.568 0.662 –5.392 <0.001 ***
edad 0.161 0.007 23.967 < 2.2e-16 ***
edad² –0.001 0.0001 –12.189 < 2.2e-16 ***
quintil Bajo –0.333 0.026 –12.795 < 2.2e-16 ***
quintil Medio –0.463 0.027 –17.362 < 2.2e-16 ***
quintil Alto –0.595 0.028 –21.462 < 2.2e-16 ***
quintil Más alto –0.593 0.030 –19.936 < 2.2e-16 ***
tiene_pareja 0.471 0.016 29.057 < 2.2e-16 ***

Nota: Errores estándar robustos HC1. * p<0.05, ** p<0.01, *** p<0.001.


Diagnósticos del Modelo

Multicolinealidad (VIF)

El Factor de Inflación de Varianza calculado sobre el modelo 3 descarta problemas de multicolinealidad: todos los valores GVIF^(1/(2·Df)) se ubican por debajo de 1.1, muy lejos del umbral convencional de 10.

Variable GVIF Df GVIF^(1/(2·Df))
educ_factor 1.524 11 1.019
edad 1.177 1 1.085
quintil_factor 1.392 4 1.042
tiene_pareja 1.105 1 1.051

Fuente: car::vif(modelo3).

Especificación (test RESET de Ramsey)

El test RESET de Ramsey evalúa si la forma funcional del modelo es correcta. Con el modelo 3 se obtiene RESET = 114.77, df1 = 2, df2 = 20.980, p-valor < 2.2e-16, lo que indica problemas de especificación. La incorporación de edad² en reg2 atenúa parcialmente esta señal, aunque no la elimina por completo. Esta limitación es consistente con la naturaleza discreta de la variable dependiente y con la posible omisión de variables no disponibles en la ENDS 2015, como factores culturales o religiosos señalados por Iyer et al. (2025).

Normalidad (test de Jarque-Bera)

El test de Jarque-Bera rechaza la hipótesis de normalidad en los residuos. Con una muestra de 21.000 observaciones, el Teorema del Límite Central garantiza que los estimadores MCO se distribuyen aproximadamente normal y que la inferencia estadística basada en distribuciones asintóticas es válida, por lo que este resultado no invalida las conclusiones del modelo.

Heterocedasticidad y corrección con errores robustos

Tanto el test de Breusch-Pagan (bptest) como el de Goldfeld-Quandt (gqtest) arrojan p-valor < 2.2e-16, rechazando la homoscedasticidad. La solución aplicada fue estimar errores estándar robustos HC1 mediante plm::vcovHC y lmtest::coeftest. Los coeficientes no cambian, pero los errores estándar se corrigen, asegurando inferencia válida. Los resultados presentados en la Tabla 6 corresponden a esta corrección.

vcov <- plm::vcovHC(reg2, type = "HC1")
lmtest::coeftest(reg2, vcov. = vcov)

Interpretación de Resultados

Efecto de la educación

El efecto de la educación es el resultado más robusto del modelo. Tomando Ninguno como referencia, todos los niveles desde Primaria presentan coeficientes negativos y estadísticamente significativos, con magnitudes que crecen a medida que sube el nivel educativo. Mujeres con educación primaria tienen en promedio 1.05 hijos menos que mujeres sin educación; con secundaria básica, 1.62 menos; con educación profesional, 2.31 menos; con doctorado, 3.58 menos. El nivel Preescolar es el único no significativo, lo que se explica por el tamaño mínimo del grupo (n=6). Estos resultados son consistentes con las predicciones de Tuman et al. (2007) para Colombia (–0.3 a –1.5 según nivel) y con las estimaciones globales de Kim (2016).

Efecto de la edad

El coeficiente de edad es +0.073 en el modelo lineal y +0.161 en reg2, con el término cuadrático (–0.001) indicando que la relación se acelera en edades jóvenes y se desacelera hacia el final del período fértil. Este efecto refleja la acumulación biológica del tiempo de exposición al riesgo de embarazo y es el coeficiente con mayor significancia estadística del modelo (t≈24 en reg2).

Efecto del quintil de riqueza

Los coeficientes de quintil son todos negativos y crecen en magnitud frente al quintil más bajo. Las mujeres del quintil Bajo tienen en promedio 0.35 hijos menos; las del quintil Medio, 0.46 menos; las del quintil Alto, 0.60 menos; y las del quintil Más alto, 0.59 menos. La diferencia entre los dos quintiles superiores es pequeña, sugiriendo que el efecto del ingreso sobre la fecundidad se satura a partir del nivel Alto, en línea con lo documentado por Doepke et al. (2022) para economías en transición.

Efecto del estado conyugal

Tener pareja (casada o en unión libre) aumenta el número de hijos en 0.47 (modelo 1) a 0.53 (modelo 3), con la variación entre especificaciones explicada por la correlación parcial entre estado conyugal y uso de anticonceptivos. En la especificación final, el coeficiente de 0.53 es estadísticamente muy significativo (t≈29) y tiene la dirección esperada por la literatura. Es el segundo coeficiente más grande del modelo después del gradiente educativo.

Predicciones vs. valores observados por nivel educativo

Para ilustrar la capacidad predictiva del modelo, se construyó una gráfica que compara el promedio observado de hijos por nivel educativo contra los valores predichos manteniendo las demás variables en sus medias. El modelo captura correctamente la tendencia decreciente a lo largo de todos los niveles educativos. Las predicciones son más precisas en los niveles de educación media y superior, donde hay mayor masa de observaciones. Las desviaciones más visibles ocurren en los extremos (Ninguno con n=25 y Doctorado con n=3), donde el tamaño muestral no permite una estimación precisa del promedio observado.

Predicciones vs. valores observados por nivel educativo.

Predicciones vs. valores observados por nivel educativo.


Conclusiones

Este trabajo estimó los determinantes socioeconómicos de la fecundidad de 21.000 mujeres colombianas de 13 a 49 años usando datos de la ENDS 2015 y regresión MCO con errores estándar robustos HC1. La especificación final explica aproximadamente el 47.9% de la variación en hijos nacidos vivos (R² ajustado = 0.4794).

El resultado más robusto es el efecto negativo de la educación: el gradiente es monotónico, estadísticamente significativo desde primaria y llega a una reducción de 3.58 hijos en el nivel doctoral frente a ninguna educación. Este hallazgo es estable a través de las distintas especificaciones probadas y coincide con las predicciones del marco teórico de Becker y con la evidencia empírica de Kim (2016), Tuman et al. (2007) y Batyra (2015). El quintil de riqueza opera en la misma dirección pero con menor magnitud, y su efecto se satura en los quintiles superiores. Tener pareja aumenta la fecundidad en aproximadamente medio hijo, reflejo de la mayor exposición al riesgo de embarazo dentro de uniones estables.

El proceso de modelado identificó dos variables del modelo inicial que debieron excluirse: usa_anticonceptivo por endogeneidad por causalidad inversa (las mujeres con más hijos adoptan métodos para no tener más, no al revés) y urbana por solapamiento conceptual con quintil de riqueza, dado que la población rural está concentrada casi en su totalidad en los quintiles más bajos.

El modelo tiene limitaciones reconocidas. El test RESET señala problemas de especificación funcional no completamente corregidos con la inclusión de edad². La variable dependiente es un conteo y el MCO no está diseñado específicamente para esa distribución, aunque la literatura valida su uso en este contexto. La ENDS 2015 no captura variables religiosas, culturales ni de acceso geográfico a servicios de salud reproductiva que la literatura identifica como determinantes complementarios; su omisión introduce sesgo de variable omitida que no puede cuantificarse sin datos adicionales.

En términos de implicaciones, la evidencia apunta con consistencia a la educación como la variable con mayor potencial para modificar las trayectorias reproductivas. Los coeficientes más pronunciados corresponden a los niveles de educación secundaria y superior, que son justamente los niveles donde las brechas de acceso entre quintiles y entre zonas rurales y urbanas son más grandes. Políticas que reduzcan esas brechas incidirían simultáneamente en las disparidades de fecundidad más persistentes del país.


Referencias

Ángeles, L. y Stubner, M. (2022). Socio-Economic Determinants of Fertility. En: Global Fertility Transitions. Springer, Cap. 4.

Batyra, E. (2015/2016). Fertility and the Changing Pattern of the Timing of Childbearing in Colombia. Demographic Research, 35(46), 1373–1410.

Becker, G.S. (1960). An Economic Analysis of Fertility. En: Demographic and Economic Change in Developed Countries. Princeton University Press.

Becker, G.S. (1981). A Treatise on the Family. Harvard University Press.

Brand, J.E. y Davis, D. (2011). The Impact of College Education on Fertility: Evidence for Heterogeneous Effects. Demography, 48(3), 863–887.

Doepke, M. (2015). Gary Becker on the Quantity and Quality of Children. Journal of Demographic Economics, 81(1), 59–66.

Doepke, M., Hannusch, A., Kindermann, F. y Tertilt, M. (2022). The Economics of Fertility: A New Era. IZA Discussion Paper No. 15224.

Iyer, S. et al. (2025). Religion and Demography: Papal Influences on Fertility. Working Paper, Population Analytics, Notre Dame.

Kim, J. (2016). Female Education and Its Impact on Fertility. IZA World of Labor, 228.

National Academies of Sciences (2003). Critical Perspectives on Schooling and Fertility in the Developing World. National Academies Press, Cap. 2.

Penn Wharton Budget Model (2022). The Decline in Fertility: The Role of Marriage and Education. University of Pennsylvania.

Profamilia y Ministerio de Salud y Protección Social de Colombia (2015). Encuesta Nacional de Demografía y Salud – ENDS 2015. Bogotá: Profamilia.

Tuman, J.P., Ayoub, N. y Roth-Johnson, D. (2007). The Effects of Education on Fertility in Colombia and Peru. Global Health Governance, I(2).

UNFPA (2018). Challenges Posed by Low Fertility in Latin America and the Caribbean. Fondo de Población de las Naciones Unidas.

Vásquez-Neira, P. et al. (2020). Human Fertility in Relation to Education, Economy, Religion, Contraception, and Family Planning Programs. BMC Public Health, 20(1), 327.

Winkelmann, R. y Boes, S. (2009). Analysis of Microdata (2.ª ed.). Springer.

Wooldridge, J.M. (2019). Introductory Econometrics: A Modern Approach (7.ª ed.). Cengage Learning.