title: “Determinantes Socioeconómicos de la Fecundidad Femenina en Colombia” output: html_document: toc: true toc_depth: 3 toc_float: true number_sections: true theme: flatly highlight: tango pdf_document: toc: true toc_depth: 3 number_sections: true latex_engine: xelatex date: “2026-05-14” lang: es —
En Colombia, la Tasa Global de Fecundidad (TGF) pasó de 7.0 hijos por mujer en 1964 a 2.0 en 2015, según la Encuesta Nacional de Demografía y Salud (ENDS 2015, p. 37). Detrás de ese promedio se esconden brechas persistentes: mujeres sin educación promedian 3.9 hijos frente a 1.6 de quienes alcanzaron educación superior; en el quintil de riqueza más bajo el promedio es 2.8 frente a 1.3 en el más alto; y las mujeres rurales tienen 2.6 hijos frente a 1.8 en zonas urbanas. Comprender qué factores explican esas diferencias es relevante no solo desde el punto de vista demográfico, sino para el diseño de política pública en salud reproductiva, educación y reducción de la pobreza.
El objetivo de este trabajo es estimar los determinantes
socioeconómicos del número de hijos nacidos vivos de mujeres de 13 a 49
años en Colombia usando datos de la ENDS 2015. La variable dependiente
es Q210, que registra el total de hijos nacidos vivos con
valores válidos de 0 a 8 o más.
Los ceros se conservan como respuestas válidas. El promedio muestral
es 1.47 (ENDS 2015, p. 38). Los regresores son: nivel educativo
(Q106A), edad de la mujer (Q104), zona de
residencia (QZONA), quintil de riqueza
(QUINTIL), estado conyugal (Q601) y uso actual
de anticonceptivos (Q311).
Esa especificación constituye el modelo inicial propuesto, que se evaluó y ajustó en función de los resultados obtenidos, como se describe a continuación.
Distribución de hijos nacidos vivos. ENDS 2015.
Comparación de la muestra: zona urbana y rural. ENDS 2015.
Tabla 1. Variables del modelo
| Código | Variable | Tipo | Descripción |
|---|---|---|---|
| Q210 | Hijos nacidos vivos | Dependiente | Total de hijos vivos reportados. Promedio: 1.47. |
| Q106A | Nivel educativo | Factor (0–11) | De Ninguno (0) a Doctorado (11). Categoría base: Ninguno. |
| Q104 | Edad | Continua (13–49) | Controla el tiempo acumulado de exposición al riesgo. |
| QZONA | Zona | Dummy (1=Urbano) | Captura diferencias en acceso a servicios y mercado laboral. |
| QUINTIL | Quintil de riqueza | Factor (1–5) | Proxy de ingreso. Categoría base: Más bajo. |
| Q601 | Estado conyugal | Dummy (1=Con pareja) | Unida o casada=1; sin pareja estable=0. Mide exposición al riesgo. |
| Q311 | Uso de anticonceptivos | Dummy (1=Sí) | Mecanismo de control de la fecundidad. |
Fuente: ENDS 2015, Profamilia.
El fundamento del modelo es la Nueva Economía del Hogar de Gary Becker. En su artículo de 1960 y en A Treatise on the Family (1981), Becker plantea que la decisión de tener hijos resulta de una optimización en la que el hogar maximiza utilidad sobre consumo, número y calidad de los hijos, sujeto a restricciones de tiempo e ingreso. El mecanismo central del tradeoff cantidad-calidad es que un mayor nivel educativo de la madre eleva su salario potencial, encarece el costo de oportunidad de criar y reduce la demanda óptima de hijos. Esto fundamenta la predicción de un coeficiente negativo en educación (\(\beta_1 < 0\)). Doepke et al. (2022, IZA DP No. 15224) actualizan este marco para el siglo XXI, mostrando que el costo de oportunidad del tiempo materno sigue siendo el mecanismo explicativo central en contextos de transición demográfica.
La economía de la fecundidad tiene sus raíces en Becker (1960, 1981), quien formalizó la decisión reproductiva como un problema de optimización del hogar. Doepke (2015) sintetiza cómo este marco predice una relación negativa entre educación femenina y número de hijos a través del costo de oportunidad del tiempo: a mayor capital humano, mayor salario potencial, mayor precio implícito de criar. Doepke et al. (2022) documentan que este mecanismo sigue siendo el más robusto para explicar la variación en fecundidad entre países y cohortes, aunque señalan que la relación ingreso-fecundidad se ha debilitado en economías avanzadas, lo que motiva controlar por quintil de riqueza de forma separada a la educación.
La evidencia sobre el efecto negativo de la educación femenina sobre
la fecundidad es consistente en distintos contextos. Kim (2016), en su
revisión para IZA World of Labor, identifica tres vías causales: el
aumento del costo de oportunidad de la crianza, la reducción de la
mortalidad infantil que disminuye la demanda precautoria de hijos, y el
mayor acceso al conocimiento anticonceptivo. Su estimación cuantitativa
indica que cada año adicional de educación se asocia con –0.26 hijos en
promedio, cifra que sirve como referencia para calibrar la magnitud de
los coeficientes del presente modelo. Ángeles y Stubner (2022), usando
regresión MCO con efectos fijos de país sobre un panel 1960–2015,
estiman un coeficiente de 0.42 hijos por año de educación, y documentan
que este resultado es robusto a distintas especificaciones. National
Academies of Sciences (2003) sistematiza cómo la educación opera a
través de los determinantes próximos de la fecundidad (nupcialidad, uso
de anticonceptivos e iniciación sexual) lo que justifica la inclusión
simultánea de Q601 y Q311 en el modelo como
variables de control, no como variables de tratamiento.
Brand y Davis (2011) introducen un matiz importante: el efecto de la educación universitaria es heterogéneo según la propensión previa al acceso educativo. Las mujeres con menor probabilidad de acceso que logran alcanzar la universidad exhiben los efectos negativos más pronunciados sobre fecundidad. Esto implica que, sin controlar por quintil de riqueza (que determina en parte esa propensión), el coeficiente de educación estaría sesgado hacia arriba.
Vásquez-Neira et al. (2020), en un análisis de 141 países, clasifican
los determinantes de la fecundidad por magnitud de efecto y encuentran
que la educación es el factor más influyente, seguido por la prevalencia
anticonceptiva, el ingreso y la religión. Para América Latina
específicamente, la pendiente negativa de la relación
educación-fecundidad es más pronunciada que en otras regiones, validando
el signo esperado \(\beta_1 < 0\)
para Colombia. Penn Wharton Budget Model (2022) cuantifica el efecto del
estado conyugal: las mujeres casadas tienen al menos tres puntos
porcentuales más de probabilidad de tener un hijo en un período dado,
apoyando la inclusión de Q601 como determinante
independiente y no sustituto de la educación. Iyer et al. (2025)
advierten que los determinantes económicos estándar dejan sin explicar
parte de la variación atribuible a factores culturales y religiosos no
observados, lo que constituye una limitación reconocida de la
especificación propuesta.
Tuman, Ayoub y Roth-Johnson (2007) ofrecen el antecedente más
directamente comparable: usando datos de la DHS para Colombia y Perú
(equivalente metodológico de la ENDS) con las mismas variables del
modelo, confirman que la educación reduce la fecundidad incluso
controlando por riqueza, zona y anticoncepción. Sus efectos marginales
indican que mujeres con educación secundaria tienen entre 0.3 y 0.8
hijos menos que mujeres sin educación, y con educación superior entre
0.8 y 1.5 menos. Batyra (2015/2016) analiza específicamente el
timing de la fecundidad en Colombia y encuentra que las mujeres
con educación superior tienen odds de primer hijo 79% menores
frente a quienes no tienen educación. En cuanto a zona, documenta que
las mujeres rurales enfrentan un 27% más de riesgo de segundo hijo. La
UNFPA (2018) ubica la experiencia colombiana en contexto regional y
señala que la expansión educativa femenina y la urbanización son los dos
factores estructurales que mejor explican el descenso de la fecundidad
en América Latina, validando la relevancia de Q106A y
QZONA como regresores principales.
Tabla 2. Predicciones por coeficiente según la literatura
| Coeficiente | Variable | Signo esperado | Fundamento principal |
|---|---|---|---|
| \(\beta_1\) (Q106A) | Nivel educativo | Negativo (***) | Kim (2016): –0.26/año. Tuman et al. (2007): –0.3 a –1.5 para Colombia. |
| \(\beta_2\) (Q104) | Edad | Positivo (***) | Mayor tiempo acumulado de exposición al riesgo de embarazo. |
| \(\beta_3\) (QZONA) | Zona (rural=0) | Positivo si rural | ENDS 2015: TGF rural=2.6 vs. urbano=1.8. Batyra (2015). |
| \(\beta_4\) (QUINTIL) | Quintil de riqueza | Negativo | ENDS 2015: quintil más bajo=2.8 vs. más alto=1.3. |
| \(\beta_5\) (Q601) | Tiene pareja | Positivo (***) | Penn Wharton (2022). Mayor exposición al riesgo de embarazo. |
| \(\beta_6\) (Q311) | Usa anticonceptivos | Negativo | Vásquez-Neira et al. (2020). Mecanismo proximal del efecto educativo. |
Los datos provienen de la Encuesta Nacional de Demografía y Salud (ENDS 2015), realizada por Profamilia y el Ministerio de Salud y Protección Social de Colombia. La muestra cubre mujeres de 13 a 49 años. Tras filtrar observaciones con valores faltantes en las variables del modelo, se obtuvieron 21.000 observaciones válidas.
datos_modelo <- Datos_mujer2015 %>%
filter(Q210 != "NULL", Q106A != "NULL", Q601 != "NULL",
Q311 != "NULL", QZONA != "NULL") %>%
mutate(hijos = as.numeric(as.character(Q210)),
educ = as.numeric(as.character(Q106A)),
edad = as.numeric(as.character(Q104)), ...)
Las variables categóricas se construyeron de la siguiente manera. La
zona de residencia se recodificó como dummy urbana
(QZONA=1→1, QZONA=2→0), con rural como
categoría de referencia (n=4.828 rural, n=16.172 urbana). El uso de
anticonceptivos se construyó como dummy donde 1 indica uso
actual y 0 no uso, siendo no uso la referencia (n=7.144 no usa, n=13.856
usa). El estado conyugal se recodificó en una dummy de pareja:
casada (ec_raw=1) y unión libre (ec_raw=2)
toman valor 1, y no en unión (ec_raw=3) toma valor 0,
siendo sin pareja la referencia (n=9.608 sin pareja, n=11.392 con
pareja).
El nivel educativo se definió como factor de 12 niveles de 0 a 11, con Ninguno como categoría base; el quintil de riqueza como factor de 5 niveles, con Más bajo como referencia.
Tabla 3. Distribución por nivel educativo (n=21.000)
| Nivel educativo | N |
|---|---|
| Ninguno (referencia) | 25 |
| Preescolar | 6 |
| Primaria | 3.604 |
| Secundaria básica | 3.668 |
| Media académica | 5.458 |
| Media técnica | 583 |
| Técnico profesional | 2.906 |
| Tecnológica | 1.213 |
| Profesional | 3.076 |
| Especialización | 362 |
| Maestría | 96 |
| Doctorado | 3 |
Fuente: ENDS 2015, procesamiento propio en R.
La distribución muestral muestra que los niveles de mayor concentración son Secundaria básica (24.8%), Media académica (24.0%) y Primaria (16.6%). En el caso de Prescolar y Doctorado toman valores de 0% ya que la muestra solo va de mujeres entre 13 y 49 años excluyendo mujeres en primaria y tomando 0% para mujeres en doctorado.
Distribución por nivel educativo más alto alcanzado. ENDS 2015, n=21.000.
La gráfica de promedio de hijos nacidos vivos por nivel educativo muestra una pendiente negativa que constituye la hipótesis central del modelo: las mujeres sin educación promedian 3.98 hijos, cifra que desciende de forma drástica hasta 1.07 en el nivel profesional y 0.87 en especialización. El nivel Doctorado registra 1.15, por encima de Maestría (1.20), lo que se explica por el tamaño extremadamente reducido de ese grupo (n=3) y no contradice la tendencia estructural.
Número promedio de hijos por nivel educativo. ENDS 2015.
La gráfica sobre la distribución del nivel educativo según el quintil de riqueza muestra una relación importante para el modelo: en el quintil más bajo, el 49.9% de las mujeres tiene solo educación primaria o ninguna educación, mientras que en el quintil más alto el 57.4% alcanza educación superior. Esto indica que el nivel educativo y el quintil de riqueza están relacionados, pero no representan exactamente lo mismo, ya que cada uno refleja una dimensión diferente del nivel socioeconómico. Por eso, tiene sentido incluir ambas variables al mismo tiempo en la especificación del modelo.
Distribución del nivel educativo por quintil de riqueza. ENDS 2015.
La gráfica de promedio de hijos por quintil muestra una relación negativa y decreciente: las mujeres del quintil más bajo promedian 2.07 hijos, cifra que desciende a 1.59 en el quintil Bajo, 1.40 en Medio, 1.19 en Alto y 1.12 en Más alto. La caída es más pronunciada entre los quintiles inferiores y se aplana hacia los superiores, lo que anticipa el resultado del modelo donde la diferencia entre los coeficientes de los quintiles Alto y Más alto es pequeña, sugiriendo que el efecto del ingreso sobre la fecundidad se satura a partir de cierto umbral.
Número promedio de hijos por quintil de riqueza. ENDS 2015.
La gráfica de porcentaje que usa anticonceptivos por nivel educativo
muestra una relación positiva y creciente: el uso pasa del 47% en
mujeres sin educación al 76% en el nivel doctoral. Esta asociación, que
a primera vista sugeriría que mayor uso de anticonceptivos se asocia con
menor fecundidad, es precisamente la que genera el problema de
endogeneidad por causalidad inversa documentado en el proceso de
modelado: no son los anticonceptivos los que reducen los hijos
observados en la muestra, sino que las mujeres que ya tienen hijos son
quienes más adoptan métodos para no tener más. El coeficiente positivo
de usa_anticonceptivo en el modelo 1 (+0.254, p<0.001)
es la manifestación estadística de ese mecanismo, y motivó su exclusión
en el modelo final.
Porcentaje que usa anticonceptivos por nivel educativo. ENDS 2015.
El modelo inicial incluyó todas las variables descritas en la sección de justificación teórica:
modelo1 <- lm(hijos ~ educ_factor + edad + urbana + quintil_factor +
tiene_pareja + usa_anticonceptivo, data = datos_modelo)
Al correr esta especificación aparecieron dos coeficientes con signos contrarios a los esperados por la literatura, lo que llevó a revisar la idoneidad de ambas variables.
El coeficiente de usa_anticonceptivo resultó positivo
(+0.254, p<0.001), sugiriendo que quienes usan anticonceptivos
tendrían más hijos. Esto refleja un problema de endogeneidad por
causalidad inversa: no son los anticonceptivos los que generan
más hijos, sino que las mujeres que ya tienen hijos son precisamente
quienes más adoptan métodos para no tener más. La ENDS 2015 documenta
que el número de hijos al momento de iniciar el uso del método es mayor
en zona rural (52% lo inicia habiendo tenido ya al menos un hijo), lo
que confirma que el uso anticonceptivo está condicionado por la
fecundidad previa y no al revés. El coeficiente positivo no tiene
interpretación causal válida en esta especificación.
El coeficiente de urbana también resultó positivo
(+0.132, p<0.001), contradiciendo la evidencia descriptiva de la ENDS
2015 (TGF rural=2.6 vs. urbano=1.8). Esto se explica por un solapamiento
entre zona y quintil: el 97.5% de la población rural se concentra en los
dos quintiles de menor riqueza, mientras que en las zonas urbanas esos
quintiles suman solo el 22.6% de la población. Una vez que el modelo
controla por quintil, la variable urbana pierde su
contenido informativo sobre pobreza —que ya está recogido por
quintil_factor— y termina capturando otros factores
asociados a la urbanización que van en sentido opuesto. Es decir, el
efecto de ser rural ya está siendo explicado por los quintiles, por lo
que la variable urbana pierde su independencia conceptual
dentro del modelo. Esto no es multicolinealidad en sentido estadístico,
como confirma el VIF calculado sobre el modelo 3.
Tabla 4. Distribución zona × quintil (n=21.000)
| Zona | Más bajo | Bajo | Medio | Alto | Más alto |
|---|---|---|---|---|---|
| Rural (0) | 3.682 | 1.026 | 80 | 26 | 14 |
| Urbana (1) | 1.144 | 5.332 | 4.407 | 3.224 | 2.065 |
Propio en R.
Con base en ese diagnóstico se construyeron dos especificaciones
adicionales. El modelo 2 eliminó usa_anticonceptivo. El
modelo 3 eliminó adicionalmente la variable urbana,
quedando como especificación final:
modelo3 <- lm(hijos ~ educ_factor + edad + quintil_factor +
tiene_pareja, data = datos_modelo)
Los coeficientes de educación son estables a través de las especificaciones, cambiando muy poco en magnitud al eliminar las dos variables problemáticas. Esto indica que la especificación es robusta: la relación entre educación y fecundidad no depende de que se incluya o excluya ninguno de los otros controles.
Tabla 5. Resultados de los tres modelos (variable dependiente: hijos nacidos vivos)
| Variable | Completo (1) | Sin anti (2) | Sin urbana ni anti (3) |
|---|---|---|---|
| educ Preescolar | –0.410 (0.499) | –0.372 (0.502) | –0.366 (0.502) |
| educ Primaria | –1.120*** (0.220) | –1.052*** (0.222) | –1.052*** (0.222) |
| educ Sec. básica | –1.692*** (0.221) | –1.632*** (0.222) | –1.623*** (0.222) |
| educ Media académica | –2.006*** (0.220) | –1.939*** (0.222) | –1.929*** (0.222) |
| educ Media técnica | –2.072*** (0.225) | –2.003*** (0.226) | –1.994*** (0.226) |
| educ Técnico profesional | –2.197*** (0.221) | –2.133*** (0.222) | –2.123*** (0.222) |
| educ Tecnológica | –2.274*** (0.222) | –2.202*** (0.224) | –2.194*** (0.224) |
| educ Profesional | –2.384*** (0.221) | –2.319*** (0.222) | –2.310*** (0.222) |
| educ Especialización | –2.686*** (0.228) | –2.620*** (0.229) | –2.611*** (0.229) |
| educ Maestría | –2.638*** (0.247) | –2.562*** (0.249) | –2.558*** (0.249) |
| educ Doctorado | –3.685*** (0.671) | –3.588*** (0.675) | –3.578*** (0.675) |
| edad | 0.076*** (0.001) | 0.073*** (0.001) | 0.073*** (0.001) |
| urbana | 0.132*** (0.026) | 0.122*** (0.026) | — |
| quintil Bajo | –0.419*** (0.027) | –0.418*** (0.027) | –0.348*** (0.022) |
| quintil Medio | –0.579*** (0.031) | –0.569*** (0.031) | –0.482*** (0.025) |
| quintil Alto | –0.725*** (0.033) | –0.710*** (0.033) | –0.622*** (0.028) |
| quintil Más alto | –0.739*** (0.037) | –0.716*** (0.037) | –0.627*** (0.032) |
| tiene_pareja | 0.457*** (0.017) | 0.530*** (0.016) | 0.526*** (0.016) |
| usa_anticonceptivo | 0.254*** (0.017) | — | — |
| Constante | 1.052*** (0.222) | 1.193*** (0.223) | 1.221*** (0.223) |
| Observaciones | 21.000 | 21.000 | 21.000 |
| R² ajustado | 0.480 | 0.475 | 0.474 |
| E.E. residual | 1.098 | 1.104 | 1.105 |
Nota: Errores estándar entre paréntesis. *** p<0.001. Categorías de referencia: Ninguno (educación), Más bajo (quintil), Sin pareja (conyugal), Rural (zona).
El test RESET rechazó la especificación lineal, lo que motivó incorporar un término cuadrático de edad para capturar posibles no linealidades en la relación entre exposición biológica acumulada y fecundidad:
datos_modelo <- datos_modelo %>% mutate(edad_sq = edad^2)
reg2 <- lm(hijos ~ educ_factor + edad + edad_sq + quintil_factor +
tiene_pareja, data = datos_modelo)
La incorporación de edad² mejoró el R² ajustado de
0.4741 a 0.4794. Los demás coeficientes no cambiaron sustancialmente en
dirección ni significancia. El término cuadrático resultó negativo y
significativo, indicando que la relación entre edad y fecundidad tiene
una pendiente decreciente hacia el final del período fértil.
Tabla 6. Modelo con edad al cuadrado — coeficientes con errores estándar robustos HC1
| Variable | Coef. | E.E. Robusto | t-valor | Pr(>|t|) |
|---|---|---|---|---|
| (Intercepto) | –0.020 | 0.512 | –0.040 | 0.969 |
| educ Preescolar | –0.289 | 0.863 | –0.335 | 0.738 |
| educ Primaria | –1.020 | 0.505 | –2.019 | 0.043 * |
| educ Sec. básica | –1.559 | 0.504 | –3.090 | 0.002 ** |
| educ Media académica | –1.930 | 0.504 | –3.828 | <0.001 *** |
| educ Media técnica | –1.982 | 0.505 | –3.925 | <0.001 *** |
| educ Técnico profesional | –2.159 | 0.498 | –4.336 | <0.001 *** |
| educ Tecnológica | –2.237 | 0.504 | –4.438 | <0.001 *** |
| educ Profesional | –2.360 | 0.506 | –4.665 | <0.001 *** |
| educ Especialización | –2.657 | 0.524 | –5.071 | <0.001 *** |
| educ Maestría | –2.620 | 0.513 | –5.105 | <0.001 *** |
| educ Doctorado | –3.568 | 0.662 | –5.392 | <0.001 *** |
| edad | 0.161 | 0.007 | 23.967 | < 2.2e-16 *** |
| edad² | –0.001 | 0.0001 | –12.189 | < 2.2e-16 *** |
| quintil Bajo | –0.333 | 0.026 | –12.795 | < 2.2e-16 *** |
| quintil Medio | –0.463 | 0.027 | –17.362 | < 2.2e-16 *** |
| quintil Alto | –0.595 | 0.028 | –21.462 | < 2.2e-16 *** |
| quintil Más alto | –0.593 | 0.030 | –19.936 | < 2.2e-16 *** |
| tiene_pareja | 0.471 | 0.016 | 29.057 | < 2.2e-16 *** |
Nota: Errores estándar robustos HC1. * p<0.05, ** p<0.01, *** p<0.001.
El Factor de Inflación de Varianza calculado sobre el modelo 3 descarta problemas de multicolinealidad: todos los valores GVIF^(1/(2·Df)) se ubican por debajo de 1.1, muy lejos del umbral convencional de 10.
| Variable | GVIF | Df | GVIF^(1/(2·Df)) |
|---|---|---|---|
| educ_factor | 1.524 | 11 | 1.019 |
| edad | 1.177 | 1 | 1.085 |
| quintil_factor | 1.392 | 4 | 1.042 |
| tiene_pareja | 1.105 | 1 | 1.051 |
Fuente: car::vif(modelo3).
El test RESET de Ramsey evalúa si la forma funcional del modelo es
correcta. Con el modelo 3 se obtiene RESET = 114.77, df1 = 2, df2 =
20.980, p-valor < 2.2e-16, lo que indica problemas de especificación.
La incorporación de edad² en reg2 atenúa
parcialmente esta señal, aunque no la elimina por completo. Esta
limitación es consistente con la naturaleza discreta de la variable
dependiente y con la posible omisión de variables no disponibles en la
ENDS 2015, como factores culturales o religiosos señalados por Iyer et
al. (2025).
El test de Jarque-Bera rechaza la hipótesis de normalidad en los residuos. Con una muestra de 21.000 observaciones, el Teorema del Límite Central garantiza que los estimadores MCO se distribuyen aproximadamente normal y que la inferencia estadística basada en distribuciones asintóticas es válida, por lo que este resultado no invalida las conclusiones del modelo.
Tanto el test de Breusch-Pagan (bptest) como el de
Goldfeld-Quandt (gqtest) arrojan p-valor < 2.2e-16,
rechazando la homoscedasticidad. La solución aplicada fue estimar
errores estándar robustos HC1 mediante plm::vcovHC y
lmtest::coeftest. Los coeficientes no cambian, pero los
errores estándar se corrigen, asegurando inferencia válida. Los
resultados presentados en la Tabla 6 corresponden a esta corrección.
vcov <- plm::vcovHC(reg2, type = "HC1")
lmtest::coeftest(reg2, vcov. = vcov)
El efecto de la educación es el resultado más robusto del modelo. Tomando Ninguno como referencia, todos los niveles desde Primaria presentan coeficientes negativos y estadísticamente significativos, con magnitudes que crecen a medida que sube el nivel educativo. Mujeres con educación primaria tienen en promedio 1.05 hijos menos que mujeres sin educación; con secundaria básica, 1.62 menos; con educación profesional, 2.31 menos; con doctorado, 3.58 menos. El nivel Preescolar es el único no significativo, lo que se explica por el tamaño mínimo del grupo (n=6). Estos resultados son consistentes con las predicciones de Tuman et al. (2007) para Colombia (–0.3 a –1.5 según nivel) y con las estimaciones globales de Kim (2016).
El coeficiente de edad es +0.073 en el modelo lineal y +0.161 en
reg2, con el término cuadrático (–0.001) indicando que la
relación se acelera en edades jóvenes y se desacelera hacia el final del
período fértil. Este efecto refleja la acumulación biológica del tiempo
de exposición al riesgo de embarazo y es el coeficiente con mayor
significancia estadística del modelo (t≈24 en reg2).
Los coeficientes de quintil son todos negativos y crecen en magnitud frente al quintil más bajo. Las mujeres del quintil Bajo tienen en promedio 0.35 hijos menos; las del quintil Medio, 0.46 menos; las del quintil Alto, 0.60 menos; y las del quintil Más alto, 0.59 menos. La diferencia entre los dos quintiles superiores es pequeña, sugiriendo que el efecto del ingreso sobre la fecundidad se satura a partir del nivel Alto, en línea con lo documentado por Doepke et al. (2022) para economías en transición.
Tener pareja (casada o en unión libre) aumenta el número de hijos en 0.47 (modelo 1) a 0.53 (modelo 3), con la variación entre especificaciones explicada por la correlación parcial entre estado conyugal y uso de anticonceptivos. En la especificación final, el coeficiente de 0.53 es estadísticamente muy significativo (t≈29) y tiene la dirección esperada por la literatura. Es el segundo coeficiente más grande del modelo después del gradiente educativo.
Para ilustrar la capacidad predictiva del modelo, se construyó una gráfica que compara el promedio observado de hijos por nivel educativo contra los valores predichos manteniendo las demás variables en sus medias. El modelo captura correctamente la tendencia decreciente a lo largo de todos los niveles educativos. Las predicciones son más precisas en los niveles de educación media y superior, donde hay mayor masa de observaciones. Las desviaciones más visibles ocurren en los extremos (Ninguno con n=25 y Doctorado con n=3), donde el tamaño muestral no permite una estimación precisa del promedio observado.
Predicciones vs. valores observados por nivel educativo.
Este trabajo estimó los determinantes socioeconómicos de la fecundidad de 21.000 mujeres colombianas de 13 a 49 años usando datos de la ENDS 2015 y regresión MCO con errores estándar robustos HC1. La especificación final explica aproximadamente el 47.9% de la variación en hijos nacidos vivos (R² ajustado = 0.4794).
El resultado más robusto es el efecto negativo de la educación: el gradiente es monotónico, estadísticamente significativo desde primaria y llega a una reducción de 3.58 hijos en el nivel doctoral frente a ninguna educación. Este hallazgo es estable a través de las distintas especificaciones probadas y coincide con las predicciones del marco teórico de Becker y con la evidencia empírica de Kim (2016), Tuman et al. (2007) y Batyra (2015). El quintil de riqueza opera en la misma dirección pero con menor magnitud, y su efecto se satura en los quintiles superiores. Tener pareja aumenta la fecundidad en aproximadamente medio hijo, reflejo de la mayor exposición al riesgo de embarazo dentro de uniones estables.
El proceso de modelado identificó dos variables del modelo inicial
que debieron excluirse: usa_anticonceptivo por endogeneidad
por causalidad inversa (las mujeres con más hijos adoptan métodos para
no tener más, no al revés) y urbana por solapamiento
conceptual con quintil de riqueza, dado que la población rural está
concentrada casi en su totalidad en los quintiles más bajos.
El modelo tiene limitaciones reconocidas. El test RESET señala
problemas de especificación funcional no completamente corregidos con la
inclusión de edad². La variable dependiente es un conteo y
el MCO no está diseñado específicamente para esa distribución, aunque la
literatura valida su uso en este contexto. La ENDS 2015 no captura
variables religiosas, culturales ni de acceso geográfico a servicios de
salud reproductiva que la literatura identifica como determinantes
complementarios; su omisión introduce sesgo de variable omitida que no
puede cuantificarse sin datos adicionales.
En términos de implicaciones, la evidencia apunta con consistencia a la educación como la variable con mayor potencial para modificar las trayectorias reproductivas. Los coeficientes más pronunciados corresponden a los niveles de educación secundaria y superior, que son justamente los niveles donde las brechas de acceso entre quintiles y entre zonas rurales y urbanas son más grandes. Políticas que reduzcan esas brechas incidirían simultáneamente en las disparidades de fecundidad más persistentes del país.
Ángeles, L. y Stubner, M. (2022). Socio-Economic Determinants of Fertility. En: Global Fertility Transitions. Springer, Cap. 4.
Batyra, E. (2015/2016). Fertility and the Changing Pattern of the Timing of Childbearing in Colombia. Demographic Research, 35(46), 1373–1410.
Becker, G.S. (1960). An Economic Analysis of Fertility. En: Demographic and Economic Change in Developed Countries. Princeton University Press.
Becker, G.S. (1981). A Treatise on the Family. Harvard University Press.
Brand, J.E. y Davis, D. (2011). The Impact of College Education on Fertility: Evidence for Heterogeneous Effects. Demography, 48(3), 863–887.
Doepke, M. (2015). Gary Becker on the Quantity and Quality of Children. Journal of Demographic Economics, 81(1), 59–66.
Doepke, M., Hannusch, A., Kindermann, F. y Tertilt, M. (2022). The Economics of Fertility: A New Era. IZA Discussion Paper No. 15224.
Iyer, S. et al. (2025). Religion and Demography: Papal Influences on Fertility. Working Paper, Population Analytics, Notre Dame.
Kim, J. (2016). Female Education and Its Impact on Fertility. IZA World of Labor, 228.
National Academies of Sciences (2003). Critical Perspectives on Schooling and Fertility in the Developing World. National Academies Press, Cap. 2.
Penn Wharton Budget Model (2022). The Decline in Fertility: The Role of Marriage and Education. University of Pennsylvania.
Profamilia y Ministerio de Salud y Protección Social de Colombia (2015). Encuesta Nacional de Demografía y Salud – ENDS 2015. Bogotá: Profamilia.
Tuman, J.P., Ayoub, N. y Roth-Johnson, D. (2007). The Effects of Education on Fertility in Colombia and Peru. Global Health Governance, I(2).
UNFPA (2018). Challenges Posed by Low Fertility in Latin America and the Caribbean. Fondo de Población de las Naciones Unidas.
Vásquez-Neira, P. et al. (2020). Human Fertility in Relation to Education, Economy, Religion, Contraception, and Family Planning Programs. BMC Public Health, 20(1), 327.
Winkelmann, R. y Boes, S. (2009). Analysis of Microdata (2.ª ed.). Springer.
Wooldridge, J.M. (2019). Introductory Econometrics: A Modern Approach (7.ª ed.). Cengage Learning.