Resumen

Este artículo analiza los determinantes socioeconómicos de la tasa global de fecundidad (TGF) en los departamentos de Colombia utilizando un modelo de regresión lineal múltiple con datos de corte transversal. A partir de información oficial del DANE, se evalúa el papel de la educación femenina, la pobreza, la ruralidad y el nivel de ingreso departamental sobre las diferencias territoriales en la fecundidad. Los resultados muestran que la educación femenina y las condiciones de pobreza(NBI) son factores clave para explicar la heterogeneidad observada, en línea con la teoría económica de la fecundidad. El modelo presenta un alto poder explicativo y, tras realizar diagnósticos econométricos, se aplican correcciones que mejoran la robustez y la interpretabilidad de los coeficientes. Los hallazgos contribuyen a la comprensión de la transición demográfica colombiana y ofrecen insumos relevantes para el diseño de políticas públicas diferenciadas por territorio.

Palabras clave: fecundidad, educación femenina, pobreza, econometría, Colombia.

Abstract

This paper analyzes the socioeconomic determinants of the total fertility rate (TFR) across Colombian departments using a multiple linear regression model with cross-sectional data. Based on official data from DANE, the study evaluates the role of female education, poverty, rurality, and income levels in explaining territorial differences in fertility. The results indicate that female education and poverty(UBN) conditions are key drivers of fertility disparities, consistent with the economic theory of fertility. After conducting econometric diagnostics, several corrections are implemented to improve robustness and interpretability. The findings contribute to the understanding of Colombia’s demographic transition and provide useful evidence for regionally differentiated public policy design.

Introducción

Colombia atraviesa un cambio demográfico sin precedentes; datos del DANE revelan las tasas de natalidad más bajas de su historia, situándose por debajo del nivel de reemplazo poblacional de 2.1 hijos por mujer. No obstante, este fenómeno no es uniforme: mientras algunos departamentos muestran tasas europeas, otros mantienen niveles elevados, reflejando profundas disparidades socioeconómicas territoriales.

El objetivo general de esta investigación es estimar y analizar los determinantes socioeconómicos de la tasa de natalidad en Colombia mediante un modelo de regresión lineal múltiple. Se busca responder si factores como la educación, el ingreso y la pobreza explican estas diferencias regionales. Con base en la teoría de Becker (1960), se formulan las siguientes hipótesis: i) existe una relación negativa entre el nivel educativo femenino y la natalidad debido al costo de oportunidad del tiempo ; ii) el ingreso (PIB) presenta una relación negativa por el efecto sustitución ; y iii) la pobreza (NBI) se asocia positivamente con la natalidad al limitar el acceso a información y planificación.

Revisión de Literatura

La economía de la fecundidad tiene su origen en el trabajo pionero de Becker (1960), quien conceptualiza a los hijos como bienes cuya demanda depende de las restricciones presupuestarias y del costo de oportunidad del tiempo, particularmente el de las mujeres. En Colombia, la transición demográfica ha sido drástica, pasando de 6.7 hijos por mujer en 1960 a niveles actuales de 1.8. Estudios previos sugieren que la educación femenina es el factor más determinante, pues incrementa el valor del tiempo de las mujeres en el mercado laboral, desincentivando la alta fecundidad.

Este enfoque predice una relación negativa entre educación femenina y fecundidad, debido a que mayores niveles educativos incrementan el valor del tiempo y favorecen la sustitución de cantidad por calidad de los hijos. La evidencia empírica para países en desarrollo confirma estas predicciones. En el caso colombiano, los informes del DANE documentan una rápida transición demográfica. Estudios recientes destacan que esta reducción ha sido liderada por mujeres con mayor nivel educativo y residentes en zonas urbanas, mientras que las regiones rurales y con mayores privaciones estructurales presentan rezagos significativos.

Algunos estudios similares incluyen variables climáticas, como la temperatura promedio, bajo el argumento de que estas pueden afectar condiciones de vida, productividad o salud. No obstante, en este trabajo se decide no incorporar dicha variable bajo la hipótesis de que, en el contexto colombiano contemporáneo, el clima no ejerce un efecto directo ni relevante sobre las decisiones de fecundidad. Siguiendo el enfoque de Becker (1960), la fecundidad responde principalmente a factores económicos y sociales, en particular al valor del tiempo de las mujeres, la educación y el acceso a oportunidades laborales. Adicionalmente, la temperatura presenta una alta persistencia temporal a nivel departamental, por lo que resulta poco plausible que explique variaciones recientes y aceleradas en la fecundidad. Desde una perspectiva econométrica, su inclusión podría generar problemas de identificación y multicolinealidad con efectos fijos territoriales, sin aportar poder explicativo significativo.

Desde una perspectiva más contemporánea, Buelvas (2025) argumenta que la caída de la natalidad en Colombia responde no solo al desarrollo económico, sino también a cambios culturales, transformaciones en los roles de género y mayor incertidumbre laboral. No obstante, gran parte de esta literatura se concentra en análisis descriptivos o a nivel nacional, dejando un vacío en la estimación econométrica de los determinantes departamentales de la fecundidad. Este trabajo contribuye a llenar ese vacío mediante un análisis cuantitativo que articula teoría económica, datos oficiales y diagnóstico econométrico.

Estrategia empírica

Datos y variables

El análisis utiliza datos de corte transversal para los 32 departamentos y el Distrito Capital, provenientes de fuentes oficiales del DANE. La variable dependiente es la tasa global de fecundidad (TGF), medida como el número promedio de hijos que tendría una mujer a lo largo de su vida reproductiva.

Las variables explicativas incluyen: (i) el promedio de años de educación femenina (educfem), (ii) el índice de necesidades básicas insatisfechas (nbi) como proxy de pobreza, (iii) el porcentaje de población rural (rural) y (iv) el PIB departamental, transformado en logaritmos para capturar efectos marginales decrecientes.

Especificación del modelo

El modelo inicial se plantea como:

\[tgf = \beta_0 + \beta_1 educfem + \beta_2 nbi + \beta_3 salud + \beta_4 rural + \beta_5 trabfem + \beta_6 pib + u\] El modelo se estima mediante Mínimos Cuadrados Ordinarios (MCO), bajo los supuestos clásicos del modelo de regresión lineal.

Análisis Descriptivo Exploratorio

El análisis evidencia una marcada heterogeneidad territorial en Colombia. La TGF fluctúa entre un mínimo de 1.48 y un máximo de 5.21 hijos por mujer. El Índice de Necesidades Basicas Insatifechas(NBI), usado como proxy para medir la probreza, muestra una dispersión crítica (desde 4.1% hasta 68.5%), confirmando desigualdades estructurales entre los departamentos. Mientras la salud y el trabajo femenino son más homogéneos, el PIB presenta una fuerte asimetría, concentrándose en pocos territorios. Estos patrones preliminares sugieren una relación estrecha entre condiciones socioeconómicas y comportamiento reproductivo de la población.

Resultados econométricos y diagnóstico

Las estimaciones preliminares del modelo completo, que incluía como variables explicativas la educación femenina (educfem), el índice de necesidades básicas insatisfechas (nbi), el acceso a salud (salud), la ruralidad (rural), la participación laboral femenina (trabfem) y el PIB departamental, muestran un alto poder explicativo, con un R² ajustado superior al 0.80 y una significancia global elevada según el estadístico F. En esta especificación inicial, la educación femenina presenta un coeficiente negativo y estadísticamente significativo, mientras que el índice de pobreza muestra un efecto positivo y significativo sobre la tasa global de fecundidad, resultados consistentes con la teoría económica de la fecundidad.

No obstante, el diagnóstico econométrico revela problemas relevantes de multicolinealidad entre algunas variables explicativas. En particular, los factores de inflación de la varianza (VIF) indican valores elevados para las variables educfem, salud y trabfem, así como una alta correlación entre estas y la ruralidad. Este patrón sugiere que dichas variables capturan dimensiones estrechamente relacionadas del desarrollo socioeconómico departamental, generando redundancia informativa y afectando la estabilidad e interpretabilidad de los coeficientes estimados.

Con base en este diagnóstico, se decidió excluir del modelo final las variables de acceso a salud y participación laboral femenina. La exclusión se justifica porque sus efectos estaban fuertemente correlacionados con la educación femenina, que actúa como un indicador estructural que resume mejoras en capital humano, acceso a información, condiciones de salud y oportunidades laborales para las mujeres. De manera similar, la ruralidad y el índice de pobreza capturan desigualdades territoriales que ya incorporan indirectamente condiciones asociadas al acceso a servicios básicos. Mantener simultáneamente estas variables habría incrementado la multicolinealidad sin aportar información adicional significativa.

Adicionalmente, para corregir leves desviaciones del supuesto de linealidad asociadas al ingreso, se incorporó una transformación logarítmica del PIB departamental, lo que permite capturar rendimientos marginales decrecientes del desarrollo económico sobre la fecundidad y mejora la especificación funcional del modelo.

El modelo reespecificado, que incluye educación femenina, pobreza (nbi), ruralidad y el logaritmo del PIB, mantiene una alta significancia global y coeficientes con signos coherentes con la teoría económica. Aunque el R² ajustado (0.76) disminuye ligeramente respecto al modelo completo, esta reducción se considera aceptable dado que el modelo final es más parsimonioso, presenta menor multicolinealidad y ofrece mayor claridad interpretativa. En conjunto, las correcciones implementadas fortalecen la robustez de los resultados y refuerzan la validez econométrica del análisis.

El modelo final se plantea como:

\[tgf = \beta_0 + \beta_1 educfem + \beta_2 nbi + \beta_4 rural + \ln(\text{pib}) + u\]

El modelo se estima mediante Mínimos Cuadrados Ordinarios (MCO), bajo los supuestos clásicos del modelo de regresión lineal.

Conclusiones

Este estudio muestra que la educación femenina y las condiciones de pobreza son determinantes clave de la tasa global de fecundidad en los departamentos de Colombia. Los resultados son consistentes con la teoría económica de la fecundidad y con la evidencia empírica previa sobre la transición demográfica del país, al confirmar que mayores niveles de capital humano y mejores condiciones socioeconómicas se asocian con menores niveles de fecundidad.

No obstante, estos hallazgos no deben interpretarse como un argumento normativo en contra de la tenencia de hijos. Por el contrario, reflejan que, en contextos de mayor desarrollo, las decisiones reproductivas responden a restricciones económicas, costos de crianza elevados e incertidumbre laboral. En este sentido, la reducción de la fecundidad plantea retos relevantes para la sostenibilidad demográfica, el mercado laboral y los sistemas de protección social en el mediano y largo plazo.

Desde una perspectiva de política pública, los resultados sugieren la necesidad de explorar estrategias alternativas para incentivar la tenencia de hijos sin revertir los avances en educación y bienestar. Entre estas se encuentran políticas de conciliación entre trabajo y familia, ampliación de servicios de cuidado infantil, estabilidad laboral, reducción de los costos asociados a la crianza y fortalecimiento de esquemas de apoyo a las familias jóvenes. Estas medidas permitirían mitigar los efectos económicos que desincentivan la fecundidad, respetando al mismo tiempo las decisiones individuales y los logros en equidad de género.

Finalmente, como agenda de investigación futura, sería relevante incorporar dinámicas temporales, analizar posibles efectos espaciales entre departamentos y evaluar el impacto de políticas familiares específicas sobre el comportamiento reproductivo. Estas extensiones permitirían profundizar el análisis y aportar evidencia más directa para el diseño de políticas públicas orientadas a enfrentar los desafíos de la transición demográfica en Colombia.

Referencias

Becker, G. (1960). An Economic Analysis of Fertility. Princeton University Press.

Buelvas, L. (2025). El fin de los niños, o sobre la “coreanización” de la natalidad en Colombia. Razón Pública.

Departamento Administrativo Nacional de Estadística (DANE). (2021). Evolución de la fecundidad en Colombia por departamentos, 2005–2018 (PDF).

Departamento Administrativo Nacional de Estadística (DANE). (2023). Proyecciones de población y tasa global de fecundidad.

Departamento Administrativo Nacional de Estadística (DANE). Años promedio de estudio en población de 15 años y más (Geoportal Atlas Estadístico).

Departamento Administrativo Nacional de Estadística (DANE). (2025). Demografía Rural Colombia 2025.

Departamento Administrativo Nacional de Estadística (DANE). Cifras de afiliación en salud (datos oficiales).

Departamento Administrativo Nacional de Estadística (DANE). Necesidades básicas insatisfechas (NBI).

Departamento Administrativo Nacional de Estadística (DANE). PIB departamental por total de departamentos (anex-PIBDep-TotalDep-2024pr.xlsx).

Lora, E., & Prada, S. (2016). Técnicas de Medición Económica. Universidad Icesi.

Anexos

Carga base de datos

database <- read.csv("database.csv", sep = ";", dec = ".")
summary(database)
##  departamento            tgf             nbi            salud       
##  Length:33          Min.   :1.480   Min.   : 4.10   Min.   :0.8500  
##  Class :character   1st Qu.:1.940   1st Qu.:15.30   1st Qu.:0.9000  
##  Mode  :character   Median :2.230   Median :26.90   Median :0.9200  
##                     Mean   :2.374   Mean   :27.91   Mean   :0.9161  
##                     3rd Qu.:2.500   3rd Qu.:34.40   3rd Qu.:0.9500  
##                     Max.   :5.210   Max.   :68.50   Max.   :0.9700  
##     educfem            pib               rural           trabfem      
##  Min.   : 6.500   Min.   : 5889111   Min.   :0.0160   Min.   :0.4000  
##  1st Qu.: 8.100   1st Qu.: 9862749   1st Qu.:0.2800   1st Qu.:0.4500  
##  Median : 8.400   Median :14725788   Median :0.4400   Median :0.4700  
##  Mean   : 8.439   Mean   :16234468   Mean   :0.4296   Mean   :0.4812  
##  3rd Qu.: 9.100   3rd Qu.:20241029   3rd Qu.:0.5500   3rd Qu.:0.5200  
##  Max.   :10.800   Max.   :36877466   Max.   :0.7600   Max.   :0.5700  
##     region         
##  Length:33         
##  Class :character  
##  Mode  :character  
##                    
##                    
## 

Modelo de regresión inicial

\[tgf = \beta_0 + \beta_1 educfem + \beta_2 nbi + \beta_3 salud + \beta_4 rural + \beta_5 trabfem + \beta_6 pib + u\]

## 
## Call:
## lm(formula = tgf ~ educfem + nbi + salud + rural + trabfem + 
##     pib, data = database)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.47598 -0.16128 -0.01054  0.11411  0.99624 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)  
## (Intercept)  1.970e+01  7.225e+00   2.727   0.0113 *
## educfem     -6.284e-01  3.070e-01  -2.047   0.0509 .
## nbi          2.100e-02  8.128e-03   2.584   0.0157 *
## salud       -2.243e+01  9.795e+00  -2.290   0.0304 *
## rural       -1.031e+00  9.928e-01  -1.038   0.3086  
## trabfem      1.698e+01  6.657e+00   2.550   0.0170 *
## pib          1.304e-08  1.071e-08   1.218   0.2342  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.3358 on 26 degrees of freedom
## Multiple R-squared:  0.8433, Adjusted R-squared:  0.8071 
## F-statistic: 23.32 on 6 and 26 DF,  p-value: 2.636e-09

Validació de suspuestos

Linealidad

Normalidad de los residuos (Shapiro–Wilk)

## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(modelo_tgf)
## W = 0.89556, p-value = 0.004095

Homocedasticidad (Breusch–Pagan)

## 
##  studentized Breusch-Pagan test
## 
## data:  modelo_tgf
## BP = 8.5945, df = 6, p-value = 0.1977

Independencia de errores (Durbin–Watson)

## 
##  Durbin-Watson test
## 
## data:  modelo_tgf
## DW = 2.4503, p-value = 0.9193
## alternative hypothesis: true autocorrelation is greater than 0

Multicolinealidad (VIF)

##   educfem       nbi     salud     rural   trabfem       pib 
## 26.390431  4.943317 31.645719 11.101313 26.001358  2.228505

Correcciones

Linealidad

## 
## Call:
## lm(formula = tgf ~ educfem + nbi + salud + rural + trabfem + 
##     log_pib, data = database)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.44452 -0.14365 -0.02951  0.09416  0.99258 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)  
## (Intercept)  16.219691   8.351440   1.942   0.0630 .
## educfem      -0.610498   0.302405  -2.019   0.0539 .
## nbi           0.022378   0.008466   2.643   0.0137 *
## salud       -23.687195   9.485167  -2.497   0.0192 *
## rural        -1.027733   0.987220  -1.041   0.3074  
## trabfem      17.309442   6.628689   2.611   0.0148 *
## log_pib       0.272556   0.208655   1.306   0.2029  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.3344 on 26 degrees of freedom
## Multiple R-squared:  0.8446, Adjusted R-squared:  0.8087 
## F-statistic: 23.54 on 6 and 26 DF,  p-value: 2.38e-09

Normalidad de los residuos

Dado el tamaño muestral reducido, la desviación de normalidad no invalida la consistencia de los estimadores MCO, aunque puede afectar inferencia en muestras pequeñas

## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(modelo_tgf_box)
## W = 0.9176, p-value = 0.01573

Multicolinealidad

##            educfem      salud    trabfem      rural        nbi        pib
## educfem  1.0000000  0.9702685  0.9699282 -0.9401596 -0.8676110  0.6555902
## salud    0.9702685  1.0000000  0.9749760 -0.9473911 -0.8531709  0.5955962
## trabfem  0.9699282  0.9749760  1.0000000 -0.9394099 -0.8348781  0.6108994
## rural   -0.9401596 -0.9473911 -0.9394099  1.0000000  0.8095369 -0.6238270
## nbi     -0.8676110 -0.8531709 -0.8348781  0.8095369  1.0000000 -0.6983229
## pib      0.6555902  0.5955962  0.6108994 -0.6238270 -0.6983229  1.0000000
##   educfem       nbi     rural   log_pib 
## 12.037942  5.116801  8.689231  2.857826

Modelo de regresión final

\[tgf = \beta_0 + \beta_1 educfem + \beta_2 nbi + \beta_4 rural + \ln(\text{pib}) + u\]

## 
## Call:
## lm(formula = tgf ~ educfem + nbi + rural + log_pib, data = database)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.57760 -0.23785 -0.06059  0.17419  1.23498 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)   
## (Intercept)  0.961758   4.511938   0.213  0.83275   
## educfem     -0.522489   0.229828  -2.273  0.03087 * 
## nbi          0.027039   0.009165   2.950  0.00635 **
## rural       -0.700269   0.973523  -0.719  0.47791   
## log_pib      0.325638   0.226608   1.437  0.16180   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.3721 on 28 degrees of freedom
## Multiple R-squared:  0.7927, Adjusted R-squared:  0.7631 
## F-statistic: 26.77 on 4 and 28 DF,  p-value: 3.275e-09

La no significancia de la variable rural sugiere que su efecto opera indirectamente a través de pobreza y educación.