Introducción

La esperanza de vida es uno de los indicadores más representativos del desarrollo y bienestar de una población. Este indicador resume de manera integral aspectos clave como el acceso a servicios de salud, el nivel educativo, las condiciones económicas y la estabilidad social de un país. Sin embargo, su distribución no es uniforme a nivel mundial: existen diferencias marcadas entre regiones y países, influenciadas por una variedad de factores tanto sanitarios como socioeconómicos.

El presente estudio busca analizar las variaciones en la esperanza de vida entre países durante el año 2021, con el objetivo de identificar qué factores explican estas diferencias. Para ello, se ha utilizado una técnica estadística conocida como regresión lineal múltiple, que permite cuantificar el impacto de múltiples variables independientes sobre una variable dependiente, en este caso, la esperanza de vida.

Entre las variables consideradas se incluyen indicadores sanitarios como la tasa de VIH por cada 1.000 personas, la mortalidad infantil en menores de 5 años y las muertes en conflictos armados, así como factores sociales y económicos como el índice de corrupción, el nivel de desarrollo del país, y la región geográfica o continente al que pertenece. Esta metodología permite evaluar de forma simultánea el efecto de cada variable, controlando la influencia de las demás, y estimar su significancia estadística.

De esta manera, el estudio busca ofrecer una visión más profunda y fundamentada sobre los factores que inciden en la esperanza de vida a nivel global. El análisis no solo pretende describir las diferencias observadas entre países, sino también aportar elementos útiles para la formulación de políticas públicas orientadas a mejorar las condiciones de vida. Comprender cómo interactúan estas variables puede contribuir a diseñar estrategias más eficaces en salud y desarrollo, adaptadas a las realidades específicas de cada región.

Metodología

Para analizar los factores asociados a la variabilidad en la esperanza de vida a nivel mundial durante el año 2021, se siguió una metodología cuantitativa basada en la construcción y análisis de un modelo de regresión lineal múltiple. El proceso se desarrolló en varias etapas, que incluyeron la recopilación de datos, selección de variables, limpieza y preparación de la base de datos, y posterior análisis estadístico.

1. Selección de variables e identificación de fuentes de datos

El primer paso consistió en definir un conjunto de variables que, desde una perspectiva teórica y empírica, pudieran estar relacionadas con la esperanza de vida. Entre ellas se consideraron variables de carácter sanitario, social, económico y geográfico, tales como:

  • Tasa de VIH por cada 1.000 personas

  • Mortalidad infantil (menores de 5 años)

  • Muertes por conflictos armados

  • Índice de percepción de la corrupción

  • Nivel de desarrollo del país

  • Continente o región

Todas estas variables, se buscaron en “Our world in data”, repositorio de bases de datos públicas, actualizadas y confiables.

2. Recolección y consolidación de datos

Cada base de datos fue descargada en formato csv y revisada individualmente. Posteriormente, los conjuntos de datos fueron integrados utilizando el lenguaje de programación R, mediante la función left_join() del paquete dplyr, empleando como clave de unión el nombre del país. Este paso permitió consolidar la información en un solo marco de datos data.frame que contenía las variables necesarias para el análisis.

3. Limpieza y transformación de datos

Durante esta etapa se llevaron a cabo diversas tareas de limpieza para garantizar la calidad del análisis:

  • Estandarización de nombres de países para evitar inconsistencias durante las uniones (join)
  • Conversión de variables categóricas a factores (as.factor())
  • Eliminación de valores faltantes (NA) o imputación en casos justificados
  • Transformación de unidades o escalas en algunas variables para asegurar comparabilidad

Además, se revisaron posibles errores de codificación, valores extremos y duplicados que pudieran sesgar los resultados del modelo.

4. Análisis exploratorio de datos

Antes de construir el modelo, se exploraron las variables del conjunto de datos para entender su distribución y comportamiento. Para esto, se utilizaron distintos tipos de visualizaciones como histogramas, gráficos de dispersión y boxplots, junto con tablas resumen. Este análisis preliminar permitió identificar relaciones iniciales entre variables, posibles outliers y patrones que orientaron el enfoque del modelo final.

5. Modelado

El análisis principal se llevó a cabo mediante un modelo de regresión lineal múltiple, implementado con la función lm(). Este modelo permite estimar el efecto de cada variable independiente sobre la esperanza de vida, controlando por el resto de variables incluidas. Se evaluó la significancia estadística de cada predictor mediante el valor p, así como la calidad global del modelo utilizando el R² ajustado y el análisis de residuos.

6.Interpretación

Finalmente, los resultados del modelo fueron interpretados desde un enfoque estadístico y contextual. Se consideraron tanto la magnitud como la dirección del efecto de cada variable. Se prestó especial atención a aquellas variables que mostraron una significancia estadística alta, con el fin de identificar patrones relevantes para explicar las diferencias en esperanza de vida entre países.

Analisis

Antes de aplicar modelos explicativos, es fundamental comprender cómo se distribuyen y se comportan las variables involucradas. El análisis descriptivo permite observar patrones generales, contrastes entre regiones o grupos de países, y explorar posibles asociaciones entre los factores considerados y la esperanza de vida. Esta etapa ayuda a construir una visión preliminar del fenómeno, facilitando una interpretación más contextualizada de los resultados posteriores.

Estadísticas descriptivas por nivel de desarrrollo

A continuación, se presentan diversos diagramas de dispersión que permiten visualizar gráficamente la relación entre la esperanza de vida y algunas de las variables explicativas más relevantes del estudio con respecto a su nivel de desarrollo

VIH

El gráfico muestra una relación negativa entre la tasa de VIH y la esperanza de vida: a mayor prevalencia de VIH, menor esperanza de vida. Los países desarrollados se agrupan con baja incidencia de VIH y alta longevidad, mientras que los no desarrollados presentan mayor dispersión, con casos de alta prevalencia y menor esperanza de vida. Esto refuerza la influencia del VIH en el bienestar poblacional, especialmente en contextos con menor acceso a servicios de salud.

Muertes por conflictos armados

El gráfico ilustra la relación entre las muertes por conflicto armado y la esperanza de vida. Aunque no se observa una relación lineal clara teniendo en cuenta el nivel de desarrollo,puesto que no se presentan datos de países desarrollados por la escala logaritmica. Revisando la base de datos, se aprecia que este número de muertes por conflictos armados es 0, lo que contrasta mucho con casos como Ethiopia, que registra alrededor de 100000 muertes a causa del conflicto armado. Sin embargo, omitiendo el nivel de desarrollo de los países, se observa una tendencia negativa leve entre las muertes a causa del conflicto armado y la esperanza de vida: a mayores esperanza de vida, menos muertes por conflicto armado existen.

Mortalidad menores 5 años

El gráfico muestra una relación negativa entre las muertes de menores de 5 años y la esperanza de vida: a mayores muertes de menores, menor esperanza de vida. Los países desarrollados se agrupan con baja incidencia de fallecimientos y alta longevidad, mientras que los no desarrollados presentan mayor dispersión, con casos de alta mortalidad y menor esperanza de vida. Esto sugiere que dichas muertes de menores, reduce significativamente la esperanza vida de un país, puesto que es un valor atípico con gran presencia.

Corrupción

El gráfico muestra una relación ligeramente negativa entre la corrupción y la esperanza de vida: a mayor corrupción, menor esperanza de vida. Los países desarrollados se agrupan con baja incidencia de corrupción y alta longevidad, mientras que los no desarrollados presentan mayor dispersión, con casos de alta corrupción y menor esperanza de vida. Sin embargo, hay dos países desarrollados que no siguen esa tendencia, como es el caso de Rusia y Serbia, los cuales tienen un nivel mucho mayor de corrupción, no obstante, su esperanza de vida no se ve demasiado reducida.

Estadísticas descriptivas por continente

De igual forma que se realizó anteriomente con el nivel de desarrollo, a continuación se presentan los diagramas de dispersión de la esperanza de vida con las distintas variables de estudio teniendo en cuenta al continente al que pertenecen sus países.

VIH

El gráfico muestra una relación negativa entre la tasa de VIH y la esperanza de vida: a mayor prevalencia de VIH, menor esperanza de vida. Sin embargo, esta tendencia no se ve representada si clasificamos según su continente, entonces se puede decir que no hay una correlación notoria entre estas dos variables. No obstante, cabe resaltar que los países del continente africano, tienen a tener valores atípicos en la tasa de VIH, lo que puede sugerir su influencia en la esperanza de vida

Muertes por conflictos armados

El gráfico ilustra la relación entre las muertes por conflicto armado y la esperanza de vida. No se observa una relación lineal clara teniendo en cuenta el continente al cual pertenece, por lo tanto se concluye que no hay una correlación directa entre ambas variables teniendo en cuenta el continente.

Mortalidad menores 5 años

El gráfico muestra una relación negativa entre las muertes de menores de 5 años y la esperanza de vida: a mayores muertes de menores, menor esperanza de vida. Los continentes como europa y america, muestran una leve tendencia a alta esperanza de vida y baja mortalidad, mientras que africa posee una alta mortalidad y por ende se ve afectada su esperanza de vida

Corrupción

El gráfico muestra la relación entre la corrupción y la esperanza de vida. Sin embargo no se muestra una tendencia clara, sin embargo el unico continente que tiende a tener una alta esperanza y bajo nivel de corrupción corresponde a europa. Esto puede deberse a la gran variedad de paises socioeconomicamente distintos que poseen los otros continentes.

Modelo de regresión lineal

Con el fin de evaluar la relación entre las distintas variables predictoras y la esperanza de vida, se ha ajustado un modelo de regresión lineal. A continuación, se presentan los resultados obtenidos a partir del summary() del modelo, el cual permite identificar la magnitud, dirección y significancia estadística de cada uno de los predictores incluidos. Esta información es clave para entender cuáles factores están más fuertemente asociados con la esperanza de vida entre los países analizados.

## 
## Call:
## lm(formula = esperanza_vida ~ +vih_1000personas + deaths_conflict + 
##     mortalidad_menor_5anios + corrupcion + as.factor(continente) + 
##     as.factor(desarrollado), data = data_final)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -8.4955 -1.9616  0.0708  1.6526  6.4413 
## 
## Coefficients:
##                                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)                   7.813e+01  9.758e-01  80.070  < 2e-16 ***
## vih_1000personas             -2.045e+00  3.667e-01  -5.578 1.40e-07 ***
## deaths_conflict              -1.767e-05  2.066e-05  -0.855    0.394    
## mortalidad_menor_5anios      -1.710e+00  1.194e-01 -14.329  < 2e-16 ***
## corrupcion                   -5.385e+00  1.081e+00  -4.982 2.02e-06 ***
## as.factor(continente)america -5.363e-01  8.478e-01  -0.633    0.528    
## as.factor(continente)Asia     6.207e-01  7.333e-01   0.847    0.399    
## as.factor(continente)europe  -3.314e-02  9.027e-01  -0.037    0.971    
## as.factor(continente)oceania -1.947e+00  1.371e+00  -1.419    0.158    
## as.factor(desarrollado)yes    4.492e+00  9.374e-01   4.792 4.54e-06 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.77 on 127 degrees of freedom
##   (99 observations deleted due to missingness)
## Multiple R-squared:  0.868,  Adjusted R-squared:  0.8586 
## F-statistic: 92.79 on 9 and 127 DF,  p-value: < 2.2e-16

Interpretación

El modelo de regresión lineal múltiple ajustado tiene como variable dependiente la esperanza de vida y considera como predictores: la tasa de VIH por cada 1.000 personas, muertes por conflicto armado, mortalidad en menores de 5 años, percepción de corrupción, continente de pertenencia y si el país está clasificado como desarrollado.

Calidad del ajuste

El modelo explica una proporción alta de la variabilidad en la esperanza de vida (R² ajustado = 0.8586), lo cual indica que aproximadamente el 86% de la variabilidad en esta variable se encuentra explicada por los factores incluidos. Además, el modelo es estadísticamente significativo en su conjunto (F(9, 127) = 92.79, p < 0.001), lo que respalda la validez general de los resultados.

Interpretación de los coeficientes

  • (Intercepto) 78.13: Representa la esperanza de vida esperada en un país que presenta valores cero en todas las variables predictoras. Aunque no interpretable de forma directa, sirve como punto de referencia para los efectos marginales.

  • Tasa de VIH por cada 1.000 personas (β = -2.045, p < 0.001): Cada unidad adicional en la tasa de VIH se asocia, en promedio, con una reducción de aproximadamente 2.05 años en la esperanza de vida, manteniendo constantes el resto de las variables.

  • Muertes por conflicto armado (β = -0.0000177, p = 0.394): Aunque el signo del coeficiente es negativo, el valor no es estadísticamente significativo, lo que sugiere que en este modelo no se puede afirmar que las muertes por conflicto armado tengan un efecto directo sobre la esperanza de vida.

  • Mortalidad en menores de 5 años (β = -1.710, p < 0.001): Por cada unidad adicional en la tasa de mortalidad infantil, la esperanza de vida disminuye en 1.71 años en promedio. Se trata de una relación fuerte y significativa.

  • Percepción de la corrupción (β = -5.385, p < 0.001): Mayores niveles de corrupción percibida están asociados con una reducción de más de 5 años en la esperanza de vida. Su magnitud y significancia sugieren un fuerte impacto institucional.

  • Continente de pertenencia: Ninguna de las categorías continentales (América, Asia, Europa, Oceanía) presenta un efecto significativo sobre la esperanza de vida en comparación con la categoría base (África).

  • Condición de país desarrollado (β = 4.492, p < 0.001): Los países desarrollados tienen, en promedio, una esperanza de vida 4.5 años superior a los países no desarrollados, controlando por las demás variables.

Supuestos

Linealidad y homocedasticidad

Para verificar la validez del modelo de regresión lineal, se analizó el gráfico de residuos versus valores ajustados (Residuals vs Fitted). Este gráfico permite evaluar dos supuestos importantes:

  • Linealidad: Se espera que los residuos se dispersen aleatoriamente alrededor de la línea horizontal (residuo = 0), sin seguir ningún patrón sistemático.

  • Homocedasticidad: La variabilidad de los residuos debe ser constante a lo largo de los valores ajustados (es decir, sin forma de embudo o dispersión creciente/disminuyente).

En el gráfico presentado, los residuos parecen distribuirse de forma moderadamente simétrica alrededor de la línea horizontal, aunque con cierta curvatura leve en la línea de suavizado, lo que sugiere una posible ligera desviación del supuesto de linealidad. Además, la dispersión de los residuos se mantiene relativamente constante en la mayoría del rango de valores ajustados, aunque se observa una leve mayor variabilidad en los extremos, lo que podría indicar una ligera heterocedasticidad.

Normalidad

Con este supuesto se busca que los datos presenten semejanza significativamente con una distribución normal. A continuación se muestra la gráfica correspondiente al modelo.

En este caso, se observa que la mayor parte de los puntos se alinean de forma razonablemente cercana a la línea diagonal, aunque con algunas desviaciones en los extremos (colas). Esta ligera curvatura indica la posible presencia de valores atípicos o colas más pesadas de lo esperado bajo normalidad perfecta.

A pesar de estas desviaciones, el patrón general no muestra grandes irregularidades, por lo que el supuesto de normalidad se considera moderadamente cumplido. Dado que el modelo se basa en una muestra amplia y el análisis de regresión es relativamente robusto a leves desviaciones de la normalidad, estas observaciones no comprometen de forma significativa la validez del modelo ajustado.

Multicolinealidad

La multicolinealidad se refiere a la correlación alta entre variables independientes dentro de un modelo de regresión, lo cual puede distorsionar las estimaciones de los coeficientes y su significancia. Para evaluar este supuesto, se calculó el GVIF (Generalized Variance Inflation Factor) para cada predictor en el modelo. A continuación se muestran los resultados.

##                             GVIF Df GVIF^(1/(2*Df))
## vih_1000personas        1.338384  1        1.156886
## deaths_conflict         1.032158  1        1.015952
## mortalidad_menor_5anios 1.913169  1        1.383174
## corrupcion              1.708967  1        1.307275
## as.factor(continente)   2.719086  4        1.133190
## as.factor(desarrollado) 1.617848  1        1.271947

Todos los valores de GVIF ajustado se encuentran por debajo de 2, muy lejos del umbral comúnmente aceptado de 5, que indica presencia de multicolinealidad severa. Esto sugiere que no existen problemas significativos de multicolinealidad en el modelo. Las variables incluidas están suficientemente diferenciadas entre sí como para proporcionar estimaciones confiables de los coeficientes.

Conclusiones

El análisis de regresión lineal múltiple permitió identificar diversos factores que inciden significativamente en la esperanza de vida de los países durante el año 2021. Los principales hallazgos se resumen a continuación:

  • Mortalidad infantil: La tasa de mortalidad en menores de 5 años se asoció de forma negativa y altamente significativa con la esperanza de vida. Esto evidencia que una elevada mortalidad infantil representa un serio obstáculo para el aumento del bienestar poblacional, y refuerza la necesidad de fortalecer políticas de salud materno-infantil.

  • Tasa de VIH: También se identificó una relación negativa significativa entre la tasa de VIH por cada 1.000 personas y la esperanza de vida. La presencia y propagación de enfermedades infecciosas continúa siendo un factor crítico, especialmente en contextos con deficiencias en acceso a tratamiento y prevención.

  • Índice de corrupción: El modelo evidenció que mayores niveles percibidos de corrupción están asociados con una menor esperanza de vida. Esto sugiere que una gestión ineficiente y poco transparente de los recursos públicos puede afectar negativamente áreas clave como la salud, la educación y la infraestructura básica.

  • Nivel de desarrollo: Ser un país desarrollado mostró un efecto positivo y significativo sobre la esperanza de vida. Este resultado es coherente con la literatura y confirma el papel fundamental del desarrollo económico y social en la mejora de las condiciones de vida de la población.

  • Otras variables: Algunas variables incluidas en el modelo, como las muertes por conflicto armado y la región geográfica (continente), no presentaron una relación estadísticamente significativa con la esperanza de vida, al menos en el contexto analizado.

A partir de los resultados obtenidos en el análisis, es posible plantear una serie de recomendaciones orientadas a mejorar las condiciones que influyen significativamente en la esperanza de vida. Estas sugerencias se fundamentan en los factores que mostraron mayor impacto en el modelo y en la evidencia existente sobre su relación con el bienestar poblacional. A continuación, se presentan algunas estrategias y acciones clave que podrían contribuir a reducir las brechas observadas entre países y regiones.

  • Priorizar la salud infantil: Invertir en programas de atención primaria para la infancia y la maternidad, con especial énfasis en países con altas tasas de mortalidad infantil.

  • Fortalecer la prevención del VIH: Ampliar el acceso a pruebas diagnósticas, campañas educativas y tratamientos antirretrovirales, sobre todo en regiones con prevalencias elevadas.

  • Reducir la corrupción institucional: Fomentar políticas de transparencia, rendición de cuentas y fortalecimiento institucional para mejorar la eficiencia en el uso de recursos públicos.

  • Promover el desarrollo sostenible: Apoyar a los países en vías de desarrollo mediante iniciativas integrales que aborden salud, educación y gobernanza, con el fin de cerrar brechas estructurales y reducir las desigualdades en esperanza de vida.

Bibliografía