La esperanza de vida es uno de los indicadores más representativos del desarrollo y bienestar de una población. Este indicador resume de manera integral aspectos clave como el acceso a servicios de salud, el nivel educativo, las condiciones económicas y la estabilidad social de un país. Sin embargo, su distribución no es uniforme a nivel mundial: existen diferencias marcadas entre regiones y países, influenciadas por una variedad de factores tanto sanitarios como socioeconómicos.
El presente estudio busca analizar las variaciones en la esperanza de vida entre países durante el año 2021, con el objetivo de identificar qué factores explican estas diferencias. Para ello, se ha utilizado una técnica estadística conocida como regresión lineal múltiple, que permite cuantificar el impacto de múltiples variables independientes sobre una variable dependiente, en este caso, la esperanza de vida.
Entre las variables consideradas se incluyen indicadores sanitarios como la tasa de VIH por cada 1.000 personas, la mortalidad infantil en menores de 5 años y las muertes en conflictos armados, así como factores sociales y económicos como el índice de corrupción, el nivel de desarrollo del país, y la región geográfica o continente al que pertenece. Esta metodología permite evaluar de forma simultánea el efecto de cada variable, controlando la influencia de las demás, y estimar su significancia estadística.
De esta manera, el estudio busca ofrecer una visión más profunda y fundamentada sobre los factores que inciden en la esperanza de vida a nivel global. El análisis no solo pretende describir las diferencias observadas entre países, sino también aportar elementos útiles para la formulación de políticas públicas orientadas a mejorar las condiciones de vida. Comprender cómo interactúan estas variables puede contribuir a diseñar estrategias más eficaces en salud y desarrollo, adaptadas a las realidades específicas de cada región.
Para analizar los factores asociados a la variabilidad en la esperanza de vida a nivel mundial durante el año 2021, se siguió una metodología cuantitativa basada en la construcción y análisis de un modelo de regresión lineal múltiple. El proceso se desarrolló en varias etapas, que incluyeron la recopilación de datos, selección de variables, limpieza y preparación de la base de datos, y posterior análisis estadístico.
1. Selección de variables e identificación de fuentes de datos
El primer paso consistió en definir un conjunto de variables que, desde una perspectiva teórica y empírica, pudieran estar relacionadas con la esperanza de vida. Entre ellas se consideraron variables de carácter sanitario, social, económico y geográfico, tales como:
Tasa de VIH por cada 1.000 personas
Mortalidad infantil (menores de 5 años)
Muertes por conflictos armados
Índice de percepción de la corrupción
Nivel de desarrollo del país
Continente o región
Todas estas variables, se buscaron en “Our world in data”, repositorio de bases de datos públicas, actualizadas y confiables.
2. Recolección y consolidación de datos
Cada base de datos fue descargada en formato csv y revisada
individualmente. Posteriormente, los conjuntos de datos fueron
integrados utilizando el lenguaje de programación R, mediante la función
left_join()
del paquete dplyr
, empleando como
clave de unión el nombre del país. Este paso permitió consolidar la
información en un solo marco de datos data.frame
que
contenía las variables necesarias para el análisis.
3. Limpieza y transformación de datos
Durante esta etapa se llevaron a cabo diversas tareas de limpieza para garantizar la calidad del análisis:
join
)as.factor()
)NA
) o imputación en
casos justificadosAdemás, se revisaron posibles errores de codificación, valores extremos y duplicados que pudieran sesgar los resultados del modelo.
4. Análisis exploratorio de datos
Antes de construir el modelo, se exploraron las variables del conjunto de datos para entender su distribución y comportamiento. Para esto, se utilizaron distintos tipos de visualizaciones como histogramas, gráficos de dispersión y boxplots, junto con tablas resumen. Este análisis preliminar permitió identificar relaciones iniciales entre variables, posibles outliers y patrones que orientaron el enfoque del modelo final.
5. Modelado
El análisis principal se llevó a cabo mediante un modelo de regresión
lineal múltiple, implementado con la función lm()
. Este
modelo permite estimar el efecto de cada variable independiente sobre la
esperanza de vida, controlando por el resto de variables incluidas. Se
evaluó la significancia estadística de cada predictor mediante el valor
p, así como la calidad global del modelo utilizando el R² ajustado y el
análisis de residuos.
6.Interpretación
Finalmente, los resultados del modelo fueron interpretados desde un enfoque estadístico y contextual. Se consideraron tanto la magnitud como la dirección del efecto de cada variable. Se prestó especial atención a aquellas variables que mostraron una significancia estadística alta, con el fin de identificar patrones relevantes para explicar las diferencias en esperanza de vida entre países.
Antes de aplicar modelos explicativos, es fundamental comprender cómo se distribuyen y se comportan las variables involucradas. El análisis descriptivo permite observar patrones generales, contrastes entre regiones o grupos de países, y explorar posibles asociaciones entre los factores considerados y la esperanza de vida. Esta etapa ayuda a construir una visión preliminar del fenómeno, facilitando una interpretación más contextualizada de los resultados posteriores.
A continuación, se presentan diversos diagramas de dispersión que permiten visualizar gráficamente la relación entre la esperanza de vida y algunas de las variables explicativas más relevantes del estudio con respecto a su nivel de desarrollo
El gráfico muestra una relación negativa entre la tasa de VIH y la esperanza de vida: a mayor prevalencia de VIH, menor esperanza de vida. Los países desarrollados se agrupan con baja incidencia de VIH y alta longevidad, mientras que los no desarrollados presentan mayor dispersión, con casos de alta prevalencia y menor esperanza de vida. Esto refuerza la influencia del VIH en el bienestar poblacional, especialmente en contextos con menor acceso a servicios de salud.
El gráfico ilustra la relación entre las muertes por conflicto armado y la esperanza de vida. Aunque no se observa una relación lineal clara teniendo en cuenta el nivel de desarrollo,puesto que no se presentan datos de países desarrollados por la escala logaritmica. Revisando la base de datos, se aprecia que este número de muertes por conflictos armados es 0, lo que contrasta mucho con casos como Ethiopia, que registra alrededor de 100000 muertes a causa del conflicto armado. Sin embargo, omitiendo el nivel de desarrollo de los países, se observa una tendencia negativa leve entre las muertes a causa del conflicto armado y la esperanza de vida: a mayores esperanza de vida, menos muertes por conflicto armado existen.
El gráfico muestra una relación negativa entre las muertes de menores de 5 años y la esperanza de vida: a mayores muertes de menores, menor esperanza de vida. Los países desarrollados se agrupan con baja incidencia de fallecimientos y alta longevidad, mientras que los no desarrollados presentan mayor dispersión, con casos de alta mortalidad y menor esperanza de vida. Esto sugiere que dichas muertes de menores, reduce significativamente la esperanza vida de un país, puesto que es un valor atípico con gran presencia.
El gráfico muestra una relación ligeramente negativa entre la corrupción y la esperanza de vida: a mayor corrupción, menor esperanza de vida. Los países desarrollados se agrupan con baja incidencia de corrupción y alta longevidad, mientras que los no desarrollados presentan mayor dispersión, con casos de alta corrupción y menor esperanza de vida. Sin embargo, hay dos países desarrollados que no siguen esa tendencia, como es el caso de Rusia y Serbia, los cuales tienen un nivel mucho mayor de corrupción, no obstante, su esperanza de vida no se ve demasiado reducida.
De igual forma que se realizó anteriomente con el nivel de desarrollo, a continuación se presentan los diagramas de dispersión de la esperanza de vida con las distintas variables de estudio teniendo en cuenta al continente al que pertenecen sus países.
El gráfico muestra una relación negativa entre la tasa de VIH y la esperanza de vida: a mayor prevalencia de VIH, menor esperanza de vida. Sin embargo, esta tendencia no se ve representada si clasificamos según su continente, entonces se puede decir que no hay una correlación notoria entre estas dos variables. No obstante, cabe resaltar que los países del continente africano, tienen a tener valores atípicos en la tasa de VIH, lo que puede sugerir su influencia en la esperanza de vida
El gráfico ilustra la relación entre las muertes por conflicto armado y la esperanza de vida. No se observa una relación lineal clara teniendo en cuenta el continente al cual pertenece, por lo tanto se concluye que no hay una correlación directa entre ambas variables teniendo en cuenta el continente.
El gráfico muestra una relación negativa entre las muertes de menores de 5 años y la esperanza de vida: a mayores muertes de menores, menor esperanza de vida. Los continentes como europa y america, muestran una leve tendencia a alta esperanza de vida y baja mortalidad, mientras que africa posee una alta mortalidad y por ende se ve afectada su esperanza de vida
El gráfico muestra la relación entre la corrupción y la esperanza de vida. Sin embargo no se muestra una tendencia clara, sin embargo el unico continente que tiende a tener una alta esperanza y bajo nivel de corrupción corresponde a europa. Esto puede deberse a la gran variedad de paises socioeconomicamente distintos que poseen los otros continentes.
Con el fin de evaluar la relación entre las distintas variables
predictoras y la esperanza de vida, se ha ajustado un modelo de
regresión lineal. A continuación, se presentan los resultados obtenidos
a partir del summary()
del modelo, el cual permite
identificar la magnitud, dirección y significancia estadística de cada
uno de los predictores incluidos. Esta información es clave para
entender cuáles factores están más fuertemente asociados con la
esperanza de vida entre los países analizados.
##
## Call:
## lm(formula = esperanza_vida ~ +vih_1000personas + deaths_conflict +
## mortalidad_menor_5anios + corrupcion + as.factor(continente) +
## as.factor(desarrollado), data = data_final)
##
## Residuals:
## Min 1Q Median 3Q Max
## -8.4955 -1.9616 0.0708 1.6526 6.4413
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 7.813e+01 9.758e-01 80.070 < 2e-16 ***
## vih_1000personas -2.045e+00 3.667e-01 -5.578 1.40e-07 ***
## deaths_conflict -1.767e-05 2.066e-05 -0.855 0.394
## mortalidad_menor_5anios -1.710e+00 1.194e-01 -14.329 < 2e-16 ***
## corrupcion -5.385e+00 1.081e+00 -4.982 2.02e-06 ***
## as.factor(continente)america -5.363e-01 8.478e-01 -0.633 0.528
## as.factor(continente)Asia 6.207e-01 7.333e-01 0.847 0.399
## as.factor(continente)europe -3.314e-02 9.027e-01 -0.037 0.971
## as.factor(continente)oceania -1.947e+00 1.371e+00 -1.419 0.158
## as.factor(desarrollado)yes 4.492e+00 9.374e-01 4.792 4.54e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 2.77 on 127 degrees of freedom
## (99 observations deleted due to missingness)
## Multiple R-squared: 0.868, Adjusted R-squared: 0.8586
## F-statistic: 92.79 on 9 and 127 DF, p-value: < 2.2e-16
El modelo de regresión lineal múltiple ajustado tiene como variable dependiente la esperanza de vida y considera como predictores: la tasa de VIH por cada 1.000 personas, muertes por conflicto armado, mortalidad en menores de 5 años, percepción de corrupción, continente de pertenencia y si el país está clasificado como desarrollado.
El modelo explica una proporción alta de la variabilidad en la esperanza de vida (R² ajustado = 0.8586), lo cual indica que aproximadamente el 86% de la variabilidad en esta variable se encuentra explicada por los factores incluidos. Además, el modelo es estadísticamente significativo en su conjunto (F(9, 127) = 92.79, p < 0.001), lo que respalda la validez general de los resultados.
(Intercepto) 78.13: Representa la esperanza de vida esperada en un país que presenta valores cero en todas las variables predictoras. Aunque no interpretable de forma directa, sirve como punto de referencia para los efectos marginales.
Tasa de VIH por cada 1.000 personas (β = -2.045, p < 0.001): Cada unidad adicional en la tasa de VIH se asocia, en promedio, con una reducción de aproximadamente 2.05 años en la esperanza de vida, manteniendo constantes el resto de las variables.
Muertes por conflicto armado (β = -0.0000177, p = 0.394): Aunque el signo del coeficiente es negativo, el valor no es estadísticamente significativo, lo que sugiere que en este modelo no se puede afirmar que las muertes por conflicto armado tengan un efecto directo sobre la esperanza de vida.
Mortalidad en menores de 5 años (β = -1.710, p < 0.001): Por cada unidad adicional en la tasa de mortalidad infantil, la esperanza de vida disminuye en 1.71 años en promedio. Se trata de una relación fuerte y significativa.
Percepción de la corrupción (β = -5.385, p < 0.001): Mayores niveles de corrupción percibida están asociados con una reducción de más de 5 años en la esperanza de vida. Su magnitud y significancia sugieren un fuerte impacto institucional.
Continente de pertenencia: Ninguna de las categorías continentales (América, Asia, Europa, Oceanía) presenta un efecto significativo sobre la esperanza de vida en comparación con la categoría base (África).
Condición de país desarrollado (β = 4.492, p < 0.001): Los países desarrollados tienen, en promedio, una esperanza de vida 4.5 años superior a los países no desarrollados, controlando por las demás variables.
Para verificar la validez del modelo de regresión lineal, se analizó el gráfico de residuos versus valores ajustados (Residuals vs Fitted). Este gráfico permite evaluar dos supuestos importantes:
Linealidad: Se espera que los residuos se dispersen aleatoriamente alrededor de la línea horizontal (residuo = 0), sin seguir ningún patrón sistemático.
Homocedasticidad: La variabilidad de los residuos debe ser constante a lo largo de los valores ajustados (es decir, sin forma de embudo o dispersión creciente/disminuyente).
En el gráfico presentado, los residuos
parecen distribuirse de forma moderadamente simétrica alrededor de la
línea horizontal, aunque con cierta curvatura leve en la línea de
suavizado, lo que sugiere una posible ligera desviación del supuesto de
linealidad. Además, la dispersión de los residuos se mantiene
relativamente constante en la mayoría del rango de valores ajustados,
aunque se observa una leve mayor variabilidad en los extremos, lo que
podría indicar una ligera heterocedasticidad.
Con este supuesto se busca que los datos presenten semejanza significativamente con una distribución normal. A continuación se muestra la gráfica correspondiente al modelo.
En este caso, se observa que la mayor
parte de los puntos se alinean de forma razonablemente cercana a la
línea diagonal, aunque con algunas desviaciones en los extremos (colas).
Esta ligera curvatura indica la posible presencia de valores atípicos o
colas más pesadas de lo esperado bajo normalidad perfecta.
A pesar de estas desviaciones, el patrón general no muestra grandes irregularidades, por lo que el supuesto de normalidad se considera moderadamente cumplido. Dado que el modelo se basa en una muestra amplia y el análisis de regresión es relativamente robusto a leves desviaciones de la normalidad, estas observaciones no comprometen de forma significativa la validez del modelo ajustado.
La multicolinealidad se refiere a la correlación alta entre variables independientes dentro de un modelo de regresión, lo cual puede distorsionar las estimaciones de los coeficientes y su significancia. Para evaluar este supuesto, se calculó el GVIF (Generalized Variance Inflation Factor) para cada predictor en el modelo. A continuación se muestran los resultados.
## GVIF Df GVIF^(1/(2*Df))
## vih_1000personas 1.338384 1 1.156886
## deaths_conflict 1.032158 1 1.015952
## mortalidad_menor_5anios 1.913169 1 1.383174
## corrupcion 1.708967 1 1.307275
## as.factor(continente) 2.719086 4 1.133190
## as.factor(desarrollado) 1.617848 1 1.271947
Todos los valores de GVIF ajustado se encuentran por debajo de 2, muy lejos del umbral comúnmente aceptado de 5, que indica presencia de multicolinealidad severa. Esto sugiere que no existen problemas significativos de multicolinealidad en el modelo. Las variables incluidas están suficientemente diferenciadas entre sí como para proporcionar estimaciones confiables de los coeficientes.
El análisis de regresión lineal múltiple permitió identificar diversos factores que inciden significativamente en la esperanza de vida de los países durante el año 2021. Los principales hallazgos se resumen a continuación:
Mortalidad infantil: La tasa de mortalidad en menores de 5 años se asoció de forma negativa y altamente significativa con la esperanza de vida. Esto evidencia que una elevada mortalidad infantil representa un serio obstáculo para el aumento del bienestar poblacional, y refuerza la necesidad de fortalecer políticas de salud materno-infantil.
Tasa de VIH: También se identificó una relación negativa significativa entre la tasa de VIH por cada 1.000 personas y la esperanza de vida. La presencia y propagación de enfermedades infecciosas continúa siendo un factor crítico, especialmente en contextos con deficiencias en acceso a tratamiento y prevención.
Índice de corrupción: El modelo evidenció que mayores niveles percibidos de corrupción están asociados con una menor esperanza de vida. Esto sugiere que una gestión ineficiente y poco transparente de los recursos públicos puede afectar negativamente áreas clave como la salud, la educación y la infraestructura básica.
Nivel de desarrollo: Ser un país desarrollado mostró un efecto positivo y significativo sobre la esperanza de vida. Este resultado es coherente con la literatura y confirma el papel fundamental del desarrollo económico y social en la mejora de las condiciones de vida de la población.
Otras variables: Algunas variables incluidas en el modelo, como las muertes por conflicto armado y la región geográfica (continente), no presentaron una relación estadísticamente significativa con la esperanza de vida, al menos en el contexto analizado.
A partir de los resultados obtenidos en el análisis, es posible plantear una serie de recomendaciones orientadas a mejorar las condiciones que influyen significativamente en la esperanza de vida. Estas sugerencias se fundamentan en los factores que mostraron mayor impacto en el modelo y en la evidencia existente sobre su relación con el bienestar poblacional. A continuación, se presentan algunas estrategias y acciones clave que podrían contribuir a reducir las brechas observadas entre países y regiones.
Priorizar la salud infantil: Invertir en programas de atención primaria para la infancia y la maternidad, con especial énfasis en países con altas tasas de mortalidad infantil.
Fortalecer la prevención del VIH: Ampliar el acceso a pruebas diagnósticas, campañas educativas y tratamientos antirretrovirales, sobre todo en regiones con prevalencias elevadas.
Reducir la corrupción institucional: Fomentar políticas de transparencia, rendición de cuentas y fortalecimiento institucional para mejorar la eficiencia en el uso de recursos públicos.
Promover el desarrollo sostenible: Apoyar a los países en vías de desarrollo mediante iniciativas integrales que aborden salud, educación y gobernanza, con el fin de cerrar brechas estructurales y reducir las desigualdades en esperanza de vida.
Our World in Data. (s.f). Life Expectancy. https://ourworldindata.org/life-expectancy
Organización Mundial de la Salud (OMS). (2023). El impacto del VIH/SIDA en la esperanza de vida global. Disponible en: https://www.who.int/news-room/fact-sheets/detail/hiv-aids
UNICEF. (2022). Reducir la mortalidad infantil: clave para mejorar la esperanza de vida. Disponible en: https://www.unicef.org/es/mortalidad-infantil
Banco Mundial. (2021). La corrupción y sus efectos sobre el desarrollo y el bienestar de la población. Disponible en: https://www.bancomundial.org/es/news/feature/2021/12/09/corruption-development-and-poverty