Contextualización

Base de datos: Esperanza de vida de la población mundial

La base de datos escogida ofrece una lista de países clasificados según la esperanza de vida al nacer, que representa el promedio de años que se espera que viva un recién nacido con las tasas de mortalidad actuales. Incluye cifras de esperanza de vida a nivel mundial, regional y nacional, con datos separados para hombres y mujeres. El conjunto de datos destaca las disparidades en la longevidad entre países, siendo países como Hong Kong, Japón y Corea del Sur los que presentan las mayores esperanzas de vida. Estos datos sirven como un indicador clave de la salud pública, la calidad de vida y la eficacia de la atención médica, ofreciendo información valiosa para los responsables políticos, investigadores y organizaciones sanitarias mundiales. (Azua, 2025)

head(data)
## # A tibble: 6 × 4
##   pais                     `EV(mujeres)` `EV(ambos sexos)` `EV(hombres)`
##   <chr>                            <dbl>             <dbl>         <dbl>
## 1 Chad                              57.2              55.2          53.4
## 2 Nigeria                           54.9              54.6          54.3
## 3 South Sudan                       60.8              57.7          54.8
## 4 Lesotho                           60.4              57.8          55.0
## 5 Central African Republic          59.6              57.7          55.5
## 6 Somalia                           61.6              59.0          56.5

Este análisis estudia si la esperanza de vida por sexo es un predictor lineal de la esperanza de vida total.

Explicación del modelo

En este estudio utilizamos un modelo de regresión lineal simple para evaluar si la esperanza de vida de hombres y de mujeres predice la esperanza de vida total (ambos sexos). En este tipo de modelo se analiza si una variable independiente (X) explica los cambios en una variable dependiente (Y) mediante la ecuación:

\[Y = \beta_0 + \beta_1 X\] Aplicado a nuestro caso:

Modelo 1: Esperanza de vida total= β0​ + β1​ (esperanza de vida de hombres)

Modelo 2: Esperanza de vida total= β0​ + β1​ (esperanza de vida de mujeres)

Donde:

Si β₁ es positivo y estadísticamente significativo, entonces existe evidencia a favor de nuestras hipótesis:

Este modelo nos permite cuantificar la fuerza y dirección de esas relaciones mediante los coeficientes obtenidos en el análisis.

Hipótesis a evaluar

Se evaluarán dos hipótesis, cada una mediante un modelo de regresión lineal simple.

Hipótesis 1

La esperanza de vida de hombres predice positivamente la esperanza de vida total

Dependiente (Y): EV(ambos sexos)

Independiente (X): EV(hombres)

Se espera una relación positiva.

Paso 1. correlación y dispersión

plot(data$`EV(hombres)`, data$`EV(ambos sexos)`,
     xlab = "Esperanza de vida hombres",
     ylab = "Esperanza de vida total",
     main = "Relación entre EV hombres y EV total")

Paso 2. Validación del modelo

cor.test(data$`EV(hombres)`, data$`EV(ambos sexos)`)
## 
##  Pearson's product-moment correlation
## 
## data:  data$`EV(hombres)` and data$`EV(ambos sexos)`
## t = 104.52, df = 197, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.9882464 0.9932692
## sample estimates:
##      cor 
## 0.991104

Existe una correlación positiva y extremadamente fuerte entre la esperanza de vida de los hombres y la esperanza de vida total (r = 0.991,p < 0.001). Esto significa que, en los países analizados, cuando aumenta la esperanza de vida masculina, también aumenta de forma muy consistente la esperanza de vida general.

modelo1 <- lm(`EV(ambos sexos)` ~ `EV(hombres)`, data = data)
summary(modelo1)
## 
## Call:
## lm(formula = `EV(ambos sexos)` ~ `EV(hombres)`, data = data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -2.4028 -0.6220 -0.1077  0.5263  3.2449 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   2.865672   0.681782   4.203 3.99e-05 ***
## `EV(hombres)` 0.996286   0.009532 104.522  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.9394 on 197 degrees of freedom
## Multiple R-squared:  0.9823, Adjusted R-squared:  0.9822 
## F-statistic: 1.092e+04 on 1 and 197 DF,  p-value: < 2.2e-16
  • El p-value del modelo completo es < 2.2e-16

  • El p-value del coeficiente EV(hombres) también es < 2e-16

El modelo es estadísticamente válido porque la relación entre la esperanza de vida de hombres y la esperanza de vida total no es producto del azar (p-value extremadamente pequeño). Además, los errores del modelo son bajos y se distribuyen alrededor de cero, lo que indica que las predicciones del modelo son confiables. Por lo tanto, el modelo lineal puede ser utilizado para explicar y predecir la esperanza de vida total a partir de la masculina.

Paso 3. Bondad de ajuste

El modelo muestra:

  • Multiple R-squared: 0.9823

  • Adjusted R-squared: 0.9822

Esto significa que el 98.23 % de la variación en la esperanza de vida total se explica por la esperanza de vida de hombres.

Esto implica:

  • El modelo tiene un ajuste excelente.

  • La relación es casi perfectamente lineal.

  • EV(hombres) predice extremadamente fuerte la EV(ambos sexos).

Paso 4. Interpretación de los coeficientes

Coeficiente Estimate Interpretación
Intercept 2.8657 La EV total sería aproximadamente 2.86 años si la EV masculina fuera 0. No es interpretable en la realidad.
EV(hombres) 0.9963 Por cada año adicional de esperanza de vida masculina, la esperanza de vida total aumenta en 0.996 años.

El coeficiente de pendiente (0.996) muestra una relación positiva y casi 1

  • Esto significa que si la EV de los hombres sube en 1 año, la EV total sube casi exactamente 1 año.
  • Esto es coherente porque la EV total incluye la de hombres y mujeres

Paso 5. Ecuación

modelo1$coefficients
##   (Intercept) `EV(hombres)` 
##     2.8656724     0.9962862
2.8656724 +(0.9962862*70)
## [1] 72.60571

Realizando el cálculo manual con los coeficientes estimados, se obtiene que si la esperanza de vida de los hombres es de 70 años, la esperanza de vida total esperada sería aproximadamente 72.61 años.

plot(data$`EV(hombres)`, data$`EV(ambos sexos)`,
     xlab = "Esperanza de vida hombres",
     ylab = "Esperanza de vida total",
     main = "Relación entre EV hombres y EV total")

abline(modelo1, col="red")

La línea resume la relación entre las dos variables: mientras aumenta la esperanza de vida de los hombres, también aumenta la esperanza de vida total.

Hipótesis 2

A mayor esperanza de vida de las mujeres, mayor será la esperanza de vida general

Dependiente (Y): EV(ambos sexos)

Independiente (X): EV(mujeres)

Se espera una relación positiva.

Paso 1. correlación y dispersión

plot(data$`EV(mujeres)`, data$`EV(ambos sexos)`,
     xlab = "Esperanza de vida mujeres",
     ylab = "Esperanza de vida total",
     main = "Relación entre EV mujeres y EV total")

Paso 2. Validación del modelo

cor.test(data$`EV(mujeres)`, data$`EV(ambos sexos)`)
## 
##  Pearson's product-moment correlation
## 
## data:  data$`EV(mujeres)` and data$`EV(ambos sexos)`
## t = 109.97, df = 197, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.9893675 0.9939127
## sample estimates:
##       cor 
## 0.9919536
modelo2 <- lm(`EV(ambos sexos)` ~ `EV(mujeres)`, data = data)
summary(modelo2)
## 
## Call:
## lm(formula = `EV(ambos sexos)` ~ `EV(mujeres)`, data = data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -3.1475 -0.4712  0.1037  0.5563  2.0728 
## 
## Coefficients:
##                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   -0.539501   0.678819  -0.795    0.428    
## `EV(mujeres)`  0.972686   0.008845 109.973   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.8936 on 197 degrees of freedom
## Multiple R-squared:  0.984,  Adjusted R-squared:  0.9839 
## F-statistic: 1.209e+04 on 1 and 197 DF,  p-value: < 2.2e-16

La correlación entre la esperanza de vida en mujeres y la esperanza de vida total es muy alta (r = 0.9919), positiva y estadísticamente significativa (p < 0.001). Esto indica que cuando la esperanza de vida de las mujeres aumenta, la esperanza de vida total también tiende a aumentar de manera consistente.

Paso 3. Bondad de ajuste

El modelo presenta los siguientes resultados:

  • Multiple R-squared: 0.984

  • Adjusted R-squared: 0.9839

  • Residual standard error: 0.8936

El estadístico R² indica que el 98.4 % de la variabilidad en la esperanza de vida total puede ser explicada por la esperanza de vida de las mujeres. Este nivel de ajuste es extremadamente alto, lo que evidencia que la variable femenina es un predictor muy sólido. Los residuos tienen una magnitud pequeña (≈0.89), lo cual sugiere que las diferencias entre los valores observados y los valores estimados por el modelo son mínimas.

Paso 4. Interpretación de los coeficientes

Coeficiente Estimate
Intercept -0.5395
EV (mujeres) 0.9727
  • Esto indica que por cada año adicional de esperanza de vida en mujeres, la esperanza de vida total aumenta aproximadamente 0.97 años.

  • La relación es positiva, muy fuerte y estadísticamente significativa (p < 0.001).

  • Esto demuestra que la EV de mujeres es un predictor muy sólido de la EV general.

Paso 5. Ecuación

modelo2$coefficients
##   (Intercept) `EV(mujeres)` 
##    -0.5395009     0.9726861
 -0.5395009  + ( 0.9726861 * 75)
## [1] 72.41196

Esto significa que, según el modelo, si un país tiene 75 años de esperanza de vida femenina, se estima que su esperanza de vida total será aproximadamente 72.4 años.

plot(data$`EV(mujeres)`, data$`EV(ambos sexos)`,
     xlab = "Esperanza de vida mujeres",
     ylab = "Esperanza de vida total",
     main = "Relación entre EV mujeres y EV total")

abline(modelo2, col="red")

  • A medida que la esperanza de vida en mujeres aumenta, también aumenta la esperanza de vida total.

  • No hay presencia de valores atípicos extremos o patrones curvos.

Conclusión

Los resultados obtenidos permiten confirmar ambas hipótesis planteadas. Tanto la esperanza de vida de los hombres como la de las mujeres presentan una relación lineal, positiva y altamente significativa con la esperanza de vida total.

Sin embargo, al comparar ambos modelos, se observa que la esperanza de vida en mujeres muestra una relación ligeramente más fuerte, con un ajuste muy similar pero con residuales más pequeños y una correlación marginalmente más alta. Esto indica que, aunque ambos sexos predicen muy bien la esperanza de vida total, la variable femenina lo hace con una precisión ligeramente superior.

En conjunto, el análisis confirma que la esperanza de vida por sexo es un excelente predictor de la esperanza de vida global, y que las diferencias entre los modelos son mínimas pero favorecen a la esperanza de vida en mujeres como el predictor más estable.

Bibliografía

Data Política. (2019, noviembre 28). ¿Qué es regresión lineal? [Video]. YouTube. https://www.youtube.com/watch?v=-p02G7NXlSk

Azua, I. (2025). Life expectancy [Base de datos]. Kaggle. https://www.kaggle.com/datasets/ignacioazua/life-expectancy