Base de datos: Esperanza de vida de la población mundial
La base de datos escogida ofrece una lista de países clasificados según la esperanza de vida al nacer, que representa el promedio de años que se espera que viva un recién nacido con las tasas de mortalidad actuales. Incluye cifras de esperanza de vida a nivel mundial, regional y nacional, con datos separados para hombres y mujeres. El conjunto de datos destaca las disparidades en la longevidad entre países, siendo países como Hong Kong, Japón y Corea del Sur los que presentan las mayores esperanzas de vida. Estos datos sirven como un indicador clave de la salud pública, la calidad de vida y la eficacia de la atención médica, ofreciendo información valiosa para los responsables políticos, investigadores y organizaciones sanitarias mundiales. (Azua, 2025)
head(data)
## # A tibble: 6 × 4
## pais `EV(mujeres)` `EV(ambos sexos)` `EV(hombres)`
## <chr> <dbl> <dbl> <dbl>
## 1 Chad 57.2 55.2 53.4
## 2 Nigeria 54.9 54.6 54.3
## 3 South Sudan 60.8 57.7 54.8
## 4 Lesotho 60.4 57.8 55.0
## 5 Central African Republic 59.6 57.7 55.5
## 6 Somalia 61.6 59.0 56.5
Este análisis estudia si la esperanza de vida por sexo es un predictor lineal de la esperanza de vida total.
En este estudio utilizamos un modelo de regresión lineal simple para evaluar si la esperanza de vida de hombres y de mujeres predice la esperanza de vida total (ambos sexos). En este tipo de modelo se analiza si una variable independiente (X) explica los cambios en una variable dependiente (Y) mediante la ecuación:
\[Y = \beta_0 + \beta_1 X\] Aplicado a nuestro caso:
Modelo 1: Esperanza de vida total= β0 + β1 (esperanza de vida de hombres)
Modelo 2: Esperanza de vida total= β0 + β1 (esperanza de vida de mujeres)
Donde:
β₀ (intercepto): valor estimado de la esperanza de vida total cuando la esperanza de vida de hombres o mujeres es cero.
β₁ (pendiente): indica cuánto aumenta la esperanza de vida total cuando la esperanza de vida masculina o femenina aumenta en 1 año.
Si β₁ es positivo y estadísticamente significativo, entonces existe evidencia a favor de nuestras hipótesis:
H1: “A mayor esperanza de vida en hombres, mayor esperanza de vida total.”
H2: “A mayor esperanza de vida en mujeres, mayor esperanza de vida total.”
Este modelo nos permite cuantificar la fuerza y dirección de esas relaciones mediante los coeficientes obtenidos en el análisis.
Se evaluarán dos hipótesis, cada una mediante un modelo de regresión lineal simple.
La esperanza de vida de hombres predice positivamente la esperanza de vida total
Dependiente (Y): EV(ambos sexos)
Independiente (X): EV(hombres)
Se espera una relación positiva.
plot(data$`EV(hombres)`, data$`EV(ambos sexos)`,
xlab = "Esperanza de vida hombres",
ylab = "Esperanza de vida total",
main = "Relación entre EV hombres y EV total")
cor.test(data$`EV(hombres)`, data$`EV(ambos sexos)`)
##
## Pearson's product-moment correlation
##
## data: data$`EV(hombres)` and data$`EV(ambos sexos)`
## t = 104.52, df = 197, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.9882464 0.9932692
## sample estimates:
## cor
## 0.991104
Existe una correlación positiva y extremadamente fuerte entre la esperanza de vida de los hombres y la esperanza de vida total (r = 0.991,p < 0.001). Esto significa que, en los países analizados, cuando aumenta la esperanza de vida masculina, también aumenta de forma muy consistente la esperanza de vida general.
modelo1 <- lm(`EV(ambos sexos)` ~ `EV(hombres)`, data = data)
summary(modelo1)
##
## Call:
## lm(formula = `EV(ambos sexos)` ~ `EV(hombres)`, data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -2.4028 -0.6220 -0.1077 0.5263 3.2449
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 2.865672 0.681782 4.203 3.99e-05 ***
## `EV(hombres)` 0.996286 0.009532 104.522 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.9394 on 197 degrees of freedom
## Multiple R-squared: 0.9823, Adjusted R-squared: 0.9822
## F-statistic: 1.092e+04 on 1 and 197 DF, p-value: < 2.2e-16
El p-value del modelo completo es < 2.2e-16
El p-value del coeficiente EV(hombres) también es < 2e-16
El modelo es estadísticamente válido porque la relación entre la esperanza de vida de hombres y la esperanza de vida total no es producto del azar (p-value extremadamente pequeño). Además, los errores del modelo son bajos y se distribuyen alrededor de cero, lo que indica que las predicciones del modelo son confiables. Por lo tanto, el modelo lineal puede ser utilizado para explicar y predecir la esperanza de vida total a partir de la masculina.
El modelo muestra:
Multiple R-squared: 0.9823
Adjusted R-squared: 0.9822
Esto significa que el 98.23 % de la variación en la esperanza de vida total se explica por la esperanza de vida de hombres.
Esto implica:
El modelo tiene un ajuste excelente.
La relación es casi perfectamente lineal.
EV(hombres) predice extremadamente fuerte la EV(ambos sexos).
| Coeficiente | Estimate | Interpretación |
|---|---|---|
| Intercept | 2.8657 | La EV total sería aproximadamente 2.86 años si la EV masculina fuera 0. No es interpretable en la realidad. |
| EV(hombres) | 0.9963 | Por cada año adicional de esperanza de vida masculina, la esperanza de vida total aumenta en 0.996 años. |
El coeficiente de pendiente (0.996) muestra una relación positiva y casi 1
modelo1$coefficients
## (Intercept) `EV(hombres)`
## 2.8656724 0.9962862
2.8656724 +(0.9962862*70)
## [1] 72.60571
Realizando el cálculo manual con los coeficientes estimados, se obtiene que si la esperanza de vida de los hombres es de 70 años, la esperanza de vida total esperada sería aproximadamente 72.61 años.
plot(data$`EV(hombres)`, data$`EV(ambos sexos)`,
xlab = "Esperanza de vida hombres",
ylab = "Esperanza de vida total",
main = "Relación entre EV hombres y EV total")
abline(modelo1, col="red")
La línea resume la relación entre las dos variables: mientras aumenta la esperanza de vida de los hombres, también aumenta la esperanza de vida total.
A mayor esperanza de vida de las mujeres, mayor será la esperanza de vida general
Dependiente (Y): EV(ambos sexos)
Independiente (X): EV(mujeres)
Se espera una relación positiva.
plot(data$`EV(mujeres)`, data$`EV(ambos sexos)`,
xlab = "Esperanza de vida mujeres",
ylab = "Esperanza de vida total",
main = "Relación entre EV mujeres y EV total")
cor.test(data$`EV(mujeres)`, data$`EV(ambos sexos)`)
##
## Pearson's product-moment correlation
##
## data: data$`EV(mujeres)` and data$`EV(ambos sexos)`
## t = 109.97, df = 197, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.9893675 0.9939127
## sample estimates:
## cor
## 0.9919536
modelo2 <- lm(`EV(ambos sexos)` ~ `EV(mujeres)`, data = data)
summary(modelo2)
##
## Call:
## lm(formula = `EV(ambos sexos)` ~ `EV(mujeres)`, data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -3.1475 -0.4712 0.1037 0.5563 2.0728
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -0.539501 0.678819 -0.795 0.428
## `EV(mujeres)` 0.972686 0.008845 109.973 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.8936 on 197 degrees of freedom
## Multiple R-squared: 0.984, Adjusted R-squared: 0.9839
## F-statistic: 1.209e+04 on 1 and 197 DF, p-value: < 2.2e-16
La correlación entre la esperanza de vida en mujeres y la esperanza de vida total es muy alta (r = 0.9919), positiva y estadísticamente significativa (p < 0.001). Esto indica que cuando la esperanza de vida de las mujeres aumenta, la esperanza de vida total también tiende a aumentar de manera consistente.
El modelo presenta los siguientes resultados:
Multiple R-squared: 0.984
Adjusted R-squared: 0.9839
Residual standard error: 0.8936
El estadístico R² indica que el 98.4 % de la variabilidad en la esperanza de vida total puede ser explicada por la esperanza de vida de las mujeres. Este nivel de ajuste es extremadamente alto, lo que evidencia que la variable femenina es un predictor muy sólido. Los residuos tienen una magnitud pequeña (≈0.89), lo cual sugiere que las diferencias entre los valores observados y los valores estimados por el modelo son mínimas.
| Coeficiente | Estimate |
|---|---|
| Intercept | -0.5395 |
| EV (mujeres) | 0.9727 |
Esto indica que por cada año adicional de esperanza de vida en mujeres, la esperanza de vida total aumenta aproximadamente 0.97 años.
La relación es positiva, muy fuerte y estadísticamente significativa (p < 0.001).
Esto demuestra que la EV de mujeres es un predictor muy sólido de la EV general.
modelo2$coefficients
## (Intercept) `EV(mujeres)`
## -0.5395009 0.9726861
-0.5395009 + ( 0.9726861 * 75)
## [1] 72.41196
Esto significa que, según el modelo, si un país tiene 75 años de esperanza de vida femenina, se estima que su esperanza de vida total será aproximadamente 72.4 años.
plot(data$`EV(mujeres)`, data$`EV(ambos sexos)`,
xlab = "Esperanza de vida mujeres",
ylab = "Esperanza de vida total",
main = "Relación entre EV mujeres y EV total")
abline(modelo2, col="red")
A medida que la esperanza de vida en mujeres aumenta, también aumenta la esperanza de vida total.
No hay presencia de valores atípicos extremos o patrones curvos.
Los resultados obtenidos permiten confirmar ambas hipótesis planteadas. Tanto la esperanza de vida de los hombres como la de las mujeres presentan una relación lineal, positiva y altamente significativa con la esperanza de vida total.
Sin embargo, al comparar ambos modelos, se observa que la esperanza de vida en mujeres muestra una relación ligeramente más fuerte, con un ajuste muy similar pero con residuales más pequeños y una correlación marginalmente más alta. Esto indica que, aunque ambos sexos predicen muy bien la esperanza de vida total, la variable femenina lo hace con una precisión ligeramente superior.
En conjunto, el análisis confirma que la esperanza de vida por sexo es un excelente predictor de la esperanza de vida global, y que las diferencias entre los modelos son mínimas pero favorecen a la esperanza de vida en mujeres como el predictor más estable.
Data Política. (2019, noviembre 28). ¿Qué es regresión lineal? [Video]. YouTube. https://www.youtube.com/watch?v=-p02G7NXlSk
Azua, I. (2025). Life expectancy [Base de datos]. Kaggle. https://www.kaggle.com/datasets/ignacioazua/life-expectancy