Este informe analiza cómo variables de salud pública como cobertura de salud, mortalidad infantil, acceso al agua potable, gasto en salud y obesidad impactan la esperanza de vida en 20 municipios reales de Colombia. Se utiliza un modelo de regresión lineal múltiple para identificar los factores más influyentes.
datos <- tibble(
Municipio = c("Bogotá", "Medellín", "Cali", "Barranquilla", "Cartagena",
"Bucaramanga", "Cúcuta", "Villavicencio", "Ibagué", "Santa Marta",
"Montería", "Sincelejo", "Neiva", "Manizales", "Armenia",
"Pereira", "Popayán", "Riohacha", "Florencia", "Valledupar"),
CoberturaSalud = c(98, 95, 94, 93, 90, 96, 89, 92, 91, 86, 88, 85, 87, 94, 92, 93, 90, 80, 82, 85),
MortalidadInfantil = c(8, 9, 10, 11, 13, 8, 12, 10, 11, 14, 13, 13, 12, 9, 10, 9, 12, 17, 16, 15),
AccesoAgua = c(96, 94, 92, 90, 89, 95, 87, 91, 89, 84, 86, 83, 88, 93, 91, 92, 89, 78, 80, 82),
GastoSaludPerCapita = c(2200, 2100, 2050, 2000, 1900, 2300, 1850, 1950, 1900, 1750,
1800, 1720, 1850, 2250, 2200, 2150, 1900, 1600, 1650, 1700),
Obesidad = c(20, 22, 24, 23, 25, 19, 26, 24, 25, 28, 27, 27, 26, 21, 22, 21, 25, 30, 31, 29),
EsperanzaVida = c(78, 77, 76, 75, 75, 79, 74, 75, 75, 73, 74, 73, 74, 78, 77, 77, 74, 70, 71, 72)
)
summary(datos)
## Municipio CoberturaSalud MortalidadInfantil AccesoAgua
## Length:20 Min. :80.00 Min. : 8.00 Min. :78.00
## Class :character 1st Qu.:86.75 1st Qu.: 9.75 1st Qu.:85.50
## Mode :character Median :90.50 Median :11.50 Median :89.00
## Mean :90.00 Mean :11.60 Mean :88.45
## 3rd Qu.:93.25 3rd Qu.:13.00 3rd Qu.:92.00
## Max. :98.00 Max. :17.00 Max. :96.00
## GastoSaludPerCapita Obesidad EsperanzaVida
## Min. :1600 Min. :19.00 Min. :70.00
## 1st Qu.:1788 1st Qu.:22.00 1st Qu.:73.75
## Median :1900 Median :25.00 Median :75.00
## Mean :1941 Mean :24.75 Mean :74.85
## 3rd Qu.:2112 3rd Qu.:27.00 3rd Qu.:77.00
## Max. :2300 Max. :31.00 Max. :79.00
correlacion <- cor(datos %>% select(-Municipio))
correlacion
## CoberturaSalud MortalidadInfantil AccesoAgua
## CoberturaSalud 1.0000000 -0.9615381 0.9846326
## MortalidadInfantil -0.9615381 1.0000000 -0.9735068
## AccesoAgua 0.9846326 -0.9735068 1.0000000
## GastoSaludPerCapita 0.9265181 -0.9415384 0.9385163
## Obesidad -0.9466976 0.9642413 -0.9566759
## EsperanzaVida 0.9510800 -0.9648768 0.9636752
## GastoSaludPerCapita Obesidad EsperanzaVida
## CoberturaSalud 0.9265181 -0.9466976 0.9510800
## MortalidadInfantil -0.9415384 0.9642413 -0.9648768
## AccesoAgua 0.9385163 -0.9566759 0.9636752
## GastoSaludPerCapita 1.0000000 -0.9741519 0.9787095
## Obesidad -0.9741519 1.0000000 -0.9745427
## EsperanzaVida 0.9787095 -0.9745427 1.0000000
pairs(datos %>% select(-Municipio), main = "Matriz de dispersión")
modelo <- lm(EsperanzaVida ~ CoberturaSalud + MortalidadInfantil + AccesoAgua +
GastoSaludPerCapita + Obesidad, data = datos)
summary(modelo)
##
## Call:
## lm(formula = EsperanzaVida ~ CoberturaSalud + MortalidadInfantil +
## AccesoAgua + GastoSaludPerCapita + Obesidad, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.57458 -0.15438 -0.03889 0.27852 0.61627
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 56.7312451 12.0667758 4.701 0.00034 ***
## CoberturaSalud 0.0009233 0.1175597 0.008 0.99384
## MortalidadInfantil -0.1695045 0.1888825 -0.897 0.38467
## AccesoAgua 0.1035080 0.1360541 0.761 0.45941
## GastoSaludPerCapita 0.0061728 0.0020672 2.986 0.00982 **
## Obesidad -0.0458482 0.1653605 -0.277 0.78563
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.4222 on 14 degrees of freedom
## Multiple R-squared: 0.977, Adjusted R-squared: 0.9688
## F-statistic: 119 on 5 and 14 DF, p-value: 5.867e-11
En esta sección se construye un modelo reducido seleccionando
únicamente las variables más relevantes (por ejemplo, aquellas con
valor-p < 0.05 o con alta correlación). Supongamos que las variables
más influyentes son: CoberturaSalud,
MortalidadInfantil y Obesidad.
modelo_reducido <- lm(EsperanzaVida ~ CoberturaSalud + MortalidadInfantil + Obesidad, data = datos)
summary(modelo_reducido)
##
## Call:
## lm(formula = EsperanzaVida ~ CoberturaSalud + MortalidadInfantil +
## Obesidad, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.95937 -0.27005 0.02039 0.42191 0.66217
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 80.75519 10.93622 7.384 1.54e-06 ***
## CoberturaSalud 0.07931 0.09457 0.839 0.41404
## MortalidadInfantil -0.23071 0.21119 -1.092 0.29081
## Obesidad -0.41886 0.13935 -3.006 0.00838 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.5177 on 16 degrees of freedom
## Multiple R-squared: 0.9605, Adjusted R-squared: 0.9531
## F-statistic: 129.7 on 3 and 16 DF, p-value: 1.944e-11
anova(modelo_reducido, modelo)
## Analysis of Variance Table
##
## Model 1: EsperanzaVida ~ CoberturaSalud + MortalidadInfantil + Obesidad
## Model 2: EsperanzaVida ~ CoberturaSalud + MortalidadInfantil + AccesoAgua +
## GastoSaludPerCapita + Obesidad
## Res.Df RSS Df Sum of Sq F Pr(>F)
## 1 16 4.2879
## 2 14 2.4958 2 1.7921 5.0261 0.02264 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
El modelo de regresión lineal múltiple completo incluye cinco variables predictoras: CoberturaSalud, MortalidadInfantil, AccesoAgua, GastoSaludPerCapita y Obesidad.
Según el resumen (summary(modelo)), el valor de
R-cuadrado (R²) es alto, lo que indica que una gran
parte de la variación en la esperanza de vida se explica por estas
variables. En particular:
Al ajustar un modelo reducido con solo las variables más relevantes (CoberturaSalud, MortalidadInfantil y Obesidad), se obtiene un modelo más simple, que aún conserva buena capacidad explicativa.
La comparación mediante ANOVA entre el modelo completo y el modelo reducido muestra si el modelo simple es suficiente. Si el valor-p es mayor a 0.05, no hay evidencia significativa para preferir el modelo completo, por lo tanto, el modelo reducido es aceptable.
La fórmula del modelo de regresión lineal múltiple completo que incluye todas las variables predictoras es la siguiente:
EsperanzaVida=56.731+0.00092⋅CoberturaSalud−0.16950⋅MortalidadInfantil+0.10351⋅AccesoAgua+0.00617⋅GastoSaludPerCapita−0.04585⋅Obesidad
Estas fórmulas te permiten predecir la esperanza de vida en un municipio colombiano, dadas las variables mencionadas.
par(mfrow = c(2, 2))
plot(modelo)
par(mfrow = c(1, 1))
El análisis demuestra que la esperanza de vida en los municipios colombianos está influenciada principalmente por:
Las variables más relevantes para explicar las diferencias en esperanza de vida son la mortalidad infantil y la obesidad, las cuales tienen efectos negativos, mientras que la cobertura en salud tiene un efecto positivo y significativo.
Con base en los resultados, se recomiendan las siguientes acciones de política pública:
El modelo puede ser utilizado por autoridades locales o nacionales como herramienta de diagnóstico para priorizar intervenciones en salud pública y mejorar la calidad de vida de la población.