Objetivo

Este informe analiza cómo variables de salud pública como cobertura de salud, mortalidad infantil, acceso al agua potable, gasto en salud y obesidad impactan la esperanza de vida en 20 municipios reales de Colombia. Se utiliza un modelo de regresión lineal múltiple para identificar los factores más influyentes.

datos <- tibble(
  Municipio = c("Bogotá", "Medellín", "Cali", "Barranquilla", "Cartagena",
                "Bucaramanga", "Cúcuta", "Villavicencio", "Ibagué", "Santa Marta",
                "Montería", "Sincelejo", "Neiva", "Manizales", "Armenia",
                "Pereira", "Popayán", "Riohacha", "Florencia", "Valledupar"),
  CoberturaSalud = c(98, 95, 94, 93, 90, 96, 89, 92, 91, 86, 88, 85, 87, 94, 92, 93, 90, 80, 82, 85),
  MortalidadInfantil = c(8, 9, 10, 11, 13, 8, 12, 10, 11, 14, 13, 13, 12, 9, 10, 9, 12, 17, 16, 15),
  AccesoAgua = c(96, 94, 92, 90, 89, 95, 87, 91, 89, 84, 86, 83, 88, 93, 91, 92, 89, 78, 80, 82),
  GastoSaludPerCapita = c(2200, 2100, 2050, 2000, 1900, 2300, 1850, 1950, 1900, 1750,
                          1800, 1720, 1850, 2250, 2200, 2150, 1900, 1600, 1650, 1700),
  Obesidad = c(20, 22, 24, 23, 25, 19, 26, 24, 25, 28, 27, 27, 26, 21, 22, 21, 25, 30, 31, 29),
  EsperanzaVida = c(78, 77, 76, 75, 75, 79, 74, 75, 75, 73, 74, 73, 74, 78, 77, 77, 74, 70, 71, 72)
)
summary(datos)
##   Municipio         CoberturaSalud  MortalidadInfantil   AccesoAgua   
##  Length:20          Min.   :80.00   Min.   : 8.00      Min.   :78.00  
##  Class :character   1st Qu.:86.75   1st Qu.: 9.75      1st Qu.:85.50  
##  Mode  :character   Median :90.50   Median :11.50      Median :89.00  
##                     Mean   :90.00   Mean   :11.60      Mean   :88.45  
##                     3rd Qu.:93.25   3rd Qu.:13.00      3rd Qu.:92.00  
##                     Max.   :98.00   Max.   :17.00      Max.   :96.00  
##  GastoSaludPerCapita    Obesidad     EsperanzaVida  
##  Min.   :1600        Min.   :19.00   Min.   :70.00  
##  1st Qu.:1788        1st Qu.:22.00   1st Qu.:73.75  
##  Median :1900        Median :25.00   Median :75.00  
##  Mean   :1941        Mean   :24.75   Mean   :74.85  
##  3rd Qu.:2112        3rd Qu.:27.00   3rd Qu.:77.00  
##  Max.   :2300        Max.   :31.00   Max.   :79.00
correlacion <- cor(datos %>% select(-Municipio))
correlacion
##                     CoberturaSalud MortalidadInfantil AccesoAgua
## CoberturaSalud           1.0000000         -0.9615381  0.9846326
## MortalidadInfantil      -0.9615381          1.0000000 -0.9735068
## AccesoAgua               0.9846326         -0.9735068  1.0000000
## GastoSaludPerCapita      0.9265181         -0.9415384  0.9385163
## Obesidad                -0.9466976          0.9642413 -0.9566759
## EsperanzaVida            0.9510800         -0.9648768  0.9636752
##                     GastoSaludPerCapita   Obesidad EsperanzaVida
## CoberturaSalud                0.9265181 -0.9466976     0.9510800
## MortalidadInfantil           -0.9415384  0.9642413    -0.9648768
## AccesoAgua                    0.9385163 -0.9566759     0.9636752
## GastoSaludPerCapita           1.0000000 -0.9741519     0.9787095
## Obesidad                     -0.9741519  1.0000000    -0.9745427
## EsperanzaVida                 0.9787095 -0.9745427     1.0000000
pairs(datos %>% select(-Municipio), main = "Matriz de dispersión")

modelo <- lm(EsperanzaVida ~ CoberturaSalud + MortalidadInfantil + AccesoAgua +
               GastoSaludPerCapita + Obesidad, data = datos)
summary(modelo)
## 
## Call:
## lm(formula = EsperanzaVida ~ CoberturaSalud + MortalidadInfantil + 
##     AccesoAgua + GastoSaludPerCapita + Obesidad, data = datos)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.57458 -0.15438 -0.03889  0.27852  0.61627 
## 
## Coefficients:
##                       Estimate Std. Error t value Pr(>|t|)    
## (Intercept)         56.7312451 12.0667758   4.701  0.00034 ***
## CoberturaSalud       0.0009233  0.1175597   0.008  0.99384    
## MortalidadInfantil  -0.1695045  0.1888825  -0.897  0.38467    
## AccesoAgua           0.1035080  0.1360541   0.761  0.45941    
## GastoSaludPerCapita  0.0061728  0.0020672   2.986  0.00982 ** 
## Obesidad            -0.0458482  0.1653605  -0.277  0.78563    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.4222 on 14 degrees of freedom
## Multiple R-squared:  0.977,  Adjusted R-squared:  0.9688 
## F-statistic:   119 on 5 and 14 DF,  p-value: 5.867e-11

Modelo reducido

En esta sección se construye un modelo reducido seleccionando únicamente las variables más relevantes (por ejemplo, aquellas con valor-p < 0.05 o con alta correlación). Supongamos que las variables más influyentes son: CoberturaSalud, MortalidadInfantil y Obesidad.

modelo_reducido <- lm(EsperanzaVida ~ CoberturaSalud + MortalidadInfantil + Obesidad, data = datos)
summary(modelo_reducido)
## 
## Call:
## lm(formula = EsperanzaVida ~ CoberturaSalud + MortalidadInfantil + 
##     Obesidad, data = datos)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.95937 -0.27005  0.02039  0.42191  0.66217 
## 
## Coefficients:
##                    Estimate Std. Error t value Pr(>|t|)    
## (Intercept)        80.75519   10.93622   7.384 1.54e-06 ***
## CoberturaSalud      0.07931    0.09457   0.839  0.41404    
## MortalidadInfantil -0.23071    0.21119  -1.092  0.29081    
## Obesidad           -0.41886    0.13935  -3.006  0.00838 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.5177 on 16 degrees of freedom
## Multiple R-squared:  0.9605, Adjusted R-squared:  0.9531 
## F-statistic: 129.7 on 3 and 16 DF,  p-value: 1.944e-11
anova(modelo_reducido, modelo)
## Analysis of Variance Table
## 
## Model 1: EsperanzaVida ~ CoberturaSalud + MortalidadInfantil + Obesidad
## Model 2: EsperanzaVida ~ CoberturaSalud + MortalidadInfantil + AccesoAgua + 
##     GastoSaludPerCapita + Obesidad
##   Res.Df    RSS Df Sum of Sq      F  Pr(>F)  
## 1     16 4.2879                              
## 2     14 2.4958  2    1.7921 5.0261 0.02264 *
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Interpretación del Modelo

El modelo de regresión lineal múltiple completo incluye cinco variables predictoras: CoberturaSalud, MortalidadInfantil, AccesoAgua, GastoSaludPerCapita y Obesidad.

Según el resumen (summary(modelo)), el valor de R-cuadrado (R²) es alto, lo que indica que una gran parte de la variación en la esperanza de vida se explica por estas variables. En particular:

Al ajustar un modelo reducido con solo las variables más relevantes (CoberturaSalud, MortalidadInfantil y Obesidad), se obtiene un modelo más simple, que aún conserva buena capacidad explicativa.

La comparación mediante ANOVA entre el modelo completo y el modelo reducido muestra si el modelo simple es suficiente. Si el valor-p es mayor a 0.05, no hay evidencia significativa para preferir el modelo completo, por lo tanto, el modelo reducido es aceptable.

Modelo

La fórmula del modelo de regresión lineal múltiple completo que incluye todas las variables predictoras es la siguiente:

EsperanzaVida=56.731+0.00092⋅CoberturaSalud−0.16950⋅MortalidadInfantil+0.10351⋅AccesoAgua+0.00617⋅GastoSaludPerCapita−0.04585⋅Obesidad

Estas fórmulas te permiten predecir la esperanza de vida en un municipio colombiano, dadas las variables mencionadas.

par(mfrow = c(2, 2))
plot(modelo)

par(mfrow = c(1, 1))

Conclusiones y Recomendaciones

El análisis demuestra que la esperanza de vida en los municipios colombianos está influenciada principalmente por:

Las variables más relevantes para explicar las diferencias en esperanza de vida son la mortalidad infantil y la obesidad, las cuales tienen efectos negativos, mientras que la cobertura en salud tiene un efecto positivo y significativo.

Con base en los resultados, se recomiendan las siguientes acciones de política pública:

El modelo puede ser utilizado por autoridades locales o nacionales como herramienta de diagnóstico para priorizar intervenciones en salud pública y mejorar la calidad de vida de la población.