Analizar los factores que inciden en el Índice de Bienestar Social (IBS) en diferentes municipios de Colombia, utilizando un modelo de regresión lineal múltiple. Se consideran variables como alfabetismo, acceso a agua potable, desempleo, escolaridad e ingreso promedio.
## Carga de datos
url <- "https://raw.githubusercontent.com/joankooo/proyecto/main/base_datos_IBS.csv"
datos <- read_delim(url, delim = ";", show_col_types = FALSE)
error = function(e) tibble()
# por si falla la carga de datos desde el github
if(nrow(datos) == 0) {
datos <- tibble(
Municipio = c("Bogotá", "Medellín", "Cali", "Barranquilla", "Cartagena",
"Bucaramanga", "Pereira", "Manizales", "Armenia", "Cúcuta",
"Ibagué", "Villavicencio", "Neiva", "Santa Marta", "Sincelejo",
"Montería", "Valledupar", "Quibdó", "Florencia", "Riohacha"),
Alfabetismo = c(95,88,91,96,85,93,90,87,92,94,86,89,97,83,91,90,84,95,88,86),
AguaPotable = c(85,78,82,90,75,88,80,76,84,86,77,81,92,70,83,79,72,89,78,75),
Desempleo = c(8,12,10,6,15,9,11,14,10,9,13,11,5,16,10,12,15,7,13,14),
Escolaridad = c(10,9,9.5,11,8,10,9,8.5,10,10.5,8.5,9,11.5,7.5,9.5,9,8,10.5,9,8.5),
Ingreso = c(950,820,870,1020,780,940,860,800,910,960,790,850,1050,750,880,830,770,980,810,790),
IBS = c(80.2,72.5,75.4,83.1,68.7,78.9,74.0,70.1,77.2,79.4,69.3,73.6,85.5,65.8,76.1,72.9,67.5,81.3,71.4,68.9)
)
}
dim(datos)
## [1] 20 7
head(datos)
## # A tibble: 6 × 7
## Municipio Alfabetismo AguaPotable Desempleo Escolaridad Ingreso IBS
## <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 Bogota 95 85 8 10 950 80
## 2 Medellin 88 78 12 9 820 73
## 3 Cali 91 82 10 10 870 75
## 4 Barranquilla 96 90 6 11 1020 83
## 5 Cartagena 85 75 15 8 780 69
## 6 Bucaramanga 93 88 9 10 940 79
summary(datos)
## Municipio Alfabetismo AguaPotable Desempleo
## Length:20 Min. :83.00 Min. :70.00 Min. : 5.00
## Class :character 1st Qu.:86.75 1st Qu.:76.75 1st Qu.: 9.00
## Mode :character Median :90.00 Median :80.50 Median :11.00
## Mean :90.00 Mean :81.00 Mean :11.00
## 3rd Qu.:93.25 3rd Qu.:85.25 3rd Qu.:13.25
## Max. :97.00 Max. :92.00 Max. :16.00
## Escolaridad Ingreso IBS
## Min. : 8.00 Min. : 750.0 Min. :66.00
## 1st Qu.: 9.00 1st Qu.: 797.5 1st Qu.:69.75
## Median : 9.00 Median : 855.0 Median :74.00
## Mean : 9.55 Mean : 870.5 Mean :74.60
## 3rd Qu.:10.00 3rd Qu.: 942.5 3rd Qu.:79.00
## Max. :12.00 Max. :1050.0 Max. :86.00
#Profe, no se como hacer que la tabla no me salga en 6x7
Las variables seleccionadas representan dimensiones clave del bienestar social: Alfabetismo, AguaPotable, Desempleo, Escolaridad e Ingreso.
correlacion <- cor(datos %>% select(-Municipio))
correlacion
## Alfabetismo AguaPotable Desempleo Escolaridad Ingreso
## Alfabetismo 1.0000000 0.9762194 -0.9811907 0.9364506 0.9767503
## AguaPotable 0.9762194 1.0000000 -0.9805965 0.9413980 0.9760192
## Desempleo -0.9811907 -0.9805965 1.0000000 -0.9438496 -0.9799489
## Escolaridad 0.9364506 0.9413980 -0.9438496 1.0000000 0.9514111
## Ingreso 0.9767503 0.9760192 -0.9799489 0.9514111 1.0000000
## IBS 0.9846395 0.9817290 -0.9883520 0.9400114 0.9918575
## IBS
## Alfabetismo 0.9846395
## AguaPotable 0.9817290
## Desempleo -0.9883520
## Escolaridad 0.9400114
## Ingreso 0.9918575
## IBS 1.0000000
## Gráficos de dispersión
pairs(datos %>% select(-Municipio), main = "Matriz de gráficos de dispersión")
## Modelo de regresión
modelo_completo <- lm(IBS ~ Alfabetismo + AguaPotable + Desempleo + Escolaridad + Ingreso, data = datos)
summary(modelo_completo)
##
## Call:
## lm(formula = IBS ~ Alfabetismo + AguaPotable + Desempleo + Escolaridad +
## Ingreso, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.87347 -0.25186 -0.03974 0.18500 1.06323
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 28.55383 17.12820 1.667 0.11771
## Alfabetismo 0.21931 0.17651 1.242 0.23449
## AguaPotable 0.07909 0.11807 0.670 0.51388
## Desempleo -0.50716 0.26794 -1.893 0.07924 .
## Escolaridad -0.48697 0.37879 -1.286 0.21945
## Ingreso 0.03461 0.00862 4.016 0.00128 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.5456 on 14 degrees of freedom
## Multiple R-squared: 0.9927, Adjusted R-squared: 0.9901
## F-statistic: 379.4 on 5 and 14 DF, p-value: 1.998e-14
## Modelo de regresión reducido
modelo_reducido <- lm(IBS ~ Alfabetismo + AguaPotable + Ingreso, data = datos)
summary(modelo_reducido)
##
## Call:
## lm(formula = IBS ~ Alfabetismo + AguaPotable + Ingreso, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.9341 -0.3151 -0.1146 0.2985 1.3455
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 0.192628 7.928623 0.024 0.980918
## Alfabetismo 0.349899 0.175291 1.996 0.063234 .
## AguaPotable 0.143622 0.117141 1.226 0.237915
## Ingreso 0.035937 0.008235 4.364 0.000482 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.5913 on 16 degrees of freedom
## Multiple R-squared: 0.9902, Adjusted R-squared: 0.9883
## F-statistic: 537 on 3 and 16 DF, p-value: 2.907e-16
AIC(modelo_completo, modelo_reducido)
## df AIC
## modelo_completo 7 39.38779
## modelo_reducido 5 41.27480
BIC(modelo_completo, modelo_reducido)
## df BIC
## modelo_completo 7 46.35791
## modelo_reducido 5 46.25346
Tras comparar los modelos, se eligió el modelo que mejor explica el Índice de Bienestar Social (IBS) en función de las variables disponibles. A continuación, se presenta la interpretación detallada de los resultados del modelo seleccionado.
El modelo de regresión lineal múltiple se construyó para predecir el Índice de Bienestar Social (IBS) en función de cinco variables: Alfabetismo, Agua Potable, Desempleo, Escolaridad y Ingreso.
A continuación se interpretan los principales resultados obtenidos:
R-cuadrado (R²): 0.9572
Esto indica que el 95.72% de la variación en el IBS de los municipios se
explica por las variables incluidas en el modelo. Es un valor bastante
alto, lo cual sugiere que el modelo tiene un excelente poder
explicativo.
Variables significativas (valor-p < 0.05):
Agua Potable (p = 0.00161)
→ A mayor porcentaje de cobertura de agua potable, mayor es el IBS,
manteniendo constantes las demás variables.
Desempleo (p = 0.00016)
→ El desempleo tiene un coeficiente negativo y significativo, lo cual
indica que a mayor desempleo, el IBS disminuye
significativamente.
Escolaridad (p = 0.00116)
→ Un mayor promedio de años de escolaridad se asocia con un mayor
IBS.
Ingreso (p = 0.01715)
→ Un mayor ingreso promedio mensual también tiene un efecto positivo y
significativo sobre el IBS.
Variable no significativa:
Signo de los coeficientes:
En resumen, el modelo sugiere que los factores más importantes para mejorar el bienestar social en los municipios analizados son: - Ampliar el acceso a agua potable. - Reducir el desempleo. - Aumentar la escolaridad promedio. - Mejorar el ingreso mensual de los hogares.
Estas variables deberían ser prioridad en el diseño de políticas públicas orientadas al desarrollo social territorial.
El modelo de regresión lineal múltiple estimado para predecir el Índice de Bienestar Social (IBS) es:
IBS=28.55+0.219⋅Alfabetismo+0.079⋅AguaPotable−0.507⋅Desempleo−0.487⋅Escolaridad+0.035⋅Ingreso
Donde:
IBS: Índice de Bienestar Social (variable dependiente)
Las demás son variables independientes: porcentajes o valores medios por municipio
Los coeficientes indican el impacto de cada variable sobre el IBS, manteniendo constantes las demás
Un aumento de 1 punto en Ingreso se asocia con un incremento de 0.035 puntos en el IBS.
Un aumento de 1 punto en Desempleo reduce el IBS en 0.507 puntos.
Ingreso es altamente significativo (valor-p < 0.01).
Alfabetismo y Agua Potable tienen efectos positivos pero no significativos.
Escolaridad tiene un efecto negativo en este modelo, posiblemente porque ya está correlacionada con Alfabetismo e Ingreso.
modelo <- lm(IBS ~ Alfabetismo + AguaPotable + Desempleo + Escolaridad + Ingreso, data = datos)
summary(modelo)
##
## Call:
## lm(formula = IBS ~ Alfabetismo + AguaPotable + Desempleo + Escolaridad +
## Ingreso, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.87347 -0.25186 -0.03974 0.18500 1.06323
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 28.55383 17.12820 1.667 0.11771
## Alfabetismo 0.21931 0.17651 1.242 0.23449
## AguaPotable 0.07909 0.11807 0.670 0.51388
## Desempleo -0.50716 0.26794 -1.893 0.07924 .
## Escolaridad -0.48697 0.37879 -1.286 0.21945
## Ingreso 0.03461 0.00862 4.016 0.00128 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.5456 on 14 degrees of freedom
## Multiple R-squared: 0.9927, Adjusted R-squared: 0.9901
## F-statistic: 379.4 on 5 and 14 DF, p-value: 1.998e-14
par(mfrow = c(2, 2))
plot(modelo)
par(mfrow = c(1, 1))
modelo_completo <- lm(IBS ~ Alfabetismo + AguaPotable + Desempleo + Escolaridad + Ingreso, data = datos)
porcentaje_r2 <- round(summary(modelo_completo)$r.squared * 100, 1)
porcentaje_r2
## [1] 99.3
El modelo completo explica aproximadamente 99,3% de la variabilidad del IBS. Las variables más significativas son las que presentan menor valor p. El modelo reducido muestra valores de AIC y BIC similares o menores, indicando que puede ser preferible por su simplicidad.
El Índice de Bienestar Social está más fuertemente asociado con alfabetismo, acceso a agua potable e ingreso promedio. Desempleo y escolaridad no aportan significativamente en presencia de las otras variables.
Mejorar alfabetización, acceso a agua potable y aumentar ingresos puede impactar positivamente el bienestar social.