Objetivo.

Analizar los factores que inciden en el Índice de Bienestar Social (IBS) en diferentes municipios de Colombia, utilizando un modelo de regresión lineal múltiple. Se consideran variables como alfabetismo, acceso a agua potable, desempleo, escolaridad e ingreso promedio.

## Carga de datos
url <- "https://raw.githubusercontent.com/joankooo/proyecto/main/base_datos_IBS.csv"
datos <- read_delim(url, delim = ";", show_col_types = FALSE)
  error = function(e) tibble()


# por si falla la carga de datos desde el github
if(nrow(datos) == 0) {
  datos <- tibble(
    Municipio = c("Bogotá", "Medellín", "Cali", "Barranquilla", "Cartagena", 
                  "Bucaramanga", "Pereira", "Manizales", "Armenia", "Cúcuta", 
                  "Ibagué", "Villavicencio", "Neiva", "Santa Marta", "Sincelejo", 
                  "Montería", "Valledupar", "Quibdó", "Florencia", "Riohacha"),
    Alfabetismo = c(95,88,91,96,85,93,90,87,92,94,86,89,97,83,91,90,84,95,88,86),
    AguaPotable = c(85,78,82,90,75,88,80,76,84,86,77,81,92,70,83,79,72,89,78,75),
    Desempleo = c(8,12,10,6,15,9,11,14,10,9,13,11,5,16,10,12,15,7,13,14),
    Escolaridad = c(10,9,9.5,11,8,10,9,8.5,10,10.5,8.5,9,11.5,7.5,9.5,9,8,10.5,9,8.5),
    Ingreso = c(950,820,870,1020,780,940,860,800,910,960,790,850,1050,750,880,830,770,980,810,790),
    IBS = c(80.2,72.5,75.4,83.1,68.7,78.9,74.0,70.1,77.2,79.4,69.3,73.6,85.5,65.8,76.1,72.9,67.5,81.3,71.4,68.9)
  )
}
dim(datos)
## [1] 20  7
head(datos)
## # A tibble: 6 × 7
##   Municipio    Alfabetismo AguaPotable Desempleo Escolaridad Ingreso   IBS
##   <chr>              <dbl>       <dbl>     <dbl>       <dbl>   <dbl> <dbl>
## 1 Bogota                95          85         8          10     950    80
## 2 Medellin              88          78        12           9     820    73
## 3 Cali                  91          82        10          10     870    75
## 4 Barranquilla          96          90         6          11    1020    83
## 5 Cartagena             85          75        15           8     780    69
## 6 Bucaramanga           93          88         9          10     940    79
summary(datos)
##   Municipio          Alfabetismo     AguaPotable      Desempleo    
##  Length:20          Min.   :83.00   Min.   :70.00   Min.   : 5.00  
##  Class :character   1st Qu.:86.75   1st Qu.:76.75   1st Qu.: 9.00  
##  Mode  :character   Median :90.00   Median :80.50   Median :11.00  
##                     Mean   :90.00   Mean   :81.00   Mean   :11.00  
##                     3rd Qu.:93.25   3rd Qu.:85.25   3rd Qu.:13.25  
##                     Max.   :97.00   Max.   :92.00   Max.   :16.00  
##   Escolaridad       Ingreso            IBS       
##  Min.   : 8.00   Min.   : 750.0   Min.   :66.00  
##  1st Qu.: 9.00   1st Qu.: 797.5   1st Qu.:69.75  
##  Median : 9.00   Median : 855.0   Median :74.00  
##  Mean   : 9.55   Mean   : 870.5   Mean   :74.60  
##  3rd Qu.:10.00   3rd Qu.: 942.5   3rd Qu.:79.00  
##  Max.   :12.00   Max.   :1050.0   Max.   :86.00
#Profe, no se como hacer que la tabla no me salga en 6x7

Las variables seleccionadas representan dimensiones clave del bienestar social: Alfabetismo, AguaPotable, Desempleo, Escolaridad e Ingreso.

correlacion <- cor(datos %>% select(-Municipio))
correlacion
##             Alfabetismo AguaPotable  Desempleo Escolaridad    Ingreso
## Alfabetismo   1.0000000   0.9762194 -0.9811907   0.9364506  0.9767503
## AguaPotable   0.9762194   1.0000000 -0.9805965   0.9413980  0.9760192
## Desempleo    -0.9811907  -0.9805965  1.0000000  -0.9438496 -0.9799489
## Escolaridad   0.9364506   0.9413980 -0.9438496   1.0000000  0.9514111
## Ingreso       0.9767503   0.9760192 -0.9799489   0.9514111  1.0000000
## IBS           0.9846395   0.9817290 -0.9883520   0.9400114  0.9918575
##                    IBS
## Alfabetismo  0.9846395
## AguaPotable  0.9817290
## Desempleo   -0.9883520
## Escolaridad  0.9400114
## Ingreso      0.9918575
## IBS          1.0000000
## Gráficos de dispersión
pairs(datos %>% select(-Municipio), main = "Matriz de gráficos de dispersión")

## Modelo de regresión
modelo_completo <- lm(IBS ~ Alfabetismo + AguaPotable + Desempleo + Escolaridad + Ingreso, data = datos)
summary(modelo_completo)
## 
## Call:
## lm(formula = IBS ~ Alfabetismo + AguaPotable + Desempleo + Escolaridad + 
##     Ingreso, data = datos)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.87347 -0.25186 -0.03974  0.18500  1.06323 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)   
## (Intercept) 28.55383   17.12820   1.667  0.11771   
## Alfabetismo  0.21931    0.17651   1.242  0.23449   
## AguaPotable  0.07909    0.11807   0.670  0.51388   
## Desempleo   -0.50716    0.26794  -1.893  0.07924 . 
## Escolaridad -0.48697    0.37879  -1.286  0.21945   
## Ingreso      0.03461    0.00862   4.016  0.00128 **
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.5456 on 14 degrees of freedom
## Multiple R-squared:  0.9927, Adjusted R-squared:  0.9901 
## F-statistic: 379.4 on 5 and 14 DF,  p-value: 1.998e-14
## Modelo de regresión reducido
modelo_reducido <- lm(IBS ~ Alfabetismo + AguaPotable + Ingreso, data = datos)
summary(modelo_reducido)
## 
## Call:
## lm(formula = IBS ~ Alfabetismo + AguaPotable + Ingreso, data = datos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -0.9341 -0.3151 -0.1146  0.2985  1.3455 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 0.192628   7.928623   0.024 0.980918    
## Alfabetismo 0.349899   0.175291   1.996 0.063234 .  
## AguaPotable 0.143622   0.117141   1.226 0.237915    
## Ingreso     0.035937   0.008235   4.364 0.000482 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.5913 on 16 degrees of freedom
## Multiple R-squared:  0.9902, Adjusted R-squared:  0.9883 
## F-statistic:   537 on 3 and 16 DF,  p-value: 2.907e-16
AIC(modelo_completo, modelo_reducido)
##                 df      AIC
## modelo_completo  7 39.38779
## modelo_reducido  5 41.27480
BIC(modelo_completo, modelo_reducido)
##                 df      BIC
## modelo_completo  7 46.35791
## modelo_reducido  5 46.25346

Interpretación del modelo seleccionado

Tras comparar los modelos, se eligió el modelo que mejor explica el Índice de Bienestar Social (IBS) en función de las variables disponibles. A continuación, se presenta la interpretación detallada de los resultados del modelo seleccionado.

Interpretación de Resultados

El modelo de regresión lineal múltiple se construyó para predecir el Índice de Bienestar Social (IBS) en función de cinco variables: Alfabetismo, Agua Potable, Desempleo, Escolaridad y Ingreso.

A continuación se interpretan los principales resultados obtenidos:

En resumen, el modelo sugiere que los factores más importantes para mejorar el bienestar social en los municipios analizados son: - Ampliar el acceso a agua potable. - Reducir el desempleo. - Aumentar la escolaridad promedio. - Mejorar el ingreso mensual de los hogares.

Estas variables deberían ser prioridad en el diseño de políticas públicas orientadas al desarrollo social territorial.

Representación del modelo

El modelo de regresión lineal múltiple estimado para predecir el Índice de Bienestar Social (IBS) es:

IBS=28.55+0.219⋅Alfabetismo+0.079⋅AguaPotable−0.507⋅Desempleo−0.487⋅Escolaridad+0.035⋅Ingreso

Donde:

Como intepretar el modelo?

modelo <- lm(IBS ~ Alfabetismo + AguaPotable + Desempleo + Escolaridad + Ingreso, data = datos)
summary(modelo)
## 
## Call:
## lm(formula = IBS ~ Alfabetismo + AguaPotable + Desempleo + Escolaridad + 
##     Ingreso, data = datos)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.87347 -0.25186 -0.03974  0.18500  1.06323 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)   
## (Intercept) 28.55383   17.12820   1.667  0.11771   
## Alfabetismo  0.21931    0.17651   1.242  0.23449   
## AguaPotable  0.07909    0.11807   0.670  0.51388   
## Desempleo   -0.50716    0.26794  -1.893  0.07924 . 
## Escolaridad -0.48697    0.37879  -1.286  0.21945   
## Ingreso      0.03461    0.00862   4.016  0.00128 **
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.5456 on 14 degrees of freedom
## Multiple R-squared:  0.9927, Adjusted R-squared:  0.9901 
## F-statistic: 379.4 on 5 and 14 DF,  p-value: 1.998e-14
par(mfrow = c(2, 2))
plot(modelo)

par(mfrow = c(1, 1))

Conclusiones

modelo_completo <- lm(IBS ~ Alfabetismo + AguaPotable + Desempleo + Escolaridad + Ingreso, data = datos)
porcentaje_r2 <- round(summary(modelo_completo)$r.squared * 100, 1)
porcentaje_r2
## [1] 99.3

Porcentaje

El modelo completo explica aproximadamente 99,3% de la variabilidad del IBS. Las variables más significativas son las que presentan menor valor p. El modelo reducido muestra valores de AIC y BIC similares o menores, indicando que puede ser preferible por su simplicidad.

Conclusión:

El Índice de Bienestar Social está más fuertemente asociado con alfabetismo, acceso a agua potable e ingreso promedio. Desempleo y escolaridad no aportan significativamente en presencia de las otras variables.

Recomendación:

Mejorar alfabetización, acceso a agua potable y aumentar ingresos puede impactar positivamente el bienestar social.