REPORTE DE ANÁLISIS: MODELO DE REGRESIÓN LOGÍSTICA PARA ACCESO A VIVIENDA PROPIA

INTRODUCCIÓN

El presente análisis tiene como objetivo evaluar los factores que influyen en la probabilidad de que un hogar adquiera vivienda propia, en el marco de la evaluación de un programa gubernamental de subsidios dirigido a sectores de bajos ingresos. Para ello, se emplea una base de datos de 1,000 hogares y se aplica un modelo de regresión logística que permite modelar la probabilidad de acceso a vivienda propia en función de variables socioeconómicas y demográficas clave. Los resultados de este estudio buscan proporcionar evidencia cuantitativa que sirva de insumo para el diseño y ajuste de políticas públicas más efectivas y focalizadas en materia habitacional.

1. ESTADÍSTICOS DESCRIPTIVOS

# CARGAR LIBRERÍAS
library(ggplot2)
library(dplyr)
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(MASS)
## 
## Adjuntando el paquete: 'MASS'
## The following object is masked from 'package:dplyr':
## 
##     select
library(readxl)

# CARGAR DATOS
Base_Datos_Vivienda <- read_excel("C:/Users/User/Downloads/Base_Datos_Vivienda.xlsx")
datos <- Base_Datos_Vivienda

# 1. ESTADÍSTICOS DESCRIPTIVOS
# Resumen de variables numéricas
summary(datos[, c("Ingreso", "Edad_Jefe", "Tamano_Hogar")])
##     Ingreso       Edad_Jefe      Tamano_Hogar  
##  Min.   : 500   Min.   :25.00   Min.   :1.000  
##  1st Qu.:2029   1st Qu.:35.00   1st Qu.:2.000  
##  Median :3038   Median :44.00   Median :4.000  
##  Mean   :3050   Mean   :44.55   Mean   :3.465  
##  3rd Qu.:3972   3rd Qu.:54.00   3rd Qu.:5.000  
##  Max.   :8779   Max.   :64.00   Max.   :6.000
# Tablas de frecuencia
table(datos$Educacion)
## 
##   0   1   2   3   4   5 
## 156 173 141 186 177 167
table(datos$Credito)
## 
##   0   1 
## 302 698
table(datos$Zona)
## 
##  Rural Urbana 
##    291    709
table(datos$Vivienda)
## 
##   0   1 
## 156 844

El análisis descriptivo de la muestra revela las características generales de los hogares estudiados. En términos de ingresos, los hogares presentan un promedio mensual de 3,050, con una dispersión considerable que va desde $500 hasta casi 8,800. La mediana se sitúa alrededor de 3,000, indicando que la mitad de los hogares tiene ingresos por debajo de ese monto.

Respecto al perfil del jefe de hogar, la edad promedio es de 44.6 años, con un rango que abarca desde adultos jóvenes de 25 años hasta personas de 64 años. El tamaño promedio del hogar es de 3.5 personas, con una variación entre hogares unipersonales y aquellos con hasta 6 integrantes.

En las variables categóricas, se observa que la distribución entre los distintos niveles educativos es relativamente equilibrada. Un hallazgo relevante es que el 69.8% de los hogares reporta tener acceso a crédito bancario o financiero. Geográficamente, la muestra está compuesta predominantemente por hogares urbanos (70.9%). Finalmente, y de manera destacada, el 84.4% de los hogares en la muestra afirma poseer vivienda propia, lo que establece un punto de partida de alta prevalencia para el análisis.

2. ANÁLISIS EXPLORATORIO CON GRÁFICOS

# Distribución de la variable respuesta
ggplot(datos, aes(x = factor(Vivienda, labels = c("No", "Si")))) +
  geom_bar(fill = c("tomato", "steelblue"), alpha = 0.8) +
  labs(title = "Distribución de Vivienda Propia",
       x = "Vivienda Propia",
       y = "Frecuencia") +
  theme_minimal() +
  theme(plot.title = element_text(hjust = 0.5))

# Ingreso vs Vivienda
ggplot(datos, aes(x = Ingreso, fill = factor(Vivienda))) +
  geom_density(alpha = 0.5) +
  labs(title = "Distribución de Ingresos por Estado de Vivienda",
       x = "Ingreso",
       y = "Densidad",
       fill = "Vivienda") +
  scale_fill_manual(values = c("tomato", "steelblue"),
                    labels = c("No", "Sí")) +
  theme_minimal() +
  theme(plot.title = element_text(hjust = 0.5))

# Educación vs Vivienda
ggplot(datos, aes(x = factor(Educacion), fill = factor(Vivienda))) +
  geom_bar(position = "fill") +
  labs(title = "Proporción de Vivienda Propia por Nivel Educativo",
       x = "Nivel Educativo",
       y = "Proporción",
       fill = "Vivienda") +
  scale_fill_manual(values = c("tomato", "steelblue"),
                    labels = c("No", "Sí")) +
  scale_x_discrete(labels = c("Sin estudios", "Primaria inc", 
                              "Primaria comp", "Secundaria",
                              "Univ inc", "Univ comp")) +
  theme_minimal() +
  theme(plot.title = element_text(hjust = 0.5),
        axis.text.x = element_text(angle = 45, hjust = 1))

# Zona vs Vivienda
ggplot(datos, aes(x = Zona, fill = factor(Vivienda))) +
  geom_bar(position = "dodge") +
  labs(title = "Vivienda Propia por Zona Geográfica",
       x = "Zona",
       y = "Frecuencia",
       fill = "Vivienda") +
  scale_fill_manual(values = c("tomato", "steelblue"),
                    labels = c("No", "Sí")) +
  theme_minimal() +
  theme(plot.title = element_text(hjust = 0.5))

El análisis gráfico permitió visualizar patrones y relaciones preliminares antes de modelar. En primer lugar, un gráfico de barras confirma la distribución desbalanceada de la variable respuesta, donde la gran mayoría de los hogares posee vivienda propia.

Un gráfico de densidad de los ingresos, separado por la condición de vivienda, sugiere una relación positiva: las distribuciones de ingresos de los hogares con vivienda propia tienden a desplazarse hacia la derecha y presentan colas más largas en los valores altos, en comparación con los hogares sin vivienda propia.

Un tercer gráfico, que muestra la proporción de hogares con vivienda propia según el nivel educativo del jefe de hogar, revela una tendencia clara y ascendente. La proporción es más baja para los niveles educativos básicos (alrededor del 75-80%) y aumenta consistentemente hasta alcanzar el 92% para los hogares con educación universitaria completa. Esto indica una fuerte asociación preliminar entre mayor educación y mayor probabilidad de acceso a la vivienda.

Finalmente, un gráfico de barras apiladas por zona geográfica muestra que, en términos absolutos, hay muchos más hogares con vivienda propia en zonas urbanas. Sin embargo, al observar las proporciones dentro de cada zona, la diferencia entre zonas urbanas y rurales parece menos marcada, lo que sugiere que otros factores podrían estar interactuando.

3. MODELO DE REGRESIÓN LOGÍSTICA

# Convertir variables categóricas a factores
datos$Educacion <- as.factor(datos$Educacion)
datos$Credito <- as.factor(datos$Credito)
datos$Zona <- as.factor(datos$Zona)
datos$Vivienda <- as.factor(datos$Vivienda)

# Modelo completo
modelo_completo <- glm(Vivienda ~ Ingreso + Educacion + Credito + Zona + 
                         Edad_Jefe + Tamano_Hogar,
                       data = datos, family = binomial(link = "logit"))

summary(modelo_completo)
## 
## Call:
## glm(formula = Vivienda ~ Ingreso + Educacion + Credito + Zona + 
##     Edad_Jefe + Tamano_Hogar, family = binomial(link = "logit"), 
##     data = datos)
## 
## Coefficients:
##                Estimate Std. Error z value Pr(>|z|)    
## (Intercept)  -3.259e+00  6.066e-01  -5.372 7.77e-08 ***
## Ingreso       8.651e-04  8.809e-05   9.821  < 2e-16 ***
## Educacion1   -1.283e-01  3.045e-01  -0.421 0.673638    
## Educacion2    2.207e-01  3.326e-01   0.664 0.506982    
## Educacion3    5.906e-01  3.203e-01   1.844 0.065144 .  
## Educacion4    1.178e+00  3.689e-01   3.194 0.001405 ** 
## Educacion5    1.408e+00  4.010e-01   3.511 0.000446 ***
## Credito1      7.709e-01  2.048e-01   3.764 0.000168 ***
## ZonaUrbana    5.507e-01  2.102e-01   2.620 0.008786 ** 
## Edad_Jefe     3.530e-02  8.988e-03   3.927 8.59e-05 ***
## Tamano_Hogar -3.324e-02  5.724e-02  -0.581 0.561413    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 865.95  on 999  degrees of freedom
## Residual deviance: 670.73  on 989  degrees of freedom
## AIC: 692.73
## 
## Number of Fisher Scoring iterations: 6

Para explicar la probabilidad de acceso a vivienda propia, se propone y ajusta un modelo de regresión logística binaria. La componente aleatoria del modelo asume que la variable respuesta Vivienda sigue una distribución Bernoulli, donde la probabilidad de éxito (poseer vivienda) varía para cada hogar en función de sus características. La componente sistemática se especifica mediante un predictor lineal que incluye todas las variables disponibles: Ingreso, Educacion (como factor), Credito, Zona, Edad_Jefe y Tamano_Hogar.

La ecuación del modelo estimado es la siguiente: logit(P(Vivienda=1)) = -3.259 + 0.000865Ingreso + β_educacion + 0.771 Credito1 + 0.551* ZonaUrbana + 0.0353Edad_Jefe - 0.0332Tamano_Hogar

Donde logit(p) = ln(p/(1-p)) es la función de enlace que transforma la probabilidad en una escala no acotada.

4. INTERPRETACIÓN DE COEFICIENTES

coeficientes <- coef(modelo_completo)
odds_ratios <- exp(coeficientes)

coeficientes
##   (Intercept)       Ingreso    Educacion1    Educacion2    Educacion3 
## -3.2591715290  0.0008651005 -0.1282589131  0.2207068879  0.5906426166 
##    Educacion4    Educacion5      Credito1    ZonaUrbana     Edad_Jefe 
##  1.1781186895  1.4080166568  0.7709199268  0.5506547196  0.0353003913 
##  Tamano_Hogar 
## -0.0332431350
odds_ratios
##  (Intercept)      Ingreso   Educacion1   Educacion2   Educacion3   Educacion4 
##   0.03842021   1.00086547   0.87962560   1.24695788   1.80514806   3.24825747 
##   Educacion5     Credito1   ZonaUrbana    Edad_Jefe Tamano_Hogar 
##   4.08783977   2.16175399   1.73438818   1.03593085   0.96730335
  1. INTERPRETACIÓN DE COEFICIENTES ESTIMADOS Para una interpretación más intuitiva, los coeficientes se transforman en Odds Ratios (OR), que representan el cambio multiplicativo en la ventaja (odds) de tener vivienda propia por unidad de cambio en el predictor.

Ingreso: Por cada dólar adicional de ingreso mensual, el odds de tener vivienda propia se multiplica por 1.000865, lo que equivale a un aumento marginal del 0.0865% por dólar. Aunque el efecto unitario es pequeño, su impacto acumulado a lo largo de un rango de ingresos es sustancial.

Educación: Tomando como referencia a los hogares sin estudios, solo los niveles educativos superiores muestran un efecto significativo. Los hogares con educación universitaria completa tienen un odds 4.09 veces mayor (OR=4.09), y aquellos con educación universitaria incompleta tienen un odds 3.25 veces mayor (OR=3.25).

Crédito: El acceso a crédito es uno de los predictores más fuertes. Los hogares con crédito tienen un odds de tener vivienda propia 2.16 veces mayor que los que no tienen acceso (OR=2.16), lo que representa un incremento del 116%.

Zona: Los hogares ubicados en zonas urbanas tienen un odds 1.73 veces mayor que los hogares en zonas rurales (OR=1.73).

Edad del Jefe: Por cada año adicional en la edad del jefe de hogar, el odds de tener vivienda propia aumenta en un 3.6% (OR=1.036).

5. SIGNIFICANCIA ESTADÍSTICA

summary_modelo <- summary(modelo_completo)
p_valores <- summary_modelo$coefficients[,4]

names(p_valores)[p_valores < 0.05]
## [1] "(Intercept)" "Ingreso"     "Educacion4"  "Educacion5"  "Credito1"   
## [6] "ZonaUrbana"  "Edad_Jefe"
names(p_valores)[p_valores >= 0.05]
## [1] "Educacion1"   "Educacion2"   "Educacion3"   "Tamano_Hogar"

El análisis de significancia estadística mediante pruebas de Wald identifica claramente qué variables contribuyen información relevante para predecir la probabilidad de acceso a vivienda propia. Variables con efectos altamente significativos (p < 0.001) incluyen el ingreso, la educación universitaria (tanto completa como incompleta), el acceso a crédito, y la edad del jefe de hogar. La zona urbana también muestra significancia estadística, aunque con un nivel de confianza ligeramente menor (p = 0.0088).

En contraste, los niveles educativos básicos (primaria y secundaria) no muestran diferencias significativas respecto a la categoría de referencia (sin estudios), sugiriendo que estos niveles no confieren ventajas diferenciadas en términos de acceso a propiedad habitacional dentro de este contexto específico. Similarmente, el tamaño del hogar no emerge como predictor significativo, indicando que el número de integrantes no afecta sustancialmente la probabilidad de propiedad una vez controladas las demás variables socioeconómicas.

6. BONDAD DE AJUSTE

# AIC
AIC(modelo_completo)
## [1] 692.7338
# Pseudo R²
logLik_null <- logLik(glm(Vivienda ~ 1, data = datos, family = binomial))
logLik_model <- logLik(modelo_completo)
1 - (logLik_model/logLik_null)
## 'log Lik.' 0.2254395 (df=11)

La calidad del ajuste del modelo se evaluó con múltiples métricas. El AIC (Criterio de Información de Akaike) tiene un valor de 692.73, que es relativamente bajo en comparación con modelos más simples, indicando un buen equilibrio entre ajuste y parsimonia. El Pseudo R² de McFadden es de 0.2254, lo que se puede interpretar como que el modelo logra explicar aproximadamente el 22.5% de la variabilidad en la probabilidad de acceso a vivienda propia, una proporción considerable para modelos con datos de sección cruzada.

La comparación de la Desviación del modelo nulo (865.95) con la del modelo propuesto (670.73) confirma una reducción sustancial, respaldando la inclusión de los predictores.

7. PREDICCIÓN PARA HOGARES ESPECÍFICOS

# Hogar urbano con educación universitaria y crédito
hogar1 <- data.frame(
  Ingreso = 3000,
  Educacion = factor("5", levels = levels(datos$Educacion)),
  Credito = factor("1", levels = levels(datos$Credito)),
  Zona = factor("Urbana", levels = levels(datos$Zona)),
  Edad_Jefe = 45,
  Tamano_Hogar = 4
)

# Hogar rural con educación básica y sin crédito
hogar2 <- data.frame(
  Ingreso = 800,
  Educacion = factor("2", levels = levels(datos$Educacion)),
  Credito = factor("0", levels = levels(datos$Credito)),
  Zona = factor("Rural", levels = levels(datos$Zona)),
  Edad_Jefe = 55,
  Tamano_Hogar = 6
)

predict(modelo_completo, newdata = hogar1, type = "response")
##         1 
## 0.9712868
predict(modelo_completo, newdata = hogar2, type = "response")
##         1 
## 0.3533556

Para ilustrar las implicaciones prácticas del modelo, se estimaron probabilidades de acceso a vivienda propia para dos perfiles de hogar contrastantes que representan extremos en el espectro socioeconómico. Un hogar urbano con características favorables —ingreso de $3,000, educación universitaria completa, acceso a crédito, jefe de 45 años y 4 integrantes— presenta una probabilidad estimada del 97.1% de ser propietario. En el extremo opuesto, un hogar rural con educación primaria completa, sin acceso a crédito, ingreso de $800, jefe de 55 años y 6 integrantes tiene una probabilidad de apenas 35.3%.

Esta brecha de 61.8 puntos porcentuales ilustra dramáticamente cómo las desigualdades socioeconómicas se traducen en diferencias sustanciales en oportunidades de acceso a vivienda. Particularmente notable es el hecho de que incluso un hogar rural con jefe mayor (que normalmente acumularía más recursos con el tiempo) enfrenta probabilidades muy bajas cuando carece de educación superior y acceso a crédito, sugiriendo que estos dos factores funcionan como prerrequisitos casi indispensables en el contexto estudiado.

8. INTERACCIÓN INGRESO*ZONA

modelo_interaccion <- glm(Vivienda ~ Ingreso * Zona + Educacion + Credito + 
                            Edad_Jefe + Tamano_Hogar,
                          data = datos, family = binomial)

summary(modelo_interaccion)
## 
## Call:
## glm(formula = Vivienda ~ Ingreso * Zona + Educacion + Credito + 
##     Edad_Jefe + Tamano_Hogar, family = binomial, data = datos)
## 
## Coefficients:
##                      Estimate Std. Error z value Pr(>|z|)    
## (Intercept)        -2.8977558  0.6570956  -4.410 1.03e-05 ***
## Ingreso             0.0007122  0.0001380   5.163 2.44e-07 ***
## ZonaUrbana         -0.0049250  0.4560903  -0.011 0.991384    
## Educacion1         -0.0958542  0.3064500  -0.313 0.754441    
## Educacion2          0.2230659  0.3325703   0.671 0.502391    
## Educacion3          0.5870979  0.3200063   1.835 0.066558 .  
## Educacion4          1.1663460  0.3671926   3.176 0.001491 ** 
## Educacion5          1.4037156  0.3994222   3.514 0.000441 ***
## Credito1            0.7792120  0.2050951   3.799 0.000145 ***
## Edad_Jefe           0.0350190  0.0089860   3.897 9.74e-05 ***
## Tamano_Hogar       -0.0336725  0.0572542  -0.588 0.556449    
## Ingreso:ZonaUrbana  0.0002442  0.0001774   1.376 0.168709    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 865.95  on 999  degrees of freedom
## Residual deviance: 668.87  on 988  degrees of freedom
## AIC: 692.87
## 
## Number of Fisher Scoring iterations: 6
# Comparación de modelos
anova(modelo_completo, modelo_interaccion, test = "Chisq")
## Analysis of Deviance Table
## 
## Model 1: Vivienda ~ Ingreso + Educacion + Credito + Zona + Edad_Jefe + 
##     Tamano_Hogar
## Model 2: Vivienda ~ Ingreso * Zona + Educacion + Credito + Edad_Jefe + 
##     Tamano_Hogar
##   Resid. Df Resid. Dev Df Deviance Pr(>Chi)
## 1       989     670.73                     
## 2       988     668.87  1   1.8637   0.1722

Se investigó si el efecto del ingreso sobre la probabilidad de tener vivienda propia era diferente entre zonas urbanas y rurales, incorporando un término de interacción (Ingreso * Zona) en el modelo. El análisis mostró que el coeficiente de esta interacción no es estadísticamente significativo (p-valor = 0.1687). Una prueba de razón de verosimilitud entre el modelo con y sin interacción arrojó un resultado no significativo (p = 0.1722).

Conclusión: No existe evidencia estadística suficiente para afirmar que la relación entre el ingreso y la probabilidad de acceder a vivienda propia sea distinta en áreas urbanas y rurales. El efecto positivo del ingreso opera de manera similar en ambos contextos geográficos.

9. GRÁFICO DE PROBABILIDADES VS INGRESO

# Datos para predicción
nuevos_datos <- expand.grid(
  Ingreso = seq(min(datos$Ingreso), max(datos$Ingreso), length.out = 100),
  Zona = factor(c("Rural", "Urbana"), levels = levels(datos$Zona)),
  Educacion = factor("3", levels = levels(datos$Educacion)),
  Credito = factor("1", levels = levels(datos$Credito)),
  Edad_Jefe = mean(datos$Edad_Jefe),
  Tamano_Hogar = mean(datos$Tamano_Hogar)
)

# Predecir probabilidades
nuevos_datos$Probabilidad <- predict(modelo_completo, newdata = nuevos_datos, 
                                     type = "response")

# Crear gráfico
ggplot(nuevos_datos, aes(x = Ingreso, y = Probabilidad, color = Zona)) +
  geom_line(linewidth = 1.5) +
  labs(title = "Probabilidad de Vivienda Propia vs Ingreso por Zona",
       x = "Ingreso Mensual ($)",
       y = "Probabilidad Estimada",
       color = "Zona") +
  scale_color_manual(values = c("Rural" = "darkgreen", "Urbana" = "darkorange")) +
  theme_minimal() +
  theme(plot.title = element_text(hjust = 0.5, face = "bold"),
        legend.position = "bottom")

La visualización de la relación entre ingreso y probabilidad estimada de propiedad, diferenciando por zona geográfica, sintetiza varios hallazgos clave del análisis. La curva presenta la forma de “S” alargada característica de los modelos logísticos: inicialmente plana para ingresos muy bajos, luego con pendiente pronunciada en rangos intermedios, y finalmente estabilizándose en niveles cercanos al 100% para ingresos altos. Este patrón sugiere la existencia de umbrales de ingreso mínimos necesarios para iniciar el proceso de adquisición, seguido de rendimientos marginales crecientes en rangos medios, y finalmente saturación en los niveles superiores.

Las curvas para zonas urbanas y rurales aparecen prácticamente paralelas a lo largo de todo el espectro de ingresos, confirmando visualmente la ausencia de interacción significativa encontrada en el análisis estadístico. Sin embargo, la curva urbana se sitúa consistentemente por encima de la rural, reflejando la brecha de nivel base identificada en el modelo. Esta brecha es particularmente pronunciada en rangos de ingreso medio, donde diferencias relativamente pequeñas en probabilidad absoluta pueden traducirse en diferencias sustanciales en términos de odds ratios.

10. MATRIZ DE CONFUSIÓN

predicciones <- predict(modelo_completo, type = "response")
predicciones_class <- ifelse(predicciones > 0.5, 1, 0)
matriz_confusion <- table(Predicho = predicciones_class, 
                          Real = as.numeric(datos$Vivienda)-1)

matriz_confusion
##         Real
## Predicho   0   1
##        0  42  27
##        1 114 817
sum(diag(matriz_confusion)) / sum(matriz_confusion)
## [1] 0.859

La evaluación de la capacidad predictiva del modelo utilizando un umbral de clasificación estándar de 0.5 revela un patrón característico de situaciones con clases desbalanceadas. La matriz de confusión resultante muestra que de los 156 hogares que realmente no son propietarios, el modelo identifica correctamente a 42 (27%), mientras clasifica erróneamente como propietarios a 114 (73%). En contraste, de los 844 hogares propietarios, el modelo acierta en 817 casos (96.8%), cometiendo solo 27 falsos negativos.

Estos resultados se traducen en una exactitud global del 85.9%, una sensibilidad excelente del 96.8%, pero una especificidad modesta del 26.9%. Este perfil de desempeño —alta capacidad para identificar correctamente a propietarios, pero menor precisión para identificar no propietarios— es común en contextos donde una clase (en este caso, propietarios) predomina ampliamente. El modelo tiende a “inclinarse” hacia predecir la clase mayoritaria, lo que maximiza la exactitud global pero a expensas de identificar correctamente los casos minoritarios.

Esta limitación debe considerarse cuidadosamente en aplicaciones prácticas del modelo, particularmente si el objetivo es identificar hogares en riesgo de no acceder a vivienda para intervenciones focalizadas. En tales casos, podría justificarse el uso de umbrales de clasificación diferentes al estándar de 0.5, buscando un balance más apropiado entre sensibilidad y especificidad según los objetivos específicos de la intervención.

CONCLUSIONES Y RECOMENDACIONES

Los hallazgos de este estudio revelan patrones consistentes sobre los determinantes del acceso a vivienda propia que tienen implicaciones importantes tanto para la comprensión teórica del fenómeno habitacional como para el diseño de políticas públicas.

El acceso a crédito emerge como el factor más robusto, duplicando aproximadamente la probabilidad relativa de propiedad. Este resultado subraya la importancia crítica de los mecanismos financieros en los mercados habitacionales y sugiere que políticas que faciliten el acceso crediticio —particularmente para poblaciones tradicionalmente excluidas— podrían tener impactos significativos. Programas de garantías estatales, microcréditos habitacionales, o simplificación de requisitos para créditos hipotecarios merecen consideración prioritaria.

La educación superior muestra un efecto “techo” claro, donde solo los niveles universitarios confieren ventajas significativas respecto a la ausencia total de estudios. Este hallazgo sugiere que los beneficios de la educación en términos de acceso a vivienda operan principalmente a través de umbrales discretos más que de gradientes continuos. Políticamente, esto refuerza la importancia de la educación superior no solo como herramienta de movilidad laboral, sino también como facilitadora de acceso a activos como la vivienda.

La persistente brecha urbano-rural, que se mantiene incluso controlando por ingreso y otras variables, señala la necesidad de intervenciones específicamente diseñadas para contextos rurales. Estas podrían incluir subsidios diferenciados, programas especiales de financiamiento, asistencia técnica para autoconstrucción, o modelos de propiedad colectiva adaptados a realidades rurales.

El efecto positivo de la edad sugiere que los hogares más jóvenes enfrentan barreras adicionales para acceder a la propiedad, posiblemente relacionadas con menor acumulación de capital, historiales crediticios más cortos, o inestabilidad laboral inicial. Programas de apoyo específico para hogares jóvenes, como subsidios iniciales, créditos con períodos de gracia, o modelos de arrendamiento con opción a compra, podrían ayudar a mitigar estas desventajas asociadas al ciclo de vida.

La ausencia de interacción significativa entre ingreso y zona sugiere que políticas de aumento de ingresos podrían tener efectividad similar en ambos contextos geográficos. Sin embargo, dado el diferencial de nivel base, tales políticas deberían complementarse con intervenciones que aborden específicamente las barreras estructurales que afectan desproporcionadamente a zonas rurales.

Finalmente, el análisis sugiere que las políticas más efectivas probablemente serían aquellas que combinen múltiples componentes: subsidios directos para impactar el ingreso disponible, facilitación crediticia para superar barreras financieras, apoyo técnico y educativo para mejorar la capacidad de gestión, y consideración de las particularidades de diferentes contextos geográficos y demográficos. Un enfoque integral que reconozca la multicausalidad del acceso a vivienda probablemente tendrá mayores probabilidades de éxito que intervenciones aisladas o unimodales.

Estos hallazgos, aunque derivados de un contexto específico, ofrecen insights valiosos para el diseño de políticas habitacionales más efectivas y equitativas, contribuyendo al objetivo de ampliar el acceso a vivienda digna como componente fundamental del bienestar social y el desarrollo humano.