Introducción

El presente informe desarrolla un análisis del mercado inmobiliario en Cali, con el fin de evaluar la viabilidad de dos solicitudes de vivienda: una casa en la Zona Norte y un apartamento en la Zona Sur.

A lo largo del documento se aplican técnicas de exploración de datos, estimación de un modelo de regresión lineal múltiple y validación de supuestos estadísticos, complementadas con la predicción de precios y la identificación de ofertas potenciales.

El objetivo es determinar qué tan coherentes son los precios de las viviendas en relación con sus características principales —área construida, estrato socioeconómico, número de habitaciones, baños y parqueaderos— y evaluar si las alternativas disponibles en el mercado cumplen con los criterios y presupuestos definidos para cada solicitud.

Análisis Vivienda 1: Casa en Zona Norte


Validación de la ubicación para tipo de vivienda casas

Primeros 3 registros de Casas en Zona Norte
barrio zona tipo areaconst estrato banios habitaciones parqueaderos preciom
Acopi Zona Norte Casa 150 5 4 6 2 320
Acopi Zona Norte Casa 380 5 3 3 2 780
Acopi Zona Norte Casa 445 6 7 6 NA 750
Tipos de vivienda en base1
tipo n
Casa 722
Zonas en base1
zona n
Zona Norte 722

Al graficar en el mapa las 722 viviendas clasificadas como “Zona Norte” se observa que la mayoría de los registros se concentran efectivamente en el sector norte de la ciudad, lo cual es coherente con la información de la variable zona.

No obstante, algunos puntos aparecen en sectores más alejados, incluso hacia el sur de la ciudad. Esto indica que existen registros que, a pesar de estar clasificados como “Zona Norte” en la base de datos, no se localizan geográficamente en esa zona.


Análisis exploratorio de correlaciones para tipo de vivienda casas

Los resultados de la matriz de correlaciones muestran que:

  • Área construida es la variable con mayor influencia en el precio (r ≈ 0.73).
  • Estrato socioeconómico también presenta una relación positiva moderada (r ≈ 0.61).
  • Número de baños guarda relación positiva (r ≈ 0.52), aunque con mayor dispersión.
  • Habitaciones tiene la correlación más débil (r ≈ 0.32).

En los gráficos de dispersión se confirma que área construida y estrato son los factores más relevantes, mientras que baños y habitaciones aportan menor poder explicativo.

Los diagnósticos del modelo indican cierta heterocedasticidad y autocorrelación positiva, lo que sugiere que variables adicionales como piso, barrio o coordenadas geográficas podrían incorporarse en futuros modelos para mejorar el ajuste.


Estimación del modelo de regresión lineal múltiple para tipo de vivienda casas

Coeficientes estimados del modelo de regresión
term Estimate Std_Error t_value p_value Significativo
(Intercept) -238.17 44.41 -5.36 1.00e-07
areaconst 0.68 0.05 12.81 0.00e+00
estrato 80.63 9.83 8.21 0.00e+00
habitaciones 7.65 5.66 1.35 1.77e-01 No
parqueaderos 24.01 5.87 4.09 5.14e-05
banios 18.90 7.49 2.52 1.20e-02
Medidas de ajuste del modelo
R2 R2_Ajustado Error_Estandar Estadistico_F p_value
0.604 0.599 155.11 130.92 0

El modelo de regresión lineal múltiple muestra que:

  • Área construida (p < 0.001) y estrato (p < 0.001) son altamente significativos y explican gran parte de la variación en el precio.
  • Parqueaderos (p < 0.001) y baños (p = 0.012) también resultan significativos, aunque con menor impacto.
  • Habitaciones no es significativa (p = 0.177), indicando que su aporte aislado al precio es bajo.

El R² ajustado es 0.60, lo que significa que el modelo explica aproximadamente el 60% de la variación del precio.
Aunque el ajuste es aceptable, los diagnósticos muestran problemas de heterocedasticidad y autocorrelación, por lo que variables adicionales (piso, barrio, coordenadas) podrían mejorar el modelo.


Validación de supuestos del modelo para tipo de vivienda casas

Prueba Durbin-Watson (Casas)
Estadistico_DW p_value
DW 1.762 0.00547
Factor de Inflación de Varianza (VIF) - Casas
Variable VIF
areaconst areaconst 1.461
estrato estrato 1.308
habitaciones habitaciones 1.721
parqueaderos parqueaderos 1.226
banios banios 1.967

Normalidad de los residuos
El histograma y el QQ-Plot muestran que los residuos siguen aproximadamente una distribución normal, con pequeñas desviaciones en los extremos.

Homocedasticidad
El gráfico de residuos vs. valores ajustados no presenta un patrón definido, lo que indica que la varianza de los errores se mantiene relativamente constante.

Independencia de los residuos
La prueba de Durbin-Watson (DW = 1.76, p = 0.014) sugiere una ligera autocorrelación positiva en los errores. Aunque no es grave, puede indicar que faltan variables en el modelo (ej. ubicación más detallada).

Multicolinealidad
Los valores de VIF son todos menores a 2, por lo que no se evidencian problemas de colinealidad entre las variables explicativas.

Conclusión
En general, el modelo cumple razonablemente con los supuestos de regresión lineal. La única alerta es la ligera autocorrelación detectada, que podría mejorar al incluir más información en el modelo.


Predicción del precio para tipo de vivienda casas

Predicción del precio para la Vivienda 1 (en millones)
Estimado Limite_Inferior Limite_Superior
312.101 6.205196 617.9968

Con las características de la Vivienda 1 (casa en zona norte, área de 200 m², estrato 4, 4 habitaciones, 2 baños y 1 parqueadero), el modelo de regresión lineal múltiple estima un precio promedio de 312 millones de pesos.

El intervalo de predicción al 95% oscila entre 6 millones y 618 millones, lo que refleja una alta dispersión en los datos y evidencia cierto nivel de incertidumbre en la estimación.

Al comparar este resultado con el crédito preaprobado de 350 millones de pesos, se observa que la vivienda se encuentra dentro del rango de financiamiento disponible.


Ofertas potenciales para tipo de vivienda casas

ofertas en Zona Norte que cumplen los criterios de la Vivienda 1
tipo zona barrio estrato areaconst habitaciones banios parqueaderos preciom
Casa Zona Norte El Bosque 4 270.0 4 4 2 315
Casa Zona Norte La Flora 5 200.0 4 4 2 320
Casa Zona Norte La Flora 5 230.0 4 4 2 320
Casa Zona Norte La Merced 4 200.0 4 4 2 320
Casa Zona Norte La Merced 4 260.0 4 3 1 330
Casa Zona Norte Prados Del Norte 5 246.0 4 4 2 330
Casa Zona Norte El Bosque 4 300.0 4 4 3 335
Casa Zona Norte El Bosque 5 250.0 4 4 2 340
Casa Zona Norte Vipasa 5 203.0 4 3 2 340
Casa Zona Norte Vipasa 4 264.5 4 4 2 340

Aunque no se identifican casas en la Zona Norte que cumplan estrictamente con todos los criterios de la Vivienda 1, sí existen opciones muy próximas en barrios como La Flora, La Merced y El Bosque.

Estas alternativas cumplen con el área construida (200 m²), el estrato socioeconómico (4 o 5), el número de habitaciones (4) y el presupuesto disponible, pero presentan diferencias en el número de baños y parqueaderos.

Análisis Vivienda 2: Apartamento en Zona Sur


Validación de la ubicación para tipo de vivienda apartamentos

Primeros 3 registros de Apartamentos en Zona Sur
barrio zona tipo areaconst estrato banios habitaciones parqueaderos preciom
Acopi Zona Sur Apartamento 96 4 2 3 1 290
Aguablanca Zona Sur Apartamento 40 3 1 2 1 78
Aguacatal Zona Sur Apartamento 194 6 5 3 2 875
Tipos de vivienda en base2
tipo n
Apartamento 2787
Zonas en base2
zona n
Zona Sur 2787

Al graficar en el mapa los 2.787 apartamentos clasificados como “Zona Sur” se observa que la mayoría de los registros se concentran efectivamente en el sector sur de la ciudad, lo cual es coherente con la información de la variable zona.

No obstante, también se identifican agrupaciones de viviendas en sectores centrales y en algunos barrios tradicionalmente asociados a otras zonas de la ciudad. Esto indica que, al igual que en el caso de la Zona Norte, existen registros que, a pesar de estar clasificados como “Zona Sur” en la base de datos, no se localizan geográficamente en esa zona.


Análisis exploratorio de correlaciones para tipo de vivienda apartamentos

En el caso de los apartamentos de la Zona Sur, la matriz de correlaciones evidencia que:

  • Área construida es la variable más asociada al precio (r ≈ 0.69).
  • Estrato socioeconómico presenta una relación positiva moderada (r ≈ 0.58).
  • Número de baños y habitaciones muestran correlaciones positivas, pero con mayor dispersión.

Los gráficos de dispersión confirman que área construida y estrato son los principales determinantes del precio, mientras que las demás variables aportan información menos consistente.

Los diagnósticos del modelo señalan signos de heterocedasticidad y autocorrelación en los residuos, lo que indica que variables adicionales como piso, barrio o coordenadas geográficas podrían mejorar el ajuste en futuros modelos.


Estimación del modelo de regresión lineal múltiple para tipo de vivienda apartamentos

Coeficientes estimados del modelo de regresión (Vivienda 2 - Apartamentos)
term Estimate Std_Error t_value p_value Significativo
(Intercept) -261.63 15.63 -16.74 0
areaconst 1.29 0.05 23.79 0
estrato 60.90 3.08 19.75 0
habitaciones -24.84 3.89 -6.38 0
parqueaderos 72.91 3.96 18.42 0
banios 50.70 3.40 14.93 0
Medidas de ajuste del modelo (Vivienda 2 - Apartamentos)
R2 R2_Ajustado Error_Estandar Estadistico_F p_value
0.749 0.748 98.02 1413.8 0

El modelo para apartamentos en la Zona Sur indica que:

  • Área construida (p < 0.001) y estrato (p < 0.001) son las variables con mayor peso en la explicación del precio.
  • Baños (p < 0.05) también contribuye de manera significativa.
  • Habitaciones presenta un efecto negativo y significativo, mientras que parqueaderos tiene un impacto positivo moderado.

El R² ajustado es 0.75, lo que significa que el modelo explica aproximadamente el 75% de la variación en el precio.

El ajuste es adecuado, pero se observan indicios de heterocedasticidad y autocorrelación en residuos, lo que confirma la necesidad de considerar variables adicionales como piso, barrio o ubicación geográfica exacta para robustecer el modelo.


Validación de supuestos del modelo para tipo de vivienda apartamentos

Prueba Durbin-Watson (Apartamentos)
Estadistico_DW p_value
DW 1.533 0
Factor de Inflación de Varianza (VIF) - Apartamentos
Variable VIF
areaconst areaconst 2.067
estrato estrato 1.545
habitaciones habitaciones 1.429
parqueaderos parqueaderos 1.738
banios banios 2.529

En la validación de supuestos para el modelo de apartamentos en la Zona Sur se observan los siguientes aspectos:

  • Independencia de residuos: el estadístico Durbin-Watson (DW = 1.533, p < 0.001) indica presencia de cierta autocorrelación positiva en los residuos, lo que puede afectar la independencia de los errores.
  • Normalidad de los residuos: el QQ-Plot y el histograma muestran que los residuos se aproximan a una distribución normal, aunque con colas más pesadas en los extremos.
  • Homoscedasticidad: el gráfico de residuos vs valores ajustados evidencia una dispersión relativamente constante, aunque se aprecian mayores varianzas a precios altos.
  • Multicolinealidad: los valores de VIF están entre 1.42 y 2.53, todos por debajo de 5, lo que indica que no existe un problema grave de multicolinealidad entre las variables explicativas.

En conclusión, el modelo para apartamentos cumple de manera razonable los supuestos de regresión lineal, aunque la autocorrelación detectada en los residuos es un aspecto que debe considerarse al interpretar los resultados.


Predicción del precio para tipo de vivienda apartamentos

Predicción del precio para la Vivienda 2 (en millones)
Estimado Limite_Inferior Limite_Superior
675 481.5 868.6

La predicción del modelo de regresión para la Vivienda 2 (Apartamento en Zona Sur, área 300 m², estrato 5-6, 5 habitaciones, 3 baños y 3 parqueaderos) arroja un precio estimado de 675 millones.

  • El intervalo de confianza al 95% se encuentra entre 481.5 millones y 868.6 millones, lo que refleja la incertidumbre del modelo.
  • Comparando con el crédito preaprobado de 850 millones, el valor estimado es menor, aunque el límite superior del intervalo está cercano al monto aprobado, lo que indica que el presupuesto es adecuado para este tipo de inmueble.
  • En conclusión, el modelo sugiere que la vivienda es financieramente viable dentro del rango previsto, aunque el comprador debería considerar que los valores del mercado podrían fluctuar hacia el límite superior.


Ofertas potenciales para tipo de vivienda apartamentos

Ofertas exactas para la Vivienda 2 (≤ 850 millones)
tipo zona barrio estrato areaconst habitaciones banios parqueaderos preciom
Apartamento Zona Sur Seminario 5 300 6 5 3 670
Apartamento Zona Sur Guadalupe 5 573 5 8 3 730

En el caso de la Vivienda 2, aunque se identifican apartamentos en la Zona Sur dentro del presupuesto disponible (≤ 850 millones), ninguno cumple de manera estricta con todas las características planteadas.

Las opciones encontradas en barrios como Seminario y Guadalupe cumplen con el área construida (≥ 300 m²), el estrato socioeconómico (5) y el número de parqueaderos (3), además de estar dentro del rango de precio.
Sin embargo, presentan diferencias en el número de habitaciones y baños respecto al perfil inicial de la Vivienda 2.

Esto indica que, aunque existen alternativas cercanas y viables en la Zona Sur, no se encontró una oferta que coincida exactamente con todos los criterios establecidos.


Observaciones finales

Del análisis realizado para ambas solicitudes se concluye lo siguiente:

En ambas zonas se observan alternativas viables, aunque ninguna coincide al 100% con los criterios definidos.
Esto refleja que, si bien los modelos y filtros permiten acercarse a opciones potenciales, en la práctica los compradores deberán flexibilizar algunos atributos (como baños o parqueaderos) para encontrar una vivienda ajustada al presupuesto disponible.

En conclusión, los resultados son coherentes con el mercado inmobiliario de Cali:
el área construida y el estrato socioeconómico son los factores más determinantes en el precio, pero las demás características (habitaciones, baños y parqueaderos) presentan una mayor variabilidad en la oferta.