El presente informe desarrolla un análisis del mercado inmobiliario en Cali, con el fin de evaluar la viabilidad de dos solicitudes de vivienda: una casa en la Zona Norte y un apartamento en la Zona Sur.
A lo largo del documento se aplican técnicas de exploración de datos, estimación de un modelo de regresión lineal múltiple y validación de supuestos estadísticos, complementadas con la predicción de precios y la identificación de ofertas potenciales.
El objetivo es determinar qué tan coherentes son los precios de las viviendas en relación con sus características principales —área construida, estrato socioeconómico, número de habitaciones, baños y parqueaderos— y evaluar si las alternativas disponibles en el mercado cumplen con los criterios y presupuestos definidos para cada solicitud.
barrio | zona | tipo | areaconst | estrato | banios | habitaciones | parqueaderos | preciom |
---|---|---|---|---|---|---|---|---|
Acopi | Zona Norte | Casa | 150 | 5 | 4 | 6 | 2 | 320 |
Acopi | Zona Norte | Casa | 380 | 5 | 3 | 3 | 2 | 780 |
Acopi | Zona Norte | Casa | 445 | 6 | 7 | 6 | NA | 750 |
tipo | n |
---|---|
Casa | 722 |
zona | n |
---|---|
Zona Norte | 722 |
Al graficar en el mapa las 722 viviendas clasificadas como “Zona
Norte” se observa que la mayoría de los registros se concentran
efectivamente en el sector norte de la ciudad, lo cual es coherente con
la información de la variable zona
.
No obstante, algunos puntos aparecen en sectores más alejados, incluso hacia el sur de la ciudad. Esto indica que existen registros que, a pesar de estar clasificados como “Zona Norte” en la base de datos, no se localizan geográficamente en esa zona.
Los resultados de la matriz de correlaciones muestran que:
En los gráficos de dispersión se confirma que área construida y estrato son los factores más relevantes, mientras que baños y habitaciones aportan menor poder explicativo.
Los diagnósticos del modelo indican cierta heterocedasticidad y autocorrelación positiva, lo que sugiere que variables adicionales como piso, barrio o coordenadas geográficas podrían incorporarse en futuros modelos para mejorar el ajuste.
term | Estimate | Std_Error | t_value | p_value | Significativo |
---|---|---|---|---|---|
(Intercept) | -238.17 | 44.41 | -5.36 | 1.00e-07 | Sí |
areaconst | 0.68 | 0.05 | 12.81 | 0.00e+00 | Sí |
estrato | 80.63 | 9.83 | 8.21 | 0.00e+00 | Sí |
habitaciones | 7.65 | 5.66 | 1.35 | 1.77e-01 | No |
parqueaderos | 24.01 | 5.87 | 4.09 | 5.14e-05 | Sí |
banios | 18.90 | 7.49 | 2.52 | 1.20e-02 | Sí |
R2 | R2_Ajustado | Error_Estandar | Estadistico_F | p_value |
---|---|---|---|---|
0.604 | 0.599 | 155.11 | 130.92 | 0 |
El modelo de regresión lineal múltiple muestra que:
El R² ajustado es 0.60, lo que significa que el
modelo explica aproximadamente el 60% de la variación del
precio.
Aunque el ajuste es aceptable, los diagnósticos muestran problemas de
heterocedasticidad y autocorrelación,
por lo que variables adicionales (piso, barrio, coordenadas) podrían
mejorar el modelo.
Estadistico_DW | p_value | |
---|---|---|
DW | 1.762 | 0.00547 |
Variable | VIF | |
---|---|---|
areaconst | areaconst | 1.461 |
estrato | estrato | 1.308 |
habitaciones | habitaciones | 1.721 |
parqueaderos | parqueaderos | 1.226 |
banios | banios | 1.967 |
Normalidad de los residuos
El histograma y el QQ-Plot muestran que los residuos siguen
aproximadamente una distribución normal, con pequeñas desviaciones en
los extremos.
Homocedasticidad
El gráfico de residuos vs. valores ajustados no presenta un patrón
definido, lo que indica que la varianza de los errores se mantiene
relativamente constante.
Independencia de los residuos
La prueba de Durbin-Watson (DW = 1.76, p = 0.014) sugiere una ligera
autocorrelación positiva en los errores. Aunque no es grave, puede
indicar que faltan variables en el modelo (ej. ubicación más
detallada).
Multicolinealidad
Los valores de VIF son todos menores a 2, por lo que no se evidencian
problemas de colinealidad entre las variables explicativas.
Conclusión
En general, el modelo cumple razonablemente con los supuestos de
regresión lineal. La única alerta es la ligera autocorrelación
detectada, que podría mejorar al incluir más información en el
modelo.
Estimado | Limite_Inferior | Limite_Superior |
---|---|---|
312.101 | 6.205196 | 617.9968 |
Con las características de la Vivienda 1 (casa en zona norte, área de 200 m², estrato 4, 4 habitaciones, 2 baños y 1 parqueadero), el modelo de regresión lineal múltiple estima un precio promedio de 312 millones de pesos.
El intervalo de predicción al 95% oscila entre 6 millones y 618 millones, lo que refleja una alta dispersión en los datos y evidencia cierto nivel de incertidumbre en la estimación.
Al comparar este resultado con el crédito preaprobado de 350 millones de pesos, se observa que la vivienda se encuentra dentro del rango de financiamiento disponible.
tipo | zona | barrio | estrato | areaconst | habitaciones | banios | parqueaderos | preciom |
---|---|---|---|---|---|---|---|---|
Casa | Zona Norte | El Bosque | 4 | 270.0 | 4 | 4 | 2 | 315 |
Casa | Zona Norte | La Flora | 5 | 200.0 | 4 | 4 | 2 | 320 |
Casa | Zona Norte | La Flora | 5 | 230.0 | 4 | 4 | 2 | 320 |
Casa | Zona Norte | La Merced | 4 | 200.0 | 4 | 4 | 2 | 320 |
Casa | Zona Norte | La Merced | 4 | 260.0 | 4 | 3 | 1 | 330 |
Casa | Zona Norte | Prados Del Norte | 5 | 246.0 | 4 | 4 | 2 | 330 |
Casa | Zona Norte | El Bosque | 4 | 300.0 | 4 | 4 | 3 | 335 |
Casa | Zona Norte | El Bosque | 5 | 250.0 | 4 | 4 | 2 | 340 |
Casa | Zona Norte | Vipasa | 5 | 203.0 | 4 | 3 | 2 | 340 |
Casa | Zona Norte | Vipasa | 4 | 264.5 | 4 | 4 | 2 | 340 |
Aunque no se identifican casas en la Zona Norte que cumplan estrictamente con todos los criterios de la Vivienda 1, sí existen opciones muy próximas en barrios como La Flora, La Merced y El Bosque.
Estas alternativas cumplen con el área construida (200 m²), el estrato socioeconómico (4 o 5), el número de habitaciones (4) y el presupuesto disponible, pero presentan diferencias en el número de baños y parqueaderos.
barrio | zona | tipo | areaconst | estrato | banios | habitaciones | parqueaderos | preciom |
---|---|---|---|---|---|---|---|---|
Acopi | Zona Sur | Apartamento | 96 | 4 | 2 | 3 | 1 | 290 |
Aguablanca | Zona Sur | Apartamento | 40 | 3 | 1 | 2 | 1 | 78 |
Aguacatal | Zona Sur | Apartamento | 194 | 6 | 5 | 3 | 2 | 875 |
tipo | n |
---|---|
Apartamento | 2787 |
zona | n |
---|---|
Zona Sur | 2787 |
Al graficar en el mapa los 2.787 apartamentos clasificados como “Zona Sur” se observa que la mayoría de los registros se concentran efectivamente en el sector sur de la ciudad, lo cual es coherente con la información de la variable zona.
No obstante, también se identifican agrupaciones de viviendas en sectores centrales y en algunos barrios tradicionalmente asociados a otras zonas de la ciudad. Esto indica que, al igual que en el caso de la Zona Norte, existen registros que, a pesar de estar clasificados como “Zona Sur” en la base de datos, no se localizan geográficamente en esa zona.
En el caso de los apartamentos de la Zona Sur, la matriz de correlaciones evidencia que:
Los gráficos de dispersión confirman que área construida y estrato son los principales determinantes del precio, mientras que las demás variables aportan información menos consistente.
Los diagnósticos del modelo señalan signos de heterocedasticidad y autocorrelación en los residuos, lo que indica que variables adicionales como piso, barrio o coordenadas geográficas podrían mejorar el ajuste en futuros modelos.
term | Estimate | Std_Error | t_value | p_value | Significativo |
---|---|---|---|---|---|
(Intercept) | -261.63 | 15.63 | -16.74 | 0 | Sí |
areaconst | 1.29 | 0.05 | 23.79 | 0 | Sí |
estrato | 60.90 | 3.08 | 19.75 | 0 | Sí |
habitaciones | -24.84 | 3.89 | -6.38 | 0 | Sí |
parqueaderos | 72.91 | 3.96 | 18.42 | 0 | Sí |
banios | 50.70 | 3.40 | 14.93 | 0 | Sí |
R2 | R2_Ajustado | Error_Estandar | Estadistico_F | p_value |
---|---|---|---|---|
0.749 | 0.748 | 98.02 | 1413.8 | 0 |
El modelo para apartamentos en la Zona Sur indica que:
El R² ajustado es 0.75, lo que significa que el modelo explica aproximadamente el 75% de la variación en el precio.
El ajuste es adecuado, pero se observan indicios de heterocedasticidad y autocorrelación en residuos, lo que confirma la necesidad de considerar variables adicionales como piso, barrio o ubicación geográfica exacta para robustecer el modelo.
Estadistico_DW | p_value | |
---|---|---|
DW | 1.533 | 0 |
Variable | VIF | |
---|---|---|
areaconst | areaconst | 2.067 |
estrato | estrato | 1.545 |
habitaciones | habitaciones | 1.429 |
parqueaderos | parqueaderos | 1.738 |
banios | banios | 2.529 |
En la validación de supuestos para el modelo de apartamentos en la Zona Sur se observan los siguientes aspectos:
En conclusión, el modelo para apartamentos cumple de manera razonable los supuestos de regresión lineal, aunque la autocorrelación detectada en los residuos es un aspecto que debe considerarse al interpretar los resultados.
Estimado | Limite_Inferior | Limite_Superior |
---|---|---|
675 | 481.5 | 868.6 |
La predicción del modelo de regresión para la Vivienda 2 (Apartamento en Zona Sur, área 300 m², estrato 5-6, 5 habitaciones, 3 baños y 3 parqueaderos) arroja un precio estimado de 675 millones.
tipo | zona | barrio | estrato | areaconst | habitaciones | banios | parqueaderos | preciom |
---|---|---|---|---|---|---|---|---|
Apartamento | Zona Sur | Seminario | 5 | 300 | 6 | 5 | 3 | 670 |
Apartamento | Zona Sur | Guadalupe | 5 | 573 | 5 | 8 | 3 | 730 |
En el caso de la Vivienda 2, aunque se identifican apartamentos en la Zona Sur dentro del presupuesto disponible (≤ 850 millones), ninguno cumple de manera estricta con todas las características planteadas.
Las opciones encontradas en barrios como Seminario y
Guadalupe cumplen con el área construida (≥ 300 m²), el estrato
socioeconómico (5) y el número de parqueaderos (3), además de estar
dentro del rango de precio.
Sin embargo, presentan diferencias en el número de habitaciones y baños
respecto al perfil inicial de la Vivienda 2.
Esto indica que, aunque existen alternativas cercanas y viables en la Zona Sur, no se encontró una oferta que coincida exactamente con todos los criterios establecidos.
Del análisis realizado para ambas solicitudes se concluye lo siguiente:
En ambas zonas se observan alternativas viables, aunque ninguna
coincide al 100% con los criterios definidos.
Esto refleja que, si bien los modelos y filtros permiten acercarse a
opciones potenciales, en la práctica los compradores deberán
flexibilizar algunos atributos (como baños o
parqueaderos) para encontrar una vivienda ajustada al
presupuesto disponible.
En conclusión, los resultados son coherentes con el mercado
inmobiliario de Cali:
el área construida y el estrato socioeconómico son los factores más
determinantes en el precio, pero las demás características
(habitaciones, baños y parqueaderos) presentan una mayor variabilidad en
la oferta.