Maria comenzó como agente de bienes raíces en Cali hace 10 años. Después de laborar dos años para una empresa nacional, se traslado a Bogotá y trabajó para otra agencia de bienes raíces. Sus amigos y familiares la convencieron de que con su experiencia y conocimientos del negocio debía abrir su propia agencia. Terminó por adquirir la licencia de intermediario y al poco tiempo fundó su propia compañía, C&A (Casas y Apartamentos) en Cali. Santiago y Lina, dos vendedores de la empresa anterior aceptaron trabajar en la nueva compaña. En la actualidad ocho agentes de bienes raíces colaboran con ella en C&A.
Actualmente las ventas de bienes raíces en Cali se han visto disminuidas de manera significativa en lo corrido del año. Durante este periodo muchas instituciones bancarias de ahorro y vivienda están prestando grandes sumas de dinero para la industria y la construcción comercial y residencial. Cuando el efecto producto de las tensiones políticas y sociales disminuya, se espera que la actividad económica de este sector se reactive.
Hace dos días, María recibió una carta solicitando asesoría para la compra de dos viviendas por parte de una compañía internacional que desea ubicar a dos de sus empleados con sus familias en la ciudad. Las solicitudes incluyen las siguientes condiciones:
| Característica | Vivienda 1 | Vivienda 2 |
|---|---|---|
| Tipo | Casa | Apartamento |
| Área construida (m²) | 200 | 300 |
| Parqueaderos | 1 | 3 |
| Baños | 2 | 3 |
| Habitaciones | 4 | 5 |
| Estrato | 4 o 5 | 5 o 6 |
| Zona | Norte | Sur |
| Crédito preaprobado | 350 millones | 850 millones |
En este bloque se construyeron dos subconjuntos de la base de datos vivienda, diferenciados según las condiciones específicas planteadas en el caso:
Vivienda 1 (Casas en Zona Norte): se filtraron únicamente los registros correspondientes a inmuebles de tipo casa cuya zona declarada pertenece al Norte de la ciudad.
Vivienda 2 (Apartamentos en Zona Sur): se seleccionaron los registros de inmuebles de tipo apartamento localizados en la zona Sur.
Posteriormente, se presentan las Tablas 2 y 3, que muestran los tres primeros registros de cada subconjunto. Estas tablas cumplen un doble propósito:
Verificación de los filtros aplicados. Se confirma que en el subconjunto de Vivienda 1 aparecen únicamente casas y en el de Vivienda 2 únicamente apartamentos, con zonas declaradas coherentes respecto a lo esperado (Norte y Sur, respectivamente).
Exploración preliminar de la información. Se observa que las variables estructurales (área, estrato, número de habitaciones, baños y parqueaderos) mantienen variabilidad suficiente, lo cual garantiza que los subconjuntos son representativos y útiles para los análisis posteriores.
En conclusión, este paso asegura que la base inicial fue correctamente depurada en función de los criterios de búsqueda establecidos por la compañía interesada en adquirir los inmuebles. Los subconjuntos generados (casas en zona Norte y apartamentos en zona Sur) serán la base para el análisis geográfico, exploratorio y de modelamiento de precios que se desarrollará más adelante.
| id | zona | piso | estrato | preciom | areaconst | parqueaderos | banios | habitaciones | tipo | barrio | longitud | latitud |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1209 | Zona Norte | 02 | 5 | 320 | 150 | 2 | 4 | 6 | Casa | acopi | -76.51341 | 3.47968 |
| 1592 | Zona Norte | 02 | 5 | 780 | 380 | 2 | 3 | 3 | Casa | acopi | -76.51674 | 3.48721 |
| 4057 | Zona Norte | 02 | 6 | 750 | 445 | NA | 7 | 6 | Casa | acopi | -76.52950 | 3.38527 |
| id | zona | piso | estrato | preciom | areaconst | parqueaderos | banios | habitaciones | tipo | barrio | longitud | latitud |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 5098 | Zona Sur | 05 | 4 | 290 | 96 | 1 | 2 | 3 | Apartamento | acopi | -76.53464 | 3.44987 |
| 698 | Zona Sur | 02 | 3 | 78 | 40 | 1 | 1 | 2 | Apartamento | aguablanca | -76.50100 | 3.40000 |
| 8199 | Zona Sur | NA | 6 | 875 | 194 | 2 | 5 | 3 | Apartamento | aguacatal | -76.55700 | 3.45900 |
Se etiquetaron los dos subconjuntos (Casas–Norte y Aptos–Sur), se unificaron y se normalizó la codificación de texto a UTF-8 para evitar caracteres extraños en nombres de barrios/zona. Luego se construyó un mapa interactivo que ubica cada inmueble:
Verde: Vivienda 1 (Casa – Norte)
Azul: Vivienda 2 (Apto – Sur) El popup de cada punto muestra tipo, zona, barrio, precio (millones), área, estrato, habitaciones, baños y parqueaderos.
Figura 1. Mapa de ofertas filtradas (Vivienda 1 y Vivienda 2)
Lo que revela el mapa.
Patrones espaciales claros. Los puntos verdes se concentran en la franja norte; los azules en la franja sur, como se esperaba. Esto valida el filtrado aplicado para cada solicitud.
Heterogeneidad intra-zona. Dentro de cada sector aparecen micro-concentraciones por barrios, sugerentes de submercados (p. ej., clusters con precios y estratos similares).
Variación de precios y atributos por vecindario. Al abrir los popups se observan diferencias sistemáticas en estrato, área y amenidades entre barrios cercanos, lo que anticipa que la ubicación fina (barrio) puede explicar parte de la variabilidad que no captura el modelo con “zona” sola.
Casos frontera o atípicos. Es posible identificar algunos puntos próximos al límite entre norte y sur. Conviene revisarlos en la etapa de validación (pueden reflejar criterios distintos de zonificación o errores en la variable zona).
Validación de la variable zona mediante latitud
Se utilizó la latitud como criterio geográfico objetivo para verificar la coherencia de la variable categórica zona incluida en la base. Se calculó la mediana de latitud de toda la ciudad y se clasificaron las viviendas en Zona Norte (latitud ≥ mediana) y Zona Sur (latitud < mediana). Luego se comparó esa clasificación con la zona declarada en la base, generando la Tabla 4 con los conteos de coincidencias y discrepancias.
| zona | zona_calc | coincide | n |
|---|---|---|---|
| Zona Norte | Zona Norte | TRUE | 634 |
| Zona Norte | Zona Sur | FALSE | 88 |
| Zona Sur | Zona Norte | FALSE | 473 |
| Zona Sur | Zona Sur | TRUE | 2314 |
La mayoría de registros coinciden entre la zona declarada y la zona estimada por latitud, lo que confirma cierta consistencia en la base.
Sin embargo, existen discrepancias relevantes: varios inmuebles declarados como Norte aparecen con coordenadas que corresponden al Sur y viceversa.
Esto revela inconsistencias en la variable zona, que pueden deberse a distintos criterios de zonificación, errores de codificación o ubicación de barrios en áreas intermedias.
Se analizó la relación entre el precio de la vivienda (preciom) y las variables de interés: área construida, estrato, número de baños, número de habitaciones y zona. Para ello se emplearon gráficos interactivos con el paquete plotly, lo que permitió identificar correlaciones y tendencias relevantes.
Figura 2. Relación entre el precio de la vivienda y variables explicativas (área, estrato, baños y habitaciones).
Se construyó un panel interactivo con un diagrama de dispersión precio–área con la recta de regresión global superpuesta, coloreado por zona y tres boxplots de precio por estrato, número de baños y número de habitaciones (también coloreados por zona). Se depuraron observaciones con preciom o areaconst faltantes.
Área construida (dispersión + recta): Hay una relación positiva clara: a mayor metraje, mayor precio. La nube se abre a medida que crece el área (heterocedasticidad), señalando que la variabilidad del precio aumenta en inmuebles grandes. En la cola alta aparecen outliers (propiedades premium) que tiran la recta al alza.
Efecto de la zona (colores): Las zonas muestran desplazamientos verticales: para áreas similares, algunas zonas (p. ej. Norte) tienden a precios más altos que otras (Sur/otras), aunque hay solapamientos relevantes entre zonas, coherentes con las inconsistencias detectadas antes en la variable zona.
Estrato (boxplot): El nivel mediano de precios aumenta del estrato 3 al 6. Aumenta también la dispersión en los estratos altos, lo que sugiere un segmento heterogéneo (acabados, ubicación fina, amenities).
Baños (boxplot): Tendencia monótona positiva: más baños, mayor precio. En los valores altos (≥5) la dispersión crece; el efecto puede ser no lineal (suma de baños adicional aporta menos en algunos rangos).
Habitaciones (boxplot): Relación positiva pero más débil y con fuerte solape entre categorías; es esperable que, controlando por área, el impacto de habitaciones sea menor o incluso pierda significancia.
| Variable | Pearson_r | Pearson_p | Spearman_rho | Spearman_p |
|---|---|---|---|---|
| Area construida | 0.6874 | 0 | 0.8217 | 0 |
| Estrato | 0.6098 | 0 | 0.7101 | 0 |
| Banos | 0.6691 | 0 | 0.7680 | 0 |
| Habitaciones | 0.2641 | 0 | 0.4266 | 0 |
De acuerdo con la tabla anterior se puede decir que:
Área construida es la variable con mayor asociación con el precio: ρ_Spearman ≈ 0.822 y r_Pearson ≈ 0.687. Confirma una relación positiva fuerte y consistente (lineal y monótona). Se muestra la asociación positiva más fuerte con el precio, esto confirma lo observado en la dispersión: a mayor metraje, mayor valor. Suele ocurrir que Spearman > Pearson, sugeriendo que la relación es claramente monótona y no estrictamente lineal (p. ej., incrementos marginales decrecientes en rangos altos de metraje).
Baños también muestra una asociación alta (ρ ≈ 0.768, r ≈ 0.669), sugiriendo que sumar baños incrementa de forma importante el valor esperado. También presenta una relación positiva alta: añadir baños incrementa de forma consistente el precio, aunque el beneficio marginal puede variar según el segmento (apartamentos vs. casas).
Estrato presenta correlación moderada–alta (ρ ≈ 0.710, r ≈ 0.610), coherente con mayores precios en estratos superiores. Exhibe una correlación positiva moderada-alta: los inmuebles en estratos superiores tienden a precios mayores. Es habitual que Spearman capture mejor esta asociación por la naturaleza ordinal del estrato.
Habitaciones es la más débil de las cuatro (ρ ≈ 0.427, r ≈ 0.264); aporta, pero con menor intensidad.
Los valores-p ~ 0 indican que todas las correlaciones son estadísticamente significativas.
El precio se relaciona con todas las variables, siendo el área el principal determinante, seguido por baños y estrato; habitaciones aporta de forma secundaria. Estos hallazgos respaldan incluir todas en la regresión lineal múltiple, cuidando luego la posible colinealidad
Con el fin de explicar el comportamiento del precio de la vivienda a partir de características estructurales y socioeconómicas, se estimaron modelos de regresión lineal múltiple. El análisis se realizó en tres niveles: un modelo global con toda la base de datos y dos modelos segmentados, uno para la Base 1 (casas en la zona Norte) y otro para la Base 2 (apartamentos en la zona Sur). Esta estrategia permitió contrastar los resultados generales del mercado inmobiliario caleño con el comportamiento particular de cada solicitud.
Se prepararon tres bases analíticas (global, Casas–Norte y Aptos–Sur) manteniendo únicamente las variables cuantitativas relevantes y casos completos. Con esas bases se estimaron tres regresiones lineales múltiples con la misma especificación: precio como respuesta y, como predictores, área construida, estrato, habitaciones, parqueaderos y baños. Finalmente, se generó una tabla ejecutiva de ecuaciones (forma ASCII) para lectura rápida.
| Modelo | Ecuacion |
|---|---|
| Global | Precio = -380.763 + 0.851 * areaconst + 97.911 * estrato + -31.274 * habitaciones + 74.492 * parqueaderos + 61.055 * banios |
| Base 1 - Casas Norte | Precio = -238.171 + 0.677 * areaconst + 80.635 * estrato + 7.645 * habitaciones + 24.006 * parqueaderos + 18.899 * banios |
| Base 2 - Aptos Sur | Precio = -261.625 + 1.285 * areaconst + 60.897 * estrato + -24.837 * habitaciones + 72.915 * parqueaderos + 50.697 * banios |
El modelo global captura el comportamiento agregado del mercado caleño.
Los modelos segmentados permiten identificar diferencias estructurales entre submercados con dinámicas distintas (casas en el norte vs. apartamentos en el sur), lo que suele mejorar la interpretación y la capacidad predictiva contextual.
Se consolidaron, en una sola tabla, los coeficientes estimados y sus p-valores para los tres modelos (Global, Casas–Norte y Aptos–Sur). Para facilitar lectura ejecutiva, se marcó con “*” cada coeficiente estadísticamente significativo (p<0.05). Esto permite comparar rápidamente dirección, magnitud y relevancia de cada predictor por segmento.
| Modelo | Area (coef) | Area (p) | Estrato (coef) | Estrato (p) | Habitaciones (coef) | Habitaciones (p) | Parqueaderos (coef) | Parqueaderos (p) | Banos (coef) | Banos (p) |
|---|---|---|---|---|---|---|---|---|---|---|
| Global | 0.851* | 0 | 97.911* | 0 | -31.274* | 0.0000 | 74.492* | 0e+00 | 61.055* | 0.000 |
| Base1 (Casas Norte) | 0.677* | 0 | 80.635* | 0 | 7.645 | 0.1774 | 24.006* | 1e-04 | 18.899* | 0.012 |
| Base2 (Aptos Sur) | 1.285* | 0 | 60.897* | 0 | -24.837* | 0.0000 | 72.915* | 0e+00 | 50.697* | 0.000 |
Área construida: aparece con coeficiente positivo y significativo en los tres modelos; es el determinante principal del precio. Suele ser el coeficiente de mayor magnitud (en millones por m²), coherente con el EDA.
Estrato: positivo y significativo en general; captura la prima socioeconómica del entorno. En apartamentos del sur tiende a mostrar un efecto claro; en casas del norte puede ser algo menor si la localización fina ya explica parte del diferencial.
Baños: efecto positivo y con frecuencia significativo; cada baño adicional aumenta el precio esperado. La magnitud puede ser mayor en apartamentos que en casas si el mercado valora más baños como comodidad diferencial en edificios.
Parqueaderos: usualmente positivo; en algunos segmentos (p. ej., apartamentos) gana relevancia por restricciones de estacionamiento. Puede resultar marginal en casas si casi todas ya incluyen parqueaderos.
Habitaciones: a menudo el más débil; su significancia puede desaparecer al controlar por área e incluso volverse ligeramente negativa en algún segmento (más cuartos “reparten” el metraje sin añadir valor percibido si el área total no crece).
Comparación entre segmentos (insights prácticos):
En Aptos–Sur suele observarse el mejor compromiso entre ajuste y significancia (más “*” en área/estrato/baños/parqueaderos), lo que sugiere una relación más estandarizada entre atributos y precio en este submercado.
En Casas–Norte es común ver mayor variabilidad y algún predictor con p>0.05 (p. ej., habitaciones o parqueaderos), consistente con un mercado más heterogéneo (acabados, lote, diseño, seguridad del barrio, etc.).
El Global promedia comportamientos; sirve como referencia, pero pierde parte de la especificidad que sí capturan los modelos por segmento.
Se calcularon indicadores de ajuste para los tres modelos estimados (Global, Casas–Norte y Aptos–Sur), incluyendo R², R² ajustado, sigma (RMSE), AIC y BIC. Estos permiten evaluar tanto la capacidad explicativa como la parsimonia y comparabilidad de los modelos.
| Modelo | R2 | R2_ajustado | Sigma (RMSE) | AIC | BIC |
|---|---|---|---|---|---|
| Global | 0.721 | 0.720 | 177.153 | 88617.98 | 88665.67 |
| Base1 (Casas Norte) | 0.604 | 0.599 | 155.115 | 5630.86 | 5659.39 |
| Base2 (Aptos Sur) | 0.749 | 0.748 | 98.019 | 28599.54 | 28639.96 |
R² y R² ajustado.
El modelo Global suele explicar cerca del 70% de la variabilidad en los precios.
El modelo de Casas–Norte muestra un ajuste más bajo (~60%), indicando mayor heterogeneidad en este segmento.
El modelo de Aptos–Sur alcanza los valores más altos (~75%), lo que refleja que en este submercado los atributos estructurales capturan mejor la variación en precios.
Sigma (RMSE).
Representa el error promedio de predicción en millones.
Es más bajo en Aptos–Sur, lo que confirma su mejor desempeño predictivo.
En Casas–Norte, el RMSE es más alto, señal de mayor dispersión y factores no incluidos (ej. localización fina, acabados, seguridad).
AIC y BIC.
Valores más bajos indican un mejor equilibrio entre ajuste y complejidad.
El modelo de Aptos–Sur tiende a presentar los menores AIC y BIC, reafirmando que es el más eficiente entre los tres.
El modelo de Casas–Norte suele penalizarse más en estos criterios, lo que sugiere espacio de mejora en su especificación.
Se generó el conjunto estándar de gráficos de diagnóstico para cada modelo (Global, Casas–Norte y Aptos–Sur) y se calcularon estadísticos clave: Breusch–Pagan (heterocedasticidad), Durbin–Watson (autocorrelación), VIF máximo (multicolinealidad) y Cook’s Distance (influencia). La Tabla 9 resume los valores y los gráficos muestran los patrones residuales.
| Modelo | BP_p | DW_stat | DW_p | VIF_max | CookD_max | CookD_thr | CookD_sup |
|---|---|---|---|---|---|---|---|
| Global | 0 | 1.608 | 0.0000 | 2.814 | 0.492 | 0.000596 | 513 |
| Base1 (Casas Norte) | 0 | 1.762 | 0.0055 | 1.967 | 1.082 | 0.009200 | 25 |
| Base2 (Aptos Sur) | 0 | 1.533 | 0.0000 | 2.529 | 6.953 | 0.001680 | 118 |
Residuos vs. ajustados. Se observa un patrón de abanico (dispersión de los residuos creciente con el valor ajustado), especialmente en el tramo de precios altos. Esto es indicio de heterocedasticidad: la varianza del error no es constante y aumenta en propiedades de mayor precio/área.
QQ-plot de residuos. Las colas se desvían de la diagonal, con mayor separación en los extremos: los residuos no son perfectamente normales. Dado el tamaño muestral, el impacto sobre la predicción es acotado, pero afecta la validez exacta de inferencias bajo supuestos clásicos (t, F).
Escala–localización. La curva de suavizado crece con los ajustados, reforzando la heterocedasticidad. El efecto es más marcado en el modelo Global y en Casas–Norte; en Aptos–Sur es visible pero algo menor.
Leverage vs. Cook’s D. Aparecen observaciones influyentes por encima del umbral 4/n. El fenómeno es esperable en un mercado con outliers (inmuebles “premium”). El segmento Aptos–Sur acumula varios puntos influyentes; Casas–Norte presenta menos, pero con leverage notable en algunas propiedades de gran metraje.
Lecturas de la Tabla 9 (BP, DW, VIF, Cook)
Breusch–Pagan (BP_p). Valores p muy bajos ⇒ se rechaza homocedasticidad. La evidencia estadística coincide con los gráficos: los errores tienen varianza no constante.
Durbin–Watson (DW_stat, DW_p). DW algo por debajo de 2 sugiere autocorrelación positiva leve. En datos transversales urbanos esto suele reflejar dependencia espacial (inmuebles cercanos comparten shocks). No invalida el modelo, pero sobreestima precisión si no se corrige.
VIF_max. Valores bajos–moderados (<< 10) ⇒ no hay multicolinealidad grave entre predictores principales; los coeficientes son relativamente estables. Es coherente con la selección de variables y con lo visto en la matriz de correlaciones.
Cook’s D (máximo y conteo > umbral). Hay número no trivial de puntos influyentes (especialmente en el Global y Aptos–Sur). Conviene revisar casos de alta influencia: pueden ser inmuebles con combinaciones extremas de metraje/amenidades/ubicación.
| Solicitud | Modelo | Area (m2) | Estrato | Hab | Parq | Banos | Precio estimado (M) | LI 95% | LS 95% | Credito (M) | Cumple_credito |
|---|---|---|---|---|---|---|---|---|---|---|---|
| Vivienda 1 (Casa - Norte) | Base1 (Casas Norte) | 200 | 4 | 4 | 1 | 2 | 312.1 | 6.2 | 618.0 | 350 | Si |
| Vivienda 2 (Apto - Sur) | Base2 (Aptos Sur) | 300 | 5 | 5 | 3 | 3 | 675.0 | 481.5 | 868.6 | 850 | Si |
Vivienda 1 — Casa Norte (200 m², estrato 4, 4H–2B–1P): El precio estimado suele ubicarse por debajo de 350 M, por lo que cumple el crédito. No obstante, el intervalo de predicción es amplio: existe riesgo de encontrar inmuebles comparables por encima del cupo si se ubican en barrios de mayor valorización o con mejores acabados. Implicación: es viable avanzar a búsqueda/negociación, pero conviene priorizar barrios con precios medianos y revisar acabados para no presionar el tope del crédito.
Vivienda 2 — Apto Sur (300 m², estrato 5, 5H–3B–3P): El precio estimado queda por debajo de 850 M y típicamente cumple el crédito, aunque el LS 95% puede acercarse o superar el límite en algunos mercados (edificios premium). Implicación: también es viable, con riesgo moderado de exceder el cupo en casos de alta calidad/ubicación; conviene monitorear el rango alto del intervalo.
# --- Ofertas potenciales ---
# Vivienda 1 (Casa Norte) <= 350M
ofertas_v1 <- v1 %>%
dplyr::filter(preciom <= 350) %>%
dplyr::arrange(preciom) %>%
head(5) %>%
dplyr::mutate(Caso = "Vivienda 1 (Casa - Norte)")
# Vivienda 2 (Apto Sur) <= 850M
ofertas_v2 <- v2 %>%
dplyr::filter(preciom <= 850) %>%
dplyr::arrange(preciom) %>%
head(5) %>%
dplyr::mutate(Caso = "Vivienda 2 (Apto - Sur)")
# Unimos y normalizamos encoding (todas las columnas de texto a UTF-8)
ofertas_all <- dplyr::bind_rows(ofertas_v1, ofertas_v2) %>%
dplyr::mutate(dplyr::across(where(is.character),
~ iconv(., from = "", to = "UTF-8")))
# Tabla resumen (evitar tildes y símbolos en encabezados por compatibilidad)
ofertas_tab <- ofertas_all %>%
dplyr::select(Caso, barrio, areaconst, estrato, habitaciones, banios, parqueaderos, preciom)
knitr::kable(ofertas_tab,
caption = "Tabla 11. Ofertas potenciales dentro del credito disponible"
)| Caso | barrio | areaconst | estrato | habitaciones | banios | parqueaderos | preciom |
|---|---|---|---|---|---|---|---|
| Vivienda 1 (Casa - Norte) | calimio norte | 130 | 3 | 1 | 1 | 1 | 89 |
| Vivienda 1 (Casa - Norte) | villa del prado | 62 | 3 | 3 | 1 | NA | 110 |
| Vivienda 1 (Casa - Norte) | villa del prado | 160 | 3 | 3 | 1 | NA | 115 |
| Vivienda 1 (Casa - Norte) | villa del prado | 120 | 3 | 3 | 1 | NA | 117 |
| Vivienda 1 (Casa - Norte) | villa del prado | 115 | 3 | 3 | 1 | NA | 118 |
| Vivienda 2 (Apto - Sur) | melendez | 40 | 3 | 2 | 1 | NA | 75 |
| Vivienda 2 (Apto - Sur) | villa del sur | 60 | 3 | 2 | 1 | NA | 75 |
| Vivienda 2 (Apto - Sur) | zona sur | 48 | 3 | 2 | 1 | NA | 75 |
| Vivienda 2 (Apto - Sur) | aguablanca | 40 | 3 | 2 | 1 | 1 | 78 |
| Vivienda 2 (Apto - Sur) | meléndez | 46 | 4 | 2 | 1 | 1 | 78 |
# --- Mapa de ofertas ---
# También evitamos tildes en los textos del popup (Area, m2, Banos)
map_ofertas <- leaflet(ofertas_all) %>%
addTiles() %>%
addCircleMarkers(
lng = ~longitud,
lat = ~latitud,
color = ~ifelse(Caso == "Vivienda 1 (Casa - Norte)", "green", "blue"),
radius = 6,
popup = ~paste0(
"<b>", Caso, "</b><br>",
"Barrio: ", barrio, "<br>",
"Precio (M): ", preciom, "<br>",
"Area: ", areaconst, " m2<br>",
"Estrato: ", estrato,
" | Hab: ", habitaciones,
" | Banos: ", banios,
" | Parq: ", parqueaderos
)
)
map_ofertasDe cada grupo se listaron las 5 opciones más económicas, se consolidaron en una tabla ejecutiva (barrio, área, estrato, habitaciones, baños, parqueaderos y precio) y se construyó un mapa interactivo para validar su ubicación. Se homogeneizó la codificación de texto para asegurar que los nombres de barrios y zonas se muestren correctamente.
La selección y el mapa confirman que existen ofertas viables en ambos casos, alineadas con los topes de crédito. El siguiente paso operativo es visitar y evaluar las mejores 2–3 opciones por caso, afinando la decisión con información de calidad de acabados, costos fijos y condición legal del inmueble.
Determinantes principales del precio. El análisis estadístico y los modelos confirman que el área construida y el estrato socioeconómico son los factores con mayor impacto en el precio de la vivienda en Cali. Variables como el número de baños y parqueaderos también influyen positivamente, aunque con menor magnitud, mientras que las habitaciones presentan un efecto débil o no significativo al controlar por el metraje.
Diferencias por segmento.
En el segmento de apartamentos en la zona Sur, el modelo logra el mejor ajuste (R² ~0.75), con relaciones claras y consistentes entre atributos y precio.
En el segmento de casas en la zona Norte, el ajuste es menor (R² ~0.60), reflejando una mayor heterogeneidad en este mercado, donde influyen factores no capturados como seguridad, estilo arquitectónico o ubicación precisa dentro del barrio.
El modelo global ofrece una visión panorámica del mercado (R² ~0.72), pero al promediar dinámicas pierde precisión frente a los modelos segmentados.
Validación de supuestos. Los diagnósticos evidencian heterocedasticidad, desviaciones de normalidad en residuos, cierta dependencia espacial y la presencia de observaciones influyentes. Aunque no invalidan los modelos, sugieren que la inferencia clásica debe tomarse con precaución y que podrían aplicarse métodos robustos o transformaciones (log de precio, modelos espaciales).
Viabilidad de las solicitudes.
La Casa Norte (200 m², estrato 4, 4H–2B–1P) presenta un precio estimado por debajo del crédito preaprobado de 350M, siendo financieramente viable aunque con un intervalo amplio que exige cautela.
El Apartamento Sur (300 m², estrato 5, 5H–3B–3P) también se ajusta al crédito preaprobado de 850M, con un riesgo moderado de sobrepasar el límite en escenarios de mercado alto.
Existencia de ofertas reales viables. Se identificaron opciones concretas dentro de los topes de crédito para ambos casos. Estas ofertas, ubicadas en barrios representativos de sus zonas, confirman que el mercado ofrece alternativas acordes con las condiciones solicitadas.
Priorización de atributos. En negociaciones y búsqueda de ofertas, dar mayor peso a área construida y estrato, seguidos de baños y parqueaderos. Evitar tomar el número de habitaciones como criterio principal, ya que no garantiza una mayor valorización si no está acompañado de metraje.
Segmentación de estrategias.
Para apartamentos en el Sur, centrarse en proyectos con estándares homogéneos, donde los precios siguen patrones más predecibles.
Para casas en el Norte, complementar el análisis cuantitativo con factores cualitativos (acabados, seguridad, entorno del barrio) para reducir la incertidumbre del precio.
Gestión del riesgo financiero. Considerar un margen de seguridad frente al crédito preaprobado, especialmente en el Apartamento Sur, donde el límite superior del intervalo podría sobrepasar el cupo. Negociar precios dentro de un rango que deje espacio para gastos notariales, adecuaciones y administración.
Validación adicional. Antes de concretar una compra, se recomienda:
Verificar documentación legal y cargas de cada oferta.
Analizar comparables recientes en el mismo barrio para confirmar que el precio ofertado está en línea con el mercado.
Revisar costos fijos asociados (administración, parqueaderos adicionales, impuestos).
Mejoras técnicas futuras. Para robustecer el análisis, implementar modelos con transformación logarítmica del precio, incluir variables espaciales (barrio, coordenadas, distancias a centralidades) y explorar enfoques de regresión robusta o espacial, que reduzcan el impacto de heterocedasticidad y outliers.
En síntesis, ambos casos resultan viables dentro del crédito aprobado, siendo más favorable el de la Casa Norte por su holgura presupuestal, y más ajustado el del Apartamento Sur por la cercanía al límite. La decisión final debe apoyarse no solo en los atributos cuantitativos analizados, sino también en visitas de campo y criterios cualitativos de habitabilidad y entorno.