Introducción al caso

María es agente inmobiliaria con diez años de experiencia y fundadora de C&A (Casas y Apartamentos) en Cali. Tras consolidar un equipo de ocho asesores, la empresa enfrenta un mercado local con baja dinámica de ventas en lo corrido del año. Aun así, el mayor apalancamiento bancario y la expectativa de reactivación económica permiten proyectar oportunidades si se toman decisiones soportadas en datos.

Hace dos días, C&A recibió la solicitud de una compañía internacional que busca ubicar en Cali a dos colaboradores con sus familias. El encargo pide asesoría integral para definir precio de mercado, viabilidad financiera y oferta disponible bajo dos perfiles:

Solicitud 1 — Vivienda 1: Casa en zona norte, aprox. 200 m², 4 habitaciones, 2 baños, 1 parqueadero, estrato 4–5, crédito preaprobado: 350 millones.

Solicitud 2 — Vivienda 2: Apartamento en zona sur, aprox. 300 m², 5 habitaciones, 3 baños, 3 parqueaderos, estrato 5–6, crédito preaprobado: 850 millones.

Objetivo del análisis

Apoyar la decisión de compra estimando el valor de mercado de ambos perfiles, verificando la factibilidad frente a los créditos asignados e identificando ofertas alineadas con los requisitos.

Condiciones de las viviendas solicitadas

E este punto buscamos filtrar la base para crear base1 con ofertas tipo “casa” ubicadas en la zona norte (estandarizando tipo/zona y numéricos). Mostraremos los primeros 3 registros, tablas de control (tipo/zona/estrato) y un mapa de puntos para validar la ubicación.

Tabla 1. Condiciones de Vivienda 1 y Vivienda 2
Característica Vivienda 1 Vivienda 2
Tipo casa apartamento
Área construida (m²) 200 300
Parqueaderos 1 3
Baños 2 3
Habitaciones 4 5
Estrato 4 5
Zona norte sur
Crédito preaprobado 350 millones 850 millones
Tabla 2. Registros iniciales — Vivienda 1 (Casas en Zona Norte)
id zona piso estrato areaconst parqueaderos banios habitaciones tipo barrio
1209 Zona Norte 02 5 150 2 4 6 Casa acopi
1592 Zona Norte 02 5 380 2 3 3 Casa acopi
4057 Zona Norte 02 6 445 NA 7 6 Casa acopi
Tabla 3. Registros iniciales — Vivienda 2 (Apartamentos en Zona Sur)
id zona piso estrato areaconst parqueaderos banios habitaciones tipo barrio
5098 Zona Sur 05 4 96 1 2 3 Apartamento acopi
698 Zona Sur 02 3 40 1 1 2 Apartamento aguablanca
8199 Zona Sur NA 6 194 2 5 3 Apartamento aguacatal
Tabla 4. Chequeo zonas — Solicitud 1 (debe decir ‘Zona Norte’ / ‘norte’)
zona n
Zona Norte 722
Tabla 5. Chequeo zonas — Solicitud 2 (debe decir ‘Zona Sur’ / ‘sur’)
zona n
Zona Sur 2787
Tabla 6. Conteo por etiqueta de zona (sin coordenadas)
zona_lbl n
norte 1920
otra 1676
sur 4726

La mayoría de las ofertas de sol1 (Casa / Norte) y de sol2 (Apto / Sur) cae en la zona esperada. Los pocos puntos cerca del centro o de los límites se explican por:

rótulos comerciales de zona (no límites administrativos),

geocodificación aproximada (centroides/direcciones),

heterogeneidad y typos en la variable zona.

Análisis exploratorio de datos

En esta sección medimos la relación entre el precio y las variables explicativas clave: área construida, estrato, baños y habitaciones.

Calculamos dos coeficientes por variable: Pearson (adecuado para relaciones lineales con variables numéricas) y Spearman (basado en rangos, robusto a no linealidades y apropiado cuando hay variables ordinales como el estrato). Para evitar sesgos, primero forzamos los campos a numéricos y eliminamos observaciones con datos faltantes en cada par de variables; si un par queda con menos de 3 observaciones completas, reportamos NA.

Presentamos los resultados por solicitud: (i) Casas en Zona Norte y (ii) Apartamentos en Zona Sur. Recordatorio: la correlación no implica causalidad; los coeficientes sólo cuantifican asociación y pueden verse afectados por outliers o variables omitidas.

Tabla 7. Correlaciones — Solicitud 1 (Casas en Zona Norte)
Par Correlación
cor(precio, areaconst) 0.7313480
cor(precio, estrato) 0.6123503
cor(precio, banios) 0.5233357
cor(precio, habitaciones) 0.3227096
Tabla 8. Correlaciones — Solicitud 2 (Apartamentos en Zona Sur)
Par Correlación
cor(precio, areaconst) 0.7579955
cor(precio, banios) 0.7196705
cor(precio, estrato) 0.6727067
cor(precio, habitaciones) 0.3317538

Área construida: r ≈ 0.73 → relación fuerte y positiva (≈ 53% de variación explicada, r²).

Estrato: r ≈ 0.61 → moderada–alta (~37%).

Baños: r ≈ 0.52 → moderada (~27%).

Habitaciones: r ≈ 0.32 → débil (~10%).

Lectura: en casas del norte, el tamaño (área) y el nivel socioeconómico mandan; baños ayuda, y habitaciones aporta poco una vez que el área ya captura el tamaño general.

Área construida: r ≈ 0.76 → muy fuerte (~58%).

Baños: r ≈ 0.72 → fuerte (~52%).

Estrato: r ≈ 0.67 → moderada–alta (~45%).

Habitaciones: r ≈ 0.33 → débil (~11%).

Lectura: en apartamentos del sur, baños pesa más que en casas; diferencia formatos/calidades (social/privado) y mueve el precio aun a igual área.

Dispersión con recta LM: todas las pendientes son positivas. Se aprecia heterocedasticidad (la dispersión del precio crece con el área y con los conteos) y outliers de precio alto → conviene usar SE robustos (como hicimos), o considerar transformar log(precio) / regresión cuantílica en extensiones futuras.

Variables discretas (estrato, baños, habitaciones): se ven “bandas” verticales; hay tendencia positiva pero con ruido mayor que en área (relación real, aunque más difusa).

Boxplots por zona:

Casas: el Sur muestra una mediana algo superior al Norte, y “Otra” es la más baja → la zona sí importa también en casas.

Apartamentos: “Otra” (centro-oeste) es la más cara, Sur queda intermedio y Norte es el más barato → tiene sentido mantener la segmentación por zona o incluir zona como factor en el modelo.

Para evaluar la relación entre precio y los atributos principales, estimamos correlaciones de Pearson y Spearman para área construida, estrato, baños y habitaciones, y visualizamos dispersogramas con recta LM y boxplots por zona; los resultados muestran asociaciones positivas en todas las variables, lideradas por área y estrato, con heterocedasticidad y outliers esperables en datos inmobiliarios.

Correlaciones (Pearson y Spearman) — Tabla 9. Solicitud 1 (Casas / Norte)
Variable N_pares Pearson_r Pearson_p Spearman_rho Spearman_p
areaconst 722 0.7313 0 0.8126 0
estrato 722 0.6124 0 0.7105 0
banios 722 0.5233 0 0.6170 0
habitaciones 722 0.3227 0 0.3979 0
Correlaciones (Pearson y Spearman) — Tabla 10. Solicitud 2 (Apartamentos / Sur)
Variable N_pares Pearson_r Pearson_p Spearman_rho Spearman_p
areaconst 2787 0.7580 0 0.8657 0
estrato 2787 0.6727 0 0.7521 0
banios 2787 0.7197 0 0.7010 0
habitaciones 2787 0.3318 0 0.3905 0
Correlaciones (Pearson y Spearman) — Tabla 11. Conjunto completo
Variable N_pares Pearson_r Pearson_p Spearman_rho Spearman_p
areaconst 8319 0.6874 0 0.8217 0
estrato 8319 0.6098 0 0.7101 0
banios 8319 0.6691 0 0.7680 0
habitaciones 8319 0.2641 0 0.4266 0

Tamaños muestrales y significancia.

Casas/Norte: N = 722; Aptos/Sur: N = 2 787; Conjunto: N = 8 319. Los p-values ≈ 0 por tamaño muestral → nos enfocamos en la magnitud de r (Pearson) y ρ (Spearman).

Área: r = 0.731 (ρ = 0.813) → fuerte y positiva; ≈ 53% de la varianza del precio (r²) se explica solo con área.

Estrato: r = 0.612 (ρ = 0.711) → moderada-alta; ≈ 37%.

Baños: r = 0.523 (ρ = 0.617) → moderada; ≈ 27%.

Habitaciones: r = 0.323 (ρ = 0.398) → débil; ≈ 10%.

ρ > r en todas sugiere relación monótona muy clara (no perfectamente lineal). En los gráficos hay heterocedasticidad: la dispersión del precio crece con el metraje.

Área: r = 0.758 (ρ = 0.866) → muy fuerte; ≈ 57–58%.

Baños: r = 0.720 (ρ = 0.701) → fuerte; ≈ 52%.

Estrato: r = 0.673 (ρ = 0.752) → moderada-alta; ≈ 45%.

Habitaciones: r = 0.332 (ρ = 0.391) → débil; ≈ 11%.

En aptos del sur, baños pesa más que en casas: distingue mejor calidades/amenidades.

Área r = 0.687 (ρ = 0.822), Baños r = 0.669 (ρ = 0.768), Estrato r = 0.610 (ρ = 0.710): los tres son drivers claros del precio.

Habitaciones r = 0.264 (ρ = 0.427): aporta poca señal por sí sola (ya está “captada” por el metraje).

El área construida es el determinante principal del precio en ambos segmentos; estrato y baños añaden poder explicativo; habitaciones aporta poco de manera marginal. Las relaciones son fuertes y monotónicas, con cierta no linealidad y heterocedasticidad que el siguiente modelo puede manejar con transformaciones y errores robustos.

Modelo de regresión lineal múltiple

Para cuantificar el efecto conjunto de los atributos de la vivienda sobre el precio, estimamos un modelo de regresión lineal múltiple con las variables del punto anterior: área construida, estrato, número de habitaciones, parqueaderos y baños. Ajustamos el modelo por separado para cada solicitud (Casas/Norte y Apartamentos/Sur) y para el conjunto completo. Reportamos los coeficientes (con errores estándar robustos tipo HC3, para mitigar heterocedasticidad), sus valores-p y medidas de ajuste (R², R² ajustado, RMSE). Además calculamos el VIF para revisar colinealidad entre predictores. En términos sustantivos, esperamos signos positivos: mantener todo lo demás constante, mayor área, estrato, baños, habitaciones o parqueaderos debería asociarse con mayor precio. Si alguna variable no resulta significativa o muestra signo inesperado, lo discutimos a la luz de posible colinealidad y de atributos omitidos (acabados, antigüedad, localización fina, etc.).

Modelo lineal múltiple (HC3) — Tabla 12. Solicitud 1 — Casas / Zona Norte
term Estimate Std. Error t value Pr(>|t|)
(Intercept) -238.1708979 45.784411 -5.202009 0.0000003
areaconst 0.6767346 0.147908 4.575375 0.0000062
estrato 80.6349477 12.154977 6.633904 0.0000000
habitaciones 7.6451100 6.979050 1.095437 0.2739398
parqueaderos 24.0059798 7.069626 3.395650 0.0007484
banios 18.8993776 10.462151 1.806452 0.0715483
Bondad de ajuste
N R2 R2_aj RMSE F p_model
435 0.6040956 0.5994813 155.1149 130.919 0
Modelo lineal múltiple (HC3) — Tabla 13. Solicitud 2 — Apartamentos / Zona Sur
term Estimate Std. Error t value Pr(>|t|)
(Intercept) -261.625007 23.3820483 -11.189140 0.0000000
areaconst 1.285049 0.3987112 3.223006 0.0012857
estrato 60.897089 3.9981181 15.231438 0.0000000
habitaciones -24.836930 6.9558097 -3.570674 0.0003631
parqueaderos 72.914680 15.1745212 4.805073 0.0000016
banios 50.696747 9.1455734 5.543310 0.0000000
Bondad de ajuste
N R2 R2_aj RMSE F p_model
2381 0.7485178 0.7479884 98.01942 1413.802 0
Modelo lineal múltiple (HC3) — Tabla 14. Conjunto completo (todas las viviendas)
term Estimate Std. Error t value Pr(>|t|)
(Intercept) -380.7629502 16.0271067 -23.75744 0
areaconst 0.8510035 0.0570696 14.91167 0
estrato 97.9107496 2.8980192 33.78540 0
habitaciones -31.2744340 3.1800057 -9.83471 0
parqueaderos 74.4922170 4.5785339 16.26988 0
banios 61.0553784 3.5981291 16.96865 0
Bondad de ajuste
N R2 R2_aj RMSE F p_model
6717 0.7206364 0.7204282 177.1525 3462.291 0
  1. Tabla 12. Casas / Zona Norte

Efectos:

Área: +0.677 M por m² (p≈6.2e-06).

Estrato: +80.6 M por nivel (p<0.001).

Parqueaderos: +24.0 M por cupo (p≈0.0007).

Baños: +18.9 M (p≈0.072, marginal).

Habitaciones: +7.6 M (p≈0.274, no sig.).

Lectura: el precio de las casas del norte lo explican sobre todo m², estrato y parqueaderos; una vez controlas por área/estrato, habitaciones pierde relevancia y baños queda al borde de significancia.

Ajuste: R²≈0.60, RMSE≈155 M → ajuste medio; errores típicos del orden de 155 millones.

  1. Tabla 13. Apartamentos / Zona Sur

Efectos:

Área: +1.285 M por m² (p≈0.0013).

Estrato: +60.9 M (p<0.001).

Parqueaderos: +72.9 M (p<0.001).

Baños: +50.7 M (p<0.001).

Habitaciones: −24.8 M (p≈0.00036).

Lectura: todos los efectos son significativos. El signo negativo de habitaciones es coherente a igual área: más cuartos implican espacios más pequeños y, en promedio, menor valoración del m² en aptos.

Ajuste: R²≈0.75, RMSE≈98 M → mejor que en casas; errores típicos ~98 millones.

  1. Tabla 14. Conjunto completo (todas las viviendas)

Efectos (todos p≈0): Área +0.851 M/m², Estrato +97.9 M, Parqueaderos +74.5 M, Baños +61.1 M, Habitaciones −31.3 M.

Ajuste: R²≈0.72, RMSE≈177 M. Patrón consistente con los modelos por segmento.

R² y calidad de ajuste

Casas/Norte: R²≈0.60 → ajuste medio.

Aptos/Sur: R²≈0.75 → ajuste alto.

Global: R²≈0.72 → alto para un modelo lineal sin variables finas de localización/calidad. Los RMSE (155 M, 98 M, 177 M) son razonables para el contexto.

Validación de supuestos del modelo

Para cada uno de los tres modelos (Casas/Norte, Apartamentos/Sur y Conjunto completo) verificaremos los supuestos clásicos de la regresión lineal:

Linealidad y forma funcional

Gráfico Residuos vs. Ajustados (y línea LOESS) para detectar curvaturas o patrones.

Homoscedasticidad (varianza constante)

Breusch–Pagan (p < 0.05 sugiere heterocedasticidad).

Scale–Location (√|residuo est.| vs ajustados).

Nota: ya estamos usando errores robustos HC3, que mitigan este problema para la inferencia.

Normalidad de residuos

QQ-plot y test de Shapiro–Wilk (en muestras grandes es común rechazar; lo importante es que no haya colas extremas que afecten mucho).

Observaciones influyentes

Leverage (hat values) y Cook’s D (listaremos el Top-5).

Multicolinealidad

VIF (regla práctica: > 5 “alto”, > 10 “problemático”).

Modelo lineal múltiple (HC3) — Tabla 15. Solicitud 1 — Casas / Zona Norte
term Estimate Std. Error t value Pr(>|t|)
(Intercept) -238.1708979 45.784411 -5.202009 0.0000003
areaconst 0.6767346 0.147908 4.575375 0.0000062
estrato 80.6349477 12.154977 6.633904 0.0000000
habitaciones 7.6451100 6.979050 1.095437 0.2739398
parqueaderos 24.0059798 7.069626 3.395650 0.0007484
banios 18.8993776 10.462151 1.806452 0.0715483
Bondad de ajuste
N R2 R2_aj RMSE F p_model
435 0.6040956 0.5994813 154.0415 130.919 0
Modelo lineal múltiple (HC3) — Tabla 16. Solicitud 2 — Apartamentos / Zona Sur
term Estimate Std. Error t value Pr(>|t|)
(Intercept) -261.625007 23.3820483 -11.189140 0.0000000
areaconst 1.285049 0.3987112 3.223006 0.0012857
estrato 60.897089 3.9981181 15.231438 0.0000000
habitaciones -24.836930 6.9558097 -3.570674 0.0003631
parqueaderos 72.914680 15.1745212 4.805073 0.0000016
banios 50.696747 9.1455734 5.543310 0.0000000
Bondad de ajuste
N R2 R2_aj RMSE F p_model
2381 0.7485178 0.7479884 97.89584 1413.802 0
Modelo lineal múltiple (HC3) — Tabla 17. Conjunto completo (todas las viviendas)
term Estimate Std. Error t value Pr(>|t|)
(Intercept) -380.7629502 16.0271067 -23.75744 0
areaconst 0.8510035 0.0570696 14.91167 0
estrato 97.9107496 2.8980192 33.78540 0
habitaciones -31.2744340 3.1800057 -9.83471 0
parqueaderos 74.4922170 4.5785339 16.26988 0
banios 61.0553784 3.5981291 16.96865 0
Bondad de ajuste
N R2 R2_aj RMSE F p_model
6717 0.7206364 0.7204282 177.0734 3462.291 0
  1. Solicitud 1 — Casas / Zona Norte

Ajuste: R² = 0.60, RMSE ≈ $155 M (N=435).

Efectos (HC3):

Área: +0.677 M por m² (p<0.001).

Estrato: +80.6 M por nivel (p<0.001).

Parqueaderos: +24.0 M por cupo (p<0.001).

Baños: +18.9 M (p=0.072, marginal).

Habitaciones: +7.6 M (p=0.27, no sig.).

Diagnóstico: heterocedasticidad (abanico), no normalidad en colas, y obs. 393 muy influyente (Cook’s D > 1).

Lectura: el precio de las casas al norte se explica sobre todo por m², estrato y parqueaderos; “habitaciones” pierde fuerza una vez controlamos por área.

  1. Solicitud 2 — Apartamentos / Zona Sur

Ajuste: R² = 0.75, RMSE ≈ $98 M (N=2,381).

Efectos:

Área: +1.285 M por m² (p=0.0013).

Estrato: +60.9 M (p<0.001).

Parqueaderos: +72.9 M (p<0.001).

Baños: +50.7 M (p<0.001).

Habitaciones: −24.8 M (p<0.001).

Diagnóstico: marcada heterocedasticidad y no normalidad; varios outliers con leverage moderado.

Lectura: en aptos del sur todos los atributos son significativos. El signo negativo de habitaciones es coherente a igual m² (más cuartos ⇒ cuartos/espacios más pequeños).

  1. Conjunto completo (todas las viviendas)

Ajuste: R² = 0.72, RMSE ≈ $177 M (N=6,717).

Efectos (todos p≈0):

Área: +0.851 M/m² · Estrato: +97.9 M · Parqueaderos: +74.5 M · Baños: +61.1 M · Habitaciones: −31.3 M.

Diagnóstico: heterocedasticidad clara; colas gruesas; varias influencias (ej., idx 2449, Cook’s D ≈ 0.49).

Lectura: patrones consistentes con los segmentos; el estrato y amenidades (parqueaderos/baños) pesan fuerte junto a m².

Transformar: usar log(precio) (y evaluar log(área)) → mejora linealidad y varianza.

Flexibilizar área: un término cuadrático o spline corto.

Codificar: tratar estrato como factor; redefinir “habitaciones” (p. ej., m² por habitación).

Robustos & outliers: mantener HC3; revisar/limitar las obs. con Cook’s D alto (p. ej., 393).

Espacio: incluir efectos por barrio/zona o errores agrupados por zona.

Resumen: el ajuste es medio en Casas/Norte (R²≈0.60) y alto en Aptos/Sur (R²≈0.75). Los coeficientes son lógicos y significativos (salvo habitaciones en casas). Los diagnósticos justifican pequeñas mejoras (log, no linealidad suave, efectos espaciales) para un modelo aún más estable.

Predicción de precios de vivienda

En este apartado usamos los modelos de regresión lineal múltiple ajustados en el punto 3 para estimar el precio esperado de la vivienda bajo las dos solicitudes. Trabajamos con los modelos específicos por tipo-zona:

Solicitud 1: Casas en Zona Norte (res_casas)

Solicitud 2: Apartamentos en Zona Sur (res_aptos)

Las predicciones se calculan a partir de las mismas variables del modelo —área construida (m²), estrato, número de habitaciones, parqueaderos y baños— manteniendo todas las demás condiciones “ceteris paribus”. Además del valor puntual, reportamos un intervalo de predicción al 95%, que refleja la incertidumbre natural del modelo para nuevas observaciones.

Finalmente, comparamos el precio estimado con los créditos preaprobados (Solicitud 1: 350 millones, Solicitud 2: 850 millones) para indicar si la compra sería factible bajo cada configuración (p. ej., estrato alternativo 4/5 o 5/6). Estas proyecciones deben interpretarse como referencias sujetas a las hipótesis del modelo; si los casos se salen del rango típico de la base (p. ej., áreas o calidades inusuales), la incertidumbre crece y conviene complementar con validaciones de mercado o modelos más ricos (interacciones, no linealidades o efectos de barrio).

Tabla 21. Predicción — Solicitud 1 (Casa / Norte) con IC del 95%
Solicitud Modelo Área (m²) Estrato Hab Parq Baños Precio estimado (M) LI 95% LS 95% Crédito (M) ¿Cumple crédito?
Vivienda 1 (Casa - Norte) Base1 (Casas Norte) 200 4 4 1 2 312.1 6.2 618 350 TRUE
Tabla 22. Predicciones — Solicitud 2 (Apto / Sur) con IC del 95% y dos estratos
Solicitud Modelo Área (m²) Estrato Hab Parq Baños Precio estimado (M) LI 95% LS 95% Crédito (M) ¿Cumple crédito?
1…1 Vivienda 2 (Apto - Sur) Base2 (Aptos Sur) 300 5 5 3 3 675.0 481.5 868.6 850 TRUE
1…2 Vivienda 2 (Apto - Sur) Base2 (Aptos Sur) 300 6 5 3 3 735.9 542.3 929.5 850 TRUE

Solicitud 1 · Casa / Norte (200 m², E4, 1 parq, 2 baños, 4 hab) Precio estimado ≈ 312 M. El PI95% es muy amplio (≈ 6–618 M), señal de alta variabilidad (heterocedasticidad/variables faltantes). Viable frente al crédito de 350 M; para comprar con margen, fijaría tope ~320–330 M en la búsqueda.

Solicitud 2 · Apto / Sur (300 m², 3 parq, 3 baños, 5 hab)

Estrato 5: ≈ 675 M (PI95% 481–869 M). Viable con 850 M; una fracción de unidades podría exceder el crédito por la cola superior.

Estrato 6: ≈ 736 M (PI95% 542–929 M). También viable, pero riesgo mayor de superar 850 M. Sugerido: buscar ≤ 800 M para mantener colchón.

Las predicciones confirman lo visto en el EDA y en los modelos: área y estrato empujan el precio, y los intervalos amplios indican que, para decisiones financieras, es prudente filtrar con holgura (10–15% por debajo del crédito) y/o mejorar el modelo (log-precio, variables de localización fina, antigüedad/piso, amenities) para acotar la incertidumbre.

El punto estimado respalda que ambas solicitudes son financiables con los créditos asignados.

Los intervalos amplios confirman lo visto en diagnósticos: área y estrato mandan, pero hay dispersión grande (precio aumenta y la varianza también).

Acción práctica: filtrar listados con 10–15% por debajo del crédito (Sol1 ≤330 M; Sol2 E5 ≤800 M, E6 ≤780–800 M), y priorizar unidades con atributos que el modelo valora (más parqueaderos/baños).

Sugerencia de potenciales ofertas

Tabla 23. Ofertas candidatas — Solicitud 1 (Casa / Zona Norte). Precios en millones
id_anuncio barrio_zona estrato area_m2 hab banos parq precio_M pred_M ahorro_M gap_credito_M en_PI
1914 vipasa 5 205 6 5 2 300 492.1 192.1 50 TRUE
1009 el bosque 5 243 5 4 1 250 467.3 217.3 100 TRUE
1343 la flora 5 200 4 4 2 320 454.5 134.5 30 TRUE
1151 urbanización la merced 5 210 5 3 2 320 450.1 130.1 30 TRUE
1020 la merced 4 250 5 3 2 230 396.5 166.5 120 TRUE

Viabilidad financiera: Las 5 opciones están por debajo de 350 M ⇒ todas cumplen el crédito.

Valor relativo (modelo vs. precio): El modelo para Casas/Norte estima 396–492 M, mientras los precios de oferta son 230–320 M. El “ahorro” modelado (pred_M – precio_M) va de +130 M a +217 M: hay potencial de valorización si las condiciones reales acompañan.

Zonas: Vipasa, El Bosque, La Flora y La Merced — norte consolidado, buena accesibilidad y servicios.

Solicitud 2. Crédito preaprobado 850 millones.

Top 5 ofertas candidatas — Solicitud 2 (Apto / Zona Sur). Precios en millones
id_anuncio barrio estrato areaconst habitaciones banios parqueaderos precio_M pred_M ahorro_M gap_credito_M lat lon zona
6175 capri 5 270.00 4 3 3 350 661.3102 500 500 3.39200 -76.54100 zona sur
7512 seminario 5 300.00 6 5 3 670 751.5813 180 180 3.40900 -76.55000 zona sur
8113 cuarto de legua 5 295.55 4 4 2 410 671.9253 440 440 3.40750 -76.55527 zona sur
8036 seminario 5 256.00 5 5 3 530 719.8761 320 320 3.40748 -76.55408 zona sur
2308 San Fernando 5 258.00 5 4 2 350 598.8347 500 500 3.44000 -76.51972 zona sur
Puntos en el mapa por fuente de coordenadas
coord_fuente n_puntos
anuncio 5

Viabilidad financiera. Las 5 ofertas listadas están por debajo de $850M, por lo que todas son factibles. El campo ahorro_M (crédito – precio) va de $81M a $500M, así que hay margen para gastos de cierre, mejoras o negociación.

Recomendación

Prioridad 1 – 7512 (Seminario): mejor alineación con la solicitud y dentro del presupuesto.

Prioridad 2 – 8113 (Cuarto de Legua): muy buen diferencial modelo–precio y casi 300 m²; revisar si 4 habitaciones es aceptable.

Plan B – 6175 (Capri): gran “descuento” modelado, pero 4 habitaciones y 270 m²; verificar posibilidad de redistribución o si 4 hab es suficiente.

Observación: 8036 y 2308 pueden ser atractivas por precio, pero se quedan cortas en área/parqueaderos frente a lo solicitado.

Qué podemos tener en cuenta….

Costos de administración (PH), año de construcción, ascensores/amenities y estado de la copropiedad.

Avalúo independiente (el modelo da un valor promedio esperado; no reemplaza un peritaje).

Riesgos locativos (ruido, movilidad, pendiente/zona de ladera) y complementos de seguridad.

Negociación: para 7512 y 8113 hay margen razonable; para 6175 el modelo sugiere un gap grande, pero valida estado físico (descuentos altos a veces reflejan pendientes de mantenimiento).

Conclusiones

Determinantes: el área y el estrato explican la mayor parte del precio; parqueaderos y baños aportan; habitaciones es débil una vez se controla por área.

Ajuste: buen desempeño del modelo global (R²≈0.72); por segmento: Casas/Norte (R²≈0.60) y Aptos/Sur (R²≈0.75) → el mercado no es homogéneo.

Supuestos: hay no normalidad y heterocedasticidad (típicas en inmuebles); sin multicolinealidad y con pocos puntos influyentes identificados.

Predicción: ambas solicitudes viables con los créditos (≈312M y 675M estimados).

Oferta: las opciones disponibles están muy por debajo de los topes de crédito → brecha entre lo solicitado y lo que hay en la base.