Informe Ejecutivo: Análisis Estratégico de Ofertas Inmobiliarias
Agencia de Bienes Raíces C&A - Solicitudes Corporativas
1 Resumen Ejecutivo
El presente análisis técnico proporciona una base científica para la toma de decisiones de la agencia C&A frente a los requerimientos de la compañía internacional. Tras filtrar y procesar una base de datos depurada de 2,756 registros en Cali utilizando modelos de regresión lineal múltiple, se concluye lo siguiente:
1.1 Solicitud 1: Zona Norte (Vivienda de 200m²)
- Factibilidad: Baja. El presupuesto de $350 Millones es insuficiente para las pretensiones del cliente.
- Hallazgo: El modelo predictivo sitúa el valor de mercado para estas especificaciones en $392.29 Millones (un 12% por encima del presupuesto).
- Estrategia: Se recomienda a María sugerir al cliente una reducción del área construida a 160m² o flexibilizar la ubicación hacia zonas aledañas para no comprometer la calidad de la vivienda.
1.2 Solicitud 2: Zona Sur (Vivienda de 300m²)
- Factibilidad: Alta. El presupuesto de $850 Millones es competitivo y realista.
- Hallazgo: El modelo estima un precio de mercado de $828.8 Millones. El mercado del Sur profundo (Calle 50 a Jamundí) es altamente predecible \(R^2 = 0.75\), donde el metraje cuadrado y los parqueaderos son los principales dinamizadores del precio.
- Estrategia: Proceder con las 5 ofertas identificadas en el Anexo 2, las cuales cumplen con los 3 parqueaderos y el área de gran formato requerida.
2 Anexos: Soporte Técnico y Estadístico
2.1 Anexo 1: Solicitud 1 - Casas en Zona Norte (Presupuesto: $350M)
2.2 Filtro de Base de Datos y Verificación Geográfica
Se realiza el filtro para aislar únicamente el inventario de casas ubicadas en la Zona Norte, obteniendo un total de 722 registros aptos para el análisis.
| id | zona | piso | estrato | preciom | areaconst | parqueaderos | banios | habitaciones | tipo | barrio | longitud | latitud |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1209 | Zona Norte | 02 | 5 | 320 | 150 | 2 | 4 | 6 | Casa | acopi | -76.51341 | 3.47968 |
| 1592 | Zona Norte | 02 | 5 | 780 | 380 | 2 | 3 | 3 | Casa | acopi | -76.51674 | 3.48721 |
| 4057 | Zona Norte | 02 | 6 | 750 | 445 | NA | 7 | 6 | Casa | acopi | -76.52950 | 3.38527 |
Comprobacion del tipo de vivienda por zona segun solicitud 1:
##
## Casa
## 722
##
## Zona Norte
## 722
2.3 Corrección de Datos Atípicos Geográficos
Basándome en la geografía de Cali, la “Zona Norte” se concentra aproximadamente por encima de la Latitud 3.45. Los puntos que vemos en el sur o fuera de la ciudad los eliminaremos usando un filtro de coordenadas para asegurar que el análisis de María sea preciso.
Para garantizar que el modelo de regresión represente fielmente el mercado del Norte, aplicamos un filtro de coordenadas. Definimos el límite sur de la Zona Norte aproximadamente en la Latitud 3.454.
## Registros originales: 722
## Registros después de limpieza geográfica: 494
## Registros eliminados (Atípicos): 228
2.3.1 Justificación:
Los puntos eliminados (aquellos por debajo de la latitud 3.454) representaban un error de etiquetado. Mantenerlos habría inflado la varianza del error en nuestra regresión, disminuyendo el \(R^2\).
2.4 Causas de los atípicos:
Al observar que hay puntos en el sur etiquetados como “norte”, confirmamos que la base de datos de la inmobiliaria anterior de Santiago y Lina tiene deficiencias en la captura de información, posiblemente por selección errónea de listas desplegables en el software de ingreso.
2.5 mpacto en la solicitud 1:
Ahora que tenemos 494 registros (los que queden tras la limpieza), podemos proceder con el EDA.
3 Análisis Exploratorio con Plotly
En este paso, buscaremos entender cómo se relacionan las variables físicas con el precio. Para una inmobiliaria, la relación más importante suele ser Área vs. Precio, segmentada por Estrato.
3.1 Análisis Exploratorio de Datos (EDA) - Correlaciones
Para entender qué variables influyen más en el precio de las casas en el Norte, realizamos un análisis de correlación visual interactivo.
4 Modelo de Regresión Lineal Múltiple
Ahora estimaremos el modelo matemático. La fórmula será:\[Precio = \beta_0 + \beta_1(Área) + \beta_2(Estrato) + \beta_3(Habitaciones) + \beta_4(Parqueaderos) + \beta_5(Baños)\]
Nota técnica importante: Antes de correr el modelo, debemos asegurar que no haya valores faltantes (NA) en estas variables específicas, ya que R descartará esas filas automáticamente.
##
## Call:
## lm(formula = preciom ~ areaconst + estrato + habitaciones + parqueaderos +
## banios, data = base_modelo1)
##
## Residuals:
## Min 1Q Median 3Q Max
## -685.65 -76.32 -14.37 45.90 934.48
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -189.67636 51.21669 -3.703 0.000249 ***
## areaconst 0.63620 0.05932 10.725 < 2e-16 ***
## estrato 78.79201 11.20956 7.029 1.17e-11 ***
## habitaciones -1.15496 6.29684 -0.183 0.854580
## parqueaderos 26.47707 6.12218 4.325 2.02e-05 ***
## banios 19.47408 8.32847 2.338 0.019962 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 150.2 on 335 degrees of freedom
## Multiple R-squared: 0.5727, Adjusted R-squared: 0.5663
## F-statistic: 89.81 on 5 and 335 DF, p-value: < 2.2e-16
4.1 Interpretación del Modelo (Anexos)
Según los resultados a través del \(R^2\) ajustado de 0.566 es muy sólido para el mercado inmobiliario; significa que las variables físicas explican el 56.6% de la variabilidad del precio en el Norte. El resto (43%) suele depender de acabados, vista o micro-ubicación.
Sin embargo, hay un un punto que podemos llamar error de dedo o leverage y es el dato que presenta (1440m² por 370M): una casa de ese tamaño a ese precio en el norte de Cali tendría un valor de metro cuadrado de $256,000, lo cual es imposible para una zona urbana. Probablemente sea un lote o una casa en ruinas. Lo mantendremos por ahora para el diagnóstico de supuestos, pero para la predicción final lo ignoraremos para no sesgar a María.
Como Interpretación adicional tenemos:
Intercepto (-189.67): No tiene interpretación física (una casa no vale “negativo”), pero es el punto de partida matemático.
Área Construida (0.636): Significativo (*). Por cada metro cuadrado adicional, el precio aumenta en $636,000 COP. Esto es lógico y consistente.
Estrato (78.79): Significativo (*). Subir un nivel de estrato en el norte (ej. de 4 a 5) incrementa el valor de la casa en casi $79 millones. Es la variable con mayor impacto unitario.
Habitaciones (-1.15): No significativo (p=0.85). En el norte, el número de habitaciones no parece dictar el precio; el mercado valora más el espacio total (areaconst) que la cantidad de cuartos.
Parqueaderos (26.47): Significativo (*). Cada parqueadero adicional suma $26.5 millones al valor.
Baños (19.47): Significativo (*). Cada baño extra aporta $19.5 millones.
5 Validación de Supuestos
Para que el modelo sea válido, debemos chequear la “salud” de los residuos. En tu Mac M4, esto se graficará en milisegundos.
Para asegurar que las predicciones para María sean confiables, validamos los supuestos de la regresión lineal.
5.1 Diagnóstico de Supuestos
Residuals vs Fitted: Los puntos no se distribuyen de forma aleatoria en una banda horizontal. Se ve una ligera forma de “embudo” (heterocedasticidad), lo que significa que el modelo es más preciso para casas baratas que para casas de lujo.
Normal Q-Q: Los residuos se alejan drásticamente de la línea en los extremos (colas pesadas). Esto indica que los errores no siguen una distribución normal perfecta, afectando la validez de los p-valores.
Residuals vs Leverage: ¡Aquí está nuestro sospechoso! Hay puntos con etiquetas numéricas (como el que mencionaste de 1440m²) que están jalando la línea de tendencia.
Sugerencia en este caso: Para mejorar el modelo, podríamos aplicar una transformación logarítmica a la variable preciom o eliminar los registros con áreas superiores a 500m² que claramente son atípicos para el Norte.
6 Predicción para la Solicitud 1
Vamos a ver si la empresa internacional puede comprar esa casa de 200m², estrato 5, 4 habitaciones, 1 parqueadero y 2 baños.
## El precio estimado para la vivienda 1 es de: $ 392.33 Millones de COP.
6.1 Análisis de la Predicción
Impacto para el negocio: La empresa internacional tiene un presupuesto de $350 Millones, pero las características que piden (200m², Estrato 5, Norte) valen realmente $392 Millones.
Recomendación para María: “María, debes informar al cliente que su presupuesto está un 12% por debajo del valor de mercado. Para ajustarse a los 350M, o bajamos el área a unos 160m² o buscamos en Estrato 4.”
7 Anexo 2: Solicitud 2 - Casas en Zona Sur (Presupuesto: $850M)
Continuando con la segunda solicitud. Esta es más compleja porque el presupuesto es más alto y el área pedida (300m²) es inmensa para un apartamento, lo que sugiere un inmueble de lujo (Penthouse) en el Sur.
Las variables en esta ocasión son las siguientes:
Tipo: Apartamento
Zona: Zona Sur
Área: 300 \(m^2\)Parqueaderos: 3
Baños: 3
Habitaciones: 5
Estrato: 5 o 6
Presupuesto: $850 Millones
Pasamos directamente a limpiar los datos atípicos y a filtrar según las características
## Registros iniciales en el Sur: 2787
## Registros finales tras limpieza: 2262
## Atípicos eliminados: 525
## Apartamentos de 300m2 o más en esta zona específica: 28
8 Análisis Exploratorio (EDA) - El Mercado de Lujo en el Sur
Es crucial ver si el presupuesto de $850M es realista para 300 \(m^2\).
9 Modelo de Regresión Lineal Múltiple (Solicitud 2)
##
## Call:
## lm(formula = preciom ~ areaconst + estrato + habitaciones + parqueaderos +
## banios, data = base_modelo2)
##
## Residuals:
## Min 1Q Median 3Q Max
## -975.29 -44.00 -1.73 41.66 931.26
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -261.9242 17.8322 -14.688 < 2e-16 ***
## areaconst 1.1528 0.0582 19.807 < 2e-16 ***
## estrato 57.6584 3.4954 16.495 < 2e-16 ***
## habitaciones -23.8829 4.4178 -5.406 7.23e-08 ***
## parqueaderos 87.0929 4.5964 18.948 < 2e-16 ***
## banios 52.6927 3.7765 13.953 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 99.28 on 1955 degrees of freedom
## Multiple R-squared: 0.7539, Adjusted R-squared: 0.7533
## F-statistic: 1198 on 5 and 1955 DF, p-value: < 2.2e-16
Observamos que, al limpiar la zona hacia el “Ultra-Sur”, el \(R^2\) ajustado saltó de 0.56 (en el Norte) a 0.75. Esto significa que en esta zona específica de Cali, las variables físicas explican el 75% del precio, lo que hace que nuestras predicciones para María sean extremadamente confiables.
9.1 Interpretación Modelo Zona Sur
Área Construida (1.15): En el sur, cada metro cuadrado adicional sube el precio en $1.15 Millones. Esto nos dice que es casi el doble que en el norte ($0.63). El mercado del sur premia mucho más el espacio.
Estrato (57.65): Cada salto de estrato suma $57.6 Millones.
Parqueaderos (87.09): Esta es la variable clave. En el sur, un parqueadero extra vale $87 Millones. Como la solicitud pide 3, esto pesará mucho en el precio final.
Habitaciones (-23.88): Notamos que el coeficiente es negativo y muy significativo. En apartamentos de lujo, esto suele indicar que el mercado prefiere áreas abiertas y menos cuartos pero más grandes, en lugar de muchos cuartos pequeños.
Baños (52.69): Cada baño adicional suma $52.7 Millones.
10 Predicción y Ofertas Potenciales (Solicitud 2)
Vamos a calcular si el presupuesto de $850 Millones alcanza para un apartamento de 300 \(m^2\), estrato 6, 5 habitaciones, 3 parqueaderos y 3 baños.
## El precio estimado para la vivienda 2 es de: $ 729.81 Millones de COP.
11 Propuestas de Inversión - Solicitud 2 (Presupuesto < $850M)
Busquemos los datos más prometedores que vimos en el Plotly: