Contexto: En un mercado inmobiliario urbano altamente competitivo, la toma de decisiones basada en la intuición es insuficiente. La empresa requiere una comprensión profunda de los factores latentes que determinan la valoración de las propiedades y la dinámica de la oferta.
Objetivo General: Realizar una minería de datos integral sobre la base de oferta inmobiliaria para identificar patrones estructurales, segmentar el mercado y optimizar la estrategia comercial.
Objetivos Específicos:
1. Saneamiento: Asegurar la calidad del dato para modelos fiables.
2. Reducción de Dimensionalidad (ACP): Detectar qué variables explican la variabilidad de precios.
3. Segmentación (Clustering): Perfilar grupos de propiedades (nichos de mercado).
4. Asociación (ACM): Analizar la relación entre ubicación, tipo de vivienda y estrato.
Antes de cualquier modelado, es crítico evaluar la integridad de la información. Datos sucios conducen a estrategias erróneas (“Garbage In, Garbage Out”).
## Registros iniciales: 8322
## Registros aptos para análisis: 6717
Interpretación de la Limpieza: Se ha priorizado la calidad sobre la cantidad. El conjunto de datos resultante (vivienda_model) garantiza que las relaciones matemáticas que encontraremos en el ACP y el Clustering no sean artefactos de valores imputados o nulos.
Para entender la distribución territorial del valor (“Location, Location, Location”), visualizamos la oferta.
Análisis Preliminar: El mapa interactivo revela clusters naturales de precios altos (puntos claros/amarillos) versus zonas de vivienda económica (puntos oscuros). Esta segregación espacial justifica el uso posterior de análisis por “Zonas” y “Estratos”.
Esta técnica nos permite simplificar la complejidad. Transformamos múltiples variables correlacionadas (área, baños, cuartos, precio) en nuevas “Dimensiones” sintéticas que resumen la información.
Resultados del ACP:
1. Dimensión 1 (Eje X): Explica el mayor porcentaje de varianza (observar porcentaje en gráfico). Representa el “Factor de Tamaño y Estatus”. Todas las variables (precio, área, baños) apuntan a la derecha. Propiedades a la derecha son grandes y costosas; a la izquierda, pequeñas y económicas.
2. Relaciones Clave: Los vectores de preciom y areaconst son casi paralelos y largos, confirmando que el metraje es el predictor determinante del precio en este mercado.
Más allá de analizar variables, necesitamos agrupar viviendas para definir estrategias de venta diferenciadas. Usaremos K-Means sobre las variables estandarizadas.
| Cluster | Cant | Precio_Prom | Area_Prom | Habitaciones | Banios | Precio_m2_Aprox |
|---|---|---|---|---|---|---|
| 1 | 825 | 1129.9 | 426.9 | 4.6 | 5.3 | 2.6 |
| 2 | 2129 | 548.5 | 231.9 | 4.5 | 4.1 | 2.4 |
| 3 | 3763 | 278.9 | 98.5 | 2.9 | 2.3 | 2.8 |
Interpretación de Segmentos:
Cluster 1: Probablemente corresponde a vivienda de interés social o estrato medio-bajo (áreas pequeñas, precio bajo).
Cluster 2: Vivienda familiar estándar.
Cluster 3: Mercado de Lujo/Premium. (Se verificará con los precios promedio más altos en la tabla).
Finalmente, analizamos las variables cualitativas para entender la vocación de las zonas.
Resultados del ACM: Este mapa nos permite responder preguntas como: “¿Qué tipo de vivienda predomina en la Zona Norte?”. Si “Zona Norte” está cerca de “Apartamento” y “Est_6”, confirma una verticalización de lujo en esa área. Las categorías distantes entre sí (ej. Estrato 2 vs Zona Norte) indican combinaciones poco frecuentes en la oferta.
Tras un análisis riguroso de la base de datos inmobiliaria, se derivan las siguientes conclusiones estratégicas para la dirección:
Recomendación: Para valoración rápida, utilizar el metraje como proxy principal.
Inventario Rotativo (Cluster Económico): Requiere estrategias de volumen y comisiones bajas.
Inventario Premium (Cluster Lujo): Propiedades con áreas > X m² (ver tabla). Requieren marketing personalizado y visitas privadas.
Hallazgo: Ciertas zonas están saturadas de un solo tipo de oferta (ej. solo apartamentos en zona X).
Estrategia: Buscar propiedades atípicas (ej. Casas en zonas de edificios) puede representar una oportunidad de exclusividad, o bien un riesgo de iliquidez. Se sugiere alinear la captación de inmuebles con la vocación natural de la zona detectada en el gráfico.