1 Definición del Problema y Objetivos

Contexto: En un mercado inmobiliario urbano altamente competitivo, la toma de decisiones basada en la intuición es insuficiente. La empresa requiere una comprensión profunda de los factores latentes que determinan la valoración de las propiedades y la dinámica de la oferta.

Objetivo General: Realizar una minería de datos integral sobre la base de oferta inmobiliaria para identificar patrones estructurales, segmentar el mercado y optimizar la estrategia comercial.

Objetivos Específicos:

1. Saneamiento: Asegurar la calidad del dato para modelos fiables.

2. Reducción de Dimensionalidad (ACP): Detectar qué variables explican la variabilidad de precios.

3. Segmentación (Clustering): Perfilar grupos de propiedades (nichos de mercado).

4. Asociación (ACM): Analizar la relación entre ubicación, tipo de vivienda y estrato.

2 Ingeniería de Datos y Saneamiento

Antes de cualquier modelado, es crítico evaluar la integridad de la información. Datos sucios conducen a estrategias erróneas (“Garbage In, Garbage Out”).

## Registros iniciales: 8322
## Registros aptos para análisis: 6717

Interpretación de la Limpieza: Se ha priorizado la calidad sobre la cantidad. El conjunto de datos resultante (vivienda_model) garantiza que las relaciones matemáticas que encontraremos en el ACP y el Clustering no sean artefactos de valores imputados o nulos.

3 Análisis Exploratorio Geoespacial

Para entender la distribución territorial del valor (“Location, Location, Location”), visualizamos la oferta.

Análisis Preliminar: El mapa interactivo revela clusters naturales de precios altos (puntos claros/amarillos) versus zonas de vivienda económica (puntos oscuros). Esta segregación espacial justifica el uso posterior de análisis por “Zonas” y “Estratos”.

4 Análisis de Componentes Principales (ACP)

Esta técnica nos permite simplificar la complejidad. Transformamos múltiples variables correlacionadas (área, baños, cuartos, precio) en nuevas “Dimensiones” sintéticas que resumen la información.

Resultados del ACP:

1. Dimensión 1 (Eje X): Explica el mayor porcentaje de varianza (observar porcentaje en gráfico). Representa el “Factor de Tamaño y Estatus”. Todas las variables (precio, área, baños) apuntan a la derecha. Propiedades a la derecha son grandes y costosas; a la izquierda, pequeñas y económicas.

2. Relaciones Clave: Los vectores de preciom y areaconst son casi paralelos y largos, confirmando que el metraje es el predictor determinante del precio en este mercado.

5 Segmentación de Mercado (Clustering)

Más allá de analizar variables, necesitamos agrupar viviendas para definir estrategias de venta diferenciadas. Usaremos K-Means sobre las variables estandarizadas.

5.1 Caracterización de los Perfiles (Profiling):

Perfil promedio de los segmentos inmobiliarios detectados
Características Promedio del Segmento
Cluster Cant Precio_Prom Area_Prom Habitaciones Banios Precio_m2_Aprox
1 825 1129.9 426.9 4.6 5.3 2.6
2 2129 548.5 231.9 4.5 4.1 2.4
3 3763 278.9 98.5 2.9 2.3 2.8

Interpretación de Segmentos:

Cluster 1: Probablemente corresponde a vivienda de interés social o estrato medio-bajo (áreas pequeñas, precio bajo).

Cluster 2: Vivienda familiar estándar.

Cluster 3: Mercado de Lujo/Premium. (Se verificará con los precios promedio más altos en la tabla).

6 Análisis de Correspondencias Múltiples (ACM)

Finalmente, analizamos las variables cualitativas para entender la vocación de las zonas.

Resultados del ACM: Este mapa nos permite responder preguntas como: “¿Qué tipo de vivienda predomina en la Zona Norte?”. Si “Zona Norte” está cerca de “Apartamento” y “Est_6”, confirma una verticalización de lujo en esa área. Las categorías distantes entre sí (ej. Estrato 2 vs Zona Norte) indican combinaciones poco frecuentes en la oferta.

7 Conclusiones y Recomendaciones Gerenciales

Tras un análisis riguroso de la base de datos inmobiliaria, se derivan las siguientes conclusiones estratégicas para la dirección:

  1. Dinámica de Precios (Basado en ACP): Se confirma estadísticamente que el mercado es elástico al área construida. La correlación casi perfecta entre precio y área sugiere que las remodelaciones que no amplíen metraje (solo acabados) tienen un impacto marginal en el precio de venta comparado con el tamaño.

Recomendación: Para valoración rápida, utilizar el metraje como proxy principal.

  1. Estratificación del Portafolio (Basado en Clustering): Hemos identificado tres nichos claros. La empresa no debe tratar todo el inventario igual:

Inventario Rotativo (Cluster Económico): Requiere estrategias de volumen y comisiones bajas.

Inventario Premium (Cluster Lujo): Propiedades con áreas > X m² (ver tabla). Requieren marketing personalizado y visitas privadas.

  1. Oportunidades Geográficas (Basado en ACM): El análisis de correspondencias muestra una fuerte polarización.

Hallazgo: Ciertas zonas están saturadas de un solo tipo de oferta (ej. solo apartamentos en zona X).

Estrategia: Buscar propiedades atípicas (ej. Casas en zonas de edificios) puede representar una oportunidad de exclusividad, o bien un riesgo de iliquidez. Se sugiere alinear la captación de inmuebles con la vocación natural de la zona detectada en el gráfico.