Problema

Una empresa inmobiliaria líder en una gran ciudad está buscando comprender en profundidad el mercado de viviendas urbanas para tomar decisiones estratégicas más informadas. La empresa posee una base de datos extensa que contiene información detallada sobre diversas propiedades residenciales disponibles en el mercado. Se requiere realizar un análisis holístico de estos datos para identificar patrones, relaciones y segmentaciones relevantes que permitan mejorar la toma de decisiones en cuanto a la compra, venta y valoración de propiedades.

## [1] "Registros listos para el análisis: 6717"

Análisis Descriptivo y Correlación

Se realizó una inspección de los momentos estadísticos de la muestra. Como se detalla en la Tabla 1, las variables presentan rangos de variabilidad heterogéneos, lo que justifica la necesidad de una estandarización previa al análisis multivariado. Destaca la asimetría positiva en la variable de precios y área construida, un indicador común en mercados urbanos donde la oferta de alto nivel —aunque menos frecuente— desplaza las medidas de tendencia central.

Tabla 1: Estadísticos descriptivos de las variables métricas
N Promedio Desv. Est. Mediana Mín Máx Asimetría
preciom 6717 468.88 335.04 355 58 1999 1.78
areaconst 6717 181.14 144.10 130 30 1745 2.72
parqueaderos 6717 1.84 1.12 2 1 10 2.33
banios 6717 3.26 1.38 3 0 10 0.90
habitaciones 6717 3.61 1.36 3 0 10 1.78
estrato 6717 4.83 0.95 5 3 6 -0.37

Visualizando la relación directa entre las variable a través de una matríz de correlación:

Figura 1: Matriz de correlación de Pearson para variables cuantitativas del mercado inmobiliario.

Figura 1: Matriz de correlación de Pearson para variables cuantitativas del mercado inmobiliario.

La inspección visual de las correlaciones permite identificar el peso relativo de cada atributo en la estructura del mercado. Se observa una convergencia significativa entre la valoración económica (preciom) y la infraestructura física del inmueble, particularmente en lo que respecta al área y la dotación de baños y parqueaderos, así como al estrato. Estos coeficientes actúan como validadores de la racionalidad del mercado, indicando que el precio no es una variable independiente, sino que responde a la capacidad instalada de la propiedad.

Análisis de Componentes Principales (PCA)

Figura 2: Diagnóstico del PCA. (A) Gráfico de sedimentación. (B) Círculo de correlaciones de las variables.Figura 2: Diagnóstico del PCA. (A) Gráfico de sedimentación. (B) Círculo de correlaciones de las variables.

Figura 2: Diagnóstico del PCA. (A) Gráfico de sedimentación. (B) Círculo de correlaciones de las variables.

Los hallazgos derivados del Análisis de Componentes Principales (Figura 2) confirman una estructura de mercado altamente polarizada por la dimensión escalar. El primer componente, que retiene el 58.1% de la inercia, consolida las métricas de valor, superficie y dotación sanitaria, actuando como un índice de magnitud del inmueble. Por otro lado, la proyección de las variables en el segundo eje (20.4%) permite distinguir matices habitacionales: se observa una oposición vectorial entre la densidad de alcobas y el nivel socioeconómico (estrato), sugiriendo que el mercado de estratos superiores no necesariamente apuesta por un mayor número de habitaciones, sino por una mayor calidad espacial y valorización por unidad de área.

Determinación de grupos (Método del Codo Elbow Method)

Figura 3: Análisis de la suma de cuadrados intra-cluster para la selección de K.

Figura 3: Análisis de la suma de cuadrados intra-cluster para la selección de K.

Para identificar las agrupaciones naturales dentro del mercado inmobiliario, se aplicó el criterio de la suma de cuadrados internos (WSS). Como se observa en la Figura 3, la curva presenta un ‘codo’ o punto de inflexión pronunciado al alcanzar los tres conglomerados. Superado este valor, la ganancia en la explicación de la varianza se marginaliza, lo que sugiere que una partición en \(k=3\) es la solución más parsimoniosa y estadísticamente estable para caracterizar los perfiles de vivienda en el área de estudio.

Análisis de Conglomerados

Ejecución de K-means y Visualización de Grupos

Figura 4: Mapa de segmentación inmobiliaria en el plano de componentes principales (Dim1 y Dim2).

Figura 4: Mapa de segmentación inmobiliaria en el plano de componentes principales (Dim1 y Dim2).

La aplicación del algoritmo K-means sobre el espacio factorial (Figura 4) revela una partición clara y diferenciada del inventario inmobiliario. Se identifican tres dominios bien definidos que no presentan solapamientos críticos, lo que valida la robustez del modelo de segmentación. El Grupo 1 (derecha) se posiciona sobre el vector de mayores atributos físicos y valor comercial; el Grupo 2 (superior) parece concentrar unidades con alta densidad habitacional, mientras que el Grupo 3 (izquierda) agrupa la oferta más compacta y de acceso base

Tabla de caracterización

Tabla 2: Perfilamiento descriptivo de los segmentos identificados
Cluster N° Viviendas Precio (M) Área (m2) Habit. Baños Estrato Predom.
1 887 1117.0 419.6 4.6 5.2 6
2 3498 261.3 97.7 2.9 2.3 5
3 2332 533.8 215.6 4.2 4.0 6

La culminación del proceso analítico permite la identificación de nichos operativos claramente diferenciados. Más allá de una agrupación estadística, los resultados sugieren una especialización del mercado donde el valor del suelo y la configuración arquitectónica influyen en la pertenencia a un clúster específico. Esta segmentación facilita a la dirección la toma de decisiones basada en datos, permitiendo diseñar estrategias de oferta personalizadas según el perfil de habitabilidad y la capacidad de inversión identificada en cada dominio.

Análisis de Correspondencia (CA)

Figura 5: Asociación entre Zona Geográfica y Tipología de Vivienda (Eje Principal).

Figura 5: Asociación entre Zona Geográfica y Tipología de Vivienda (Eje Principal).

Debido a que se compararon dos categorías de vivienda (Casa vs. Apartamento), el análisis se resume en una sola línea de asociación. La posición de cada zona en este eje indica qué tan “extrema” o “balanceada” es su oferta:

Conclusiones y Recomendaciones

Conclusiones

  • Estructura Gravitacional del Mercado: A través del PCA, se determinó que el 58.1% de la variabilidad del mercado está explicada por un componente escalar que vincula directamente el precio, el área construida y la dotación de servicios (baños y parqueaderos). Esto confirma que la valoración inmobiliaria en la muestra no es aleatoria, sino que responde a una métrica de “capacidad instalada” del inmueble.

  • Identificación de Nichos Operativos: La aplicación de K-means permitió fragmentar la oferta en tres segmentos estratégicos. Esta tripartición facilita a la dirección la transición de un modelo de gestión masivo a uno especializado, donde se pueden diferenciar claramente las viviendas de inversión compacta, las residencias familiares estándar y las unidades de alto valor.

  • Especialización Geográfica: El análisis de correspondencia reveló una polarización técnica: mientras las Zonas Centro y Oriente muestran una vocación homogénea (asociada a la densificación), la Zona Oeste se posiciona como el mercado diferencial o de nicho. Las zonas Norte y Sur emergen como los sectores con mayor equilibrio y potencial de diversificación tipológica.

Recomendaciones

  • Optimización de Precios por Segmento: Se recomienda a la gerencia adoptar modelos de tasación diferenciados basados en los tres clústeres identificados. En lugar de aplicar promedios globales, se debe valorar cada inmueble según su pertenencia al segmento de “Alta Dotación”, “Densidad Familiar” o “Base Compacta”.

  • Estrategia de Captación Focalizada: Dado que la Zona Oeste presenta un comportamiento estadísticamente opuesto al Centro y Oriente, la fuerza comercial debe diseñar estrategias de marketing específicas para cada polo. En el Oeste, el foco debe estar en los atributos de exclusividad y área, mientras que en el Centro-Oriente la eficiencia espacial es el motor de venta.

  • Monitoreo de Zonas Híbridas: Las Zonas Norte y Sur representan las mejores oportunidades para proyectos de desarrollo mixto. Al ser sectores con una correspondencia equilibrada, admiten tanto la oferta de casas como de apartamentos con menor riesgo de rechazo por parte del mercado local.

  • Actualización de Variables Críticas: Se sugiere mejorar la recolección de datos en la variable “piso”, cuya ausencia limitó el análisis actual. Contar con esta información permitiría refinar el PCA para capturar la plusvalía asociada a la altura en las zonas de mayor densificación