Una empresa inmobiliaria líder en una gran ciudad está buscando comprender en profundidad el mercado de viviendas urbanas para tomar decisiones estratégicas más informadas. La empresa posee una base de datos extensa que contiene información detallada sobre diversas propiedades residenciales disponibles en el mercado. Se requiere realizar un análisis holístico de estos datos para identificar patrones, relaciones y segmentaciones relevantes que permitan mejorar la toma de decisiones en cuanto a la compra, venta y valoración de propiedades.
## [1] "Registros listos para el análisis: 6717"
Se realizó una inspección de los momentos estadísticos de la muestra. Como se detalla en la Tabla 1, las variables presentan rangos de variabilidad heterogéneos, lo que justifica la necesidad de una estandarización previa al análisis multivariado. Destaca la asimetría positiva en la variable de precios y área construida, un indicador común en mercados urbanos donde la oferta de alto nivel —aunque menos frecuente— desplaza las medidas de tendencia central.
| N | Promedio | Desv. Est. | Mediana | Mín | Máx | Asimetría | |
|---|---|---|---|---|---|---|---|
| preciom | 6717 | 468.88 | 335.04 | 355 | 58 | 1999 | 1.78 |
| areaconst | 6717 | 181.14 | 144.10 | 130 | 30 | 1745 | 2.72 |
| parqueaderos | 6717 | 1.84 | 1.12 | 2 | 1 | 10 | 2.33 |
| banios | 6717 | 3.26 | 1.38 | 3 | 0 | 10 | 0.90 |
| habitaciones | 6717 | 3.61 | 1.36 | 3 | 0 | 10 | 1.78 |
| estrato | 6717 | 4.83 | 0.95 | 5 | 3 | 6 | -0.37 |
Visualizando la relación directa entre las variable a través de una matríz de correlación:
Figura 1: Matriz de correlación de Pearson para variables cuantitativas del mercado inmobiliario.
La inspección visual de las correlaciones permite identificar el peso
relativo de cada atributo en la estructura del mercado. Se observa una
convergencia significativa entre la valoración económica
(preciom) y la infraestructura física del inmueble,
particularmente en lo que respecta al área y la dotación de baños y
parqueaderos, así como al estrato. Estos coeficientes actúan como
validadores de la racionalidad del mercado, indicando que el precio no
es una variable independiente, sino que responde a la capacidad
instalada de la propiedad.
Figura 2: Diagnóstico del PCA. (A) Gráfico de sedimentación. (B) Círculo de correlaciones de las variables.
Los hallazgos derivados del Análisis de Componentes Principales (Figura 2) confirman una estructura de mercado altamente polarizada por la dimensión escalar. El primer componente, que retiene el 58.1% de la inercia, consolida las métricas de valor, superficie y dotación sanitaria, actuando como un índice de magnitud del inmueble. Por otro lado, la proyección de las variables en el segundo eje (20.4%) permite distinguir matices habitacionales: se observa una oposición vectorial entre la densidad de alcobas y el nivel socioeconómico (estrato), sugiriendo que el mercado de estratos superiores no necesariamente apuesta por un mayor número de habitaciones, sino por una mayor calidad espacial y valorización por unidad de área.
Figura 3: Análisis de la suma de cuadrados intra-cluster para la selección de K.
Para identificar las agrupaciones naturales dentro del mercado inmobiliario, se aplicó el criterio de la suma de cuadrados internos (WSS). Como se observa en la Figura 3, la curva presenta un ‘codo’ o punto de inflexión pronunciado al alcanzar los tres conglomerados. Superado este valor, la ganancia en la explicación de la varianza se marginaliza, lo que sugiere que una partición en \(k=3\) es la solución más parsimoniosa y estadísticamente estable para caracterizar los perfiles de vivienda en el área de estudio.
Figura 4: Mapa de segmentación inmobiliaria en el plano de componentes principales (Dim1 y Dim2).
La aplicación del algoritmo K-means sobre el espacio factorial (Figura 4) revela una partición clara y diferenciada del inventario inmobiliario. Se identifican tres dominios bien definidos que no presentan solapamientos críticos, lo que valida la robustez del modelo de segmentación. El Grupo 1 (derecha) se posiciona sobre el vector de mayores atributos físicos y valor comercial; el Grupo 2 (superior) parece concentrar unidades con alta densidad habitacional, mientras que el Grupo 3 (izquierda) agrupa la oferta más compacta y de acceso base
| Cluster | N° Viviendas | Precio (M) | Área (m2) | Habit. | Baños | Estrato Predom. |
|---|---|---|---|---|---|---|
| 1 | 887 | 1117.0 | 419.6 | 4.6 | 5.2 | 6 |
| 2 | 3498 | 261.3 | 97.7 | 2.9 | 2.3 | 5 |
| 3 | 2332 | 533.8 | 215.6 | 4.2 | 4.0 | 6 |
La culminación del proceso analítico permite la identificación de nichos operativos claramente diferenciados. Más allá de una agrupación estadística, los resultados sugieren una especialización del mercado donde el valor del suelo y la configuración arquitectónica influyen en la pertenencia a un clúster específico. Esta segmentación facilita a la dirección la toma de decisiones basada en datos, permitiendo diseñar estrategias de oferta personalizadas según el perfil de habitabilidad y la capacidad de inversión identificada en cada dominio.
Figura 5: Asociación entre Zona Geográfica y Tipología de Vivienda (Eje Principal).
Debido a que se compararon dos categorías de vivienda (Casa vs. Apartamento), el análisis se resume en una sola línea de asociación. La posición de cada zona en este eje indica qué tan “extrema” o “balanceada” es su oferta:
Polos de Especialización: Las zonas que están en los extremos tienen una identidad muy marcada.
Zona Oriente y Zona Centro (Extremo Izquierdo): Están prácticamente en el mismo punto (cerca de -1.0). Esto indica que comparten un perfil inmobiliario casi idéntico. En estas zonas predomina fuertemente un tipo de vivienda (probablemente apartamentos, dada la densidad del centro).
Zona Oeste (Extremo Derecho): Es la zona con el perfil más opuesto a las anteriores. Se ubica en el lado positivo del eje, lo que sugiere que aquí domina la tipología contraria (posiblemente casas de mayor estrato).
Zonas Híbridas o Balanceadas:
Estructura Gravitacional del Mercado: A través del PCA, se determinó que el 58.1% de la variabilidad del mercado está explicada por un componente escalar que vincula directamente el precio, el área construida y la dotación de servicios (baños y parqueaderos). Esto confirma que la valoración inmobiliaria en la muestra no es aleatoria, sino que responde a una métrica de “capacidad instalada” del inmueble.
Identificación de Nichos Operativos: La aplicación de K-means permitió fragmentar la oferta en tres segmentos estratégicos. Esta tripartición facilita a la dirección la transición de un modelo de gestión masivo a uno especializado, donde se pueden diferenciar claramente las viviendas de inversión compacta, las residencias familiares estándar y las unidades de alto valor.
Especialización Geográfica: El análisis de correspondencia reveló una polarización técnica: mientras las Zonas Centro y Oriente muestran una vocación homogénea (asociada a la densificación), la Zona Oeste se posiciona como el mercado diferencial o de nicho. Las zonas Norte y Sur emergen como los sectores con mayor equilibrio y potencial de diversificación tipológica.
Optimización de Precios por Segmento: Se recomienda a la gerencia adoptar modelos de tasación diferenciados basados en los tres clústeres identificados. En lugar de aplicar promedios globales, se debe valorar cada inmueble según su pertenencia al segmento de “Alta Dotación”, “Densidad Familiar” o “Base Compacta”.
Estrategia de Captación Focalizada: Dado que la Zona Oeste presenta un comportamiento estadísticamente opuesto al Centro y Oriente, la fuerza comercial debe diseñar estrategias de marketing específicas para cada polo. En el Oeste, el foco debe estar en los atributos de exclusividad y área, mientras que en el Centro-Oriente la eficiencia espacial es el motor de venta.
Monitoreo de Zonas Híbridas: Las Zonas Norte y Sur representan las mejores oportunidades para proyectos de desarrollo mixto. Al ser sectores con una correspondencia equilibrada, admiten tanto la oferta de casas como de apartamentos con menor riesgo de rechazo por parte del mercado local.
Actualización de Variables Críticas: Se sugiere mejorar la recolección de datos en la variable “piso”, cuya ausencia limitó el análisis actual. Contar con esta información permitiría refinar el PCA para capturar la plusvalía asociada a la altura en las zonas de mayor densificación