Análisis Multidimensional del Mercado Inmobiliario

Modelos Estadísticos para la Toma de Decisiones

1 Análisis de Componentes Principales (PCA)

El objetivo del PCA es identificar los factores subyacentes que influyen en la variación de precios y oferta. Al reducir la dimensionalidad, podemos ver qué variables “mueven” el mercado.

Para poder hacer un análisis relevante sobre la información o el dataset original, hemos optado por seleccionar las columnas que a criterior parecen tener mayor relevancia, así como una pequeña limpieza y normalización de los datos para su posterior procesamiento.

Dentro de las columnas seleccionadas encontramos: \(preciom\), \(areaconst\), \(estrato\), \(banios\), y, \(habitaciones\)

## Posterior a esta selección y limpieza, la base de datos contiene 4808 registros y 13 columnas.
## Rows: 4,808
## Columns: 13
## $ id           <dbl> 5992, 1212, 1724, 2326, 4386, 1209, 1592, 4460, 6081, 749…
## $ zona         <fct> Zona Sur, Zona Norte, Zona Norte, Zona Norte, Zona Norte,…
## $ piso         <fct> 02, 01, 01, 01, 01, 02, 02, 02, 02, 02, 02, 02, 03, 03, 0…
## $ estrato      <dbl> 4, 5, 5, 4, 5, 5, 5, 4, 5, 6, 4, 5, 5, 4, 5, 3, 6, 6, 4, …
## $ preciom      <dbl> 400, 260, 240, 220, 310, 320, 780, 625, 750, 520, 600, 42…
## $ areaconst    <dbl> 280, 90, 87, 52, 137, 150, 380, 355, 237, 98, 160, 200, 1…
## $ parqueaderos <dbl> 3, 1, 1, 2, 2, 2, 2, 3, 2, 2, 1, 4, 2, 2, 2, 1, 1, 2, 1, …
## $ banios       <dbl> 5, 2, 3, 2, 3, 4, 3, 5, 6, 2, 4, 4, 4, 3, 2, 2, 4, 3, 2, …
## $ habitaciones <dbl> 3, 3, 3, 3, 4, 6, 3, 5, 6, 2, 5, 5, 4, 3, 3, 3, 4, 4, 3, …
## $ tipo         <fct> Casa, Apartamento, Apartamento, Apartamento, Apartamento,…
## $ barrio       <fct> 3 de julio, acopi, acopi, acopi, acopi, acopi, acopi, aco…
## $ longitud     <dbl> -76.54000, -76.51350, -76.51700, -76.51974, -76.53105, -7…
## $ latitud      <dbl> 3.43500, 3.45891, 3.36971, 3.42627, 3.38296, 3.47968, 3.4…

Ahora bien, sabemos que el PCA nos permite identificar la estructura de las variables numéricas. Como se observa en el círculo de correlación, existe una relación directa entre el tamaño y el precio.

1.1 Interpretación de Componentes

El Círculo de Correlación (Figura 1) muestra cómo el Precio y el Área están estrechamente relacionados, definiendo el eje principal de valor de la propiedad.

Circulo de Correlación de Variables

Figure 1: Circulo de Correlación de Variables

Al observar que los baños y el Área están casi superpuestos en el círculo de correlación, esto significa que existe una colinealidad casi perfecta entre el tamaño de la casa y su equipamiento sanitario, pero el mercado no está valorando el precio únicamente por estas variables físicas.

Si el área y los baños van de la mano, podrías decir que en esta ciudad “no se construye más área sin añadir baños proporcionalmente”.

El análisis de componentes principales revela una redundancia informativa entre el Área Construida y el Número de Baños (flechas CASI superpuestas). Esto indica que ambas variables aportan la misma información al modelo. Sin embargo, el hecho de que el Precio se encuentre ligeramente separado sugiere que existen otros factores (como la ubicación o acabados) que están influyendo en el valor final, más allá de la simple amplitud física.

2 Análisis de Distancias Euclidianas

Para justificar el uso de conglomerados, evaluamos la Matriz de Distancia Euclidiana. Esta métrica cuantifica la disimilitud entre las propiedades basándose en sus características numéricas escaladas.

Gráfico de Distancias Euclidianas

Figure 2: Gráfico de Distancias Euclidianas

“La matriz de distancias (Figura 2 revela bloques de alta similitud (color azul), lo que valida la existencia de nichos de mercado claros. La distancia euclidiana permite que el algoritmo K-means asigne cada propiedad al segmento donde la diferencia de características físicas y de precio sea mínima.”

3 Análisis de Conglomerados (Clustering)

Para segmentar el mercado, aplicamos K-means. Esto nos permite agrupar viviendas con perfiles similares para entender dinámicas de estratos específicos.

La segmentación mediante K-means permite agrupar las propiedades en nichos homogéneos. Basándonos en la varianza intraclase, hemos definido \(k=3\) grupos.

4 Análisis de Correspondencia (CA)

Examinamos la relación entre variables categóricas (Zona y Tipo de Vivienda) para identificar patrones de comportamiento de la oferta. Para evitar el error de dimensiones, filtramos la tabla de contingencia para asegurar que solo existan cruces con datos suficientes entre Zona y Tipo.

Relación Estadística entre Zona y Tipo de Vivienda

Figure 3: Relación Estadística entre Zona y Tipo de Vivienda

Gracias al gráfico podemos decir que: el cuadro de Zona Sur - Apartamento es grande y azul, lo cual indica que el mercado allí está saturado de propiedad horizontal.

Si Zona Centro - Casa es azul, la estrategia de compra debe ser de renovación urbana, pues hay una asociación atípica allí.

5 Interpretación del Análisis de Correspondencia

Debido a que la variable “Tipo” es binaria (Apartamento o Casa), el análisis se simplifica a la comparación de proporciones por zona. En el gráfico de mosaico anterior: - El ancho de las columnas representa el volumen de oferta total de cada zona. - Los colores y divisiones muestran la preferencia de formato. Por ejemplo, la Zona Sur y Zona Norte muestran una clara dominancia de apartamentos, mientras que en la Zona Centro y Oriente la proporción de casas es significativamente mayor a la media del mercado.

6 Conclusiones Estratégicas

  • Insesgadez en la Valoración: El área es el predictor más consistente del precio.
  • Eficiencia de Segmentación: El Clúster 1 representa la mayor oportunidad de inversión por su relación área-estrato.
  • Consistencia Geográfica: El análisis de correspondencia revela que la zona Norte domina el mercado de apartamentos, mientras el Sur mantiene la oferta de casas.

7 Anexos Estadísticos por Segmento

Resumen descriptivo de los clústeres identificados para la toma de decisiones:

Table 1: Table 2: Perfil Estadístico de los Segmentos Identificados
cluster Casos Precio_Promedio Area_Promedio Estrato_Medio
1 1440 655.89 206.66 5.7
2 2792 267.55 103.84 4.4
3 576 879.66 438.78 5.0