Introducción
Una empresa inmobiliaria líder en una gran ciudad está buscando comprender en profundidad el mercado de viviendas urbanas para tomar decisiones estratégicas más informadas. La empresa posee una base de datos extensa que contiene información detallada sobre diversas propiedades residenciales disponibles en el mercado. Se requiere realizar un análisis holístico de estos datos para identificar patrones, relaciones y segmentaciones relevantes que permitan mejorar la toma de decisiones en cuanto a la compra, venta y valoración de propiedades.
En el contexto del análisis del mercado inmobiliario, los modelos estadísticos multivariados permiten analizar múltiples variables simultáneamente con el fin de identificar patrones, relaciones y segmentaciones dentro de los datos. En este estudio se aplican técnicas de Análisis de Componentes Principales, Análisis de Conglomerados y Análisis de Correspondencia, las cuales permiten resumir información, clasificar observaciones y analizar asociaciones entre variables categóricas, facilitando la toma de decisiones estratégicas en el sector inmobiliario.
Estructura del Dataset
El dataset contiene 6.717 observaciones y 11 variables, incluyendo características estructurales, socioeconómicas y geográficas.
## tibble [6,717 × 11] (S3: tbl_df/tbl/data.frame)
## $ preciom : num [1:6717] 250 320 350 400 260 240 220 310 320 780 ...
## $ areaconst : num [1:6717] 70 120 220 280 90 87 52 137 150 380 ...
## $ parqueaderos: num [1:6717] 1 1 2 3 1 1 2 2 2 2 ...
## $ banios : num [1:6717] 3 2 2 5 2 3 2 3 4 3 ...
## $ habitaciones: num [1:6717] 6 3 4 3 3 3 3 4 6 3 ...
## $ estrato : num [1:6717] 3 3 3 4 5 5 4 5 5 5 ...
## $ tipo : chr [1:6717] "Casa" "Casa" "Casa" "Casa" ...
## $ zona : chr [1:6717] "Zona Oriente" "Zona Oriente" "Zona Oriente" "Zona Sur" ...
## $ barrio : chr [1:6717] "20 de julio" "20 de julio" "20 de julio" "3 de julio" ...
## $ longitud : num [1:6717] -76.5 -76.5 -76.5 -76.5 -76.5 ...
## $ latitud : num [1:6717] 3.43 3.43 3.44 3.44 3.46 ...
## - attr(*, "na.action")= 'omit' Named int [1:1605] 11 20 28 29 30 31 32 33 34 35 ...
## ..- attr(*, "names")= chr [1:1605] "11" "20" "28" "29" ...
Estadísticas descriptivas
## preciom areaconst parqueaderos banios
## Min. : 58.0 Min. : 30.0 Min. : 1.000 Min. : 0.000
## 1st Qu.: 248.0 1st Qu.: 86.0 1st Qu.: 1.000 1st Qu.: 2.000
## Median : 355.0 Median : 130.0 Median : 2.000 Median : 3.000
## Mean : 468.9 Mean : 181.1 Mean : 1.835 Mean : 3.255
## 3rd Qu.: 580.0 3rd Qu.: 233.0 3rd Qu.: 2.000 3rd Qu.: 4.000
## Max. :1999.0 Max. :1745.0 Max. :10.000 Max. :10.000
## habitaciones estrato tipo zona
## Min. : 0.000 Min. :3.00 Length:6717 Length:6717
## 1st Qu.: 3.000 1st Qu.:4.00 Class :character Class :character
## Median : 3.000 Median :5.00 Mode :character Mode :character
## Mean : 3.611 Mean :4.83
## 3rd Qu.: 4.000 3rd Qu.:6.00
## Max. :10.000 Max. :6.00
## barrio longitud latitud
## Length:6717 Min. :-76.59 Min. :3.333
## Class :character 1st Qu.:-76.54 1st Qu.:3.379
## Mode :character Median :-76.53 Median :3.412
## Mean :-76.53 Mean :3.415
## 3rd Qu.:-76.52 3rd Qu.:3.451
## Max. :-76.46 Max. :3.498
Dimensiones del Dataset
## [1] 6717 11
Histograma (variable preciom)
El análisis exploratorio evidencia que la distribución del precio por metro cuadrado presenta asimetría positiva, indicando que la mayoría de las propiedades se concentran en rangos de precios medios, mientras que existe un grupo reducido de propiedades con valores significativamente altos. Esto sugiere la presencia de segmentos premium dentro del mercado inmobiliario.
El primer componente principal explica el 58.1% de la variabilidad total, mientras que el segundo componente explica un 20.4%, acumulando aproximadamente un 78.5% de la varianza en las dos primeras dimensiones. Esto indica que la estructura del mercado inmobiliario puede resumirse adecuadamente en dos factores principales.
El primer componente está altamente influenciado por variables como el área construida, el estrato socioeconómico y el número de baños, lo que sugiere que estas características estructurales son determinantes en la formación del precio por metro cuadrado. El segundo componente captura variabilidad asociada al número de habitaciones y parqueaderos, diferenciando tipos de vivienda según su tamaño y nivel de equipamiento.
El análisis de conglomerados permitió identificar tres segmentos diferenciados dentro del mercado inmobiliario. El método del codo sugirió que k = 3 es un número adecuado de grupos, ya que a partir de ese punto la reducción en la suma de cuadrados intra-grupo disminuye de manera menos significativa.
Los clusters representan perfiles estructurales distintos: un segmento de viviendas con menores valores de precio, área y estrato (segmento económico), un segmento intermedio y un segmento de mayor tamaño, mayor número de baños y mayor estrato (segmento de alto valor). Esta segmentación permite diseñar estrategias comerciales diferenciadas según el perfil del cliente objetivo.
##
## Zona Centro Zona Norte Zona Oeste Zona Oriente Zona Sur
## Apartamento 10 852 966 22 2381
## Casa 54 435 132 141 1724
La tabla de contingencia muestra una distribución diferenciada entre tipo de vivienda y zona geográfica. Se observa que en la Zona Oriente predominan los apartamentos, mientras que en la Zona Sur existe una mayor presencia relativa de casas.
Esto evidencia patrones territoriales en la oferta inmobiliaria, donde ciertas zonas tienden a especializarse en determinados tipos de vivienda. Este comportamiento puede estar asociado a dinámicas urbanas como densificación vertical en zonas centrales y expansión horizontal en zonas periféricas.
La visualización espacial permite identificar patrones geográficos en la distribución de los precios, evidenciando zonas con mayor concentración de propiedades de alto valor. Este análisis es clave para la toma de decisiones estratégicas relacionadas con inversión inmobiliaria y expansión del portafolio.
El análisis multivariado permitió identificar que el precio por metro cuadrado está fuertemente asociado con variables estructurales como el área construida, el estrato socioeconómico y el número de baños, confirmando que la calidad y el tamaño de la vivienda son determinantes clave en la valorización inmobiliaria.
La reducción de dimensionalidad mediante ACP mostró que más del 78% de la variabilidad del mercado puede explicarse en dos dimensiones principales, lo que facilita la interpretación estratégica del comportamiento del sector.
El análisis de conglomerados permitió segmentar el mercado en tres perfiles claramente diferenciados, facilitando la definición de estrategias comerciales, políticas de precios y análisis de inversión específicos para cada segmento.
Finalmente, el análisis de correspondencia y la visualización espacial evidenciaron patrones territoriales en la distribución de la oferta, permitiendo identificar zonas con mayor concentración de viviendas de alto valor.
En conjunto, estos resultados proporcionan ventajas competitivas para la empresa inmobiliaria, al permitir decisiones informadas sobre compra, venta, valoración y segmentación del mercado urbano.
Se recomienda:
Focalizar inversión en zonas con mayor concentración de propiedades premium.
Diseñar estrategias comerciales diferenciadas según los clusters identificados.
Incorporar variables estructurales como área y estrato en modelos de valoración automatizada.