Introducción

Una empresa inmobiliaria líder en una gran ciudad está buscando comprender en profundidad el mercado de viviendas urbanas para tomar decisiones estratégicas más informadas. La empresa posee una base de datos extensa que contiene información detallada sobre diversas propiedades residenciales disponibles en el mercado. Se requiere realizar un análisis holístico de estos datos para identificar patrones, relaciones y segmentaciones relevantes que permitan mejorar la toma de decisiones en cuanto a la compra, venta y valoración de propiedades.

En el contexto del análisis del mercado inmobiliario, los modelos estadísticos multivariados permiten analizar múltiples variables simultáneamente con el fin de identificar patrones, relaciones y segmentaciones dentro de los datos. En este estudio se aplican técnicas de Análisis de Componentes Principales, Análisis de Conglomerados y Análisis de Correspondencia, las cuales permiten resumir información, clasificar observaciones y analizar asociaciones entre variables categóricas, facilitando la toma de decisiones estratégicas en el sector inmobiliario.

Análisis Exploratorio de Datos

Estructura del Dataset

El dataset contiene 6.717 observaciones y 11 variables, incluyendo características estructurales, socioeconómicas y geográficas.

## tibble [6,717 × 11] (S3: tbl_df/tbl/data.frame)
##  $ preciom     : num [1:6717] 250 320 350 400 260 240 220 310 320 780 ...
##  $ areaconst   : num [1:6717] 70 120 220 280 90 87 52 137 150 380 ...
##  $ parqueaderos: num [1:6717] 1 1 2 3 1 1 2 2 2 2 ...
##  $ banios      : num [1:6717] 3 2 2 5 2 3 2 3 4 3 ...
##  $ habitaciones: num [1:6717] 6 3 4 3 3 3 3 4 6 3 ...
##  $ estrato     : num [1:6717] 3 3 3 4 5 5 4 5 5 5 ...
##  $ tipo        : chr [1:6717] "Casa" "Casa" "Casa" "Casa" ...
##  $ zona        : chr [1:6717] "Zona Oriente" "Zona Oriente" "Zona Oriente" "Zona Sur" ...
##  $ barrio      : chr [1:6717] "20 de julio" "20 de julio" "20 de julio" "3 de julio" ...
##  $ longitud    : num [1:6717] -76.5 -76.5 -76.5 -76.5 -76.5 ...
##  $ latitud     : num [1:6717] 3.43 3.43 3.44 3.44 3.46 ...
##  - attr(*, "na.action")= 'omit' Named int [1:1605] 11 20 28 29 30 31 32 33 34 35 ...
##   ..- attr(*, "names")= chr [1:1605] "11" "20" "28" "29" ...

Estadísticas descriptivas

##     preciom         areaconst       parqueaderos        banios      
##  Min.   :  58.0   Min.   :  30.0   Min.   : 1.000   Min.   : 0.000  
##  1st Qu.: 248.0   1st Qu.:  86.0   1st Qu.: 1.000   1st Qu.: 2.000  
##  Median : 355.0   Median : 130.0   Median : 2.000   Median : 3.000  
##  Mean   : 468.9   Mean   : 181.1   Mean   : 1.835   Mean   : 3.255  
##  3rd Qu.: 580.0   3rd Qu.: 233.0   3rd Qu.: 2.000   3rd Qu.: 4.000  
##  Max.   :1999.0   Max.   :1745.0   Max.   :10.000   Max.   :10.000  
##   habitaciones       estrato         tipo               zona          
##  Min.   : 0.000   Min.   :3.00   Length:6717        Length:6717       
##  1st Qu.: 3.000   1st Qu.:4.00   Class :character   Class :character  
##  Median : 3.000   Median :5.00   Mode  :character   Mode  :character  
##  Mean   : 3.611   Mean   :4.83                                        
##  3rd Qu.: 4.000   3rd Qu.:6.00                                        
##  Max.   :10.000   Max.   :6.00                                        
##     barrio             longitud         latitud     
##  Length:6717        Min.   :-76.59   Min.   :3.333  
##  Class :character   1st Qu.:-76.54   1st Qu.:3.379  
##  Mode  :character   Median :-76.53   Median :3.412  
##                     Mean   :-76.53   Mean   :3.415  
##                     3rd Qu.:-76.52   3rd Qu.:3.451  
##                     Max.   :-76.46   Max.   :3.498

Dimensiones del Dataset

## [1] 6717   11

Histograma (variable preciom)

El análisis exploratorio evidencia que la distribución del precio por metro cuadrado presenta asimetría positiva, indicando que la mayoría de las propiedades se concentran en rangos de precios medios, mientras que existe un grupo reducido de propiedades con valores significativamente altos. Esto sugiere la presencia de segmentos premium dentro del mercado inmobiliario.

Análisis de Componentes Principales

El primer componente principal explica el 58.1% de la variabilidad total, mientras que el segundo componente explica un 20.4%, acumulando aproximadamente un 78.5% de la varianza en las dos primeras dimensiones. Esto indica que la estructura del mercado inmobiliario puede resumirse adecuadamente en dos factores principales.

El primer componente está altamente influenciado por variables como el área construida, el estrato socioeconómico y el número de baños, lo que sugiere que estas características estructurales son determinantes en la formación del precio por metro cuadrado. El segundo componente captura variabilidad asociada al número de habitaciones y parqueaderos, diferenciando tipos de vivienda según su tamaño y nivel de equipamiento.

Análisis de Conglomerados

El análisis de conglomerados permitió identificar tres segmentos diferenciados dentro del mercado inmobiliario. El método del codo sugirió que k = 3 es un número adecuado de grupos, ya que a partir de ese punto la reducción en la suma de cuadrados intra-grupo disminuye de manera menos significativa.

Los clusters representan perfiles estructurales distintos: un segmento de viviendas con menores valores de precio, área y estrato (segmento económico), un segmento intermedio y un segmento de mayor tamaño, mayor número de baños y mayor estrato (segmento de alto valor). Esta segmentación permite diseñar estrategias comerciales diferenciadas según el perfil del cliente objetivo.

Análisis de Correspondencia

##              
##               Zona Centro Zona Norte Zona Oeste Zona Oriente Zona Sur
##   Apartamento          10        852        966           22     2381
##   Casa                 54        435        132          141     1724

La tabla de contingencia muestra una distribución diferenciada entre tipo de vivienda y zona geográfica. Se observa que en la Zona Oriente predominan los apartamentos, mientras que en la Zona Sur existe una mayor presencia relativa de casas.

Esto evidencia patrones territoriales en la oferta inmobiliaria, donde ciertas zonas tienden a especializarse en determinados tipos de vivienda. Este comportamiento puede estar asociado a dinámicas urbanas como densificación vertical en zonas centrales y expansión horizontal en zonas periféricas.

Visualización Espacial

La visualización espacial permite identificar patrones geográficos en la distribución de los precios, evidenciando zonas con mayor concentración de propiedades de alto valor. Este análisis es clave para la toma de decisiones estratégicas relacionadas con inversión inmobiliaria y expansión del portafolio.

Conclusiones

El análisis multivariado permitió identificar que el precio por metro cuadrado está fuertemente asociado con variables estructurales como el área construida, el estrato socioeconómico y el número de baños, confirmando que la calidad y el tamaño de la vivienda son determinantes clave en la valorización inmobiliaria.

La reducción de dimensionalidad mediante ACP mostró que más del 78% de la variabilidad del mercado puede explicarse en dos dimensiones principales, lo que facilita la interpretación estratégica del comportamiento del sector.

El análisis de conglomerados permitió segmentar el mercado en tres perfiles claramente diferenciados, facilitando la definición de estrategias comerciales, políticas de precios y análisis de inversión específicos para cada segmento.

Finalmente, el análisis de correspondencia y la visualización espacial evidenciaron patrones territoriales en la distribución de la oferta, permitiendo identificar zonas con mayor concentración de viviendas de alto valor.

En conjunto, estos resultados proporcionan ventajas competitivas para la empresa inmobiliaria, al permitir decisiones informadas sobre compra, venta, valoración y segmentación del mercado urbano.

Se recomienda: