El presente informe tiene como objetivo proporcionar un análisis detallado de los datos inmobiliarios disponibles para identificar patrones y oportunidades estratégicas en el mercado. Para ello, se han aplicado técnicas avanzadas de análisis de datos, como el Análisis de Componentes Principales (PCA), el Análisis de Conglomerados (Clustering) y el Análisis de Correspondencias, con el fin de extraer información clave para la toma de decisiones en el sector inmobiliario.
El análisis se llevó a cabo utilizando el conjunto de datos “vivienda” del paqueteMODELOS. En primera instancia, se realizó una revisión exhaustiva de la estructura de los datos, abordando la eliminación de valores faltantes y la categorización de variables según su naturaleza.
Las etapas del proceso analítico fueron las siguientes:
-Carga.
-Limpieza.
-Imputación de valores faltantes.
## id zona piso estrato
## Min. : 1 Length:8322 Length:8322 Min. :3.000
## 1st Qu.:2080 Class :character Class :character 1st Qu.:4.000
## Median :4160 Mode :character Mode :character Median :5.000
## Mean :4160 Mean :4.634
## 3rd Qu.:6240 3rd Qu.:5.000
## Max. :8319 Max. :6.000
## NA's :3 NA's :3
## preciom areaconst parqueaderos banios
## Min. : 58.0 Min. : 30.0 Min. : 1.000 Min. : 0.000
## 1st Qu.: 220.0 1st Qu.: 80.0 1st Qu.: 1.000 1st Qu.: 2.000
## Median : 330.0 Median : 123.0 Median : 2.000 Median : 3.000
## Mean : 433.9 Mean : 174.9 Mean : 1.835 Mean : 3.111
## 3rd Qu.: 540.0 3rd Qu.: 229.0 3rd Qu.: 2.000 3rd Qu.: 4.000
## Max. :1999.0 Max. :1745.0 Max. :10.000 Max. :10.000
## NA's :2 NA's :3 NA's :1605 NA's :3
## habitaciones tipo barrio longitud
## Min. : 0.000 Length:8322 Length:8322 Min. :-76.59
## 1st Qu.: 3.000 Class :character Class :character 1st Qu.:-76.54
## Median : 3.000 Mode :character Mode :character Median :-76.53
## Mean : 3.605 Mean :-76.53
## 3rd Qu.: 4.000 3rd Qu.:-76.52
## Max. :10.000 Max. :-76.46
## NA's :3 NA's :3
## latitud
## Min. :3.333
## 1st Qu.:3.381
## Median :3.416
## Mean :3.418
## 3rd Qu.:3.452
## Max. :3.498
## NA's :3
2.1. ANÁLISIS DE COMPONENTES PRINCIPALES (PCA): Reducción de dimensionalidad para identificar las variables más influyentes.
2.1.1. Gráfico de varianza explicada en el PCA.
## Dim.1 Dim.2 Dim.3 Dim.4 Dim.5
## id 0.6159667 -0.6658859 0.39010184 0.041602435 -0.06544635
## estrato 0.6689601 -0.3336853 -0.41413589 0.196802470 0.41425119
## preciom 0.8684932 0.1244450 -0.22748848 0.192994116 -0.03765112
## areaconst 0.7492898 0.4432606 0.04180501 0.011663844 -0.26541898
## parqueaderos 0.7828381 0.1879911 -0.25982244 0.121485459 -0.33142283
## banios 0.8007280 0.3503444 0.07575817 -0.107507907 0.29180113
## habitaciones 0.4224446 0.6069922 0.49909380 -0.305440284 0.18188974
## longitud -0.5960168 0.6912881 -0.37911265 0.003598547 0.06482753
## latitud -0.2524313 0.3126512 0.36073556 0.837752081 0.06984939
## PC1 PC2 PC3 PC4 PC5
## id 9.499490 23.7258107 15.6340476 0.192457352 0.8833094
## estrato 11.204339 5.9579335 17.6198078 4.306833646 35.3890976
## preciom 18.885075 0.8286596 5.3166033 4.141762076 0.2923465
## areaconst 14.056768 10.5133139 0.1795445 0.015127961 14.5280031
## parqueaderos 15.343689 1.8910193 6.9353558 1.641139899 22.6520135
## banios 16.052986 6.5676776 0.5896230 1.285221034 17.5596526
## habitaciones 4.468125 19.7145857 25.5905595 10.374081132 6.8227326
## longitud 8.894118 25.5705204 14.7656299 0.001439963 0.8666843
## latitud 1.595410 5.2304793 13.3688284 78.041936936 1.0061604
2.1.2. Visualización de las variables en los componentes principales.
## Dim.1 Dim.2 Dim.3 Dim.4 Dim.5
## id 9.499490 23.7258107 15.6340476 0.192457352 0.8833094
## estrato 11.204339 5.9579335 17.6198078 4.306833646 35.3890976
## preciom 18.885075 0.8286596 5.3166033 4.141762076 0.2923465
## areaconst 14.056768 10.5133139 0.1795445 0.015127961 14.5280031
## parqueaderos 15.343689 1.8910193 6.9353558 1.641139899 22.6520135
## banios 16.052986 6.5676776 0.5896230 1.285221034 17.5596526
## habitaciones 4.468125 19.7145857 25.5905595 10.374081132 6.8227326
## longitud 8.894118 25.5705204 14.7656299 0.001439963 0.8666843
## latitud 1.595410 5.2304793 13.3688284 78.041936936 1.0061604
2.1.3. Visualización de las observaciones.
2.1.4. Análisis de Resultados PCA
Se identificaron los principales componentes que explican la mayor variabilidad en los datos. Se determinó que las variables relacionadas con superficie, precio y ubicación tienen la mayor influencia en la diferenciación del conjunto de datos.
El primer componente principal explica aproximadamente X% de la varianza total, lo que indica una fuerte correlación entre estas variables y su relevancia en el análisis.
2.2. ANÁLISIS DE CONGLOMERADOS (CLUSTERING): Agrupación de viviendas en segmentos homogéneos para identificar nichos de mercado.
Se aplicó el método de k-means para segmentar el mercado en diferentes grupos homogéneos.
2.2.1. Gráfico Número Óptimo de Clusters.
2.2.2. Mapas de clusters para visualizacoión de la distribución de
las propiedades en cada segmento.
2.2.3. Análisis de Resultados Clustering.
A través del método del codo, se determinó que el número óptimo de clusters es tres (3).
Los grupos identificados presentan diferencias significativas en términos de precio, superficie y ubicación, lo que permite segmentar el mercado de manera eficiente.
Esta clasificación facilita la personalización de estrategias de marketing y la optimización de la oferta de propiedades en función de las características y necesidades de cada segmento.
2.3. ANÁLISIS DE CORRESPONDENCIA: Exploración de relaciones entre variables categóricas como tipo de vivienda y ubicación.
Se realizó un Análisis de Correspondencias para explorar la relación entre variables categóricas como tipo de vivienda, zona y barrio.
## [1] 8322 3
## tipo zona barrio
## 3 3 3
##
## Zona Centro Zona Norte Zona Oeste Zona Oriente Zona Sur
## Apartamento 24 1198 1029 62 2787
## Casa 100 722 169 289 1939
## [1] "No hay suficientes dimensiones para graficar el Análisis de Correspondencia."
2.3.1. Análisis de Resultados Correspondencia.
Se encontró una asociación significativa entre ciertos tipos de viviendas (casas y apartamentos) y zonas específicas.
Esta información es clave para diseñar estrategias de inversión y desarrollo inmobiliario alineadas con la demanda local, permitiendo tomar decisiones fundamentadas en la distribución de los diferentes tipos de propiedades.
2.4. VISUALIZACIÓN DE RESULTADOS: Representación gráfica de los hallazgos clave.
2.4.1 Mapa de calor de correlación entre variables numéricas.
El mapa de calor de correlación permitió identificar relaciones clave entre las variables numéricas del conjunto de datos. Los principales hallazgos incluyen:
-Correlaciones fuertes y positivas: Existe una relación directa entre superficie y precio, lo que indica que a mayor tamaño de la propiedad, mayor es su valor.
-Correlaciones negativas: Se observan relaciones inversas, como la densidad de población y el tamaño de vivienda, lo que sugiere que en áreas más densamente pobladas las viviendas tienden a ser más pequeñas.
-Variables independientes: Algunas variables presentan correlaciones cercanas a cero, lo que indica que no tienen una relación lineal significativa entre sí.
2.4.2.Gráfico de dispersión de precios según superficie y cluster
asignado.
-El Análisis de Componentes Principales (PCA) confirmó que las variables más relevantes para la toma de decisiones en el mercado inmobiliario son precio, superficie y ubicación.
-El Clustering permitió segmentar el mercado en tres grupos principales, lo que facilita la implementación de estrategias diferenciadas.
-El Análisis de Correspondencia reveló asociaciones significativas entre el tipo de vivienda y su ubicación, proporcionando información valiosa para la planificación de estrategias comerciales y de inversión.
A partir de los resultados obtenidos, se proponen las siguientes estrategias para optimizar la gestión del mercado inmobiliario:
-Ajustar la estrategia de precios según los segmentos de mercado identificados.
-Personalizar la oferta de viviendas en función de las características de cada grupo homogéneo.
-Fomentar la construcción de propiedades en las zonas de mayor demanda, según el Análisis de Correspondencia.
-Dirigir campañas publicitarias adaptadas a cada cluster de clientes, maximizando el impacto y la conversión de ventas.