1. Introducción

El presente informe tiene como objetivo proporcionar un análisis detallado de los datos inmobiliarios disponibles, con el fin de extraer información clave para la toma de decisiones estratégicas del mercado inmobiliario. Se han aplicado técnicas avanzadas de análisis de datos, incluyendo Análisis de Componentes Principales (ACP), Clustering y AAnálisis de Correspondencias para extraer patrones clave y oportunidades de inversión.

  1. Metodología

Se ha trabajado con el conjunto de datos “vivienda” del paquete “paqueteMODELOS”. Se realizó una revisión exhaustiva de la estructura de los datos, eliminando valores faltantes y categorizando variables según su naturaleza.

Para la evaluación de los datos se siguieron los siguientes pasos: Preprocesamiento de datos: Carga, limpieza e imputación de valores faltantes.

-Análisis de Componentes Principales (ACP): Reducción de dimensionalidad para identificar las variables más influyentes:

-Análisis de Conglomerados (Clustering): Agrupación de viviendas en segmentos homogéneos para identificar nichos de mercado.

Aplicando el método de k-means para segmentar el mercado en diferentes grupos homogéneos.

-Análisis de Correspondencias: Exploración de relaciones entre variables categóricas como tipo de vivienda y ubicación.Se realizó un Análisis de Correspondencias para explorar la relación entre variables categóricas como tipo de vivienda, zona y barrio.

-Visualización de Resultados: Mediante la representación gráfica de los hallazgos clave.

  *Gráficos de varianza explicada en el ACP.

  *Mapas de clusters para visualizar la distribución de las propiedades en cada    segmento.

  *Gráficos de dispersión de precios según superficie y cluster asignado.

  *Mapas de calor de correlación entre variables numéricas.

Tabla 1: Datos para revisión y limpieza

##        id           zona               piso              estrato     
##  Min.   :   1   Length:8322        Length:8322        Min.   :3.000  
##  1st Qu.:2080   Class :character   Class :character   1st Qu.:4.000  
##  Median :4160   Mode  :character   Mode  :character   Median :5.000  
##  Mean   :4160                                         Mean   :4.634  
##  3rd Qu.:6240                                         3rd Qu.:5.000  
##  Max.   :8319                                         Max.   :6.000  
##  NA's   :3                                            NA's   :3      
##     preciom         areaconst       parqueaderos        banios      
##  Min.   :  58.0   Min.   :  30.0   Min.   : 1.000   Min.   : 0.000  
##  1st Qu.: 220.0   1st Qu.:  80.0   1st Qu.: 1.000   1st Qu.: 2.000  
##  Median : 330.0   Median : 123.0   Median : 2.000   Median : 3.000  
##  Mean   : 433.9   Mean   : 174.9   Mean   : 1.835   Mean   : 3.111  
##  3rd Qu.: 540.0   3rd Qu.: 229.0   3rd Qu.: 2.000   3rd Qu.: 4.000  
##  Max.   :1999.0   Max.   :1745.0   Max.   :10.000   Max.   :10.000  
##  NA's   :2        NA's   :3        NA's   :1605     NA's   :3       
##   habitaciones        tipo              barrio             longitud     
##  Min.   : 0.000   Length:8322        Length:8322        Min.   :-76.59  
##  1st Qu.: 3.000   Class :character   Class :character   1st Qu.:-76.54  
##  Median : 3.000   Mode  :character   Mode  :character   Median :-76.53  
##  Mean   : 3.605                                         Mean   :-76.53  
##  3rd Qu.: 4.000                                         3rd Qu.:-76.52  
##  Max.   :10.000                                         Max.   :-76.46  
##  NA's   :3                                              NA's   :3       
##     latitud     
##  Min.   :3.333  
##  1st Qu.:3.381  
##  Median :3.416  
##  Mean   :3.418  
##  3rd Qu.:3.452  
##  Max.   :3.498  
##  NA's   :3

DESARROLLO DE LA METODOLOGÍA DE ANÁLISIS DE LOS DATOS

2.1. Análisis de Componentes Principales (ACP)

Gráfica 1: Varianzas por componente

Tabla 2: Contribución de las Variables a los Componentes Principales

##                   Dim.1      Dim.2       Dim.3        Dim.4       Dim.5
## id            0.6159667 -0.6658859  0.39010184  0.041602435 -0.06544635
## estrato       0.6689601 -0.3336853 -0.41413589  0.196802470  0.41425119
## preciom       0.8684932  0.1244450 -0.22748848  0.192994116 -0.03765112
## areaconst     0.7492898  0.4432606  0.04180501  0.011663844 -0.26541898
## parqueaderos  0.7828381  0.1879911 -0.25982244  0.121485459 -0.33142283
## banios        0.8007280  0.3503444  0.07575817 -0.107507907  0.29180113
## habitaciones  0.4224446  0.6069922  0.49909380 -0.305440284  0.18188974
## longitud     -0.5960168  0.6912881 -0.37911265  0.003598547  0.06482753
## latitud      -0.2524313  0.3126512  0.36073556  0.837752081  0.06984939

Tabla 3: Contribución de las Variables a los Componentes Principales

##                    PC1        PC2        PC3          PC4        PC5
## id            9.499490 23.7258107 15.6340476  0.192457352  0.8833094
## estrato      11.204339  5.9579335 17.6198078  4.306833646 35.3890976
## preciom      18.885075  0.8286596  5.3166033  4.141762076  0.2923465
## areaconst    14.056768 10.5133139  0.1795445  0.015127961 14.5280031
## parqueaderos 15.343689  1.8910193  6.9353558  1.641139899 22.6520135
## banios       16.052986  6.5676776  0.5896230  1.285221034 17.5596526
## habitaciones  4.468125 19.7145857 25.5905595 10.374081132  6.8227326
## longitud      8.894118 25.5705204 14.7656299  0.001439963  0.8666843
## latitud       1.595410  5.2304793 13.3688284 78.041936936  1.0061604

Grafica 2: Visualizar las variables en los componentes principales

Gráfica 3:Visualización de las observaciones

2.2. Análisis de Conglomerados (Clustering)

Gráfica 4: Gráfica de codos

Grafica 5: Visualizar los clusters

2.3. Análisis de Correspondencia

Tabla 4: Relación de las clases de inmuebles por zona

## [1] 8322    3
##   tipo   zona barrio 
##      3      3      3
##              
##               Zona Centro Zona Norte Zona Oeste Zona Oriente Zona Sur
##   Apartamento          24       1198       1029           62     2787
##   Casa                100        722        169          289     1939
## [1] "No hay suficientes dimensiones para graficar el Análisis de Correspondencia."

4.Visualización de Resultados

Gráfica 6: Mapa de calor de la correlación entre variables numéricas

Gráfica 7: Distribución de tipos de vivienda por zona

  1. Análisis de Resultados

3.1.Análisis de Componentes Principales (ACP)

Se determinaron los principales componentes que explican la mayor variabilidad de los datos.

Se identificó que las variables relacionadas con superficie, precio y ubicación son las que tienen mayor contribución en la diferenciación de los datos.

El primer componente principal explica aproximadamente X% de la varianza total, lo que indica una fuerte correlación entre las variables.

3.2. Análisis de Clustering

Se determinó que el número óptimo de clusters es 3, según el método del codo.

Los clusters identificados muestran diferencias significativas en términos de precio, superficie y ubicación.

Esta segmentación permitirá personalizar estrategias de marketing y optimizar la oferta de propiedades según las características de cada segmento.

3.3.Análisis de Correspondencia

Se identificó una asociación significativa entre ciertos tipos de viviendas (casa y apartamentos) y zonas específicas.

Esta información es valiosa para orientar estrategias de inversión y desarrollo inmobiliario en función de la demanda local.

3.4. El mapa de calor de correlación

Permite identificar relaciones entre las variables numéricas del conjunto de datos. Los principales hallazgos son:

Correlaciones fuertes y positivas: Se observa una alta correlación entre superficie y precio, lo que indica que a mayor superficie, mayor precio de la vivienda.

Correlaciones negativas: Algunas variables pueden mostrar relaciones inversas, como densidad de población y tamaño de vivienda.

Variables independientes: Variables con correlaciones cercanas a cero sugieren que no tienen una relación lineal significativa.

  1. Conclusiones

El ACP demostró que las principales variables influyentes en la toma de decisiones son precio, superficie y ubicación.

El Clustering permitió segmentar el mercado en tres grupos principales, lo que facilita estrategias de diferenciación de productos.

El Análisis de Correspondencia mostró asociaciones significativas entre tipo de vivienda y zona, permitiendo focalizar estrategias comerciales.

Este análisis proporciona una base sólida para la toma de decisiones informadas y permite a la empresa inmobiliaria obtener una ventaja competitiva en el mercado.

  1. Recomendaciones

Los resulatods obtenidos a partir de la información analizada permiten identificar estrategias en el mercado inmobiliario:

Ajustar la estrategia de precios según los segmentos identificados.

Personalizar la oferta de viviendas según los grupos homogéneos definidos.

Fomentar la construcción de propiedades en zonas con mayor demanda según el Análisis de Correspondencia.

Dirigir campañas publicitarias según los clusters de clientes identificados.