Punto 1

Selección de Variables Numéricas: Se seleccionaron las variables numéricas más relevantes para el análisis, entre las cuales se incluyen:

areaconst: Área construida de la propiedad.

preciom: Precio de la propiedad.

habitaciones: Número de habitaciones.

banios: Número de baños.

parqueaderos: Número de parqueaderos.

Aplicación del Análisis de Componentes Principales (PCA): Se aplicó el PCA para reducir la dimensionalidad de los datos y capturar la mayor varianza posible en un número reducido de componentes. Este método permite identificar las direcciones (componentes) en las que los datos presentan la mayor variabilidad.

Varianza Explicada por los Componentes Principales: Los dos primeros componentes principales (Dim1 y Dim2) capturan un total del 81.5% de la varianza total de los datos, lo que indica que resumen de manera efectiva la mayor parte de la información contenida en las variables originales.

Dim1: Representa el 63.8% de la varianza y está fuertemente influenciado por variables relacionadas con el tamaño y el valor de la propiedad, como areaconst (área construida) y preciom (precio). Este componente distingue principalmente entre propiedades grandes y costosas frente a propiedades más pequeñas y económicas.

Dim2: Representa el 17.7% de la varianza y está asociado principalmente con variables relacionadas con la distribución interna de la propiedad, como el número de habitaciones y baños. Este componente permite diferenciar propiedades con mayor número de habitaciones y baños frente a aquellas con menos.

Importance of components:
                          PC1    PC2     PC3     PC4     PC5
Standard deviation     1.7687 0.9580 0.65962 0.56977 0.44053
Proportion of Variance 0.6257 0.1836 0.08702 0.06493 0.03881
Cumulative Proportion  0.6257 0.8092 0.89626 0.96119 1.00000

PUNTO 2

Se seleccionaron las variables relevantes para el análisis, tales como zona, estrato, tipo de vivienda, área construida, número de habitaciones, número de baños y precio. Estas variables fueron normalizadas para garantizar que todas tuvieran el mismo peso en el análisis. Se hizo la prueba con dos tipos de distancias, Manhattan y Euclidiana, para buscar un mejor resultado en la elaboración de los clusters.

Clusters con Distancia Manhattan:

Al utilizar la distancia Manhattan, se observó que los clusters resultantes presentan una menor segregación entre sí. Esto significa que las propiedades residenciales tienden a estar más mezcladas en términos de características, lo que sugiere una mayor homogeneidad en la distribución de las ofertas. Los clusters identificados son menos marcados, lo que indica que las diferencias entre los grupos no son extremadamente pronunciadas.

Clusters con Distancia Euclidiana:

Por el contrario, al aplicar la distancia Euclidiana, los clusters resultantes muestran una mayor segregación y están más claramente definidos. Esto implica que las propiedades residenciales se agrupan en segmentos más diferenciados, con características más específicas y menos superposición entre los grupos. Los clusters son más marcados, lo que facilita la identificación de patrones y dinámicas específicas en cada segmento.

       id            zona           piso      estrato     preciom      
 1      :   1   Centro : 124   1      :3495   3:1453   Min.   :  58.0  
 2      :   1   Norte  :1920   2      :1450   4:2129   1st Qu.: 220.0  
 3      :   1   Oeste  :1198   3      :1097   5:2750   Median : 330.0  
 4      :   1   Oriente: 351   4      : 607   6:1987   Mean   : 433.9  
 5      :   1   Sur    :4726   5      : 567            3rd Qu.: 540.0  
 6      :   1                  6      : 245            Max.   :1999.0  
 (Other):8313                  (Other): 858                            
   areaconst       parqueaderos        banios        habitaciones    tipo    
 Min.   :  30.0   Min.   : 0.000   Min.   : 0.000   Min.   : 0.000   0:5100  
 1st Qu.:  80.0   1st Qu.: 1.000   1st Qu.: 2.000   1st Qu.: 3.000   1:3219  
 Median : 123.0   Median : 1.000   Median : 3.000   Median : 3.000           
 Mean   : 174.9   Mean   : 1.482   Mean   : 3.111   Mean   : 3.605           
 3rd Qu.: 229.0   3rd Qu.: 2.000   3rd Qu.: 4.000   3rd Qu.: 4.000           
 Max.   :1745.0   Max.   :10.000   Max.   :10.000   Max.   :10.000           
                                                                             
            barrio       longitud           latitud             cluster1    
 valle del lili:1009   Length:8319        Length:8319        Min.   :1.000  
 ciudad jardín : 518   Class :character   Class :character   1st Qu.:1.000  
 pance         : 412   Mode  :character   Mode  :character   Median :1.000  
 la flora      : 368                                         Mean   :1.185  
 santa teresita: 263                                         3rd Qu.:1.000  
 el caney      : 209                                         Max.   :3.000  
 (Other)       :5540                                                        
    cluster2    
 Min.   :1.000  
 1st Qu.:1.000  
 Median :2.000  
 Mean   :1.564  
 3rd Qu.:2.000  
 Max.   :3.000  
                

Punto 3

Se detallan los hallazgos obtenidos a partir del análisis de las relaciones entre los estratos socioeconómicos, las zonas geográficas y los tipos de vivienda en el mercado inmobiliario urbano. Los resultados revelan patrones claros que permiten comprender la distribución y preferencias de la oferta inmobiliaria en diferentes áreas de la ciudad.

Estrato 6, Zona Oeste y Apartamentos:

Se observa una relación significativa entre el estrato 6 y la zona oeste, donde predomina el tipo de vivienda apartamento. Esta asociación sugiere que la zona oeste se caracteriza por ofrecer un perfil residencial de alto nivel, con propiedades modernas y de carácter vertical, orientadas a un segmento de población con mayor capacidad adquisitiva.

Zona Sur y Estrato 4 con Apartamentos:

Por otro lado, la zona sur muestra una fuerte asociación con el estrato 4 y el tipo de vivienda apartamento. Esto indica que esta zona se posiciona como un área de interés para un segmento socioeconómico medio, donde predominan las soluciones habitacionales en edificios multifamiliares, posiblemente dirigidas a familias o profesionales que buscan equilibrio entre accesibilidad y calidad de vida.

Zona Oriente, Centro y Estrato 3 con Casas:

En contraste, las zonas oriente y centro están más relacionadas con el estrato 3 y el tipo de vivienda casa. Este patrón refleja un perfil residencial más tradicional, donde predominan las viviendas unifamiliares, posiblemente en áreas consolidadas o con un carácter más histórico y familiar. Estas zonas podrían estar asociadas a una población que valora la estabilidad y la conexión con el entorno comunitario.

Zona Norte, Estrato 4 y Casas:

Finalmente, la zona norte se asocia principalmente con el estrato 4 y el tipo de vivienda casa. Esto sugiere que esta zona ofrece una combinación de accesibilidad y espacio, atrayendo a un segmento de población que busca viviendas unifamiliares con mayor amplitud y comodidad, en un entorno residencial consolidado.