Selección de Variables Numéricas: Se seleccionaron las variables numéricas más relevantes para el análisis, entre las cuales se incluyen:
areaconst: Área construida de la propiedad.
preciom: Precio de la propiedad.
habitaciones: Número de habitaciones.
banios: Número de baños.
parqueaderos: Número de parqueaderos.
Aplicación del Análisis de Componentes Principales (PCA): Se aplicó el PCA para reducir la dimensionalidad de los datos y capturar la mayor varianza posible en un número reducido de componentes. Este método permite identificar las direcciones (componentes) en las que los datos presentan la mayor variabilidad.
Varianza Explicada por los Componentes Principales: Los dos primeros componentes principales (Dim1 y Dim2) capturan un total del 81.5% de la varianza total de los datos, lo que indica que resumen de manera efectiva la mayor parte de la información contenida en las variables originales.
Dim1: Representa el 63.8% de la varianza y está fuertemente influenciado por variables relacionadas con el tamaño y el valor de la propiedad, como areaconst (área construida) y preciom (precio). Este componente distingue principalmente entre propiedades grandes y costosas frente a propiedades más pequeñas y económicas.
Dim2: Representa el 17.7% de la varianza y está asociado principalmente con variables relacionadas con la distribución interna de la propiedad, como el número de habitaciones y baños. Este componente permite diferenciar propiedades con mayor número de habitaciones y baños frente a aquellas con menos.
Importance of components:
PC1 PC2 PC3 PC4 PC5
Standard deviation 1.7687 0.9580 0.65962 0.56977 0.44053
Proportion of Variance 0.6257 0.1836 0.08702 0.06493 0.03881
Cumulative Proportion 0.6257 0.8092 0.89626 0.96119 1.00000
Se seleccionaron las variables relevantes para el análisis, tales como zona, estrato, tipo de vivienda, área construida, número de habitaciones, número de baños y precio. Estas variables fueron normalizadas para garantizar que todas tuvieran el mismo peso en el análisis. Se hizo la prueba con dos tipos de distancias, Manhattan y Euclidiana, para buscar un mejor resultado en la elaboración de los clusters.
Al utilizar la distancia Manhattan, se observó que los clusters resultantes presentan una menor segregación entre sí. Esto significa que las propiedades residenciales tienden a estar más mezcladas en términos de características, lo que sugiere una mayor homogeneidad en la distribución de las ofertas. Los clusters identificados son menos marcados, lo que indica que las diferencias entre los grupos no son extremadamente pronunciadas.
Por el contrario, al aplicar la distancia Euclidiana, los clusters resultantes muestran una mayor segregación y están más claramente definidos. Esto implica que las propiedades residenciales se agrupan en segmentos más diferenciados, con características más específicas y menos superposición entre los grupos. Los clusters son más marcados, lo que facilita la identificación de patrones y dinámicas específicas en cada segmento.
id zona piso estrato preciom
1 : 1 Centro : 124 1 :3495 3:1453 Min. : 58.0
2 : 1 Norte :1920 2 :1450 4:2129 1st Qu.: 220.0
3 : 1 Oeste :1198 3 :1097 5:2750 Median : 330.0
4 : 1 Oriente: 351 4 : 607 6:1987 Mean : 433.9
5 : 1 Sur :4726 5 : 567 3rd Qu.: 540.0
6 : 1 6 : 245 Max. :1999.0
(Other):8313 (Other): 858
areaconst parqueaderos banios habitaciones tipo
Min. : 30.0 Min. : 0.000 Min. : 0.000 Min. : 0.000 0:5100
1st Qu.: 80.0 1st Qu.: 1.000 1st Qu.: 2.000 1st Qu.: 3.000 1:3219
Median : 123.0 Median : 1.000 Median : 3.000 Median : 3.000
Mean : 174.9 Mean : 1.482 Mean : 3.111 Mean : 3.605
3rd Qu.: 229.0 3rd Qu.: 2.000 3rd Qu.: 4.000 3rd Qu.: 4.000
Max. :1745.0 Max. :10.000 Max. :10.000 Max. :10.000
barrio longitud latitud cluster1
valle del lili:1009 Length:8319 Length:8319 Min. :1.000
ciudad jardín : 518 Class :character Class :character 1st Qu.:1.000
pance : 412 Mode :character Mode :character Median :1.000
la flora : 368 Mean :1.185
santa teresita: 263 3rd Qu.:1.000
el caney : 209 Max. :3.000
(Other) :5540
cluster2
Min. :1.000
1st Qu.:1.000
Median :2.000
Mean :1.564
3rd Qu.:2.000
Max. :3.000
Se detallan los hallazgos obtenidos a partir del análisis de las relaciones entre los estratos socioeconómicos, las zonas geográficas y los tipos de vivienda en el mercado inmobiliario urbano. Los resultados revelan patrones claros que permiten comprender la distribución y preferencias de la oferta inmobiliaria en diferentes áreas de la ciudad.
Se observa una relación significativa entre el estrato 6 y la zona oeste, donde predomina el tipo de vivienda apartamento. Esta asociación sugiere que la zona oeste se caracteriza por ofrecer un perfil residencial de alto nivel, con propiedades modernas y de carácter vertical, orientadas a un segmento de población con mayor capacidad adquisitiva.
Por otro lado, la zona sur muestra una fuerte asociación con el estrato 4 y el tipo de vivienda apartamento. Esto indica que esta zona se posiciona como un área de interés para un segmento socioeconómico medio, donde predominan las soluciones habitacionales en edificios multifamiliares, posiblemente dirigidas a familias o profesionales que buscan equilibrio entre accesibilidad y calidad de vida.
En contraste, las zonas oriente y centro están más relacionadas con el estrato 3 y el tipo de vivienda casa. Este patrón refleja un perfil residencial más tradicional, donde predominan las viviendas unifamiliares, posiblemente en áreas consolidadas o con un carácter más histórico y familiar. Estas zonas podrían estar asociadas a una población que valora la estabilidad y la conexión con el entorno comunitario.
Finalmente, la zona norte se asocia principalmente con el estrato 4 y el tipo de vivienda casa. Esto sugiere que esta zona ofrece una combinación de accesibilidad y espacio, atrayendo a un segmento de población que busca viviendas unifamiliares con mayor amplitud y comodidad, en un entorno residencial consolidado.