Una empresa inmobiliaria líder en una gran ciudad está buscando comprender en profundidad el mercado de viviendas urbanas para tomar decisiones estratégicas más informadas. La empresa posee una base de datos extensa que contiene información detallada sobre diversas propiedades residenciales disponibles en el mercado. Se requiere realizar un análisis holístico de estos datos para identificar patrones, relaciones y segmentaciones relevantes que permitan mejorar la toma de decisiones en cuanto a la compra, venta y valoración de propiedades.
El reto principal consisten en realizar un análisis integral y multidimensional de la base de datos para obtener una comprensión del mercado inmobiliario urbano. Se requiere aplicar diversas técnicas de análisis de datos, incluyendo
En esta etapa inicial, como se presenta durante el momento de Acción en Brightspace, se procede a explorar el conjunto de datos para obtener una visión compacta de su dimensión y atributos. Es importante resaltar que la base de datos de vivienda consta de 8,322 filas y 13 columnas, información clave para identificar las características particulares de los datos, tal como se analiza en la unidad de análisis multivariado.
## spc_tbl_ [8,322 × 13] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
## $ id : num [1:8322] 1147 1169 1350 5992 1212 ...
## $ zona : chr [1:8322] "Zona Oriente" "Zona Oriente" "Zona Oriente" "Zona Sur" ...
## $ piso : chr [1:8322] NA NA NA "02" ...
## $ estrato : num [1:8322] 3 3 3 4 5 5 4 5 5 5 ...
## $ preciom : num [1:8322] 250 320 350 400 260 240 220 310 320 780 ...
## $ areaconst : num [1:8322] 70 120 220 280 90 87 52 137 150 380 ...
## $ parqueaderos: num [1:8322] 1 1 2 3 1 1 2 2 2 2 ...
## $ banios : num [1:8322] 3 2 2 5 2 3 2 3 4 3 ...
## $ habitaciones: num [1:8322] 6 3 4 3 3 3 3 4 6 3 ...
## $ tipo : chr [1:8322] "Casa" "Casa" "Casa" "Casa" ...
## $ barrio : chr [1:8322] "20 de julio" "20 de julio" "20 de julio" "3 de julio" ...
## $ longitud : num [1:8322] -76.5 -76.5 -76.5 -76.5 -76.5 ...
## $ latitud : num [1:8322] 3.43 3.43 3.44 3.44 3.46 ...
## - attr(*, "spec")=
## .. cols(
## .. id = col_double(),
## .. zona = col_character(),
## .. piso = col_character(),
## .. estrato = col_double(),
## .. preciom = col_double(),
## .. areaconst = col_double(),
## .. parqueaderos = col_double(),
## .. banios = col_double(),
## .. habitaciones = col_double(),
## .. tipo = col_character(),
## .. barrio = col_character(),
## .. longitud = col_double(),
## .. latitud = col_double()
## .. )
## - attr(*, "problems")=<externalptr>
En esta sección, se observa que, según la muestra de datos, el campo “piso” muestra valores ausentes, los cuales parecen estar relacionados con el tipo de vivienda denominado “casa”. No obstante, esta primera inferencia no es completamente precisa, ya que existen registros del mismo tipo de vivienda que sí contienen dicha información.
options(tibble.width = Inf)
kable(head(vivienda))
| id | zona | piso | estrato | preciom | areaconst | parqueaderos | banios | habitaciones | tipo | barrio | longitud | latitud |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1147 | Zona Oriente | NA | 3 | 250 | 70 | 1 | 3 | 6 | Casa | 20 de julio | -76.51168 | 3.43382 |
| 1169 | Zona Oriente | NA | 3 | 320 | 120 | 1 | 2 | 3 | Casa | 20 de julio | -76.51237 | 3.43369 |
| 1350 | Zona Oriente | NA | 3 | 350 | 220 | 2 | 2 | 4 | Casa | 20 de julio | -76.51537 | 3.43566 |
| 5992 | Zona Sur | 02 | 4 | 400 | 280 | 3 | 5 | 3 | Casa | 3 de julio | -76.54000 | 3.43500 |
| 1212 | Zona Norte | 01 | 5 | 260 | 90 | 1 | 2 | 3 | Apartamento | acopi | -76.51350 | 3.45891 |
| 1724 | Zona Norte | 01 | 5 | 240 | 87 | 1 | 3 | 3 | Apartamento | acopi | -76.51700 | 3.36971 |
En esta sección, se busca obtener un resumen estadístico básico del conjunto de datos. En este resumen, se puede identificar que las columnas “zona”, “piso”, “tipo” y “barrio” corresponden a variables categóricas.
| id | zona | piso | estrato | preciom | areaconst | parqueaderos | banios | habitaciones | tipo | barrio | longitud | latitud | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Min. : 1 | Length:8322 | Length:8322 | Min. :3.000 | Min. : 58.0 | Min. : 30.0 | Min. : 1.000 | Min. : 0.000 | Min. : 0.000 | Length:8322 | Length:8322 | Min. :-76.59 | Min. :3.333 | |
| 1st Qu.:2080 | Class :character | Class :character | 1st Qu.:4.000 | 1st Qu.: 220.0 | 1st Qu.: 80.0 | 1st Qu.: 1.000 | 1st Qu.: 2.000 | 1st Qu.: 3.000 | Class :character | Class :character | 1st Qu.:-76.54 | 1st Qu.:3.381 | |
| Median :4160 | Mode :character | Mode :character | Median :5.000 | Median : 330.0 | Median : 123.0 | Median : 2.000 | Median : 3.000 | Median : 3.000 | Mode :character | Mode :character | Median :-76.53 | Median :3.416 | |
| Mean :4160 | NA | NA | Mean :4.634 | Mean : 433.9 | Mean : 174.9 | Mean : 1.835 | Mean : 3.111 | Mean : 3.605 | NA | NA | Mean :-76.53 | Mean :3.418 | |
| 3rd Qu.:6240 | NA | NA | 3rd Qu.:5.000 | 3rd Qu.: 540.0 | 3rd Qu.: 229.0 | 3rd Qu.: 2.000 | 3rd Qu.: 4.000 | 3rd Qu.: 4.000 | NA | NA | 3rd Qu.:-76.52 | 3rd Qu.:3.452 | |
| Max. :8319 | NA | NA | Max. :6.000 | Max. :1999.0 | Max. :1745.0 | Max. :10.000 | Max. :10.000 | Max. :10.000 | NA | NA | Max. :-76.46 | Max. :3.498 | |
| NA’s :3 | NA | NA | NA’s :3 | NA’s :2 | NA’s :3 | NA’s :1605 | NA’s :3 | NA’s :3 | NA | NA | NA’s :3 | NA’s :3 |
A partir de este análisis, se identifican los valores faltantes o ausentes, y se procede a realizar un enfoque detallado para evidenciar gráficamente su impacto. En la tabla anterior, el resumen estadístico mostraba un sesgo, indicando que el campo “parqueadero” tenía el mayor volumen de datos ausentes, con un total de 1605. Sin embargo, tras revisar los pasos previos, se detectó que la columna “piso” no presentaba valores ausentes, sino que se había rellenado con la cadena de texto “NA”. Por lo tanto, en los pasos siguientes se buscará verificar y corregir esta información.
| Columna | Valores_Faltantes | |
|---|---|---|
| id | id | 3 |
| zona | zona | 3 |
| piso | piso | 2638 |
| estrato | estrato | 3 |
| preciom | preciom | 2 |
| areaconst | areaconst | 3 |
| parqueaderos | parqueaderos | 1605 |
| banios | banios | 3 |
| habitaciones | habitaciones | 3 |
| tipo | tipo | 3 |
| barrio | barrio | 3 |
| longitud | longitud | 3 |
| latitud | latitud | 3 |
Dado que todas las columnas del conjunto de datos contienen valores faltantes, se procede a representar gráficamente la proporción de estos valores ausentes en cada una de las columnas.
## Warning in geom_text(aes(label = Valores_Faltantes), vjust = -0.5, linewidth =
## 3): Ignoring unknown parameters: `linewidth`
A continuación, se presentan, según mi criterio, las principales visualizaciones relacionadas con el negocio inmobiliario:
En el primer gráfico, se observa una alta concentración de registros en los rangos de precios 167-234 y 301-368. Para poder cuantificar adecuadamente estos inmuebles, será necesario excluir los valores “NA” durante el preprocesamiento de los datos.
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
En el análisis anterior, es posible observar los datos ácidos, es decir, que se puede notar que las zonas más representativas en cuanto a registros de viviendas son la zona sur, con una participación del 56,8%, y la zona norte, con una participación del 20,1%. Juntas, estas zonas representan un total del 76,9%, lo que indica que la acción comercial más fuerte se concentra en estas áreas estratégicas de operación.
En este gráfico, se puede apreciar que la concentración de puntos cerca de la coordenada (250, 500) sugiere que existe una gran cantidad de viviendas con un área construida alrededor de las 250 unidades y un precio cercano a las 500 unidades. Este patrón podría indicar una tendencia común en el mercado inmobiliario, donde las viviendas con características similares (en términos de área) tienden a tener precios promedio establecidos de manera proporcional. Esto podría reflejar una relación entre el área construida y el precio, que podría ser un factor clave en la determinación del valor de estas propiedades.
En este análisis, se observa que, en general, las viviendas clasificadas en el estrato 6 tienen precios significativamente más altos en comparación con las de otras categorías de estratos. Por otro lado, las viviendas del estrato 5 presentan precios en un rango más bajo en comparación con el estrato 6, pero aún así, sus precios son relativamente más altos que los de los estratos inferiores. Esto sugiere que el estrato 6 es el segmento más caro del mercado, seguido de cerca por el estrato 5, mientras que los estratos más bajos reflejan precios más accesibles.
En los siguientes gráficos se muestra la distribución de tipos de vivienda. En el primero, se observa que, aunque hay más apartamentos que casas en el conjunto de datos, el segundo gráfico revela que, al menos por tipo de vivienda, las casas tienen una mayor área construida en comparación con los apartamentos. Esto sugiere que, aunque la cantidad de apartamentos es mayor, las casas, en promedio, tienden a ser más grandes en términos de superficie construida.
En base al análisis exploratorio anterior, se procede a eliminar las columnas ID, longitud y latitud, debido a que se considera que no aportan valor significativo al análisis del informe. Además, se realizará el tratamiento correspondiente a los valores faltantes o ausentes, que, como se observó durante la exploración de los datos, impidieron la evaluación de la correlación entre las variables. Estos valores serán gestionados adecuadamente para asegurar que no interfieran con los análisis posteriores, permitiendo un estudio más preciso y fiable.
## zona piso estrato preciom
## Length:8322 Length:8322 Min. :3.000 Min. : 58.0
## Class :character Class :character 1st Qu.:4.000 1st Qu.: 220.0
## Mode :character Mode :character Median :5.000 Median : 330.0
## Mean :4.634 Mean : 433.9
## 3rd Qu.:5.000 3rd Qu.: 540.0
## Max. :6.000 Max. :1999.0
## NA's :3 NA's :2
## areaconst parqueaderos banios habitaciones
## Min. : 30.0 Min. : 1.000 Min. : 0.000 Min. : 0.000
## 1st Qu.: 80.0 1st Qu.: 1.000 1st Qu.: 2.000 1st Qu.: 3.000
## Median : 123.0 Median : 2.000 Median : 3.000 Median : 3.000
## Mean : 174.9 Mean : 1.835 Mean : 3.111 Mean : 3.605
## 3rd Qu.: 229.0 3rd Qu.: 2.000 3rd Qu.: 4.000 3rd Qu.: 4.000
## Max. :1745.0 Max. :10.000 Max. :10.000 Max. :10.000
## NA's :3 NA's :1605 NA's :3 NA's :3
## tipo barrio
## Length:8322 Length:8322
## Class :character Class :character
## Mode :character Mode :character
##
##
##
##
## tibble [4,808 × 10] (S3: tbl_df/tbl/data.frame)
## $ zona : chr [1:4808] "Zona Sur" "Zona Norte" "Zona Norte" "Zona Norte" ...
## $ piso : chr [1:4808] "02" "01" "01" "01" ...
## $ estrato : num [1:4808] 4 5 5 4 5 5 5 4 5 6 ...
## $ preciom : num [1:4808] 400 260 240 220 310 320 780 625 750 520 ...
## $ areaconst : num [1:4808] 280 90 87 52 137 150 380 355 237 98 ...
## $ parqueaderos: num [1:4808] 3 1 1 2 2 2 2 3 2 2 ...
## $ banios : num [1:4808] 5 2 3 2 3 4 3 5 6 2 ...
## $ habitaciones: num [1:4808] 3 3 3 3 4 6 3 5 6 2 ...
## $ tipo : chr [1:4808] "Casa" "Apartamento" "Apartamento" "Apartamento" ...
## $ barrio : chr [1:4808] "3 de julio" "acopi" "acopi" "acopi" ...
A continuación se presentan los valores de la desviación estándar, los cuales reflejan el grado de dispersión de los datos que cada componente principal es capaz de explicar. Para simplificar este procedimiento, se seleccionaron únicamente las variables numéricas. En este contexto, la proporción de varianza y la proporción acumulada de varianza indican, respectivamente, el porcentaje de variabilidad total en los datos explicado por cada componente principal y por las componentes anteriores.
De acuerdo con estos cálculos:
## Importance of components:
## PC1 PC2 PC3 PC4 PC5 PC6
## Standard deviation 1.8866 1.0884 0.69530 0.58528 0.49647 0.42886
## Proportion of Variance 0.5932 0.1974 0.08057 0.05709 0.04108 0.03065
## Cumulative Proportion 0.5932 0.7906 0.87117 0.92827 0.96935 1.00000
En este orden de ideas, se puede apreciar que el análisis de componentes principales (PCA) muestra un total de seis componentes, pero se observa que la mayor parte de la varianza es explicada por las dos primeras componentes principales (PC1 y PC2), que juntas capturan el 79.06% de la varianza total. Este hallazgo sugiere que, para simplificar el análisis, bastaría con considerar solo estas dos primeras componentes, ya que representan la mayor parte de la variabilidad presente en los datos.
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
## `geom_line()`: Each group consists of only one observation.
## ℹ Do you need to adjust the group aesthetic?
## Warning in geom_point(color = "red", linewidth = 2): Ignoring unknown
## parameters: `linewidth`
## Warning in geom_text(aes(label = paste0(round(Proportion_of_Variance, 1), :
## Ignoring unknown parameters: `linewidth`
Ahora bien, basándonos en lo visto en el curso, es posible aplicar la “regla del codo” en el análisis de componentes principales.,En esta etapa se calculará la varianza explicada por cada componente principal y se trazaría un gráfico para identificar el punto en el que se produce un cambio significativo en la pendiente (el “codo”), en este se observa que la curva se genera para el primer y segun componente para confirmar lo observado anteriormente.
## Warning: package 'factoextra' was built under R version 4.4.2
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
## preciom areaconst
## 1 -0.5434125 -0.5423895
## 2 0.4802026 0.5818992
## 3 2.4677661 2.1167169
Los resultados del análisis previo, muestran tres centroides correspondientes a los clusters identificados por el algoritmo K-means, utilizando las variables preciom (precio por metro cuadrado) y areaconst (área construida). Los centroides de los clusters pueden interpretarse de la siguiente manera:
Este análisis permite observar cómo se agrupan las viviendas según estas dos variables clave, proporcionando una comprensión más clara de las distintas categorías en el mercado inmobiliario.
El análisis de correspondencia múltiple (ACM) realizado proporciona valiosa información sobre las interacciones entre las variables categóricas en el conjunto de datos. A continuación se presenta un resumen de las dimensiones principales identificadas, que reflejan la estructura subyacente de los datos y la cantidad de varianza total que explican:
Dimensión 1: Con una varianza explicada de 0.711, representando el 77.0% de la varianza total, esta dimensión muestra una relación entre el tipo de propiedad (apartamento o casa) y la zona geográfica (centro, norte, oeste, oriente, sur), con contrastes significativos en los valores.
Dimensión 2: Explicando el 66.3% de la varianza (0.718% de la varianza total), esta dimensión destaca la relación entre la zona geográfica y otras variables categóricas como “3 de julio”, “acopi”, y “aguablanca”, mostrando asociaciones adicionales.
Dimensión 3: Con una varianza explicada de 0.658 (0.713% de la varianza total), esta dimensión complementa la información sobre la distribución espacial y las características de ciertas zonas en relación con otras variables categóricas.
El análisis también revela cómo cada categoría contribuye a las dimensiones principales y su asociación con otras categorías. Por ejemplo, la categoría “Casa” se relaciona positivamente con la Dimensión 1, mientras que “Zona Sur” presenta una fuerte correlación positiva con la Dimensión 2, reflejando las tendencias de agrupamiento geográfico y las características del tipo de propiedad en las diferentes zonas.
## Warning: package 'FactoMineR' was built under R version 4.4.2
##
## Call:
## MCA(X = df_corr)
##
##
## Eigenvalues
## Dim.1 Dim.2 Dim.3 Dim.4 Dim.5 Dim.6 Dim.7
## Variance 0.711 0.663 0.658 0.645 0.446 0.333 0.333
## % of var. 0.770 0.718 0.713 0.699 0.483 0.361 0.361
## Cumulative % of var. 0.770 1.488 2.201 2.900 3.383 3.744 4.105
## Dim.8 Dim.9 Dim.10 Dim.11 Dim.12 Dim.13 Dim.14
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.361 0.361 0.361 0.361 0.361 0.361 0.361
## Cumulative % of var. 4.466 4.827 5.188 5.549 5.910 6.271 6.633
## Dim.15 Dim.16 Dim.17 Dim.18 Dim.19 Dim.20 Dim.21
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.361 0.361 0.361 0.361 0.361 0.361 0.361
## Cumulative % of var. 6.994 7.355 7.716 8.077 8.438 8.799 9.160
## Dim.22 Dim.23 Dim.24 Dim.25 Dim.26 Dim.27 Dim.28
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.361 0.361 0.361 0.361 0.361 0.361 0.361
## Cumulative % of var. 9.521 9.882 10.243 10.604 10.965 11.326 11.687
## Dim.29 Dim.30 Dim.31 Dim.32 Dim.33 Dim.34 Dim.35
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.361 0.361 0.361 0.361 0.361 0.361 0.361
## Cumulative % of var. 12.048 12.409 12.770 13.131 13.492 13.853 14.214
## Dim.36 Dim.37 Dim.38 Dim.39 Dim.40 Dim.41 Dim.42
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.361 0.361 0.361 0.361 0.361 0.361 0.361
## Cumulative % of var. 14.575 14.936 15.297 15.658 16.019 16.380 16.741
## Dim.43 Dim.44 Dim.45 Dim.46 Dim.47 Dim.48 Dim.49
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.361 0.361 0.361 0.361 0.361 0.361 0.361
## Cumulative % of var. 17.102 17.463 17.824 18.185 18.546 18.907 19.268
## Dim.50 Dim.51 Dim.52 Dim.53 Dim.54 Dim.55 Dim.56
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.361 0.361 0.361 0.361 0.361 0.361 0.361
## Cumulative % of var. 19.629 19.990 20.351 20.712 21.073 21.434 21.795
## Dim.57 Dim.58 Dim.59 Dim.60 Dim.61 Dim.62 Dim.63
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.361 0.361 0.361 0.361 0.361 0.361 0.361
## Cumulative % of var. 22.156 22.517 22.878 23.239 23.600 23.961 24.322
## Dim.64 Dim.65 Dim.66 Dim.67 Dim.68 Dim.69 Dim.70
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.361 0.361 0.361 0.361 0.361 0.361 0.361
## Cumulative % of var. 24.683 25.044 25.405 25.766 26.127 26.488 26.849
## Dim.71 Dim.72 Dim.73 Dim.74 Dim.75 Dim.76 Dim.77
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.361 0.361 0.361 0.361 0.361 0.361 0.361
## Cumulative % of var. 27.210 27.571 27.932 28.293 28.654 29.015 29.376
## Dim.78 Dim.79 Dim.80 Dim.81 Dim.82 Dim.83 Dim.84
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.361 0.361 0.361 0.361 0.361 0.361 0.361
## Cumulative % of var. 29.737 30.098 30.459 30.820 31.181 31.542 31.903
## Dim.85 Dim.86 Dim.87 Dim.88 Dim.89 Dim.90 Dim.91
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.361 0.361 0.361 0.361 0.361 0.361 0.361
## Cumulative % of var. 32.264 32.625 32.986 33.347 33.708 34.069 34.430
## Dim.92 Dim.93 Dim.94 Dim.95 Dim.96 Dim.97 Dim.98
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.361 0.361 0.361 0.361 0.361 0.361 0.361
## Cumulative % of var. 34.791 35.152 35.513 35.874 36.235 36.596 36.957
## Dim.99 Dim.100 Dim.101 Dim.102 Dim.103 Dim.104 Dim.105
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.361 0.361 0.361 0.361 0.361 0.361 0.361
## Cumulative % of var. 37.318 37.679 38.040 38.401 38.762 39.123 39.484
## Dim.106 Dim.107 Dim.108 Dim.109 Dim.110 Dim.111 Dim.112
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.361 0.361 0.361 0.361 0.361 0.361 0.361
## Cumulative % of var. 39.846 40.207 40.568 40.929 41.290 41.651 42.012
## Dim.113 Dim.114 Dim.115 Dim.116 Dim.117 Dim.118 Dim.119
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.361 0.361 0.361 0.361 0.361 0.361 0.361
## Cumulative % of var. 42.373 42.734 43.095 43.456 43.817 44.178 44.539
## Dim.120 Dim.121 Dim.122 Dim.123 Dim.124 Dim.125 Dim.126
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.361 0.361 0.361 0.361 0.361 0.361 0.361
## Cumulative % of var. 44.900 45.261 45.622 45.983 46.344 46.705 47.066
## Dim.127 Dim.128 Dim.129 Dim.130 Dim.131 Dim.132 Dim.133
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.361 0.361 0.361 0.361 0.361 0.361 0.361
## Cumulative % of var. 47.427 47.788 48.149 48.510 48.871 49.232 49.593
## Dim.134 Dim.135 Dim.136 Dim.137 Dim.138 Dim.139 Dim.140
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.361 0.361 0.361 0.361 0.361 0.361 0.361
## Cumulative % of var. 49.954 50.315 50.676 51.037 51.398 51.759 52.120
## Dim.141 Dim.142 Dim.143 Dim.144 Dim.145 Dim.146 Dim.147
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.361 0.361 0.361 0.361 0.361 0.361 0.361
## Cumulative % of var. 52.481 52.842 53.203 53.564 53.925 54.286 54.647
## Dim.148 Dim.149 Dim.150 Dim.151 Dim.152 Dim.153 Dim.154
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.361 0.361 0.361 0.361 0.361 0.361 0.361
## Cumulative % of var. 55.008 55.369 55.730 56.091 56.452 56.813 57.174
## Dim.155 Dim.156 Dim.157 Dim.158 Dim.159 Dim.160 Dim.161
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.361 0.361 0.361 0.361 0.361 0.361 0.361
## Cumulative % of var. 57.535 57.896 58.257 58.618 58.979 59.340 59.701
## Dim.162 Dim.163 Dim.164 Dim.165 Dim.166 Dim.167 Dim.168
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.361 0.361 0.361 0.361 0.361 0.361 0.361
## Cumulative % of var. 60.062 60.423 60.784 61.145 61.506 61.867 62.228
## Dim.169 Dim.170 Dim.171 Dim.172 Dim.173 Dim.174 Dim.175
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.361 0.361 0.361 0.361 0.361 0.361 0.361
## Cumulative % of var. 62.589 62.950 63.311 63.672 64.033 64.394 64.755
## Dim.176 Dim.177 Dim.178 Dim.179 Dim.180 Dim.181 Dim.182
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.361 0.361 0.361 0.361 0.361 0.361 0.361
## Cumulative % of var. 65.116 65.477 65.838 66.199 66.560 66.921 67.282
## Dim.183 Dim.184 Dim.185 Dim.186 Dim.187 Dim.188 Dim.189
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.361 0.361 0.361 0.361 0.361 0.361 0.361
## Cumulative % of var. 67.643 68.004 68.365 68.726 69.087 69.448 69.809
## Dim.190 Dim.191 Dim.192 Dim.193 Dim.194 Dim.195 Dim.196
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.361 0.361 0.361 0.361 0.361 0.361 0.361
## Cumulative % of var. 70.170 70.531 70.892 71.253 71.614 71.975 72.336
## Dim.197 Dim.198 Dim.199 Dim.200 Dim.201 Dim.202 Dim.203
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.361 0.361 0.361 0.361 0.361 0.361 0.361
## Cumulative % of var. 72.697 73.059 73.420 73.781 74.142 74.503 74.864
## Dim.204 Dim.205 Dim.206 Dim.207 Dim.208 Dim.209 Dim.210
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.361 0.361 0.361 0.361 0.361 0.361 0.361
## Cumulative % of var. 75.225 75.586 75.947 76.308 76.669 77.030 77.391
## Dim.211 Dim.212 Dim.213 Dim.214 Dim.215 Dim.216 Dim.217
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.361 0.361 0.361 0.361 0.361 0.361 0.361
## Cumulative % of var. 77.752 78.113 78.474 78.835 79.196 79.557 79.918
## Dim.218 Dim.219 Dim.220 Dim.221 Dim.222 Dim.223 Dim.224
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.361 0.361 0.361 0.361 0.361 0.361 0.361
## Cumulative % of var. 80.279 80.640 81.001 81.362 81.723 82.084 82.445
## Dim.225 Dim.226 Dim.227 Dim.228 Dim.229 Dim.230 Dim.231
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.361 0.361 0.361 0.361 0.361 0.361 0.361
## Cumulative % of var. 82.806 83.167 83.528 83.889 84.250 84.611 84.972
## Dim.232 Dim.233 Dim.234 Dim.235 Dim.236 Dim.237 Dim.238
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.361 0.361 0.361 0.361 0.361 0.361 0.361
## Cumulative % of var. 85.333 85.694 86.055 86.416 86.777 87.138 87.499
## Dim.239 Dim.240 Dim.241 Dim.242 Dim.243 Dim.244 Dim.245
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.361 0.361 0.361 0.361 0.361 0.361 0.361
## Cumulative % of var. 87.860 88.221 88.582 88.943 89.304 89.665 90.026
## Dim.246 Dim.247 Dim.248 Dim.249 Dim.250 Dim.251 Dim.252
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.361 0.361 0.361 0.361 0.361 0.361 0.361
## Cumulative % of var. 90.387 90.748 91.109 91.470 91.831 92.192 92.553
## Dim.253 Dim.254 Dim.255 Dim.256 Dim.257 Dim.258 Dim.259
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.361 0.361 0.361 0.361 0.361 0.361 0.361
## Cumulative % of var. 92.914 93.275 93.636 93.997 94.358 94.719 95.080
## Dim.260 Dim.261 Dim.262 Dim.263 Dim.264 Dim.265 Dim.266
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.361 0.361 0.361 0.361 0.361 0.361 0.361
## Cumulative % of var. 95.441 95.802 96.163 96.524 96.885 97.246 97.607
## Dim.267 Dim.268 Dim.269 Dim.270 Dim.271 Dim.272 Dim.273
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.167
## % of var. 0.361 0.361 0.361 0.361 0.361 0.361 0.180
## Cumulative % of var. 97.968 98.329 98.690 99.051 99.412 99.773 99.954
## Dim.274 Dim.275 Dim.276 Dim.277
## Variance 0.023 0.008 0.008 0.003
## % of var. 0.025 0.009 0.009 0.003
## Cumulative % of var. 99.979 99.988 99.997 100.000
##
## Individuals (the 10 first)
## Dim.1 ctr cos2 Dim.2 ctr cos2 Dim.3 ctr
## 1 | 0.855 0.021 0.000 | -0.463 0.007 0.000 | -0.200 0.001
## 2 | -0.461 0.006 0.003 | 1.433 0.064 0.026 | -0.794 0.020
## 3 | -0.461 0.006 0.003 | 1.433 0.064 0.026 | -0.794 0.020
## 4 | -0.461 0.006 0.003 | 1.433 0.064 0.026 | -0.794 0.020
## 5 | -0.461 0.006 0.003 | 1.433 0.064 0.026 | -0.794 0.020
## 6 | -0.005 0.000 0.000 | 1.448 0.066 0.027 | -0.792 0.020
## 7 | -0.005 0.000 0.000 | 1.448 0.066 0.027 | -0.792 0.020
## 8 | -0.005 0.000 0.000 | 1.448 0.066 0.027 | -0.792 0.020
## 9 | -0.005 0.000 0.000 | 1.448 0.066 0.027 | -0.792 0.020
## 10 | -0.461 0.006 0.003 | 1.433 0.064 0.026 | -0.794 0.020
## cos2
## 1 0.000 |
## 2 0.008 |
## 3 0.008 |
## 4 0.008 |
## 5 0.008 |
## 6 0.008 |
## 7 0.008 |
## 8 0.008 |
## 9 0.008 |
## 10 0.008 |
##
## Categories (the 10 first)
## Dim.1 ctr cos2 v.test Dim.2 ctr cos2
## Apartamento | -0.390 4.729 0.298 -37.867 | -0.013 0.005 0.000
## Casa | 0.764 9.254 0.298 37.867 | 0.025 0.010 0.000
## Zona Centro | 3.157 3.499 0.075 19.013 | 1.318 0.654 0.013
## Zona Norte | -0.428 1.584 0.041 -14.112 | 1.805 30.162 0.736
## Zona Oeste | -1.661 20.262 0.512 -49.634 | -0.177 0.246 0.006
## Zona Oriente | 3.587 12.169 0.265 35.687 | 2.802 7.959 0.162
## Zona Sur | 0.385 4.387 0.254 34.936 | -0.588 10.971 0.592
## 3 de julio | 1.014 0.010 0.000 1.014 | -0.569 0.003 0.000
## acopi | -0.349 0.025 0.001 -1.601 | 1.708 0.640 0.013
## aguablanca | -0.005 0.000 0.000 -0.005 | -0.607 0.004 0.000
## v.test Dim.3 ctr cos2 v.test
## Apartamento -1.230 | -0.002 0.000 0.000 -0.172 |
## Casa 1.230 | 0.003 0.000 0.000 0.172 |
## Zona Centro 7.938 | 1.385 0.727 0.014 8.340 |
## Zona Norte 59.470 | -0.970 8.784 0.213 -31.973 |
## Zona Oeste -5.281 | 1.470 17.137 0.401 43.921 |
## Zona Oriente 27.874 | 4.582 21.443 0.432 45.581 |
## Zona Sur -53.359 | -0.244 1.908 0.102 -22.167 |
## 3 de julio -0.569 | -0.247 0.001 0.000 -0.247 |
## acopi 7.843 | -0.960 0.204 0.004 -4.408 |
## aguablanca -0.607 | -0.252 0.001 0.000 -0.252 |
##
## Categorical variables (eta2)
## Dim.1 Dim.2 Dim.3
## tipo | 0.298 0.000 0.000 |
## zona | 0.894 0.995 0.987 |
## barrio | 0.941 0.995 0.987 |
A partir del análisis realizado, se pueden extraer las siguientes conclusiones clave:
Asociación entre tamaño, ubicación y precio: Se observó una fuerte relación entre el tamaño de la vivienda, su ubicación geográfica y el precio. Esto sugiere que tanto el área construida como la zona donde se encuentra la propiedad son factores determinantes en la fijación de precios en el mercado inmobiliario.
Segmentación de mercado: El análisis de conglomerados permitió identificar distintos segmentos de mercado, lo que abre la puerta a la creación de estrategias de marketing personalizadas. Al comprender las características de cada grupo de viviendas, es posible ofrecer soluciones más específicas y dirigidas a las preferencias de cada segmento.
Variación de preferencias según zona geográfica: Las preferencias del mercado varían considerablemente según la zona geográfica y el barrio. Esto resalta la importancia de adaptar la oferta de viviendas a las necesidades y demandas específicas de cada área, lo que podría mejorar la competitividad y la satisfacción del cliente en el sector inmobiliario.