Este informe presenta un análisis integral del mercado inmobiliario urbano mediante técnicas avanzadas de analítica de datos, se aplicaron métodos de reducción de dimensionalidad, segmentación de mercado y análisis de asociaciones categóricas para identificar patrones ocultos en la oferta de viviendas.
El objetivo es proporcionar información estratégica que permita optimizar inversiones, mejorar la segmentación comercial y maximizar la rentabilidad.
Los resultados presentados en el informe principal corresponden a versiones resumidas e interpretadas de los análisis estadísticos y los anexos contienen la evidencia numérica completa que respalda las conclusiones y recomendaciones estratégicas.
## spc_tbl_ [8,322 × 13] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
## $ id : num [1:8322] 1147 1169 1350 5992 1212 ...
## $ zona : chr [1:8322] "Zona Oriente" "Zona Oriente" "Zona Oriente" "Zona Sur" ...
## $ piso : chr [1:8322] NA NA NA "02" ...
## $ estrato : num [1:8322] 3 3 3 4 5 5 4 5 5 5 ...
## $ preciom : num [1:8322] 250 320 350 400 260 240 220 310 320 780 ...
## $ areaconst : num [1:8322] 70 120 220 280 90 87 52 137 150 380 ...
## $ parqueaderos: num [1:8322] 1 1 2 3 1 1 2 2 2 2 ...
## $ banios : num [1:8322] 3 2 2 5 2 3 2 3 4 3 ...
## $ habitaciones: num [1:8322] 6 3 4 3 3 3 3 4 6 3 ...
## $ tipo : chr [1:8322] "Casa" "Casa" "Casa" "Casa" ...
## $ barrio : chr [1:8322] "20 de julio" "20 de julio" "20 de julio" "3 de julio" ...
## $ longitud : num [1:8322] -76.5 -76.5 -76.5 -76.5 -76.5 ...
## $ latitud : num [1:8322] 3.43 3.43 3.44 3.44 3.46 ...
## - attr(*, "spec")=List of 3
## ..$ cols :List of 13
## .. ..$ id : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ zona : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
## .. ..$ piso : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
## .. ..$ estrato : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ preciom : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ areaconst : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ parqueaderos: list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ banios : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ habitaciones: list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ tipo : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
## .. ..$ barrio : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
## .. ..$ longitud : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ latitud : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## ..$ default: list()
## .. ..- attr(*, "class")= chr [1:2] "collector_guess" "collector"
## ..$ delim : chr ";"
## ..- attr(*, "class")= chr "col_spec"
## - attr(*, "problems")=<externalptr>
## id zona piso estrato
## Min. : 1 Length:8322 Length:8322 Min. :3.000
## 1st Qu.:2080 Class :character Class :character 1st Qu.:4.000
## Median :4160 Mode :character Mode :character Median :5.000
## Mean :4160 Mean :4.634
## 3rd Qu.:6240 3rd Qu.:5.000
## Max. :8319 Max. :6.000
## NA's :3 NA's :3
## preciom areaconst parqueaderos banios
## Min. : 58.0 Min. : 30.0 Min. : 1.000 Min. : 0.000
## 1st Qu.: 220.0 1st Qu.: 80.0 1st Qu.: 1.000 1st Qu.: 2.000
## Median : 330.0 Median : 123.0 Median : 2.000 Median : 3.000
## Mean : 433.9 Mean : 174.9 Mean : 1.835 Mean : 3.111
## 3rd Qu.: 540.0 3rd Qu.: 229.0 3rd Qu.: 2.000 3rd Qu.: 4.000
## Max. :1999.0 Max. :1745.0 Max. :10.000 Max. :10.000
## NA's :2 NA's :3 NA's :1605 NA's :3
## habitaciones tipo barrio longitud
## Min. : 0.000 Length:8322 Length:8322 Min. :-76.59
## 1st Qu.: 3.000 Class :character Class :character 1st Qu.:-76.54
## Median : 3.000 Mode :character Mode :character Median :-76.53
## Mean : 3.605 Mean :-76.53
## 3rd Qu.: 4.000 3rd Qu.:-76.52
## Max. :10.000 Max. :-76.46
## NA's :3 NA's :3
## latitud
## Min. :3.333
## 1st Qu.:3.381
## Median :3.416
## Mean :3.418
## 3rd Qu.:3.452
## Max. :3.498
## NA's :3
## id zona piso estrato preciom areaconst
## 3 3 2638 3 2 3
## parqueaderos banios habitaciones tipo barrio longitud
## 1605 3 3 3 3 3
## latitud
## 3
## id zona piso estrato preciom areaconst
## 0.04 0.04 31.70 0.04 0.02 0.04
## parqueaderos banios habitaciones tipo barrio longitud
## 19.29 0.04 0.04 0.04 0.04 0.04
## latitud
## 0.04
# Seleccionar variables numéricas
vivienda_num <- vivienda[, sapply(vivienda, is.numeric)]
# Filtrar filas completas
filas_validas <- complete.cases(vivienda_num)
vivienda_num <- vivienda_num[filas_validas, ]Se eliminaron únicamente registros con valores faltantes en variables numéricas para garantizar consistencia estadística en los análisis multivariados.
# Boxplots para detectar outliers
boxplot(vivienda_num,
main="Detección de valores atípicos",
las=2)No se eliminaron valores atípicos automáticamente para evitar pérdida de información relevante del mercado, ya que en contextos inmobiliarios los valores extremos pueden representar segmentos reales (lujo o bajo costo).
## Importance of components:
## PC1 PC2 PC3 PC4 PC5 PC6 PC7
## Standard deviation 1.9628 1.3725 1.0095 0.9673 0.69386 0.59741 0.49420
## Proportion of Variance 0.4281 0.2093 0.1132 0.1040 0.05349 0.03966 0.02714
## Cumulative Proportion 0.4281 0.6374 0.7506 0.8546 0.90804 0.94770 0.97483
## PC8 PC9
## Standard deviation 0.43328 0.19689
## Proportion of Variance 0.02086 0.00431
## Cumulative Proportion 0.99569 1.00000
fviz_pca_ind(pca_vivienda,
geom = "point",
col.ind = vivienda_cluster$cluster,
palette = "jco",
addEllipses = TRUE,
legend.title = "Cluster")El PCA muestra que pocas dimensiones explican la mayor variabilidad del mercado, esto indica que el valor inmobiliario depende principalmente de factores estructurales clave.
La proyección PCA muestra una estructura de agrupamiento clara entre propiedades, evidenciando que las variables analizadas permiten segmentar el mercado en perfiles diferenciados las flechas indican las variables que más influyen en la separación de segmentos.
Se podria dar como recomendacion enfocar decisiones estratégicas en variables con mayor contribución a las primeras componentes.
wss <- sapply(1:10,function(k){
kmeans(pca_data,centers=k,nstart=25)$tot.withinss})
plot(1:10,wss,type="b",xlab="k",ylab="WSS")sil <- sapply(2:10,function(k){
km <- kmeans(pca_data,centers=k,nstart=25)
mean(silhouette(km$cluster,dist(pca_data))[,3])})
plot(2:10,sil,type="b",xlab="k",ylab="Silhouette")plot(pca_data[,1],pca_data[,2],
col=vivienda_cluster$cluster,pch=19,
xlab="PC1",ylab="PC2")
legend("topright",levels(vivienda_cluster$cluster),col=1:3,pch=19)##
## 3 4 5 6
## 1 542 1065 1016 57
## 2 115 465 1129 957
## 3 27 111 377 856
##
## Zona Centro Zona Norte Zona Oeste Zona Oriente Zona Sur
## 1 49 918 28 152 1533
## 2 10 199 752 4 1701
## 3 5 170 318 7 871
El mercado inmobiliario se segmenta en grupos homogéneos con características diferenciadas, lo que confirma la existencia de submercados con dinámicas propias.
La visualización en el espacio PCA evidencia una separación clara entre tres grupos de propiedades, lo que confirma la existencia de segmentos diferenciados dentro del mercado inmobiliario, esta estructura indica que las variables analizadas contienen suficiente información para discriminar perfiles de vivienda, permitiendo identificar submercados con características homogéneas.
se recomienda diseñar estrategias comerciales y precios diferenciados para cada segmento.
##
## Call:
## MCA(X = datos_cat, graph = FALSE)
##
##
## Eigenvalues
## Dim.1 Dim.2 Dim.3 Dim.4 Dim.5 Dim.6 Dim.7
## Variance 1.000 0.652 0.570 0.509 0.469 0.393 0.379
## % of var. 0.895 0.584 0.510 0.455 0.419 0.352 0.339
## Cumulative % of var. 0.895 1.479 1.988 2.444 2.863 3.215 3.554
## Dim.8 Dim.9 Dim.10 Dim.11 Dim.12 Dim.13 Dim.14
## Variance 0.334 0.319 0.250 0.250 0.250 0.250 0.250
## % of var. 0.299 0.286 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 3.853 4.139 4.362 4.586 4.810 5.034 5.257
## Dim.15 Dim.16 Dim.17 Dim.18 Dim.19 Dim.20 Dim.21
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 5.481 5.705 5.928 6.152 6.376 6.600 6.823
## Dim.22 Dim.23 Dim.24 Dim.25 Dim.26 Dim.27 Dim.28
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 7.047 7.271 7.494 7.718 7.942 8.166 8.389
## Dim.29 Dim.30 Dim.31 Dim.32 Dim.33 Dim.34 Dim.35
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 8.613 8.837 9.060 9.284 9.508 9.732 9.955
## Dim.36 Dim.37 Dim.38 Dim.39 Dim.40 Dim.41 Dim.42
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 10.179 10.403 10.626 10.850 11.074 11.298 11.521
## Dim.43 Dim.44 Dim.45 Dim.46 Dim.47 Dim.48 Dim.49
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 11.745 11.969 12.192 12.416 12.640 12.864 13.087
## Dim.50 Dim.51 Dim.52 Dim.53 Dim.54 Dim.55 Dim.56
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 13.311 13.535 13.758 13.982 14.206 14.430 14.653
## Dim.57 Dim.58 Dim.59 Dim.60 Dim.61 Dim.62 Dim.63
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 14.877 15.101 15.324 15.548 15.772 15.996 16.219
## Dim.64 Dim.65 Dim.66 Dim.67 Dim.68 Dim.69 Dim.70
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 16.443 16.667 16.890 17.114 17.338 17.562 17.785
## Dim.71 Dim.72 Dim.73 Dim.74 Dim.75 Dim.76 Dim.77
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 18.009 18.233 18.456 18.680 18.904 19.128 19.351
## Dim.78 Dim.79 Dim.80 Dim.81 Dim.82 Dim.83 Dim.84
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 19.575 19.799 20.022 20.246 20.470 20.694 20.917
## Dim.85 Dim.86 Dim.87 Dim.88 Dim.89 Dim.90 Dim.91
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 21.141 21.365 21.588 21.812 22.036 22.259 22.483
## Dim.92 Dim.93 Dim.94 Dim.95 Dim.96 Dim.97 Dim.98
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 22.707 22.931 23.154 23.378 23.602 23.825 24.049
## Dim.99 Dim.100 Dim.101 Dim.102 Dim.103 Dim.104 Dim.105
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 24.273 24.497 24.720 24.944 25.168 25.391 25.615
## Dim.106 Dim.107 Dim.108 Dim.109 Dim.110 Dim.111 Dim.112
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 25.839 26.063 26.286 26.510 26.734 26.957 27.181
## Dim.113 Dim.114 Dim.115 Dim.116 Dim.117 Dim.118 Dim.119
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 27.405 27.629 27.852 28.076 28.300 28.523 28.747
## Dim.120 Dim.121 Dim.122 Dim.123 Dim.124 Dim.125 Dim.126
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 28.971 29.195 29.418 29.642 29.866 30.089 30.313
## Dim.127 Dim.128 Dim.129 Dim.130 Dim.131 Dim.132 Dim.133
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 30.537 30.761 30.984 31.208 31.432 31.655 31.879
## Dim.134 Dim.135 Dim.136 Dim.137 Dim.138 Dim.139 Dim.140
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 32.103 32.327 32.550 32.774 32.998 33.221 33.445
## Dim.141 Dim.142 Dim.143 Dim.144 Dim.145 Dim.146 Dim.147
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 33.669 33.893 34.116 34.340 34.564 34.787 35.011
## Dim.148 Dim.149 Dim.150 Dim.151 Dim.152 Dim.153 Dim.154
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 35.235 35.459 35.682 35.906 36.130 36.353 36.577
## Dim.155 Dim.156 Dim.157 Dim.158 Dim.159 Dim.160 Dim.161
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 36.801 37.025 37.248 37.472 37.696 37.919 38.143
## Dim.162 Dim.163 Dim.164 Dim.165 Dim.166 Dim.167 Dim.168
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 38.367 38.591 38.814 39.038 39.262 39.485 39.709
## Dim.169 Dim.170 Dim.171 Dim.172 Dim.173 Dim.174 Dim.175
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 39.933 40.157 40.380 40.604 40.828 41.051 41.275
## Dim.176 Dim.177 Dim.178 Dim.179 Dim.180 Dim.181 Dim.182
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 41.499 41.723 41.946 42.170 42.394 42.617 42.841
## Dim.183 Dim.184 Dim.185 Dim.186 Dim.187 Dim.188 Dim.189
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 43.065 43.289 43.512 43.736 43.960 44.183 44.407
## Dim.190 Dim.191 Dim.192 Dim.193 Dim.194 Dim.195 Dim.196
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 44.631 44.855 45.078 45.302 45.526 45.749 45.973
## Dim.197 Dim.198 Dim.199 Dim.200 Dim.201 Dim.202 Dim.203
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 46.197 46.421 46.644 46.868 47.092 47.315 47.539
## Dim.204 Dim.205 Dim.206 Dim.207 Dim.208 Dim.209 Dim.210
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 47.763 47.987 48.210 48.434 48.658 48.881 49.105
## Dim.211 Dim.212 Dim.213 Dim.214 Dim.215 Dim.216 Dim.217
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 49.329 49.553 49.776 50.000 50.224 50.447 50.671
## Dim.218 Dim.219 Dim.220 Dim.221 Dim.222 Dim.223 Dim.224
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 50.895 51.119 51.342 51.566 51.790 52.013 52.237
## Dim.225 Dim.226 Dim.227 Dim.228 Dim.229 Dim.230 Dim.231
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 52.461 52.685 52.908 53.132 53.356 53.579 53.803
## Dim.232 Dim.233 Dim.234 Dim.235 Dim.236 Dim.237 Dim.238
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 54.027 54.251 54.474 54.698 54.922 55.145 55.369
## Dim.239 Dim.240 Dim.241 Dim.242 Dim.243 Dim.244 Dim.245
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 55.593 55.817 56.040 56.264 56.488 56.711 56.935
## Dim.246 Dim.247 Dim.248 Dim.249 Dim.250 Dim.251 Dim.252
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 57.159 57.383 57.606 57.830 58.054 58.277 58.501
## Dim.253 Dim.254 Dim.255 Dim.256 Dim.257 Dim.258 Dim.259
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 58.725 58.949 59.172 59.396 59.620 59.843 60.067
## Dim.260 Dim.261 Dim.262 Dim.263 Dim.264 Dim.265 Dim.266
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 60.291 60.515 60.738 60.962 61.186 61.409 61.633
## Dim.267 Dim.268 Dim.269 Dim.270 Dim.271 Dim.272 Dim.273
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 61.857 62.081 62.304 62.528 62.752 62.975 63.199
## Dim.274 Dim.275 Dim.276 Dim.277 Dim.278 Dim.279 Dim.280
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 63.423 63.647 63.870 64.094 64.318 64.541 64.765
## Dim.281 Dim.282 Dim.283 Dim.284 Dim.285 Dim.286 Dim.287
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 64.989 65.213 65.436 65.660 65.884 66.107 66.331
## Dim.288 Dim.289 Dim.290 Dim.291 Dim.292 Dim.293 Dim.294
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 66.555 66.779 67.002 67.226 67.450 67.673 67.897
## Dim.295 Dim.296 Dim.297 Dim.298 Dim.299 Dim.300 Dim.301
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 68.121 68.345 68.568 68.792 69.016 69.239 69.463
## Dim.302 Dim.303 Dim.304 Dim.305 Dim.306 Dim.307 Dim.308
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 69.687 69.911 70.134 70.358 70.582 70.805 71.029
## Dim.309 Dim.310 Dim.311 Dim.312 Dim.313 Dim.314 Dim.315
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 71.253 71.477 71.700 71.924 72.148 72.371 72.595
## Dim.316 Dim.317 Dim.318 Dim.319 Dim.320 Dim.321 Dim.322
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 72.819 73.042 73.266 73.490 73.714 73.937 74.161
## Dim.323 Dim.324 Dim.325 Dim.326 Dim.327 Dim.328 Dim.329
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 74.385 74.608 74.832 75.056 75.280 75.503 75.727
## Dim.330 Dim.331 Dim.332 Dim.333 Dim.334 Dim.335 Dim.336
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 75.951 76.174 76.398 76.622 76.846 77.069 77.293
## Dim.337 Dim.338 Dim.339 Dim.340 Dim.341 Dim.342 Dim.343
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 77.517 77.740 77.964 78.188 78.412 78.635 78.859
## Dim.344 Dim.345 Dim.346 Dim.347 Dim.348 Dim.349 Dim.350
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 79.083 79.306 79.530 79.754 79.978 80.201 80.425
## Dim.351 Dim.352 Dim.353 Dim.354 Dim.355 Dim.356 Dim.357
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 80.649 80.872 81.096 81.320 81.544 81.767 81.991
## Dim.358 Dim.359 Dim.360 Dim.361 Dim.362 Dim.363 Dim.364
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 82.215 82.438 82.662 82.886 83.110 83.333 83.557
## Dim.365 Dim.366 Dim.367 Dim.368 Dim.369 Dim.370 Dim.371
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 83.781 84.004 84.228 84.452 84.676 84.899 85.123
## Dim.372 Dim.373 Dim.374 Dim.375 Dim.376 Dim.377 Dim.378
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 85.347 85.570 85.794 86.018 86.242 86.465 86.689
## Dim.379 Dim.380 Dim.381 Dim.382 Dim.383 Dim.384 Dim.385
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 86.913 87.136 87.360 87.584 87.808 88.031 88.255
## Dim.386 Dim.387 Dim.388 Dim.389 Dim.390 Dim.391 Dim.392
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 88.479 88.702 88.926 89.150 89.374 89.597 89.821
## Dim.393 Dim.394 Dim.395 Dim.396 Dim.397 Dim.398 Dim.399
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 90.045 90.268 90.492 90.716 90.940 91.163 91.387
## Dim.400 Dim.401 Dim.402 Dim.403 Dim.404 Dim.405 Dim.406
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 91.611 91.834 92.058 92.282 92.506 92.729 92.953
## Dim.407 Dim.408 Dim.409 Dim.410 Dim.411 Dim.412 Dim.413
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 93.177 93.400 93.624 93.848 94.072 94.295 94.519
## Dim.414 Dim.415 Dim.416 Dim.417 Dim.418 Dim.419 Dim.420
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 94.743 94.966 95.190 95.414 95.638 95.861 96.085
## Dim.421 Dim.422 Dim.423 Dim.424 Dim.425 Dim.426 Dim.427
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 96.309 96.532 96.756 96.980 97.204 97.427 97.651
## Dim.428 Dim.429 Dim.430 Dim.431 Dim.432 Dim.433 Dim.434
## Variance 0.250 0.250 0.250 0.250 0.250 0.250 0.250
## % of var. 0.224 0.224 0.224 0.224 0.224 0.224 0.224
## Cumulative % of var. 97.875 98.098 98.322 98.546 98.770 98.993 99.217
## Dim.435 Dim.436 Dim.437 Dim.438 Dim.439 Dim.440 Dim.441
## Variance 0.250 0.250 0.124 0.116 0.046 0.037 0.026
## % of var. 0.224 0.224 0.111 0.104 0.041 0.033 0.023
## Cumulative % of var. 99.441 99.664 99.775 99.880 99.921 99.953 99.976
## Dim.442 Dim.443 Dim.444 Dim.445 Dim.446 Dim.447
## Variance 0.013 0.009 0.005 0.000 0.000 0.000
## % of var. 0.012 0.008 0.004 0.000 0.000 0.000
## Cumulative % of var. 99.988 99.996 100.000 100.000 100.000 100.000
##
## Individuals (the 10 first)
## Dim.1 ctr cos2 Dim.2 ctr cos2 Dim.3 ctr
## 1 | -0.019 0.000 0.000 | 2.730 0.137 0.011 | 1.161 0.028
## 2 | -0.019 0.000 0.000 | 2.730 0.137 0.011 | 1.161 0.028
## 3 | -0.019 0.000 0.000 | 2.730 0.137 0.011 | 1.161 0.028
## 4 | -0.019 0.000 0.000 | 0.059 0.000 0.000 | -0.819 0.014
## 5 | -0.019 0.000 0.000 | 0.086 0.000 0.001 | -0.316 0.002
## 6 | -0.019 0.000 0.000 | 0.086 0.000 0.001 | -0.316 0.002
## 7 | -0.019 0.000 0.000 | 0.108 0.000 0.001 | -0.432 0.004
## 8 | -0.019 0.000 0.000 | 0.086 0.000 0.001 | -0.316 0.002
## 9 | -0.019 0.000 0.000 | 0.346 0.002 0.008 | -0.358 0.003
## 10 | -0.019 0.000 0.000 | 0.346 0.002 0.008 | -0.358 0.003
## cos2
## 1 0.002 |
## 2 0.002 |
## 3 0.002 |
## 4 0.000 |
## 5 0.007 |
## 6 0.007 |
## 7 0.013 |
## 8 0.007 |
## 9 0.009 |
## 10 0.009 |
##
## Categories (the 10 first)
## Dim.1 ctr cos2 v.test Dim.2 ctr cos2
## Apartamento | -0.019 0.006 0.001 -2.179 | -0.325 2.479 0.167
## Casa | -0.019 0.003 0.000 -1.376 | 0.515 3.928 0.167
## tipo.NA | 52.659 24.991 1.000 91.220 | 0.000 0.000 0.000
## Zona Centro | -0.019 0.000 0.000 -0.213 | 2.566 3.760 0.100
## Zona Norte | -0.019 0.002 0.000 -0.949 | 0.513 2.328 0.079
## Zona Oeste | -0.019 0.001 0.000 -0.710 | -1.087 6.520 0.199
## Zona Oriente | -0.019 0.000 0.000 -0.364 | 3.185 16.400 0.447
## Zona Sur | -0.019 0.005 0.000 -1.986 | -0.237 1.220 0.074
## zona.NA | 52.659 24.991 1.000 91.220 | 0.000 0.000 0.000
## 20 de julio | -0.019 0.000 0.000 -0.033 | 3.381 0.158 0.004
## v.test Dim.3 ctr cos2 v.test
## Apartamento -37.284 | 0.049 0.064 0.004 5.611 |
## Casa 37.291 | -0.077 0.102 0.004 -5.612 |
## tipo.NA 0.000 | 0.000 0.000 0.000 0.000 |
## Zona Centro 28.784 | 0.928 0.563 0.013 10.415 |
## Zona Norte 25.629 | -0.234 0.553 0.016 -11.675 |
## Zona Oeste -40.664 | 1.862 21.901 0.583 69.660 |
## Zona Oriente 60.967 | 1.474 4.018 0.096 28.206 |
## Zona Sur -24.756 | -0.511 6.503 0.343 -53.427 |
## zona.NA 0.000 | 0.000 0.000 0.000 0.000 |
## 20 de julio 5.856 | 1.538 0.037 0.001 2.663 |
##
## Categorical variables (eta2)
## Dim.1 Dim.2 Dim.3
## tipo | 1.000 0.167 0.004 |
## zona | 1.000 0.789 0.764 |
## barrio | 1.000 0.955 0.956 |
## estrato | 1.000 0.699 0.555 |
## Crear copia SOLO para MCA
datos_cat <- vivienda[,c("tipo","zona","barrio","estrato")]
datos_cat[] <- lapply(datos_cat, as.factor)
## Reducir categorías poco frecuentes automáticamente
reducir_niveles <- function(x, min_freq = 50){
frec <- table(x)
niveles_validos <- names(frec[frec >= min_freq])
x <- ifelse(x %in% niveles_validos, as.character(x), "Otros")
return(as.factor(x))
}
datos_cat$barrio <- reducir_niveles(datos_cat$barrio, min_freq = 50)
## Ejecutar MCA
mca_vivienda <- MCA(datos_cat, graph = FALSE)
## Scree plot (varianza explicada)
fviz_screeplot(mca_vivienda,
addlabels = TRUE,
ylim = c(0,50),
title = "Varianza explicada — MCA")## Gráfico limpio de variables
fviz_mca_var(mca_vivienda,
repel = TRUE,
ggtheme = theme_minimal(),
title = "Mapa perceptual de categorías")Existen asociaciones claras entre tipo de vivienda, zona y estrato, lo que demuestra que el mercado presenta patrones estructurados y predecibles.
El gráfico MCA muestra que las categorías con mayor contribución estructuran la diferenciación del mercado inmobiliario, las agrupaciones observadas indican asociaciones entre zona, estrato y tipo de vivienda, evidenciando patrones de segmentación territorial.
El análisis de correspondencia múltiple revela agrupamientos claros entre barrios y zonas urbanas, evidenciando patrones territoriales estructurados en la oferta inmobiliaris, las categorías cercanas en el plano factorial presentan asociaciones significativas, indicando que existen perfiles geográficos diferenciados del mercado, la presencia de categorías aisladas corresponde a registros con valores faltantes y no a segmentos reales.
El análisis de correspondencia múltiple evidencia que la primera dimensión está dominada por valores faltantes, lo cual indica que no representa una segmentación real del mercado sino un efecto de calidad de datos,en contraste, la segunda dimensión refleja la estructura socioespacial del mercado inmobiliario, donde variables como zona geográfica y estrato socioeconómico son los principales determinantes, esto sugiere que las decisiones estratégicas deben enfocarse en la segmentación territorial y socioeconómica, priorizando zonas con mayor diferenciación y potencial de valorización.
El mercado inmobiliario urbano presenta una estructura segmentada dominada por factores latentes y patrones socioespaciales definidos.
Principales hallazgos:
El mercado se organiza en segmentos diferenciados
Pocas variables explican la mayor parte del valor
Existen combinaciones recurrentes de atributos
La analítica permite anticipar tendencias
Priorizar inversiones en segmentos de alto potencial
Implementar modelos de pricing inteligente
Diseñar estrategias diferenciadas por cluster
Detectar zonas emergentes
Automatizar monitoreo analítico del mercado
La analítica de datos aplicada al sector inmobiliario permite transformar información en decisiones estratégicas. Las organizaciones que integran estos modelos logran ventajas competitivas sostenibles, optimizando inversiones y maximizando rentabilidad.
Análisis de Componentes Principales (PCA)
Se utilizó PCA para reducir dimensionalidad y eliminar redundancia entre
variables numéricas.
Supuestos considerados: - variables cuantitativas - relaciones lineales
- estandarización previa
K-means Clustering
Se aplicó segmentación no supervisada para identificar perfiles de
mercado.
Criterios de validación utilizados: - Método del codo - Silhouette
promedio
Análisis de Correspondencia Múltiple (MCA)
Se utilizó MCA para analizar relaciones entre variables
categóricas.
Este método permite identificar asociaciones estructurales y patrones
latentes entre categorías.
## [1] "id" "estrato" "preciom" "areaconst" "parqueaderos"
## [6] "banios" "habitaciones" "longitud" "latitud"
## PC1 PC2 PC3 PC4 PC5 PC6 PC7 PC8 PC9
## id 0.291 0.526 0.357 0.023 -0.084 0.005 0.015 -0.004 -0.710
## estrato 0.321 0.246 -0.448 -0.262 0.589 -0.094 -0.442 0.127 0.000
## preciom 0.441 -0.075 -0.218 -0.211 -0.062 0.277 0.269 -0.744 0.027
## areaconst 0.389 -0.304 0.070 0.007 -0.237 0.668 -0.305 0.396 -0.007
## parqueaderos 0.390 -0.131 -0.232 -0.123 -0.603 -0.606 -0.119 0.129 0.006
## banios 0.417 -0.236 0.075 0.093 0.369 -0.146 0.673 0.381 0.004
## habitaciones 0.234 -0.415 0.491 0.317 0.276 -0.276 -0.414 -0.329 0.004
## longitud -0.277 -0.541 -0.352 -0.062 0.085 -0.010 -0.001 -0.026 -0.703
## latitud -0.099 -0.164 0.442 -0.871 0.053 -0.063 0.004 0.050 0.026
## Importance of components:
## PC1 PC2 PC3 PC4 PC5 PC6 PC7
## Standard deviation 1.9628 1.3725 1.0095 0.9673 0.69386 0.59741 0.49420
## Proportion of Variance 0.4281 0.2093 0.1132 0.1040 0.05349 0.03966 0.02714
## Cumulative Proportion 0.4281 0.6374 0.7506 0.8546 0.90804 0.94770 0.97483
## PC8 PC9
## Standard deviation 0.43328 0.19689
## Proportion of Variance 0.02086 0.00431
## Cumulative Proportion 0.99569 1.00000
## PC1 PC2 PC3
## 1 -1.640 -0.743 -0.190
## 2 0.149 1.108 0.252
## 3 2.916 -0.703 -0.118
##
## 3 4 5 6
## 1 542 1065 1016 57
## 2 115 465 1129 957
## 3 27 111 377 856
##
## Zona Centro Zona Norte Zona Oeste Zona Oriente Zona Sur
## 1 49 918 28 152 1533
## 2 10 199 752 4 1701
## 3 5 170 318 7 871
## eigenvalue percentage of variance cumulative percentage of variance
## dim 1 7.502954e-01 6.524308e+00 6.524308
## dim 2 5.705604e-01 4.961395e+00 11.485703
## dim 3 5.060164e-01 4.400143e+00 15.885846
## dim 4 4.473937e-01 3.890380e+00 19.776226
## dim 5 3.705876e-01 3.222501e+00 22.998726
## dim 6 3.325143e-01 2.891429e+00 25.890155
## dim 7 2.866255e-01 2.492396e+00 28.382551
## dim 8 2.648726e-01 2.303240e+00 30.685791
## dim 9 2.553485e-01 2.220422e+00 32.906213
## dim 10 2.500000e-01 2.173913e+00 35.080126
## dim 11 2.500000e-01 2.173913e+00 37.254039
## dim 12 2.500000e-01 2.173913e+00 39.427952
## dim 13 2.500000e-01 2.173913e+00 41.601865
## dim 14 2.500000e-01 2.173913e+00 43.775778
## dim 15 2.500000e-01 2.173913e+00 45.949691
## dim 16 2.500000e-01 2.173913e+00 48.123604
## dim 17 2.500000e-01 2.173913e+00 50.297517
## dim 18 2.500000e-01 2.173913e+00 52.471430
## dim 19 2.500000e-01 2.173913e+00 54.645343
## dim 20 2.500000e-01 2.173913e+00 56.819256
## dim 21 2.500000e-01 2.173913e+00 58.993169
## dim 22 2.500000e-01 2.173913e+00 61.167083
## dim 23 2.500000e-01 2.173913e+00 63.340996
## dim 24 2.500000e-01 2.173913e+00 65.514909
## dim 25 2.500000e-01 2.173913e+00 67.688822
## dim 26 2.500000e-01 2.173913e+00 69.862735
## dim 27 2.500000e-01 2.173913e+00 72.036648
## dim 28 2.500000e-01 2.173913e+00 74.210561
## dim 29 2.500000e-01 2.173913e+00 76.384474
## dim 30 2.500000e-01 2.173913e+00 78.558387
## dim 31 2.500000e-01 2.173913e+00 80.732300
## dim 32 2.500000e-01 2.173913e+00 82.906213
## dim 33 2.500000e-01 2.173913e+00 85.080126
## dim 34 2.500000e-01 2.173913e+00 87.254039
## dim 35 2.500000e-01 2.173913e+00 89.427952
## dim 36 2.500000e-01 2.173913e+00 91.601865
## dim 37 2.448053e-01 2.128742e+00 93.730607
## dim 38 1.727808e-01 1.502442e+00 95.233049
## dim 39 1.663652e-01 1.446654e+00 96.679703
## dim 40 1.479011e-01 1.286097e+00 97.965800
## dim 41 8.825478e-02 7.674329e-01 98.733232
## dim 42 5.564664e-02 4.838838e-01 99.217116
## dim 43 5.030414e-02 4.374273e-01 99.654544
## dim 44 3.972749e-02 3.454564e-01 100.000000
## dim 45 1.168704e-27 1.016265e-26 100.000000
## dim 46 6.536662e-28 5.684054e-27 100.000000
## Dim 1 Dim 2 Dim 3 Dim 4 Dim 5
## Apartamento 1.261820e-02 2.09391375 0.167872577 3.762126409 2.5322354068
## Casa 1.207905e-03 3.32873383 0.268310362 5.967053521 4.0087317988
## tipo.NA 3.329257e+01 0.01022795 0.005510749 0.001932707 0.0006839027
## Zona Centro 3.647998e-04 1.38906838 1.820087128 1.974496023 0.4882640185
## Zona Norte 6.818787e-04 5.46981876 4.894060930 18.085631222 2.7857442490
## Zona Oeste 5.099278e-03 20.38241177 7.955095811 0.300776692 6.8034946447
El análisis es completamente reproducible bajo las siguientes condiciones:
## R version 4.5.1 (2025-06-13 ucrt)
## Platform: x86_64-w64-mingw32/x64
## Running under: Windows 11 x64 (build 26100)
##
## Matrix products: default
## LAPACK version 3.12.1
##
## locale:
## [1] LC_COLLATE=Spanish_Colombia.utf8 LC_CTYPE=Spanish_Colombia.utf8
## [3] LC_MONETARY=Spanish_Colombia.utf8 LC_NUMERIC=C
## [5] LC_TIME=Spanish_Colombia.utf8
##
## time zone: America/Bogota
## tzcode source: internal
##
## attached base packages:
## [1] stats graphics grDevices utils datasets methods base
##
## other attached packages:
## [1] factoextra_1.0.7 FactoMineR_2.13 cluster_2.1.8.1
## [4] paqueteMODELOS_0.1.0 summarytools_1.1.4 knitr_1.50
## [7] gridExtra_2.3 GGally_2.4.0 ggplot2_3.5.2
## [10] broom_1.0.9 boot_1.3-31
##
## loaded via a namespace (and not attached):
## [1] gtable_0.3.6 xfun_0.52 bslib_0.9.0
## [4] htmlwidgets_1.6.4 rstatix_0.7.2 ggrepel_0.9.6
## [7] lattice_0.22-7 vctrs_0.6.5 tools_4.5.1
## [10] generics_0.1.4 tibble_3.3.0 pkgconfig_2.0.3
## [13] checkmate_2.3.2 pryr_0.1.6 RColorBrewer_1.1-3
## [16] S7_0.2.0 scatterplot3d_0.3-44 lifecycle_1.0.4
## [19] compiler_4.5.1 farver_2.1.2 stringr_1.5.1
## [22] rapportools_1.2 ggsci_4.0.0 leaps_3.2
## [25] codetools_0.2-20 carData_3.0-5 htmltools_0.5.8.1
## [28] sass_0.4.10 yaml_2.3.10 Formula_1.2-5
## [31] car_3.1-3 ggpubr_0.6.1 pillar_1.11.0
## [34] jquerylib_0.1.4 tidyr_1.3.1 MASS_7.3-65
## [37] DT_0.34.0 flashClust_1.01-2 cachem_1.1.0
## [40] magick_2.8.7 abind_1.4-8 ggstats_0.10.0
## [43] tidyselect_1.2.1 digest_0.6.37 mvtnorm_1.3-3
## [46] stringi_1.8.7 dplyr_1.1.4 reshape2_1.4.4
## [49] pander_0.6.6 purrr_1.1.0 labeling_0.4.3
## [52] fastmap_1.2.0 grid_4.5.1 cli_3.6.5
## [55] magrittr_2.0.3 base64enc_0.1-3 withr_3.0.2
## [58] scales_1.4.0 backports_1.5.0 lubridate_1.9.4
## [61] timechange_0.3.0 estimability_1.5.1 rmarkdown_2.29
## [64] matrixStats_1.5.0 emmeans_2.0.1 ggsignif_0.6.4
## [67] evaluate_1.0.4 tcltk_4.5.1 rlang_1.1.6
## [70] Rcpp_1.1.0 xtable_1.8-4 glue_1.8.0
## [73] rstudioapi_0.17.1 jsonlite_2.0.0 R6_2.6.1
## [76] plyr_1.8.9 multcompView_0.1-10