Introducción

El siguiente reporte busca presentar un análisis estadístico univariado, bivariado y multivariado alrededor del mercado inmobiliario de Cali, con el propósito de lograr una idea clara sobre las tendencias, concentraciones espaciales, tipo de viviendas ofertadas, dinámica del precio en relación a diferentes variables y, sobre todo, identificar formas de desarrollar estrategias de venta y distinguir nichos de mercado.

Para ello se inicia con exploración general (exploratorio, EDA), seguido por dos análisis específicos: uno enfocado en el estrato y otro en la zona de la ciudad. Se realiza posteriormente un análisis de componentes principales para entender las variables que más influyen en el mercado, un análisis de conglomerados para identificar segmentos homogéneos más allá de lo pre-establecido en, por ejemplo, zonas y barrios y, por último, un análisis de correspondencia para revisar patrones de comportamiento alrededor de variables categóricas.

A continuación, se encuentran los hallazgos, conclusiones y recomendaciones que se soportan en el análisis específico de cada sección:

Recomendaciones y conclusiones

El análisis detallado de la base de datos de viviendas revela un mercado inmobiliario principalmente de clase media-alta, con una fuerte representación en los estratos 4 y 5, abarcando el 58.63% de las viviendas (25.59% en estrato 4 y 33.04% en estrato 5). El precio por M2 depende estrechamente de la zona y el estrato donde se encuentra la vivienda, existiendo fuerte variabilidad por casos extremos (muy costosos), mientras que el área construida es más estable en el panorama actual. En general, el mercado está orientado hacia el sector multifamiliar de clase media, con una mayor proporción de apartamentos (61%) que de casas (39%), y con viviendas típicas que tienen un área construida de alrededor de 175m² (promedio general), al menos un parqueadero, tres baños y tres habitaciones. En cuanto al precio por metro cuadrado, el 50% de las viviendas ofertadas tienen un precio que ronda entre los COP 2’200.000 y COP 5’400.000, siendo el promedio COP 4’324.250.

Algunas recomendaciones son:

  1. Subrepresentación de zonas: zonas como Oriente y Centro están subrepresentadas. Esto puede sesgar conclusiones generales y estrategias basadas en clusters, particularmente para el segmento de interés social; a no ser que estas zonas no sean el foco de la inmobiliaria. Ver siguiente insight.

  2. Segmentación del mercado con base en espacio y estrato: dividir el mercado en segmentos más específicos basados en zonas y luego en estratos (en este orden). Considerar un tratamiento especial para las viviendas del estrato 6 debido a su alta variabilidad en precios y características, distribuir las Zonas Oriente y Centro dentro de las demás, así como el estrato 3. Esto para mejorar aspectos operativos.

  3. Los mercados afluentes (estrato 6, principalmente de Zona Sur) no deben ser consideradores representativos de la situación inmobiliaria en Cali debido a que concentran los valores más atípicos y extremos de toda el panorama.

  4. Enfocarse en nichos de familias pequeñas y medianas (de 2 a 4 miembros): lo anterior en cuanto estamos frente a un mercado multifamiliar, representado por mayoritariamente por viviendas de 2 y 3 habitaciones (el 50% de las casas y el 80% de los apartamentos), así como un promedio de 174 M2 construidos (para un mínimo de 43.5 M2 por persona para familias con cuatro integrantes). En este sentido, y usando como referencia los valores Q1 que se podrían considerar el equilibrio entre el punto donde la inmobiliaria empieza a ver utilidades y existe una mayor disposición de pago, se recomienda buscar clientes que estén buscando como mínimo una vivienda de 80M2 con un precio por M2 de COP 2’200,000.

  5. La estrategia comercial debe basarse además en la combinación del área construida con las variable baño, piso, parqueaderos y demás en cuanto la mayor parte de la oferta habitacional no se aleja mucho de los valores medios para toda la ciudad.

  6. Revisar viviendas antiguas y en obra negra: más de 30 viviendas no tienen baño, habitaciones o no cumplen con la normativa vigente por lo cual deben pasar por un proceso de revisión y inversión.

  7. Incluir filtros en la página web de la inmobiliaria para los clientes como lo son la inclusión o no de parqueaderos, el piso en el que se encuentra el apartamento o el número de baños debido a la diversidad de posibilidades.

  8. Existen zonas no exploradas por la inmobiliaria: la base de datos no cuenta con viviendas en las comunas 15, 16, 13, 14, 21, 11, 12 y 8 (alrededor del 40% de las comunas en Cali). La base de datos está concentrada en la Comuna 17, 3, 19 y la 2, posibilitando una situación de desbalanceo y sesgo por lo cual se recomienda no realizar conclusiones generalizadas para toda la ciudad.

  9. Próximas investigaciones: se recomienda desarollar en profundidad el análisis de la fórmula del precio a partir de regresiones para poder realizar proyecciones robustas sobre el precio de una vivienda con base en sus características.

  10. Tener en cuenta relaciones claves: La variable habitaciones tiene correlaciones más bajas con otras variables, en particular con el precio por M2. Esto sugiere que el número de habitaciones no es un predictor tan fuerte del precio, posiblemente porque el tamaño general (areaconst) ya incluye implícitamente esta información. En contraste, en zonas densamente urbanizadas como el Centro y Oriente, la correlación entre área construida y número de baños/habitaciones es más alta, reflejando el condicionamiento del espacio sobre el equipamiento.

  11. Oportunidades para desarrollos verticales en estratos medios-altos (3 y 4): Dado que los apartamentos predominan en estratos altos (5 y 6) y las casas en estratos medios (3 y 4), podría haber una oportunidad para introducir desarrollos de vivienda vertical en estratos medios. Esto puede aprovecharse especialmente en zonas con alta densidad poblacional y acceso limitado a terrenos disponibles.

  12. Los clusters de mercado identificados, en general, fueron:

    1. Cluster 1 - Clase media alta: precio promedio de $527 millones, con un área de 182 m², un promedio de 1.96 parqueaderos y un estrato moda 5. Se sugiere para familias o parejas afluentes, o negocios tipo Airbnb.

    2. Cluster 2 - Familias en clase media: precio promedio de $445 millones y un área amplia de 299 m², reflejan un enfoque en familias grandes, con un promedio de 6.46 habitaciones. Esto es ideal, además, para grupos universitarios o soluciones de vivienda multipersonal.

    3. Cluster 3 - Propiedades de lujo: este grupo incluye las propiedades más caras, con un precio promedio de $1,148 millones, un área de 422 m², y un promedio de 3.74 parqueaderos. Por encima del estrato 5, se sugiere la venta con fines comerciales a empresas de eventos, organizaciones que necesiten nuevos espacios amplios o personas con capital de inversión.

    4. Cluster 4 - Mercado asequible: precio promedio de $227 millones, áreas pequeñas de 90.8 m², y 0.815 parqueaderos en promedio, este grupo representa propiedades más accesibles. En general son viviendas de estrato 4 para personas recien independizadas, que no tengan vehículo o cuyo nivel de ingreso necesite soluciones menos exigentes.

Análisis Univariado y Bivariado (descriptivo)

Antes de detallar este análisis vale la pena señalar que se realizó un proceso de limpieza y tratamiento de datos con base en recomendaciones de expertos [1]:

Teniendo esto en cuenta, la tabla 1 permite observar las medidas de tendencia central y dispersión de variables cuantitativas de interés. Con base en ello podríamos afirmar que el mercado inmobiliario en cuestión es de clase media-clase alta debido a la ausencia de vivienda popular (estratos menores a 2) mientras que la vivienda promedio en este caso tiene un área construida de 175m2, al menos un parqueadero, tres baños y tres habitaciones; mientras que su precio por M2 está alrededor de los COP 4’339,000.

No obstante, esto es una idea meramente ilustrativa debido a que algunas de las dimensiones contienen alta variabilidad como lo es el caso del precio por M2 cuyo coeficiente de variación es del 76% (debido a esta situación, en momentos siguientes se discute con mayor profundidad). Así, y para ser más precisos, podríamos decir que el 50% de las viviendas ofertadas tienen entre 80 y 229 M2, son de estrato 3 o 4 y su precio por M2 ronda entre los COP 2’200.000 - 5’400.000 (ver Anexo 1).

Estadísticas descriptivas de las variables numéricas
Variable Mean Median SD Min Max CV
preciom 433.90 330 328.67 58 1999 0.76
areaconst 174.93 123 142.96 30 1745 0.82
parqueaderos 1.48 1 1.24 0 10 0.84
banios 3.11 3 1.43 0 10 0.46
habitaciones 3.61 3 1.46 0 10 0.40

Entrando en más detalle, el 61% del mercado lo acumulan apartamentos con 2 o 3 habitaciones (83% de los casos en este tipo de vivienda), mientras que las casas son el 39% del mismo, pero con una distribución más diversa en cuanto a la oferta habitacional (el 50% de ellas tienen entre 3 y 4 habitaciones). De cualquier manera, lo que vemos acá es un mercado pensado para el sector multifamiliar, principalmente para familias de entre tres a cuatro miembros, lo cual se podría diferenciar de mercados como Bogotá donde la tendencia es cada vez más hacia vivienda unifamiliar o de familias muy pequeñas (más del 80% apartamentos de una o dos habitaciones) [2] o tendencias de mediados del S. XX de mercados que orbitaban alrededor de casas con muchas habitaciones.

Gráfica 1: Distribución por tipo de vivienda

Gráfica 2: Distribución por cantidad de habitaciones

Respecto a la discusión sobre la dispersión del área construida, nótese que esta variable tiene una asimetría positiva (sesgo a la derecha) agrupando el 75% de los datos en el rango de 30m2 (valor mínimo) a 230m2 (Q3), donde se considera que todo lo mayor a este valor es un dato extremo u atípico lo que correspondería en este caso a mansiones o vivienda afluente. Acá vale la pena señalar que el POT Cali 2014 establece que el área mínima de cada vivienda debe ser 42m2 [3] , sugiriendo así que las seis viviendas que se encuentran ofertadas debajo de este nivel pueden no ser aptas para las circunstancias actuales y se consideran outliers absolutos.

Esta misma distribución se observa para el precio por M2 pero con una cola mucho menos prolongada. El 75% de los casos no supera los COP 5’400.000 por M2 y podría decirse que los valores por debajo de los COP 2’200.000 por M2 se deberían considerar como lo más baratos para esta base de datos en específico. Si se necesita trabajar con un valor único de referencia, se recomienda acudir a la mediana de COP 3’300,000 por M2 debido a la alteración del valor promedio como consecuencia de precios muy altos.

Gráfica 3: Histograma del área construida

Gráfica 4: Histograma del precio por M2

Finalmente, se deja a disposición del equipo inmobiliario el siguiente mapa para una concepción espacial de la discusión, donde se ven tres cluster preliminares: comuna 17 hacia el Valle del Lili, Comuna 2 hacia los barrios del Oeste y dos islas menores hacia la zona norte de la ciudad.

Mapa 1: Mapa de calor del mercado inmobilairio

Análisis por estrato

En cuanto a los estratos, y teniendo en cuenta que esto es una variable de interés para el mercado en cuanto define precios de servicios y otros factores, la siguiente información permite señalar que a pesar de que la distribución por estratos no es extremadamente desigual, sí se podía considerar dividir las viviendas del estrato 3 entre los vendedores del estrato 4 y 5 debido a que sus rangos intercuartiles no son muy distantes y podría facilitar temas logísticos. En contraste, vemos que el estrato 6 presenta los precios más altos y una mayor variabilidad, como se observa en la longitud de sus bigotes y la dispersión de los puntos atípicos, señalando que es un mercado especializado potencialmente muy diferente a los demás al punto que su distribución es la que más se aleja de los otros grupos.

Gráfica 5: Gráfica de torta para la distribución de viviendas por estratos estratos

Gráfica 6: Box plot del precio por M2 en cada estrato

Análisis por sector de la ciudad

Ampliando el análisis hacia las zonas de la ciudad, observamos de entrada que la Zona Centro y la Zona Oriente son marginales en cuanto sus dimensiones y podrían aglutinarse con las demás para la venta (son además las zonas con las viviendas más pequeñas y baratas). En la Zona Sur se agrupa la mayor cantidad de viviendas, la mayor parte en el rango estrato 4-5, recomendado tener cuidado con su caracterización en cuanto la amplitud de su precio por M2 es la más diversa con un promedio de COP 4’260,000 pero una mediana de COP 3’200,000). En términos proporcionales, la Zona Oeste es la que concentra mayor cantidad de viviendas de lujo (ojo, en términos relativos específicos para la zona) y por tanto menor diversidad en precio y área construida (sin tener en cuenta las dos zonas marginales con pocos valores).

Gráfica 7: Frecuencia de zonas por estratos

Estadísticas descriptivas por zona (variables escogidas)
medida Zona Centro Zona Norte Zona Oeste Zona Oriente Zona Sur
promedio_preciom 309.69 345.61 677.58 228.53 426.52
mediana_preciom 297.00 300.00 580.00 210.00 320.00
promedio_areaconst 194.04 161.12 196.40 192.33 173.31
mediana_areaconst 160.00 107.00 165.50 160.00 113.00
moda_estrato 3.00 5.00 6.00 3.00 5.00

Para fines de contextualización, tener en cuenta que la Zona Sur y Norte son la más equilibradas en cuanto oferta de tipo de vivienda mientras que la Zona Oeste es ante todo de apartamentos de lujo. Igualmente se deja a consideración la información del Top 3 de barrios más costosos por Zona para tener un punto comparativo para cada uno (acá se excluyeron barrios con una sola vivienda en oferta).

Gráfica 8: Distribución de Tipos de Vivienda por Zona

Top 3 Barrios con el precio de m2 mas caro por zona
Zona Barrio Promedio PrecioM
Zona
Zona Centro san antonio 565.00
centro 541.25
alameda 424.55
Zona Norte santa teresita 925.00
occidente 758.80
ciudad jardín 750.00
Zona Oeste arboleda 1225.00
normandia 1016.00
la arboleda 908.33
Zona Oriente villa colombia 348.00
la fortaleza 316.25
20 de julio 306.67
Zona Sur tejares de san 1416.67
Pance 1236.67
parcelaciones pance 974.26

Análisis de Componentes Principales (PCA)

En esta sección se busca adelantar un Análisis de Componentes Principales (PCA por sus siglas en inglés) que permita (1) identificar relaciones o patrones particulares que no se han hallado, (2) robustecer algunas conclusiones preliminares del análisis univariado y bivariado con nueva evidencia y, principalmente, (3) identificar dimensiones - compuestas por variables - que permitan reducir eventualmente los atributos de esta base de datos para facilitar su interpretación, reducir el costo al analizar variables marginales en su aporte al precio final y facilitar el entrenamiento de modelos predictivos más complejos.

El cruce general de variables, desde su correlación, indica que la variabilidad enre ellas es significativa para los diverentes pares aunque para algunos casos como el preciom y areaconst es más marcado que, por ejemplo, la relación entre banios y parqueaderos (que entre otras cosas no hay un soporte teórico para este cruce en particular).

Gráfica 9: Cruce general de variables cuantitativas

El análisis de componentes principales muestra que el Componente 1 (PC1) captura el 62.6% de la varianza total, mientras que el Componente 2 (PC2) explica el 18.4%, para un total acumulado de 81%. Este resultado sugiere que las primeras dos dimensiones son suficientes para captar la mayor parte de la variabilidad presente en los datos inmobiliarios. En particular, las variables banios, areaconst y preciom están altamente correlacionadas con el PC1, lo que evidencia que las características físicas, como el área construida y la cantidad de baños, son determinantes en la variación de los precios inmobiliarios.

Por otro lado, el PC2 está más relacionado con habitaciones y parqueaderos, reflejando dimensiones más asociadas a la capacidad y funcionalidad del espacio, así como a elementos complementarios que añaden valor a las propiedades. En esta dimensión, se observa una fuerte relación con la segmentación socioeconómica, representada por la variable ordinal estrato, que explica un 33.8% de esta variabilidad. Este comportamiento refuerza la hipótesis de que las viviendas con mayor número de habitaciones y parqueaderos suelen estar asociadas a estratos más altos como se esbozó prematuramente en el EDA.

La dispersión observada en las estadísticas descriptivas iniciales, como la alta desviación estándar y coeficientes de variación significativos en preciom y areaconst, sugiere una gran heterogeneidad en el mercado, lo que podría explicar por qué ambos componentes principales son necesarios para capturar las distintas dimensiones de variabilidad presentes.

Gráfica 10: Varianza explicada y contribuciones por variables al PCA

## Importance of components:
##                           PC1    PC2     PC3     PC4     PC5
## Standard deviation     1.7687 0.9580 0.65962 0.56977 0.44053
## Proportion of Variance 0.6257 0.1836 0.08702 0.06493 0.03881
## Cumulative Proportion  0.6257 0.8092 0.89626 0.96119 1.00000

Un análisis más detallado revela que las contribuciones al PC1 son lideradas por las variables banios (24.6%), areaconst (23.4%) y preciom (22.9%). Por su parte, el PC2 está dominado por habitaciones, que aporta un 56.8%, seguido de parqueaderos con un 27%. La segmentación observada en estas variables refleja tanto los aspectos estructurales como las características socioeconómicas de las propiedades, mostrando cómo estas dimensiones interactúan para dar forma a los patrones de oferta y demanda en el mercado inmobiliario.

Gráfica 11: Contribuciones de las variables a las dimensiones

##                 Dim.1      Dim.2     Dim.3     Dim.4      Dim.5
## preciom      22.90739 12.9326929 12.896168  6.949241 44.3145058
## areaconst    23.40515  0.7268657 31.560238 28.963628 15.3441210
## parqueaderos 16.67232 27.0696875 43.641509 11.954780  0.6617019
## banios       24.59239  2.4508938  1.467025 48.278137 23.2115544
## habitaciones 12.42275 56.8198601 10.435060  3.854214 16.4681168

El análisis también incluyó pruebas de hipótesis sobre las correlaciones entre las variables continuas y las dimensiones principales. Los resultados muestran correlaciones significativas, con valores de R-cuadrado altos para variables como banios (0.877), areaconst (0.856) y preciom (0.847) en el PC1, lo que confirma su relevancia en la explicación de la variabilidad en esta dimensión. En el PC2, habitaciones destaca con una correlación de 0.722, reflejando su fuerte asociación con esta componente. Estas relaciones, todas con p-valores menores a 0.05, respaldan la robustez estadística del modelo y refuerzan la interpretación de los resultados, señalando cómo las variables físicas y socioeconómicas actúan como ejes principales en la estructura del mercado inmobiliario.

## 
## Link between the variable and the continuous variables (R-square)
## =================================================================================
##              correlation p.value
## banios         0.8771231       0
## areaconst      0.8556888       0
## preciom        0.8465410       0
## parqueaderos   0.7222012       0
## habitaciones   0.6234032       0
## 
## Link between the variable and the continuous variables (R-square)
## =================================================================================
##              correlation       p.value
## habitaciones  0.72214514  0.000000e+00
## banios        0.14998114  4.728133e-43
## areaconst     0.08167732  8.585588e-14
## preciom      -0.34452354 1.617248e-230
## parqueaderos -0.49844361  0.000000e+00

Análisis de Correspondencia (CA)

El análisis inicial intentó realizar un análisis de correspondencia para explorar las relaciones entre las variables categóricas tipo, zona y barrio. Sin embargo, debido a la alta cardinalidad de la variable barrio (con un gran número de categorías únicas), el procesamiento resultó poco eficiente y complicado de interpretar visualmente. Para evitar iteraciones innecesarias y centrarnos en identificar patrones más agregados y representativos, se optó por un análisis de componentes múltiples (MCA), el cual es más adecuado para analizar conjuntos de datos con múltiples variables categóricas y permite una visualización más manejable del espacio de factores.

La exploración inicial preliminar de los cruces por variables dan cuenta de la existencia de relaciones considerabls entre observaciones específicas. Algunas de estas, ya observables con antelación en el EDA, son por ejemplo la prelación de apartamentos en la Zona Oeste (lo que da pistas del alto costo de preicom por el componente de escaces de tierra para construir) y la existencia de un crisol más variado de estratos en la zona sur y norte frente a la zona oriente u oeste.

Gráfica 12: Exploración preliminar de relación entre variables categóricas

Teniendo en cuenta lo anterior, se desarrolló el MCA que, en comparación con el PCA, no logra explicar por sí mismo una gran porción de la varianza. Sin embargo, y teniendo en cuenta que solo se trabajaron con tres variables, es relevante considerar las dos dimensiones de mayor envergadura:

Dimensión 1 (21.1% de la varianza):

Dimensión 2 (17% de la varianza):

Conclusión general:

Gráfica 13: Resultados del MCA a nivel de dimensiones y variables

##       eigenvalue percentage of variance cumulative percentage of variance
## dim 1  0.5620882              21.078306                          21.07831
## dim 2  0.4531232              16.992119                          38.07043
## dim 3  0.3796450              14.236687                          52.30711
## dim 4  0.3334444              12.504164                          64.81128
## dim 5  0.3233137              12.124263                          76.93554
## dim 6  0.2717762              10.191608                          87.12715
## dim 7  0.2013563               7.550862                          94.67801
## dim 8  0.1419197               5.321990                         100.00000

Análisis de Conglomerados

El siguiente análisis busca agrupar el mercado inmobiliario según características comunes. Se retoma el grupo de variables del MCA junto con el conjunto de variables estríctamente númericas para realizar el cluster de manera completa.

Para ello, se inicia con el análisis del gráfico del método del codo para establecer el número de clusters a través de la distinción del “punto de inflexión”, donde la disminución en la suma de cuadrados dentro de los grupos (Total Within Sum of Squares) comienza a estabilizarse. En este caso, el punto de inflexión parece estar alrededor de 4 clusters. Este valor representa un buen equilibrio entre la cantidad de clusters y la variabilidad explicada dentro de cada grupo. Optar por más clusters después de este punto generará una mejora marginal en la reducción de la variabilidad, pero a costa de una mayor complejidad del modelo (se realizaron dos iteraciones adicionales con 3 y 5 clusters con resultados menos útiles).

Gráfica 13: Método del codo para determinar el número de Clusters

Así, la implementación del agrupamiento por medio del método K-means arrojó naturalmente cuatro grupos específicos que dan luz sobre las dinámicas específicas del mercado inmobiliario.

El Cluster 1, con un precio promedio de $527 millones y un estrato promedio alto (5.33), está compuesto por propiedades de tamaño medio (182 m2), con 1.96 parqueaderos y 3.63 baños. Este segmento parece enfocado en compradores de profesiones liberales, jóvenes independientes y afluentes, donde la ubicación en zonas como el oeste y el estrato socioeconómico son los factores predominantes para la decisión de ofeta y compra.

El Cluster 2, con un precio promedio de $445 millones y un área mayor (299 m2), destaca por tener el mayor número de habitaciones (6.46), sugiriendo un mercado dirigido a familias grandes que priorizan el espacio habitable antes que el lujo o zonas de alta distinción social. Este segmento se encuentra en un estrato promedio moderado (3.93), lo que podría asociarlo con zonas de expansión. Además, el bajo promedio de parqueaderos (1.11) refuerza la idea de que estas propiedades están destinadas a compradores con menores necesidades de infraestructura vehicular.

El Cluster 3 agrupa propiedades de lujo, con el precio promedio más alto ($1,148 millones), áreas amplias (422 m2) y el mayor promedio de parqueaderos (3.74), lo que lo asocia con propiedades premium ubicadas en zonas exclusivas de la ciudad. En contraste, el Cluster 4, con el precio promedio más bajo ($227 millones) y las áreas más reducidas (90.8 m2), se relaciona con propiedades asequibles para el públicos del estrato 4 hacia abajo. Estas viviendas, con 2.87 habitaciones y 0.815 parqueaderos en promedio, parecen destinadas a compradores que buscan su primera vivienda o soluciones de interés social.

Gráfica 14 y 15: Visualización de conglomerados y distribución de variables en clusters

## # A tibble: 4 × 7
##   cluster Precio_Promedio Area_Promedio Parqueaderos_Prom Banios_Prom
##   <fct>             <dbl>         <dbl>             <dbl>       <dbl>
## 1 1                  527.         182.              1.96         3.63
## 2 2                  445.         299.              1.11         4.39
## 3 3                 1148.         422.              3.74         5.18
## 4 4                  227.          90.8             0.815        2.09
## # ℹ 2 more variables: Habitaciones_Prom <dbl>, Estrato_Prom <dbl>

Vale la pena señalar que se buscó evaluar el modelo propuesto para una transparencia sobre los resultados. Así, tener en cuenta lo siguinete:

## Suma de Cuadrados Totales (SST): 50035.54
## Suma de Cuadrados Dentro de Clusters (SSC): 23199.79
## Suma de Cuadrados Entre Clusters (SSB): 26835.75
## Porcentaje de variabilidad explicada por los clusters (SSB/SST): 53.63 %
## Índice de Rand Ajustado (ARI): 0.143

Anexos

Anexo 1 y 2: box plot e información estadística de estrato, área construida y precio por M2

Cuartiles para área construida, Precio por M2 y número de habitaciones
Variable Q1 Mediana Q3
areaconst 80 123 229
preciom 220 330 540
habitac 3 3 4

Anexo 3: Medidas de tendencia central por Zona para cada variable

Estadísticas Descriptivas por Zona
medida Zona Centro Zona Norte Zona Oeste Zona Oriente Zona Sur
promedio_preciom 309.69 345.61 677.58 228.53 426.52
mediana_preciom 297.00 300.00 580.00 210.00 320.00
promedio_areaconst 194.04 161.12 196.40 192.33 173.31
mediana_areaconst 160.00 107.00 165.50 160.00 113.00
promedio_parquea 0.73 1.10 1.97 0.64 1.59
mediana_parquea 1.00 1.00 2.00 0.00 1.00
promedio_banios 2.84 2.78 3.51 2.75 3.18
mediana_banios 2.50 2.00 4.00 2.00 3.00

Referencias

[1] J. García, J. M. Molina, A. Berlanga, M. Á. Patricio, Á. L. Bustamante, and W. R. Padilla, Ciencia de Datos: Técnicas Analíticas y Aprendizaje Estadístico en un Enfoque Práctico, 1st ed. México: Alfaomega, 2021, pp. 445, ISBN: 9786075382524.

[2] “Viviendas unipersonales, la tendencia que aumenta en Colombia,” El Tiempo, 27-Jun-2023. [Online]. Available: https://www.eltiempo.com/economia/sectores/viviendas-unipersonales-la-tendencia-que-aumenta-en-colombia-706369. [Accessed: 17-Jul-2024].

[3] Concejo de Ssantiago de Cali, “Acuerdo N° 0373 de 2014: Por medio del cual se adopta la revisión ordinaria de contenido de largo plazo del Plan de Ordenamiento Territorial del municipio de Santiago de Cali,” 2014. [Online]. Available: https://www.cali.gov.co/planeacion/publicaciones/106497/pot_2014_idesc/.