Introducción

El mercado inmobiliario de la ciudad de Cali, Colombia, representa un sector dinámico y de gran importancia tanto a nivel departamental como regional, puesto que comprende una de las ciudades mas importantes del país. En el contexto de este informe estadístico, dirigido a la empresa B&C Bienes y Casas de Cali, se analiza la base de datos “viviendas_faltantes”. Esta base de datos contiene información detallada sobre las propiedades ofertadas en la ciudad, abarcando una amplia gama de variables pertinentes para comprender la dinámica del mercado inmobiliario.

Los métodos de preprocesamiento de datos empleados en este informe, tales como la revisión, sistematización, eliminación de duplicados e imputación de valores faltantes, aseguran la integridad y calidad de la información analizada. Estos procesos son esenciales para brindar a B&C Bienes y Casas de Cali una visión precisa y confiable del estado actual del mercado inmobiliario en la ciudad.

Además, se han utilizado herramientas y técnicas avanzadas de análisis descriptivo, como histogramas, gráficos de barras, gráficos de densidad múltiple, mapas y tablas con valores promedio por zona. Estas herramientas proporcionan una visión profunda de las tendencias y características del mercado inmobiliario, permitiendo a identificar oportunidades de inversión, entender la demanda del mercado y tomar decisiones estratégicas informadas.

Objetivo

  1. Preparar los datos del conjunto de viviendas_faltantes para un análisis preciso, empleando estrategias de limpieza, sistematización e imputación de datos.

  2. Analizar la información de la base de datos viviendas_faltantes para exponer el estado y las características del mercado inmobiliario en la ciudad de Cali.

Métodos

Preprocesamiento de los datos.

Para garantizar un análisis preciso del mercado inmobiliario en Cali, se llevó a cabo un exhaustivo proceso de preprocesamiento de los datos obtenidos del conjunto viviendas_faltantes. Este proceso incluyó revisión, sistematización, eliminación de duplicados e imputación de valores faltantes.

library(paqueteMETODOS);
data(vivienda_faltantes)

En la etapa de sistematización, se resolvieron conflictos de terminología en la variable “tipo”, unificando exclusivamente los tipos de casas y apartamentos, eliminando variantes textuales. Del mismo modo, se normalizaron los nombres de los barrios para evitar discrepancias. Se eliminaron un total de once registros, tres de ellos por ausencia completa de datos y ocho debido a la detección de duplicados.

Respecto a la imputación de valores faltantes, se identificaron tres registros con información totalmente vacía, los cuales fueron eliminados. Para abordar los 2638 valores faltantes en la variable “piso” y los 1603 en “parqueadero”, se implementó un modelo de regresión para estimar estos valores basándose en registros similares. Para conocer más detalles sobre este proceso, consulte la sección de anexos al final del documento.

Análisis descriptivo

Se emplearon diversas herramientas y métricas disponibles en R para obtener medidas de tendencia central, dispersión y forma que nutrieron el informe de resultados. Los gráficos se generaron utilizando paquetes como Leaflet, ggplot y ggplot2, abarcando histogramas, gráficas de barras, gráficos de densidad múltiple, mapas y tablas con valores promedio por zona. Estas representaciones visuales enriquecen la comprensión del mercado inmobiliario en Cali y facilitan la interpretación de los datos.

Resultados y discusiones

El número de propiedades ofertadas en Cali al momento de la consulta de la base de datos fue de 8319, distribuidas y delimitadas en cinco zonas de la ciudad. La zona norte, que comprende principalmente propiedades al norte de la Carrera Quinta, con límites en Acopi y Altos de Menga, representa la tercera zona más extensa geográficamente y la segunda en términos de inmuebles ofertados.

La zona centro abarca propiedades ubicadas entre la Carrera 24 y la Carrera Quinta de sur a norte, y entre la Calle Quinta y la Carrera 25 de oeste a este. Es la zona más reducida tanto en extensión geográfica como en oferta inmobiliaria.

Por otro lado, la zona oeste está delimitada al sur por la Carrera 40 y el Ecoparque Bataclan, al norte. Además, se separa del centro en la Calle 5. Es la cuarta zona más amplia en términos geográficos y la tercera en términos de oferta inmobiliaria.

La zona oriente comprende los inmuebles entre la Calle 25 y el Jarillón de Cali de oeste a este, y desde la Carrera 5 hasta la Carrera 50 en sentido norte-sur. Es la segunda zona más extensa geográficamente y la cuarta en oferta inmobiliaria.

Finalmente, la zona sur contiene límites más irregulares, delimitada desde la zona oeste por la Carrera 40 hasta la Calle 5, donde el límite se desplaza hacia la zona centro en la Carrera 24 y vuelve a ceder al llegar a la Calle 25, donde limita con la zona oriente en la Carrera 50. Es la zona más grande tanto geográficamente como en oferta inmobiliaria.

Las propiedades se distribuyen de la siguiente forma entre zonas:

Se observa que gran parte de la oferta inmobiliaria de Cali se concentra en la zona sur de la ciudad, seguida por la zona Norte. En su mayoría el tipo de inmueble que se encuentra mas en venta es el de tipo apartamento y este patrón es diferente solamente en la zona centro y oriente de la ciudad, donde las casas son el inmueble más ofertado.

Los barrios de la ciudad con mayor ofertas de venta son Valle de Lili con 1009 inmuebles, Pance con 412 y El Caney con 209, los tres mencionados son barrios del sur de la ciudad. En el oeste destaca Santa Teresita con 263 inmuebles en venta.

Composición de las propiedades

Área construida

El área construida nos brinda información relevante del tamaño total de la propiedad por encima de cualquier otro valor, aunque este es mucho más objetivo en inmuebles del tipo apartamento cuya área construida usualmente está definida desde un principio y es invariable.

El área construida promedio de los inmuebles en venta en la ciudad es de 174.93 m² con una mediana de 123 m² lo cual indica que la distribución de los valores no sigue la distribución normal, en su lugar se acumulan a la izquierda.

Al observar el gráfico dividido por tipo de inmueble se evidencia que los apartamentos en general son de un tamaño más pequeño que las casas como es comúnmente asumido. También se observa que gran parte de los apartamentos tienen un área construida entre 50 y 100 metros cuadrados.

Un análisis sobre los estratos socioeconómicos evidencia que las propiedades en venta en sectores estrato cinco y seis son más grandes que aquellas de estrato tres y cuatro, de hecho, de acuerdo a la mediana (observada en el gráfico inferior), las viviendas más pequeñas ofertadas son de estrato 4.

Division interna de los inmuebles

Las viviendas reportan diferentes categorías de cómo se distribuye el área construida entre baños, habitaciones y parqueaderos si corresponde. A continuación, se presenta las diferentes formas en que se dividen los inmuebles en oferta.

Ya se evidencio la diferencia de tamaño que existe entre casas y apartamentos, sin embargo la tabla inferior no muestra una diferencia muy grande en cómo se distribuye el espacio dentro del inmueble entre casas y apartamentos, mas allá de las claras diferencias en número la proporción entre baños-habitaciones-parqueaderos es similar entre ambos tipos de inmueble.

Número promedio reportado
Tipo Baños Habitaciones Parqueaderos
apartamento 2.617376 2.971563 1.499118
casa 3.893478 4.609006 2.162422

Para el caso de las la composición promedio de una propiedad en las diferentes zonas de la ciudad:

Número promedio reportado
Zona Baños Habitaciones Parqueaderos
Zona Centro 2.838710 4.701613 1.395161
Zona Norte 2.778125 3.500521 1.578646
Zona Oeste 3.511686 3.292154 2.121035
Zona Oriente 2.746439 4.923077 1.353276
Zona Sur 3.179433 3.600719 1.774651

Se observa que el numero de baños y parqueaderos es mas alto en aquellas zonas con mayores precios de venta para las propiedades. El numero de habitaciones reportado en las viviendas es en promedio mas alto en el oriente y el centro de Cali, lo cual da información clave de la distribución del área construida dependiendo de la zona.

Una tabla similar pero enfocada en el estrato socioeconómico demuestra como se distribuyen las necesidades de asignación de espacios. Las casas reportadas de estrato 3 tienen en promedio más habitaciones sacrificando el numero de baños y de parqueaderos disponibles. En el estrato 4 se reporta el menor número de habitaciones. Para el estrato 6 las viviendas tienen en promedio mas baños, hasta dos mas que en estrato 3, y parqueaderos.

Número promedio reportado
Estrato Baños Habitaciones Parqueaderos
3 2.353751 4.061253 1.249140
4 2.656646 3.367309 1.326444
5 3.147273 3.575636 1.737818
6 4.102667 3.568193 2.611475

Precios de venta

Los precios de los inmuebles van desde los 58 millones hasta casi 2000 millones de pesos con una media de precio para toda la ciudad de 433.9 millones y una mediana de 330 millones, indicando que mas de la mitad de todas las propiedades ofertadas se encuentra por debajo de los 330 millones de pesos.

El rango de precios entre casas y apartamentos es muy similar, por lo cual no se puede afirmar con certeza que un tipo de inmueble tengo un precio de venta mas alto que el otro, se observa una cantidad importante de apartamentos con precios entre los 100-300 millones pero este patrón diferenciado puede ser producto de la disparidad entre el numero de apartamentos y casas totales.

En un intento de normalizar la métrica de precio se decidió calcular el valor del metro cuadrado de cada vivienda usando la formula Valor m2 = (Precio del inmueble / área construida). La métrica fue analizada en el contexto de cada zona de la ciudad como se reporta en la figura de abajo.

A pesar de que las propiedades del tipo “casa” suelen ser más grandes los precios por metro cuadrado parecen ser mayores en los apartamentos particularmente en la zona oeste y norte. Por otro lado, en la zona norte y la zona oriente la diferencia en mucho mas pequeña, aunque el valor del metro cuadrado sigue siendo superior en los apartamentos.

También es relevante conocer como se distribuyen los precios entre los diferentes estratos socioeconómicos, la tabla inferior muestra intervalos de precios y el numero total de propiedades por estrato que se encuentran en ese intervalo de precio.

No. de propiedades por estrato
Precio en millones 3 4 5 6
$58 - $234 974 1061 339 11
$235 - $411 386 781 1453 252
$412 - $587 70 200 557 413
$588 - $764 11 59 246 426
$765 - $940 7 12 61 305
$941 - $1,120 1 5 31 176
$1,121 - $1,290 0 4 26 147
$1,291 - $1,470 2 3 17 116
$1,471 - $1,650 1 2 12 61
$1,651 - $1,820 0 2 4 56
$1,821 - $2,000 0 0 3 24

El mayor número de inmuebles se concentra en las evaluadas entre 235-411 millones de pesos de estrato 5, seguida por las evaluadas en 58-234 millones de estrato 4. El estrato 6 demuestra el mayor rango de precios, con inmuebles representantes en todos los intervalos de precios considerados. Como era de esperarse las viviendas mas caras se concentran en el estrato 6 e incluso parece seguir un patrón lineal, donde entre mas precio mayor es el estrato asociado a la vivienda. Esta tabla puede resultar particularmente útil para identificar puntos del mercado inmobiliario con baja oferta.

La grafica de la izquierda confirma que entre mayor es el estrato de la vivienda mayor es el precio asociado, casi en una tendencia lineal. La grafica de la derecha por otro lado muestra la relación entre el No. De piso reportado y el valor por metro cuadrado, donde se evidencia la ausencia de alguna tendencia en las casas, lo cual podría estar relacionado con un reporte no muy acertado en estos registros. Los apartamentos muestran un valor superior cuando están ubicados en pisos superiores al 5.

Explorador geográfico

A continuación se adjunta una herramienta de exploración geográfica, que permite consultar de forma visual las zonas de la ciudad con mayores precios de venta, la distribución de todas las viviendas ofertadas y por supuesto, las zonas con baja oferta inmobiliaria.

Conclusiones

El estudio exploratorio del mercado inmobiliario en la ciudad de Cali arrojo algunos datos interesantes a tener en cuenta, el primero es que gran parte de la oferta se concentra en las zonas más caras de la ciudad como seria el oeste y el sur. En particular los barrios Valle de Lili y Pance parecen estar bastante saturados de oferta por lo cual dependiendo de los objetivos que tenga la empresa B&C estos barrios y las zonas en general podrían ser zonas muy relevantes para sus estrategias. Por otro lado, la zona oriente es la que menos oferta presenta a pesar de tener un tamaño considerable, al ser una zona popular es posible que gran parte de los inmuebles en venta disponibles no estén siendo considerados.

Otro punto interesante para B&C es la gama de precios que se maneja en la ciudad, con valores de media y mediana entre 330 y 430 millones de pesos. La cantidad de inmuebles con mayor precio es menor entre mayor sea el precio y también en proporción crece la necesidad de ofrecer casas cada vez mas grandes y con una distribución del espacio enfocada en mas parqueaderos y baños.

Finalmente, los apartamentos presentan una mayor oferta que las casas en toda la ciudad con excepción de las zonas oriente y centro, donde el numero de viviendas en mucho menor. En total se reportan 5099 apartamentos y 3220 casas. Las casas son usualmente mas grandes que los apartamentos y su valor por metro cuadrado es menor, además resultan mucho mas atractivas para algunos clientes por su capacidad de incrementar el área construida y el grado de independencia.

Anexos

Limpieza

### Sistematización
#DB=vivienda_faltantes
#DB$tipo<- tolower(DB$tipo) #### pasar todos a minusculas 
#DB$tipo<- gsub("apto", "apartamento", DB$tipo, ignore.case = TRUE) #### Sustituir variantes de nombres
#DB$barrio=tolower(DB$barrio)
#limpiar_barrios <- function(nombres) {
#  nombres <- tolower(trimws(iconv(nombres, from = "UTF-8", to = "ASCII//TRANSLIT")))
#  nombres <- gsub("[_ ]", "", nombres)
#  return(nombres)
#}
#DB$barrio <- limpiar_barrios(DB$barrio)
#Eliminar duplicados y vacios
#DB=DB[complete.cases(DB$id),]#elimina los faltantes en una categoria
#DB=unique(DB)
######imputacion
#library(mice)
#DB_imputacion = DB[, c('zona','piso','estrato','preciom', 'areaconst','parquea', 'banios','habitac','tipo','barrio')]
#Modelo de imputación 
#Imputados <- mice(DB_imputacion, method = 'pmm', m = 20, maxit = 50, seed = 500)
#DB_imputacion <- complete(Imputados)
#DB$piso <- DB_imputacion$piso
#DB$parquea <- DB_imputacion$parquea

Imputación usando modelos de regresion del paquete MICE

#install.packages("mice")
#library(mice)
#DB_imputacion = DB[, c('zona','piso','estrato','preciom', 'areaconst','parquea', 'banios','habitac','tipo','barrio')]
#Modelo de imputación 
#Imputados <- mice(DB_imputacion, method = 'pmm', m = 50, maxit = 100, seed = 500)
#DB_imputacion <- complete(Imputados)
#DB$piso <- DB_imputacion$piso
#DB$parquea <- DB_imputacion$parquea