0.1 Introducción

Señores B&C, este documento presenta un análisis riguroso de datos entorno al mercado inmobiliario de la ciudad de Cali. Dicho análisis se enfoca principalmente en: i) el precio de las viviendas en diferentes zonas de ciudad, ii) tipo de viviendas más vendidas, iii) características más buscadas y, iv) evolución del mercado de bienes raíces en Cali.

Es importante resaltar que el mercado de bienes raíces en Cali ha crecido significativamente en los últimos años, impulsado por el crecimiento de la población, la inversión extranjera directa y el desarrollo de nuevos proyectos inmobiliarios. En 2021, las ventas del sector en Cali llegaron a $6700 millones y en 2022 a $6100 mil millones. Se espera que este sector continúe creciendo durante los próximos años, permitiendo un desarrollo dinámico en la economía regional.

0.2 Objetivos

En esta sección enunciamos los principales objetivos del presente reporte, así:

  1. Exponer las principales característias de las viviendas en las diferentes zonas de Cali
  2. Identificar las características más buscadas en las viviendas en Cali
  3. Generalidades adicionales del mercado inmobiliario en Cali

0.3 Métodos

En esta sección se describirán los métodos utilizados para la construcción del reporte.

0.3.1 Métodos básicos

Entre los métodos básicos que se utilizaran en el reporte, usted podrán encontrar:

  1. Tablas descriptivas de datos
  2. Gráficas de datos (histogramas, diagramas de densidad, gráficos de barras y caja)

Estos métodos permiten de una manera visual identificar particularidades de la base de datos y del compotamiento del mercado inmobiliario en Cali.

0.3.2 Métodos de estimación de datos faltantes

En caso de tener datos faltantes en la base de datos se implementaran los siguientes métodos de imputación:

  1. Imputación con la media
  2. Imputación mediante regresión
  3. Imputación mediante regresión estocastica
  4. Imputación con muestra aleatoria

Estos métodos se utilizaran para buscar el que mejor se ajuste a los datos y permita imputar de la mejor manera estos.

0.4 Resultados

0.4.1 Base de datos

A continuación, se presenta la base de datos con que se lleva a cabo el presente reporte. Con el objetivo de que los miembros directivos de la compañía puedan interartuar con esta, se presenta la base en una tabla dinámica que le permitirá hacer filtros (en la celda buscar) u ordenamientos (con la flechas de cada columna) para hacerse una idea inicial de las cifras que verá más adelante.

Nota 1.: Las viviendas que no tienen información de la zona en la cual están ubicadas, se identifican con nombre de zona: NA

Nota 2.: Los datos faltantes en las demás variables se identifican por los vacios en las columnas de información.

0.4.2 Descripción general de la base de datos

En esta sección podrá observar las características generales de la base de datos con que se desarrolla el presente reporte.

##        id           zona                piso           estrato     
##  Min.   :   1   Length:8330        Min.   : 1.000   Min.   :3.000  
##  1st Qu.:2082   Class :character   1st Qu.: 2.000   1st Qu.:4.000  
##  Median :4164   Mode  :character   Median : 3.000   Median :5.000  
##  Mean   :4164                      Mean   : 3.772   Mean   :4.634  
##  3rd Qu.:6246                      3rd Qu.: 5.000   3rd Qu.:5.000  
##  Max.   :8319                      Max.   :12.000   Max.   :6.000  
##  NA's   :3                         NA's   :2641     NA's   :3      
##     preciom         areaconst       parquea           banios      
##  Min.   :  58.0   Min.   :  30   Min.   : 1.000   Min.   : 0.000  
##  1st Qu.: 220.0   1st Qu.:  80   1st Qu.: 1.000   1st Qu.: 2.000  
##  Median : 330.0   Median : 123   Median : 2.000   Median : 3.000  
##  Mean   : 434.2   Mean   : 175   Mean   : 1.836   Mean   : 3.112  
##  3rd Qu.: 540.0   3rd Qu.: 229   3rd Qu.: 2.000   3rd Qu.: 4.000  
##  Max.   :1999.0   Max.   :1745   Max.   :10.000   Max.   :10.000  
##  NA's   :2        NA's   :3      NA's   :1606     NA's   :3       
##     habitac           tipo              barrio            longitud        
##  Min.   : 0.000   Length:8330        Length:8330        Length:8330       
##  1st Qu.: 3.000   Class :character   Class :character   Class :character  
##  Median : 3.000   Mode  :character   Mode  :character   Mode  :character  
##  Mean   : 3.605                                                           
##  3rd Qu.: 4.000                                                           
##  Max.   :10.000                                                           
##  NA's   :3                                                                
##     latitud       
##  Min.   :   3.34  
##  1st Qu.: 337.79  
##  Median : 344.08  
##  Mean   :1180.80  
##  3rd Qu.:3367.00  
##  Max.   :3497.00  
##  NA's   :3

Algunos de los datos relevantes de la anterior tabla son los siguientes:

  • Número de observaciones: 8.330

Variables

  • zona: en dónde se ubica la vivienda

  • piso: el número de piso en que se cuentra la vivienda (es importante entender que se cuenta con apartamentos y estos pueden tomar diferentes valores)

  • estrato: el estrato socioeconomico al cual pertenece el sitio en que está la vivienda

  • preciom: precio del metrocuadrado del inmueble

  • areaconst: el total de área construida

  • parquea: el número de paqueaderos con que cuenta el inmueble

  • banios: es el número de baños que tiene la vivienda

  • habitac: es el número de habitaciones de la vivienda

  • tipo: caracteriza la vivienda entre “casa” o “apartamento”

  • barrio: nombre del barrio en dónde está el inmueble

  • longitud y latitud: las coordenadas del inmueble

0.4.3 Imputación de datos faltantes

Dentro del total de datos se encuentró un número de 4279 de datos faltantes. Estos datos se encontraron principalmente en las siguientes variables:

## 
##  Variables sorted by number of missings: 
##   Variable        Count
##       piso 0.3170468187
##    parquea 0.1927971188
##         id 0.0003601441
##       zona 0.0003601441
##    estrato 0.0003601441
##  areaconst 0.0003601441
##     banios 0.0003601441
##    habitac 0.0003601441
##       tipo 0.0003601441
##     barrio 0.0003601441
##   longitud 0.0003601441
##    latitud 0.0003601441
##    preciom 0.0002400960

Como se observa en la gráfica anterior, la mayoría de datos faltantes hacen parte de las variables piso y parquea.

0.4.3.1 Imputación con la media

Este método permite reemplazar los datos faltantes con el valor de la media de los observados. A continuación, se presenta el gráfico con el comportamiento de los datos observados e imputados.

0.4.3.2 Imputación mediante regresión

Este método consiste en estimar los valores faltantes con base en un análisis de regresión lineal. A continuación, se presenta el gráfico con el comportamiento de los datos observados e imputados.

0.4.3.3 Imputación mediante regresión estocastica

Este método en primer lugar calcula la intercepción, la pendiente y la varianza residual del modelo lineal, luego construye el valor para cada valor faltante y agrega un compnente aleatorio sobre los residuales de la predicción. A continuación, se presenta el gráfico con el comportamiento de los datos observados e imputados.

0.4.3.4 Aleatorio

Este método se base en la selección de una muestra aleatoria sobre los datos observables y con esta se estiman los datos faltantes. A continuación, se presenta el gráfico con el comportamiento de los datos observados e imputados.

Con base en los métodos de imputación explorados se decide complementar las variables piso y parquea con los resultados del método aleatorio.

  • Adicional al ejercicio hecho en la imputación de los datos faltantes, se unificaron las categorias de la variables tipo, dejando únicamente: Apartamento y Casa.

0.4.4 Descripción de la base de datos por varibles relevantes

0.4.4.1 Zona

En la gráfica de torta, se presenta la distribución de los inmuebles de la empresa B&C en la ciudad de Cali. Es importante resaltar que el 56,7% de la muestra corresponde a viviendas ubicadas en la zona sur de la ciudad. En el segundo y tercer lugar se ubican las zonas norte y oeste de la ciudad, con un 23,1% y 14,5% del total de viviendas, respectivamente.

0.4.4.2 Tipo de vivienda por zona

En siguiente gráfica, presenta la distribución de los inmuebles de la empresa B&C según el tipo en cada una de las zonas de la ciudad. Es importante resaltar que el 61,3% de la muestra corresponde a viviendas identificadas como apartamentos y el restante 39% casas. Este resultado responde a la dinámica inmobiliria de uso del suelo.

0.4.4.3 Estrato socioeconómico de las viviendas

En esta sección se presenta la distribución de los inmuebles de la empresa B&C según el estrato socioeconómico al que pertenecen. Es importante resaltar que el 33% de las viviendas de la muestra están ubicadas en estrato 5 (1 de cada 3). Asimismo, los inmuebles restantes hacen parte de los estratos 3 (17,5%), 4 (25,6%) y 6 (23,9%).

0.4.4.4 Precio del metro cuadrado para las viviendas

En esta sección se presenta el comportamiento de los precios para cada una de las variables relevantes de la muestra.

Precios según zona

Comportamiento del precio del metro cuadrado promedio por zona
zona n_observa media minimo max var sd mediana
Zona Centro 124 309.69 100 1100 26291.94 162.15 297
Zona Norte 1922 345.76 65 1940 57986.81 240.80 300
Zona Oeste 1204 678.68 85 1999 154114.00 392.57 580
Zona Oriente 351 228.53 58 1350 14899.64 122.06 210
Zona Sur 4726 426.52 75 1900 104150.07 322.72 320
NA 3 330.00 NA NA NA NA 330

De la tabla anterior se obtienen diferentes resultados, entre los cuales vale resaltar:

  1. La mayoría de los inmuebles están ubicados en la zona sur de la ciudad de Cali

  2. El precio cuadrado promedio más alta pertenece a la zona oeste. Por el contrario, el menor precio promedio se encuentra en la zona oriente de la ciudad.

  3. La menor distancia (en valor absoluto) entre los precios mínimos y máximos del metro cuadrado se observan en la zona centro. El caso contrario se observa en la zona oeste.

  4. La menor varianza en los precios se encuentra entre los inmuebles de la zona oriente. El caso contrario se ve en la zona oeste de la ciudad.

Adicional a la tabla anterior, se presentan las densidades del metro cuadrado en cada una de las zonas de la ciudad. Estas gráficas exponen los resultados anteriores de una manera más visual.

Precios según tipo de inmueble

Comportamiento del precio del metro cuadrado promedio por zona
tipo n_observa media minimo max var sd mediana
Apartamento 5106 367.62 58 1950 84176.24 290.13 280
Casa 3221 539.88 77 1999 128284.54 358.17 430
NA 3 330.00 NA NA NA NA 330

De la tabla anterior se obtienen diferentes resultados, entre los cuales vale resaltar:

  1. El mayor número de inmuebles de la base de datos de la empresa B&C son apartamentos.

  2. El precio promedio del metro cuadrado es más alto para las casas.

  3. La menor distancia (en valor absoluto) entre los precios mínimos y máximos del metro cuadrado se observan en los apartamentos.

  4. La menor varianza en los precios se encuentra entre los inmuebles tipo apartamento.

Estas conclusiones también pueden ser validadas en la siguientes gráfica. En dónde se presentan los valores promedio del metro cuadrado entre los tipos de inmuebles, asimismo, se observa la dispersión del precio entre estos.

Precio del metro cuadrado y otras variables

Dada la estructura de la base de datos y la lógica de las variables que la componen, en el siguiente gráfico se muestra la correlación de la variable precio del metro cuadrado y las demás variables de la base de datos. De estas correlaciones se puede indicar qué, el precio del metro cuadrado tiene una correlación positiva con todas las variables. Sin embargo, las más altas son: área construida (0,69), número de baños (0,67), estrato socioeconómico (0,61) y número de parqueaderos (0,54). Es importante indicar que estas correlaciones positivas con el precio del metro cuadrado responden a la lógica del precio de un inmueble y no sopesan resultados contra intuitivos.

Por otra parte, para las variables de habitaciones y número de piso, estas correlaciones son positivas pero menores a las obtenidas previamente.

Comportamiento del precio del metro cuadrado a nivel de quantiles

En la siguiente gráfica se presenta el comportamiento de los precios del metro cuadrado sobre el total de la muestra. Allí se observan los quantiles que acumulan el 50% de la muestra y se indica desde dónde inician los datos atípicos de la muestra, estos se calcularon con el índice inter cuartil.

Datos cruzados

Valores promedio de las variables por zona
zona n_observa media_precio media_piso media_estrato media_area media_parquea media_ban media_hab
Zona Centro 124 309.69 2.92 3.20 194.04 1.56 2.84 4.70
Zona Norte 1922 345.76 3.89 4.28 161.22 1.75 2.78 3.50
Zona Oeste 1204 678.68 4.35 5.48 196.52 2.14 3.51 3.29
Zona Oriente 351 228.53 2.76 3.04 192.33 1.68 2.75 4.92
Zona Sur 4726 426.52 3.67 4.72 173.31 1.84 3.18 3.60

La tabla muestra el valor promedio de las variables de interés a nivel de zona. De aquí podemos concluir lo siguiente:

Zona centro: en esta zona el valor promedio del metro cuadrado es de 310, el piso más demandado es el tercero, el estrato más común es el tres (3), el metraje promedio del inmueble es de 194 metros, el número de parqueaderos promedio es 1,5, el número de baños promedio es de 3 y cerca de 5 habitaciones en la vivienda. Estas características son las promedio para la zona.

Zona norte: en esta zona el valor promedio del metro cuadrado es de 346, el piso más demandado es el cuarto, el estrato más común es el cuatro (4), el metraje promedio del inmueble es de 161 metros, el número de parqueaderos promedio es 1,75, el número de baños promedio es de 3 y cerca de tres y media habitaciones en la vivienda. Estas características son las promedio para la zona.

Zona oeste: en esta zona el valor promedio del metro cuadrado es de 679, el piso más demandado es el cuarto, el estrato más común es el cinco (5), el metraje promedio del inmueble es de 196 metros, el número de parqueaderos promedio es 2, el número de baños promedio es de 3,5 y cerca de 3 habitaciones en la vivienda. Estas características son las promedio para la zona.

Zona oriente: en esta zona el valor promedio del metro cuadrado es de 228, el piso más demandado es el tercero, el estrato más común es el tres (3), el metraje promedio del inmueble es de 192 metros, el número de parqueaderos promedio es 1,5, el número de baños promedio es de 2,75 y cerca de 5 habitaciones en la vivienda. Estas características son las promedio para la zona.

Zona sur: en esta zona el valor promedio del metro cuadrado es de 426, el piso más demandado es el cuarto, el estrato más común es el quinto (5), el metraje promedio del inmueble es de 173 metros, el número de parqueaderos promedio es 1,84, el número de baños promedio es de 3 y cerca tres habitaciones en la vivienda. Estas características son las promedio para la zona.

0.5 Discusión

Con base en los datos obtenidos en la base de la empresa B&C, se observan diferentes resultados que pueden generar discusión, estos son:

  1. La muestra está muy influenciada por la zona sur de la ciudad (56,7% del total). Esto genera desproporción entre las demás zonas y el total de la muestra. Por lo anterior, es posible que se modele un hecho estilizado altamente relacionado a la zona sur.

  2. La base de datos de la empresa B&C está sesgada hacia los estratos 3, 4, 5 y 6. Por lo cual, no es una acertada radiografía del total del mercado inmobiliario en la ciudad de Cali.

0.6 Conclusiones

De acuerdo con la base de datos es importante que la empresa B&C fortalezca su enfoque sobre los inmuebles tipo apartamentos. Estos representan cerca del 60% de las viviendas de la ciudad de Cali. Asimismo, tienen valores inferiores en términos de metro cuadrado que las casas, esto favorece su probabilidad de adquisición.

En cuanto a la relación entre variables, se observa que los precios de los inmuebles se favorecen por el número de metros cuadrados construidos, el número de parqueaderos y de baños. Estas variables se convierten en deseables a la hora de salir con proyectos al mercado.

La heterogeneidad entre las zonas de la ciudad hace que las características de las viviendas que se encuentran allí difieran. Esto indica que es necesario revisar las cifras a nivel de zona, para conocer los proyectos que pueden tener mayor probabilidad de éxito en esta.