Actividad 1 - Evaluación de la Oferta Inmobiliaria Urbana
INTRODUCCIÓN
Una empresa inmobiliaria líder en una gran ciudad está buscando comprender en profundidad el mercado de viviendas urbanas para tomar decisiones estratégicas más informadas. La empresa posee una base de datos extensa que contiene información detallada sobre diversas propiedades residenciales disponibles en el mercado. Se requiere realizar un análisis holístico de estos datos para identificar patrones, relaciones y segmentaciones relevantes que permitan mejorar la toma de decisiones en cuanto a la compra, venta y valoración de propiedades.
En un contexto marcado por fluctuaciones económicas y cambios en la demanda, el mercado inmobiliario en la ciudad de Cali ha mostrado signos de un comportamiento constante referente a las viviendas dentro del sector urbano, situación que se mantendrá en la tendencia debido al POT definido por la ciudad en donde “El Plan de Desarrollo 2020-2023 en Cali tiene como objetivo principal impulsar el crecimiento y desarrollo integral de la ciudad en diferentes dimensiones.” [1]
objetivo
Este informe pretende presentar un análisis descriptivo exhaustivo del mercado inmobiliario, enfocándose en las variables clave como precios, sector, características físicas de las viviendas entre otras, así como en las proyecciones futuras que permitan analizar y entender el nicho de mercado para proporcionar un análisis integral y multidimensional de la base de datos que permita establecer las estrategias adecuadas de marketing y cursos de acción para potencializar su participación en el sector inmobiliario de la ciudad.
-Análisis de Componentes Principales -Análisis de Conglomerados -Análisis de Correspondencia -Visualización de resultados
1. Análisis Exploratorio de los Datos
1.1 Revisión de los Datos
La siguiente sección pretende efectuar una verificación de las variables contenidas en la base de datos, donde se pudieron identificar un total de 13 variables y 8322 registros, identificando variables tipo categorico y númerico, para su posterior análisis se pueden dividir estas variables en dos grandes grupos, el primero relacionado con características propias de la infraestructura de las viviendas y el segundo referente a la ubicación.
## Rows: 8,322
## Columns: 13
## $ id <dbl> 1147, 1169, 1350, 5992, 1212, 1724, 2326, 4386, 1209, 159…
## $ zona <chr> "Zona Oriente", "Zona Oriente", "Zona Oriente", "Zona Sur…
## $ piso <chr> NA, NA, NA, "02", "01", "01", "01", "01", "02", "02", "02…
## $ estrato <dbl> 3, 3, 3, 4, 5, 5, 4, 5, 5, 5, 6, 4, 5, 6, 4, 5, 5, 4, 5, …
## $ preciom <dbl> 250, 320, 350, 400, 260, 240, 220, 310, 320, 780, 750, 62…
## $ areaconst <dbl> 70, 120, 220, 280, 90, 87, 52, 137, 150, 380, 445, 355, 2…
## $ parqueaderos <dbl> 1, 1, 2, 3, 1, 1, 2, 2, 2, 2, NA, 3, 2, 2, 1, 4, 2, 2, 2,…
## $ banios <dbl> 3, 2, 2, 5, 2, 3, 2, 3, 4, 3, 7, 5, 6, 2, 4, 4, 4, 3, 2, …
## $ habitaciones <dbl> 6, 3, 4, 3, 3, 3, 3, 4, 6, 3, 6, 5, 6, 2, 5, 5, 4, 3, 3, …
## $ tipo <chr> "Casa", "Casa", "Casa", "Casa", "Apartamento", "Apartamen…
## $ barrio <chr> "20 de julio", "20 de julio", "20 de julio", "3 de julio"…
## $ longitud <dbl> -76.51168, -76.51237, -76.51537, -76.54000, -76.51350, -7…
## $ latitud <dbl> 3.43382, 3.43369, 3.43566, 3.43500, 3.45891, 3.36971, 3.4…
Posterior a la verificación de datos se estudian los datos faltantes, donde se identificaron un total de 4275 lo que representa el 51.36% de la información, por lo tanto, eliminarlos no sería una opción prudente, se opta por efectuar un análisis más profundo con el fin de identificar otro tipo de procesos.
1.2 Limpieza de los datos
Una vez se revisaron los datos se logró determinar que la variable ID posee un total de 03 registros que se encuentran sin ninguna información, por lo tanto, se procederá a eliminarlos ya que no aportan datos al análisis, las otras variables con datos faltantes son la variable de piso con tun total de 2638 y parqueadero con 1605.
Variable piso: se imputará dependiendo el tipo, si es una casa se tomará el valor de 1 asumiendo que solo consta de 1 piso, pero si la vivienda es un apartamento se imputará con la mediana dependiendo la zona.
Variable parqueadero: se imputará con un valor de 0 para las viviendas de estrato 3 considerando que considerando que pueden ser parqueaderos comunales y no propios, quedaron un total de 1260 registros que serán imputados por la media dependiendo el estrato.
Variable habitaciones: se imputará con un valor de 1 cuando su valor sea igual a cero, considerando que por más pequeño que sea un inmueble al menos se contará con una habitación.
La siguiente imagen nos permite comprobar la correcta limpieza de nuestros datos al corregir errores como duplicación, normalización de caracteres, datos faltantes, e imputación de datos, por ejemplo, uno de los errores encontrados es que habían registros con cero baños y las viviendas por más pequeña que sean al menos cuentan con 1.
## # A tibble: 8,319 × 13
## id zona piso estrato preciom areaconst parqueaderos banios habitaciones
## <dbl> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 1147 ZONA … 1 3 250 70 1 3 6
## 2 1169 ZONA … 1 3 320 120 1 2 3
## 3 1350 ZONA … 1 3 350 220 2 2 4
## 4 5992 ZONA … 1 4 400 280 3 5 3
## 5 1212 ZONA … 1 5 260 90 1 2 3
## 6 1724 ZONA … 1 5 240 87 1 3 3
## 7 2326 ZONA … 1 4 220 52 2 2 3
## 8 4386 ZONA … 1 5 310 137 2 3 4
## 9 1209 ZONA … 1 5 320 150 2 4 6
## 10 1592 ZONA … 1 5 780 380 2 3 3
## # ℹ 8,309 more rows
## # ℹ 4 more variables: tipo <chr>, barrio <chr>, longitud <dbl>, latitud <dbl>
1.3 Datos atípicos
Existen varios datos que al ser atípicos pueden generar una distorsión o ruido en nuestro análisis, a continuación, se presentan los valores calculados para el valor de las propiedades en miles de millones.
De acuerdo a la gráfica anterior se puede observar que la mayoría de los
datos se encuentran entre 250 y 500 millones, lo cual puede reflejar el
enfoque a nuestro nicho de mercado, sin embargo, debemos considerar que
esos valores atípicos se podrían orientar a un nicho preferencial a
partir de los 1000 millones. Una buena práctica podría ser separar las
bases de datos y trabajar una enfocada a valores que tienen más dinámica
de venta y otra orientada a clientes VIP con un bajo flujo.[2]
1.4 Análisis relevantes de datos
En esta sección identificaremos las características relevantes de nuestra base de datos para analizar y enfocar nuestra estrategia:
El anterior gráfico nos indica que de acuerdo a los datos la vivienda
que más se vende son el tipo apartamento con 61.3% esto da un indicio
que permite enfocar los esfuerzos en este nicho, sin embargo,
analizaremos otros factores como el precio y la zona.
Ahora bien, conociendo el tipo de vivienda que más se vende, es
importante empezar a analizar las zonas de la ciudad donde estan más
concentradas las ventas, la anterior gráfica nos permite identificar que
en la zona sur es donde más se concentró el nicho de mercado con un 56,8
%, dividida en 33.5% de participación en apartamentos y 23.3% en
casas.
Posterior, es importante analizar los precios que las viviendas manejan por tipo para entender los rangos entre los que oscilan los valores de las mismas.
Si analizamos el diagrama de distribución de precios de casas y apartamentos se puede evidenciar que precios de los apto estan entre los 200 y 400 millones, haciendo que sean viviendas más asequibles para los compradores, mientras que las casas concentran sus precios entre los 250 y 700 millones.
Es importante también analizar la gráfica de zonas versus los precios,
acá se pueden observar varios valores atípicos, sin embargo, se
considera manejarlos en una estrategia diferentes de negocio, esta
gráfica nos indica que en la zona oeste es donde se concentran las
viviendas de más valor y cuya zona es de mayor crecimiento, sin embargo
de acuerdo al análisis de zonas la zona sur es donde más se producen
venden y en esta gráfica se puede observar que sus valores estan con una
media de 427 millones.
También se identificaron características relevantes de las estructuras físicas que hacen la diferencia a la hora de tomar decisiones por parte de los clientes, entre las que se destacan: pisos preferidos (1,2,3 para casas / 3,5,4,2 para apartamentos), parqueaderos 1 o 2, baños de 2 a 3, habitaciones 3 a 4, lo cual nos puede dar un indicio del nicho del mercado.
De la anterior matriz de correlación solo se tuvieron en cuenta los datos númericos, donde se puede observar que no existen atributos con correlaciones fuertes, considerando que ninguna sobrepasa el valor de 0.7, por lo tanto, podemos afirmar que no existe redundancia en los datos. Adicionalmente encontramos correlaciones moderadas entre las variables, sin embargo, se puede observar una estrecha correlación de 0.69 entre el precio y el área construida de la vivienda, que tambíen impacta con 0.61 en el estrato socioeconomico.
2. Análisis de Componentes - ACP
2.1 Estandarización de variables
Reducir la dimensionalidad del conjunto de datos y visualizar la estructura de las variables en componentes principales para identificar características clave que influyen en la variación de precios y oferta del mercado.
Emplearemos el ACP como complemento de los análisis descriptivos y para contribución en modelos predictivos, reduciendo el número de variables empleadas en el modelo. De acuerdo con las variables actuales se puede pensar en dos grandes componentes, el primero es el relacionado con el tamaño de la vivienda que podría incluir variables como; área construida, baños, número de habitaciones. El segundo componente podría ser la ubicación, que considera variables como la zona, barrio, estrato y coordenadas.
## piso estrato preciom areaconst
## Min. : 1.000 Min. :3.000 Min. : 58.0 Min. : 30.0
## 1st Qu.: 1.000 1st Qu.:4.000 1st Qu.: 220.0 1st Qu.: 80.0
## Median : 2.000 Median :5.000 Median : 330.0 Median : 123.0
## Mean : 3.158 Mean :4.634 Mean : 433.9 Mean : 174.9
## 3rd Qu.: 4.000 3rd Qu.:5.000 3rd Qu.: 540.0 3rd Qu.: 229.0
## Max. :12.000 Max. :6.000 Max. :1999.0 Max. :1745.0
## parqueaderos banios habitaciones
## Min. : 0.000 Min. : 1.000 Min. : 1.000
## 1st Qu.: 1.000 1st Qu.: 2.000 1st Qu.: 3.000
## Median : 2.000 Median : 3.000 Median : 3.000
## Mean : 1.682 Mean : 3.117 Mean : 3.613
## 3rd Qu.: 2.000 3rd Qu.: 4.000 3rd Qu.: 4.000
## Max. :10.000 Max. :10.000 Max. :10.000
## ------------Estandarizado---------------
## piso estrato preciom areaconst
## Min. :-0.8443 Min. :-1.5872 Min. :-1.1437 Min. :-1.0138
## 1st Qu.:-0.8443 1st Qu.:-0.6156 1st Qu.:-0.6508 1st Qu.:-0.6640
## Median :-0.4531 Median : 0.3560 Median :-0.3161 Median :-0.3633
## Mean : 0.0000 Mean : 0.0000 Mean : 0.0000 Mean : 0.0000
## 3rd Qu.: 0.3294 3rd Qu.: 0.3560 3rd Qu.: 0.3228 3rd Qu.: 0.3782
## Max. : 3.4591 Max. : 1.3276 Max. : 4.7620 Max. :10.9822
## parqueaderos banios habitaciones
## Min. :-1.4683 Min. :-1.4925 Min. :-1.8116
## 1st Qu.:-0.5954 1st Qu.:-0.7874 1st Qu.:-0.4252
## Median : 0.2775 Median :-0.0823 Median :-0.4252
## Mean : 0.0000 Mean : 0.0000 Mean : 0.0000
## 3rd Qu.: 0.2775 3rd Qu.: 0.6228 3rd Qu.: 0.2681
## Max. : 7.2609 Max. : 4.8533 Max. : 4.4274
2.2 Elección del número de componentes
La anterior gráfica explica el número de componentes principales y su respectivo porcentaje, donde se puede inferir que los dos primeros componentes explican el 72.5% de la variabiliad de los datos.
## TableGrob (1 x 2) "arrange": 2 grobs
## z cells name grob
## 1 1 (1-1,1-1) arrange gtable[layout]
## 2 2 (1-1,2-2) arrange gtable[layout]
## Standard deviations (1, .., p=7):
## [1] 1.8726230 1.2525769 0.8236707 0.6560030 0.6238808 0.4887492 0.4329641
##
## Rotation (n x k) = (7 x 7):
## PC1 PC2 PC3 PC4 PC5
## piso 0.1495547 -0.55704328 0.77441890 0.2490732 -0.01986721
## estrato -0.3097496 -0.52476999 -0.14806725 -0.6131961 -0.06164576
## preciom -0.4657777 -0.20434451 -0.03648095 0.1279706 -0.36859140
## areaconst -0.4467970 0.18157262 0.01054449 0.4430708 -0.50799577
## parqueaderos -0.4049064 -0.25402621 -0.23511104 0.4468674 0.71614060
## banios -0.4633470 0.09611612 0.26153705 -0.3444003 0.08851946
## habitaciones -0.2940622 0.51558347 0.50322022 -0.1759624 0.28494336
## PC6 PC7
## piso 0.02465088 -0.06761442
## estrato 0.45787692 -0.13147944
## preciom -0.22926997 0.73154819
## areaconst 0.29835323 -0.47318761
## parqueaderos 0.04085686 -0.04502462
## banios -0.67161875 -0.36076389
## habitaciones 0.44206409 0.29477854
La tabla anterior, permite conocer las contribuciones de las variables en cada una de las dimensiones, en la primera dimensión se obtuvo que el precio, baños, area construida y parqueaderos, para la segunda dimensión las variables que más contribuyentes son piso, estrato y habitaciones.
Para este análisis no se tuvieron en cuenta las variables latitud y longitud, al considerar que de manera individual no tienen influencia significante en las datos, ya que solo de manera conjunta conforman un punto cartesiano en un mapa para indicar una zona.
De las gráficas anteriores se puede concluir uqe las variables relacionadas con el tamaño de la vivienda estan fuertemente asociadas entre si, contribuyendo a la variabilidad de los datos en la dimensión1, se puede inferir que las propiedades con mayor área construida tienden a tener mayor costo, más baños, más parqueaderos, indicando su asociación. Mientras que la dimensión 2 indica una variabilidad entre las variables piso, habitaciones y estrato, que define una variabilidad baja entre estrato y habitaciones ya que muestran un ángulo de casi 90°, pero ambas variables indican un alto nivel de contribución del CP2.
Para tener mejor claridad se realizará la nubes de individuos, que pueden ayudar a identificar grupos, detectar outliers e interpretar los componentes principales.
## piso estrato preciom areaconst parqueaderos banios habitaciones
## Vivienda 6645 1 6 1600 825 8 6 8
## Vivienda 1966 12 4 240 73 1 2 1
## Vivienda 3312 10 6 1200 274 3 4 2
## Vivienda 1500 1 6 530 150 2 4 3
Estos datos extremos nos permiten interpretar la variabilidad de la variables detectadas en los componentes principales, por ejemplo para la vivienda 1966 tiene un precio relativamente bajo en contraste con la vivienda ubicada en el otro extremo (6645), esto parece tener congruencia al confirmar que la vivienda más costosa posee mayor área construida, parqueaderos, baños y habitaciones. Este primer componente podría indicar que entre más costosa es la vivienda mayor área construida va a tener y así mismo mayor cantidad de baños y habitaciones.
Para la segunda dimensión, parece ser que incluye más las variables de piso, habitaciones y estrato, ya que se puede ver como la vivienda 3312 tiene un área construida menor pero un alto costo debido a su ubicación en una estrato 6 dentro de cali.
Entre más nos acercamos al centro, se puede observar una normalidad en los datos, por ejemplo la vivienda 1500 es congruente con la información presentada, ya que indica que se encuentra en un primer piso, lo cúal podría indicar que se trata de una vivienda tipo casa por su costo de 530 (verificando el dataframe se confirma que es una casa), su area construida es de 150 lo cual es congruente con la cantidad de parqueaderos, baños y habitaciones incluidas en la dimension 1.
Para el análisis de Biplot se decidió emplear la variable de estrato, con el fin de determinar como se relacionan las dimensiones con esta variable, se puede notar que definitivamente las variables de precio y parqueadero estan fuertemente ligadas con estratos altos, entre más parqueaderos y mayor precio se va a contar con un mayor estrato socioeconómico, también se puede notar que el área construida alcanza a cubrir los estratos 3,4,5,6. Lo que indicaría que el estrato estaría asociado al tamaño de la vivienda. Sin embargo, se pueden encontrar sesgos al encontrar viviendas con estrato alto pero de área construida baja, teniendo en cuenta la nueva tendencia inmobiliaria de apartaestudios. sin embargo para este análisis solo se consideraron dos tipos (casa y apartamentos).
Para concluir podemos analizar la última gráfica, que nos indica que entre mayor sea el estrato, se encontraran viviendas con mayor área construida, mayor precio y mayor número de parqueaderos.Los baños y la cantidad de habitaciones parecen ser congruentes de acuerdo con el estrato.
Los valores negativos son parte del análisis del PCA y esto nos indican que la variable original esta inversamente relacionada con el componente principal, indicando que la observación esta por debajo de la media de ese componente.
3. Análisis de conglomerados
Agrupar las propiedades residenciales en segmentos homogéneos con características similares para entender las dinámicas de las ofertas específicas en diferentes partes de la ciudad y en diferentes estratos socioeconómicos.
Inicialmente emplearemos el método del codo para determinar el número de clusters.
De acuerdo con el análisis de codo y el de silueta se puede observar que el valor para K es igual a 2 clusters, donde se observa un cambio significativo en la variación inter-cluster, indicando una clara división del conjunto de datos en dos conglomerados. a continuación calcularemos K=2:
Los anteriores gráficos explican cómo los individuos se han agrupado en dos clusters basados en los componentes principales que definen el mayor porcentaje de variabilidad de los datos, s epuede apreciar como jerarquicamente los individuos se distribuyen en estos grupos, lo cual permite destacar diferencia y algunas similitudes entre ellos y en función de los componentes principales.
Ejecución de los conglomerados:
# Código para generar res_HCPC
res_HCPC <- HCPC(res_pca, nb.clust = 2, graph = FALSE)
res_HCPC$desc.var$quanti## $`1`
## v.test Mean in category Overall mean sd in category Overall sd
## piso 22.24426 0.1714265 5.278948e-17 0.9985358 0.9999399
## estrato -41.41244 -0.3191471 -1.735866e-16 0.9017929 0.9999399
## habitaciones -44.73116 -0.3447230 -1.396420e-16 0.6869115 0.9999399
## parqueaderos -50.79012 -0.3914167 -2.039212e-17 0.5887707 0.9999399
## areaconst -60.76582 -0.4682950 1.091881e-17 0.4027663 0.9999399
## preciom -64.73148 -0.4988565 -3.542222e-17 0.3753459 0.9999399
## banios -68.35394 -0.5267732 -1.439360e-16 0.5488077 0.9999399
## p.value
## piso 1.281922e-109
## estrato 0.000000e+00
## habitaciones 0.000000e+00
## parqueaderos 0.000000e+00
## areaconst 0.000000e+00
## preciom 0.000000e+00
## banios 0.000000e+00
##
## $`2`
## v.test Mean in category Overall mean sd in category Overall sd
## banios 68.35394 1.0661844 -1.439360e-16 0.8459524 0.9999399
## preciom 64.73148 1.0096813 -3.542222e-17 1.1024229 0.9999399
## areaconst 60.76582 0.9478250 1.091881e-17 1.1632114 0.9999399
## parqueaderos 50.79012 0.7922239 -2.039212e-17 1.1765632 0.9999399
## habitaciones 44.73116 0.6977163 -1.396420e-16 1.1581389 0.9999399
## estrato 41.41244 0.6459510 -1.735866e-16 0.8684759 0.9999399
## piso -22.24426 -0.3469658 5.278948e-17 0.9086774 0.9999399
## p.value
## banios 0.000000e+00
## preciom 0.000000e+00
## areaconst 0.000000e+00
## parqueaderos 0.000000e+00
## habitaciones 0.000000e+00
## estrato 0.000000e+00
## piso 1.281922e-109
En los resultados del cluster 1 prevalecen los valores negativos, pueden interpretarse como viviendas con características inferiores a las media general, es decir, que podemos encontrar aquellas con menor número de habitaciones, menor cantidad de baños, menor o sin parqueaderos, menor precio y un estrato social más bajo (3), la variable piso es la única positiva, lo que nos podría indicar que estas viviendas tienden a estar en pisos más altos.
Por el contrario, el cluster 2 posee más valores positivos, lo que indicaría que este grupo estaría representado por viviendas con mayor cantidad de parqueaderos, area construida, maroy habitaciones, mayor estrato y por lo tanto, un mayor costo. La variable negativa (piso) indica que estas viviendas tienden a estar en pisos bajos, es decir, que la mayoria de ellas podría pertecener al tipo CASA.
En general podriamos afirmar que el cluster 1 hace referencia a viviendas menos costosas y con menos comodidades que tienden estar en pisos altos, mientras que el cluster 2 son viviendas más lujosas, de mayor estrato y por lo tanto de un mayor costo, normalmente en pisos bajos. Este análisis nos permite segmentar el mecardo inmobiliarío urbano para entender los diferentes grupos de viviendas en función de sus caracteristicas.
El siguiente gráfico permite visualiza la distribución de los cluster en la ciudad de Cali y su ubicación dentro de la ciudad para la identificación de nichos de mercado por zonas de acuerdo con la descripción de cada Cluster.
## Reading layer `gadm41_COL_0' from data source
## `C:\Users\USER\Desktop\MAESTRÍA CIENCIA DE DATOS\Segundo semestre\modelos estadisticos\gadm41_COL_shp\gadm41_COL_0.shp'
## using driver `ESRI Shapefile'
## Simple feature collection with 1 feature and 2 fields
## Geometry type: MULTIPOLYGON
## Dimension: XY
## Bounding box: xmin: -81.84153 ymin: -4.228429 xmax: -66.83774 ymax: 15.91248
## Geodetic CRS: WGS 84
4. Análisis de correspondencias
El objetivo es examinar la relación entre las variables categóricas (tipo de vivienda, zona y barrio), para identificar patrones de comportamiento de la oferta en mercado inmobiliario. Este método estadístico es empleado para representar las posibles asociaciones entre variables categóricas para establecer si existen patrones o estructuras en los datos.
Inicialmente el conjunto de datos está representado por 3 variables categoricas, zona, tipo y barrio, se tendrán en cuenta la zona y el tipo de vivienda para este análisis, ya que barrio posee una gran cantidad de categoría lo cuál podría ser complejo de analizar.
La anterior gráfica permite tener observar como por ejemplo en la zona sur, norte y oeste tienen la preferencia hacia la vivienda de tipo apartamento, mientras que en zona centro y oriente predominan las tipo casa.
##
## Pearson's Chi-squared test
##
## data: tipo_zona
## X-squared = 690.93, df = 4, p-value < 2.2e-16
El resultado de esta prueba de chi-cuadrado indica que hay una asociación significativa entre las variables “tipo” y “zona”, donde se puede observar un valor extremadamente bajo de p-value (2.2e-6), lo cúal significa que los tipos de propiedad varian significativamente según la zona en la que se encuentran, el valor de (X-squared = 690.93) es muy grande, por lo tanto, se rechaza la hipotesis nula de independecia de las dos variables analizadas
Esta información puede ser útil para las estrategias de geomarketing, ya que el tipo de vivienda se puede asociar con una zona de la ciudad.
El gráfico anterior nos permite identificar que las dos primeras dimensiones ofrecen el 38.1% de la varianza, se observa como las variables de Zona y estrato están significativamente correlacionadas al la dimensión 1.
La gráfica anterior nos permite identificar la contribución de cada variable a la diferentes dimensiones, también es una forma de observar la segmentación de estratos, en donde se puede identificar que los estratos 4 y 5 son más frecuentes en la zona norte y sur, el estrato 6 se aprecia más congruente con la zona oeste de la ciudad y el estrato 3 en la zona centro. tambien se puede inferir que en la zona norte y zona sur es donde podemos encontrar mayor diversidad del tipo de vivienda, ya sea apartamento o casa.
Para las zonas oriente y centro es más común encontrar viviendas tipo casa, mientras que para la zona oeste predominan los apartamentos.
5. Informe
El estudio del mercado de bienes raíces en Cali, basado en la información proporcionada por la base de datos, revela varios hallazgos importantes que pueden orientar la toma de decisiones estratégicas para potenciar la presencia de la empresa en este sector altamente competitivo. Tras el análisis de los datos, se observa la presencia de diversas áreas fundamentales que pueden ser aprovechadas con el fin de potenciar el rendimiento en el sector inmobiliario urbano de la ciudad.
En primer lugar, el estudio resalta la relevancia de la zona Oeste de Cali como un área de interés estratégico. Según los datos recopilados, el costo medio de la vivienda en esta región resulta altamente atractivo, tanto en el caso de las residencias unifamiliares como en el de los apartamentos. Esta área no solo exhibe un costo competitivo, sino que también se encuentra en una fase de expansión, lo cual indica una demanda elevada y un potencial de aumento de valor considerable. Considerando el contexto mencionado, se recomienda que la empresa B&C desarrolle e implemente un plan estratégico dirigido a incrementar su cuota de mercado en la región Oeste. La inversión en bienes raíces en esta zona podría generar beneficios significativos debido a su potencial de valorización y al constante crecimiento del mercado inmobiliario en la región.
En segundo lugar, se desprende de los datos que los apartamentos ubicados en la zona Oeste exhiben un costo promedio elevado, equiparable al de las viviendas unifamiliares. Este hecho sugiere que la inversión en apartamentos en esta área podría resultar muy rentable, al igual que en el caso de las viviendas unifamiliares. Los datos indican que, a pesar de la mayor presencia de apartamentos en la ciudad, existen posibilidades de obtener rendimientos favorables en este sector particular. Como parte de su estrategia de expansión, la empresa debe evaluar la posibilidad de adquirir apartamentos en la zona Oeste.
El análisis también evidencia la disparidad de precios entre distintas áreas geográficas y categorías de inmuebles. En el mercado de Cali, los apartamentos constituyen alrededor del 61.32% de todas las viviendas, lo cual destaca su posición predominante. No obstante, las viviendas siguen teniendo una relevancia significativa al mostrar la variedad en las preferencias de residencia de los compradores.
Como se determinó en el análisis de cluster, en general podriamos afirmar que el cluster 1 hace referencia a viviendas menos costosas y con menos comodidades que tienden estar en pisos altos, mientras que el cluster 2 son viviendas más lujosas, de mayor estrato y por lo tanto de un mayor costo, normalmente en pisos bajos. Este análisis nos permite segmentar el mecardo inmobiliarío urbano para entender los diferentes grupos de viviendas en función de sus caracteristicas.
Se recomienda que priorice la adquisición de apartamentos y casas, Específicamente, se sugiere enfocarse en propiedades que cumplan con características demandadas, tales como contar con al menos tres habitaciones, dos baños y un parqueadero. También es importante enfocar los esfuerzos en la zona sur que es donde se concentra la mayoría de viviendas en Cali.
6. Referencias
[1] Carolina Restrepo Lenis. “El Plan de Desarrollo Cali 2020-2023, por buen camino”, púclicado en cali.giv.co, 26/06/2023.
[2] Idreos, S., Papaemmanouil, O., & Chaudhuri, S. (2015). Overview of Data Exploration Techniques. Proceedings of the 2015 ACM SIGMOD International Conference on Management of Data.