Este informe ofrece un análisis exhaustivo del mercado inmobiliario en Cali, con un enfoque en la adquisición de viviendas solicitadas por la compañía internacional ABC para su personal. Se han considerado condiciones específicas de compra y límites de crédito pre-aprobados: $350 millones para una vivienda y $850 millones para otra. Para identificar y evaluar las opciones más adecuadas, se han empleado técnicas avanzadas de modelación y análisis de datos.
Mediante un riguroso proceso de filtrado, se han recopilado datos relevantes sobre propiedades en las zonas norte y sur de Cali. Se han evaluado aspectos críticos como la superficie construida, los estratos socioeconómicos y la correlación entre precios y características de las viviendas.
Se han desarrollado modelos de regresión lineal que permiten predecir el precio de las viviendas en función de variables significativas, proporcionando estimaciones precisas que respaldan la toma de decisiones estratégicas. Asimismo, se han validado los supuestos de estos modelos para garantizar la robustez de los resultados obtenidos.
Este documento no solo presenta las opciones más prometedoras que cumplen con las especificaciones requeridas, sino que también incluye visualizaciones interactivas y mapas que facilitan la comprensión de la información y las decisiones a tomar.
Las recomendaciones que se ofrecen a continuación destacan las mejores oportunidades disponibles, analizando su idoneidad respecto a las necesidades de la empresa cliente y las expectativas de sus empleados. Se espera que este análisis funcione como una herramienta clave para maximizar la satisfacción de ABC y optimizar su inversión en el sector inmobiliario en Cali.
La variable “piso” es categórica, ya que representa el nivel en que se encuentra la vivienda (por ejemplo, primer piso, segundo piso). En estos casos, la imputación de valores utilizando la media o la mediana no sería válida, ya que estos métodos son más adecuados para variables numéricas continuas. La moda, que representa el valor más frecuente, es, por lo tanto, una elección más lógica.
La imputación de datos faltantes es un paso crucial en el proceso de análisis de datos, y la elección del método de imputación puede influir significativamente en los resultados del modelo. En el caso de los datos faltantes en la variable de parqueaderos, se opta por imputarlos con un valor de cero en lugar de utilizar la media o la mediana, por las siguientes razones:
Para este ejercicio se toma la desición de imputar con valor 0 para los parqueaderos (N/A) lo que refleja la realidad de muchos hogares en el contexto urbano de Cali, donde algunas propiedades, especialmente casas más pequeñas o en zonas más antiguas, pueden no tener necesariamente parqueaderos asignados. Esto no debe interpretarse como un error o falta de información, sino como una característica inherente de la vivienda. Naturaleza de la Variable:
La variable de parqueaderos es categórica y ordinal. Imputar un valor como la media o la mediana podría distorsionar la interpretación real de los datos, dado que estos valores podrían no tener sentido en el contexto de la propiedad. Por ejemplo, para una vivienda sin parqueadero, un valor de 0 representa una existencia real, mientras que imputar 1 o más podría crear una falsa impresión de que se dispone de espacio para estacionamiento.
Imputar con la media o mediana puede introducir sesgos en el análisis y llevar a inferencias incorrectas sobre la relación entre parqueaderos y precio de la vivienda. Al utilizar 0, se indica que la propiedad no tiene parqueadero, lo que puede influir en el precio de manera más precisa que un promedio que no refleja la composición real del conjunto de datos.
La opción de no responder en algunos casos puede estar relacionada con la falta de aplicabilidad (es decir, que simplemente no tienen parqueadero), lo que sugiere que imputar con un valor que represente esta ausencia (cero) es más adecuado que suponer que todos los hogares tienen al menos un parqueadero.
Asumir 0 parqueaderos puede resultar en un modelo más ajustado y realista, ya que evita la introducción de supuestos engañosos sobre la disponibilidad de estacionamiento. Esto permite a futuros análisis y predicciones ser más precisos y representativos de la realidad del mercado inmobiliario.
Luego de esta limpieza:
Cantidad de datos faltantes en cada variable: id: 0 zona: 0 piso: 0 estrato: 0 preciom: 0 areaconst: 0 parqueaderos: 0 banios: 0 habitaciones: 0 tipo: 0 barrio: 0 longitud: 0 latitud: 0
Adicional, conocer las estadisticas de la BD:
La media del precio es: 433.9 millones La desviación estándar del
precio es: 328.67 millones El coeficiente de variación del precio es:
75.75 % El área media construida es: 174.93 m² La desviación estándar
del área construida es: 142.96 m² El coeficiente de variación del área
es: 81.72 % La cantidad de casas es: 3219 La cantidad de apartamentos
es: 5100
El análisis revela que la mediana del precio de las casas es ligeramente superior a la de los apartamentos, lo que sugiere que, en términos generales, las casas están valoradas más alto que los apartamentos en esta base de datos.
La altura del rango intercuartílico, que se representa en el gráfico de caja, proporciona información relevante sobre la dispersión de la mitad central de los datos. Un rango intercuartílico más estrecho indica que los precios se concentran alrededor de la mediana, un fenómeno que se observa con mayor claridad en los apartamentos.
Además, los puntos ubicados por encima de las líneas de los cuadros indican la existencia de propiedades cuyos precios son excepcionalmente altos, particularmente en el segmento de apartamentos, lo que sugiere la presencia de posibles valores atípicos (outliers).
Ambos tipos de vivienda exhiben una variabilidad considerable en precios; sin embargo, las casas presentan un rango de precios más amplio en los niveles superiores, lo que refleja una mayor diversidad en las características y, por ende, en el valor de las propiedades más costosas. Este análisis resalta la complejidad del mercado inmobiliario local y sugiere que los compradores pueden encontrar diferencias significativas en las ofertas dependiendo del tipo de propiedad considerada.
Precio vs:
Área Construida: Correlación positiva moderada (0.687), indicando que a medida que el área aumenta, el precio también lo hace, lo cual es lógico.
Baños: Correlación positiva moderada (0.669), sugiriendo que más baños tienden a asociarse con precios más altos.
Habitaciones: Correlación baja (0.264), lo que puede indicar que el número de habitaciones no es tan determinante en el precio.
Parqueaderos: Correlación moderada (0.640), lo que sugiere que el número de parqueaderos tiene impacto en el precio.
Multicolinealidad:
Área Construida y Baños: Correlación moderada (0.648), lo que podría indicar cierto nivel de multicolinealidad, pero no parece ser extremadamente grave. Baños y Habitaciones: Correlación moderada (0.590), que es algo esperado, pero debe monitorearse si se suma con otras correlaciones altas para evaluar multicolinealidad.
## ANALISIS DE LAS SOLICITUDES RECIBIDAS:
Distribución de Precios
El análisis del histograma de precios revela que la mayoría de las propiedades se agrupan en un rango de entre 200 y 600 millones de pesos. Esta tendencia indica una demanda notable en el segmento de precios accesibles. Por otro lado, se observa una disminución en la frecuencia de viviendas con precios más elevados, lo que sugiere que las propiedades de lujo son relativamente escasas en esta área. Para María, esta información sugiere que centrar sus esfuerzos de venta en propiedades dentro de este rango podría resultar en una maximización de oportunidades, dado que existe un mercado potencial más amplio y receptivo.
Relación entre Precio y Área Construida Los gráficos de caja indican que el precio de las casas tiende a aumentar con el área construida, corroborando la existencia de una correlación positiva y significativa entre estas variables. Este hallazgo es coherente con las dinámicas del mercado inmobiliario, donde las propiedades más espaciosas tienden a tener un mayor valor. La variabilidad observada en el área construida también sugiere la presencia de un mercado mixto, que incluye tanto propiedades más compactas como opciones más amplias y lujosas.
Diversidad del Mercado El rango intercuartílico observado en los gráficos de área construida, junto con un coeficiente de variación elevado en los precios, sugiere una considerable diversidad en las características de las viviendas disponibles. Este panorama implica que María puede ofrecer a sus clientes una variedad de opciones que abarcan desde propiedades más asequibles hasta aquellas con características premium, adaptándose así a diferentes necesidades y expectativas del mercado.
Outliers y Oportunidades La identificación de outliers en los gráficos de área construida y precios indica la existencia de propiedades excepcionales que podrían atraer a un nicho específico de compradores. Reconocer y capitalizar estas oportunidades puede ser una estrategia efectiva para atraer clientes en busca de propiedades lujosas o con características únicas, ampliando así el alcance del mercado al que se dirige María.
Correlaciones Fuertes:
Precio y Área Construida: La correlación entre el precio de la vivienda y el área construida es de 0.73, lo que indica una relación positiva significativa. Este hallazgo sugiere que a medida que aumenta la superficie construida, también tiende a incrementarse el precio de la vivienda, un resultado que se alinea con las expectativas del mercado inmobiliario.
Baños y Habitaciones: Se observa una correlación de 0.58 entre el número de baños y el de habitaciones. Esto indica que las viviendas que cuentan con un mayor número de baños suelen tener también más habitaciones, lo cual es una relación lógica en el contexto de la oferta de propiedades.
Correlaciones Moderadas:
Estrato y Precio: Existe una correlación de 0.42 entre el estrato socioeconómico y el precio de la vivienda, lo que sugiere que, en general, a medida que aumenta el estrato (frecuentemente asociado a un estatus socioeconómico más elevado), también tiende a incrementarse el precio de la vivienda.
Parqueaderos con Precio y Área Construida: La correlación de 0.35 entre el número de parqueaderos y el precio, y de 0.36 entre el número de parqueaderos y el área construida, indica relaciones positivas, aunque no particularmente fuertes. Esto sugiere que la cantidad de parqueaderos no es un factor determinante en los precios de las viviendas.
Variables No Correlacionadas:
Se ha encontrado que la correlación entre el número de habitaciones y el número de parqueaderos es de 0.11, lo que indica que no existe una relación directa entre estas dos variables. Esto sugiere que el número de habitaciones en una vivienda no influye significativamente en la cantidad de parqueaderos disponibles.
## Realizando el analisis de las casas de Zona norte encontramos que, el número de casas es de: 722
A continuación se presentan los primeros 3 registros:
## # A tibble: 3 × 13
## id zona piso estrato preciom areaconst parqueaderos banios habitaciones
## <dbl> <fct> <fct> <fct> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 1209 Zona N… 2 5 320 150 2 4 6
## 2 1592 Zona N… 2 5 780 380 2 3 3
## 3 4057 Zona N… 2 6 750 445 0 7 6
## # ℹ 4 more variables: tipo <fct>, barrio <chr>, longitud <dbl>, latitud <dbl>
Estadísticas Descriptivas para las Viviendas en la Zona Norte: 1. Media del Precio: 445.91 millones 2. Desviación Estándar del Precio: 268.36 millones 3. Coeficiente de Variación del Precio: 60.18% 4. Área Media Construida: 264.85 m² 5. Desviación Estándar del Área Construida: 167.17 m² 6. Coeficiente de Variación del Área: 63.12% 7. Número de Casas: 722 #### Visualizacion de la ubicacion de las casas zona norte
Durante el análisis de los datos de propiedades en la zona norte de Cali, se ha logrado identificar la mayoría de los puntos geoespaciales correspondientes a esta área. Sin embargo, se han observado puntos dispersos en otras localidades.
Además, se han detectado diversas anomalías en los nombres de los barrios listados, destacando ejemplos como “Cali” y “Brisas de los…”. La ambigüedad asociada con estos nombres presenta problemas significativos para asegurar la precisión y la validez del análisis geoespacial. Esta falta de claridad puede resultar en la representación de puntos en el mapa que no se corresponden adecuadamente con la zona norte, afectando así la interpretación de los datos.
## Interpretación de coeficientes:
## - Cada metro cuadrado adicional incrementa el precio en 0.82 millones
## - Cada baño adicional incrementa el precio en 25.64 millones
## - Cada habitación adicional incrementa el precio en 1.51 millones
## - Cada parqueadero adicional incrementa el precio en 2.35 millones
Gráfico de Residuos vs. Valores Ajustados
Algunos puntos están relativamente cerca de la línea horizontal al principio, pero se vuelven más dispersos a medida que se avanza hacia el extremo derecho. Esto podría indicar un problema de heterocedasticidad, ya que la variabilidad de los residuos parece aumentar a medida que el valor ajustado se incrementa.
Es recomendable considerar transformar la variable dependiente o verificar la especificación del modelo para abordar esta variabilidad.
Gráfico Q-Q Los puntos están alineados a lo largo de la línea diagonal con algunas desviaciones en el inicio y en el extremo derecho.
La alineación mayoritaria sugiere que los residuos se distribuyen aproximadamente de manera normal, pero las discrepancias al inicio y al final indican que podría haber influencias de datos atípicos o que las colas de la distribución no son adecuadamente modeladas. Esto podría requerir acciones como la identificación de outliers que afectan la normalidad.
## Predicción del precio para la vivienda 1 de Zona Norte (estrato 4): 340.1 millones de pesos
## Predicción del precio para la vivienda 1 de Zona Norte (estrato 5): 392.63 millones de pesos
Evaluación de Ofertas Potenciales - Predicción del Precio para la Solicitud 1
Para hacerle una oferta potencial al cliente se manejaria la siguiente propuesta:
La casa ID 1943 cumple con todos los requisitos establecidos por el cliente. Aunque el precio de la propiedad es ligeramente inferior a la predicción realizada para la vivienda estrato 5, lo que representa una excelente oportunidad, ya que ofrece características adicionales y está ubicada en una zona altamente deseable. Esta propiedad no solo se alinea con las expectativas del cliente, sino que también puede proporcionar un valor significativo a largo plazo
Ver la ubicacion de la propiedad:
Sin embargo, también hemos identificado otras ofertas en la Zona Norte que cumplen con los requisitos mínimos establecidos por el cliente (Especialmente monto maximo; mismo rango de estrato;habitaciones, baños, parqueaderos y areas minimas). Estas propiedades ofrecen una buena relación entre precio y espacio, muchas con mayor área construida, así como un mayor número de habitaciones o baños.
Antes de presentar estas opciones adicionales al cliente, es fundamental discutir si está dispuesto a considerar propiedades que, aunque pueden ser más grandes y atender a sus necesidades, implicarían un mayor mantenimiento. Este aspecto es clave para asegurarnos de que las alternativas sean viables y alineadas con sus expectativas:
## # A tibble: 34 × 13
## id zona piso estrato preciom areaconst parqueaderos banios habitaciones
## <dbl> <fct> <fct> <fct> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 4210 Zona … 1 5 350 200 3 3 4
## 2 4267 Zona … 1 5 335 202 1 4 5
## 3 4800 Zona … 1 5 340 250 2 4 4
## 4 4209 Zona … 2 5 350 300 3 5 6
## 5 4422 Zona … 2 5 350 240 2 3 6
## 6 4458 Zona … 2 4 315 270 2 4 4
## 7 4483 Zona … 2 5 342 250 1 4 6
## 8 1009 Zona … 2 5 250 243 1 4 5
## 9 1270 Zona … 2 5 350 203 2 2 5
## 10 3352 Zona … 2 4 335 300 3 4 4
## # ℹ 24 more rows
## # ℹ 4 more variables: tipo <fct>, barrio <chr>, longitud <dbl>, latitud <dbl>
## Número de apartamentos en la zona sur: 2787
## # A tibble: 3 × 13
## id zona piso estrato preciom areaconst parqueaderos banios habitaciones
## <dbl> <fct> <fct> <fct> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 5098 Zona S… 5 4 290 96 1 2 3
## 2 698 Zona S… 2 3 78 40 1 1 2
## 3 8199 Zona S… 2 6 875 194 2 5 3
## # ℹ 4 more variables: tipo <fct>, barrio <chr>, longitud <dbl>, latitud <dbl>
## ## Estadísticas Descriptivas para Apartamentos en la Zona Sur
## 1. Media del Precio: 297.29 millones
## 2. Desviación Estándar del Precio: 191.55 millones
## 3. Coeficiente de Variación del Precio: 64.43%
## 4. Área Media Construida: 97.47 m²
## 5. Desviación Estándar del Área Construida: 52.57 m²
## 6. Coeficiente de Variación del Área: 53.93%
## 7. Número de Apartamentos: 2787
Se observa que a medida que el estrato aumenta (de 3 a 6), el precio de
las viviendas también tiende a aumentar significativamente. Esto refleja
las diferencias de valor basadas en el estatus socioeconómico asociado a
cada estrato. Distribuciones y Outliers:
Existen outliers claros en los estratos 5 y 6, que son propiedades con precios significativamente más altos. Estos podrían representar propiedades premium y deberían ser analizados individualmente.
El IQR, representado por la altura de las cajas, muestra que el rango de precios también se amplía a medida que se avanza a estratos más altos, indicando una mayor variabilidad en el precio.
La caja del estrato 4 muestra una mediana más baja que la del estrato 5, lo que indica que, en promedio, las propiedades en este estrato son más accesibles en comparación con las del estrato superior.
Precio y Área Construida: 0.758 (Fuerte correlación) Precio y Baños: 0.720 (Fuerte correlación) Precio y Parqueaderos: 0.675 (Moderadamente fuerte correlación) Precio y Habitaciones: 0.332 (Correlación moderada)
Al igual que en la Zona Norte, se han identificado ciertas anomalías en los nombres de los barrios y en su geolocalización en la Zona Sur. Estas inconsistencias pueden surgir por varias razones, como errores de entrada de datos o ambigüedades en los nombres, lo que plantea desafíos significativos para garantizar la precisión y validez del análisis geoespacial.
#Modelo de regresión Vivienda 2 (Sur)
## Predicción para la Vivienda 2
## Predicción del precio para la vivienda 2 (estrato 5): 653 millones de pesos
## Predicción del precio para la vivienda 2 (estrato 6): 820 millones de pesos
Oferta principal:
Tras un análisis exhaustivo del mercado de apartamentos en la Zona Sur, hemos constatado que no existe una oferta que cumpla completamente con todas las especificaciones solicitadas. Sin embargo, hemos identificado dos propiedades que satisfacen la mayoría de las características deseadas.
Es relevante señalar que, al igual que en la Zona Norte, algunas de estas propiedades ofrecen un mayor número de habitaciones y baños, así como una superficie construida superior. Este incremento en las características puede conllevar un aumento en los costos de mantenimiento y otros gastos asociados.
Recomendamos llevar a cabo una discusión detallada con el cliente sobre estas opciones, asegurándonos de que comprendan y se sientan cómodos con las posibles responsabilidades adicionales de mantenimiento que pueden surgir. Este diálogo será fundamental para alinear sus expectativas con las alternativas disponibles en el mercado, garantizando que la decisión sea informada y satisfactoria.
Ubicacion de las viviendas:
Basado en el modelo de regresión lineal múltiple, la estimación del precio para un apartamento con las siguientes características:
Área Construida: 300 m²
Número de Baños: 3 Número de Habitaciones: 5 Número de Parqueaderos:
Estrato: 5: Es de 653 millones de pesos. Estrato 6: Es de 820 millones de pesos
A continuación, se presentan dos opciones de apartamentos que cumplen con la mayoria características solicitadas:
ID: 7182 Zona: Zona Sur Área Construida: 573 m² Precio: 730 millones de pesos Estrato: 5 Número de Baños: 8 Número de Habitaciones: 5 Número de Parqueaderos: 3
Este apartamento ofrece un amplio espacio, ideal para acomodar a una familia. Con 730 m², permite una distribución cómoda y funcional, cumpliendo y superando los requerimientos de espacio. El precio es acorde al mercado actual y se sitúa por encima de la valoración estimada, sin embargo implica un costo de mantenimieto mas alto.
Opción 2 ID: 7512 Zona: Zona Sur Área Construida: 300 m² Precio: 670 millones de pesos Estrato: 5 Número de Baños: 5 Número de Habitaciones: 6 Número de Parqueaderos: 3
Este apartamento también proporciona el espacuio solicitado. Con un precio de 670 millones de pesos, se ajusta perfectamente al presupuesto aprobado, y es significativamente inferior a la valoración estimada, lo que puede presentar una excelente oportunidad para el cliente.
Ambas opciones están localizadas en una de las zonas más demandadas de Cali, ofreciendo no solo comodidad, sino también cercanía a servicios y áreas comunes que beneficiarán a los empleados que las ocuparán. La alta calidad de las propiedades en la Zona Sur asegura un ambiente seguro y agradable para vivir.
Para ambos casos se recomienda visitas presenciales, con el fin de que el cliente pueda experimentar en persona las características y beneficios de cada una.