1. INTRODUCCIÓN

En el marco del continuo crecimiento y desarrollo del mercado inmobiliario en la ciudad de Cali, se presenta el siguiente informe estadístico . Este informe tiene como objetivo brindar una visión detallada y exhaustiva del panorama actual del mercado de bienes raíces en la ciudad, con énfasis en la información recopilada y analizada por ustedes B&C. A través de un análisis riguroso de los datos disponibles, se pretende ofrecer una comprensión clara de las tendencias, patrones y características más relevantes que caracterizan al mercado inmobiliario local. Con base en esta información, se busca proporcionar una ventaja competitiva al tomar decisiones fundamentadas y estratégicas que impulsen el crecimiento y éxito continuo en el sector. A continuación, se detallarán los objetivos, métodos, resultados y conclusiones de este estudio, con el fin de ofrecer una perspectiva integral y útil para la toma de decisiones gerenciales en B&C.

2. OBJETIVOS

2.1 Objetivo general:

Realizar un análisis estadístico exhaustivo del mercado inmobiliario en la ciudad de Cali, con el fin de proporcionar a la empresa B&C una comprensión clara de las tendencias y patrones que caracterizan dicho mercado, con miras a mejorar la toma de decisiones estratégicas y el desarrollo de su negocio.

2.2 Objetivos específicos:

  • Identificar y analizar las zonas de mayor demanda y oferta de propiedades en Cali, así como las características socioeconómicas y demográficas asociadas a dichas zonas, con el propósito de definir un enfoque estratégico para la comercialización de propiedades por parte de B&C.

  • Evaluar la relación entre variables clave como el precio, el tipo de propiedad, el estrato socioeconómico y la ubicación geográfica, con el objetivo de establecer criterios claros para la fijación de precios y la segmentación de mercado, permitiendo a B&C ofrecer servicios personalizados y competitivos a sus clientes.

3. METODOS

Los datos utilizados en este análisis fueron recopilados por la empresa B&C (Bines y Casas) a través de su base de datos interna de ventas de viviendas en la ciudad de Cali. La base de datos contiene información detallada sobre el precio, ubicación, características entre otras.

Antes del análisis, se realizó un proceso de preprocesamiento de datos para limpiar y preparar los datos. Esto incluyó la eliminación de registros con datos faltantes o inconsistentes, así como la imputación de valores faltantes utilizando el método de imputación múltiple (MICE) para conservar la información y reducir el sesgo en el análisis.

El análisis estadístico se llevó a cabo utilizando el lenguaje de programación R, junto con paquetes como ggplot2 para visualización y stats para pruebas estadísticas. Se realizaron análisis descriptivos para resumir las características clave del mercado inmobiliario en Cali.

3.1 Datos faltantes

En el contexto del análisis realizado, opte por utilizar la Imputación Múltiple por Ecuaciones Encadenadas (mice) debido a la complejidad de los datos y la presencia de múltiples variables interrelacionadas. Dado que el conjunto de datos incluye diversas características de las viviendas, como el precio, la ubicación, el número de habitaciones y baños, entre otros, la imputación por permite capturar de manera más precisa las relaciones entre estas variables. Además, la imputación por mice es especialmente útil cuando hay valores faltantes en varias variables y se quiere evitar sesgos en el análisis. Por lo tanto, se eligio este enfoque para garantizar una imputación más completa y precisa, que refleje de manera adecuada la complejidad del conjunto de datos y permita obtener resultados más robustos en el análisis.

4. RESULTADOS

4.1 Resumen Ejecutivo

El análisis del mercado inmobiliario en Cali revela un panorama positivo para B&C, con un crecimiento notable en las ventas impulsado por el aumento de la población, la inversión extranjera y el desarrollo de nuevos proyectos. Se identificaron tendencias de precios y demanda de viviendas, así como características relevantes de la oferta. Se abordaron los datos faltantes para garantizar la integridad de los análisis. Estos hallazgos ofrecen oportunidades estratégicas para B&C, resaltando la necesidad de aprovechar el potencial del mercado inmobiliario en Cali.

DISTRIBUCIÓN DE VIVIENDAS DE ACUERDO A LA ZONA

En términos generales, la mayor parte de los inmuebles se localizaron en la zona sur (56.8%), seguida de la zona norte (23.1%) y la zona oeste (14.5%). La zona centro tuvo la menor proporción de inmuebles, representando apenas un 1.5%. La Figura 1 ilustra la distribución de los inmuebles por zona.

                                  **FIGURA 1**

4.2 Precio de las viviendas en diferentes zonas de Cali.

El análisis por zona ofrece un resumen estadístico de los precios de las viviendas en diferentes áreas de Cali, incluyendo la media, mediana, mínimo y máximo de los precios inmobiliarios. Esta información permite comprender la distribución y variabilidad de los precios en la ciudad.

                                  **FIGURA 2**

                                  **FIGURA 3**
## `summarise()` has grouped output by 'zona'. You can override using the
## `.groups` argument.

                                  **FIGURA 4**

Se compararon los precios en las distintas zonas para determinar las áreas de mayor interes, según los objetivos establecidos. Se observó que la zona oeste ofrece una mayor variedad de precios en general en comparación con las otras zonas, ya que presenta una distribución más amplia de densidad de precios, lo que resulta en una media más elevada.

Análisis de precios por estrato socioeconómico

Este análisis revela si hay diferencias significativas en los precios entre diferentes estratos, lo que refleja las preferencias del mercado. Proporciona información valiosa sobre cómo el estrato socioeconómico influye en los precios y guía las estrategias de precios y marketing en el mercado inmobiliario.

4.3 TIPOS DE VIVIENDAS MAS OFERTADAS

El análisis de los tipos de viviendas más ofertadas ofrece una visión detallada de las preferencias del mercado inmobiliario. Permite identificar las viviendas más demandadas, lo que influye en las estrategias de desarrollo y comercialización

                                  **FIGURA 5**

En cuanto al tipo de inmueble, los apartamentos representaron el tipo más predominante, abarcando el 61%, mientras que las casas constituyeron el 39% restante, como se muestra en la Figura 5.

                                  **FIGURA 6**

Se Observa que la demanda de apartamentos varía según la ubicación en el edificio, con una concentración mayor en los pisos intermedios. Por otro lado, las casas muestran una distribución diversa en cuanto al número de pisos, siendo más comunes las de 2 y 3 pisos. La comparación entre ambos tipos de vivienda revela diferencias en las preferencias de los compradores según la estructura y ubicación de la vivienda.

4.4 CARACTERÍSTICAS MÁS RELEVANTES DE LA OFERTA DE VIVIENDA EN CALI.

El análisis de las características más relevantes de la oferta de vivienda en Cali proporciona una visión detallada de los factores clave que influyen en el mercado inmobiliario de la ciudad. Permite identificar las características más demandadas por los compradores o arrendatarios, así como entender cómo varían según las zonas y estratos socioeconómicos.

                                  **FIGURA 7**

El análisis del tamaño de la vivienda versus el precio proporciona una comprensión detallada de cómo el tamaño de una propiedad influye en su valor en el mercado inmobiliario de Cali. Este análisis nos permite identificar si existe una relación significativa entre el tamaño de la vivienda y su precio de venta. Además, nos ayuda a comprender si hay variaciones en esta relación según las zonas de la ciudad o los estratos socioeconómicos.

                                  **FIGURA 8**

El análisis de precios de vivienda por tipo revela cómo varían los precios según el tipo de vivienda en Cali. Permite identificar diferencias significativas entre apartamentos, casas u otras propiedades, reflejando las preferencias del mercado. Este análisis orienta las estrategias de precios y marketing, maximizando las oportunidades de venta o alquiler.

                                  **FIGURA 9**

En el contexto de nuestro análisis del mercado inmobiliario, comprender la relación entre la cantidad de habitaciones y baños en las viviendas es fundamental. Esta relación nos proporciona información crucial sobre la distribución del espacio interior de las propiedades y su adecuación a las necesidades de los posibles compradores.

                                  **FIGURA 10**

                                  **FIGURA 11**

5. DISCUCIONES

En la sección de discusión de nuestro análisis del mercado inmobiliario en Cali, es importante resaltar varios hallazgos significativos. En primer lugar, hemos observado una tendencia hacia una distribución equilibrada de precios de viviendas en diferentes zonas de la ciudad, lo que indica un mercado diversificado y dinámico. Esto sugiere que los compradores tienen opciones variadas para elegir, lo que puede influir en las estrategias de precios y comercialización. Además, al analizar las características de las viviendas, como el número de habitaciones, baños y parqueaderos, hemos identificado patrones claros que pueden guiar la toma de decisiones de los desarrolladores y agentes inmobiliarios.

En segundo lugar, al explorar la relación entre el precio de las viviendas y variables como el tamaño, la ubicación y el estrato socioeconómico, hemos obtenido información valiosa sobre los factores que influyen en el valor de las propiedades. Por ejemplo, hemos observado que el precio medio de las viviendas puede variar significativamente según la zona de la ciudad, lo que destaca la importancia de la ubicación en el mercado inmobiliario. Asimismo, al analizar la relación entre el precio y el estrato socioeconómico, hemos identificado patrones que pueden indicar preferencias de compra de diferentes segmentos de la población.

En relación a los datos faltantes, es importante destacar que su presencia puede afectar la integridad y la validez de nuestro análisis. Durante el proceso de limpieza y preparación de los datos, hemos identificado una cantidad significativa de valores faltantes en variables clave como el número de parqueaderos y el piso de las viviendas. Estas omisiones pueden ser el resultado de diversos factores, como errores en la recopilación de datos o información incompleta en los registros. Para abordar este desafío, hemos implementado técnicas de imputación de datos, utilizando métodos como la imputación por regresión lineal para estimar valores faltantes basados en otras variables relevantes. Sin embargo, es importante tener en cuenta que la imputación de datos introduce cierto grado de incertidumbre en nuestro análisis, y es crucial validar la integridad de los datos imputados y considerar su posible impacto en nuestras conclusiones. En futuros estudios, se recomienda continuar explorando y refinando técnicas de manejo de datos para mejorar la precisión y la fiabilidad de los análisis.

6. CONCLUCIONES

Se observa una creciente demanda de apartamentos en comparación con casas, lo cual sugiere una preferencia por opciones de vivienda más compactas y urbanas. Esta tendencia puede estar influenciada por factores como la densificación urbana y la disponibilidad de servicios cercanos.

La zona sur emerge como la de mayor concentración de viviendas, lo que podría indicar un mayor desarrollo y demanda en esa área. Esto resalta la importancia de considerar la ubicación al momento de evaluar propiedades y su potencial de inversión.

Se evidencia una relación significativa entre el precio de las viviendas y su estrato socioeconómico. Las viviendas ubicadas en estratos más altos tienden a tener precios superiores, lo que refleja las diferencias en la calidad y prestigio de las propiedades en diferentes sectores de la ciudad.

7. ANEXOS

7.1 Librerias utilizadas

library(paqueteMET)
library(paqueteMETODOS)
library(ggplot2)
library(dplyr)
library(mice)

7.2 Carga y exploracion inicial del dataset

data(vivienda_faltantes)
# defino mi dataset 
analisis=vivienda_faltantes
backup=vivienda_faltantes
#identificacion preliminar de caracteristicas del dataframe
str(analisis)
# realiza un prelimnar de los datos
glimpse(analisis)

7.3 Resumen estadístico básico de cada variable

#se encuentran   3 NA PERO SE EVIDENCIA 0 BAÑOS
summary(analisis$banios)
banios=table(analisis$banios) %>% data.frame() #45  baños en 0
#se encuentran   3 NA PERO SE EVIDENCIA 0 HABITACIONES
summary(analisis$habitac)
habitac=table(analisis$habitac) %>% data.frame() # 66 habitaciones en 0
# se encuentran   2641 NA paso a 2617
summary(analisis$piso) 
#se encuentran   1606 NA  paso 1582
summary(analisis$parquea)

#varible en formato de cadena de caracteres
summary(analisis$zona)
#se encuentran   3 NA
summary(analisis$estrato)
#se encuentran   2 NA
summary(analisis$preciom)
#se encuentran   3 NA
summary(analisis$areaconst)
#varible en formato de cadena de caracteres
summary(analisis$barrio)
#varible en formato de cadena de caracteres
summary(analisis$tipo)
#varible en formato de cadena de caracteres
summary(analisis$barrio)
#se encuentran   3 NA
summary(analisis$longitud)
#se encuentran   3 NA
summary(analisis$latitud)

7.4 Limpieza del Dataset

inconsistencias <- analisis[analisis$banios == 0, c("id", "banios", "habitac", "piso", "parquea")]
print(inconsistencias, n = Inf)

#elimar filas que cumplan la condicion de banio=0,habitac=0 y parquea=piso=na

# Filtrar las filas que cumplen con la condición
analisis_filtrado <- analisis[!(analisis$banios == 0 & analisis$habitac == 0 & is.na(analisis$piso) & is.na(analisis$parquea)), ]
# Verificar la cantidad de filas eliminadas
filas_eliminadas <- nrow(analisis) - nrow(analisis_filtrado)
cat("Se han eliminado", filas_eliminadas, "filas del dataset.")
# Actualizar el dataframe original
analisis <- analisis_filtrado

#elimar finalas que cumplan la condicion de banio=NA,habitac=NA y parquea=piso=na
# Filtrar las filas que cumplen con la condición
analisis_filtrado <- analisis[!(is.na(analisis$banios) & is.na(analisis$habitac) & is.na(analisis$parquea) & is.na(analisis$piso)), ]
# Verificar la cantidad de filas eliminadas
filas_eliminadas <- nrow(analisis) - nrow(analisis_filtrado)
cat("Se han eliminado", filas_eliminadas, "filas del dataset.")
# Actualizar el dataframe original
analisis <- analisis_filtrado

#elimar finalas que cumplan la condicion de id=NA
# Filtrar las filas que cumplen con la condición
analisis_filtrado <- analisis[!is.na(analisis$id), ]
# Verificar la cantidad de filas eliminadas
filas_eliminadas <- nrow(analisis) - nrow(analisis_filtrado)
cat("Se han eliminado", filas_eliminadas, "filas del dataset.")
# Actualizar el dataframe original
analisis <- analisis_filtrado
analisis_filtrado1 <-analisis_por_tamano[!is.na(analisis_por_tamano$tamano_vivienda), ]
analisis_por_tamano1 <- analisis_filtrado1

#limpieza varible tipo se evidentes formas de escritura para la misma palabra
analisis$tipo <- tolower(analisis$tipo)
analisis$tipo <- gsub("apto", "apartamento", analisis$tipo)
tipo=table(analisis$tipo) %>% data.frame()
# Seleccionar todas las variables relevantes para la imputación
datos_imputacion <- analisis[, c("parquea", "piso")]

# Imputación utilizando mice
imputacion <- mice(datos_imputacion)
analisis$parquea <- complete(imputacion)$parquea
analisis$piso <- complete(imputacion)$piso

7.5 Agrupacion los datos por zona y calcular estadísticas descriptivas del precio

#precio de las viviendas en diferentes zonas
# Precio medio de viviendas por zona en Cali
analisis_por_zona <- analisis %>%
  group_by(zona) %>%
  summarize(
    precio_media = mean(preciom, na.rm = TRUE),
    precio_mediana = median(preciom, na.rm = TRUE),
    precio_min = min(preciom, na.rm = TRUE),
    precio_max = max(preciom, na.rm = TRUE)
  )
datatable(analisis_por_zona, options = list(pageLength = 10))

# Visualizar los resultados
ggplot(analisis_por_zona, aes(x = zona, y = precio_media)) +
  geom_bar(stat = "identity", fill = "skyblue", width = 0.7) +
  labs(title = "Precio medio de viviendas por zona en Cali",
       x = "Zona",
       y = "Precio medio") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))