Introduccion

El sector de la finca raíz en especial la venta de propiedades como casas y apartamentos en la ciudad de Cali, ha presentado un notable crecimiento en los últimos años, impulsado por diversos factores como el aumento de la población, la inversión extranjera que ha llegado a la ciudad y el desarrollo de nuevos proyectos residenciales por parte de diversas empresas privadas o personas naturales. En este contexto, la empresa B&C (Bines y Casas) se ha consolidado como una agencia líder en bienes raíces en la región, con una trayectoria de 10 años en el mercado desde su fundación por la Sra. Sandra Milena.

Con el objetivo de mantener su posición competitiva y tomar decisiones informadas, B&C ha recopilado una amplia cantidad de datos sobre el mercado inmobiliario de Cali, incluyendo información detallada sobre precios por metro cuadrado, ubicación, estrato social, numero de habitaciones, numero de baños y numero de parqueaderos entre otros. Este conjunto de datos ofrece una oportunidad para realizar un análisis estadístico exhaustivo que aporte valor agregado a la toma de decisiones de la compañia sobre las tendencias y patrones clave en el mercado de bienes raíces de la ciudad para asi realizar un mejor ejercicio de ventas.

Objetivos

El presente informe tiene como objetivo principal proporcionar a la empresa B&C un análisis descriptivo detallado de los datos recopilados, con el fin de detectar tendencias y patrones relevantes en el mercado inmobiliario de Cali. Los objetivos específicos del informe son los siguientes:

  1. Analizar la distribución y variación de los precios de las viviendas en diferentes zonas de Cali, con el objetivo de identificar áreas de alta demanda y potencial de crecimiento.

  2. Identificar y describir los tipos de viviendas más ofertados en el mercado de Cali, así como las características más relevantes de estas propiedades, tales como tamaño, número de habitaciones, numero de baños, estrato social y ubicación.

  3. Detallar información que permita tomar decisiones sobre la definición del nicho de mercado de la empresa B&C, el desarrollo de estrategias de marketing efectivas, la fijación de precios de venta competitivos y la oferta de servicios personalizados que generan la satisfacción de las necesidades y preferencias de sus clientes.

Metodos

Para empezar con el analisis estadistico se emplearán tecnicas de revisión de los datos obtenidos por la compañia para identificar posibles patrones, desviaciones, datos faltantes y decidir cual sera la mejor opcion para generar la depuración de la información.

El analisis empieza con una revisión preliminar de las variables que componen el dataset, inicialmente se puede identificar que en las variables “Piso” y “Numero de parqueaderos” se presenta gran cantidad de datos faltantes, por lo cual se definió imputar estas dos variables.

##                         vars    n      mean       sd  median   trimmed     mad
## Id                         1 8327   4163.99  2403.93 4164.00   4164.00 3086.77
## Zona*                      2 8327      3.92     1.33    5.00      4.04    0.00
## Piso                       3 5689      3.77     2.62    3.00      3.37    1.48
## Estrato                    4 8327      4.63     1.03    5.00      4.67    1.48
## Precio x metro cuadrado    5 8328    434.24   329.02  330.00    374.72  209.05
## Area construida            6 8327    174.99   142.95  123.00    149.22   84.51
## Numero de parqueaderos     7 6724      1.84     1.13    2.00      1.62    1.48
## Baños                      8 8327      3.11     1.43    3.00      2.99    1.48
## Habitaciones               9 8327      3.61     1.46    3.00      3.41    1.48
## Tipo*                     10 8327      2.56     1.94    1.00      2.45    0.00
## Barrio*                   11 8327    241.48   128.81  251.00    245.34  171.98
## Longitud                  12 8327 -21845.13 34503.90  -76.54 -17732.94    0.03
## Latitud                   13 8327    970.37  1539.16    3.45    779.76    0.10
##                               min     max    range  skew kurtosis     se
## Id                           1.00 8319.00  8318.00  0.00    -1.20  26.34
## Zona*                        1.00    5.00     4.00 -0.59    -1.37   0.01
## Piso                         1.00   12.00    11.00  1.28     1.05   0.03
## Estrato                      3.00    6.00     3.00 -0.18    -1.11   0.01
## Precio x metro cuadrado     58.00 1999.00  1941.00  1.85     3.66   3.61
## Area construida             30.00 1745.00  1715.00  2.69    12.90   1.57
## Numero de parqueaderos       1.00   10.00     9.00  2.32     8.29   0.01
## Baños                        0.00   10.00    10.00  0.92     1.12   0.02
## Habitaciones                 0.00   10.00    10.00  1.64     3.99   0.02
## Tipo*                        1.00    6.00     5.00  0.46    -1.78   0.02
## Barrio*                      1.00  436.00   435.00 -0.09    -1.23   1.41
## Longitud                -76576.00  -76.46 76499.54 -0.95    -1.09 378.11
## Latitud                      3.33 3497.00  3493.67  0.96    -1.07  16.87

Detalle de NA’s (datos faltantes) por variable, se identifica que aproximadamente un 30% de los datos no tienen información en la variable “Piso” y un 20% en la variable “Numero de parqueaderos”.

Despues se realizar la imputación de las dos variables “Piso” y “Numero de parqueaderos” con el objetivo de completar la información para generar un analisis mas preciso, se realiza la limpieza de las variables “Tipo”, “Barrio”, “Latitud”, “Longitud” normalizando el dataset por completo.

El detalle de lo anterior esta descrito de la siguiente manera.

  1. Imputación variable Piso: Se imputa mediante el reemplazo de la media “truncada” por el 68% de los datos que son validos generando que los datos NA’S(Faltantes) se reemplacen por 3er piso.

  2. Imputación variable Numero de parqueaderos: Se imputa mediante el reemplazo de la mediana por lo menos el 75% de las propiedades tienen 2 o mas parqueaderos, los faltantes se reemplazan por 2 parqueaderos.

  3. La limpieza de la información en las variables cualitativas como Tipo y Barrio se hace mediante arreglos de texto como gsub que reemplaza sinonimos y Chartr que reemplaza las tildes y caracteres especiales.

  4. Para el caso de latitud y longitud al presentar ciertas cifras en miles y otras en cientos, se realiza un arreglo mediante un condicional que permita que las coordenadas mayores a 100 para este caso queden expresadas en cientos.

La información normalizada queda de la siguiente manera: se detalla que no existen datos faltantes para ninguna de las variables y por lo tanto se puede iniciar con los respectivos analisis estadisticos y graficos para ayudar a la toma de decisiones.

Resultados

  1. Precio de las viviendas en diferentes zonas de Cali.

Se observa que el precio promedio por metro cuadrado en general es mas alto en la Zona Oeste y el mas bajo es en la Zona Oriente, tambien se puede evidenciar que donde se presenta un rango mayor de precios es en la Zona Oeste y a su vez el rango es mas estrecho en la Zona Oriente, donde se presentan mas datos atipicos (precios por fuera de rango) es en Zona Norte y en Zona Sur.

  1. Tipo de vivienda mas ofertada en Cali.

Se observa que aproximadamente un 61% de las propiedades analizadas en este informe pertenecen al tipo “Apartamento” mientras que el restante 39% pertenecen al tipo “Casa”

  1. Caracteristicas mas relevantes de la oferta de vivienda en Cali.

Se observa que la gran mayoria de propiedades tienen 3 habitaciones y 2 baños, respecto a los estratos y zonas la mayoria de propiedades se encuentran ubicadas en el estrato 5 y en la Zona Sur de la Ciudad.

  1. Analisis estadistico de las caracteristicas de la oferta de vivienda en Cali.

Se evidencia que la gran mayoria de propiedades estan en el 3er piso sin importar cual sea el estrato socioeconomico asignado, teniendo datos atipicos en todos los estratos principalmente por encima del 7mo piso.

Se evidencia que la gran mayoria de propiedades cumplen las siguientes caracteristicas:

  1. Menor a 1000 m2 construidos

  2. Menor a 1.500 el precio x m2

Se detectan atipicos como que una pequeña parte de las propiedades tienen un valor igual o mayor a 1.500 el precio x m2 y tienen un area construida mayor a 1.000 M2

Se describe la densidad de datos presentada entre el Numero de Habitaciones vs Numero de Baños en cada propiedad.

La información permite afirmar que la gran mayoria de propiedades tienen solo 1 parqueadero, solo en casos puntuales tienen entre 2 y 4 parqueaderos, existen datos atipicos donde las propiedades tienen entre 4 y 10 parqueaderos.

  1. Mapa descriptivo e interactivo de la oferta de vivienda en Cali.

Para este mapa se toma la muestra de 100 propiedades con el objetivo de poder visualizar de forma grafica la ubicación geoespacial de las propiedades evaluadas para este informe.

Discusión

La empresa B&C debe presentar oferta sectorizada para las propiedades que pretende vender en la ciudad de Cali ya que el estudio refleja diferencias sustanciales en el precio promedio por metro cuadrado en diferentes zonas de la ciudad, como punto de referencia tendrá conocimiento de que los apartamentos son las propiedades mas vendidas en Cali según este estudio teniendo como principales características dos habitaciones, dos baños y un parqueadero. Basado en este estudio debería impulsar fuertemente su plan de ventas en la Zona Sur, al ser la zona con mayor cantidad de viviendas y donde puede tener mayor porcentaje de ventas en próximos proyectos inmobiliarios.

Conclusiones

Se debe tener en cuenta una segmentación del mercado debido a que el análisis detallado de los precios por metro cuadrado en diferentes zonas de Cali resalta la importancia de segmentar la oferta para la empresa B&C. Este enfoque permitirá adaptar estrategias de precios y marketing específicas para cada área, maximizando así el potencial de ventas en cada segmento.

Las preferencias de los clientes indican una mayor preferencia por los apartamentos por lo cual la compañía deberá ajustar su oferta a este tipo de propiedad para asi garantizar que sus inmuebles sean realmente lo que demanda el mercado.

Las características principales a considerar esta en el numero de habitaciones, baños y parqueaderos que sin importar el estrato socioeconómico o el sector se mantienen, esta debe ser su oferta base para adelantar próximos proyectos inmobiliarios.

La empresa debe explotar la información obtenida en este informe sobre la expansión y el creciente desarrollo de la zona sur en la ciudad de Cali, de esta manera asegura su vigencia en el mercado frente a sus otros competidores.

Este informe permite definir de manera clara y estructura cual debe ser la estrategia comercial de la compañia B&C respecto a proximas inversiones en proyectos inmobiliarios que le permitan mantenerse vigente en el mercado y estar a la vanguardia.

Anexos

La información de este analisis se encuentra en el siguiente repositorio:

https://github.com/danielfduarteq/Maestria_Ciencia_Datos/blob/main/Entrega%201%20Informe%20Metodos%20y%20Simulacion%20Estadistica.Rmd