Introducción

Cali es un distrito colombiano, capital del departamento de Valle del Cauca, es la tercera ciudad más poblada y el tercer centro económico y cultural de Colombia. Está situada en el Valle del Río Cauca, formado por la cordillera occidental y la cordillera central, con una altura promedio de 1000 msnm. La ciudad fue fundada el 25 de julio de 1536 por Sebastián de Belalcázar, lo que la convierte en una de las ciudades más antiguas de América. La ciudad es uno de los principales centros económicos e industriales de Colombia, además de ser el principal centro urbano, cultural, económico, industrial y agrario del suroccidente del país y el tercero a nivel nacional después de Bogotá y Medellín. Es a su vez conocida como “la capital mundial de la salsa” y “la sucursal del cielo”.​

El mercado de bienes raíces en Cali ha crecido significativamente en los últimos años, impulsado por el crecimiento de la población, la inversión extranjera directa y el desarrollo de nuevos proyectos inmobiliarios. En 2021, las ventas del sector en Cali llegaron a $6700 millones y en 2022 a $6100 mil millones. Se espera que este sector continue creciendo durante los próximos años, permitiendo un desarrollo dinámico en la economía regional.

La empresa B&C es una agencia de bienes raíces que opera en la ciudad de Cali, Colombia. La empresa fue fundada por Sandra Milena hace 10 años y actualmente cuenta con ocho agentes de bienes raíces. La empresa B&C ha recogido información sobre viviendas que incluye información sobre precio, la ubicación, las caracteristicas y la venta de viviendas en Cali. Esta base de datos se utilizó para realizar el informe estadistico presentado a continuación.

Objetivo

El presente trabajo esta diseñado para analizar las variables del mercado inmobiliario de la ciudad de Cali, a partir de la base de datos suministrada por la empresa B&C, con el fin de determinar un nicho objetivo para la empresa, los servicios ofrecidos, una estrategia de venta y una estrategia de marketing adecuadas a la oferta del mercado.

Metodos

Para la realizacion del presente trabajo se utilizó la base de datos suministrada por la empresa B&C. Se realizara una revision y limpieza de los datos, para reduccir el nivel de ruido mediante la identificacion de data faltante, repetida o mal estructurada. Seguida por un analisis univariable de los atributos de la base de datos, para identificar las principales caracteristicas del mercado. Y por ultimo, se realizara correlaciones con los principales atributos para identificar patrones de comportamiento del mercado inmobiliario de Cali

Revisión y limpieza de la base de datos

La base de datos suministrada por la empresa B&C se describe a continuacion:

library(readxl)
library (dplyr)

#file.choose()
viviendas=read.csv("C:\\Users\\USER\\Documents\\CIENCIA DE DATOS\\Metodo y simulacion estadisticos\\viviendas.csv")

clases <- sapply(viviendas, class)
cant.item <- nrow(viviendas)
faltantes <-  colSums(is.na(viviendas))
tablaresumen <- data.frame(Clase= clases, Cant.elementos = cant.item, Faltantes = faltantes)

print(tablaresumen)
##               Clase Cant.elementos Faltantes
## id          integer           8330         3
## zona      character           8330         3
## piso        integer           8330      2641
## estrato     integer           8330         3
## preciom     integer           8330         2
## areaconst   numeric           8330         3
## parquea     integer           8330      1606
## banios      integer           8330         3
## habitac     integer           8330         3
## tipo      character           8330         3
## barrio    character           8330         3
## longitud    numeric           8330         3
## latitud     numeric           8330         3

De acuerdo con la tabla se identificaron:

  • 8330 entidades y 13 variables, de las cuales 4 son cualitativas (tipo, zona, barrio y estrato) y 9 cuantitativas (piso, preciom, area construida, parqueadero, baños, habitaciones, longitud y latitud).

  • La entidad pisos tiene faltante 2641 datos, lo que corresponde a un 31.7 %. Igualmente, la entidad de numero de parqueo tiene 1606 datos faltantes, lo que corresponde a un 19.3 %. Se decidio no realizar imputacion de las variables con tal de no afectar la calidad de los datos entregados por la inmobiliaria.

  • 3 elementos completamente vacios, por ende se decide eliminarlos, teniendo en cuenta no afectar la calidad de los datos

viviendas2<- viviendas[!is.na(viviendas$id),]
faltantes<- colSums(is.na(viviendas2))
  • Que la entidad baños se encuentra mal escrita, por lo que se procede a modificar la escritura.
names(viviendas2)[8]<-"banos"

Se verifica nuevamente el estado de las variables, comprobando los cambios realizados

library(mice)
grafico<- md.pattern(viviendas2, rotate.names = TRUE, )

De acuerdo con lo anterior se comprueba que los datos faltantes se encuentran unicamnete en las varaibles de piso y parqueadero, tal cual como se tenia estipulado. Ademas de concluir que:

  • 1912 elementos tiene falta unicamente en la variable de piso

  • 877 elementos tiene falta unicamente en la variable de parqueadero

  • 726 elementos tiene falta en ambas variables, es decir, piso y parqueadero

Continuando con el analisis de la base de datos, se identifica la necesidad de unificar parametros

  • Para el item de zona se identifico uniformidad en los valores de entrada
       zona <- table (viviendas$zona)
       print(names(zona))
## [1] "Zona Centro"  "Zona Norte"   "Zona Oeste"   "Zona Oriente" "Zona Sur"
  • Para el item de tipo se identifico uniformidad en los valores de entrada, es decir, que se encuentran escritas de diferentes maneras la misma palabra, como se muestra a continuacion.
    tipo <- table (viviendas$tipo)
    print(names(tipo))
## [1] "Apartamento" "APARTAMENTO" "apto"        "casa"        "Casa"       
## [6] "CASA"

Por tal motivo, se decidio mantener los string de la base de datos en mayusculas sostenida y modificar el termino “apto” por “APARTAMENTO”

library(dplyr)
viviendas2$barrio <- iconv(viviendas2$barrio, to = "UTF-8", sub = "byte")
viviendas2 <- viviendas2 %>%
  mutate_if(is.character, toupper)
viviendas2$tipo<- ifelse(viviendas2$tipo=='CASA','CASA','APARTAMENTO')

Se verifica nuevamente el estado de las variables, comprobando los cambios realizados.

tipo2 <- table (viviendas2$tipo)
print(names(tipo2))
## [1] "APARTAMENTO" "CASA"
  • Ciertos elememtos de los item de longitud y latitud se encuentran por fuera del rango correspondiente a Cali,se identificó que estos valores se debian dividir por 1000 para ajustarlos.
viviendas2a <- viviendas2
viviendas2$longitud <- ifelse(viviendas2$longitud < -1000, viviendas2$longitud/1000, viviendas2$longitud)
viviendas2$latitud <- ifelse(viviendas2$latitud > 100, viviendas2$latitud/1000, viviendas2$latitud)

Se verificó nuevamente el estado de las variables, comprobando los cambios realizados. la distribucion de los datos corresponden al comportamiento esperado

library(ggplot2)
library(gridExtra)

datos <- data.frame(id= viviendas2$id, latitud_original = viviendas2a$latitud, longitud_original =viviendas2a$longitud,latitud_corregida = viviendas2$latitud, longitud_corregida =viviendas2$longitud)

plot_original <- ggplot(datos, aes(x = latitud_original, y = longitud_original)) +
  geom_point(color = "blue", size = 3, alpha = 0.7, shape = 16) +
  labs(title = "Coordenadas Originales",
       x = "Latitud",
       y = "Longitud") +
  theme_minimal()

plot_corregido <- ggplot(datos, aes(x = latitud_corregida, y = longitud_corregida)) +
  geom_point(color = "red", size = 3, alpha = 0.7, shape = 1) +
  labs(title = "Coordenadas Corregidas",
       x = "Latitud",
       y = "Longitud") +
  theme_minimal()

grid.arrange(plot_original, plot_corregido, ncol = 2)

Se realizó una revisión de datos duplicados

datosduplicados<- viviendas2[duplicated(viviendas2),]
print(datosduplicados)
##        id       zona piso estrato preciom areaconst parquea banos habitac
## 8323 8309 ZONA OESTE    5       4     150        56      NA     1       2
## 8324 8310 ZONA OESTE    1       6    1600       463       4     6       3
## 8325 8313 ZONA OESTE    7       6     525       137       2     3       3
## 8326 8314 ZONA OESTE    7       6    1400       210       3     4       3
## 8327 8315 ZONA OESTE   NA       6     620       167       2     4       4
## 8328 8316 ZONA NORTE    7       5     400       220       1     4       4
## 8329 8317 ZONA OESTE   NA       6    1100       290       4     4       3
## 8330 8318 ZONA NORTE   NA       4     580       295       2     5       5
##             tipo     barrio  longitud latitud
## 8323 APARTAMENTO  AGUACATAL -76.57049 3.45445
## 8324 APARTAMENTO SANTA RITA -76.57076 3.45332
## 8325 APARTAMENTO  NORMANDÍA -76.57941 3.45531
## 8326 APARTAMENTO  NORMANDÍA -76.57941 3.45531
## 8327 APARTAMENTO  NORMANDÍA -76.58530 3.45971
## 8328 APARTAMENTO    GRANADA -76.58732 3.46148
## 8329 APARTAMENTO  NORMANDÍA -76.58744 3.46124
## 8330        CASA   LA FLORA -76.58876 3.46348

Se eliminaron dichos elementos para reducir el ruido de la base de datos, se consideró que no afectar la calidad de los datos.

viviendas3 <- viviendas2[!duplicated(viviendas2),]
nrow(viviendas3[duplicated(viviendas3),])
## [1] 0

A continuacion un mapa con la base de datos de viviendas.

library(leaflet)

# Coordenadas del centro de Cali
lat_cali <- 3.4516
long_cali <- -76.5320

# Crear un mapa con zoom en Cali
map <- leaflet(viviendas3) %>%
  addTiles() %>%
  addMarkers(
    lng = ~longitud,
    lat = ~latitud,
    popup = ~paste("ID:", id,
                   "<br>Zona:", enc2utf8(zona),
                   "<br>Tipo:", enc2utf8(tipo),
                   "<br>Piso:", piso,
                   "<br>Estrato:", estrato,
                   "<br>Habitaciones:", habitac,
                   "<br>Baños:", banos,
                   "<br>Parqueadero:", parquea,
                   "<br>Área construida:", areaconst),
    clusterOptions = markerClusterOptions()
  ) %>%
  setView(lng = long_cali, lat = lat_cali, zoom = 12)

map

Analisis de datos

A continuacion se realizara un analisis univariados para cada varaible de la base de datos, con el objetivo de resaltar las tendencias del mercado de viviendas en Cali.

  • Zona
zona <- table (viviendas3$zona)
total_zona <- sum(zona)
porcentajezona <- prop.table(zona)*100
tablaresumzona<- data.frame(Porcentaje=porcentajezona, Cantidad=as.integer(zona))
colnames(tablaresumzona) <- c("Zona", "Porcentaje","Cantidad")
print(tablaresumzona, row.names = FALSE)
##          Zona Porcentaje Cantidad
##   ZONA CENTRO   1.490564      124
##    ZONA NORTE  23.079697     1920
##    ZONA OESTE  14.400769     1198
##  ZONA ORIENTE   4.219257      351
##      ZONA SUR  56.809713     4726
pie(zona, labels = paste(names(zona), "\n", round(porcentajezona, 1),"%"), main = "Distribucion de preferencia de zonas urbanas Cali")

De acuerdo con la informacion anterior se concluye:

  1. La zona con mayor oferta de viviendas en Cali es la zona sur, representando más de la mitad del total con un 56.6%. seguido por la zona norte abarcando un 23.0% de las viviendas.

  2. Las zonas oeste y oriente, aunque con una participación menor, aún tienen una participacion del 18.6%

  3. La zona centro, tiene la menor cantidad de viviendas y contribuye en un 1.5.% al panorama general de la distribución urbana de la ciudad.

A continuacion se muestra la distribucion de viviendas por zonas de la ciudad de Cali.

    library(ggplot2)

    ggplot(viviendas3, aes(x = longitud, y = latitud, color = zona)) +
      geom_point() +
      labs(title = "Distribución de Viviendas por Zona",
           x = "Longitud", y = "Latitud",
           color = "Zona") +
      theme_minimal()

De acuerdo con el mapa anterior, seria adecuado hacer una revision de la base de datos y la clasificacion por zonas, debido a que se logra identificar viviendas que no corresponden con los sectores definidos.

  • Estrato
estrato <- table (viviendas3$estrato)
total_estrato<- sum(estrato)
porcentajestrato <- prop.table(estrato)*100
tablaresumestrato<- data.frame(Porcentaje=porcentajestrato, Cantidad= as.integer(estrato))
colnames(tablaresumestrato) <- c("Estrato", "Porcentaje","Cantidad")
print(tablaresumestrato, row.names = FALSE)
##  Estrato Porcentaje Cantidad
##        3   17.46604     1453
##        4   25.59202     2129
##        5   33.05686     2750
##        6   23.88508     1987
pie(estrato, labels = paste(names(estrato), "\n", round(porcentajestrato, 1),"%"), main = "Distribucion de preferencia de estratos Cali")

La mayoría de las viviendas se encuentran en los estratos 4 y 5, representando aproximadamente el 58.4% de las viviendas en total, lo que indica una preferencia por los estratos medio-alto.

  • Tipo
total_tipo <- sum(tipo2)
porcentajestipo2<- prop.table(tipo2)*100
tablaresumetipo2<- data.frame(Porcentaje=porcentajestipo2, Cantidad=as.integer(tipo2))
colnames(tablaresumetipo2) <- c("Tipo", "Porcentaje","Cantidad")
print(tablaresumetipo2, row.names = FALSE)
##         Tipo Porcentaje Cantidad
##  APARTAMENTO    61.3186     5106
##         CASA    38.6814     3221
pie(tipo2, labels = paste(names(tipo2), "\n", round(porcentajestipo2, 1),"%"), main = "Distribucion de preferencia de tipo de inmueble Cali") 

De acuerdo con la informacion anterior se tiene:

  1. La mayoría de las viviendas tipo “APARTAMENTO”, con un total de 5,099 registros. Esto representa aproximadamente el 61.3% de todas las viviendas analizadas.

  2. Las viviendas tipo “CASA”, con un total de 3,220 registros. Esto representa aproximadamente el 38.7% de todas las viviendas analizadas

  3. Esta distribución sugiere una preferencia general hacia los apartamentos en la ciudad de Cali, ya que representan la mayoría de las viviendas en el conjunto de datos. Sin embargo, las casas también tienen una presencia notable, lo que sugiere una diversidad de opciones de vivienda en la ciudad.

  4. La preferencia por los apartamentos puede deberse a factores urbanos y de densidad poblacional que hacen que las viviendas en forma de apartamentos sean una opción más viable en áreas urbanas. Los apartamentos generalmente ocupan menos espacio en comparación con las casas unifamiliares, lo que permite aprovechar mejor el terreno disponible en zonas urbanas densas.

  • Precio
precio <- data.frame(preciom=viviendas3$preciom)
summary(viviendas3$preciom)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    58.0   220.0   330.0   433.9   540.0  1999.0
boxplot(viviendas3$preciom, main = "Distribución de Precios de Viviendas en Cali")

De acuerdo con la informacion anterior se tiene:

  1. El precio mínimo de una vivienda es de $58,000, lo cual indica que hay opciones más asequibles en el mercado.

  2. El primer cuartil (25% de los datos) se sitúa en $220,000, lo que significa que la mayoría de las viviendas tienen un precio superior a esta cifra.

  3. El tercer cuartil (75% de los datos) es de $540,000, mostrando que un 25% de las viviendas tienen precios aún más elevados.

  4. Regularmente los precios de las viviendas en Cali se situan entre $220,000 (primer cuatil ) y $ 540,000 (tercer cuartil)

  5. La mediana, que es el valor que se encuentra justo en el medio de la distribución, es de $330,000. Esto implica que la mitad de las viviendas tienen un precio por debajo de este valor y la otra mitad por encima.

  6. El precio promedio (media) de las viviendas es de $433,900, lo que indica que hay algunas viviendas con precios más altos que afectan ligeramente el valor promedio.

  7. El precio máximo registrado es de $1,999,000, lo cual indica que hay algunas viviendas de lujo con precios significativamente superiores al promedio

  • Metros cuadrados construidos
hist_mconstruido <- hist(viviendas3$areaconst, main="Histograma de los metros construidos", xlab = "metros construidos", ylab = "Cantidad")

Observamos que la forma de la distribución es asimétrica y sesgada hacia la derecha, donde, La mayoría de las viviendas tienen áreas construidas relativamente moderados, ya que los intervalos más bajos (0-300 metros cuadrados) tienen las frecuencias más altas. A medida que avanzamos hacia los intervalos superiores, la frecuencia disminuye gradualmente, lo que indica que las viviendas con áreas extremadamente grandes son poco comunes en Cali. Esto es consistente con una distribución típica de bienes raíces, donde la mayoría de las propiedades son de tamaño moderado, mientras que las propiedades más grandes son menos comunes.

  • Habitaciones
habitaciones <- table(viviendas3$habitac)
total_habitaciones <- sum(habitaciones)
porcentaje_habitaciones <- prop.table(habitaciones) * 100
tablaresumhabita <- data.frame(Porcentaje = porcentaje_habitaciones ,Cantidad = as.integer(habitaciones))

colnames(tablaresumhabita) <- c("Habitaciones", "Porcentaje", "Cantidad")

print(tablaresumhabita, row.names = FALSE)
##  Habitaciones Porcentaje Cantidad
##             0  0.7933646       66
##             1  0.7092199       59
##             2 11.1311456      926
##             3 49.2487078     4097
##             4 20.7837480     1729
##             5  8.1620387      679
##             6  3.8225748      318
##             7  2.0795769      173
##             8  1.6588532      138
##             9  0.9977161       83
##            10  0.6130545       51
barplot(habitaciones, main = "Distribución de Habitaciones en Viviendas de Cali")

A continuacion se presenta la distribución de las habitaciones en las viviendas de Cali:

  1. La mayoría de las viviendas en Cali cuentan con un número de habitaciones que oscila entre 2 y 4. Lo que sugiere una tendencia hacia hogares con un tamaño moderado.

  2. A medida que el número de habitaciones aumenta, la frecuencia disminuye progresivamente, esto indica que las viviendas con un mayor número de habitaciones son menos comunes.

  3. Cabe mencionar que un número reducido de viviendas tiene 0 (66 viviendas) o 1 (59 viviendas) habitaciones, estas viviendas podrían ser departamentos o propiedades destinadas a usos específicos, como oficinas o establecimientos comerciales.

  • Baños
banos <- table(viviendas3$banos)
total_banos <- sum(banos)
porcentaje_banos <- prop.table(banos) * 100
tablaresumbanos <- data.frame(Porcentaje = porcentaje_banos ,Cantidad = as.integer(banos))
colnames(tablaresumbanos) <- c("Banos", "Porcentaje", "Cantidad")
print(tablaresumbanos, row.names = FALSE)
##  Banos Porcentaje Cantidad
##      0  0.5409304       45
##      1  5.9622551      496
##      2 35.4129102     2946
##      3 23.9572064     1993
##      4 17.5021036     1456
##      5 10.6984013      890
##      6  3.7744921      314
##      7  1.2862123      107
##      8  0.5769924       48
##      9  0.1803101       15
##     10  0.1081861        9
barplot(banos, main = "Distribución de banos en Viviendas de Cali")

Esta información nos brinda una idea de cómo están distribuidos los baños en las viviendas de Cali, lo que puede ser útil para entender las preferencias y necesidades de los residentes en términos de comodidades en sus hogares. Observamos lo siguiente:

  1. La mayoría de las viviendas tienen 2 baños (35.41%), seguido por 3 baños (23.96%) y 4 baños (17.50%).

  2. A medida que aumenta la cantidad de baños, el porcentaje disminuye gradualmente, lo que sugiere que las viviendas con más de 5 baños son menos comunes en el mercado inmobiliario de Cali

  3. Las viviendas con 0 baños representan un porcentaje bajo (0.54%), estas viviendas podrían ser habitaciones o departamentos con baños externos compartidos, sin embargo seria bueno verificar esta informacion .

  • Parqueaderos
parqueo <- table(viviendas3$parquea)
total_parqueo <- sum(parqueo)
porcentaje_parqueo <- prop.table(parqueo) * 100
tablaresumparqueo <- data.frame(Porcentaje = porcentaje_parqueo ,Cantidad = as.integer(parqueo))
colnames(tablaresumparqueo) <- c("Parqueaderos", "Porcentaje", "Cantidad")
print(tablaresumparqueo, row.names = FALSE)
##  Parqueaderos  Porcentaje Cantidad
##             1 46.97037368     3155
##             2 36.84680661     2475
##             3  7.74155129      520
##             4  5.71683787      384
##             5  1.01235671       68
##             6  1.01235671       68
##             7  0.26797678       18
##             8  0.25308918       17
##             9  0.05955039        4
##            10  0.11910079        8
barplot(parqueo, main = "Distribución de Parqueo en Viviendas de Cali")

La distribución de los números de parqueaderos en las viviendas de Cali ofrece una visión de cómo las propiedades en esta ciudad están equipadas para el estacionamiento de vehículos. A continuación, se presenta un análisis de los datos:

  1. La mayoría de las propiedades tienen uno o dos parqueaderos, lo que abarca aproximadamente el 83.82% de las viviendas, sin embargo, una proporcion significativa del alrededor del 14.78% tienen tres o más parqueadero.

  2. Las viviendas con una cantidad mayor de parqueaderos, como cinco, seis, siete u ocho indica propiedades más grandes o con espacios adicionales destinados al estacionamiento, lo que podría ser atractivo para familias con varios vehículos.

  3. Algunas viviendas tienen no cuenta con parqueaderos reportados, lo que podria significar ausencia de estos, sin embargo como recomendacion se deja la verificacion de la informacion, ya que esto podría reflejar una limitación en el espacio disponible o en las regulaciones de construcción en ciertas áreas de la ciudad.

En resumen, la distribución de los números de parqueaderos en las viviendas de Cali refleja la diversidad de opciones disponibles para los residentes en términos de estacionamiento. Esta variedad puede ser un factor importante para las personas que buscan una propiedad que se adapte a sus necesidades específicas de estacionamiento, ya sea para uno o varios vehículos.

  • Barrios
barrios <- table(viviendas3$barrio) 
total_barrios <- sum(barrios)
porcentajesbarrios <- prop.table(barrios)*100
barriosordenados <- sort(barrios, decreasing = TRUE)
barrios_mas_representativos <- head(barriosordenados, 10)
porcentajebarriosrepresentativos <- prop.table(barrios_mas_representativos)*100
barrios_nombres <- names(barrios_mas_representativos)
cantidad_barrios <- as.integer(barrios[barrios_nombres])
tablaresumbarrios <- data.frame(Porcentaje=porcentajebarriosrepresentativos,
                                Cantidad = cantidad_barrios)
colnames(tablaresumbarrios) <- c("Barrios", "Porcentaje","Cantidad")
print(tablaresumbarrios, row.names = FALSE)
##         Barrios Porcentaje Cantidad
##  VALLE DEL LILI  29.161850     1009
##   CIUDAD JARDÍN  14.971098      518
##           PANCE  11.907514      412
##        LA FLORA  10.635838      368
##  SANTA TERESITA   7.601156      263
##        EL CANEY   6.040462      209
##      EL INGENIO   5.867052      203
##     LA HACIENDA   4.797688      166
##           ACOPI   4.566474      158
##   LOS CRISTALES   4.450867      154

Los barrios con mayor disponibilidad de viviendas en la ciudad de Cali son:

  1. Valle del Lili: Este barrio representa aproximadamente el 29.16% de las viviendas disponibles en Cali, con un total de 1009 viviendas. Es un área residencial destacada por su ubicación estratégica y la variedad de opciones de vivienda.

  2. Ciudad Jardín: Con alrededor del 14.97% de las viviendas disponibles (518 viviendas), Ciudad Jardín es otra zona prominente en términos de oferta de viviendas. Su popularidad puede deberse a su ambiente tranquilo y su proximidad a servicios y comercios.

  3. Pance: Ocupando el 11.91% de las viviendas (412 viviendas), Pance es conocido por su entorno natural y atractivo paisaje. Esta ubicación podría ser atractiva para aquellos que buscan viviendas cerca de áreas verdes y recreativas.

  4. La Flora: Con una participación del 10.64% (368 viviendas), La Flora es otro barrio destacado en el mercado de viviendas. Sus características y servicios podrían estar atrayendo a aquellos que buscan una ubicación conveniente y variada.

  5. Santa Teresita: Representando el 7.60% de las viviendas (263 viviendas), Santa Teresita es una opción popular en el mercado. Su accesibilidad y posibles comodidades cercanas podrían influir en su alta disponibilidad.

En resumen, estos barrios destacados representan una parte significativa de las viviendas disponibles en Cali y podrían ser opciones atractivas para diversos tipos de compradores en función de sus preferencias y necesidades específicas.

  • Pisos
#CASA
vivienda_casa <- viviendas3[viviendas3$tipo == "CASA", ]

tabla_resumen_casa <- table(vivienda_casa$piso)
porcentaje_pisos_casa <- prop.table(tabla_resumen_casa) * 100

vivienda_apartamento <- viviendas3[viviendas3$tipo == "APARTAMENTO", ]

tabla_resumen_apartamento <- table(vivienda_apartamento$piso)
porcentaje_pisos_apartamento <- prop.table(tabla_resumen_apartamento) * 100

barplot(tabla_resumen_casa,
        col = "skyblue",
        main = "Distribución de Pisos en Viviendas de Cali (CASA)",
        xlab = "Piso",
        ylab = "Cantidad")

print("Tabla de Resumen para Viviendas CASA")
## [1] "Tabla de Resumen para Viviendas CASA"
tabla_resumen_casa
## 
##   1   2   3   4   5   6   7  10 
## 430 938 524  62   4   2   4   2
barplot(tabla_resumen_apartamento,
        col = "salmon",
        main = "Distribución de Pisos en Viviendas de Cali (APARTAMENTO)",
        xlab = "Piso",
        ylab = "Cantidad")

print("Tabla de Resumen para Viviendas APARTAMENTO")
## [1] "Tabla de Resumen para Viviendas APARTAMENTO"
tabla_resumen_apartamento
## 
##   1   2   3   4   5   6   7   8   9  10  11  12 
## 430 512 573 545 563 243 200 211 146 128  84  83
  • La mayoría de las viviendas tipo casa cuentan entre 1 y 3 pisos, siendo las casas de doble nivel las mas frecuentes.

  • El aumento y la disminución en la cantidad de viviendas por piso pueden estar relacionados con las preferencias de los compradores y la disponibilidad de unidades en diferentes niveles. Se observa una preferencia por alturas moderadas (pisos 1al 5)

  • Hay datos que se deben revisar, por ejemplo, una casa con 10 pisos a que hace referencia.

Los valores de ID no se analizaron, debido a que estos no representan caracteristicas de las vivivendas de Cali, Igualmente los valores de latitud y longitud se utilizaron dentro del analisis de las zonas, mas no como un atributo independiente.

De acuerdo con los resultados previos, se decide analizar las relaciones de entre variables, con el fin de determinar modelos de viviendas de la ciudad de Cali de acuerdo con su estrato, esto debido a que la clasificacion por zonas no es clara, como se menciono anteriormente, se identificaron viviendas en zonas que no correspondian.

Correlaciones de variables

A continuacion, analizara las dinamicas del mercado inmobiliario de la ciudad de cali:

barplot(table(viviendas3$tipo, viviendas3$estrato), main="Distribucion de tipo de vivienda segun estrato", xlab="Estratos")

En el grafico anterior el gris oscuro corresponde a las viviendas tipo casa y el gris claro corresponde a las viviendas tipo apartamento. De acuerdo con la grafica, se logra identificar la preferencia por las casas en vez de los apartamentos a medida que el estrato socioeconomico es mayor. Para las caracteristicas internas, se realizo el siguiente grafico.

library(corrplot)
correlation_matrix <- cor(viviendas3[, c("habitac", "banos", "areaconst","preciom", "estrato")])
corrplot(correlation_matrix, method = "color")

correlation_table <- as.table(correlation_matrix)

print(correlation_table)
##               habitac       banos   areaconst     preciom     estrato
## habitac    1.00000000  0.58990641  0.51691292  0.26409121 -0.07137615
## banos      0.58990641  1.00000000  0.64841648  0.66914558  0.42032178
## areaconst  0.51691292  0.64841648  1.00000000  0.68735196  0.27432332
## preciom    0.26409121  0.66914558  0.68735196  1.00000000  0.60980664
## estrato   -0.07137615  0.42032178  0.27432332  0.60980664  1.00000000

De acuerdo con el analisis de correlacion se tiene:

  1. habitac vs. banos: Existe una correlación positiva significativa de aproximadamente 0.59 entre el número de habitaciones (habitac) y el número de baños (banos). Esto sugiere que las casas con más habitaciones tienden a tener más baños y viceversa.

  2. habitac vs. areaconst: Hay una correlación positiva moderada de alrededor de 0.52 entre el número de habitaciones (habitac) y el área construida (areaconst) de las viviendas. Esto indica que las casas más grandes en términos de área construida tienden a tener más habitaciones.

  3. habitac vs. preciom: La correlación entre el número de habitaciones (habitac) y el precio de la vivienda (preciom) es relativamente baja (aproximadamente 0.26). Esto sugiere que la cantidad de habitaciones no está fuertemente relacionada con el precio de la vivienda.

  4. habitac vs. estrato: La correlación entre el número de habitaciones (habitac) y el estrato es negativa pero muy cercana a cero. Esto implica que no hay una relación significativa entre estas dos variables.

  5. banos vs. areaconst: Existe una correlación positiva considerable de alrededor de 0.65 entre el número de baños (banos) y el área construida (areaconst) de las viviendas. Esto sugiere que las casas más grandes tienden a tener más baños.

  6. banos vs. preciom: Hay una correlación positiva sólida de aproximadamente 0.67 entre el número de baños (banos) y el precio de la vivienda (preciom). Esto indica que las viviendas con más baños tienden a tener un precio más alto.

  7. banos vs. estrato: Existe una correlación positiva moderada de alrededor de 0.42 entre el número de baños (banos) y el estrato de las viviendas. Las viviendas con más baños tienden a tener un estrato ligeramente más alto.

  8. areaconst vs. preciom: Hay una correlación positiva significativa de aproximadamente 0.69 entre el área construida (areaconst) y el precio de la vivienda (preciom). Esto sugiere que las viviendas más grandes tienden a tener un precio más alto.

  9. areaconst vs. estrato: Existe una correlación positiva moderada de alrededor de 0.27 entre el área construida (areaconst) y el estrato de las viviendas. Las viviendas más grandes tienden a tener un estrato ligeramente más alto.

  10. preciom vs. estrato: Hay una correlación positiva sólida de aproximadamente 0.61 entre el precio de la vivienda (preciom) y el estrato. Esto indica que las viviendas con un estrato más alto tienden a tener un precio más alto.

De acuerdo con lo anterior la varaiable clave seria el area de construccion, ya que la cantiadad de habitaciones y baños estan relacionados con esta. Por tal razon se plantean el siguiente analisis “Area de construccion vs. precio segun el tipo de vivienda en cada estrato”

par(mfrow = c(1, 2))

boxplot(preciom ~ estrato, data = viviendas3[viviendas3$tipo == "CASA", ], 
        main = "Precio de casas por estrato - casa",
        xlab = "Estratos", ylab = "Precio")

boxplot(preciom ~ estrato, data = viviendas3[viviendas3$tipo == "APARTAMENTO", ], 
        main = "Precio de apartamentos por estrato - apartamento",
        xlab = "Estratos", ylab = "Precio")

par(mfrow = c(1, 1))


par(mfrow = c(1, 2))

boxplot(areaconst ~ estrato, data = viviendas3[viviendas3$tipo == "CASA", ], 
        main = "Precio de casas por estrato - casa",
        xlab = "Estratos", ylab = "Precio")

boxplot(areaconst~ estrato, data = viviendas3[viviendas3$tipo == "APARTAMENTO", ], 
        main = "Precio de apartamentos por estrato - apartamento",
        xlab = "Estratos", ylab = "Precio")

par(mfrow = c(1, 1))



library(ggplot2)
viviendastipo <- split(viviendas3, f=viviendas3$tipo)

#CASA
ggplot(viviendastipo[["CASA"]], aes(x = areaconst, y = preciom)) +
  geom_point() +
  facet_wrap(~ estrato) +
  stat_smooth(method = "loess", formula = y ~ x) +
  scale_x_continuous(labels = scales::number_format(scale = 1, accuracy = 1, big.mark = ",")) +
  scale_y_continuous(labels = scales::number_format(scale = 1, accuracy = 1, big.mark = ","))+
 labs(title = "Relacion entre area Construida y Precio de Viviendas (Tipo: Casa)")

#APARTAMENTO
ggplot(viviendastipo[["APARTAMENTO"]], aes(x = areaconst, y = preciom)) +
  geom_point() +
  facet_wrap(~ estrato) +
  stat_smooth(method = "loess", formula = y ~ x) +
  scale_x_continuous(labels = scales::number_format(scale = 1, accuracy = 1, big.mark = ",")) +
  scale_y_continuous(labels = scales::number_format(scale = 1, accuracy = 1, big.mark = ","))+
   labs(title = "Relacion entre area Construida y Precio de Viviendas (Tipo: Apartamento)")

De acuerdo con todo el analisis planteado:

  • Las viviendas tipo apartamento y casa muestran patrones diferentes en cuanto a sus precios según el área construida. Para las viviendas tipo apartamento, el precio tiende a aumentar a medida que aumenta el área construida, mientras que para las viviendas tipo casa, el aumento no es tan pronunciado.
  • Los precios en los apartamentos son mas estables con respecto a las casas en el mismos estrato, es decir que los precios de los apartamentos se encuentran menos dispersos.
  • Normalmente, las casas tienen mas area construida que los apartamentos, sin embargo, cuando se presenta similitud en este aspecto dentro del mismo estrato, el precio de las casas son ligeramente mayor.

Resultados

  • Se destaca la necesidad de un análisis minucioso de los valores faltantes en las variables de piso y parqueadero, los cuales representan un porcentaje significativo de la muestra, afectando la calidad de la descripcion estadistica realizada.

  • Se destaca la necesidad de una verificacion de la base sumisntrada debido a inconsistencias logicas en los datos suministrados, como la presencia viviendas sin habitaciones o viviendas sin baños, lo cual por normativa no es preciso. Este tipo de datos impactan en la adecuada caracterización de las viviendas.

  • No se tuvo en cuenta las zonas de las viviendas durante el analisis realizado, debido a las inconsistencias halladas en su distribucion, sin embargo, la zona sur cuenta con mas del 56% de la oferta de viviendas en Cali. Por tal motivo se recomienda a B&C ubicarse en este sector de la ciudad de Cali, con el fin de tener acceso rapido a la mayoria de las propiedades.

  • La base de datos suminstrada por la compañia B&C muestra un distribucion del mercado de vivienda de Cali en los estratos 3, 4, 5 y 6. Por tal motivo se recomienda a B&C enfocarase en residenciales de estratos medios-altos. Este nicho incluye a compradores que buscan propiedades de alta calidad, diseño y comodidades, con un rango de precios que refleje el valor agregado de estas características.

  • Las viviendas con mayor area construidas tienden a tener un estrato mayor, en el mercado de Cali, el area construida es mayor en las viviendas tipo casa y a su vez son mas frecuentes estas (casas) en los estratos mas altos.

  • Las viviendas con mayor area construidas tienden a tener mayor numero de habitaciones y baños, por ende, los precios son mayores. El mercado inmobiliario de cali se caracteriza en su mayoria por viviendas tipo apartamento con areas construida del alrededor del 30 - 300 metros cuadrados, con 2 a 4 habitaciones, 2 a 3 baños y 1 a 2 parqueadero. Estos rangos de atributos también reflejan la adaptabilidad de las viviendas a diferentes tamaños de familias y necesidades.

  • Los precios de las viviendas en cali se encuentran relacionados con las caracteristicas internas de las viviendas, predominando el area construida y el estrato .

  • El precio de venta de una vivienda se ve afectado por las caracteristicas de esta, por tal motivo se le recomienda a B&C implementar como estrategia de venta, la comision, esta representa un porcentaje del precio de venta del inmueble, la cual oscila entre el 5% y 6% del precio de venta del inmueble. Teniendo en cuenta que los precios del mercado de cali se encuentran entre 220 y 540 millones de pesos, la comision por venta de inmuebles estaria alrededor de 11 al 32.4 millones de pesos.

  • Teniendo en cuenta que el nicho es un familia promedio con ingresos superiores a los 7 millones de pesos mensuales que buscan ubicaciones estrategicas, comodidad y lujo, se recomienda estrategias de marketing para B&C se recomienda:

  1. Posicionamiento en Línea: Desarrollar un sitio web atractivo y fácil de usar que muestre el portafolio de propiedades disponible, con descripciones detalladas, fotografías de alta calidad y herramientas de búsqueda interactivas. Implementar estrategias de SEO para asegurar una alta visibilidad en los resultados de búsqueda en línea.

  2. Contenido Relevante: Crear contenido informativo y útil relacionado con el mercado inmobiliario en Cali, consejos para compradores y vendedores, tendencias de diseño de interiores, etc. Este contenido se puede compartir a través de las redes sociales para atraer y comprometer a la audiencia.

  3. Publicidad Segmentada: Utilizar anuncios en línea en plataformas como Google Ads y redes sociales para llegar a clientes potenciales en la zona sur de Cali que se ajusten al perfil del nicho de mercado definido.

  4. Eventos y Ferias: Participar en ferias de bienes raíces locales y eventos relacionados con la vivienda para establecer la presencia de B&C en la comunidad y establecer conexiones directas con posibles clientes.

  5. Alianzas Estratégicas: Colaborar con empresas relacionadas, como instituciones financieras y firmas de diseño de interiores, para ofrecer beneficios adicionales a los clientes y ampliar el alcance de la marca.

  • Como servicios personalizados para B&C se recomienda:
  1. Asesoría. B&C brindará asesoramiento individualizado a cada cliente, comprendiendo sus necesidades y preferencias específicas para ayudarles a encontrar la propiedad adecuada.

  2. Recorridos y Visitas: Organizar visitas a las propiedades con atención a los detalles y destacando las características que más se ajusten a las necesidades del cliente.

  3. Asistencia en Negociaciones: B&C representará a sus clientes en las negociaciones de compra, utilizando su experiencia para lograr acuerdos favorables.

  4. Servicios Post-Venta: Brindar apoyo después de la compra, ayudando con la coordinación de trámites legales y proporcionando recomendaciones para la personalización y mejora de la propiedad.

Conclusiones y discusiones

  • En el proceso de análisis de los datos presentados, se procedió a una exhaustiva revisión de la información proporcionada por la empresa B&C. Es importante resaltar que, con el fin de preservar la integridad y confiabilidad de los datos, no se realizaron modificaciones directas en la base de datos suministrada. Sin embargo, las inconsistencias y faltantes en los datos, requieren una revisión y corrección para lograr una descripción estadística completa, confiable y efectiva que respalden las decisiones y estrategias futuras.

  • El mercado de viviendas en Cali se presenta como una opción completa y adecuada para satisfacer las necesidades y requerimientos de una familia promedio. Con una amplia variedad de propiedades disponibles, desde apartamentos hasta casas. Además, la ciudad ofrece una infraestructura en constante desarrollo que brinda comodidades y servicios que complementan la experiencia de vida de sus habitantes. El crecimiento continuo en la oferta de viviendas en Cali refleja una adaptación a las cambiantes dinámicas familiares y estilos de vida, lo que permite a las familias encontrar el espacio que mejor se ajuste a sus necesidades. Los diversos rangos de precios también hacen que el mercado sea inclusivo y accesible para diferentes grupos demográficos.