Cali es un distrito colombiano, capital del departamento de Valle del Cauca, es la tercera ciudad más poblada y el tercer centro económico y cultural de Colombia. Está situada en el Valle del Río Cauca, formado por la cordillera occidental y la cordillera central, con una altura promedio de 1000 msnm. La ciudad fue fundada el 25 de julio de 1536 por Sebastián de Belalcázar, lo que la convierte en una de las ciudades más antiguas de América. La ciudad es uno de los principales centros económicos e industriales de Colombia, además de ser el principal centro urbano, cultural, económico, industrial y agrario del suroccidente del país y el tercero a nivel nacional después de Bogotá y Medellín. Es a su vez conocida como “la capital mundial de la salsa” y “la sucursal del cielo”.
El mercado de bienes raíces en Cali ha crecido significativamente en los últimos años, impulsado por el crecimiento de la población, la inversión extranjera directa y el desarrollo de nuevos proyectos inmobiliarios. En 2021, las ventas del sector en Cali llegaron a $6700 millones y en 2022 a $6100 mil millones. Se espera que este sector continue creciendo durante los próximos años, permitiendo un desarrollo dinámico en la economía regional.
La empresa B&C es una agencia de bienes raíces que opera en la ciudad de Cali, Colombia. La empresa fue fundada por Sandra Milena hace 10 años y actualmente cuenta con ocho agentes de bienes raíces. La empresa B&C ha recogido información sobre viviendas que incluye información sobre precio, la ubicación, las caracteristicas y la venta de viviendas en Cali. Esta base de datos se utilizó para realizar el informe estadistico presentado a continuación.
El presente trabajo esta diseñado para analizar las variables del mercado inmobiliario de la ciudad de Cali, a partir de la base de datos suministrada por la empresa B&C, con el fin de determinar un nicho objetivo para la empresa, los servicios ofrecidos, una estrategia de venta y una estrategia de marketing adecuadas a la oferta del mercado.
Para la realizacion del presente trabajo se utilizó la base de datos suministrada por la empresa B&C. Se realizara una revision y limpieza de los datos, para reduccir el nivel de ruido mediante la identificacion de data faltante, repetida o mal estructurada. Seguida por un analisis univariable de los atributos de la base de datos, para identificar las principales caracteristicas del mercado. Y por ultimo, se realizara correlaciones con los principales atributos para identificar patrones de comportamiento del mercado inmobiliario de Cali
La base de datos suministrada por la empresa B&C se describe a continuacion:
library(readxl)
library (dplyr)
#file.choose()
viviendas=read.csv("C:\\Users\\USER\\Documents\\CIENCIA DE DATOS\\Metodo y simulacion estadisticos\\viviendas.csv")
clases <- sapply(viviendas, class)
cant.item <- nrow(viviendas)
faltantes <- colSums(is.na(viviendas))
tablaresumen <- data.frame(Clase= clases, Cant.elementos = cant.item, Faltantes = faltantes)
print(tablaresumen)
## Clase Cant.elementos Faltantes
## id integer 8330 3
## zona character 8330 3
## piso integer 8330 2641
## estrato integer 8330 3
## preciom integer 8330 2
## areaconst numeric 8330 3
## parquea integer 8330 1606
## banios integer 8330 3
## habitac integer 8330 3
## tipo character 8330 3
## barrio character 8330 3
## longitud numeric 8330 3
## latitud numeric 8330 3
De acuerdo con la tabla se identificaron:
8330 entidades y 13 variables, de las cuales 4 son cualitativas (tipo, zona, barrio y estrato) y 9 cuantitativas (piso, preciom, area construida, parqueadero, baños, habitaciones, longitud y latitud).
La entidad pisos tiene faltante 2641 datos, lo que corresponde a un 31.7 %. Igualmente, la entidad de numero de parqueo tiene 1606 datos faltantes, lo que corresponde a un 19.3 %. Se decidio no realizar imputacion de las variables con tal de no afectar la calidad de los datos entregados por la inmobiliaria.
3 elementos completamente vacios, por ende se decide eliminarlos, teniendo en cuenta no afectar la calidad de los datos
viviendas2<- viviendas[!is.na(viviendas$id),]
faltantes<- colSums(is.na(viviendas2))
names(viviendas2)[8]<-"banos"
Se verifica nuevamente el estado de las variables, comprobando los cambios realizados
library(mice)
grafico<- md.pattern(viviendas2, rotate.names = TRUE, )
De acuerdo con lo anterior se comprueba que los datos faltantes se encuentran unicamnete en las varaibles de piso y parqueadero, tal cual como se tenia estipulado. Ademas de concluir que:
1912 elementos tiene falta unicamente en la variable de piso
877 elementos tiene falta unicamente en la variable de parqueadero
726 elementos tiene falta en ambas variables, es decir, piso y parqueadero
Continuando con el analisis de la base de datos, se identifica la necesidad de unificar parametros
zona <- table (viviendas$zona)
print(names(zona))
## [1] "Zona Centro" "Zona Norte" "Zona Oeste" "Zona Oriente" "Zona Sur"
tipo <- table (viviendas$tipo)
print(names(tipo))
## [1] "Apartamento" "APARTAMENTO" "apto" "casa" "Casa"
## [6] "CASA"
Por tal motivo, se decidio mantener los string de la base de datos en mayusculas sostenida y modificar el termino “apto” por “APARTAMENTO”
library(dplyr)
viviendas2$barrio <- iconv(viviendas2$barrio, to = "UTF-8", sub = "byte")
viviendas2 <- viviendas2 %>%
mutate_if(is.character, toupper)
viviendas2$tipo<- ifelse(viviendas2$tipo=='CASA','CASA','APARTAMENTO')
Se verifica nuevamente el estado de las variables, comprobando los cambios realizados.
tipo2 <- table (viviendas2$tipo)
print(names(tipo2))
## [1] "APARTAMENTO" "CASA"
viviendas2a <- viviendas2
viviendas2$longitud <- ifelse(viviendas2$longitud < -1000, viviendas2$longitud/1000, viviendas2$longitud)
viviendas2$latitud <- ifelse(viviendas2$latitud > 100, viviendas2$latitud/1000, viviendas2$latitud)
Se verificó nuevamente el estado de las variables, comprobando los cambios realizados. la distribucion de los datos corresponden al comportamiento esperado
library(ggplot2)
library(gridExtra)
datos <- data.frame(id= viviendas2$id, latitud_original = viviendas2a$latitud, longitud_original =viviendas2a$longitud,latitud_corregida = viviendas2$latitud, longitud_corregida =viviendas2$longitud)
plot_original <- ggplot(datos, aes(x = latitud_original, y = longitud_original)) +
geom_point(color = "blue", size = 3, alpha = 0.7, shape = 16) +
labs(title = "Coordenadas Originales",
x = "Latitud",
y = "Longitud") +
theme_minimal()
plot_corregido <- ggplot(datos, aes(x = latitud_corregida, y = longitud_corregida)) +
geom_point(color = "red", size = 3, alpha = 0.7, shape = 1) +
labs(title = "Coordenadas Corregidas",
x = "Latitud",
y = "Longitud") +
theme_minimal()
grid.arrange(plot_original, plot_corregido, ncol = 2)
Se realizó una revisión de datos duplicados
datosduplicados<- viviendas2[duplicated(viviendas2),]
print(datosduplicados)
## id zona piso estrato preciom areaconst parquea banos habitac
## 8323 8309 ZONA OESTE 5 4 150 56 NA 1 2
## 8324 8310 ZONA OESTE 1 6 1600 463 4 6 3
## 8325 8313 ZONA OESTE 7 6 525 137 2 3 3
## 8326 8314 ZONA OESTE 7 6 1400 210 3 4 3
## 8327 8315 ZONA OESTE NA 6 620 167 2 4 4
## 8328 8316 ZONA NORTE 7 5 400 220 1 4 4
## 8329 8317 ZONA OESTE NA 6 1100 290 4 4 3
## 8330 8318 ZONA NORTE NA 4 580 295 2 5 5
## tipo barrio longitud latitud
## 8323 APARTAMENTO AGUACATAL -76.57049 3.45445
## 8324 APARTAMENTO SANTA RITA -76.57076 3.45332
## 8325 APARTAMENTO NORMANDÍA -76.57941 3.45531
## 8326 APARTAMENTO NORMANDÍA -76.57941 3.45531
## 8327 APARTAMENTO NORMANDÍA -76.58530 3.45971
## 8328 APARTAMENTO GRANADA -76.58732 3.46148
## 8329 APARTAMENTO NORMANDÍA -76.58744 3.46124
## 8330 CASA LA FLORA -76.58876 3.46348
Se eliminaron dichos elementos para reducir el ruido de la base de datos, se consideró que no afectar la calidad de los datos.
viviendas3 <- viviendas2[!duplicated(viviendas2),]
nrow(viviendas3[duplicated(viviendas3),])
## [1] 0
A continuacion un mapa con la base de datos de viviendas.
library(leaflet)
# Coordenadas del centro de Cali
lat_cali <- 3.4516
long_cali <- -76.5320
# Crear un mapa con zoom en Cali
map <- leaflet(viviendas3) %>%
addTiles() %>%
addMarkers(
lng = ~longitud,
lat = ~latitud,
popup = ~paste("ID:", id,
"<br>Zona:", enc2utf8(zona),
"<br>Tipo:", enc2utf8(tipo),
"<br>Piso:", piso,
"<br>Estrato:", estrato,
"<br>Habitaciones:", habitac,
"<br>Baños:", banos,
"<br>Parqueadero:", parquea,
"<br>Área construida:", areaconst),
clusterOptions = markerClusterOptions()
) %>%
setView(lng = long_cali, lat = lat_cali, zoom = 12)
map
A continuacion se realizara un analisis univariados para cada varaible de la base de datos, con el objetivo de resaltar las tendencias del mercado de viviendas en Cali.
zona <- table (viviendas3$zona)
total_zona <- sum(zona)
porcentajezona <- prop.table(zona)*100
tablaresumzona<- data.frame(Porcentaje=porcentajezona, Cantidad=as.integer(zona))
colnames(tablaresumzona) <- c("Zona", "Porcentaje","Cantidad")
print(tablaresumzona, row.names = FALSE)
## Zona Porcentaje Cantidad
## ZONA CENTRO 1.490564 124
## ZONA NORTE 23.079697 1920
## ZONA OESTE 14.400769 1198
## ZONA ORIENTE 4.219257 351
## ZONA SUR 56.809713 4726
pie(zona, labels = paste(names(zona), "\n", round(porcentajezona, 1),"%"), main = "Distribucion de preferencia de zonas urbanas Cali")
De acuerdo con la informacion anterior se concluye:
La zona con mayor oferta de viviendas en Cali es la zona sur, representando más de la mitad del total con un 56.6%. seguido por la zona norte abarcando un 23.0% de las viviendas.
Las zonas oeste y oriente, aunque con una participación menor, aún tienen una participacion del 18.6%
La zona centro, tiene la menor cantidad de viviendas y contribuye en un 1.5.% al panorama general de la distribución urbana de la ciudad.
A continuacion se muestra la distribucion de viviendas por zonas de la ciudad de Cali.
library(ggplot2)
ggplot(viviendas3, aes(x = longitud, y = latitud, color = zona)) +
geom_point() +
labs(title = "Distribución de Viviendas por Zona",
x = "Longitud", y = "Latitud",
color = "Zona") +
theme_minimal()
De acuerdo con el mapa anterior, seria adecuado hacer una revision de la base de datos y la clasificacion por zonas, debido a que se logra identificar viviendas que no corresponden con los sectores definidos.
estrato <- table (viviendas3$estrato)
total_estrato<- sum(estrato)
porcentajestrato <- prop.table(estrato)*100
tablaresumestrato<- data.frame(Porcentaje=porcentajestrato, Cantidad= as.integer(estrato))
colnames(tablaresumestrato) <- c("Estrato", "Porcentaje","Cantidad")
print(tablaresumestrato, row.names = FALSE)
## Estrato Porcentaje Cantidad
## 3 17.46604 1453
## 4 25.59202 2129
## 5 33.05686 2750
## 6 23.88508 1987
pie(estrato, labels = paste(names(estrato), "\n", round(porcentajestrato, 1),"%"), main = "Distribucion de preferencia de estratos Cali")
La mayoría de las viviendas se encuentran en los estratos 4 y 5, representando aproximadamente el 58.4% de las viviendas en total, lo que indica una preferencia por los estratos medio-alto.
total_tipo <- sum(tipo2)
porcentajestipo2<- prop.table(tipo2)*100
tablaresumetipo2<- data.frame(Porcentaje=porcentajestipo2, Cantidad=as.integer(tipo2))
colnames(tablaresumetipo2) <- c("Tipo", "Porcentaje","Cantidad")
print(tablaresumetipo2, row.names = FALSE)
## Tipo Porcentaje Cantidad
## APARTAMENTO 61.3186 5106
## CASA 38.6814 3221
pie(tipo2, labels = paste(names(tipo2), "\n", round(porcentajestipo2, 1),"%"), main = "Distribucion de preferencia de tipo de inmueble Cali")
De acuerdo con la informacion anterior se tiene:
La mayoría de las viviendas tipo “APARTAMENTO”, con un total de 5,099 registros. Esto representa aproximadamente el 61.3% de todas las viviendas analizadas.
Las viviendas tipo “CASA”, con un total de 3,220 registros. Esto representa aproximadamente el 38.7% de todas las viviendas analizadas
Esta distribución sugiere una preferencia general hacia los apartamentos en la ciudad de Cali, ya que representan la mayoría de las viviendas en el conjunto de datos. Sin embargo, las casas también tienen una presencia notable, lo que sugiere una diversidad de opciones de vivienda en la ciudad.
La preferencia por los apartamentos puede deberse a factores urbanos y de densidad poblacional que hacen que las viviendas en forma de apartamentos sean una opción más viable en áreas urbanas. Los apartamentos generalmente ocupan menos espacio en comparación con las casas unifamiliares, lo que permite aprovechar mejor el terreno disponible en zonas urbanas densas.
precio <- data.frame(preciom=viviendas3$preciom)
summary(viviendas3$preciom)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 58.0 220.0 330.0 433.9 540.0 1999.0
boxplot(viviendas3$preciom, main = "Distribución de Precios de Viviendas en Cali")
De acuerdo con la informacion anterior se tiene:
El precio mínimo de una vivienda es de $58,000, lo cual indica que hay opciones más asequibles en el mercado.
El primer cuartil (25% de los datos) se sitúa en $220,000, lo que significa que la mayoría de las viviendas tienen un precio superior a esta cifra.
El tercer cuartil (75% de los datos) es de $540,000, mostrando que un 25% de las viviendas tienen precios aún más elevados.
Regularmente los precios de las viviendas en Cali se situan entre $220,000 (primer cuatil ) y $ 540,000 (tercer cuartil)
La mediana, que es el valor que se encuentra justo en el medio de la distribución, es de $330,000. Esto implica que la mitad de las viviendas tienen un precio por debajo de este valor y la otra mitad por encima.
El precio promedio (media) de las viviendas es de $433,900, lo que indica que hay algunas viviendas con precios más altos que afectan ligeramente el valor promedio.
El precio máximo registrado es de $1,999,000, lo cual indica que hay algunas viviendas de lujo con precios significativamente superiores al promedio
hist_mconstruido <- hist(viviendas3$areaconst, main="Histograma de los metros construidos", xlab = "metros construidos", ylab = "Cantidad")
Observamos que la forma de la distribución es asimétrica y sesgada hacia la derecha, donde, La mayoría de las viviendas tienen áreas construidas relativamente moderados, ya que los intervalos más bajos (0-300 metros cuadrados) tienen las frecuencias más altas. A medida que avanzamos hacia los intervalos superiores, la frecuencia disminuye gradualmente, lo que indica que las viviendas con áreas extremadamente grandes son poco comunes en Cali. Esto es consistente con una distribución típica de bienes raíces, donde la mayoría de las propiedades son de tamaño moderado, mientras que las propiedades más grandes son menos comunes.
habitaciones <- table(viviendas3$habitac)
total_habitaciones <- sum(habitaciones)
porcentaje_habitaciones <- prop.table(habitaciones) * 100
tablaresumhabita <- data.frame(Porcentaje = porcentaje_habitaciones ,Cantidad = as.integer(habitaciones))
colnames(tablaresumhabita) <- c("Habitaciones", "Porcentaje", "Cantidad")
print(tablaresumhabita, row.names = FALSE)
## Habitaciones Porcentaje Cantidad
## 0 0.7933646 66
## 1 0.7092199 59
## 2 11.1311456 926
## 3 49.2487078 4097
## 4 20.7837480 1729
## 5 8.1620387 679
## 6 3.8225748 318
## 7 2.0795769 173
## 8 1.6588532 138
## 9 0.9977161 83
## 10 0.6130545 51
barplot(habitaciones, main = "Distribución de Habitaciones en Viviendas de Cali")
A continuacion se presenta la distribución de las habitaciones en las viviendas de Cali:
La mayoría de las viviendas en Cali cuentan con un número de habitaciones que oscila entre 2 y 4. Lo que sugiere una tendencia hacia hogares con un tamaño moderado.
A medida que el número de habitaciones aumenta, la frecuencia disminuye progresivamente, esto indica que las viviendas con un mayor número de habitaciones son menos comunes.
Cabe mencionar que un número reducido de viviendas tiene 0 (66 viviendas) o 1 (59 viviendas) habitaciones, estas viviendas podrían ser departamentos o propiedades destinadas a usos específicos, como oficinas o establecimientos comerciales.
banos <- table(viviendas3$banos)
total_banos <- sum(banos)
porcentaje_banos <- prop.table(banos) * 100
tablaresumbanos <- data.frame(Porcentaje = porcentaje_banos ,Cantidad = as.integer(banos))
colnames(tablaresumbanos) <- c("Banos", "Porcentaje", "Cantidad")
print(tablaresumbanos, row.names = FALSE)
## Banos Porcentaje Cantidad
## 0 0.5409304 45
## 1 5.9622551 496
## 2 35.4129102 2946
## 3 23.9572064 1993
## 4 17.5021036 1456
## 5 10.6984013 890
## 6 3.7744921 314
## 7 1.2862123 107
## 8 0.5769924 48
## 9 0.1803101 15
## 10 0.1081861 9
barplot(banos, main = "Distribución de banos en Viviendas de Cali")
Esta información nos brinda una idea de cómo están distribuidos los baños en las viviendas de Cali, lo que puede ser útil para entender las preferencias y necesidades de los residentes en términos de comodidades en sus hogares. Observamos lo siguiente:
La mayoría de las viviendas tienen 2 baños (35.41%), seguido por 3 baños (23.96%) y 4 baños (17.50%).
A medida que aumenta la cantidad de baños, el porcentaje disminuye gradualmente, lo que sugiere que las viviendas con más de 5 baños son menos comunes en el mercado inmobiliario de Cali
Las viviendas con 0 baños representan un porcentaje bajo (0.54%), estas viviendas podrían ser habitaciones o departamentos con baños externos compartidos, sin embargo seria bueno verificar esta informacion .
parqueo <- table(viviendas3$parquea)
total_parqueo <- sum(parqueo)
porcentaje_parqueo <- prop.table(parqueo) * 100
tablaresumparqueo <- data.frame(Porcentaje = porcentaje_parqueo ,Cantidad = as.integer(parqueo))
colnames(tablaresumparqueo) <- c("Parqueaderos", "Porcentaje", "Cantidad")
print(tablaresumparqueo, row.names = FALSE)
## Parqueaderos Porcentaje Cantidad
## 1 46.97037368 3155
## 2 36.84680661 2475
## 3 7.74155129 520
## 4 5.71683787 384
## 5 1.01235671 68
## 6 1.01235671 68
## 7 0.26797678 18
## 8 0.25308918 17
## 9 0.05955039 4
## 10 0.11910079 8
barplot(parqueo, main = "Distribución de Parqueo en Viviendas de Cali")
La distribución de los números de parqueaderos en las viviendas de Cali ofrece una visión de cómo las propiedades en esta ciudad están equipadas para el estacionamiento de vehículos. A continuación, se presenta un análisis de los datos:
La mayoría de las propiedades tienen uno o dos parqueaderos, lo que abarca aproximadamente el 83.82% de las viviendas, sin embargo, una proporcion significativa del alrededor del 14.78% tienen tres o más parqueadero.
Las viviendas con una cantidad mayor de parqueaderos, como cinco, seis, siete u ocho indica propiedades más grandes o con espacios adicionales destinados al estacionamiento, lo que podría ser atractivo para familias con varios vehículos.
Algunas viviendas tienen no cuenta con parqueaderos reportados, lo que podria significar ausencia de estos, sin embargo como recomendacion se deja la verificacion de la informacion, ya que esto podría reflejar una limitación en el espacio disponible o en las regulaciones de construcción en ciertas áreas de la ciudad.
En resumen, la distribución de los números de parqueaderos en las viviendas de Cali refleja la diversidad de opciones disponibles para los residentes en términos de estacionamiento. Esta variedad puede ser un factor importante para las personas que buscan una propiedad que se adapte a sus necesidades específicas de estacionamiento, ya sea para uno o varios vehículos.
barrios <- table(viviendas3$barrio)
total_barrios <- sum(barrios)
porcentajesbarrios <- prop.table(barrios)*100
barriosordenados <- sort(barrios, decreasing = TRUE)
barrios_mas_representativos <- head(barriosordenados, 10)
porcentajebarriosrepresentativos <- prop.table(barrios_mas_representativos)*100
barrios_nombres <- names(barrios_mas_representativos)
cantidad_barrios <- as.integer(barrios[barrios_nombres])
tablaresumbarrios <- data.frame(Porcentaje=porcentajebarriosrepresentativos,
Cantidad = cantidad_barrios)
colnames(tablaresumbarrios) <- c("Barrios", "Porcentaje","Cantidad")
print(tablaresumbarrios, row.names = FALSE)
## Barrios Porcentaje Cantidad
## VALLE DEL LILI 29.161850 1009
## CIUDAD JARDÍN 14.971098 518
## PANCE 11.907514 412
## LA FLORA 10.635838 368
## SANTA TERESITA 7.601156 263
## EL CANEY 6.040462 209
## EL INGENIO 5.867052 203
## LA HACIENDA 4.797688 166
## ACOPI 4.566474 158
## LOS CRISTALES 4.450867 154
Los barrios con mayor disponibilidad de viviendas en la ciudad de Cali son:
Valle del Lili: Este barrio representa aproximadamente el 29.16% de las viviendas disponibles en Cali, con un total de 1009 viviendas. Es un área residencial destacada por su ubicación estratégica y la variedad de opciones de vivienda.
Ciudad Jardín: Con alrededor del 14.97% de las viviendas disponibles (518 viviendas), Ciudad Jardín es otra zona prominente en términos de oferta de viviendas. Su popularidad puede deberse a su ambiente tranquilo y su proximidad a servicios y comercios.
Pance: Ocupando el 11.91% de las viviendas (412 viviendas), Pance es conocido por su entorno natural y atractivo paisaje. Esta ubicación podría ser atractiva para aquellos que buscan viviendas cerca de áreas verdes y recreativas.
La Flora: Con una participación del 10.64% (368 viviendas), La Flora es otro barrio destacado en el mercado de viviendas. Sus características y servicios podrían estar atrayendo a aquellos que buscan una ubicación conveniente y variada.
Santa Teresita: Representando el 7.60% de las viviendas (263 viviendas), Santa Teresita es una opción popular en el mercado. Su accesibilidad y posibles comodidades cercanas podrían influir en su alta disponibilidad.
En resumen, estos barrios destacados representan una parte significativa de las viviendas disponibles en Cali y podrían ser opciones atractivas para diversos tipos de compradores en función de sus preferencias y necesidades específicas.
#CASA
vivienda_casa <- viviendas3[viviendas3$tipo == "CASA", ]
tabla_resumen_casa <- table(vivienda_casa$piso)
porcentaje_pisos_casa <- prop.table(tabla_resumen_casa) * 100
vivienda_apartamento <- viviendas3[viviendas3$tipo == "APARTAMENTO", ]
tabla_resumen_apartamento <- table(vivienda_apartamento$piso)
porcentaje_pisos_apartamento <- prop.table(tabla_resumen_apartamento) * 100
barplot(tabla_resumen_casa,
col = "skyblue",
main = "Distribución de Pisos en Viviendas de Cali (CASA)",
xlab = "Piso",
ylab = "Cantidad")
print("Tabla de Resumen para Viviendas CASA")
## [1] "Tabla de Resumen para Viviendas CASA"
tabla_resumen_casa
##
## 1 2 3 4 5 6 7 10
## 430 938 524 62 4 2 4 2
barplot(tabla_resumen_apartamento,
col = "salmon",
main = "Distribución de Pisos en Viviendas de Cali (APARTAMENTO)",
xlab = "Piso",
ylab = "Cantidad")
print("Tabla de Resumen para Viviendas APARTAMENTO")
## [1] "Tabla de Resumen para Viviendas APARTAMENTO"
tabla_resumen_apartamento
##
## 1 2 3 4 5 6 7 8 9 10 11 12
## 430 512 573 545 563 243 200 211 146 128 84 83
La mayoría de las viviendas tipo casa cuentan entre 1 y 3 pisos, siendo las casas de doble nivel las mas frecuentes.
El aumento y la disminución en la cantidad de viviendas por piso pueden estar relacionados con las preferencias de los compradores y la disponibilidad de unidades en diferentes niveles. Se observa una preferencia por alturas moderadas (pisos 1al 5)
Hay datos que se deben revisar, por ejemplo, una casa con 10 pisos a que hace referencia.
Los valores de ID no se analizaron, debido a que estos no representan caracteristicas de las vivivendas de Cali, Igualmente los valores de latitud y longitud se utilizaron dentro del analisis de las zonas, mas no como un atributo independiente.
De acuerdo con los resultados previos, se decide analizar las relaciones de entre variables, con el fin de determinar modelos de viviendas de la ciudad de Cali de acuerdo con su estrato, esto debido a que la clasificacion por zonas no es clara, como se menciono anteriormente, se identificaron viviendas en zonas que no correspondian.
A continuacion, analizara las dinamicas del mercado inmobiliario de la ciudad de cali:
barplot(table(viviendas3$tipo, viviendas3$estrato), main="Distribucion de tipo de vivienda segun estrato", xlab="Estratos")
En el grafico anterior el gris oscuro corresponde a las viviendas tipo casa y el gris claro corresponde a las viviendas tipo apartamento. De acuerdo con la grafica, se logra identificar la preferencia por las casas en vez de los apartamentos a medida que el estrato socioeconomico es mayor. Para las caracteristicas internas, se realizo el siguiente grafico.
library(corrplot)
correlation_matrix <- cor(viviendas3[, c("habitac", "banos", "areaconst","preciom", "estrato")])
corrplot(correlation_matrix, method = "color")
correlation_table <- as.table(correlation_matrix)
print(correlation_table)
## habitac banos areaconst preciom estrato
## habitac 1.00000000 0.58990641 0.51691292 0.26409121 -0.07137615
## banos 0.58990641 1.00000000 0.64841648 0.66914558 0.42032178
## areaconst 0.51691292 0.64841648 1.00000000 0.68735196 0.27432332
## preciom 0.26409121 0.66914558 0.68735196 1.00000000 0.60980664
## estrato -0.07137615 0.42032178 0.27432332 0.60980664 1.00000000
De acuerdo con el analisis de correlacion se tiene:
habitac vs. banos: Existe una correlación positiva significativa de aproximadamente 0.59 entre el número de habitaciones (habitac) y el número de baños (banos). Esto sugiere que las casas con más habitaciones tienden a tener más baños y viceversa.
habitac vs. areaconst: Hay una correlación positiva moderada de alrededor de 0.52 entre el número de habitaciones (habitac) y el área construida (areaconst) de las viviendas. Esto indica que las casas más grandes en términos de área construida tienden a tener más habitaciones.
habitac vs. preciom: La correlación entre el número de habitaciones (habitac) y el precio de la vivienda (preciom) es relativamente baja (aproximadamente 0.26). Esto sugiere que la cantidad de habitaciones no está fuertemente relacionada con el precio de la vivienda.
habitac vs. estrato: La correlación entre el número de habitaciones (habitac) y el estrato es negativa pero muy cercana a cero. Esto implica que no hay una relación significativa entre estas dos variables.
banos vs. areaconst: Existe una correlación positiva considerable de alrededor de 0.65 entre el número de baños (banos) y el área construida (areaconst) de las viviendas. Esto sugiere que las casas más grandes tienden a tener más baños.
banos vs. preciom: Hay una correlación positiva sólida de aproximadamente 0.67 entre el número de baños (banos) y el precio de la vivienda (preciom). Esto indica que las viviendas con más baños tienden a tener un precio más alto.
banos vs. estrato: Existe una correlación positiva moderada de alrededor de 0.42 entre el número de baños (banos) y el estrato de las viviendas. Las viviendas con más baños tienden a tener un estrato ligeramente más alto.
areaconst vs. preciom: Hay una correlación positiva significativa de aproximadamente 0.69 entre el área construida (areaconst) y el precio de la vivienda (preciom). Esto sugiere que las viviendas más grandes tienden a tener un precio más alto.
areaconst vs. estrato: Existe una correlación positiva moderada de alrededor de 0.27 entre el área construida (areaconst) y el estrato de las viviendas. Las viviendas más grandes tienden a tener un estrato ligeramente más alto.
preciom vs. estrato: Hay una correlación positiva sólida de aproximadamente 0.61 entre el precio de la vivienda (preciom) y el estrato. Esto indica que las viviendas con un estrato más alto tienden a tener un precio más alto.
De acuerdo con lo anterior la varaiable clave seria el area de construccion, ya que la cantiadad de habitaciones y baños estan relacionados con esta. Por tal razon se plantean el siguiente analisis “Area de construccion vs. precio segun el tipo de vivienda en cada estrato”
par(mfrow = c(1, 2))
boxplot(preciom ~ estrato, data = viviendas3[viviendas3$tipo == "CASA", ],
main = "Precio de casas por estrato - casa",
xlab = "Estratos", ylab = "Precio")
boxplot(preciom ~ estrato, data = viviendas3[viviendas3$tipo == "APARTAMENTO", ],
main = "Precio de apartamentos por estrato - apartamento",
xlab = "Estratos", ylab = "Precio")
par(mfrow = c(1, 1))
par(mfrow = c(1, 2))
boxplot(areaconst ~ estrato, data = viviendas3[viviendas3$tipo == "CASA", ],
main = "Precio de casas por estrato - casa",
xlab = "Estratos", ylab = "Precio")
boxplot(areaconst~ estrato, data = viviendas3[viviendas3$tipo == "APARTAMENTO", ],
main = "Precio de apartamentos por estrato - apartamento",
xlab = "Estratos", ylab = "Precio")
par(mfrow = c(1, 1))
library(ggplot2)
viviendastipo <- split(viviendas3, f=viviendas3$tipo)
#CASA
ggplot(viviendastipo[["CASA"]], aes(x = areaconst, y = preciom)) +
geom_point() +
facet_wrap(~ estrato) +
stat_smooth(method = "loess", formula = y ~ x) +
scale_x_continuous(labels = scales::number_format(scale = 1, accuracy = 1, big.mark = ",")) +
scale_y_continuous(labels = scales::number_format(scale = 1, accuracy = 1, big.mark = ","))+
labs(title = "Relacion entre area Construida y Precio de Viviendas (Tipo: Casa)")
#APARTAMENTO
ggplot(viviendastipo[["APARTAMENTO"]], aes(x = areaconst, y = preciom)) +
geom_point() +
facet_wrap(~ estrato) +
stat_smooth(method = "loess", formula = y ~ x) +
scale_x_continuous(labels = scales::number_format(scale = 1, accuracy = 1, big.mark = ",")) +
scale_y_continuous(labels = scales::number_format(scale = 1, accuracy = 1, big.mark = ","))+
labs(title = "Relacion entre area Construida y Precio de Viviendas (Tipo: Apartamento)")
De acuerdo con todo el analisis planteado:
Se destaca la necesidad de un análisis minucioso de los valores faltantes en las variables de piso y parqueadero, los cuales representan un porcentaje significativo de la muestra, afectando la calidad de la descripcion estadistica realizada.
Se destaca la necesidad de una verificacion de la base sumisntrada debido a inconsistencias logicas en los datos suministrados, como la presencia viviendas sin habitaciones o viviendas sin baños, lo cual por normativa no es preciso. Este tipo de datos impactan en la adecuada caracterización de las viviendas.
No se tuvo en cuenta las zonas de las viviendas durante el analisis realizado, debido a las inconsistencias halladas en su distribucion, sin embargo, la zona sur cuenta con mas del 56% de la oferta de viviendas en Cali. Por tal motivo se recomienda a B&C ubicarse en este sector de la ciudad de Cali, con el fin de tener acceso rapido a la mayoria de las propiedades.
La base de datos suminstrada por la compañia B&C muestra un distribucion del mercado de vivienda de Cali en los estratos 3, 4, 5 y 6. Por tal motivo se recomienda a B&C enfocarase en residenciales de estratos medios-altos. Este nicho incluye a compradores que buscan propiedades de alta calidad, diseño y comodidades, con un rango de precios que refleje el valor agregado de estas características.
Las viviendas con mayor area construidas tienden a tener un estrato mayor, en el mercado de Cali, el area construida es mayor en las viviendas tipo casa y a su vez son mas frecuentes estas (casas) en los estratos mas altos.
Las viviendas con mayor area construidas tienden a tener mayor numero de habitaciones y baños, por ende, los precios son mayores. El mercado inmobiliario de cali se caracteriza en su mayoria por viviendas tipo apartamento con areas construida del alrededor del 30 - 300 metros cuadrados, con 2 a 4 habitaciones, 2 a 3 baños y 1 a 2 parqueadero. Estos rangos de atributos también reflejan la adaptabilidad de las viviendas a diferentes tamaños de familias y necesidades.
Los precios de las viviendas en cali se encuentran relacionados con las caracteristicas internas de las viviendas, predominando el area construida y el estrato .
El precio de venta de una vivienda se ve afectado por las caracteristicas de esta, por tal motivo se le recomienda a B&C implementar como estrategia de venta, la comision, esta representa un porcentaje del precio de venta del inmueble, la cual oscila entre el 5% y 6% del precio de venta del inmueble. Teniendo en cuenta que los precios del mercado de cali se encuentran entre 220 y 540 millones de pesos, la comision por venta de inmuebles estaria alrededor de 11 al 32.4 millones de pesos.
Teniendo en cuenta que el nicho es un familia promedio con ingresos superiores a los 7 millones de pesos mensuales que buscan ubicaciones estrategicas, comodidad y lujo, se recomienda estrategias de marketing para B&C se recomienda:
Posicionamiento en Línea: Desarrollar un sitio web atractivo y fácil de usar que muestre el portafolio de propiedades disponible, con descripciones detalladas, fotografías de alta calidad y herramientas de búsqueda interactivas. Implementar estrategias de SEO para asegurar una alta visibilidad en los resultados de búsqueda en línea.
Contenido Relevante: Crear contenido informativo y útil relacionado con el mercado inmobiliario en Cali, consejos para compradores y vendedores, tendencias de diseño de interiores, etc. Este contenido se puede compartir a través de las redes sociales para atraer y comprometer a la audiencia.
Publicidad Segmentada: Utilizar anuncios en línea en plataformas como Google Ads y redes sociales para llegar a clientes potenciales en la zona sur de Cali que se ajusten al perfil del nicho de mercado definido.
Eventos y Ferias: Participar en ferias de bienes raíces locales y eventos relacionados con la vivienda para establecer la presencia de B&C en la comunidad y establecer conexiones directas con posibles clientes.
Alianzas Estratégicas: Colaborar con empresas relacionadas, como instituciones financieras y firmas de diseño de interiores, para ofrecer beneficios adicionales a los clientes y ampliar el alcance de la marca.
Asesoría. B&C brindará asesoramiento individualizado a cada cliente, comprendiendo sus necesidades y preferencias específicas para ayudarles a encontrar la propiedad adecuada.
Recorridos y Visitas: Organizar visitas a las propiedades con atención a los detalles y destacando las características que más se ajusten a las necesidades del cliente.
Asistencia en Negociaciones: B&C representará a sus clientes en las negociaciones de compra, utilizando su experiencia para lograr acuerdos favorables.
Servicios Post-Venta: Brindar apoyo después de la compra, ayudando con la coordinación de trámites legales y proporcionando recomendaciones para la personalización y mejora de la propiedad.
En el proceso de análisis de los datos presentados, se procedió a una exhaustiva revisión de la información proporcionada por la empresa B&C. Es importante resaltar que, con el fin de preservar la integridad y confiabilidad de los datos, no se realizaron modificaciones directas en la base de datos suministrada. Sin embargo, las inconsistencias y faltantes en los datos, requieren una revisión y corrección para lograr una descripción estadística completa, confiable y efectiva que respalden las decisiones y estrategias futuras.
El mercado de viviendas en Cali se presenta como una opción completa y adecuada para satisfacer las necesidades y requerimientos de una familia promedio. Con una amplia variedad de propiedades disponibles, desde apartamentos hasta casas. Además, la ciudad ofrece una infraestructura en constante desarrollo que brinda comodidades y servicios que complementan la experiencia de vida de sus habitantes. El crecimiento continuo en la oferta de viviendas en Cali refleja una adaptación a las cambiantes dinámicas familiares y estilos de vida, lo que permite a las familias encontrar el espacio que mejor se ajuste a sus necesidades. Los diversos rangos de precios también hacen que el mercado sea inclusivo y accesible para diferentes grupos demográficos.