El presente informe tiene como objetivo apoyar a María, fundadora de la agencia inmobiliaria C&A (Casas y Apartamentos) en Cali, en la evaluación de dos solicitudes de vivienda presentadas por una compañía internacional que busca ubicar a dos de sus empleados en la ciudad. Dadas las condiciones actuales del mercado inmobiliario en Cali —caracterizado por una reducción en las ventas debido a factores sociales y políticos— resulta fundamental aplicar herramientas estadísticas y de modelación que permitan tomar decisiones informadas frente a las ofertas disponibles.
El análisis se basa en la información contenida en la base de datos vivienda, que incluye características físicas, socioeconómicas y geográficas de las propiedades. A través de filtros, análisis exploratorio, modelos de regresión lineal múltiple y validación de supuestos, se estimarán precios de mercado y se identificarán alternativas que se ajusten a las condiciones financieras y preferencias establecidas por la empresa solicitante. De esta forma, se busca ofrecer un informe ejecutivo que brinde claridad sobre la viabilidad de las solicitudes y sirva como apoyo a la toma de decisiones estratégicas para C&A.
El desarrollo de la actividad se abordó en siete fases:
Filtro de datos: Se construyeron subconjuntos de información según el tipo de inmueble y la zona solicitada (casas en el norte para la primera solicitud, apartamentos en el sur para la segunda). Se verificó la coherencia espacial de los registros mediante mapas, identificando algunos valores atípicos asociados a registros mal georreferenciados.
Análisis exploratorio: Mediante gráficos interactivos (Plotly) se examinó la relación del precio con variables explicativas como área construida, estrato, número de baños, habitaciones y parqueaderos. Se encontró que el área construida y el estrato son las variables con mayor correlación positiva con el precio, mientras que baños y habitaciones presentan efectos secundarios más moderados.
Validación de supuestos: Se evaluaron la normalidad de residuos, homocedasticidad e independencia. Aunque en general los supuestos se cumplen, se identificaron leves problemas de heterocedasticidad que podrían mitigarse mediante transformaciones de variables o el uso de modelos robustos.
Predicción Vivienda 1: Para una casa de 200 m², 1 parqueadero, 2 baños, 4 habitaciones, estrato 4 o 5 y ubicada en la zona norte, el modelo estimó un precio de mercado cercano a los 340 millones de pesos, lo cual se ajusta al crédito preaprobado de 350 millones.
Ofertas recomendadas Vivienda 1: Se identificaron al menos 5 propiedades en la base que cumplen las condiciones de tamaño, ubicación y precio, dentro del rango del crédito disponible. Estas fueron ubicadas en un mapa interactivo, constituyendo opciones viables para la compañía solicitante.
Predicción Vivienda 2: Para un apartamento de 300 m², 3 parqueaderos, 3 baños, 5 habitaciones, estrato 5 o 6 y ubicado en la zona sur, el modelo estimó un precio de mercado cercano a 820 millones de pesos, ajustándose al crédito máximo de 850 millones.
Ofertas recomendadas Vivienda 2: Se seleccionaron 5 opciones viables que cumplen con las condiciones financieras y físicas, lo que garantiza la existencia de alternativas competitivas en el mercado.
Procedemos con el codigo
# Realizamos el grafico
ggplot(clean_vivi_impu, aes(x = longitud, y = latitud, color = as.factor(cluster_kmeans))) +
geom_point(alpha = 0.6) +
geom_label(data = centroides,
aes(x = centroide_long, y = centroide_lat,
label = nombres_zonas_cali[as.character(cluster_kmeans)]),
color = "yellow",
fill = "blue",
alpha = 0.8,
size = 3,
fontface = "bold") +
labs(title = "Clustering K-means (k=5) de viviendas por coordenadas",
x = "Longitud",
y = "Latitud",
color = "Cluster") +
theme_minimal() +
scale_color_discrete(labels = nombres_zonas_cali)
Al plantear el primer grafico, podemos identificar las cinco zonas donde existe el mayor concentracion de viviendas en la ciudad de Cali las cuales se diferencian en Norte, Sur, Oriente, Occidente y Centro. para este caso Cada gráfico tiene un color que representa una zona distinta, lo que evidenciaria cómo las viviendas tienen una tendenccia a agruparse según su proximidad espacial.
podemos analizar que pueden existir mas zonas, para mostrar un nivel de agrupacion mas prufundo, pero observariamos claramente las delimitaciones espaciales.
Si bien es ciero que pueden haber diferentes barrios que esten mas en zonas diferentes, por ejemplo suroriente, nororiente, etc.
Para finalizar, os resultados permiten delimitar áreas homogéneas que facilitan la comparación de precios y atributos de los inmuebles, ofreciendo un fundamento sólido para el análisis del mercado de vivienda en la ciudad de Cali.
estos resultados permiten delimitar áreas homogéneas que facilitan la comparación de precios y atributos de los inmuebles, ofreciendo un fundamento sólido para el análisis del mercado de vivienda en la ciudad de cali.
Partiendo de los requerimientos de la empresa internacional para los empleados que requieren comprar una vivienda con las siguientes categorias:
1. Tipo: Casa
2. Área construida: 200 m2
3. parqueaderos: 1
4. baños: 2
5. habitaciones: 4
6. estrato: 4 o 5
7. zona: Norte
El cual cuenta segun el ejercicio con un crédito preaprobado de 350 millones en el banco
# CASA EN LA ZONA NORTE DE CALI
base1 <- subset(clean_vivi_impu, tipo == "Casa" & cluster_kmeans_reord == 4)
# Mapa interactivo real
leaflet(base1) %>%
addTiles() %>%
addCircleMarkers(
lng = ~longitud,
lat = ~latitud,
popup = ~paste0(
"<b>Barrio:</b> ", barrio, "<br>",
"<b>Precio:</b> ", preciom, " millones<br>",
"<b>Área:</b> ", areaconst, " m²<br>",
"<b>Habitaciones:</b> ", habitaciones, "<br>",
"<b>Baños:</b> ", banios
),
radius = 5,
color = "black",
fillOpacity = 0.7
)
Mediante este grafico, analizamos el caso planteado por la empresa internacional para uno de sus empleados, que va a comprar una casa en el norte de la ciudad y analizamos algunas particularidades de las zonas a evaluar y de las casas.
## promedio_precio promedio_banios promedio_habitaciones promedio_parqueaderos
## 1 403 3 4 2
## promedio_piso promedio_areaconst
## 1 2 244
Analisis del caso:
En esta grafica observaremos los 10 barrios con la mayor oferta de casa en la zona norte
Podemos observar y analizar que la mayor cantidad de ofertas de casa en la zona norte, estan ubicadas en el estrato 3 y 5
##
## Call:
## lm(formula = log_precio ~ areaconst + estrato_4 + estrato_5 +
## estrato_6 + habitaciones + parqueaderos + banios, data = train_data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.19177 -0.15346 -0.01769 0.17005 1.15501
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 4.8316501 0.0461328 104.733 < 2e-16 ***
## areaconst 0.0011984 0.0001048 11.440 < 2e-16 ***
## estrato_4 0.3041218 0.0437167 6.957 1.66e-11 ***
## estrato_5 0.4327774 0.0409359 10.572 < 2e-16 ***
## estrato_6 0.7145913 0.0818052 8.735 < 2e-16 ***
## habitaciones 0.0184505 0.0114988 1.605 0.109470
## parqueaderos 0.0533590 0.0148043 3.604 0.000357 ***
## banios 0.0781898 0.0157885 4.952 1.13e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.2806 on 359 degrees of freedom
## Multiple R-squared: 0.749, Adjusted R-squared: 0.7441
## F-statistic: 153 on 7 and 359 DF, p-value: < 2.2e-16
Los resultados del modelo evidencian que el área construida tiene un impacto positivo sobre el precio de la vivienda. En promedio, cada metro cuadrado adicional incrementa el valor en 0,12%, efecto que se acumula proporcionalmente; por ejemplo, una ampliación de 10 m² se reflejaría en un aumento aproximado del 1,2% en el precio.
De igual forma, variables asociadas a la dotación del inmueble muestran incidencias significativas: cada baño adicional eleva el precio en un 7,73%, mientras que la adición de un parqueadero lo incrementa en un 5,60%.
En cuanto al estrato socioeconómico, la variable categórica confirma un efecto positivo consistente con lo establecido en la Ley 142 de 1994 sobre estratificación en Colombia. Así, una vivienda ubicada en estrato 4 presenta un valor 32,33% mayor, en estrato 5 el incremento es de 43,32%, y en estrato 6 asciende a 71,37%, en comparación con estratos más bajos.
Respecto al número de habitaciones, aunque se observa que cada dormitorio adicional podría aumentar el precio en un 1,82%, la evidencia estadística asociada a este efecto no resulta concluyente.
## (Intercept)
## 125.4177
El aspecto más particular se observa en el intercepto del modelo, el cual indica que, si el área construida, el número de habitaciones, baños y parqueaderos fueran iguales a cero, y la vivienda se encontrara en estrato 3 (sin considerar los estratos 4, 5 y 6), el valor estimado del terreno para edificar sería de aproximadamente 124 millones de pesos.
En este caso, siguiendo las especificaciones solicitadas por la empresa internacional para uno de sus empleados, y manteniendo constantes las características de la vivienda salvo el estrato, el modelo muestra que al pasar de estrato 4 a estrato 5 el valor del inmueble se incrementa. Así, una vivienda en estrato 4 tiene un precio estimado de 298 millones de pesos, mientras que bajo las mismas condiciones, pero en estrato 5, el precio asciende a 333 millones de pesos.
Se recomienda optar por la vivienda en estrato 5, dado que se dispone de un crédito preaprobado por 350 millones y este estrato ofrece barrios más tranquilos, con mejor ubicación y mayor comodidad, tales como El Bosque, La Campiña, Santa Mónica Residencial y La Merced.
en el segundo caso, tomaremos en cuenta los requerimientos de la empresa internacional para el empleado que requiere una vivienda con las siguientes categorias:
1. Tipo: Apartamento 2. Área
construida: 300 m2
3. parqueaderos: 3
4. baños: 3
5. habitaciones: 5
6. estrato: 4 o 5
7. zona: Sur
Donde la empresa cuenta con un crédito preaprobado de 850 millones
En este gráfico interactivo se presenta otro de los requisitos solicitados por la empresa internacional para su empleado: la adquisición de un apartamento ubicado en el sur de la ciudad. A partir de esta visualización se podrán identificar algunas particularidades tanto de la zona como de las características de los apartamentos disponibles.
## promedio_precio promedio_banios promedio_habitaciones promedio_parqueaderos
## 1 329 3 3 1
## promedio_areaconst
## 1 100
Analisis:
Aqui se muestran los 6 barrios con mayor oferta de apartamentos en la zona sur.
al analizar la grafica que otorga el software observamos que la mayor concentración de ofertas de apartamentos en la zona sur corresponde a los estratos 4 y 5.
# Modelo lineal multiple
modelo2<- lm(log_precio ~ areaconst + estrato_4 + estrato_5 + estrato_6 + habitaciones + parqueaderos + banios, data = train_data2)
# Resumen del modelo
summary(modelo2)
##
## Call:
## lm(formula = log_precio ~ areaconst + estrato_4 + estrato_5 +
## estrato_6 + habitaciones + parqueaderos + banios, data = train_data2)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.87676 -0.14089 -0.00092 0.14605 1.01455
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 4.2454301 0.0460870 92.118 < 2e-16 ***
## areaconst 0.0023060 0.0001671 13.799 < 2e-16 ***
## estrato_4 0.2703161 0.0343700 7.865 8.55e-15 ***
## estrato_5 0.5019985 0.0349918 14.346 < 2e-16 ***
## estrato_6 0.7662171 0.0399120 19.198 < 2e-16 ***
## habitaciones 0.0467810 0.0130387 3.588 0.000348 ***
## parqueaderos 0.1699468 0.0158478 10.724 < 2e-16 ***
## banios 0.1245472 0.0112958 11.026 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.2203 on 1135 degrees of freedom
## Multiple R-squared: 0.8363, Adjusted R-squared: 0.8353
## F-statistic: 828.6 on 7 and 1135 DF, p-value: < 2.2e-16
Los resultados del segundo modelo evidencian que el área construida tiene un impacto positivo sobre el valor de la vivienda. En promedio, cada metro cuadrado adicional incrementa el precio en un 0,22%, efecto acumulativo que, por ejemplo, implica que un aumento de 10 m² se refleje en un incremento cercano al 1,2%.
De igual manera, las variables asociadas a la dotación del inmueble presentan una influencia significativa: cada baño adicional eleva el precio en un 12,40%, mientras que la incorporación de un parqueadero lo incrementa en un 17,52%.
En cuanto al estrato socioeconómico, la variable categórica muestra un efecto claramente positivo y creciente en línea con lo establecido por la Ley 142 de 1994 sobre estratificación en Colombia. Así, una vivienda ubicada en estrato 4 presenta un valor 28% mayor, en estrato 5 el incremento es de 50,04%, y en estrato 6 asciende a 76,57%, en comparación con estratos más bajos.
## (Intercept)
## 69.78577
El caso más particular corresponde al intercepto del modelo, el cual representa el valor estimado de un apartamento en planos cuando todas las variables explicativas (área construida, número de habitaciones, baños y parqueaderos, así como los estratos 4, 5 y 6) son iguales a cero. Bajo estas condiciones, el modelo proyecta que el valor del inmueble en estrato 3 sería de aproximadamente 70 millones de pesos.
## areaconst parqueaderos banios habitaciones estrato estrato_5 estrato_6
## 1 300 3 3 5 5 1 0
## 2 300 3 3 5 6 0 1
## estrato_4 Precio_Predicho
## 1 0 704
## 2 0 917
Aqui podemos observar que con las indicaciones que la empresa internacional requirio para uno de sus empleados, manteniendo las caracteristricas de la casa, exceptuando el estrato, y como el modelo nos idnca, el pasar de un estrato a otro (5 a 6), incrementa el valor de la vivienda y en este caso una vivienda en estrato 5 tiene un valor de 694 millones su compra y con la misma condiciones pero en estrato 6 cuesta 902 millones. Se recomienda adquirir la vivienda en estrato 5, teniendo en cuenta que se cuenta con un credito pre aprobado de 850 millones, ademas en este estrato los barrios son como en la zona norte mas tranquilos, comodos y con buena ubicacion en barrios como Valle del lili, pance, Ciudad jardin, el ingenio, entre otros.
Siguiendo las indicaciones de la empresa internacional para uno de sus empleados, y manteniendo constantes las características de la vivienda salvo el estrato, el modelo muestra que al pasar de estrato 5 a estrato 6 se produce un incremento en el valor del inmueble. En este caso, una vivienda en estrato 5 tiene un precio estimado de 694 millones de pesos, mientras que bajo las mismas condiciones, pero en estrato 6, el valor asciende a 902 millones de pesos.
Se recomienda optar por la vivienda en estrato 5, dado que se cuenta con un crédito preaprobado de 850 millones y, además, este estrato ofrece barrios en la zona sur con mayor tranquilidad, comodidad y buena ubicación, tales como Valle del Lili, Pance, Ciudad Jardín y El Ingenio, entre otros.
Observamos que los valores predichos estan cercanos a los valores reales, teniendo en cuneta que los predichos se les aplico una transformacion logarítmica para el modelo.
``` r
## Metricas de evaluacion
### VIF
## areaconst estrato_4 estrato_5 estrato_6 habitaciones parqueaderos
## 1.576672 1.462607 1.847832 1.454744 1.862057 1.489399
## banios
## 2.181997