1 Introducción

El presente informe tiene como propósito brindar asesoría a la compañía internacional interesada en adquirir dos viviendas en la ciudad de Cali, con el fin de ubicar a sus empleados y sus familias. La solicitud fue recibida por la agencia C&A, dirigida por María, y se analizará mediante técnicas de modelación estadística aplicadas a la base de datos de ofertas inmobiliarias de los últimos meses.

El análisis se centra en dos casos específicos: • Vivienda 1: Casa en zona norte, con crédito preaprobado de 350 millones de pesos. • Vivienda 2: Apartamento en zona sur, con crédito preaprobado de 850 millones de pesos.

El objetivo es estimar el valor de mercado de cada vivienda, validar la viabilidad de compra según las condiciones financieras y recomendar las mejores opciones disponibles.

2 Informe

2.1 Análisis vivienda 1

La solicitud corresponde a una casa ubicada en la Zona Norte de Cali, con un crédito preaprobado de 350 millones de pesos. El análisis estadístico realizado permite extraer las siguientes conclusiones:

  • Predicción del precio: El modelo de regresión múltiple estima que una vivienda con las características solicitadas (200 m² de área construida, estrato 4, cuatro habitaciones, un parqueadero y dos baños) tendría un valor aproximado de 312.1 millones de pesos. Este precio se encuentra dentro del rango de financiamiento disponible, lo que confirma la viabilidad de la compra.

  • Ofertas potenciales: Se identificaron al menos cinco viviendas en la Zona Norte que cumplen con las condiciones generales del cliente y se ajustan al presupuesto máximo de 350 millones. Aunque algunas presentan un área construida inferior a los 200 m² solicitados, compensan esta diferencia con un mayor número de baños, habitaciones o parqueaderos. Ejemplo: una de las alternativas ofrece seis habitaciones, cuatro baños y dos parqueaderos, lo que podría representar una opción atractiva pese a su menor área.

  • Coherencia con las preferencias: Todas las alternativas se ubican en estratos 4 y 5, en línea con lo solicitado, y se encuentran dentro del rango de precios estimado por el modelo. Además, la distribución espacial de las ofertas confirma que están efectivamente localizadas en la Zona Norte.

Recomendación: El cliente cuenta con varias opciones viables en el mercado para adquirir una vivienda en la Zona Norte dentro de su capacidad de crédito. Se sugiere priorizar aquellas alternativas que, aunque tengan un área ligeramente menor, ofrecen ventajas adicionales en número de habitaciones y baños, lo que puede mejorar la comodidad y funcionalidad para la familia.

En conclusión, la compra de la vivienda solicitada es factible y existen suficientes alternativas en el mercado que cumplen con las condiciones financieras y estructurales establecidas.

2.2 Análisis vivienda 2

La solicitud 2 corresponde a un apartamento ubicado en la Zona Sur de Cali, con un crédito preaprobado de 850 millones de pesos. El análisis estadístico realizado permite extraer las siguientes conclusiones:

  • Predicción del precio: El modelo de regresión múltiple estima que un apartamento con las características solicitadas (300 m² de área construida, estrato 5–6, cinco habitaciones, tres parqueaderos y tres baños) tendría un valor aproximado de 675 millones de pesos. Este precio se encuentra dentro del rango de financiamiento disponible, lo que confirma la viabilidad de la compra.

  • Ofertas potenciales: Con base en la predicción del modelo y en el presupuesto máximo disponible, se identificaron cinco apartamentos en la Zona Sur y en estratos 5 y 6, con precios dentro del límite de 850 millones. Estas alternativas confirman que existen opciones viables en el mercado dentro de la capacidad de financiamiento del cliente.

    Sin embargo, al comparar sus características con la solicitud inicial, se observa que las ofertas disponibles presentan áreas construidas menores a los 300 m² requeridos, así como un menor número de habitaciones y parqueaderos. Esto sugiere que, aunque el presupuesto permite acceder a opciones en la zona y estrato deseados, encontrar un apartamento que cumpla exactamente con todas las características
    solicitadas podría requerir ampliar la búsqueda o considerar inmuebles de mayor precio.

  • Coherencia con las preferencias: Las alternativas encontradas cumplen con la ubicación en la Zona Sur y con estratos altos, lo cual coincide con la solicitud. No obstante, se debe tener en cuenta en la decisión final, las diferencias en área y distribución de espacios.

Recomendación: El cliente tiene capacidad financiera para adquirir este tipo de vivienda en la Zona Sur. Se recomienda evaluar las alternativas identificadas como opciones cercanas y realistas, priorizando aquellas que, aunque no cumplen exactamente con el área solicitada, ofrecen ventajas adicionales en ubicación, estrato y número de baños.

En caso de que la compañía requiera estrictamente un apartamento de 300 m² con todas las características solicitadas, podría ser necesario ampliar la búsqueda a inmuebles de mayor precio o negociar condiciones adicionales en el mercado.

3 Conclusiones

Ambas opciones son financieramente viables dentro de los créditos preaprobados, aunque presentan diferencias relevantes en cuanto a las características disponibles en el mercado:

  • Vivienda 1 (Casa, Zona Norte, crédito 350 millones):

El modelo estimó un precio cercano a 312 millones de pesos, dentro del presupuesto del cliente. Se identificaron cinco alternativas en estratos 4 y 5 que cumplen con las condiciones generales, aunque con áreas construidas menores a los 200 m² solicitados. No obstante, varias de estas opciones compensan la diferencia con un mayor número de baños o habitaciones, lo que las convierte en alternativas atractivas y realistas.

  • Vivienda 2 (Apartamento, Zona Sur, crédito 850 millones):

El modelo proyectó un precio aproximado de 675 millones de pesos, también dentro del rango de financiamiento. Se encontraron cinco alternativas en estratos 5 y 6, con precios adecuados, pero con áreas construidas menores a los 300 m² requeridos y un menor número de habitaciones y parqueaderos respecto a la solicitud inicial. Esto sugiere que, aunque el presupuesto es suficiente, encontrar un apartamento que cumpla exactamente con todas las características solicitadas podría requerir ampliar la búsqueda o considerar inmuebles de mayor precio.

Comparativo:

  • En ambos casos, las ofertas disponibles cumplen con la ubicación y estrato socioeconómico solicitados.

  • La Vivienda 1 presenta opciones más cercanas a lo solicitado en términos de precio y características, aunque con menor área construida.

  • La Vivienda 2, pese a contar con un mayor presupuesto, enfrenta una mayor brecha entre las características requeridas y las ofertas disponibles, especialmente en área y distribución de espacios.

  • El modelo para apartamentos mostró un mayor nivel de ajuste (R² ≈ 0.75) frente al de casas (R² ≈ 0.60), lo que indica que las variables explicativas capturan mejor el comportamiento del precio en el segmento de apartamentos.

Ambas solicitudes son factibles dentro de los créditos aprobados. Sin embargo, se recomienda:

  • Para la Vivienda 1, avanzar con las alternativas identificadas, priorizando aquellas que compensan el menor área con más habitaciones o baños.

  • Para la Vivienda 2, considerar las ofertas disponibles como opciones cercanas, pero evaluar la posibilidad de ampliar la búsqueda o ajustar el presupuesto si se requiere cumplir estrictamente con los 300 m² y demás características solicitadas.

En conjunto, los resultados muestran que el mercado inmobiliario en Cali ofrece alternativas viables, aunque con ciertas limitaciones en la disponibilidad exacta de inmuebles con las características solicitadas. Esto refuerza la importancia de mantener flexibilidad en los criterios de búsqueda y aprovechar el crédito disponible para optimizar la inversión.

4 Anexos

4.1 Vivienda 1

4.1.1 Filtro, tablas y mapa de puntos

#install.packages("devtools")   # solo la primera vez
#devtools::install_github("centromagis/paqueteMODELOS", force = TRUE)

#install.packages(c("dplyr", "ggplot2", "plotly", "leaflet", "car", "lmtest"))

library(paqueteMODELOS)
library(dplyr)
library(ggplot2)
library(plotly)
library(leaflet)
library(car)
library(lmtest)

data("vivienda")
str(vivienda)
summary(vivienda)
head(vivienda)
names(vivienda)
unique(vivienda$tipo)
unique(vivienda$zona)
base1 <- vivienda %>%
  filter(tipo == "Casa", zona == "Zona Norte")
head(base1,3)
table(base1$tipo)
## 
## Casa 
##  722
table(base1$zona)
## 
## Zona Norte 
##        722
dim(base1)
## [1] 722  13
leaflet(base1) %>%
  addTiles() %>%
  addCircleMarkers(
    lng = ~longitud,
    lat = ~latitud,
    radius = 4,
    popup = ~paste(
      "Barrio:", barrio,
      "<br>Precio:", preciom,
      "<br>Area:", areaconst
    )
  )

En el mapa anterior, se observa que la mayoría de los inmuebles se encuentran concentrados dentro de la Zona Norte de la ciudad, lo cual confirma que el filtro aplicado sobre la base de datos fue correcto. En general, los puntos muestran una distribución espacial coherente con la ubicación esperada para esta zona. En algunos casos podría parecer que ciertos puntos se encuentran fuera del área esperada; esto puede deberse a pequeñas imprecisiones en la georreferenciación de los datos, a diferencias en la delimitación administrativa de las zonas de la ciudad o a posibles inconsistencias en la base de datos original. No obstante, en términos generales la ubicación de las viviendas es consistente con la zona seleccionada.

4.1.2 Análisis exploratorio

ggplot(base1, aes(x = areaconst, y = preciom)) +
  geom_point() +
  geom_smooth(method = "lm") +
  labs(
    title = "Area vs Precio",
    x = "Area construida",
    y = "Precio (millones)"
  )

ggplot(base1, aes(x = as.factor(estrato), y = preciom)) +
  geom_boxplot() + 
  labs(
    title = "Estrato vs Precio",
    x = "Estrato",
    y = "Precio (millones)"
  )

ggplot(base1, aes(x = banios, y = preciom)) +
  geom_point() +
  geom_smooth(method = "lm") + 
  labs(
    title = "Numero de Banios vs Precio",
    x = "Banios",
    y = "Precio (millones)"
  )

ggplot(base1, aes(x = habitaciones, y = preciom)) +
  geom_point() +
  geom_smooth(method = "lm") + 
  labs(
    title = "Numero de Habitaciones vs Precio",
    x = "Habitaciones",
    y = "Precio (millones)"
  )

El análisis exploratorio de los datos permite observar la relación entre el precio de la vivienda y diferentes características estructurales del inmueble. En primer lugar, se identifica una relación positiva entre el área construida y el precio, lo que indica que las viviendas de mayor tamaño tienden a presentar valores más altos en el mercado. De manera similar, el estrato socioeconómico también muestra una asociación positiva con el precio, evidenciando que las viviendas ubicadas en estratos más altos presentan precios promedio superiores. En cuanto al número de baños y habitaciones, se observa una tendencia general a mayores precios a medida que estas características aumentan, aunque con mayor dispersión en los datos. Es importante señalar que en este caso la variable zona no presenta variación dentro del análisis exploratorio, ya que la base fue previamente filtrada únicamente para viviendas ubicadas en la Zona Norte.

4.1.3 Modelo de regresión lineal múltiple

modelo1 <- lm(preciom ~ areaconst + estrato + habitaciones + parqueaderos + banios,
              data = base1)

summary(modelo1)
## 
## Call:
## lm(formula = preciom ~ areaconst + estrato + habitaciones + parqueaderos + 
##     banios, data = base1)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -784.29  -77.56  -16.03   47.67  978.61 
## 
## Coefficients:
##                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  -238.17090   44.40551  -5.364 1.34e-07 ***
## areaconst       0.67673    0.05281  12.814  < 2e-16 ***
## estrato        80.63495    9.82632   8.206 2.70e-15 ***
## habitaciones    7.64511    5.65873   1.351    0.177    
## parqueaderos   24.00598    5.86889   4.090 5.14e-05 ***
## banios         18.89938    7.48800   2.524    0.012 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 155.1 on 429 degrees of freedom
##   (287 observations deleted due to missingness)
## Multiple R-squared:  0.6041, Adjusted R-squared:  0.5995 
## F-statistic: 130.9 on 5 and 429 DF,  p-value: < 2.2e-16

Con el objetivo de analizar el precio de las viviendas en función del área construida, el estrato socioeconómico, el número de habitaciones, el número de parqueaderos y el número de baños, se estimó un modelo de regresión lineal múltiple.

\[ \text{Precio} = f(\text{Área}, \text{Estrato}, \text{Habitaciones}, \text{Parqueaderos}, \text{Baños}) \]

Los resultados indican que el área construida y el estrato son las variables con mayor influencia sobre el precio de la vivienda. En particular, se observa que por cada metro cuadrado adicional el valor del inmueble aumenta en aproximadamente 0.68 millones de pesos, mientras que un incremento de una unidad en el estrato se asocia con un aumento cercano a 80.6 millones de pesos en el precio esperado.

Además, el número de parqueaderos y de baños también muestra efectos positivos y estadísticamente significativos sobre el valor de la propiedad. En cambio, el número de habitaciones no resultó significativo dentro del modelo, lo que sugiere que su impacto podría estar reflejado de manera indirecta a través del área construida.

El modelo alcanza un R² ajustado cercano a 0.60, lo que implica que alrededor del 60% de la variabilidad en los precios puede explicarse por las variables incluidas. La prueba global confirma que el modelo es estadísticamente significativo en conjunto. Cabe mencionar que, durante la estimación, se eliminaron algunas observaciones con información incompleta, por lo que el análisis final se realizó con 429 registros válidos.

4.1.4 Validación de supuestos

par(mfrow=c(2,2))
plot(modelo1)

bptest(modelo1)
## 
##  studentized Breusch-Pagan test
## 
## data:  modelo1
## BP = 80.281, df = 5, p-value = 7.33e-16
shapiro.test(resid(modelo1))
## 
##  Shapiro-Wilk normality test
## 
## data:  resid(modelo1)
## W = 0.85246, p-value < 2.2e-16
vif(modelo1)
##    areaconst      estrato habitaciones parqueaderos       banios 
##     1.460998     1.307757     1.721015     1.226334     1.967421

Para evaluar la validez del modelo de regresión múltiple se aplicaron pruebas estadísticas y gráficos de diagnóstico. Los principales hallazgos son:

  • Homoscedasticidad (Breusch-Pagan test): El estadístico BP = 80.28 con un valor p < 0.001: indica que existe heterocedasticidad significativa en los residuos. Esto significa que la varianza de los errores no es constante, lo cual puede afectar la eficiencia de las estimaciones.

    Sugerencia: considerar modelos robustos o aplicar transformaciones de variables para estabilizar la varianza.

  • Normalidad de los residuos (Shapiro-Wilk test): El estadístico W = 0.85 con p < 0.001: muestra que los residuos no siguen una distribución normal. Esto coincide con lo observado en el Q-Q plot, donde los extremos se desvían de la línea teórica.

    Sugerencia: aplicar transformaciones (ej. logaritmo del precio) o utilizar métodos que no dependan estrictamente de la normalidad, como regresión robusta.

  • Significancia de los coeficientes: los coeficientes estimados para las variables principales (área construida, estrato, habitaciones, parqueaderos y baños) son positivos, lo que resulta lógico: a mayor área, estrato o número de espacios, mayor es el precio esperado. Sin embargo, la presencia de heterocedasticidad y no normalidad puede afectar la precisión de estas estimaciones.

    Sugerencia: validar la estabilidad de los coeficientes con técnicas de remuestreo (bootstrap) o modelos alternativos.

  • Observaciones influyentes: Los gráficos de leverage y Cook’s distance muestran algunos puntos con alta influencia, lo que sugiere que ciertos registros pueden estar afectando de manera desproporcionada el ajuste del modelo.

    Sugerencia: revisar estos casos individualmente y decidir si deben mantenerse o excluirse.

El modelo explica de manera coherente la relación entre las características de las viviendas y su precio, pero presenta problemas de heterocedasticidad y normalidad en los residuos. Aunque no invalidan el análisis, estos hallazgos sugieren que para mejorar la robustez del modelo sería conveniente explorar transformaciones de variables, aplicar métodos robustos y analizar la influencia de observaciones extremas.

4.1.5 Predicción de la vivienda

sol1_e4 <- data.frame(
areaconst=200,
estrato=4,
habitaciones=4,
parqueaderos=1,
banios=2
)

predict(modelo1,newdata=sol1_e4)
##       1 
## 312.101

El modelo estima que una vivienda con las características solicitadas (200 m² de área construida, estrato 4, cuatro habitaciones, un parqueadero y dos baños) tendría un precio aproximado de 312.1 millones de pesos. Al comparar esta estimación con el presupuesto máximo disponible del cliente, equivalente a 350 millones de pesos, se observa que el valor proyectado se encuentra dentro del rango de financiamiento considerado. Esto permite concluir que el cliente tendría posibilidades reales de adquirir viviendas con características similares dentro de su capacidad de crédito.

4.1.6 Ofertas potenciales

ofertas1 <- base1 %>%
  filter(estrato %in% c(4,5),
         preciom <= 350)

head(ofertas1,5)

Las 5 viviendas que cumplen con el presupuesto de 350 millones son:

Estrato Precio Área Parqueaderos Baños Habitaciones
5 320 150 2 4 6
4 305 117 NA 3 4
4 350 118 NA 3 3
4 320 115 NA 3 3
5 300 110 NA 3 3

Comparación con la vivienda solicitada:

Característica Solicitud Ofertas
Área 200 110–150
Estrato 4–5 4–5
Habitaciones 4 3–6
Baños 2 3–4
Parqueaderos 1 algunos NA / 2

Con base en el análisis realizado se identificaron cinco viviendas potenciales que cumplen con las condiciones generales del cliente y se encuentran dentro del presupuesto máximo de 350 millones de pesos. Estas alternativas corresponden a viviendas ubicadas en la Zona Norte y en estratos 4 y 5, lo cual coincide con las preferencias indicadas en la solicitud.

Aunque algunas de las viviendas identificadas presentan un área construida menor a los 200 m² solicitados, varias de ellas compensan esta diferencia con un mayor número de baños o habitaciones. Por ejemplo, una de las alternativas cuenta con seis habitaciones, cuatro baños y dos parqueaderos, lo cual podría representar una opción atractiva para el cliente pese a su menor área.

En general, todas las alternativas identificadas se encuentran dentro del rango de precios estimado por el modelo de regresión y dentro del presupuesto disponible, lo que sugiere que el cliente tiene varias opciones viables en el mercado para considerar en su proceso de compra.

top5_ofertas1 <- head(ofertas1,5)

leaflet(top5_ofertas1) %>%
  addTiles() %>%
  addCircleMarkers(
    lng = ~longitud,
    lat = ~latitud,
    radius = 6,
    color = "red",
    popup = ~paste(
      "Barrio:", barrio,
      "<br>Precio:", preciom, "millones",
      "<br>Area:", areaconst,
      "<br>Habitaciones:", habitaciones,
      "<br>Banios:", banios,
      "<br>Parqueaderos:", parqueaderos
    )
  )

El mapa anterior muestra la ubicación geográfica de las cinco ofertas potenciales identificadas. Todas se encuentran en la Zona Norte y presentan precios dentro del presupuesto máximo del cliente, lo cual confirma la viabilidad de estas alternativas dentro del mercado analizado.

4.2 Vivienda 2

4.2.1 Filtro, tablas y mapa de puntos

base2 <- vivienda %>%
  filter(tipo == "Apartamento", zona == "Zona Sur")

head(base2,3)
table(base2$tipo)
## 
## Apartamento 
##        2787
table(base2$zona)
## 
## Zona Sur 
##     2787
dim(base2)
## [1] 2787   13

Para el análisis de la segunda solicitud se realizó un filtro sobre la base de datos original con el objetivo de identificar únicamente las ofertas correspondientes a apartamentos ubicados en la Zona Sur de la ciudad. A partir de este procedimiento se construyó la base denominada base2, la cual contiene las observaciones que cumplen con estas características. Posteriormente se presentan los primeros registros de la base filtrada y tablas de frecuencia que permiten verificar que las observaciones corresponden efectivamente al tipo de vivienda y zona seleccionados. Finalmente, la dimensión de la base permite identificar el número total de observaciones disponibles para el análisis.

leaflet(base2) %>%
  addTiles() %>%
  addCircleMarkers(
    lng = ~longitud,
    lat = ~latitud,
    radius = 4,
    color = "darkblue",
    popup = ~paste(
      "Barrio:", barrio,
      "<br>Precio:", preciom,
      "<br>Area:", areaconst
    )
  )

El mapa permite visualizar la distribución geográfica de los apartamentos ubicados en la Zona Sur de la ciudad. La mayoría, se concentran dentro del área correspondiente a esta zona, lo cual confirma la consistencia del filtro aplicado. En algunos casos podrían observarse puntos aparentemente fuera del área esperada, lo cual puede deberse a imprecisiones en las coordenadas geográficas registradas o a diferencias en la delimitación administrativa de las zonas de la ciudad.

4.2.2 Análisis exploratorio

ggplot(base2, aes(x = areaconst, y = preciom)) +
  geom_point() +
  geom_smooth(method = "lm") +
  labs(
    title = "Area vs Precio",
    x = "Area construida",
    y = "Precio (millones)"
  )

ggplot(base2, aes(x = as.factor(estrato), y = preciom)) +
  geom_boxplot() + 
  labs(
    title = "Estrato vs Precio",
    x = "Estrato",
    y = "Precio (millones)"
  )

ggplot(base2, aes(x = banios, y = preciom)) +
  geom_point() +
  geom_smooth(method = "lm") +
  labs(
    title = "Numero de Banios vs Precio",
    x = "Numero de banios",
    y = "Precio (millones)"
  )

- Habitaciones

ggplot(base2, aes(x = habitaciones, y = preciom)) +
  geom_point() +
  geom_smooth(method = "lm") +
  labs(
    title = "Numero de Habitaciones vs Precio",
    x = "Numero de habitaciones",
    y = "Precio (millones)"
  )

En general se observa una relación positiva entre el área construida y el precio, lo cual indica que los apartamentos con mayor tamaño tienden a presentar valores más altos. De manera similar, el estrato socioeconómico muestra una asociación positiva con el precio, lo que sugiere que los apartamentos ubicados en estratos más altos tienden a tener mayor valor en el mercado. Las variables relacionadas con el número de baños y habitaciones también presentan una tendencia creciente con el precio, aunque con mayor dispersión en los datos.

4.2.3 Modelo de regresión lineal múltiple

modelo2 <- lm(preciom ~ areaconst + estrato + habitaciones + parqueaderos + banios,
              data = base2)

summary(modelo2)
## 
## Call:
## lm(formula = preciom ~ areaconst + estrato + habitaciones + parqueaderos + 
##     banios, data = base2)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -1092.02   -42.28    -1.33    40.58   926.56 
## 
## Coefficients:
##                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  -261.62501   15.63220 -16.736  < 2e-16 ***
## areaconst       1.28505    0.05403  23.785  < 2e-16 ***
## estrato        60.89709    3.08408  19.746  < 2e-16 ***
## habitaciones  -24.83693    3.89229  -6.381 2.11e-10 ***
## parqueaderos   72.91468    3.95797  18.422  < 2e-16 ***
## banios         50.69675    3.39637  14.927  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 98.02 on 2375 degrees of freedom
##   (406 observations deleted due to missingness)
## Multiple R-squared:  0.7485, Adjusted R-squared:  0.748 
## F-statistic:  1414 on 5 and 2375 DF,  p-value: < 2.2e-16

Los resultados muestran que todas las variables incluidas en el modelo son estadísticamente significativas para explicar el precio de los apartamentos. En particular, el área construida presenta un efecto positivo sobre el precio, indicando que por cada metro cuadrado adicional el precio del apartamento aumenta aproximadamente en 1.29 millones de pesos, manteniendo constantes las demás variables.

De igual manera, el estrato socioeconómico muestra un efecto positivo y significativo, lo que implica que un incremento de una unidad en el estrato aumenta el precio esperado del apartamento en aproximadamente 60.9 millones de pesos. El número de parqueaderos también tiene un impacto positivo importante en el precio, incrementando el valor del inmueble en cerca de 72.9 millones de pesos por cada parqueadero adicional. Asimismo, el número de baños presenta un efecto positivo, con un aumento aproximado de 50.7 millones de pesos por cada baño adicional.

Por el contrario, el número de habitaciones presenta un coeficiente negativo en el modelo, lo que sugiere que, manteniendo constantes las demás variables, un mayor número de habitaciones podría estar asociado con apartamentos de menor tamaño o con distribuciones diferentes del espacio. Este resultado puede reflejar características particulares del mercado de apartamentos en la zona analizada.

El modelo presenta un R² ajustado de aproximadamente 0.748, lo que indica que cerca del 74.8% de la variabilidad del precio de los apartamentos puede ser explicada por las variables incluidas en el modelo, lo que representa un buen nivel de ajuste. Además, la prueba global del modelo (F-statistic) muestra que el modelo es estadísticamente significativo en conjunto.

Al igual que el análisis de la vivienda 1, se eliminaron algunas observaciones debido a valores faltantes en ciertas variables, por lo que el análisis final se realizó con 2375 observaciones disponibles.

Comparado con el modelo estimado para viviendas tipo casa, el modelo para apartamentos presenta un mayor nivel de ajuste, lo que sugiere que las variables consideradas explican en mayor medida el comportamiento del precio en este segmento del mercado inmobiliario.

4.2.4 Validación de supuestos

par(mfrow=c(2,2))
plot(modelo2)

bptest(modelo2)
## 
##  studentized Breusch-Pagan test
## 
## data:  modelo2
## BP = 754.81, df = 5, p-value < 2.2e-16
shapiro.test(resid(modelo2))
## 
##  Shapiro-Wilk normality test
## 
## data:  resid(modelo2)
## W = 0.79118, p-value < 2.2e-16
vif(modelo2)
##    areaconst      estrato habitaciones parqueaderos       banios 
##     2.066518     1.545162     1.429280     1.737878     2.529494

Los gráficos de residuos permiten examinar la relación entre los residuos y los valores ajustados, observándose una ligera dispersión creciente a medida que aumentan los valores ajustados, lo que puede sugerir la presencia de heterocedasticidad. Este resultado también se confirma con la prueba de Breusch-Pagan, cuyo p-valor es menor a 0.05, indicando que existe evidencia estadística de heterocedasticidad en los residuos.

En cuanto al supuesto de normalidad de los errores, la prueba de Shapiro-Wilk muestra un p-valor menor a 0.05, lo que sugiere que los residuos no siguen una distribución normal perfecta. No obstante, dado el gran tamaño de la muestra utilizada en el modelo, pequeñas desviaciones de la normalidad no afectan de manera significativa la validez de las estimaciones.

El análisis de multicolinealidad mediante el factor de inflación de la varianza (VIF) muestra valores inferiores a 5 para todas las variables explicativas, lo que indica que no existen problemas importantes de colinealidad entre las variables del modelo. En caso de querer mejorar el modelo se podrían considerar transformaciones de variables, métodos robustos a heterocedasticidad o la inclusión de variables adicionales que permitan capturar mejor la variabilidad del precio de los apartamentos.

4.2.5 Predicción de la vivienda

sol2_e5 <- data.frame(
areaconst = 300,
estrato = 5,
habitaciones = 5,
parqueaderos = 3,
banios = 3
)

predict(modelo2, newdata = sol2_e5)
##        1 
## 675.0247

El modelo estima que un apartamento con las características solicitadas por el cliente: área construida de 300 m², cinco habitaciones, tres baños y tres parqueaderos, ubicado en estrato 5 o 6 en la Zona Sur de la ciudad, tendría un precio aproximado de 675.02 milloes de pesos.

Al comparar esta estimación con el presupuesto máximo disponible del cliente, equivalente a 850 millones de pesos, se observa que el valor proyectado se encuentra dentro del rango de financiamiento considerado. Esto sugiere que el cliente cuenta con una capacidad de crédito suficiente para adquirir un inmueble con características similares a las solicitadas.

En consecuencia, el modelo indica que existen condiciones favorables para encontrar apartamentos que cumplan con los requerimientos establecidos dentro del presupuesto disponible, lo cual permite proceder a la identificación de ofertas potenciales en el mercado que se ajusten a dichas características.

4.2.6 Ofertas potenciales

ofertas2 <- base2 %>%
  filter(estrato %in% c(5,6),
         preciom <= 850)

head(ofertas2,5)

Tabla comparativa – Vivienda solicitada vs ofertas potenciales

Característica Solicitud del cliente Oferta 1 Oferta 2 Oferta 3 Oferta 4 Oferta 5
Tipo Apartamento Apartamento Apartamento Apartamento Apartamento Apartamento
Zona Sur Sur Sur Sur Sur Sur
Estrato 5 o 6 5 5 5 5 6
Área construida (m²) 300 107 166 64 120 125
Parqueaderos 3 2 2 1 2 2
Baños 3 2 4 2 4 3
Habitaciones 5 3 3 2 3 3
Precio (millones) ~675 estimado 344 310 175 285 305

Con base en la predicción del modelo y en el presupuesto máximo disponible del cliente, se identificaron cinco ofertas potenciales de apartamentos ubicados en la Zona Sur y en estratos 5 y 6, con precios dentro del límite de 850 millones de pesos. Estas alternativas confirman que existen opciones viables en el mercado dentro de la capacidad de financiamiento del cliente. Sin embargo, al comparar sus características con la solicitud inicial, se observa que las ofertas disponibles presentan áreas construidas menores a los 300 m² requeridos, así como un menor número de habitaciones y parqueaderos. Esto sugiere que, aunque el presupuesto permite acceder a opciones en la zona y estrato deseados, encontrar un apartamento que cumpla exactamente con todas las características solicitadas podría requerir ampliar la búsqueda o considerar inmuebles de mayor precio. En este sentido, las ofertas identificadas constituyen alternativas cercanas y realistas dentro del mercado analizado.

top5_ofertas2 <- head(ofertas2,5)

leaflet(top5_ofertas2) %>%
  addTiles() %>%
  addCircleMarkers(
    lng = ~longitud,
    lat = ~latitud,
    radius = 8,
    color = "brown",
    fillOpacity = 0.6,
    popup = ~paste(
      "Barrio:", barrio,
      "<br>Precio:", preciom,
      "<br>Area:", areaconst,
      "<br>Habitaciones:", habitaciones
    )
  )

El mapa muestra la localización de las cinco ofertas potenciales seleccionadas para la Vivienda 2. Todas se ubican en la Zona Sur y se encuentran dentro del presupuesto máximo disponible, lo que confirma la viabilidad de estas alternativas dentro del mercado estudiado. Además, se observa que varias de estas ofertas se encuentran geográficamente cercanas entre sí, concentrándose principalmente en sectores como Bella Suiza y Altos de Guadalupe, lo cual indica una agrupación de opciones disponibles dentro de una misma área de la ciudad.

Conclusión: El análisis de regresión múltiple permitió estimar el valor esperado de las viviendas en función de sus características estructurales. En ambos casos analizados se encontró que los clientes cuentan con capacidad de financiamiento suficiente para adquirir propiedades dentro de sus zonas de interés. No obstante, el mercado disponible presenta algunas diferencias frente a las características exactas solicitadas, particularmente en el área construida y el número de espacios. Aun así, existen múltiples alternativas viables que cumplen con las restricciones de ubicación y presupuesto, lo que permite recomendar continuar el proceso de búsqueda dentro de las zonas analizadas.