ACTIVIDAD 2
Enunciado
Maria comenzó como agente de bienes raíces en Cali hace 10 años. Después de laborar dos años para una empresa nacional, se traslado a Bogotá y trabajó para otra agencia de bienes raíces. Sus amigos y familiares la convencieron de que con su experiencia y conocimientos del negocio debía abrir su propia agencia. Terminó por adquirir la licencia de intermediario y al poco tiempo fundó su propia compañía, C&A (Casas y Apartamentos) en Cali. Santiago y Lina, dos vendedores de la empresa anterior aceptaron trabajar en la nueva compaña. En la actualidad ocho agentes de bienes raíces colaboran con ella en C&A.
Actualmente las ventas de bienes raíces en Cali se han visto disminuidas de manera significativa en lo corrido del año. Durante este periodo muchas instituciones bancarias de ahorro y vivienda están prestando grandes sumas de dinero para la industria y la construcción comercial y residencial. Cuando el efecto producto de las tensiones políticas y sociales disminuya, se espera que la actividad económica de este sector se reactive.
Hace dos días, María recibió una carta solicitando asesoría para la compra de dos viviendas por parte de una compañía internacional que desea ubicar a dos de sus empleados con sus familias en la ciudad. Las solicitudes incluyen las siguientes condiciones:
| Característica | Vivienda 1 | Vivienda 2 |
|---|---|---|
| Tipo | Casa | Apartamento |
| Área construida | 200 | 300 |
| Parqueaderos | 1 | 3 |
| Baños | 2 | 3 |
| Habitaciones | 4 | 5 |
| Estrato | 4 o 5 | 5 o 6 |
| Zona | Norte | Sur |
| Crédito preaprobado | 350 millones | 850 millones |
Ayude a María a responder la solicitud, mediante técnicas modelación que usted conoce. Ella requiere le envíe un informe ejecutivo donde analice los dos casos y sus recomendaciones (Informe). Como soporte del informe debe anexar las estimaciones, validaciones y comparación de modelos requeridos (Anexos) .
Punto 1
Cargar los paquetes necesarios
En el desarrollo de este análisis se emplearon diversas librerías de R, cada una seleccionada por su funcionalidad específica y su aporte al flujo de trabajo estadístico y analítico.
dplyr se utilizó como herramienta
principal para la manipulación y transformación de datos. Este paquete
proporciona una gramática intuitiva que permite realizar operaciones de
filtrado, selección, mutación, agrupamiento y resumen de datos de manera
eficiente, facilitando la preparación de la información para los
análisis posteriores.
ggplot2 fue implementado para la
generación de gráficos estáticos de alta calidad bajo la filosofía de
“The Grammar of Graphics”. Este paquete permite construir
visualizaciones complejas a partir de componentes básicos, asegurando la
reproducibilidad y claridad en la representación de los resultados.
plotly complementó el análisis visual
al proporcionar herramientas para la creación de gráficos interactivos.
Su integración con ggplot2 permite convertir
visualizaciones estáticas en representaciones dinámicas, facilitando la
exploración de datos y la comunicación de resultados de manera más
accesible para el usuario final.
leaflet se empleó para la elaboración
de mapas interactivos, permitiendo representar datos geoespaciales de
forma dinámica. Este paquete facilita la incorporación de capas,
marcadores y leyendas que enriquecen la interpretación de la información
geográfica.
lmtest se utilizó para realizar pruebas
estadísticas relacionadas con modelos de regresión lineal, incluyendo la
verificación de supuestos clásicos como la heterocedasticidad y la
autocorrelación de errores.
car aportó herramientas adicionales
para el análisis de regresión y diagnóstico de modelos, como la
evaluación de colinealidad y la obtención de intervalos de confianza
para los coeficientes estimados.
broom permitió organizar y convertir
los resultados de modelos estadísticos en estructuras de datos ordenadas
(tidy), facilitando su posterior análisis, visualización y reporte.
scales se empleó para gestionar y
personalizar escalas en las visualizaciones, permitiendo una
representación más precisa y estética de los valores en gráficos y
tablas.
Finalmente, paqueteMODELOS se utilizó
como un paquete especializado que integra diversas funciones para la
estimación, evaluación y comparación de modelos estadísticos,
optimizando el proceso analítico mediante herramientas adaptadas a los
objetivos específicos de este estudio.
Tambien se realizaron un filtro a la base de datos, incluyendo únicamente las ofertas de base1 correspondientes a casas ubicadas en la zona norte de la ciudad. Se presentan los tres primeros registros de la base y se construyen tablas que permiten comprobar la validez de la consulta.
Cargar datos vivienda desde paquete MODELOS
En esta etapa se realizó una limpieza y estandarización de
los datos de la base vivienda, asegurando que la
información estuviera correctamente estructurada para su análisis. Se
homogeneizaron las categorías de las variables relacionadas con la
ubicación y el tipo de vivienda, se corrigieron valores inconsistentes
en la variable correspondiente al piso y se transformaron estas
variables en factores para facilitar su interpretación estadística.
Posteriormente, se generó una tabla que presenta las primeras
observaciones de la base, ofreciendo una visión general de su estructura
y contenido.
| id | zona | piso | estrato | preciom | areaconst | parqueaderos | banios | habitaciones | tipo | barrio | longitud | latitud |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1147 | Zona Oriente | NA | 3 | 250 | 70 | 1 | 3 | 6 | Casa | 20 de julio | -76.51168 | 3.43382 |
| 1169 | Zona Oriente | NA | 3 | 320 | 120 | 1 | 2 | 3 | Casa | 20 de julio | -76.51237 | 3.43369 |
| 1350 | Zona Oriente | NA | 3 | 350 | 220 | 2 | 2 | 4 | Casa | 20 de julio | -76.51537 | 3.43566 |
| 5992 | Zona Sur | 02 | 4 | 400 | 280 | 3 | 5 | 3 | Casa | 3 de julio | -76.54000 | 3.43500 |
| 1212 | Zona Norte | 01 | 5 | 260 | 90 | 1 | 2 | 3 | Apartamento | acopi | -76.51350 | 3.45891 |
| 1724 | Zona Norte | 01 | 5 | 240 | 87 | 1 | 3 | 3 | Apartamento | acopi | -76.51700 | 3.36971 |
| x | |
|---|---|
| Zona Centro | 124 |
| Zona Norte | 1920 |
| Zona Oeste | 1198 |
| Zona Oriente | 351 |
| Zona Sur | 4726 |
| NA’s | 3 |
| x | |
|---|---|
| Apartamento | 5100 |
| Casa | 3219 |
| NA’s | 3 |
Filtro a la base de datos
Se realizó un filtro a la base de datos de vivienda, seleccionando únicamente los registros correspondientes a casas ubicadas en la zona norte de la ciudad. Como resultado, se obtuvo la base base1, cuyas dimensiones son 722 filas por 13 columnas. Finalmente, se presentan los primeros registros de esta base filtrada para ilustrar la estructura de la información.
| id | zona | piso | estrato | preciom | areaconst | parqueaderos | banios | habitaciones | tipo | barrio | longitud | latitud |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1209 | Zona Norte | 02 | 5 | 320 | 150 | 2 | 4 | 6 | Casa | acopi | -76.51341 | 3.47968 |
| 1592 | Zona Norte | 02 | 5 | 780 | 380 | 2 | 3 | 3 | Casa | acopi | -76.51674 | 3.48721 |
| 4057 | Zona Norte | 02 | 6 | 750 | 445 | NA | 7 | 6 | Casa | acopi | -76.52950 | 3.38527 |
| 4460 | Zona Norte | 02 | 4 | 625 | 355 | 3 | 5 | 5 | Casa | acopi | -76.53179 | 3.40590 |
| 6081 | Zona Norte | 02 | 5 | 750 | 237 | 2 | 6 | 6 | Casa | acopi | -76.54044 | 3.36862 |
| 7824 | Zona Norte | 02 | 4 | 600 | 160 | 1 | 4 | 5 | Casa | acopi | -76.55210 | 3.42125 |
Comprobación de resultados
Se construyen tablas de comprobación con el propósito de validar el filtro aplicado a la base base1. En primer lugar, la tabla de distribución por tipo de vivienda confirma que los 722 registros corresponden exclusivamente a casas. De igual forma, la tabla de distribución por zona muestra que la totalidad de las ofertas se encuentran en la zona norte de la ciudad, lo cual respalda la consistencia de la selección realizada. Finalmente, la tabla de estrato evidencia una mayor concentración de viviendas en los estratos 3 (235 registros) y 5 (271 registros), mientras que los estratos 4 (161 registros) y 6 (55 registros) presentan una menor participación relativa.
| tipo | n |
|---|---|
| Casa | 722 |
| zona | n |
|---|---|
| Zona Norte | 722 |
| estrato | n |
|---|---|
| 3 | 235 |
| 4 | 161 |
| 5 | 271 |
| 6 | 55 |
Mapa de los puntos
Para complementar el análisis, se genera un mapa interactivo con los datos de la base, utilizando únicamente las viviendas que cuentan con coordenadas de latitud y longitud. En este mapa se ubican puntos que representan cada oferta, y al hacer clic sobre ellos se despliega información adicional como el barrio de localización, el precio en millones, el área construida y el estrato socioeconómico. Gracias a esta representación espacial es posible observar de manera más clara cómo se distribuyen las viviendas y verificar si realmente corresponden a la zona norte de la ciudad, se aprecia que existen registros que se alejan de la zona esperada.
Punto 2
Análisis de correlación
Para continuar con la exploración de los datos, se seleccionan algunas variables numéricas de la base base1 (precio, área construida, estrato, número de baños y número de habitaciones) con el fin de analizar sus relaciones. A partir de ellas se construye una matriz de correlaciones y se representa mediante un mapa de calor.
En los resultados se observa que el precio de la vivienda presenta una fuerte correlación positiva con el área construida (0.73) y con el estrato (0.61), lo que tiene sentido porque a mayor tamaño y mayor nivel socioeconómico, el precio tiende a aumentar. También aparece una relación moderada con el número de baños (0.52), aunque con las habitaciones la asociación es más débil (0.32). Por otro lado, el número de baños y habitaciones muestra una correlación relativamente alta entre sí (0.57), lo cual resulta lógico ya que viviendas con más cuartos suelen tener también más baños.
Análisis grafico
Con el fin de visualizar de manera más clara las relaciones entre el precio y otras características de las viviendas de la base, se construyen gráficos de dispersión acompañados de una línea de tendencia ajustada con regresión lineal. En cada gráfico se compara el precio con una de las variables: área construida, estrato, número de baños y número de habitaciones.
En general, los resultados muestran que el precio aumenta a medida que crece el área construida, confirmando la fuerte relación positiva encontrada en la matriz de correlaciones. Algo similar ocurre con el estrato, donde se aprecia una tendencia ascendente del precio en los niveles socioeconómicos más altos. En el caso del número de baños, también se observa una correlación positiva, aunque menos pronunciada. Finalmente, la relación con el número de habitaciones resulta más débil: si bien hay una leve tendencia, el precio no crece de manera tan marcada como en las otras variables.
Punto 3
Regresión lineal múltiple
Para analizar cómo se relacionan de manera conjunta las características de las viviendas con su precio, se estima un modelo de regresión lineal múltiple en el que la variable dependiente es el precio (millones de pesos), y las variables explicativas son el área construida, el estrato socioeconómico, el número de habitaciones, el número de parqueaderos y el número de baños.
Los resultados muestran que el modelo es globalmente significativo y logra explicar aproximadamente el 60% de la variabilidad del precio (R² = 0.60). Esto indica que, aunque el modelo capta gran parte de la relación entre las variables, todavía queda un 40% que depende de otros factores no incluidos (como ubicación exacta, antigüedad de la vivienda o acabados).
En cuanto a los coeficientes, se observa que:
Área construida: tiene un efecto positivo y altamente significativo. Por cada metro cuadrado adicional, el precio aumenta en promedio 0.68 millones de pesos. Esto confirma la lógica de que a mayor tamaño, mayor valor de la vivienda.
Estrato: también es muy significativo. Un aumento de una unidad en el estrato se asocia con un incremento de aproximadamente 80 millones de pesos en el precio, lo cual refleja el peso que tiene el nivel socioeconómico en la valoración del inmueble.
Habitaciones: no resulta estadísticamente significativo (p = 0.177), lo que sugiere que, al controlar por área, estrato, parqueaderos y baños, el número de cuartos no aporta una diferencia clara en el precio.
Parqueaderos: sí es significativo. Cada parqueadero adicional se asocia con un aumento promedio de 24 millones de pesos, lo que resulta lógico considerando la demanda de parqueaderos en ciertas zonas de la ciudad.
Baños: también es significativo. Cada baño adicional incrementa el precio en aproximadamente 19 millones de pesos, coherente con la percepción de comodidad que generan más baños en una vivienda.
Modelo de regresión:
Precio_m = β₀ + β₁·Área_const + β₂·Estrato + β₃·Habitaciones + β₄·Parqueaderos + β₅·Baños + ε
| term | estimate | std.error | statistic | p.value |
|---|---|---|---|---|
| (Intercept) | -238.1708979 | 44.4055069 | -5.363544 | 0.0000001 |
| areaconst | 0.6767346 | 0.0528121 | 12.814001 | 0.0000000 |
| estrato | 80.6349477 | 9.8263227 | 8.206015 | 0.0000000 |
| habitaciones | 7.6451100 | 5.6587338 | 1.351028 | 0.1773984 |
| parqueaderos | 24.0059798 | 5.8688857 | 4.090381 | 0.0000514 |
| banios | 18.8993776 | 7.4880029 | 2.523954 | 0.0119643 |
Punto 4
Validación de supuestos (Base1)- PARTE A
Después de estimar el modelo, se realizó un análisis de los residuos para verificar los supuestos de la regresión lineal múltiple. En el gráfico de residuos vs. valores ajustados, se observa cierta dispersión desigual y una tendencia ligera en la parte derecha, lo que podría sugerir problemas de heterocedasticidad. Esto se confirma con la prueba de Breusch-Pagan, que resulta altamente significativa (BP = 80.28, p < 0.001), indicando que la varianza de los residuos no es constante.
En el Q-Q plot, los residuos siguen una tendencia cercana a la normalidad, aunque presentan desviaciones leves en las colas, lo que sugiere que la normalidad se cumple de manera aproximada, pero no perfecta.
El gráfico Scale-Location muestra un patrón ascendente en los residuos estandarizados a medida que aumentan los valores ajustados, reforzando la presencia de heterocedasticidad.
En el gráfico de residuos vs leverage, se identifican algunos puntos influyentes (como las observaciones 239, 309 y 393), aunque no parecen comprometer de forma crítica el ajuste del modelo.
La prueba de Durbin-Watson (DW = 1.76, p = 0.005) sugiere la presencia de autocorrelación positiva en los residuos, aunque no de gran magnitud.
Finalmente, los valores de VIF (todos menores a 2) indican que no existe un problema relevante de multicolinealidad entre las variables independientes, por lo que la estimación de los coeficientes no está distorsionada por colinealidad excesiva.
Sugerencias para mejorar el modelo
- Corregir la heterocedasticidad:
Aplicar una transformación logarítmica al precio (
log(preciom)) podría estabilizar la varianza de los residuos.Alternativamente, utilizar una regresión robusta o estimadores con errores estándar robustos (como
vcovHCen R) para ajustar la inferencia.
Atender la autocorrelación de los residuos:
Incluir variables omitidas relacionadas con la localización o la antigüedad de la vivienda podría reducir la autocorrelación.
En caso de que la autocorrelación sea espacial (probable en datos inmobiliarios), considerar un modelo de regresión espacial.
Examinar los puntos influyentes:
Revisar las observaciones 239, 309 y 393 para verificar si corresponden a datos atípicos o errores de registro.
Analizar si excluirlos o modelarlos aparte mejora el ajuste.
Explorar interacciones o no linealidades:
- Incluir términos cuadráticos para el área construida o interacciones entre estrato y área podría capturar mejor relaciones no lineales.
PARTE B
En primer lugar, la prueba de Breusch–Pagan (Tabla 9) arrojó un estadístico de 80.28 con un valor p de 0.000, lo que indica evidencia suficiente para rechazar la hipótesis nula de homocedasticidad. Esto sugiere la presencia de heterocedasticidad en los residuos, es decir, la varianza de los errores no es constante a lo largo de los valores ajustados.
En segundo lugar, la prueba de Durbin–Watson (Tabla 10) obtuvo un estadístico de 1.76 con un valor p de 0.0055, lo cual sugiere la existencia de autocorrelación positiva en los residuos del modelo. Este resultado es relevante especialmente si los datos presentan algún orden temporal o espacial.
Finalmente, los factores de inflación de varianza (VIF) (Tabla 11) se encuentran todos por debajo de 2, lo que indica que no existe multicolinealidad preocupante entre las variables explicativas. Esto significa que las variables independientes no presentan correlaciones excesivamente altas que puedan distorsionar las estimaciones de los coeficientes.
| statistic | p.value | parameter | method |
|---|---|---|---|
| 80.28083 | 0 | 5 | studentized Breusch-Pagan test |
| statistic | p.value | method | alternative |
|---|---|---|---|
| 1.761505 | 0.0054722 | Durbin-Watson test | true autocorrelation is greater than 0 |
| vif1 | |
|---|---|
| areaconst | 1.460998 |
| estrato | 1.307757 |
| habitaciones | 1.721015 |
| parqueaderos | 1.226334 |
| banios | 1.967421 |
Punto 5
Predicción para Vivienda 1(Casa, Zona Norte, área=200, estrato 4 o 5, habitaciones=4, parqueaderos=1, baños=2)
Con el modelo de regresión ajustado, se procede a realizar la predicción del precio para una vivienda con las características planteadas inicialmente: 200 m² de área construida, 4 habitaciones, 1 parqueadero y 2 baños, variando únicamente el estrato socioeconómico entre 4 y 5.
Los resultados de la predicción son los siguientes:
Para estrato 4, el modelo estima un precio promedio de 312 millones de pesos, con un intervalo de predicción del 95% que va aproximadamente de 6 a 618 millones.
Para estrato 5, el precio promedio aumenta a 393 millones de pesos, con un intervalo de predicción entre 86 y 699 millones.
En ambos casos, se observa que el intervalo de predicción es bastante amplio, lo cual refleja la incertidumbre inherente al modelo y la dispersión de los datos. Sin embargo, el efecto esperado es consistente: al pasar de estrato 4 a estrato 5, el precio se incrementa en cerca de 80 millones, coherente con la magnitud estimada para la variable estrato en el modelo previo.
| fit | lwr | upr |
|---|---|---|
| 312.101 | 6.205196 | 617.9968 |
| fit | lwr | upr |
|---|---|---|
| 392.7359 | 86.19637 | 699.2755 |
Punto 6
Ofertas para Vivienda 1 (≤ 350 M) + mapa (≥5 si hay)
PARTE A
| id | zona | barrio | preciom | areaconst | estrato | parqueaderos | banios | habitaciones |
|---|---|---|---|---|---|---|---|---|
| 1343 | Zona Norte | la flora | 320 | 200 | 5 | 2 | 4 | 4 |
| 1144 | Zona Norte | la merced | 320 | 200 | 4 | 2 | 4 | 4 |
| 4210 | Zona Norte | el bosque | 350 | 200 | 5 | 3 | 3 | 4 |
| 4267 | Zona Norte | el bosque | 335 | 202 | 5 | 1 | 4 | 5 |
| 1887 | Zona Norte | vipasa | 340 | 203 | 5 | 2 | 3 | 4 |
PARTE B
Punto 7
Repetir 1–6 para Vivienda 2(Apartamento, Zona Sur, área=300, estrato 5 o 6, parqueaderos≥3, baños≥3, habitaciones≥5, ≤ 850 M)
7.1 Filtro base2 + verificación + mapa
|> Dimensiones base2 (Apto, Zona Sur): 2787 filas x 13 columnas
| id | zona | piso | estrato | preciom | areaconst | parqueaderos | banios | habitaciones | tipo | barrio | longitud | latitud |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 5098 | Zona Sur | 05 | 4 | 290 | 96 | 1 | 2 | 3 | Apartamento | acopi | -76.53464 | 3.44987 |
| 698 | Zona Sur | 02 | 3 | 78 | 40 | 1 | 1 | 2 | Apartamento | aguablanca | -76.50100 | 3.40000 |
| 8199 | Zona Sur | NA | 6 | 875 | 194 | 2 | 5 | 3 | Apartamento | aguacatal | -76.55700 | 3.45900 |
| 1241 | Zona Sur | NA | 3 | 135 | 117 | NA | 2 | 3 | Apartamento | alameda | -76.51400 | 3.44100 |
| 5370 | Zona Sur | NA | 3 | 135 | 78 | NA | 1 | 3 | Apartamento | alameda | -76.53600 | 3.43600 |
| 6975 | Zona Sur | 06 | 4 | 220 | 75 | 1 | 2 | 3 | Apartamento | alférez real | -76.54627 | 3.39109 |
| tipo | n |
|---|---|
| Apartamento | 2787 |
| zona | n |
|---|---|
| Zona Sur | 2787 |
| estrato | n |
|---|---|
| 3 | 201 |
| 4 | 1091 |
| 5 | 1033 |
| 6 | 462 |
7.2 NUEVA APLICANDO EDA (base2)
7.3 Modelo lineal (base2)
| term | estimate | std.error | statistic | p.value |
|---|---|---|---|---|
| (Intercept) | -261.6250 | 15.6322 | -16.7363 | 0 |
| areaconst | 1.2850 | 0.0540 | 23.7853 | 0 |
| estrato | 60.8971 | 3.0841 | 19.7457 | 0 |
| habitaciones | -24.8369 | 3.8923 | -6.3811 | 0 |
| parqueaderos | 72.9147 | 3.9580 | 18.4223 | 0 |
| banios | 50.6967 | 3.3964 | 14.9267 | 0 |
7.4 Supuestos (base2)
| statistic | p.value | parameter | method |
|---|---|---|---|
| 754.8051 | 0 | 5 | studentized Breusch-Pagan test |
| statistic | p.value | method | alternative |
|---|---|---|---|
| 1.5333 | 0 | Durbin-Watson test | true autocorrelation is greater than 0 |
| Variable | VIF |
|---|---|
| areaconst | 2.067 |
| estrato | 1.545 |
| habitaciones | 1.429 |
| parqueaderos | 1.738 |
| banios | 2.529 |
7.5 Predicción Vivienda 2
| fit | lwr | upr |
|---|---|---|
| 675.0247 | 481.455 | 868.5945 |
| fit | lwr | upr |
|---|---|---|
| 735.9218 | 542.3141 | 929.5296 |
7.6 Ofertas Vivienda 2 (≤ 850 M) + mapa
| id | zona | barrio | preciom | areaconst | estrato | parqueaderos | banios | habitaciones |
|---|---|---|---|---|---|---|---|---|
| 7512 | Zona Sur | seminario | 670 | 300 | 5 | 3 | 5 | 6 |
| 8036 | Zona Sur | seminario | 530 | 256 | 5 | 3 | 5 | 5 |
Mapa
Siguiendo la misma metodología aplicada previamente, se construyó un modelo de regresión lineal múltiple para la segunda solicitud, correspondiente a la vivienda con crédito preaprobado de 850 millones de pesos.
En este caso, los resultados de diagnóstico evidencian algunos retos en la calidad del ajuste:
Heterocedasticidad: La prueba de Breusch-Pagan resulta altamente significativa (BP = 754.81, p < 0.001), indicando que la varianza de los residuos no es constante. Esto sugiere que el modelo podría estar sobre o subestimando la variabilidad del precio en ciertos rangos.
Autocorrelación: La prueba de Durbin-Watson (DW = 1.53, p < 0.001) confirma la presencia de autocorrelación positiva en los residuos, lo que implica que pueden existir patrones no capturados por las variables incluidas, posiblemente asociados a la localización geográfica o características omitidas del inmueble.
Multicolinealidad: Los valores de VIF se mantienen por debajo de 2.6, por lo que no se identifican problemas severos de colinealidad. Esto significa que las variables explicativas no están fuertemente correlacionadas entre sí y que los coeficientes estimados son relativamente estables.
COMENTARIOS
El análisis de las dos solicitudes evaluadas (350 millones y 850 millones) permitió evidenciar que, si bien el modelo de regresión lineal múltiple ofrece una aproximación inicial para la estimación del valor de las viviendas, presenta limitaciones que deben ser consideradas antes de utilizarlo como herramienta de apoyo para decisiones crediticias de alto impacto.
En ambos casos se identificaron signos de heterocedasticidad y autocorrelación positiva, lo que indica que el modelo no captura completamente la variabilidad ni las posibles dependencias espaciales o estructurales de los datos. Esto podría llevar a estimaciones sesgadas en ciertos segmentos del mercado, afectando la confiabilidad de la valoración.
Por otra parte, la multicolinealidad no representa un problema crítico, ya que los VIF se mantienen en rangos aceptables, lo que garantiza estabilidad en las estimaciones de los coeficientes.
En síntesis, el modelo resulta útil como punto de partida, pero requiere ajustes metodológicos adicionales para mejorar su precisión y robustez. Se recomienda:
Incorporar variables que representen mejor las características diferenciales de cada vivienda (ubicación geográfica, año de construcción, estado de conservación).
Evaluar transformaciones en la variable dependiente para mitigar la heterocedasticidad.
Considerar el uso de modelos robustos o espacialmente explícitos, especialmente cuando se analicen montos altos de crédito.
Resumen
Se evaluaron dos solicitudes de compra de vivienda en Cali para empleados de una compañía internacional. La primera solicitud corresponde a una casa en la zona norte con presupuesto de 350 millones. La segunda solicitud es para un apartamento en la zona sur con presupuesto de 850 millones.
1. Vivienda 1 – Casa, Zona Norte (Presupuesto: 350M)
• El análisis de mercado indica que una casa con las características solicitadas (200 m², estrato 4–5, 4 habitaciones, 2 baños, 1 parqueadero) tiene un valor estimado entre 312M y 393M. • Se identificaron cinco opciones viables en barrios como La Flora, Vipasa y El Bosque, todas en estrato 4–5 y dentro del rango de área solicitada.
• Recomendación: Las opciones disponibles permiten cumplir con el presupuesto de 350M, aunque en algunos casos el precio proyectado puede acercarse al límite superior. Se aconseja priorizar las ofertas en estrato 4, que se ajustan mejor al presupuesto y aún cumplen con las condiciones de área y número de habitaciones.
2. Vivienda 2 – Apartamento, Zona Sur (Presupuesto: 850M)
• El valor estimado para un apartamento de 300 m² en estratos 5–6 se encuentra en el rango de 675M a 735M, con intervalos que podrían llegar hasta 930M.
• Sin embargo, solo se encontraron 2 ofertas que cumplen plenamente las condiciones (área, estrato, número de habitaciones y parqueaderos). Ambas se ubican en el sector de Ciudad Jardín – Seminario, con precios entre 530M y 670M.
• Recomendación: ◦ Aunque hay menos opciones, estas alternativas se ajustan al presupuesto y superan en espacio y comodidades las condiciones mínimas solicitadas. ◦ Se sugiere considerar una negociación en estos proyectos, dado que ofrecen buen margen respecto al crédito aprobado.
Si se desea ampliar el portafolio de posibilidades, se recomienda flexibilizar el criterio de área (280–320 m²) o incluir apartamentos de estrato 4 alto en sectores consolidados del sur.
3. Observaciones Generales
• El análisis mostró que las viviendas en Cali presentan alta variabilidad en precios. Factores como ubicación exacta, acabados y estado de conservación influyen de forma significativa.
• Aunque los modelos estadísticos utilizados ofrecen un marco de referencia, existe un margen de incertidumbre amplio en las estimaciones. Esto implica que la decisión final debe apoyarse también en la evaluación cualitativa de cada inmueble.
• Se identificaron limitaciones en la información disponible: en el caso de los apartamentos del sur, la oferta es reducida, lo que obliga a manejar expectativas flexibles respecto a ubicación y características.
4. Conclusión
Para la Casa en Zona Norte (350M): hay disponibilidad de al menos cinco opciones viables y ajustadas al presupuesto, recomendando estrato 4 como la mejor relación calidad–precio.
Para el Apartamento en Zona Sur (850M): aunque hay solo dos opciones que cumplen estrictamente, ambas representan oportunidades atractivas, con posibilidad de negociación dentro del presupuesto aprobado.
• En ambos casos, se recomienda avanzar en visitas presenciales y negociaciones directas, complementando el análisis cuantitativo con la valoración cualitativa del entorno y estado de cada inmueble.