Enunciado

Maria comenzó como agente de bienes raíces en Cali hace 10 años. Después de laborar dos años para una empresa nacional, se traslado a Bogotá y trabajó para otra agencia de bienes raíces. Sus amigos y familiares la convencieron de que con su experiencia y conocimientos del negocio debía abrir su propia agencia. Terminó por adquirir la licencia de intermediario y al poco tiempo fundó su propia compañía, C&A (Casas y Apartamentos) en Cali. Santiago y Lina, dos vendedores de la empresa anterior aceptaron trabajar en la nueva compaña. En la actualidad ocho agentes de bienes raíces colaboran con ella en C&A.

Actualmente las ventas de bienes raíces en Cali se han visto disminuidas de manera significativa en lo corrido del año. Durante este periodo muchas instituciones bancarias de ahorro y vivienda están prestando grandes sumas de dinero para la industria y la construcción comercial y residencial. Cuando el efecto producto de las tensiones políticas y sociales disminuya, se espera que la actividad económica de este sector se reactive.

Hace dos días, María recibió una carta solicitando asesoría para la compra de dos viviendas por parte de una compañía internacional que desea ubicar a dos de sus empleados con sus familias en la ciudad. Las solicitudes incluyen las siguientes condiciones:

Característica	Vivienda 1	Vivienda 2
Tipo	Casa	Apartamento
Área construida	200	300
Parqueaderos	1	3
Baños	2	3
Habitaciones	4	5
Estrato	4 o 5	5 o 6
Zona	Norte	Sur
Crédito preaprobado	350 millones	850 millones

Ayude a María a responder la solicitud, mediante técnicas modelación que usted conoce. Ella requiere le envíe un informe ejecutivo donde analice los dos casos y sus recomendaciones (Informe). Como soporte del informe debe anexar las estimaciones, validaciones y comparación de modelos requeridos (Anexos) .

Punto 1

Cargar los paquetes necesarios

En el desarrollo de este análisis se emplearon diversas librerías de R, cada una seleccionada por su funcionalidad específica y su aporte al flujo de trabajo estadístico y analítico.

dplyr se utilizó como herramienta principal para la manipulación y transformación de datos. Este paquete proporciona una gramática intuitiva que permite realizar operaciones de filtrado, selección, mutación, agrupamiento y resumen de datos de manera eficiente, facilitando la preparación de la información para los análisis posteriores.

ggplot2 fue implementado para la generación de gráficos estáticos de alta calidad bajo la filosofía de “The Grammar of Graphics”. Este paquete permite construir visualizaciones complejas a partir de componentes básicos, asegurando la reproducibilidad y claridad en la representación de los resultados.

plotly complementó el análisis visual al proporcionar herramientas para la creación de gráficos interactivos. Su integración con ggplot2 permite convertir visualizaciones estáticas en representaciones dinámicas, facilitando la exploración de datos y la comunicación de resultados de manera más accesible para el usuario final.

leaflet se empleó para la elaboración de mapas interactivos, permitiendo representar datos geoespaciales de forma dinámica. Este paquete facilita la incorporación de capas, marcadores y leyendas que enriquecen la interpretación de la información geográfica.

lmtest se utilizó para realizar pruebas estadísticas relacionadas con modelos de regresión lineal, incluyendo la verificación de supuestos clásicos como la heterocedasticidad y la autocorrelación de errores.

car aportó herramientas adicionales para el análisis de regresión y diagnóstico de modelos, como la evaluación de colinealidad y la obtención de intervalos de confianza para los coeficientes estimados.

broom permitió organizar y convertir los resultados de modelos estadísticos en estructuras de datos ordenadas (tidy), facilitando su posterior análisis, visualización y reporte.

scales se empleó para gestionar y personalizar escalas en las visualizaciones, permitiendo una representación más precisa y estética de los valores en gráficos y tablas.

Finalmente, paqueteMODELOS se utilizó como un paquete especializado que integra diversas funciones para la estimación, evaluación y comparación de modelos estadísticos, optimizando el proceso analítico mediante herramientas adaptadas a los objetivos específicos de este estudio.

Tambien se realizaron un filtro a la base de datos, incluyendo únicamente las ofertas de base1 correspondientes a casas ubicadas en la zona norte de la ciudad. Se presentan los tres primeros registros de la base y se construyen tablas que permiten comprobar la validez de la consulta.

Cargar datos vivienda desde paquete MODELOS

En esta etapa se realizó una limpieza y estandarización de los datos de la base vivienda, asegurando que la información estuviera correctamente estructurada para su análisis. Se homogeneizaron las categorías de las variables relacionadas con la ubicación y el tipo de vivienda, se corrigieron valores inconsistentes en la variable correspondiente al piso y se transformaron estas variables en factores para facilitar su interpretación estadística. Posteriormente, se generó una tabla que presenta las primeras observaciones de la base, ofreciendo una visión general de su estructura y contenido.

Tabla 1: Resumen de la estructura de la base de datos `vivienda`
id	zona	piso	estrato	preciom	areaconst	parqueaderos	banios	habitaciones	tipo	barrio	longitud	latitud
1147	Zona Oriente	NA	3	250	70	1	3	6	Casa	20 de julio	-76.51168	3.43382
1169	Zona Oriente	NA	3	320	120	1	2	3	Casa	20 de julio	-76.51237	3.43369
1350	Zona Oriente	NA	3	350	220	2	2	4	Casa	20 de julio	-76.51537	3.43566
5992	Zona Sur	02	4	400	280	3	5	3	Casa	3 de julio	-76.54000	3.43500
1212	Zona Norte	01	5	260	90	1	2	3	Apartamento	acopi	-76.51350	3.45891
1724	Zona Norte	01	5	240	87	1	3	3	Apartamento	acopi	-76.51700	3.36971

Tabla 2: Resumen de la variable Zona en la base de datos vivienda
	x
Zona Centro	124
Zona Norte	1920
Zona Oeste	1198
Zona Oriente	351
Zona Sur	4726
NA’s	3

Tabla 3: Resumen de la variable Tipo en la base de datos vivienda
	x
Apartamento	5100
Casa	3219
NA’s	3

Filtro a la base de datos

Se realizó un filtro a la base de datos de vivienda, seleccionando únicamente los registros correspondientes a casas ubicadas en la zona norte de la ciudad. Como resultado, se obtuvo la base base1, cuyas dimensiones son 722 filas por 13 columnas. Finalmente, se presentan los primeros registros de esta base filtrada para ilustrar la estructura de la información.

Tabla 4: Resumen de la estructura de la base de datos `base1`
id	zona	piso	estrato	preciom	areaconst	parqueaderos	banios	habitaciones	tipo	barrio	longitud	latitud
1209	Zona Norte	02	5	320	150	2	4	6	Casa	acopi	-76.51341	3.47968
1592	Zona Norte	02	5	780	380	2	3	3	Casa	acopi	-76.51674	3.48721
4057	Zona Norte	02	6	750	445	NA	7	6	Casa	acopi	-76.52950	3.38527
4460	Zona Norte	02	4	625	355	3	5	5	Casa	acopi	-76.53179	3.40590
6081	Zona Norte	02	5	750	237	2	6	6	Casa	acopi	-76.54044	3.36862
7824	Zona Norte	02	4	600	160	1	4	5	Casa	acopi	-76.55210	3.42125

Comprobación de resultados

Se construyen tablas de comprobación con el propósito de validar el filtro aplicado a la base base1. En primer lugar, la tabla de distribución por tipo de vivienda confirma que los 722 registros corresponden exclusivamente a casas. De igual forma, la tabla de distribución por zona muestra que la totalidad de las ofertas se encuentran en la zona norte de la ciudad, lo cual respalda la consistencia de la selección realizada. Finalmente, la tabla de estrato evidencia una mayor concentración de viviendas en los estratos 3 (235 registros) y 5 (271 registros), mientras que los estratos 4 (161 registros) y 6 (55 registros) presentan una menor participación relativa.

Tabla 5: Resumen del conteo por `tipo`
tipo	n
Casa	722

Tabla 6: Resumen del conteo por `zona`
zona	n
Zona Norte	722

Tabla 7: Resumen del conteo por `estrato`
estrato	n
3	235
4	161
5	271
6	55

Mapa de los puntos

Para complementar el análisis, se genera un mapa interactivo con los datos de la base, utilizando únicamente las viviendas que cuentan con coordenadas de latitud y longitud. En este mapa se ubican puntos que representan cada oferta, y al hacer clic sobre ellos se despliega información adicional como el barrio de localización, el precio en millones, el área construida y el estrato socioeconómico. Gracias a esta representación espacial es posible observar de manera más clara cómo se distribuyen las viviendas y verificar si realmente corresponden a la zona norte de la ciudad, se aprecia que existen registros que se alejan de la zona esperada.

Punto 2

Análisis de correlación

Para continuar con la exploración de los datos, se seleccionan algunas variables numéricas de la base base1 (precio, área construida, estrato, número de baños y número de habitaciones) con el fin de analizar sus relaciones. A partir de ellas se construye una matriz de correlaciones y se representa mediante un mapa de calor.

En los resultados se observa que el precio de la vivienda presenta una fuerte correlación positiva con el área construida (0.73) y con el estrato (0.61), lo que tiene sentido porque a mayor tamaño y mayor nivel socioeconómico, el precio tiende a aumentar. También aparece una relación moderada con el número de baños (0.52), aunque con las habitaciones la asociación es más débil (0.32). Por otro lado, el número de baños y habitaciones muestra una correlación relativamente alta entre sí (0.57), lo cual resulta lógico ya que viviendas con más cuartos suelen tener también más baños.

Análisis grafico

Con el fin de visualizar de manera más clara las relaciones entre el precio y otras características de las viviendas de la base, se construyen gráficos de dispersión acompañados de una línea de tendencia ajustada con regresión lineal. En cada gráfico se compara el precio con una de las variables: área construida, estrato, número de baños y número de habitaciones.

En general, los resultados muestran que el precio aumenta a medida que crece el área construida, confirmando la fuerte relación positiva encontrada en la matriz de correlaciones. Algo similar ocurre con el estrato, donde se aprecia una tendencia ascendente del precio en los niveles socioeconómicos más altos. En el caso del número de baños, también se observa una correlación positiva, aunque menos pronunciada. Finalmente, la relación con el número de habitaciones resulta más débil: si bien hay una leve tendencia, el precio no crece de manera tan marcada como en las otras variables.

Punto 3

Regresión lineal múltiple

Para analizar cómo se relacionan de manera conjunta las características de las viviendas con su precio, se estima un modelo de regresión lineal múltiple en el que la variable dependiente es el precio (millones de pesos), y las variables explicativas son el área construida, el estrato socioeconómico, el número de habitaciones, el número de parqueaderos y el número de baños.

Los resultados muestran que el modelo es globalmente significativo y logra explicar aproximadamente el 60% de la variabilidad del precio (R² = 0.60). Esto indica que, aunque el modelo capta gran parte de la relación entre las variables, todavía queda un 40% que depende de otros factores no incluidos (como ubicación exacta, antigüedad de la vivienda o acabados).

En cuanto a los coeficientes, se observa que:

Área construida: tiene un efecto positivo y altamente significativo. Por cada metro cuadrado adicional, el precio aumenta en promedio 0.68 millones de pesos. Esto confirma la lógica de que a mayor tamaño, mayor valor de la vivienda.
Estrato: también es muy significativo. Un aumento de una unidad en el estrato se asocia con un incremento de aproximadamente 80 millones de pesos en el precio, lo cual refleja el peso que tiene el nivel socioeconómico en la valoración del inmueble.
Habitaciones: no resulta estadísticamente significativo (p = 0.177), lo que sugiere que, al controlar por área, estrato, parqueaderos y baños, el número de cuartos no aporta una diferencia clara en el precio.
Parqueaderos: sí es significativo. Cada parqueadero adicional se asocia con un aumento promedio de 24 millones de pesos, lo que resulta lógico considerando la demanda de parqueaderos en ciertas zonas de la ciudad.
Baños: también es significativo. Cada baño adicional incrementa el precio en aproximadamente 19 millones de pesos, coherente con la percepción de comodidad que generan más baños en una vivienda.

Modelo de regresión:

Precio_m = β₀ + β₁·Área_const + β₂·Estrato + β₃·Habitaciones + β₄·Parqueaderos + β₅·Baños + ε

Tabla 8: Resumen de los coeficientes del modelo
term	estimate	std.error	statistic	p.value
(Intercept)	-238.1708979	44.4055069	-5.363544	0.0000001
areaconst	0.6767346	0.0528121	12.814001	0.0000000
estrato	80.6349477	9.8263227	8.206015	0.0000000
habitaciones	7.6451100	5.6587338	1.351028	0.1773984
parqueaderos	24.0059798	5.8688857	4.090381	0.0000514
banios	18.8993776	7.4880029	2.523954	0.0119643

Punto 4

Validación de supuestos (Base1)- PARTE A

Después de estimar el modelo, se realizó un análisis de los residuos para verificar los supuestos de la regresión lineal múltiple. En el gráfico de residuos vs. valores ajustados, se observa cierta dispersión desigual y una tendencia ligera en la parte derecha, lo que podría sugerir problemas de heterocedasticidad. Esto se confirma con la prueba de Breusch-Pagan, que resulta altamente significativa (BP = 80.28, p < 0.001), indicando que la varianza de los residuos no es constante.

En el Q-Q plot, los residuos siguen una tendencia cercana a la normalidad, aunque presentan desviaciones leves en las colas, lo que sugiere que la normalidad se cumple de manera aproximada, pero no perfecta.

El gráfico Scale-Location muestra un patrón ascendente en los residuos estandarizados a medida que aumentan los valores ajustados, reforzando la presencia de heterocedasticidad.

En el gráfico de residuos vs leverage, se identifican algunos puntos influyentes (como las observaciones 239, 309 y 393), aunque no parecen comprometer de forma crítica el ajuste del modelo.

La prueba de Durbin-Watson (DW = 1.76, p = 0.005) sugiere la presencia de autocorrelación positiva en los residuos, aunque no de gran magnitud.

Finalmente, los valores de VIF (todos menores a 2) indican que no existe un problema relevante de multicolinealidad entre las variables independientes, por lo que la estimación de los coeficientes no está distorsionada por colinealidad excesiva.

Sugerencias para mejorar el modelo

Corregir la heterocedasticidad:

Aplicar una transformación logarítmica al precio (log(preciom)) podría estabilizar la varianza de los residuos.
Alternativamente, utilizar una regresión robusta o estimadores con errores estándar robustos (como vcovHC en R) para ajustar la inferencia.

Atender la autocorrelación de los residuos:
- Incluir variables omitidas relacionadas con la localización o la antigüedad de la vivienda podría reducir la autocorrelación.
- En caso de que la autocorrelación sea espacial (probable en datos inmobiliarios), considerar un modelo de regresión espacial.
Examinar los puntos influyentes:
- Revisar las observaciones 239, 309 y 393 para verificar si corresponden a datos atípicos o errores de registro.
- Analizar si excluirlos o modelarlos aparte mejora el ajuste.
Explorar interacciones o no linealidades:
- Incluir términos cuadráticos para el área construida o interacciones entre estrato y área podría capturar mejor relaciones no lineales.

PARTE B

En primer lugar, la prueba de Breusch–Pagan (Tabla 9) arrojó un estadístico de 80.28 con un valor p de 0.000, lo que indica evidencia suficiente para rechazar la hipótesis nula de homocedasticidad. Esto sugiere la presencia de heterocedasticidad en los residuos, es decir, la varianza de los errores no es constante a lo largo de los valores ajustados.

En segundo lugar, la prueba de Durbin–Watson (Tabla 10) obtuvo un estadístico de 1.76 con un valor p de 0.0055, lo cual sugiere la existencia de autocorrelación positiva en los residuos del modelo. Este resultado es relevante especialmente si los datos presentan algún orden temporal o espacial.

Finalmente, los factores de inflación de varianza (VIF) (Tabla 11) se encuentran todos por debajo de 2, lo que indica que no existe multicolinealidad preocupante entre las variables explicativas. Esto significa que las variables independientes no presentan correlaciones excesivamente altas que puedan distorsionar las estimaciones de los coeficientes.

Tabla 9: Prueba de Breusch-Pagan
statistic	p.value	parameter	method
80.28083	0	5	studentized Breusch-Pagan test

Tabla 10: Prueba de Durbin-Watson
statistic	p.value	method	alternative
1.761505	0.0054722	Durbin-Watson test	true autocorrelation is greater than 0

Tabla 11: Factores de inflación de varianza (VIF)
	vif1
areaconst	1.460998
estrato	1.307757
habitaciones	1.721015
parqueaderos	1.226334
banios	1.967421

Punto 5

Predicción para Vivienda 1(Casa, Zona Norte, área=200, estrato 4 o 5, habitaciones=4, parqueaderos=1, baños=2)

Con el modelo de regresión ajustado, se procede a realizar la predicción del precio para una vivienda con las características planteadas inicialmente: 200 m² de área construida, 4 habitaciones, 1 parqueadero y 2 baños, variando únicamente el estrato socioeconómico entre 4 y 5.

Los resultados de la predicción son los siguientes:

Para estrato 4, el modelo estima un precio promedio de 312 millones de pesos, con un intervalo de predicción del 95% que va aproximadamente de 6 a 618 millones.
Para estrato 5, el precio promedio aumenta a 393 millones de pesos, con un intervalo de predicción entre 86 y 699 millones.

En ambos casos, se observa que el intervalo de predicción es bastante amplio, lo cual refleja la incertidumbre inherente al modelo y la dispersión de los datos. Sin embargo, el efecto esperado es consistente: al pasar de estrato 4 a estrato 5, el precio se incrementa en cerca de 80 millones, coherente con la magnitud estimada para la variable estrato en el modelo previo.

Tabla 12: Primera predicción
fit	lwr	upr
312.101	6.205196	617.9968

Tabla 13: Primera predicción
fit	lwr	upr
392.7359	86.19637	699.2755

Punto 6

Ofertas para Vivienda 1 (≤ 350 M) + mapa (≥5 si hay)

PARTE A

Tabla 14: Ofertas para Vivienda 1 (≤ 350 M) + mapa (≥5 si hay)
id	zona	barrio	preciom	areaconst	estrato	parqueaderos	banios	habitaciones
1343	Zona Norte	la flora	320	200	5	2	4	4
1144	Zona Norte	la merced	320	200	4	2	4	4
4210	Zona Norte	el bosque	350	200	5	3	3	4
4267	Zona Norte	el bosque	335	202	5	1	4	5
1887	Zona Norte	vipasa	340	203	5	2	3	4

PARTE B

Punto 7

Repetir 1–6 para Vivienda 2(Apartamento, Zona Sur, área=300, estrato 5 o 6, parqueaderos≥3, baños≥3, habitaciones≥5, ≤ 850 M)

7.1 Filtro base2 + verificación + mapa

|> Dimensiones base2 (Apto, Zona Sur): 2787 filas x 13 columnas

Tabla 15: Base de datos 2 Apartamentos en la Zona Sur
id	zona	piso	estrato	preciom	areaconst	parqueaderos	banios	habitaciones	tipo	barrio	longitud	latitud
5098	Zona Sur	05	4	290	96	1	2	3	Apartamento	acopi	-76.53464	3.44987
698	Zona Sur	02	3	78	40	1	1	2	Apartamento	aguablanca	-76.50100	3.40000
8199	Zona Sur	NA	6	875	194	2	5	3	Apartamento	aguacatal	-76.55700	3.45900
1241	Zona Sur	NA	3	135	117	NA	2	3	Apartamento	alameda	-76.51400	3.44100
5370	Zona Sur	NA	3	135	78	NA	1	3	Apartamento	alameda	-76.53600	3.43600
6975	Zona Sur	06	4	220	75	1	2	3	Apartamento	alf√©rez real	-76.54627	3.39109

Tabla 16: Variable tipo de la base de datos 2
tipo	n
Apartamento	2787

Tabla 16: Variable zona de la base de datos 2
zona	n
Zona Sur	2787

Tabla 16: Variable estrato de la base de datos 2
estrato	n
3	201
4	1091
5	1033
6	462

7.2 NUEVA APLICANDO EDA (base2)

7.3 Modelo lineal (base2)

Tabla 17: Resultados del modelo de regresión lineal (mod2)
term	estimate	std.error	statistic
(Intercept)	-261.6250	15.6322	-16.7363
areaconst	1.2850	0.0540	23.7853
estrato	60.8971	3.0841	19.7457
habitaciones	-24.8369	3.8923	-6.3811
parqueaderos	72.9147	3.9580	18.4223
banios	50.6967	3.3964	14.9267

7.4 Supuestos (base2)

Tabla 18: Prueba de Breusch-Pagan para heterocedasticidad
statistic	p.value	parameter	method
754.8051	0	5	studentized Breusch-Pagan test

Tabla 19: Prueba de Durbin-Watson para autocorrelación
statistic	p.value	method	alternative
1.5333	0	Durbin-Watson test	true autocorrelation is greater than 0

Tabla 20: Factores de Inflación de Varianza (VIF)
Variable	VIF
areaconst	2.067
estrato	1.545
habitaciones	1.429
parqueaderos	1.738
banios	2.529

7.5 Predicción Vivienda 2

Tabla 18: primera predicción con el modelo 2 estrato 5
fit	lwr	upr
675.0247	481.455	868.5945

Tabla 18: segunda predicción con el modelo 2 estrato 6
fit	lwr	upr
735.9218	542.3141	929.5296

7.6 Ofertas Vivienda 2 (≤ 850 M) + mapa

Tabla 19: segunda predicción con el modelo 2 estrato 6
id	zona	barrio	preciom	areaconst	estrato	parqueaderos	banios	habitaciones
7512	Zona Sur	seminario	670	300	5	3	5	6
8036	Zona Sur	seminario	530	256	5	3	5	5

Mapa

Siguiendo la misma metodología aplicada previamente, se construyó un modelo de regresión lineal múltiple para la segunda solicitud, correspondiente a la vivienda con crédito preaprobado de 850 millones de pesos.

En este caso, los resultados de diagnóstico evidencian algunos retos en la calidad del ajuste:

Heterocedasticidad: La prueba de Breusch-Pagan resulta altamente significativa (BP = 754.81, p < 0.001), indicando que la varianza de los residuos no es constante. Esto sugiere que el modelo podría estar sobre o subestimando la variabilidad del precio en ciertos rangos.
Autocorrelación: La prueba de Durbin-Watson (DW = 1.53, p < 0.001) confirma la presencia de autocorrelación positiva en los residuos, lo que implica que pueden existir patrones no capturados por las variables incluidas, posiblemente asociados a la localización geográfica o características omitidas del inmueble.
Multicolinealidad: Los valores de VIF se mantienen por debajo de 2.6, por lo que no se identifican problemas severos de colinealidad. Esto significa que las variables explicativas no están fuertemente correlacionadas entre sí y que los coeficientes estimados son relativamente estables.

COMENTARIOS

El análisis de las dos solicitudes evaluadas (350 millones y 850 millones) permitió evidenciar que, si bien el modelo de regresión lineal múltiple ofrece una aproximación inicial para la estimación del valor de las viviendas, presenta limitaciones que deben ser consideradas antes de utilizarlo como herramienta de apoyo para decisiones crediticias de alto impacto.

En ambos casos se identificaron signos de heterocedasticidad y autocorrelación positiva, lo que indica que el modelo no captura completamente la variabilidad ni las posibles dependencias espaciales o estructurales de los datos. Esto podría llevar a estimaciones sesgadas en ciertos segmentos del mercado, afectando la confiabilidad de la valoración.

Por otra parte, la multicolinealidad no representa un problema crítico, ya que los VIF se mantienen en rangos aceptables, lo que garantiza estabilidad en las estimaciones de los coeficientes.

En síntesis, el modelo resulta útil como punto de partida, pero requiere ajustes metodológicos adicionales para mejorar su precisión y robustez. Se recomienda:

Incorporar variables que representen mejor las características diferenciales de cada vivienda (ubicación geográfica, año de construcción, estado de conservación).
Evaluar transformaciones en la variable dependiente para mitigar la heterocedasticidad.
Considerar el uso de modelos robustos o espacialmente explícitos, especialmente cuando se analicen montos altos de crédito.

Resumen

Se evaluaron dos solicitudes de compra de vivienda en Cali para empleados de una compañía internacional. La primera solicitud corresponde a una casa en la zona norte con presupuesto de 350 millones. La segunda solicitud es para un apartamento en la zona sur con presupuesto de 850 millones.

1. Vivienda 1 – Casa, Zona Norte (Presupuesto: 350M)

• El análisis de mercado indica que una casa con las características solicitadas (200 m², estrato 4–5, 4 habitaciones, 2 baños, 1 parqueadero) tiene un valor estimado entre 312M y 393M. • Se identificaron cinco opciones viables en barrios como La Flora, Vipasa y El Bosque, todas en estrato 4–5 y dentro del rango de área solicitada.

• Recomendación: Las opciones disponibles permiten cumplir con el presupuesto de 350M, aunque en algunos casos el precio proyectado puede acercarse al límite superior. Se aconseja priorizar las ofertas en estrato 4, que se ajustan mejor al presupuesto y aún cumplen con las condiciones de área y número de habitaciones.

2. Vivienda 2 – Apartamento, Zona Sur (Presupuesto: 850M)

• El valor estimado para un apartamento de 300 m² en estratos 5–6 se encuentra en el rango de 675M a 735M, con intervalos que podrían llegar hasta 930M.

• Sin embargo, solo se encontraron 2 ofertas que cumplen plenamente las condiciones (área, estrato, número de habitaciones y parqueaderos). Ambas se ubican en el sector de Ciudad Jardín – Seminario, con precios entre 530M y 670M.

• Recomendación: ◦ Aunque hay menos opciones, estas alternativas se ajustan al presupuesto y superan en espacio y comodidades las condiciones mínimas solicitadas. ◦ Se sugiere considerar una negociación en estos proyectos, dado que ofrecen buen margen respecto al crédito aprobado.

Si se desea ampliar el portafolio de posibilidades, se recomienda flexibilizar el criterio de área (280–320 m²) o incluir apartamentos de estrato 4 alto en sectores consolidados del sur.

3. Observaciones Generales

• El análisis mostró que las viviendas en Cali presentan alta variabilidad en precios. Factores como ubicación exacta, acabados y estado de conservación influyen de forma significativa.

• Aunque los modelos estadísticos utilizados ofrecen un marco de referencia, existe un margen de incertidumbre amplio en las estimaciones. Esto implica que la decisión final debe apoyarse también en la evaluación cualitativa de cada inmueble.

• Se identificaron limitaciones en la información disponible: en el caso de los apartamentos del sur, la oferta es reducida, lo que obliga a manejar expectativas flexibles respecto a ubicación y características.

4. Conclusión

Para la Casa en Zona Norte (350M): hay disponibilidad de al menos cinco opciones viables y ajustadas al presupuesto, recomendando estrato 4 como la mejor relación calidad–precio.
Para el Apartamento en Zona Sur (850M): aunque hay solo dos opciones que cumplen estrictamente, ambas representan oportunidades atractivas, con posibilidad de negociación dentro del presupuesto aprobado.

• En ambos casos, se recomienda avanzar en visitas presenciales y negociaciones directas, complementando el análisis cuantitativo con la valoración cualitativa del entorno y estado de cada inmueble.

ACTIVIDAD 2

ACTIVIDAD 2

Enunciado

Punto 1

Cargar los paquetes necesarios

Cargar datos vivienda desde paquete MODELOS

Filtro a la base de datos

Comprobación de resultados

Mapa de los puntos

Punto 2

Análisis de correlación

Análisis grafico

Punto 3

Regresión lineal múltiple

Punto 4

Validación de supuestos (Base1)- PARTE A

Sugerencias para mejorar el modelo

PARTE B

Punto 5

Predicción para Vivienda 1(Casa, Zona Norte, área=200, estrato 4 o 5, habitaciones=4, parqueaderos=1, baños=2)

Punto 6

Ofertas para Vivienda 1 (≤ 350 M) + mapa (≥5 si hay)

PARTE A

PARTE B

Punto 7

Repetir 1–6 para Vivienda 2(Apartamento, Zona Sur, área=300, estrato 5 o 6, parqueaderos≥3, baños≥3, habitaciones≥5, ≤ 850 M)

7.1 Filtro base2 + verificación + mapa

7.2 NUEVA APLICANDO EDA (base2)

7.3 Modelo lineal (base2)

7.4 Supuestos (base2)

7.5 Predicción Vivienda 2

7.6 Ofertas Vivienda 2 (≤ 850 M) + mapa

Mapa

COMENTARIOS

Resumen

1. Vivienda 1 – Casa, Zona Norte (Presupuesto: 350M)

2. Vivienda 2 – Apartamento, Zona Sur (Presupuesto: 850M)

3. Observaciones Generales

4. Conclusión