Maria comenzó como agente de bienes raíces en Cali hace 10 años. Después de laborar dos años para una empresa nacional, se traslado a Bogotá y trabajó para otra agencia de bienes raíces. Sus amigos y familiares la convencieron de que con su experiencia y conocimientos del negocio debía abrir su propia agencia. Terminó por adquirir la licencia de intermediario y al poco tiempo fundó su propia compañía, C&A (Casas y Apartamentos) en Cali. Santiago y Lina, dos vendedores de la empresa anterior aceptaron trabajar en la nueva compaña. En la actualidad ocho agentes de bienes raíces colaboran con ella en C&A.
Actualmente las ventas de bienes raíces en Cali se han visto disminuidas de manera significativa en lo corrido del año. Durante este periodo muchas instituciones bancarias de ahorro y vivienda están prestando grandes sumas de dinero para la industria y la construcción comercial y residencial. Cuando el efecto producto de las tensiones políticas y sociales disminuya, se espera que la actividad económica de este sector se reactive.
Hace dos días, María recibió una carta solicitando asesoría para la compra de dos viviendas por parte de una compañía internacional que desea ubicar a dos de sus empleados con sus familias en la ciudad. Las solicitudes incluyen las siguientes condiciones:
| Caracteristicas | Vivienda_1 | Vivienda_2 |
|---|---|---|
| Tipo | Casa | Apartamento |
| Área construida | 200 | 300 |
| Parqueaderos | 1 | 3 |
| Baños | 2 | 3 |
| Habitaciones | 4 | 5 |
| Estrato | 4 o 5 | 5 o 6 |
| Zona | Norte | Sur |
| Crédito preaprobado | 350 millones | 850 millones |
Ayude a María a responder la solicitud, mediante técnicas modelación que usted conoce. Ella requiere le envíe un informe ejecutivo donde analice los dos casos y sus recomendaciones (Informe). Como soporte del informe debe anexar las estimaciones, validaciones y comparación de modelos requeridos (Anexos)
| id | zona | piso | estrato | preciom | areaconst | parqueaderos | banios | habitaciones | tipo | barrio | longitud | latitud |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1147 | Zona Oriente | NA | 3 | 250 | 70 | 1 | 3 | 6 | Casa | 20 de julio | -76.51168 | 3.43382 |
| 1169 | Zona Oriente | NA | 3 | 320 | 120 | 1 | 2 | 3 | Casa | 20 de julio | -76.51237 | 3.43369 |
| 1350 | Zona Oriente | NA | 3 | 350 | 220 | 2 | 2 | 4 | Casa | 20 de julio | -76.51537 | 3.43566 |
| 5992 | Zona Sur | 02 | 4 | 400 | 280 | 3 | 5 | 3 | Casa | 3 de julio | -76.54000 | 3.43500 |
| 1212 | Zona Norte | 01 | 5 | 260 | 90 | 1 | 2 | 3 | Apartamento | acopi | -76.51350 | 3.45891 |
| 1724 | Zona Norte | 01 | 5 | 240 | 87 | 1 | 3 | 3 | Apartamento | acopi | -76.51700 | 3.36971 |
| id | zona | piso | estrato | preciom | areaconst | parqueaderos | banios | habitaciones | tipo | barrio | longitud | latitud |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1209 | Zona Norte | 02 | 5 | 320 | 150 | 2 | 4 | 6 | Casa | acopi | -76.51341 | 3.47968 |
| 1592 | Zona Norte | 02 | 5 | 780 | 380 | 2 | 3 | 3 | Casa | acopi | -76.51674 | 3.48721 |
| 4057 | Zona Norte | 02 | 6 | 750 | 445 | NA | 7 | 6 | Casa | acopi | -76.52950 | 3.38527 |
Con el fin de verificar la composición de la base de datos original, se presentan las tablas de frecuencia para las variables tipo de vivienda y zona. Posteriormente, se muestran las mismas tablas para la base filtrada, donde se seleccionaron únicamente viviendas tipo Casa ubicadas en la Zona Norte.
| Tipo de vivienda | Frecuencia |
|---|---|
| Apartamento | 5100 |
| Casa | 3219 |
| Zona de la vivienda | Frecuencia |
|---|---|
| Zona Centro | 124 |
| Zona Norte | 1920 |
| Zona Oeste | 1198 |
| Zona Oriente | 351 |
| Zona Sur | 4726 |
| Tipo de vivienda | Frecuencia |
|---|---|
| Casa | 722 |
| Zona de la vivienda | Frecuencia |
|---|---|
| Zona Norte | 722 |
Se observa que después del filtrado todos los registros en total 722 corresponden a viviendas tipo Casa ubicadas en la Zona Norte, lo cual confirma que la consulta realizada sobre la base de datos se ejecutó correctamente.
Se realiza el mapa geografico para visualizar la distribución espacial de los registros filtrados
El mapa geográfico permite visualizar la distribución espacial de las viviendas ofertadas. Se observa que la mayoría de los puntos se concentran en sectores correspondientes a la zona norte de la ciudad. Se visualizan algunos registros ligeramente fuera de esta zona, lo cual puede explicarse por errores en el registro de coordenadas o por diferencias en los límites administrativos de las zonas urbanas.
| preciom | areaconst | estrato | banios | habitaciones | parqueaderos | |
|---|---|---|---|---|---|---|
| preciom | 1.000 | 0.685 | 0.528 | 0.509 | 0.365 | 0.412 |
| areaconst | 0.685 | 1.000 | 0.354 | 0.457 | 0.421 | 0.307 |
| estrato | 0.528 | 0.354 | 1.000 | 0.351 | 0.058 | 0.261 |
| banios | 0.509 | 0.457 | 0.351 | 1.000 | 0.590 | 0.392 |
| habitaciones | 0.365 | 0.421 | 0.058 | 0.590 | 1.000 | 0.241 |
| parqueaderos | 0.412 | 0.307 | 0.261 | 0.392 | 0.241 | 1.000 |
El análisis exploratorio muestra una relación positiva entre el precio de la vivienda y el área construida, indicando que viviendas con mayor área tienden a tener precios más elevados.
También se observa que el estrato socioeconómico presenta una relación directa con el precio, lo cual es consistente con el mercado inmobiliario, donde zonas de mayor estrato presentan valores de vivienda superiores.
Las variables número de baños, habitaciones y parqueaderos también muestran tendencias positivas con respecto al precio, aunque con mayor dispersión. Esto sugiere que dichas características influyen en el valor del inmueble, pero posiblemente con menor peso que el área construida o la ubicación socioeconómica.
Modelo solicitado:
\[\text{precio} = f(\text{area}, \text{estrato}, \text{habitaciones}, \text{parqueaderos}, \text{banios})\]
| term | estimate | std.error | statistic | p.value |
|---|---|---|---|---|
| (Intercept) | -238.171 | 44.406 | -5.364 | 0.000 |
| areaconst | 0.677 | 0.053 | 12.814 | 0.000 |
| estrato | 80.635 | 9.826 | 8.206 | 0.000 |
| habitaciones | 7.645 | 5.659 | 1.351 | 0.177 |
| parqueaderos | 24.006 | 5.869 | 4.090 | 0.000 |
| banios | 18.899 | 7.488 | 2.524 | 0.012 |
El modelo de regresión lineal múltiple fue estimado con el objetivo de explicar el precio de la vivienda (en millones de pesos) en función de características estructurales del inmueble, como el área construida, el estrato socioeconómico, el número de habitaciones, parqueaderos y baños.
De acuerdo con los resultados obtenidos:
Área construida (areaconst) presenta un coeficiente positivo de 0.677, lo que indica que, manteniendo constantes las demás variables, un incremento de un metro cuadrado en el área construida aumenta el precio de la vivienda en aproximadamente 0.677 millones de pesos. Esta variable resulta estadísticamente significativa (p < 0.05).
Estrato muestra un coeficiente positivo de 80.635, indicando que un aumento de un nivel en el estrato socioeconómico incrementa el precio esperado de la vivienda en aproximadamente 80.6 millones de pesos, manteniendo las demás variables constantes. Esta variable también es estadísticamente significativa.
Número de habitaciones presenta un coeficiente positivo de 7.645, lo que sugiere que un mayor número de habitaciones tiende a aumentar el precio de la vivienda. Sin embargo, su valor p (0.177) indica que no es estadísticamente significativa al nivel del 5%, por lo que su efecto en el modelo es menos concluyente.
Número de parqueaderos tiene un coeficiente de 24.006, lo que indica que cada parqueadero adicional incrementa el precio estimado de la vivienda en aproximadamente 24 millones de pesos. Esta variable es estadísticamente significativa.
Número de baños presenta un coeficiente de 18.899, lo que sugiere que cada baño adicional incrementa el precio de la vivienda en aproximadamente 18.9 millones de pesos, siendo también estadísticamente significativa.
A partir de los coeficientes estimados se obtiene la siguiente ecuación de regresión:
\[ Precio = -238.171 + 0.677(areaconst) + 80.635(estrato) + 7.645(habitaciones) + 24.006(parqueaderos) + 18.899(baños) \] Esta ecuación permite estimar el precio de una vivienda a partir de sus características estructurales y socioeconómicas. Cada coeficiente representa el cambio esperado en el precio de la vivienda ante un aumento de una unidad en la variable correspondiente, manteniendo constantes las demás variables.
Las medidas de ajuste del modelo son las siguientes:
| r.squared | adj.r.squared | sigma | statistic | p.value |
|---|---|---|---|---|
| 0.604 | 0.599 | 155.115 | 130.919 | 0 |
El coeficiente de determinación R² = 0.604 indica que aproximadamente el 60.4% de la variabilidad del precio de las viviendas es explicada por las variables incluidas en el modelo.
El R² ajustado (0.599) muestra un valor muy cercano, lo que sugiere que el modelo tiene un buen nivel de ajuste sin presentar sobreajuste importante.
Adicionalmente, el estadístico F del modelo resulta significativo (p < 0.05), lo cual indica que el conjunto de variables explicativas incluidas en el modelo contribuye de manera significativa a explicar la variabilidad del precio de las viviendas.
En general, los resultados son coherentes con la lógica del mercado inmobiliario, ya que variables como el área construida, el estrato socioeconómico, el número de parqueaderos y el número de baños influyen de manera significativa en el valor de las viviendas.
Con base en este modelo se procederá a realizar la validación de los supuestos de regresión y posteriormente a estimar el precio de las viviendas solicitadas por el cliente.
Con el fin de evaluar la validez del modelo de regresión lineal múltiple estimado, se realizó la verificación de los principales supuestos del modelo.
En particular, se analizaron los supuestos de linealidad, normalidad de los residuos, homocedasticidad e identificación de observaciones influyentes. Para ello se presentan los gráficos diagnósticos generados a partir del modelo ajustado.
En el grafico Residuals vs Fitted se observa que los residuos se distribuyen alrededor de la línea horizontal, aunque se aprecia una ligera tendencia creciente en la dispersión a medida que aumentan los valores ajustados. Esto podría sugerir una posible heterocedasticidad moderada, es decir, variación no constante de los residuos.
En el grafico Q-Q Plot de residuos se observa que la mayoría de los puntos se ubican cerca de la línea diagonal, lo que indica que los residuos siguen razonablemente una distribución normal. Sin embargo, en los extremos se presentan algunas desviaciones que podrían estar asociadas a la presencia de valores atípicos.
En el grafico Scale-Location se observa una ligera tendencia ascendente en la dispersión de los residuos, lo que sugiere que la variabilidad de los errores podría aumentar con el valor predicho del precio de la vivienda.
En el grafico Residuals vs Leverage se observa que la mayoría de los puntos presentan valores de leverage bajos, lo cual indica que no influyen de manera significativa en el modelo. Sin embargo, algunos puntos aislados podrían representar observaciones potencialmente influyentes que sería conveniente analizar con mayor detalle.
En general, los gráficos de diagnóstico indican que el modelo cumple razonablemente con los supuestos básicos de la regresión lineal. No obstante, se observa una ligera evidencia de heterocedasticidad y la presencia de algunos posibles valores atípicos.
Se realizará la predicción de acuerdo con las caracteristicas de la primera solicitud.
| Caracteristicas | Vivienda_1 |
|---|---|
| Tipo | Casa |
| Área construida | 200 |
| Parqueaderos | 1 |
| Baños | 2 |
| Habitaciones | 4 |
| Estrato | 4 o 5 |
| Zona | Norte |
| Crédito preaprobado | 350 millones |
| areaconst | estrato | habitaciones | parqueaderos | banios | Precio_Estimado |
|---|---|---|---|---|---|
| 200 | 4 | 4 | 1 | 2 | 312,101 |
La predicción anterior corresponde a la estimación del precio de una vivienda nueva con características similares a las solicitadas por el cliente, utilizando el modelo de regresión estimado.
Con base en el modelo estimado, el precio esperado para una vivienda con área construida de 200 m², 4 habitaciones, 2 baños y 1 parqueadero se estima en aproximadamente 312 millones de pesos.
Con el fin de identificar posibles alternativas que cumplan con las condiciones de la primera solicitud, se realizó un filtrado de la base de datos considerando las viviendas cuyo precio sea menor o igual a 350 millones de pesos, correspondiente al crédito preaprobado por la empresa.
A partir de este filtro se identificaron varias viviendas potenciales que cumplen con la restricción presupuestal. En la siguiente tabla se presentan algunas de las ofertas disponibles junto con sus principales características.
| id | areaconst | estrato | habitaciones | banios | parqueaderos | preciom | latitud | longitud |
|---|---|---|---|---|---|---|---|---|
| 1144 | 200 | 4 | 4 | 4 | 2 | 320 | 3.48029 | -76.51156 |
| 2837 | 207 | 4 | 4 | 4 | NA | 340 | 3.42056 | -76.52222 |
| 4511 | 190 | 4 | 3 | 2 | NA | 275 | 3.45165 | -76.53198 |
| 5412 | 180 | 4 | 3 | 3 | NA | 280 | 3.38595 | -76.53635 |
| 515 | 180 | 4 | 4 | 3 | NA | 280 | 3.46882 | -76.49796 |
En la tabla se presentan cinco ofertas potenciales que se ajustan al presupuesto máximo de 350 millones de pesos. Se observa que las viviendas presentan áreas construidas entre aproximadamente 180 y 207 metros cuadrados, con estrato socioeconómico 4, lo cual coincide con las condiciones solicitadas para la primera vivienda.
En cuanto a las características internas, las viviendas cuentan con entre 3 y 4 habitaciones y entre 2 y 4 baños, lo cual resulta adecuado para una familia. Los precios de las ofertas oscilan entre 275 y 340 millones de pesos, por lo que todas se encuentran dentro del límite del crédito preaprobado.
Estas opciones representan alternativas viables que podrían ser consideradas por la empresa para la adquisición de la primera vivienda solicitada, se observa que la solicitud con ID 1144 cumple con todos los requisitos propuestos para la vivienda 1
Con el fin de visualizar la ubicación geográfica de estas viviendas, a continuación se presenta un mapa con la localización de las ofertas potenciales identificadas.
A continuación se repite el procedimiento anterior para la segunda solicitud, correspondiente a un apartamento ubicado en la zona sur de la ciudad, con un presupuesto máximo de 850 millones de pesos.
| term | estimate | std.error | statistic | p.value |
|---|---|---|---|---|
| (Intercept) | -261.625 | 15.632 | -16.736 | 0 |
| areaconst | 1.285 | 0.054 | 23.785 | 0 |
| estrato | 60.897 | 3.084 | 19.746 | 0 |
| habitaciones | -24.837 | 3.892 | -6.381 | 0 |
| parqueaderos | 72.915 | 3.958 | 18.422 | 0 |
| banios | 50.697 | 3.396 | 14.927 | 0 |
Los resultados del modelo de regresión muestran que variables como el área construida, el estrato socioeconómico, el número de parqueaderos y el número de baños tienen un efecto positivo sobre el precio estimado de la vivienda. Esto indica que, en general, a mayor área, mayor estrato o mayor cantidad de estas características, se espera un incremento en el valor del inmueble.
Por otra parte, el coeficiente asociado al número de habitaciones presenta un efecto negativo en este caso particular, lo cual puede deberse a relaciones entre variables o a características específicas de las viviendas presentes en la base de datos.
En general, los coeficientes estimados son estadísticamente significativos (p-value cercano a 0), lo que sugiere que las variables incluidas en el modelo contribuyen de manera importante a explicar el comportamiento del precio de las viviendas.
A partir de los coeficientes estimados se obtiene la siguiente ecuación de regresión:
\[ Precio = -261.625 + 1.285(areaconst) + 60.897(estrato) - 24.837(habitaciones) + 72.915(parqueaderos) + 50.697(baños) \] A continuación, se realiza el resumen de valoracion de la vivienda 2.
| areaconst | estrato | habitaciones | parqueaderos | banios | Precio_Estimado2 |
|---|---|---|---|---|---|
| 300 | 5 | 5 | 3 | 3 | 675,0247 |
Utilizando el modelo de regresión estimado se calculó el precio esperado para una vivienda con las características solicitadas por el cliente (300 m² de área construida, estrato 5, cinco habitaciones, tres parqueaderos y tres baños).
El modelo estima un precio aproximado de 675 millones de pesos, valor que se encuentra dentro del presupuesto máximo disponible de 850 millones. Este resultado permite orientar la búsqueda hacia viviendas con características similares dentro del mercado inmobiliario.
| id | areaconst | estrato | habitaciones | banios | parqueaderos | preciom | latitud | longitud |
|---|---|---|---|---|---|---|---|---|
| 7512 | 300.00 | 5 | 6 | 5 | 3 | 670 | 3.40900 | -76.55000 |
| 8113 | 295.55 | 5 | 4 | 4 | 2 | 410 | 3.40750 | -76.55527 |
| 7742 | 288.00 | 5 | 4 | 5 | 1 | 490 | 3.40856 | -76.55175 |
| 7658 | 320.00 | 5 | 4 | 4 | 2 | 520 | 3.40900 | -76.55100 |
| 5306 | 275.00 | 5 | 5 | 5 | 2 | 650 | 3.38597 | -76.53569 |
A partir del presupuesto disponible y de las características solicitadas, se filtraron las viviendas disponibles en la base de datos cuyo precio es menor o igual a 850 millones de pesos.
Las alternativas presentadas corresponden a viviendas ubicadas en la zona sur y con características similares a las requeridas. Estas opciones representan posibles inmuebles que podrían ajustarse a las necesidades del cliente y al valor estimado por el modelo.
La opción con ID 7512 es la más cercana a las características solicitadas, ya que posee un área construida similar, estrato 5 y tres parqueaderos.
A partir del análisis realizado mediante regresión lineal múltiple se identificó que variables como el área construida, el estrato socioeconómico, el número de parqueaderos y el número de baños influyen significativamente en el precio de las viviendas.
El modelo obtenido permite explicar aproximadamente el 60% de la variabilidad del precio de los inmuebles analizados, lo cual representa un ajuste razonable considerando la complejidad del mercado inmobiliario.
Con base en las predicciones realizadas y las ofertas disponibles en la base de datos, se identificaron alternativas que cumplen con las condiciones establecidas por la empresa para ambas solicitudes de vivienda.
Estas herramientas de modelación permiten apoyar la toma de decisiones en la selección de inmuebles que se ajusten tanto a las características solicitadas como a las restricciones presupuestales de los clientes.