Unidad 2 - Informe C&A

Universidad Pontificia Javeriana Cali

Métodos estadísticos para la toma de decisiones

Catalina Gómez Vallejo

La agencia C&A (Casas y Apartamentos) recibio una solicitud de asesoria para la compra de dos viviendas por parte de una compañía internacional que desea ubicar a dos de sus empleados con sus familias en la ciudad. Las solicitudes incluyen las siguientes condiciones:
Vivienda 1: tipo=Casa, área construida=200, parqueaderos=1, baños=2, habitaciones=4, estrato=4 ó 5, zona=Norte, crédito preaprobado=350 millones
Vivienda 2: tipo=Apartamento, área construida=300, parqueaderos=3, baños=3, habitaciones=5, estrato=5 ó 6, zona=Sur, crédito preaprobado=850 millones
Con el objetivo de identificar potenciales ofertas de viviendas, se espera predecir el valor aproximado de una vivienda en la ciudad de cali segun los requerimientos del cliente; las estimaciones serviran de referencia para identificar potenciales ofertas segun su precio de venta. El modelo se ajusto con la data “vivienda” del paqueteMOD en el software R.

Solicitud vivienda 1 “Casas en la zona norte de la ciudad”

Para la solicitad de vivienda 1 “Casas”, se trabajo con un dataset que incluye solo viviendas de tipo casa de la zona Norte de la ciudad, y se ajusto un modelo de regresión lineal multiple con las covariables area construida, estrato socioeconomico, numero de parqueaderos y numero de baños, la variable numero de habitaciones no se considero para el ajuste del modelo porque no fue significativa.
De acuerdo a las estimaciones del modelo segun los requerimientos del cliente, para el estrato 4 las casas tienen un valor estimado de 313 millones aproximadamente (275 - 350 millones), y para el estrato 5 tienen un valor estimado de 378 millones aproximadamente (346 - 409 millones).
Con el objetivo de identificar las ofertas potenciales de la base de datos que contiene viviendas tipo Casas en la zona norte de la ciudad, nos interesan las que cumplan al menos con las especificaciones solicitadas por el cliente y que tengan como precio maximo de venta el valor estimado por el modelo segun el estrato socioeconomico.
Se calcula la diferencia entre el precio de venta y el precio estimado por el modelo, y con base en esta diferencia se seleccionan las viviendas a considerar para la oferta, del estrato 4 se selecciona la vivienda con ID=“1020” y del estrato 5 se seleccionan las viviendas con ID=“1009”, “1914” por tener mayor diferencia entre el precio de venta y el valor presupuestado por el cliente; del estrato 5 tambien se seleccionan la viviendas con ID=“3053” y “766” con base en que tienen una diferencia respecto al presupuesto en mas de 50 millones y el valor por metro cuadrado es bajo en comparación del resto de ofertas.
# Viviendas considerar id=(1020, 1009, 1914, 766, 3053)

baseSelec=subset(vivienda,id=="1020"|id=="1009"|id=="1914"|id=="766"|id=="3053")
head(baseSelec)
## # A tibble: 5 × 13
##      id zona     piso estrato preciom areaconst parqueaderos banios habitaciones
##   <dbl> <fct>   <dbl> <fct>     <dbl>     <dbl>        <dbl>  <dbl>        <dbl>
## 1  1009 Zona N…    NA 5           250       243            1      4            5
## 2  3053 Zona N…     2 5           320       230            2      4            4
## 3  1020 Zona N…     2 4           230       250            2      3            5
## 4   766 Zona N…    NA 5           321       249            1      5            5
## 5  1914 Zona N…     2 5           300       205            2      5            6
## # ℹ 4 more variables: tipo <fct>, barrio <fct>, longitud <dbl>, latitud <dbl>
require(leaflet)
leaflet() %>% addTiles %>%
  addCircleMarkers(lng = baseSelec$longitud,
                   lat = baseSelec$latitud)
Las opciones presentadas al cliente cumplen con los requerimientos solicitados por este, y adicionalmente tienen un precio considerablemente menor al estimado por el modelo y al credito hipotecario preaprobado para el cliente.

Solicitud vivienda 2 “Apartamentos en la zona sur de la ciudad”

Para la solicitad de vivienda 2 “Apartamentos”, se trabajo con un dataset que incluye solo viviendas de tipo apartamento de la zona Sur de la ciudad, y se ajusto un modelo de regresión lineal multiple con las covariables area construida, estrato socioeconomico, numero de parqueaderos, numero de baños y numero de habitaciones.
De acuerdo a las estimaciones del modelo segun los requerimientos del cliente, para el estrato 5 los apartamentos tienen un valor estimado de 635 millones aproximadamente (613 - 657 millones), y para el estrato 6 tienen un valor estimado de 788 millones aproximadamente (766 - 811 millones).
Con el objetivo de identificar las ofertas potenciales de la base de datos que contiene viviendas tipo apartamento en la zona sur de la ciudad, nos interesan las que cumplan al menos con las especificaciones solicitadas por el cliente y que tengan como precio maximo de venta el valor estimado por el modelo segun el estrato socieconomico; al evaluar la data con los apartamentos disponibles se tiene que no hay apartamentos que cumplan lo descrito anteriormente, por lo cual se toma como precio maximo de apartamento el valor del credito preaprobado del cliente (850 millones) para evaluar las ofertas potenciales.
En el estrato 5 los apartamentos que cumplen con el minimo de requerimientos del cliente y tiene un precio inferior a los 850 millones son las viviendas con id=“7512” y “7182”.
Para el estrato 6 con las especificaciones minimas requeridas no hay apartamentos por debajo del valor preaprobado del credito (850 millones), por lo cual, para poder considerar ofertas para el cliente se evaluan todas las zonas, y se omiten las especificaciones de cantidad de parqueaderos,cantidad de habitaciones y cantidad de baños; se garantiza un area construida mayor o igual a 300 metros cuadrados, viviendas tipo apartamentos y estrato 6 con un precio igual o inferior a 850 millones. Para seleccionar las ofertas del estrato 6 a considerar se tomo como criterio aquellas que tuvieran menor valor del metro cuadrado.
# Viviendas considerar id=(7512, 7182, 3479, 6888, 6383)

baseSelec2=subset(vivienda,id=="7512"|id=="7182"|id=="3479"|id=="6888"|id=="6383")
head(baseSelec2)
## # A tibble: 5 × 13
##      id zona     piso estrato preciom areaconst parqueaderos banios habitaciones
##   <dbl> <fct>   <dbl> <fct>     <dbl>     <dbl>        <dbl>  <dbl>        <dbl>
## 1  3479 Zona N…    NA 6           620       480           NA      5            5
## 2  6383 Zona O…     2 6           600       350            2      4            5
## 3  7182 Zona S…    NA 5           730       573            3      8            5
## 4  6888 Zona O…     2 6           590       355            2      4            4
## 5  7512 Zona S…    NA 5           670       300            3      5            6
## # ℹ 4 more variables: tipo <fct>, barrio <fct>, longitud <dbl>, latitud <dbl>
require(leaflet)
leaflet() %>% addTiles %>%
  addCircleMarkers(lng = baseSelec2$longitud,
                   lat = baseSelec2$latitud)
Las ofertas seleccionadas para el cliente se encuentran por debajo del valor preaprobado del credito para ambos requerimientos de vivienda; sin embargo, en las ofertas seleccionadas para los apartamentos no todas cumplen con las especificaciones del cliente, por lo cual se propone evaluar el orden de importancia de las especificaciones para el cliente, para determinar cual es la oferta que mas se ajusta.