Carga de datos y EDA

El primer paso es cargar los datos para realizar las primeras exploraciones, al igual que las librerías, las cuales son cruciales para el desarrollo de estas actividades.

## utf8      (1.2.4  -> 1.2.6) [CRAN]
## tibble    (3.2.1  -> 3.3.0) [CRAN]
## rlang     (1.1.4  -> 1.1.6) [CRAN]
## purrr     (1.0.4  -> 1.1.0) [CRAN]
## cli       (3.6.3  -> 3.6.5) [CRAN]
## Rcpp      (1.0.14 -> 1.1.0) [CRAN]
## curl      (6.2.2  -> 7.0.0) [CRAN]
## xfun      (0.52   -> 0.53 ) [CRAN]
## magick    (2.8.6  -> 2.8.7) [CRAN]
## checkmate (2.3.2  -> 2.3.3) [CRAN]
## 
##   There are binary versions available but the source versions are later:
##           binary source needs_compilation
## utf8       1.2.4  1.2.6              TRUE
## tibble     3.2.1  3.3.0              TRUE
## rlang      1.1.5  1.1.6              TRUE
## purrr      1.0.4  1.1.0              TRUE
## cli        3.6.4  3.6.5              TRUE
## Rcpp      1.0.14  1.1.0              TRUE
## curl       6.2.2  7.0.0              TRUE
## xfun        0.52   0.53              TRUE
## magick     2.8.6  2.8.7              TRUE
## checkmate  2.3.2  2.3.3              TRUE
## 
##   Binaries will be installed
## package 'utf8' successfully unpacked and MD5 sums checked
## package 'tibble' successfully unpacked and MD5 sums checked
## package 'rlang' successfully unpacked and MD5 sums checked
## package 'purrr' successfully unpacked and MD5 sums checked
## package 'cli' successfully unpacked and MD5 sums checked
## package 'Rcpp' successfully unpacked and MD5 sums checked
## package 'curl' successfully unpacked and MD5 sums checked
## package 'xfun' successfully unpacked and MD5 sums checked
## package 'magick' successfully unpacked and MD5 sums checked
## package 'checkmate' successfully unpacked and MD5 sums checked
## 
## The downloaded binary packages are in
##  C:\Users\melos\AppData\Local\Temp\Rtmpasp1GE\downloaded_packages
## ── R CMD build ─────────────────────────────────────────────────────────────────
##       ✔  checking for file 'C:\Users\melos\AppData\Local\Temp\Rtmpasp1GE\remotes9b015197fbe\Centromagis-paqueteMODELOS-3b06257/DESCRIPTION' (337ms)
##       ─  preparing 'paqueteMODELOS': (4.4s)
##    checking DESCRIPTION meta-information ...  ✔  checking DESCRIPTION meta-information
##       ─  checking for LF line-endings in source and make files and shell scripts
##       ─  checking for empty or unneeded directories
##       ─  building 'paqueteMODELOS_0.1.0.tar.gz'
##      
## 
##        id           zona               piso              estrato     
##  Min.   :   1   Length:8322        Length:8322        Min.   :3.000  
##  1st Qu.:2080   Class :character   Class :character   1st Qu.:4.000  
##  Median :4160   Mode  :character   Mode  :character   Median :5.000  
##  Mean   :4160                                         Mean   :4.634  
##  3rd Qu.:6240                                         3rd Qu.:5.000  
##  Max.   :8319                                         Max.   :6.000  
##  NA's   :3                                            NA's   :3      
##     preciom         areaconst       parqueaderos        banios      
##  Min.   :  58.0   Min.   :  30.0   Min.   : 1.000   Min.   : 0.000  
##  1st Qu.: 220.0   1st Qu.:  80.0   1st Qu.: 1.000   1st Qu.: 2.000  
##  Median : 330.0   Median : 123.0   Median : 2.000   Median : 3.000  
##  Mean   : 433.9   Mean   : 174.9   Mean   : 1.835   Mean   : 3.111  
##  3rd Qu.: 540.0   3rd Qu.: 229.0   3rd Qu.: 2.000   3rd Qu.: 4.000  
##  Max.   :1999.0   Max.   :1745.0   Max.   :10.000   Max.   :10.000  
##  NA's   :2        NA's   :3        NA's   :1605     NA's   :3       
##   habitaciones        tipo              barrio             longitud     
##  Min.   : 0.000   Length:8322        Length:8322        Min.   :-76.59  
##  1st Qu.: 3.000   Class :character   Class :character   1st Qu.:-76.54  
##  Median : 3.000   Mode  :character   Mode  :character   Median :-76.53  
##  Mean   : 3.605                                         Mean   :-76.53  
##  3rd Qu.: 4.000                                         3rd Qu.:-76.52  
##  Max.   :10.000                                         Max.   :-76.46  
##  NA's   :3                                              NA's   :3       
##     latitud     
##  Min.   :3.333  
##  1st Qu.:3.381  
##  Median :3.416  
##  Mean   :3.418  
##  3rd Qu.:3.452  
##  Max.   :3.498  
##  NA's   :3

Estos son todos los datos disponibles en la base de datos de la inmobiliaria. Con esta se presentarán las mejores opciones para que los clientes puedan tomar una decisión, según sus necesidades y requerimientos, entendiendo que son dos perfiles distintos. De los más de ocho mil inmuebles disponibles para alquilar, entre casas y apartamentos, se presentarán dos opciones de cada tipo para los clientes, según sus necesidades.

## # A tibble: 5 × 5
## # Groups:   geo_ns [3]
##   geo_ns tipo            n prec_prom area_prom
##   <fct>  <fct>       <int>     <dbl>     <dbl>
## 1 Norte  Apartamento  2350      441.     129. 
## 2 Norte  Casa         1290      470.     270. 
## 3 Sur    Apartamento  2750      304.      98.9
## 4 Sur    Casa         1929      587.     275. 
## 5 <NA>   <NA>            3      330      NaN
##              preciom areaconst estrato parqueaderos banios habitaciones
## preciom         1.00      0.69    0.61         0.69   0.67         0.26
## areaconst       0.69      1.00    0.27         0.58   0.65         0.52
## estrato         0.61      0.27    1.00         0.42   0.42        -0.07
## parqueaderos    0.69      0.58    0.42         1.00   0.57         0.28
## banios          0.67      0.65    0.42         0.57   1.00         0.59
## habitaciones    0.26      0.52   -0.07         0.28   0.59         1.00

Lo primero que hay que entender es que hay una relación directa entre el tamaño del inmueble con otras características. Por ejemplo, si es más grande, tiene más baños, más habitaciones, pero también son más caros. En el último gráfico se puede ver que pasa algo muy similar entre los inmuebles del norte y los de sur, viendo solo en el área construida, pero la relación es similar en el sentido que el costo incrementa en la medida en que el tamaño lo hace, en términos generales.

Ahora bien, para el caso del norte hay una serie de viviendas que podrían, tentativamente, interesar a los clientes, las cuales se muestran a continuación.

Ahora, para el caso del sur, aquellas unidades familiares que pueden ser del interés de los clientes pueden ser las siguientes:

Zona sur

Modelo de regresión lineal múltiple

Ah

## 
## Call:
## lm(formula = preciom ~ areaconst + estrato + habitaciones + parqueaderos + 
##     banios + tipo + geo_ns, data = mod_df)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -1470.89   -85.53   -15.92    53.63  1060.50 
## 
## Coefficients:
##                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  -346.20120   14.46857 -23.928  < 2e-16 ***
## areaconst       0.88496    0.02323  38.102  < 2e-16 ***
## estrato        92.78062    2.90684  31.918  < 2e-16 ***
## habitaciones  -27.69114    2.29788 -12.051  < 2e-16 ***
## parqueaderos   75.63424    2.56394  29.499  < 2e-16 ***
## banios         63.55267    2.61533  24.300  < 2e-16 ***
## tipoCasa      -37.05984    6.05203  -6.124 9.67e-10 ***
## geo_nsSur     -43.39076    4.39514  -9.872  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 175.1 on 6709 degrees of freedom
## Multiple R-squared:  0.727,  Adjusted R-squared:  0.7267 
## F-statistic:  2553 on 7 and 6709 DF,  p-value: < 2.2e-16
## 
## Call:
## lm(formula = preciom ~ (areaconst + estrato + habitaciones + 
##     parqueaderos + banios) * geo_ns + tipo, data = mod_df)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -1477.85   -84.61   -15.37    54.02  1041.54 
## 
## Coefficients:
##                          Estimate Std. Error t value Pr(>|t|)    
## (Intercept)            -3.650e+02  2.095e+01 -17.424  < 2e-16 ***
## areaconst               8.771e-01  3.414e-02  25.688  < 2e-16 ***
## estrato                 9.446e+01  4.103e+00  23.022  < 2e-16 ***
## habitaciones           -3.996e+01  3.334e+00 -11.984  < 2e-16 ***
## parqueaderos            8.139e+01  4.036e+00  20.164  < 2e-16 ***
## banios                  7.690e+01  4.030e+00  19.080  < 2e-16 ***
## geo_nsSur              -7.149e+00  2.853e+01  -0.251    0.802    
## tipoCasa               -2.958e+01  6.123e+00  -4.831 1.39e-06 ***
## areaconst:geo_nsSur     6.368e-04  4.424e-02   0.014    0.989    
## estrato:geo_nsSur      -5.239e+00  5.615e+00  -0.933    0.351    
## habitaciones:geo_nsSur  2.213e+01  4.473e+00   4.948 7.70e-07 ***
## parqueaderos:geo_nsSur -7.144e+00  5.238e+00  -1.364    0.173    
## banios:geo_nsSur       -2.416e+01  5.286e+00  -4.572 4.93e-06 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 174.4 on 6704 degrees of freedom
## Multiple R-squared:  0.7297, Adjusted R-squared:  0.7292 
## F-statistic:  1508 on 12 and 6704 DF,  p-value: < 2.2e-16
## Analysis of Variance Table
## 
## Model 1: preciom ~ areaconst + estrato + habitaciones + parqueaderos + 
##     banios + tipo + geo_ns
## Model 2: preciom ~ (areaconst + estrato + habitaciones + parqueaderos + 
##     banios) * geo_ns + tipo
##   Res.Df       RSS Df Sum of Sq     F    Pr(>F)    
## 1   6709 205789251                                 
## 2   6704 203799613  5   1989638 13.09 1.045e-12 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##         df      AIC
## m_base   9 88466.40
## m_inter 14 88411.15

Estos resultados nos plantean una serie de relaciones que son valiosas para este informe. Tanto en el norte como en el sur hay variación en el precio del inmueble según el tamaño del mismo, como ocurre también con el estrato, que aunque es simplemente una clasificación socioeconómica sí tiene efecto en el precio del inmueble. Sin embargo, también hay diferencias. Por ejemplo, se puede ver que en el norte mayor número de habitaciones no necesariamente quiere decir un mayor precio del inmueble, puesto que no necesariamente quiere decir que hay mayor área construida.

Por otra parte, se puede considerar cuando se itera con la zona, pues la correlación se incremente ligeramente (pasa de 0,727 a 0,729). Adicionalmente, se observa que en el sur las habitaciones ayudan a incrementar el precio del inmueble a diferencia del norte, quizá por lo ya mencionado en el párrafo anterior.

## 
## Call:
## lm(formula = preciom ~ areaconst + estrato + habitaciones + parqueaderos + 
##     banios, data = .)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -1124.39  -115.51   -15.25    73.40  1002.99 
## 
## Coefficients:
##                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  -308.41669   37.78895  -8.162 1.18e-15 ***
## areaconst       0.67668    0.04612  14.671  < 2e-16 ***
## estrato       105.88442    8.13837  13.011  < 2e-16 ***
## habitaciones  -18.85326    4.82441  -3.908    1e-04 ***
## parqueaderos   52.18947    5.70682   9.145  < 2e-16 ***
## banios         40.89261    6.56022   6.233 7.17e-10 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 201.6 on 853 degrees of freedom
## Multiple R-squared:  0.6404, Adjusted R-squared:  0.6383 
## F-statistic: 303.8 on 5 and 853 DF,  p-value: < 2.2e-16
## 
## Call:
## lm(formula = preciom ~ areaconst + estrato + habitaciones + parqueaderos + 
##     banios, data = .)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -1112.58   -44.27    -2.57    41.56   901.76 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  -266.3560    17.0642 -15.609  < 2e-16 ***
## areaconst       1.3121     0.0576  22.780  < 2e-16 ***
## estrato        60.2635     3.3263  18.117  < 2e-16 ***
## habitaciones  -28.1764     4.2658  -6.605 4.92e-11 ***
## parqueaderos   83.5884     4.5680  18.299  < 2e-16 ***
## banios         51.5682     3.6690  14.055  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 105.5 on 2296 degrees of freedom
## Multiple R-squared:  0.7465, Adjusted R-squared:  0.746 
## F-statistic:  1352 on 5 and 2296 DF,  p-value: < 2.2e-16

En este último punto se puede observar de manera más sencilla lo que anteriormente se dijo, ya que se hace un modelo por zona. Por ejemplo, aunque hay un R2 menor para el norte, se puede observar que en esta zona un incremento del tamaño del inmueble significa un aumento en el precio 0,68 millones por metro cuadrado, mientras que en el sur es de 1,31 millones; aunque en el norte el estrato hace que varíe más el avalúo de una casa, a diferencia del sur, donde el impacto es menor. Sin embargo, donde sí hay relación similar es en el número de habitaciones, el cual no es necesariamente determinante en el precio que tiene un bien inmueble.

Esta separación de los datos que se hace es para poder interpretar mejor los datos por zona.

Validación de supuestos

##           areaconst             estrato        habitaciones        parqueaderos 
##            5.348053            3.352769            4.572020            4.554126 
##              banios              geo_ns                tipo    areaconst:geo_ns 
##            6.836449           43.649825            1.931179            8.761471 
##      estrato:geo_ns habitaciones:geo_ns parqueaderos:geo_ns       banios:geo_ns 
##           42.414454           18.516565            9.988841           23.113875
## 
##  studentized Breusch-Pagan test
## 
## data:  m_inter
## BP = 1338.3, df = 12, p-value < 2.2e-16

##    4   35   37   62   71   72   75  104  117  132  157  166  167  170  187  202 
##    4   35   37   62   71   72   75  104  117  132  157  166  167  170  187  202 
##  208  210  211  214  223  236  239  244  258  268  328  333  372  378  379  386 
##  208  210  211  214  223  236  239  244  258  268  328  333  372  378  379  386 
##  539  561  579  602  605  634  639  658  721  730  817  825  840  841  846  848 
##  539  561  579  602  605  634  639  658  721  730  817  825  840  841  846  848 
##  854  861  866  875  896  899  901  902  903  905  912  918  922  942  947  951 
##  854  861  866  875  896  899  901  902  903  905  912  918  922  942  947  951 
##  961  963  968  984  988  989  992  996  997 1003 1026 1027 1028 1068 1070 1071 
##  961  963  968  984  988  989  992  996  997 1003 1026 1027 1028 1068 1070 1071 
## 1075 1089 1111 1144 1154 1168 1170 1194 1228 1231 1235 1238 1239 1252 1256 1258 
## 1075 1089 1111 1144 1154 1168 1170 1194 1228 1231 1235 1238 1239 1252 1256 1258 
## 1270 1275 1282 1290 1292 1293 1298 1299 1307 1311 1313 1315 1317 1318 1323 1369 
## 1270 1275 1282 1290 1292 1293 1298 1299 1307 1311 1313 1315 1317 1318 1323 1369 
## 1379 1406 1438 1460 1479 1487 1494 1497 1499 1597 1600 1602 1613 1614 1624 1703 
## 1379 1406 1438 1460 1479 1487 1494 1497 1499 1597 1600 1602 1613 1614 1624 1703 
## 1800 1807 1850 1856 1874 1876 1880 1887 1897 1950 1981 2015 2032 2050 2056 2058 
## 1800 1807 1850 1856 1874 1876 1880 1887 1897 1950 1981 2015 2032 2050 2056 2058 
## 2059 2067 2094 2095 2097 2106 2107 2184 2197 2199 2205 2206 2208 2238 2239 2247 
## 2059 2067 2094 2095 2097 2106 2107 2184 2197 2199 2205 2206 2208 2238 2239 2247 
## 2250 2258 2286 2297 2299 2304 2315 2355 2436 2449 2454 2460 2477 2528 2531 2556 
## 2250 2258 2286 2297 2299 2304 2315 2355 2436 2449 2454 2460 2477 2528 2531 2556 
## 2559 2560 2561 2575 2577 2607 2615 2623 2629 2640 2655 2678 2683 2690 2703 2722 
## 2559 2560 2561 2575 2577 2607 2615 2623 2629 2640 2655 2678 2683 2690 2703 2722 
## 2727 2728 2731 2737 2743 2744 2944 2948 2975 2986 2995 2997 3011 3012 3016 3038 
## 2727 2728 2731 2737 2743 2744 2944 2948 2975 2986 2995 2997 3011 3012 3016 3038 
## 3065 3191 3200 3206 3220 3223 3227 3261 3269 3329 3333 3354 3355 3368 3392 3397 
## 3065 3191 3200 3206 3220 3223 3227 3261 3269 3329 3333 3354 3355 3368 3392 3397 
## 3440 3443 3454 3455 3504 3546 3549 3582 3596 3630 3638 3646 3647 3670 3681 3698 
## 3440 3443 3454 3455 3504 3546 3549 3582 3596 3630 3638 3646 3647 3670 3681 3698 
## 3702 3703 3704 3707 3710 3715 3731 3732 3737 3738 3749 3763 3766 3773 3779 3783 
## 3702 3703 3704 3707 3710 3715 3731 3732 3737 3738 3749 3763 3766 3773 3779 3783 
## 3789 3791 3792 3793 3800 3819 3823 3830 3832 3836 3837 3840 3850 3851 3854 3872 
## 3789 3791 3792 3793 3800 3819 3823 3830 3832 3836 3837 3840 3850 3851 3854 3872 
## 3967 3978 3987 3990 3992 3993 3994 3996 3998 4008 4010 4012 4013 4017 4018 4023 
## 3967 3978 3987 3990 3992 3993 3994 3996 3998 4008 4010 4012 4013 4017 4018 4023 
## 4025 4030 4033 4034 4036 4046 4052 4059 4073 4074 4075 4076 4082 4083 4091 4093 
## 4025 4030 4033 4034 4036 4046 4052 4059 4073 4074 4075 4076 4082 4083 4091 4093 
## 4098 4116 4121 4124 4125 4134 4136 4141 4144 4169 4179 4180 4246 4260 4268 4269 
## 4098 4116 4121 4124 4125 4134 4136 4141 4144 4169 4179 4180 4246 4260 4268 4269 
## 4271 4272 4275 4276 4278 4279 4280 4281 4302 4304 4305 4309 4320 4322 4323 4336 
## 4271 4272 4275 4276 4278 4279 4280 4281 4302 4304 4305 4309 4320 4322 4323 4336 
## 4338 4342 4347 4349 4362 4376 4379 4381 4386 4387 4392 4393 4394 4400 4401 4409 
## 4338 4342 4347 4349 4362 4376 4379 4381 4386 4387 4392 4393 4394 4400 4401 4409 
## 4414 4416 4422 4434 4438 4440 4441 4445 4450 4459 4480 4499 4500 4502 4517 4571 
## 4414 4416 4422 4434 4438 4440 4441 4445 4450 4459 4480 4499 4500 4502 4517 4571 
## 4586 4587 4596 4605 4706 4722 4725 4728 4730 4731 4732 4733 4742 4750 4752 4783 
## 4586 4587 4596 4605 4706 4722 4725 4728 4730 4731 4732 4733 4742 4750 4752 4783 
## 4786 4800 4801 4810 4837 4846 4848 4853 4859 4873 4875 4923 4933 4995 5005 5010 
## 4786 4800 4801 4810 4837 4846 4848 4853 4859 4873 4875 4923 4933 4995 5005 5010 
## 5014 5022 5028 5032 5034 5045 5053 5054 5057 5078 5082 5086 5092 5094 5095 5096 
## 5014 5022 5028 5032 5034 5045 5053 5054 5057 5078 5082 5086 5092 5094 5095 5096 
## 5103 5105 5115 5117 5119 5123 5124 5126 5127 5132 5133 5137 5144 5165 5170 5179 
## 5103 5105 5115 5117 5119 5123 5124 5126 5127 5132 5133 5137 5144 5165 5170 5179 
## 5183 5211 5223 5233 5248 5249 5250 5253 5255 5260 5262 5266 5267 5269 5275 5276 
## 5183 5211 5223 5233 5248 5249 5250 5253 5255 5260 5262 5266 5267 5269 5275 5276 
## 5278 5282 5284 5291 5298 5302 5303 5310 5324 5333 5338 5339 5344 5351 5357 5362 
## 5278 5282 5284 5291 5298 5302 5303 5310 5324 5333 5338 5339 5344 5351 5357 5362 
## 5371 5377 5379 5382 5384 5387 5388 5437 5438 5439 5442 5467 5482 5486 5515 5530 
## 5371 5377 5379 5382 5384 5387 5388 5437 5438 5439 5442 5467 5482 5486 5515 5530 
## 5531 5532 5533 5535 5571 5579 5602 5604 5624 5667 5895 5896 5911 6104 6269 6384 
## 5531 5532 5533 5535 5571 5579 5602 5604 5624 5667 5895 5896 5911 6104 6269 6384 
## 6468 6469 6471 6476 6495 6514 6535 6537 6552 6577 6580 6592 6619 6645 6654 6664 
## 6468 6469 6471 6476 6495 6514 6535 6537 6552 6577 6580 6592 6619 6645 6654 6664 
## 6692 6713 6714 6715 
## 6692 6713 6714 6715
## 
## Call:
## lm(formula = log(preciom) ~ log(areaconst) + log(estrato + 1) + 
##     log(habitaciones + 1) + log(parqueaderos + 1) + log(banios + 
##     1) + geo_ns + tipo, data = mod_df)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -1.4777 -0.1524  0.0008  0.1460  1.2010 
## 
## Coefficients:
##                        Estimate Std. Error t value Pr(>|t|)    
## (Intercept)            0.807068   0.044313  18.213   <2e-16 ***
## log(areaconst)         0.517196   0.009186  56.302   <2e-16 ***
## log(estrato + 1)       1.188819   0.023392  50.821   <2e-16 ***
## log(habitaciones + 1) -0.171910   0.016166 -10.634   <2e-16 ***
## log(parqueaderos + 1)  0.321980   0.013123  24.536   <2e-16 ***
## log(banios + 1)        0.350853   0.016360  21.445   <2e-16 ***
## geo_nsSur             -0.056189   0.006299  -8.920   <2e-16 ***
## tipoCasa              -0.084073   0.009216  -9.122   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.247 on 6709 degrees of freedom
## Multiple R-squared:  0.8456, Adjusted R-squared:  0.8455 
## F-statistic:  5250 on 7 and 6709 DF,  p-value: < 2.2e-16
## Analysis of Variance Table
## 
## Response: preciom
##                Df    Sum Sq   Mean Sq    F value    Pr(>F)    
## areaconst       1 352697775 352697775 11498.4109 < 2.2e-16 ***
## estrato         1 136103985 136103985  4437.1688 < 2.2e-16 ***
## habitaciones    1      4098      4098     0.1336    0.7147    
## parqueaderos    1  37528998  37528998  1223.4947 < 2.2e-16 ***
## banios          1  16950731  16950731   552.6161 < 2.2e-16 ***
## tipo            1   1832533   1832533    59.7430 1.239e-14 ***
## geo_ns          1   2989601   2989601    97.4649 < 2.2e-16 ***
## Residuals    6709 205789251     30674                         
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##             df        AIC
## m_base       9 88466.4035
## m_inter_log  9   285.7566
##        log(areaconst)      log(estrato + 1) log(habitaciones + 1) 
##              3.874711              1.785578              2.110599 
## log(parqueaderos + 1)       log(banios + 1)                geo_ns 
##              2.005952              2.961664              1.060660 
##                  tipo 
##              2.180438
## 
##  studentized Breusch-Pagan test
## 
## data:  m_inter_log
## BP = 450.59, df = 7, p-value < 2.2e-16

##    1    2    4   14   35   37   62   72  113  114  117  132  133  136  140  142 
##    1    2    4   14   35   37   62   72  113  114  117  132  133  136  140  142 
##  143  153  160  162  167  170  173  210  214  217  242  268  330  332  369  371 
##  143  153  160  162  167  170  173  210  214  217  242  268  330  332  369  371 
##  372  379  386  405  411  415  420  424  426  461  504  507  539  561  567  568 
##  372  379  386  405  411  415  420  424  426  461  504  507  539  561  567  568 
##  605  639  644  658  664  671  674  726  729  730  816  817  840  854  866  868 
##  605  639  644  658  664  671  674  726  729  730  816  817  840  854  866  868 
##  884  896  899  903  912  947  961  963  988  997 1003 1008 1027 1028 1051 1068 
##  884  896  899  903  912  947  961  963  988  997 1003 1008 1027 1028 1051 1068 
## 1069 1144 1168 1170 1212 1213 1258 1270 1290 1298 1299 1311 1356 1358 1393 1406 
## 1069 1144 1168 1170 1212 1213 1258 1270 1290 1298 1299 1311 1356 1358 1393 1406 
## 1438 1479 1487 1497 1499 1522 1584 1597 1600 1602 1613 1614 1620 1624 1643 1677 
## 1438 1479 1487 1497 1499 1522 1584 1597 1600 1602 1613 1614 1620 1624 1643 1677 
## 1688 1699 1703 1713 1776 1779 1780 1824 1835 1838 1839 1849 1850 1853 1874 1937 
## 1688 1699 1703 1713 1776 1779 1780 1824 1835 1838 1839 1849 1850 1853 1874 1937 
## 2015 2032 2042 2056 2067 2088 2093 2094 2095 2098 2106 2107 2205 2206 2208 2214 
## 2015 2032 2042 2056 2067 2088 2093 2094 2095 2098 2106 2107 2205 2206 2208 2214 
## 2238 2239 2243 2247 2250 2297 2304 2324 2355 2430 2436 2439 2441 2449 2460 2461 
## 2238 2239 2243 2247 2250 2297 2304 2324 2355 2430 2436 2439 2441 2449 2460 2461 
## 2477 2483 2501 2517 2528 2530 2559 2560 2561 2562 2594 2598 2600 2601 2607 2615 
## 2477 2483 2501 2517 2528 2530 2559 2560 2561 2562 2594 2598 2600 2601 2607 2615 
## 2621 2623 2629 2643 2677 2683 2690 2722 2728 2743 2744 2813 2888 2894 2943 2986 
## 2621 2623 2629 2643 2677 2683 2690 2722 2728 2743 2744 2813 2888 2894 2943 2986 
## 2995 2997 3011 3012 3021 3038 3065 3120 3156 3190 3191 3198 3203 3208 3219 3220 
## 2995 2997 3011 3012 3021 3038 3065 3120 3156 3190 3191 3198 3203 3208 3219 3220 
## 3223 3227 3230 3254 3265 3267 3269 3298 3307 3314 3330 3350 3392 3395 3440 3449 
## 3223 3227 3230 3254 3265 3267 3269 3298 3307 3314 3330 3350 3392 3395 3440 3449 
## 3454 3455 3493 3503 3504 3538 3549 3562 3564 3582 3596 3630 3636 3638 3646 3670 
## 3454 3455 3493 3503 3504 3538 3549 3562 3564 3582 3596 3630 3636 3638 3646 3670 
## 3681 3683 3690 3703 3704 3738 3741 3766 3791 3792 3832 3840 3851 3853 3863 3872 
## 3681 3683 3690 3703 3704 3738 3741 3766 3791 3792 3832 3840 3851 3853 3863 3872 
## 3905 3916 3946 3985 3987 3992 3993 3998 4010 4025 4034 4082 4083 4098 4121 4125 
## 3905 3916 3946 3985 3987 3992 3993 3998 4010 4025 4034 4082 4083 4098 4121 4125 
## 4179 4180 4246 4260 4271 4281 4302 4304 4322 4336 4338 4347 4362 4364 4379 4381 
## 4179 4180 4246 4260 4271 4281 4302 4304 4322 4336 4338 4347 4362 4364 4379 4381 
## 4386 4393 4401 4416 4445 4450 4459 4465 4517 4562 4586 4587 4596 4605 4704 4706 
## 4386 4393 4401 4416 4445 4450 4459 4465 4517 4562 4586 4587 4596 4605 4704 4706 
## 4722 4725 4726 4730 4731 4732 4733 4734 4737 4742 4743 4744 4747 4751 4758 4769 
## 4722 4725 4726 4730 4731 4732 4733 4734 4737 4742 4743 4744 4747 4751 4758 4769 
## 4771 4780 4786 4788 4794 4801 4837 4846 4848 4853 4872 4873 4875 4880 4905 4906 
## 4771 4780 4786 4788 4794 4801 4837 4846 4848 4853 4872 4873 4875 4880 4905 4906 
## 4921 4927 4933 4945 4947 4964 4995 5014 5034 5045 5049 5054 5057 5078 5082 5092 
## 4921 4927 4933 4945 4947 4964 4995 5014 5034 5045 5049 5054 5057 5078 5082 5092 
## 5094 5095 5103 5105 5106 5115 5119 5123 5124 5126 5127 5132 5133 5134 5137 5142 
## 5094 5095 5103 5105 5106 5115 5119 5123 5124 5126 5127 5132 5133 5134 5137 5142 
## 5144 5208 5248 5249 5250 5266 5267 5269 5275 5298 5302 5310 5338 5339 5379 5388 
## 5144 5208 5248 5249 5250 5266 5267 5269 5275 5298 5302 5310 5338 5339 5379 5388 
## 5437 5441 5449 5467 5482 5486 5515 5531 5532 5535 5571 5579 5602 5620 5624 5625 
## 5437 5441 5449 5467 5482 5486 5515 5531 5532 5535 5571 5579 5602 5620 5624 5625 
## 5628 5680 5802 5911 6104 6269 6328 6384 6469 6476 6489 6495 6509 6514 6535 6537 
## 5628 5680 5802 5911 6104 6269 6328 6384 6469 6476 6489 6495 6509 6514 6535 6537 
## 6552 6580 6590 6602 6615 6619 6638 6645 6656 6664 6689 6714 
## 6552 6580 6590 6602 6615 6619 6638 6645 6656 6664 6689 6714
##   intercept     RMSE  Rsquared      MAE   RMSESD RsquaredSD    MAESD
## 1      TRUE 175.1295 0.7272463 112.9962 13.00119 0.03015782 6.136839
##   alpha   lambda
## 2   0.1 1.314196
##    alpha      lambda     RMSE  Rsquared      MAE   RMSESD RsquaredSD    MAESD
## 1    0.1   0.5688843 175.1280 0.7272548 112.8767 12.95340 0.03001410 6.125369
## 2    0.1   1.3141964 175.1280 0.7272548 112.8767 12.95340 0.03001410 6.125369
## 3    0.1   3.0359642 175.1320 0.7272502 112.8439 12.94070 0.02997552 6.121745
## 4    0.1   7.0134711 175.1832 0.7271755 112.6672 12.87115 0.02976233 6.100064
## 5    0.1  16.2020278 175.4762 0.7267218 112.3875 12.73928 0.02934332 6.072193
## 6    0.1  37.4287857 176.8276 0.7246316 112.2806 12.54573 0.02866458 5.927078
## 7    0.1  86.4653494 181.6566 0.7179210 113.7923 12.43963 0.02819294 5.693804
## 8    0.1 199.7461717 193.7312 0.7125708 123.0850 12.59784 0.02877446 5.827159
## 9    0.2   0.5688843 175.1303 0.7272475 112.8725 12.95924 0.03002638 6.126576
## 10   0.2   1.3141964 175.1303 0.7272475 112.8725 12.95924 0.03002638 6.126576
## 11   0.2   3.0359642 175.1421 0.7272281 112.8019 12.93488 0.02994916 6.118807
## 12   0.2   7.0134711 175.2368 0.7270625 112.5960 12.85794 0.02970183 6.094239
## 13   0.2  16.2020278 175.7441 0.7261511 112.3433 12.70714 0.02919317 6.057950
## 14   0.2  37.4287857 178.0411 0.7219071 112.6902 12.48279 0.02833693 5.869171
## 15   0.2  86.4653494 184.1682 0.7149424 115.2883 12.45776 0.02843655 5.694852
## 16   0.2 199.7461717 201.1613 0.7102420 130.3626 12.64784 0.02916142 5.899003
## 17   0.3   0.5688843 175.1315 0.7272432 112.8739 12.96438 0.03003864 6.127632
## 18   0.3   1.3141964 175.1315 0.7272432 112.8739 12.96438 0.03003864 6.127632
## 19   0.3   3.0359642 175.1553 0.7271989 112.7618 12.92894 0.02992248 6.114766
## 20   0.3   7.0134711 175.3065 0.7269097 112.5404 12.84314 0.02963569 6.094708
## 21   0.3  16.2020278 176.0968 0.7253517 112.3775 12.66957 0.02902177 6.032997
## 22   0.3  37.4287857 179.3991 0.7187959 113.2834 12.45492 0.02821012 5.803488
## 23   0.3  86.4653494 186.8547 0.7122995 117.2601 12.47076 0.02862222 5.674702
## 24   0.3 199.7461717 209.7172 0.7094348 138.5906 12.70740 0.02974172 5.971522
## 25   0.4   0.5688843 175.1321 0.7272406 112.8765 12.96835 0.03004856 6.128472
## 26   0.4   1.3141964 175.1335 0.7272385 112.8699 12.96667 0.03004287 6.127624
## 27   0.4   3.0359642 175.1714 0.7271626 112.7232 12.92344 0.02989735 6.112616
## 28   0.4   7.0134711 175.3924 0.7267158 112.4977 12.82698 0.02956480 6.094921
## 29   0.4  16.2020278 176.5382 0.7242995 112.4968 12.62713 0.02883050 6.006642
## 30   0.4  37.4287857 180.6171 0.7163087 113.8642 12.44022 0.02830047 5.775538
## 31   0.4  86.4653494 189.2490 0.7120961 119.0897 12.50951 0.02887662 5.702591
## 32   0.4 199.7461717 219.8531 0.7079705 148.0783 12.75204 0.03055072 6.012363
## 33   0.5   0.5688843 175.1331 0.7272377 112.8747 12.97015 0.03005216 6.128728
## 34   0.5   1.3141964 175.1370 0.7272301 112.8512 12.96405 0.03003119 6.126261
## 35   0.5   3.0359642 175.1908 0.7271180 112.6907 12.91699 0.02986886 6.109513
## 36   0.5   7.0134711 175.4956 0.7264763 112.4701 12.81001 0.02949063 6.092619
## 37   0.5  16.2020278 177.0737 0.7229717 112.7031 12.57797 0.02861041 5.975238
## 38   0.5  37.4287857 181.4832 0.7152354 114.2605 12.46024 0.02844509 5.751792
## 39   0.5  86.4653494 192.0017 0.7119101 121.5042 12.54237 0.02917754 5.715821
## 40   0.5 199.7461717 231.6100 0.7051828 158.7145 12.78288 0.03170587 6.046139
## 41   0.6   0.5688843 175.1342 0.7272346 112.8702 12.97078 0.03005228 6.128627
## 42   0.6   1.3141964 175.1411 0.7272202 112.8328 12.96139 0.03001938 6.124968
## 43   0.6   3.0359642 175.2130 0.7270671 112.6601 12.91039 0.02984027 6.107021
## 44   0.6   7.0134711 175.6161 0.7261920 112.4600 12.79122 0.02940978 6.087386
## 45   0.6  16.2020278 177.6565 0.7215048 112.9733 12.54922 0.02847684 5.947549
## 46   0.6  37.4287857 182.4921 0.7138388 114.8541 12.47906 0.02859994 5.742023
## 47   0.6  86.4653494 195.1364 0.7116403 124.5517 12.56841 0.02952981 5.693892
## 48   0.6 199.7461717 244.9775 0.6995906 170.6413 12.80733 0.03340398 6.062240
## 49   0.7   0.5688843 175.1341 0.7272345 112.8750 12.97341 0.03005976 6.129293
## 50   0.7   1.3141964 175.1458 0.7272090 112.8151 12.95865 0.03000734 6.123657
## 51   0.7   3.0359642 175.2386 0.7270071 112.6335 12.90352 0.02981042 6.104661
## 52   0.7   7.0134711 175.7545 0.7258582 112.4682 12.77193 0.02932669 6.076931
## 53   0.7  16.2020278 178.2517 0.7200144 113.2403 12.53033 0.02839791 5.901208
## 54   0.7  37.4287857 183.4097 0.7129862 115.3371 12.47981 0.02869172 5.725290
## 55   0.7  86.4653494 198.6676 0.7112486 128.0483 12.58837 0.02995004 5.702953
## 56   0.7 199.7461717 259.9753 0.6873404 183.8250 12.82519 0.03598654 6.073578
## 57   0.8   0.5688843 175.1340 0.7272344 112.8786 12.97538 0.03006539 6.129795
## 58   0.8   1.3141964 175.1512 0.7271962 112.7976 12.95598 0.02999543 6.122015
## 59   0.8   3.0359642 175.2676 0.7269388 112.6094 12.89630 0.02977946 6.103531
## 60   0.8   7.0134711 175.9114 0.7254734 112.4921 12.75144 0.02923870 6.067513
## 61   0.8  16.2020278 178.9231 0.7182862 113.5786 12.50355 0.02829077 5.869778
## 62   0.8  37.4287857 184.1905 0.7129041 115.6649 12.49907 0.02883717 5.721975
## 63   0.8  86.4653494 202.6042 0.7106868 131.9261 12.60084 0.03045309 5.748661
## 64   0.8 199.7461717 276.6372 0.6573518 198.3118 12.80931 0.03998212 6.104513
## 65   0.9   0.5688843 175.1353 0.7272309 112.8709 12.97453 0.03006111 6.129288
## 66   0.9   1.3141964 175.1567 0.7271834 112.7798 12.95354 0.02998412 6.120495
## 67   0.9   3.0359642 175.2993 0.7268641 112.5875 12.88867 0.02974694 6.103343
## 68   0.9   7.0134711 176.0868 0.7250376 112.5311 12.72915 0.02914306 6.059382
## 69   0.9  16.2020278 179.5521 0.7167148 113.9025 12.47702 0.02830173 5.841120
## 70   0.9  37.4287857 185.0414 0.7128334 116.0985 12.51919 0.02900387 5.709487
## 71   0.9  86.4653494 206.9444 0.7098907 136.1588 12.60677 0.03106357 5.736087
## 72   0.9 199.7461717 292.9063 0.6256202 212.1537 12.97158 0.03995932 6.310661
## 73   1.0   0.5688843 175.1352 0.7272308 112.8733 12.97588 0.03006497 6.129630
## 74   1.0   1.3141964 175.1634 0.7271672 112.7641 12.95046 0.02997133 6.118419
## 75   1.0   3.0359642 175.3347 0.7267794 112.5693 12.88111 0.02971458 6.103955
## 76   1.0   7.0134711 176.2819 0.7245443 112.5906 12.70605 0.02904456 6.049053
## 77   1.0  16.2020278 179.9042 0.7161208 114.0165 12.49687 0.02843483 5.835238
## 78   1.0  37.4287857 185.9705 0.7127452 116.6417 12.53891 0.02918716 5.701548
## 79   1.0  86.4653494 211.6986 0.7087604 140.7437 12.60347 0.03179816 5.744679
## 80   1.0 199.7461717 308.8546 0.6111559 225.4595 13.24471 0.04526938 6.628275

Predicción vivienda 1

##   areaconst estrato habitaciones parqueaderos banios        tipo geo_ns
## 1       200       4            4            1      2        Casa  Norte
## 2       200       5            4            1      2        Casa  Norte
## 3       300       5            5            3      3 Apartamento    Sur
## 4       300       6            5            3      3 Apartamento    Sur
##          case      fit        lwr       upr
## 1 V1_estrato4 234.0118 -108.05362  576.0772
## 2 V1_estrato5 328.4746  -13.72154  670.6707
## 3 V2_estrato5 629.0644  286.92707  971.2017
## 4 V2_estrato6 718.2885  376.02404 1060.5530

5 ofertas potenciales

Ahora, las ofertas potenciales que se han generado son las siguiente:

Para la zona norte se tienen cuatro casas las cuales se ubican, efectivamente, en la zona norte de la ciudad y se ven en el siguiente mapa:

## # A tibble: 4 × 9
##      id barrio  areaconst estrato habitaciones parqueaderos banios preciom  pred
##   <dbl> <fct>       <dbl>   <dbl>        <dbl>        <dbl>  <dbl>   <dbl> <dbl>
## 1  2557 san vi…       850       5            4            1      2     900  899.
## 2  1943 vipasa        346       5            4            1      2     350  457.
## 3  3889 granada       350       4            4            1      2     520  366.
## 4  5051 colseg…       247       4            4            1      2     350  275.

Evaluación de desempeño

##      RMSE      MAPE 
## 169.59869  26.37146

Conclusiones

Con este modelo se puede encontrar vivienda con los requisitos que los clientes pidieron, puesto que con el conjunto de datos actual se pueden encontrar casas y apartamentos como ellos los pidieron. Ejemplo de ello es que se generaron cuatro posibles lugares en cada zona donde las dos familias podrían vivir.