Caso de Uso

María, quien comenzó su carrera en bienes raíces en Cali hace una década y tras trabajar en Bogotá decidió fundar su propia agencia, C&A (Casas y Apartamentos), actualmente enfrenta un mercado local de bienes raíces afectado por una notable disminución en las ventas. A pesar de este desafío, con un equipo de ocho agentes y el respaldo de antiguos colegas, María ha recibido recientemente una solicitud de asesoría para la compra de dos viviendas por parte de una compañía internacional que busca reubicar a sus empleados en la ciudad, lo que podría ser una oportunidad clave para reactivar su negocio en un contexto económico difícil.

A continuación, se presentan las condiciones de las viviendas que se estan buscando:

Caractrísticas Vivienda 1 Vivienda 2
Tipo Casa Apartamento
Area 200 300
Parqueadero 1 3
Baños 2 3
Habitaciones 4 5
Estrato 4 o 5 5 o 6
Zona Norte Sur
Credito 350 millones 850 millones
## Downloading GitHub repo centromagis/paqueteMODELOS@HEAD
## stringi (1.8.3 -> 1.8.4) [CRAN]
## magick  (2.8.2 -> 2.8.4) [CRAN]
## Installing 2 packages: stringi, magick
## 
##   There are binary versions available but the source versions are later:
##         binary source needs_compilation
## stringi  1.8.3  1.8.4              TRUE
## magick   2.8.2  2.8.4              TRUE
## installing the source packages 'stringi', 'magick'
## Warning in i.p(...): installation of package 'stringi' had non-zero exit status
## Warning in i.p(...): installation of package 'magick' had non-zero exit status
## ── R CMD build ─────────────────────────────────────────────────────────────────
##   
   checking for file ‘/private/var/folders/fd/t79b145j0hv0njltjf27np940000gp/T/RtmpYAGXEJ/remotes5a3242bc4730/Centromagis-paqueteMODELOS-78ce06f/DESCRIPTION’ ...
  
✔  checking for file ‘/private/var/folders/fd/t79b145j0hv0njltjf27np940000gp/T/RtmpYAGXEJ/remotes5a3242bc4730/Centromagis-paqueteMODELOS-78ce06f/DESCRIPTION’
## 
  
─  preparing ‘paqueteMODELOS’:
##    checking DESCRIPTION meta-information ...
  
✔  checking DESCRIPTION meta-information
## 
  
─  checking for LF line-endings in source and make files and shell scripts
## 
  
─  checking for empty or unneeded directories
## 
  
─  building ‘paqueteMODELOS_0.1.0.tar.gz’
## 
  
   
## 
## Warning in i.p(...): installation of package
## '/var/folders/fd/t79b145j0hv0njltjf27np940000gp/T//RtmpYAGXEJ/file5a326471e98/paqueteMODELOS_0.1.0.tar.gz'
## had non-zero exit status

##Tratamiento de Datos.

Antes de comenzar el análisis para identificar las viviendas más adecuadas a la solicitud del usuario, se procede a realizar una evaluación de la calidad de los datos. Esto tiene el propósito de depurar la información y garantizar que los análisis estadísticos se ajusten a los requerimientos del usuario, con el fin de generar una propuesta que cumpla con sus expectativas.

En este caso, se observa que la información asociada al piso donde se encuentra la vivienda no es relevante para la selección del usuario, por lo que se procede a eliminarla.

##     id         zona estrato preciom areaconst parqueaderos banios habitaciones
## 1 1147 Zona Oriente       3     250        70            1      3            6
## 2 1169 Zona Oriente       3     320       120            1      2            3
## 3 1350 Zona Oriente       3     350       220            2      2            4
## 4 5992     Zona Sur       4     400       280            3      5            3
## 5 1212   Zona Norte       5     260        90            1      2            3
## 6 1724   Zona Norte       5     240        87            1      3            3
##          tipo      barrio  longitud latitud
## 1        Casa 20 de julio -76.51168 3.43382
## 2        Casa 20 de julio -76.51237 3.43369
## 3        Casa 20 de julio -76.51537 3.43566
## 4        Casa  3 de julio -76.54000 3.43500
## 5 Apartamento       acopi -76.51350 3.45891
## 6 Apartamento       acopi -76.51700 3.36971

Vivienda 1. Casas Zona Norte

Actualmente, la Zona Norte cuenta con 722 casas con posible opción de venta. De igual manera, se presenta una muestra de estas viviendas junto con la información detallada de cada una de ellas.

## 
## Zona Norte 
##        722
Primeras Tres Casas
id zona estrato preciom areaconst parqueaderos banios habitaciones tipo barrio longitud latitud
9 1209 Zona Norte 5 320 150 2 4 6 Casa acopi -76.51341 3.47968
10 1592 Zona Norte 5 780 380 2 3 3 Casa acopi -76.51674 3.48721
11 4057 Zona Norte 6 750 445 NA 7 6 Casa acopi -76.52950 3.38527

Para entender la distribución de las propiedades en la Zona Norte, se ha creado un mapa de puntos que muestra que, están distribuidas en estratos 3, 4, 5 y 6, y el área construida varía entre 30 m² y 1,440 m². Los precios de estas propiedades oscilan entre 80 y 1,940 millones, dependiendo del número de baños, habitaciones y parqueaderos.

Es importante destacar que la mayoría de las viviendas se encuentran en esta zona pero existe un porcentaje significativo de inmueble asociados a áreas distintas a las del objetivo de análisis. Esta discrepancia puede deberse a errores de digitación al registrar las propiedades, problemas durante el proceso de georreferenciación, o errores en la codificación de zonas o barrios.

##        id             zona              estrato         preciom      
##  Min.   :  58.0   Length:722         Min.   :3.000   Min.   :  89.0  
##  1st Qu.: 766.2   Class :character   1st Qu.:3.000   1st Qu.: 261.2  
##  Median :2257.0   Mode  :character   Median :4.000   Median : 390.0  
##  Mean   :2574.6                      Mean   :4.202   Mean   : 445.9  
##  3rd Qu.:4225.0                      3rd Qu.:5.000   3rd Qu.: 550.0  
##  Max.   :8319.0                      Max.   :6.000   Max.   :1940.0  
##                                                                      
##    areaconst       parqueaderos        banios        habitaciones   
##  Min.   :  30.0   Min.   : 1.000   Min.   : 0.000   Min.   : 0.000  
##  1st Qu.: 140.0   1st Qu.: 1.000   1st Qu.: 2.000   1st Qu.: 3.000  
##  Median : 240.0   Median : 2.000   Median : 3.000   Median : 4.000  
##  Mean   : 264.9   Mean   : 2.182   Mean   : 3.555   Mean   : 4.507  
##  3rd Qu.: 336.8   3rd Qu.: 3.000   3rd Qu.: 4.000   3rd Qu.: 5.000  
##  Max.   :1440.0   Max.   :10.000   Max.   :10.000   Max.   :10.000  
##                   NA's   :287                                       
##      tipo              barrio             longitud         latitud     
##  Length:722         Length:722         Min.   :-76.59   Min.   :3.333  
##  Class :character   Class :character   1st Qu.:-76.53   1st Qu.:3.452  
##  Mode  :character   Mode  :character   Median :-76.52   Median :3.468  
##                                        Mean   :-76.52   Mean   :3.460  
##                                        3rd Qu.:-76.50   3rd Qu.:3.482  
##                                        Max.   :-76.47   Max.   :3.496  
## 

##Análisis exploratorio

Para entender cómo el precio de las viviendas se comporta en relación con las distintas variables asociadas a cada una de ellas, se realizará un análisis detallado de dichas variables.

Al analizar el costo de las viviendas en relación con el estrato en el que se encuentran, se observa una tendencia general en la que el precio de las viviendas varía según el estrato. En términos generales, a medida que disminuye el estrato, también lo hace el valor de la vivienda. Sin embargo, para las propiedades ubicadas en estratos 4 a 6, se nota un incremento significativo en los precios. Esta tendencia es consistente con la expectativa de que viviendas en estratos más altos tienden a tener características y ubicaciones que justifican precios más altos.

A pesar de esta tendencia, se identifican algunos precios que se desvían considerablemente del promedio, lo cual puede deberse a varios factores. Entre estos, se incluyen posibles errores en el registro de datos, anotaciones incorrectas de los costos o, en algunos casos, ajustes o renovaciones en las propiedades que pueden haber aumentado su valor.

Se observa que las variables presentan una correlación positiva con respecto al valor de las casas. En este caso, el área es el factor más relevante para definir el costo de la vivienda, seguido por el estrato y el número de baños. Aunque también existe una correlación entre el número de habitaciones y los parqueaderos, estos factores no son decisivos en la determinación del precio.

## corrplot 0.92 loaded

## Estimación del Modelo

Asumiendo que la relación entre las variables de las viviendas son lineales, se crea una ecuación que relacione cada una de ellas y así identificar las variables dependiente e independientes en la información. Como resultado del mismo se obtuvo el siguiente modelo:

Modelo Estimado = 11.72+0,6809X1+80,91X2+147.53X3+281.69X4+7.17X5+24.22X6+18.09X7

## 
## Call:
## lm(formula = preciom ~ areaconst + estrato + habitaciones + parqueaderos + 
##     banios, data = base1)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -790.71  -74.72  -18.93   46.54  991.70 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   11.71883   27.15751   0.432  0.66631    
## areaconst      0.68098    0.05283  12.890  < 2e-16 ***
## estrato4      80.91006   24.55085   3.296  0.00106 ** 
## estrato5     147.53872   22.70871   6.497 2.29e-10 ***
## estrato6     281.68942   37.33161   7.546 2.74e-13 ***
## habitaciones   7.17906    5.69802   1.260  0.20839    
## parqueaderos  24.22922    5.86635   4.130 4.36e-05 ***
## banios        18.09024    7.62857   2.371  0.01816 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 154.9 on 427 degrees of freedom
##   (287 observations deleted due to missingness)
## Multiple R-squared:  0.607,  Adjusted R-squared:  0.6006 
## F-statistic: 94.24 on 7 and 427 DF,  p-value: < 2.2e-16

###Sobre Ajuste del Modelo

Con respecto al sobre ajuste del modelo se obtiene un resultado de R2 de 60,7%, donde se puede conciderar que la variabilidad en el precio de los inmuebles esta relacionada por las variables asociadas al inmueble, ya que, soporta más del 50% del porcentaje de variación. En caso tal que alguna de las variables no aporte en termino de variabilidad, el r2 ajustado es del 60.06% y el cual sigue respondiente a la variación del precio del inmueble.

En este caso el error residual obtenido por el model es mayor al F estadistico, lo que indica que la variabilidad no explicada es alta y lo cual indica que se deben realizar ajustes sobre el mismo o revisar otro modelo para dar respuesta al objetivo del informe.

De acuerdo con lo mencionado anteriormente, se procede a seleccionar las variables que más aportan al modelo de datos.

## Start:  AIC=4395.13
## preciom ~ areaconst + estrato + habitaciones + parqueaderos + 
##     banios
## 
##                Df Sum of Sq      RSS    AIC
## - habitaciones  1     38087 10283123 4394.7
## <none>                      10245037 4395.1
## - banios        1    134924 10379961 4398.8
## - parqueaderos  1    409287 10654324 4410.2
## - estrato       3   1697193 11942230 4455.8
## - areaconst     1   3986618 14231655 4536.1
## 
## Step:  AIC=4394.74
## preciom ~ areaconst + estrato + parqueaderos + banios
## 
##                Df Sum of Sq      RSS    AIC
## <none>                      10283123 4394.7
## + habitaciones  1     38087 10245037 4395.1
## - banios        1    304157 10587281 4405.4
## - parqueaderos  1    413107 10696230 4409.9
## - estrato       3   1674264 11957387 4454.4
## - areaconst     1   4494777 14777900 4550.5
## 
## Call:
## lm(formula = preciom ~ areaconst + estrato + parqueaderos + banios, 
##     data = base1)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -780.51  -77.28  -18.56   48.71 1001.78 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   28.15518   23.83533   1.181 0.238165    
## areaconst      0.69827    0.05105  13.678  < 2e-16 ***
## estrato4      74.34893   24.00866   3.097 0.002085 ** 
## estrato5     139.48701   21.80589   6.397 4.17e-10 ***
## estrato6     272.59519   36.65228   7.437 5.66e-13 ***
## parqueaderos  24.33931    5.86973   4.147 4.07e-05 ***
## banios        23.12920    6.50058   3.558 0.000415 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 155 on 428 degrees of freedom
##   (287 observations deleted due to missingness)
## Multiple R-squared:  0.6056, Adjusted R-squared:  0.6001 
## F-statistic: 109.5 on 6 and 428 DF,  p-value: < 2.2e-16
## 
## Call:
## lm(formula = preciom ~ areaconst + estrato + parqueaderos + banios, 
##     data = base1)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -780.51  -77.28  -18.56   48.71 1001.78 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   28.15518   23.83533   1.181 0.238165    
## areaconst      0.69827    0.05105  13.678  < 2e-16 ***
## estrato4      74.34893   24.00866   3.097 0.002085 ** 
## estrato5     139.48701   21.80589   6.397 4.17e-10 ***
## estrato6     272.59519   36.65228   7.437 5.66e-13 ***
## parqueaderos  24.33931    5.86973   4.147 4.07e-05 ***
## banios        23.12920    6.50058   3.558 0.000415 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 155 on 428 degrees of freedom
##   (287 observations deleted due to missingness)
## Multiple R-squared:  0.6056, Adjusted R-squared:  0.6001 
## F-statistic: 109.5 on 6 and 428 DF,  p-value: < 2.2e-16

Teniendo en cuenta que posterior al ajuste el valor del error residual es menor al F Estadistico se puede decir que el modelo responde a la variabilidad con un 60.56% y así mismo la variablidad explicada es alta frente a la no explicada.

A continuación se presenta el análisis de los coeficientes del Modelo.

Validación de Supuestos

Posteriormente, se procede a validar lo mencionado anteriormente por medio de los graficos y test.

### Linealidad

De acuerdo con la gráfica Residual vs Fitted y apoyados en el Test de Jarque, podemos observar que no existe una normalidad en los residuales. Adicionalmente, podemos concluir que la relación entre las variables no es lineal, ya que, p es menor al 5% lo cual quiere decir que se rechaza la hipotesis nula.

## Registered S3 method overwritten by 'quantmod':
##   method            from
##   as.zoo.data.frame zoo
## 
##  Jarque Bera Test
## 
## data:  resid(modelovariables_sel)
## X-squared = 2002.1, df = 2, p-value < 2.2e-16

Normalidad

De acuerdo con la gráfica Q-Q y apoyados en el Test de Shapiro, se observa que existen datos que nos se ajustan a la línea de normalidad, ya que, tienen un comportamiento creciente. De igual manera, al obtener un p menor al 5% se descarta la hipotesis nula y lo cual nos permite concluir que la hipotesis 1 no presenta una distribución normal.

## 
##  Shapiro-Wilk normality test
## 
## data:  resid(modelovariables_sel)
## W = 0.84766, p-value < 2.2e-16

Homocedasticidad

En este caso observamos en la grafica Scale - Location que la distribución es aleatoria con respecto a la linea de normalidad y apoyados en el resultado de test el cual es inferior al 5%, concluimos que no se rechaza la hipotesis nula y la varianza de la hipotesis 1 no es constante.

## 
##  Bartlett test of homogeneity of variances
## 
## data:  list(base1$preciom, base1$areaconst, base1$parqueaderos, base1$banios)
## Bartlett's K-squared = 10215, df = 3, p-value < 2.2e-16

Independencia

De acuerdo eon el Test Durbin Watson se puede rechazar la hipotesis nula, al tener un valor de p inferior al 5% .

## Loading required package: zoo
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
## 
##  Durbin-Watson test
## 
## data:  modelovariables_sel
## DW = 1.8015, p-value = 0.01547
## alternative hypothesis: true autocorrelation is greater than 0

Predicción del Precio

Tomando como punto de partida las caracteristicas dadas para la compra de vivienda en la Zona Norte de la ciudad de Cali que cuente con las siguiente caracteristicas: área construida de 200 mt2, 1 parqueadero, 2 baños, 4 habitaciones y se encuentre en estrato 4 ó 5 los precios promedio son:

##       fit      lwr      upr
## 1 312.755 275.1432 350.3669
##        fit      lwr      upr
## 1 377.8931 346.4978 409.2884

Sugerencias de Oferta

Finalmente, presentamos la oferta más acorde de acuerdo a la solicitud realizada inicialmente

## 
## Attaching package: 'dplyr'
## The following object is masked from 'package:MASS':
## 
##     select
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
## 
## Attaching package: 'kableExtra'
## The following object is masked from 'package:dplyr':
## 
##     group_rows
Ofertas Casas
id zona estrato preciom areaconst parqueaderos banios habitaciones tipo barrio longitud latitud precio
1222 Zona Norte 4 360 216 2 2 4 Casa la merced -76.5139 3.48386 348.2666
## Warning: Unknown or uninitialised column: `piso`.

Vivienda 2. Apartamento Zona Sur

Actualmente, la Zona Sur cuenta con 2787 apartamento con posible opción de venta. De igual manera, se presenta una muestra de estas viviendas junto con la información detallada de cada una de ellas.

## 
## Zona Sur 
##     2787
Primeros Tres Apartamentos
id zona estrato preciom areaconst parqueaderos banios habitaciones tipo barrio longitud latitud
5098 Zona Sur 4 290 96 1 2 3 Apartamento acopi -76.53464 3.44987
698 Zona Sur 3 78 40 1 1 2 Apartamento aguablanca -76.50100 3.40000
8199 Zona Sur 6 875 194 2 5 3 Apartamento aguacatal -76.55700 3.45900

Para entender la distribución de las propiedades en la Zona Sur, se ha creado un mapa de puntos que muestra que, están distribuidas en estratos 3, 4, 5 y 6, y el área construida varía entre 40 m² y 932 m². Los precios de estas propiedades oscilan entre 75 y 1,750 millones, dependiendo del número de baños, habitaciones y parqueaderos.

Es importante destacar que la mayoría de las viviendas se encuentran en esta zona pero existe un porcentaje significativo de inmueble asociados a áreas distintas a las del objetivo de análisis. Esta discrepancia puede deberse a errores de digitación al registrar las propiedades, problemas durante el proceso de georreferenciación, o errores en la codificación de zonas o barrios.

##        id           zona              estrato        preciom      
##  Min.   :   3   Length:2787        Min.   :3.00   Min.   :  75.0  
##  1st Qu.:2292   Class :character   1st Qu.:4.00   1st Qu.: 175.0  
##  Median :4004   Mode  :character   Median :5.00   Median : 245.0  
##  Mean   :4131                      Mean   :4.63   Mean   : 297.3  
##  3rd Qu.:5876                      3rd Qu.:5.00   3rd Qu.: 335.0  
##  Max.   :8302                      Max.   :6.00   Max.   :1750.0  
##                                                                   
##    areaconst       parqueaderos        banios       habitaciones  
##  Min.   : 40.00   Min.   : 1.000   Min.   :0.000   Min.   :0.000  
##  1st Qu.: 65.00   1st Qu.: 1.000   1st Qu.:2.000   1st Qu.:3.000  
##  Median : 85.00   Median : 1.000   Median :2.000   Median :3.000  
##  Mean   : 97.47   Mean   : 1.415   Mean   :2.488   Mean   :2.966  
##  3rd Qu.:110.00   3rd Qu.: 2.000   3rd Qu.:3.000   3rd Qu.:3.000  
##  Max.   :932.00   Max.   :10.000   Max.   :8.000   Max.   :6.000  
##                   NA's   :406                                     
##      tipo              barrio             longitud         latitud     
##  Length:2787        Length:2787        Min.   :-76.57   Min.   :3.334  
##  Class :character   Class :character   1st Qu.:-76.54   1st Qu.:3.370  
##  Mode  :character   Mode  :character   Median :-76.53   Median :3.383  
##                                        Mean   :-76.53   Mean   :3.390  
##                                        3rd Qu.:-76.52   3rd Qu.:3.406  
##                                        Max.   :-76.46   Max.   :3.497  
## 
## Warning: Unknown or uninitialised column: `piso`.

##Análisis exploratorio

Al igual que en el caso anterior se realiza un analisis para conocer la relación entre el precio y las diferentes variables de cada apartamento.

Al analizar el costo de las viviendas en relación con el estrato en el que se encuentran, se observa una tendencia general en la que el precio de las viviendas varía según el estrato. En términos generales, a medida que disminuye el estrato, también lo hace el valor de la vivienda. Sin embargo, para las propiedades ubicadas en estratos 4 a 6, se nota un incremento significativo en los precios. Esta tendencia es consistente con la expectativa de que viviendas en estratos más altos tienden a tener características y ubicaciones que justifican precios más altos.

A pesar de esta tendencia, se identifican algunos precios que se desvían considerablemente del promedio, lo cual puede deberse a varios factores. Entre estos, se incluyen posibles errores en el registro de datos, anotaciones incorrectas de los costos o, en algunos casos, ajustes o renovaciones en las propiedades que pueden haber aumentado su valor.

e observa que las variables presentan una correlación positiva con respecto al valor de las casas. En este caso, el área es el factor más relevante para definir el costo de la vivienda, seguido por el estrato y el número de baños. Aunque también existe una correlación entre el número de habitaciones y los parqueaderos, estos factores no son decisivos en la determinación del precio.

## Estimación del Modelo

Asumiendo que la relación entre las variables de las viviendas son lineales, se crea una ecuación que relacione cada una de ellas y así identificar las variables dependiente e independientes en la información. Como resultado del mismo se obtuvo el siguiente modelo:

Modelo Estimado = -28.38+1.28X1+30,40X2+50.88X3+204.40X4-17.10X5+62.13X6+41.95X7

## 
## Call:
## lm(formula = preciom ~ areaconst + estrato + habitaciones + parqueaderos + 
##     banios, data = base2)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -1058.69   -39.21     0.38    36.96   898.14 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  -28.38462   12.93336  -2.195  0.02828 *  
## areaconst      1.28595    0.05105  25.189  < 2e-16 ***
## estrato4      30.40026    9.55717   3.181  0.00149 ** 
## estrato5      50.88889    9.61940   5.290 1.33e-07 ***
## estrato6     204.40443   11.17300  18.294  < 2e-16 ***
## habitaciones -17.10675    3.70357  -4.619 4.06e-06 ***
## parqueaderos  62.13696    3.79229  16.385  < 2e-16 ***
## banios        41.95467    3.24893  12.913  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 92.52 on 2373 degrees of freedom
##   (406 observations deleted due to missingness)
## Multiple R-squared:  0.7762, Adjusted R-squared:  0.7755 
## F-statistic:  1175 on 7 and 2373 DF,  p-value: < 2.2e-16

Teniendo en cuenta que posterior al ajuste el valor del error residual es menor al F Estadistico se puede decir que el modelo responde a la variabilidad con un 77.62% y así mismo la variablidad explicada es alta frente a la no explicada.

A continuación se presenta el análisis de los coeficientes del Modelo.

## 
## Call:
## lm(formula = preciom ~ areaconst + estrato + parqueaderos + banios, 
##     data = base2)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -1027.87   -38.45    -0.36    37.54   907.43 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  -65.20796   10.22765  -6.376 2.18e-10 ***
## areaconst      1.25369    0.05079  24.684  < 2e-16 ***
## estrato4      32.61559    9.58592   3.402 0.000679 ***
## estrato5      53.19928    9.64744   5.514 3.88e-08 ***
## estrato6     211.64372   11.10981  19.050  < 2e-16 ***
## parqueaderos  63.18762    3.80164  16.621  < 2e-16 ***
## banios        35.75082    2.97095  12.033  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 92.91 on 2374 degrees of freedom
##   (406 observations deleted due to missingness)
## Multiple R-squared:  0.7741, Adjusted R-squared:  0.7736 
## F-statistic:  1356 on 6 and 2374 DF,  p-value: < 2.2e-16

Validación de Supuestos

Posteriormente, se procede a validar lo mencionado anteriormente por medio de los graficos y test.

### Linealidad

De acuerdo con la gráfica Residual vs Fitted y apoyados en el Test de Jarque, podemos observar que no existe una normalidad en los residuales. Adicionalmente, podemos concluir que la relación entre las variables no es lineal, ya que, p es menor al 5% lo cual quiere decir que se rechaza la hipotesis nula.

## 
##  Jarque Bera Test
## 
## data:  resid(modeloapto_sel)
## X-squared = 71616, df = 2, p-value < 2.2e-16

Normalidad

De acuerdo con la gráfica Q-Q y apoyados en el Test de Shapiro, se observa que existen datos que nos se ajustan a la línea de normalidad, ya que, tienen un comportamiento creciente. De igual manera, al obtener un p menor al 5% se descarta la hipotesis nula y lo cual nos permite concluir que la hipotesis 1 no presenta una distribución normal.

## 
##  Shapiro-Wilk normality test
## 
## data:  resid(modeloapto_sel)
## W = 0.78047, p-value < 2.2e-16

Homocedasticidad

En este caso observamos en la grafica Scale - Location que la distribución es aleatoria con respecto a la linea de normalidad y apoyados en el resultado de test el cual es inferior al 5%, concluimos que no se rechaza la hipotesis nula y la varianza de la hipotesis 1 no es constante.

## 
##  Bartlett test of homogeneity of variances
## 
## data:  list(base2$preciom, base2$areaconst, base2$parqueaderos, base2$banios)
## Bartlett's K-squared = 50076, df = 3, p-value < 2.2e-16

Independencia

De acuerdo eon el Test Durbin Watson se puede rechazar la hipotesis nula, al tener un valor de p inferior al 5% .

## 
##  Durbin-Watson test
## 
## data:  modeloapto_sel
## DW = 1.6812, p-value = 2.625e-15
## alternative hypothesis: true autocorrelation is greater than 0

Predicción del Precio

Tomando como punto de partida las caracteristicas dadas para la compra de vivienda en la Zona Sur de la ciudad de Cali que cuente con las siguiente caracteristicas: área construida de 300 mt2, 3 parqueadero, 3 baños, 5 habitaciones y se encuentre en estrato 5 ó 6 los precios promedio son:

##        fit      lwr     upr
## 1 660.9127 641.6724 680.153
##        fit      lwr     upr
## 1 819.3571 800.6572 838.057

Sugerencias de Oferta

Finalmente, presentamos la oferta más acorde de acuerdo a la solicitud realizada inicialmente

Ofetas Apartamentos
id zona estrato preciom areaconst parqueaderos banios habitaciones tipo barrio longitud latitud precio
7512 Zona Sur 5 670 300 3 5 6 Apartamento seminario -76.55 3.409 732.4143
## Warning: Unknown or uninitialised column: `piso`.