María, quien comenzó su carrera en bienes raíces en Cali hace una década y tras trabajar en Bogotá decidió fundar su propia agencia, C&A (Casas y Apartamentos), actualmente enfrenta un mercado local de bienes raíces afectado por una notable disminución en las ventas. A pesar de este desafío, con un equipo de ocho agentes y el respaldo de antiguos colegas, María ha recibido recientemente una solicitud de asesoría para la compra de dos viviendas por parte de una compañía internacional que busca reubicar a sus empleados en la ciudad, lo que podría ser una oportunidad clave para reactivar su negocio en un contexto económico difícil.
A continuación, se presentan las condiciones de las viviendas que se estan buscando:
Caractrísticas | Vivienda 1 | Vivienda 2 |
---|---|---|
Tipo | Casa | Apartamento |
Area | 200 | 300 |
Parqueadero | 1 | 3 |
Baños | 2 | 3 |
Habitaciones | 4 | 5 |
Estrato | 4 o 5 | 5 o 6 |
Zona | Norte | Sur |
Credito | 350 millones | 850 millones |
## Downloading GitHub repo centromagis/paqueteMODELOS@HEAD
## stringi (1.8.3 -> 1.8.4) [CRAN]
## magick (2.8.2 -> 2.8.4) [CRAN]
## Installing 2 packages: stringi, magick
##
## There are binary versions available but the source versions are later:
## binary source needs_compilation
## stringi 1.8.3 1.8.4 TRUE
## magick 2.8.2 2.8.4 TRUE
## installing the source packages 'stringi', 'magick'
## Warning in i.p(...): installation of package 'stringi' had non-zero exit status
## Warning in i.p(...): installation of package 'magick' had non-zero exit status
## ── R CMD build ─────────────────────────────────────────────────────────────────
##
checking for file ‘/private/var/folders/fd/t79b145j0hv0njltjf27np940000gp/T/RtmpYAGXEJ/remotes5a3242bc4730/Centromagis-paqueteMODELOS-78ce06f/DESCRIPTION’ ...
✔ checking for file ‘/private/var/folders/fd/t79b145j0hv0njltjf27np940000gp/T/RtmpYAGXEJ/remotes5a3242bc4730/Centromagis-paqueteMODELOS-78ce06f/DESCRIPTION’
##
─ preparing ‘paqueteMODELOS’:
## checking DESCRIPTION meta-information ...
✔ checking DESCRIPTION meta-information
##
─ checking for LF line-endings in source and make files and shell scripts
##
─ checking for empty or unneeded directories
##
─ building ‘paqueteMODELOS_0.1.0.tar.gz’
##
##
## Warning in i.p(...): installation of package
## '/var/folders/fd/t79b145j0hv0njltjf27np940000gp/T//RtmpYAGXEJ/file5a326471e98/paqueteMODELOS_0.1.0.tar.gz'
## had non-zero exit status
##Tratamiento de Datos.
Antes de comenzar el análisis para identificar las viviendas más adecuadas a la solicitud del usuario, se procede a realizar una evaluación de la calidad de los datos. Esto tiene el propósito de depurar la información y garantizar que los análisis estadísticos se ajusten a los requerimientos del usuario, con el fin de generar una propuesta que cumpla con sus expectativas.
En este caso, se observa que la información asociada al piso donde se encuentra la vivienda no es relevante para la selección del usuario, por lo que se procede a eliminarla.
## id zona estrato preciom areaconst parqueaderos banios habitaciones
## 1 1147 Zona Oriente 3 250 70 1 3 6
## 2 1169 Zona Oriente 3 320 120 1 2 3
## 3 1350 Zona Oriente 3 350 220 2 2 4
## 4 5992 Zona Sur 4 400 280 3 5 3
## 5 1212 Zona Norte 5 260 90 1 2 3
## 6 1724 Zona Norte 5 240 87 1 3 3
## tipo barrio longitud latitud
## 1 Casa 20 de julio -76.51168 3.43382
## 2 Casa 20 de julio -76.51237 3.43369
## 3 Casa 20 de julio -76.51537 3.43566
## 4 Casa 3 de julio -76.54000 3.43500
## 5 Apartamento acopi -76.51350 3.45891
## 6 Apartamento acopi -76.51700 3.36971
Actualmente, la Zona Norte cuenta con 722 casas con posible opción de venta. De igual manera, se presenta una muestra de estas viviendas junto con la información detallada de cada una de ellas.
##
## Zona Norte
## 722
id | zona | estrato | preciom | areaconst | parqueaderos | banios | habitaciones | tipo | barrio | longitud | latitud | |
---|---|---|---|---|---|---|---|---|---|---|---|---|
9 | 1209 | Zona Norte | 5 | 320 | 150 | 2 | 4 | 6 | Casa | acopi | -76.51341 | 3.47968 |
10 | 1592 | Zona Norte | 5 | 780 | 380 | 2 | 3 | 3 | Casa | acopi | -76.51674 | 3.48721 |
11 | 4057 | Zona Norte | 6 | 750 | 445 | NA | 7 | 6 | Casa | acopi | -76.52950 | 3.38527 |
Para entender la distribución de las propiedades en la Zona Norte, se ha creado un mapa de puntos que muestra que, están distribuidas en estratos 3, 4, 5 y 6, y el área construida varía entre 30 m² y 1,440 m². Los precios de estas propiedades oscilan entre 80 y 1,940 millones, dependiendo del número de baños, habitaciones y parqueaderos.
Es importante destacar que la mayoría de las viviendas se encuentran en esta zona pero existe un porcentaje significativo de inmueble asociados a áreas distintas a las del objetivo de análisis. Esta discrepancia puede deberse a errores de digitación al registrar las propiedades, problemas durante el proceso de georreferenciación, o errores en la codificación de zonas o barrios.
## id zona estrato preciom
## Min. : 58.0 Length:722 Min. :3.000 Min. : 89.0
## 1st Qu.: 766.2 Class :character 1st Qu.:3.000 1st Qu.: 261.2
## Median :2257.0 Mode :character Median :4.000 Median : 390.0
## Mean :2574.6 Mean :4.202 Mean : 445.9
## 3rd Qu.:4225.0 3rd Qu.:5.000 3rd Qu.: 550.0
## Max. :8319.0 Max. :6.000 Max. :1940.0
##
## areaconst parqueaderos banios habitaciones
## Min. : 30.0 Min. : 1.000 Min. : 0.000 Min. : 0.000
## 1st Qu.: 140.0 1st Qu.: 1.000 1st Qu.: 2.000 1st Qu.: 3.000
## Median : 240.0 Median : 2.000 Median : 3.000 Median : 4.000
## Mean : 264.9 Mean : 2.182 Mean : 3.555 Mean : 4.507
## 3rd Qu.: 336.8 3rd Qu.: 3.000 3rd Qu.: 4.000 3rd Qu.: 5.000
## Max. :1440.0 Max. :10.000 Max. :10.000 Max. :10.000
## NA's :287
## tipo barrio longitud latitud
## Length:722 Length:722 Min. :-76.59 Min. :3.333
## Class :character Class :character 1st Qu.:-76.53 1st Qu.:3.452
## Mode :character Mode :character Median :-76.52 Median :3.468
## Mean :-76.52 Mean :3.460
## 3rd Qu.:-76.50 3rd Qu.:3.482
## Max. :-76.47 Max. :3.496
##
##Análisis exploratorio
Para entender cómo el precio de las viviendas se comporta en relación con las distintas variables asociadas a cada una de ellas, se realizará un análisis detallado de dichas variables.
Al analizar el costo de las viviendas en relación con el estrato en el que se encuentran, se observa una tendencia general en la que el precio de las viviendas varía según el estrato. En términos generales, a medida que disminuye el estrato, también lo hace el valor de la vivienda. Sin embargo, para las propiedades ubicadas en estratos 4 a 6, se nota un incremento significativo en los precios. Esta tendencia es consistente con la expectativa de que viviendas en estratos más altos tienden a tener características y ubicaciones que justifican precios más altos.
A pesar de esta tendencia, se identifican algunos precios que se desvían considerablemente del promedio, lo cual puede deberse a varios factores. Entre estos, se incluyen posibles errores en el registro de datos, anotaciones incorrectas de los costos o, en algunos casos, ajustes o renovaciones en las propiedades que pueden haber aumentado su valor.
Se observa que las variables presentan una correlación positiva con
respecto al valor de las casas. En este caso, el área es el factor más
relevante para definir el costo de la vivienda, seguido por el estrato y
el número de baños. Aunque también existe una correlación entre el
número de habitaciones y los parqueaderos, estos factores no son
decisivos en la determinación del precio.
## corrplot 0.92 loaded
## Estimación del Modelo
Asumiendo que la relación entre las variables de las viviendas son lineales, se crea una ecuación que relacione cada una de ellas y así identificar las variables dependiente e independientes en la información. Como resultado del mismo se obtuvo el siguiente modelo:
Modelo Estimado = 11.72+0,6809X1+80,91X2+147.53X3+281.69X4+7.17X5+24.22X6+18.09X7
##
## Call:
## lm(formula = preciom ~ areaconst + estrato + habitaciones + parqueaderos +
## banios, data = base1)
##
## Residuals:
## Min 1Q Median 3Q Max
## -790.71 -74.72 -18.93 46.54 991.70
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 11.71883 27.15751 0.432 0.66631
## areaconst 0.68098 0.05283 12.890 < 2e-16 ***
## estrato4 80.91006 24.55085 3.296 0.00106 **
## estrato5 147.53872 22.70871 6.497 2.29e-10 ***
## estrato6 281.68942 37.33161 7.546 2.74e-13 ***
## habitaciones 7.17906 5.69802 1.260 0.20839
## parqueaderos 24.22922 5.86635 4.130 4.36e-05 ***
## banios 18.09024 7.62857 2.371 0.01816 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 154.9 on 427 degrees of freedom
## (287 observations deleted due to missingness)
## Multiple R-squared: 0.607, Adjusted R-squared: 0.6006
## F-statistic: 94.24 on 7 and 427 DF, p-value: < 2.2e-16
###Sobre Ajuste del Modelo
Con respecto al sobre ajuste del modelo se obtiene un resultado de R2 de 60,7%, donde se puede conciderar que la variabilidad en el precio de los inmuebles esta relacionada por las variables asociadas al inmueble, ya que, soporta más del 50% del porcentaje de variación. En caso tal que alguna de las variables no aporte en termino de variabilidad, el r2 ajustado es del 60.06% y el cual sigue respondiente a la variación del precio del inmueble.
En este caso el error residual obtenido por el model es mayor al F estadistico, lo que indica que la variabilidad no explicada es alta y lo cual indica que se deben realizar ajustes sobre el mismo o revisar otro modelo para dar respuesta al objetivo del informe.
De acuerdo con lo mencionado anteriormente, se procede a seleccionar las variables que más aportan al modelo de datos.
## Start: AIC=4395.13
## preciom ~ areaconst + estrato + habitaciones + parqueaderos +
## banios
##
## Df Sum of Sq RSS AIC
## - habitaciones 1 38087 10283123 4394.7
## <none> 10245037 4395.1
## - banios 1 134924 10379961 4398.8
## - parqueaderos 1 409287 10654324 4410.2
## - estrato 3 1697193 11942230 4455.8
## - areaconst 1 3986618 14231655 4536.1
##
## Step: AIC=4394.74
## preciom ~ areaconst + estrato + parqueaderos + banios
##
## Df Sum of Sq RSS AIC
## <none> 10283123 4394.7
## + habitaciones 1 38087 10245037 4395.1
## - banios 1 304157 10587281 4405.4
## - parqueaderos 1 413107 10696230 4409.9
## - estrato 3 1674264 11957387 4454.4
## - areaconst 1 4494777 14777900 4550.5
##
## Call:
## lm(formula = preciom ~ areaconst + estrato + parqueaderos + banios,
## data = base1)
##
## Residuals:
## Min 1Q Median 3Q Max
## -780.51 -77.28 -18.56 48.71 1001.78
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 28.15518 23.83533 1.181 0.238165
## areaconst 0.69827 0.05105 13.678 < 2e-16 ***
## estrato4 74.34893 24.00866 3.097 0.002085 **
## estrato5 139.48701 21.80589 6.397 4.17e-10 ***
## estrato6 272.59519 36.65228 7.437 5.66e-13 ***
## parqueaderos 24.33931 5.86973 4.147 4.07e-05 ***
## banios 23.12920 6.50058 3.558 0.000415 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 155 on 428 degrees of freedom
## (287 observations deleted due to missingness)
## Multiple R-squared: 0.6056, Adjusted R-squared: 0.6001
## F-statistic: 109.5 on 6 and 428 DF, p-value: < 2.2e-16
##
## Call:
## lm(formula = preciom ~ areaconst + estrato + parqueaderos + banios,
## data = base1)
##
## Residuals:
## Min 1Q Median 3Q Max
## -780.51 -77.28 -18.56 48.71 1001.78
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 28.15518 23.83533 1.181 0.238165
## areaconst 0.69827 0.05105 13.678 < 2e-16 ***
## estrato4 74.34893 24.00866 3.097 0.002085 **
## estrato5 139.48701 21.80589 6.397 4.17e-10 ***
## estrato6 272.59519 36.65228 7.437 5.66e-13 ***
## parqueaderos 24.33931 5.86973 4.147 4.07e-05 ***
## banios 23.12920 6.50058 3.558 0.000415 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 155 on 428 degrees of freedom
## (287 observations deleted due to missingness)
## Multiple R-squared: 0.6056, Adjusted R-squared: 0.6001
## F-statistic: 109.5 on 6 and 428 DF, p-value: < 2.2e-16
Teniendo en cuenta que posterior al ajuste el valor del error residual es menor al F Estadistico se puede decir que el modelo responde a la variabilidad con un 60.56% y así mismo la variablidad explicada es alta frente a la no explicada.
A continuación se presenta el análisis de los coeficientes del Modelo.
Area Construida: Para este coeficiente se tuvo un resultado de 0.69, lo que significar que por cada metro cuadrado construido en la vivienda se esperará un aumento de 0.69 millones, siempre y cuando otras factores no intervengan dentro de los costos finales.
Estrato: Los resultados de los coeficiente fueron de 74.34,139.48 y 272.59 respectivamente, lo que indicar que el costo de la vivienda aumentará 74.34,139.48 o 272.59 millonesde acuerdo con el estrato que se decida adquirir el inmueble, esto aplica siempre y cuando se mantengan las variables restantes en 0.
Parqueaderos: El coeficiente arroja un valor de 24.33, lo que da a entender que por cada unidad de parqueadero adicional que se presente en la casa su valo aumenta 24.08 millones de pesos, siempre y cuando las variables restantes sean equivalentes.
Banios: El coeficiente relacionado a la cantidad de baños en el inmueble arroja lo siguiente. Por cada baño adicional que presente la vivienda el valor de la misma aumentará 23.12 millones de pesos si las demás variables equivalen a cero.
Posteriormente, se procede a validar lo mencionado anteriormente por medio de los graficos y test.
### Linealidad
De acuerdo con la gráfica Residual vs Fitted y apoyados en el Test de Jarque, podemos observar que no existe una normalidad en los residuales. Adicionalmente, podemos concluir que la relación entre las variables no es lineal, ya que, p es menor al 5% lo cual quiere decir que se rechaza la hipotesis nula.
## Registered S3 method overwritten by 'quantmod':
## method from
## as.zoo.data.frame zoo
##
## Jarque Bera Test
##
## data: resid(modelovariables_sel)
## X-squared = 2002.1, df = 2, p-value < 2.2e-16
De acuerdo con la gráfica Q-Q y apoyados en el Test de Shapiro, se observa que existen datos que nos se ajustan a la línea de normalidad, ya que, tienen un comportamiento creciente. De igual manera, al obtener un p menor al 5% se descarta la hipotesis nula y lo cual nos permite concluir que la hipotesis 1 no presenta una distribución normal.
##
## Shapiro-Wilk normality test
##
## data: resid(modelovariables_sel)
## W = 0.84766, p-value < 2.2e-16
En este caso observamos en la grafica Scale - Location que la distribución es aleatoria con respecto a la linea de normalidad y apoyados en el resultado de test el cual es inferior al 5%, concluimos que no se rechaza la hipotesis nula y la varianza de la hipotesis 1 no es constante.
##
## Bartlett test of homogeneity of variances
##
## data: list(base1$preciom, base1$areaconst, base1$parqueaderos, base1$banios)
## Bartlett's K-squared = 10215, df = 3, p-value < 2.2e-16
De acuerdo eon el Test Durbin Watson se puede rechazar la hipotesis nula, al tener un valor de p inferior al 5% .
## Loading required package: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
##
## Durbin-Watson test
##
## data: modelovariables_sel
## DW = 1.8015, p-value = 0.01547
## alternative hypothesis: true autocorrelation is greater than 0
Tomando como punto de partida las caracteristicas dadas para la compra de vivienda en la Zona Norte de la ciudad de Cali que cuente con las siguiente caracteristicas: área construida de 200 mt2, 1 parqueadero, 2 baños, 4 habitaciones y se encuentre en estrato 4 ó 5 los precios promedio son:
Una vivienda ubicada en la Zona Norte - Estrato 4 tiene un rango de valor entre 275.14 a 305.36 millones con un costo promedio de 312.775 millones.
Una vivienda ubicada en la Zona Norte - Estrato 5 tiene un rango de valor entre 346.49 a 409.28 millones con un costo promedio de 377.89 millones.
## fit lwr upr
## 1 312.755 275.1432 350.3669
## fit lwr upr
## 1 377.8931 346.4978 409.2884
Finalmente, presentamos la oferta más acorde de acuerdo a la solicitud realizada inicialmente
##
## Attaching package: 'dplyr'
## The following object is masked from 'package:MASS':
##
## select
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
##
## Attaching package: 'kableExtra'
## The following object is masked from 'package:dplyr':
##
## group_rows
id | zona | estrato | preciom | areaconst | parqueaderos | banios | habitaciones | tipo | barrio | longitud | latitud | precio |
---|---|---|---|---|---|---|---|---|---|---|---|---|
1222 | Zona Norte | 4 | 360 | 216 | 2 | 2 | 4 | Casa | la merced | -76.5139 | 3.48386 | 348.2666 |
## Warning: Unknown or uninitialised column: `piso`.
Actualmente, la Zona Sur cuenta con 2787 apartamento con posible opción de venta. De igual manera, se presenta una muestra de estas viviendas junto con la información detallada de cada una de ellas.
##
## Zona Sur
## 2787
id | zona | estrato | preciom | areaconst | parqueaderos | banios | habitaciones | tipo | barrio | longitud | latitud |
---|---|---|---|---|---|---|---|---|---|---|---|
5098 | Zona Sur | 4 | 290 | 96 | 1 | 2 | 3 | Apartamento | acopi | -76.53464 | 3.44987 |
698 | Zona Sur | 3 | 78 | 40 | 1 | 1 | 2 | Apartamento | aguablanca | -76.50100 | 3.40000 |
8199 | Zona Sur | 6 | 875 | 194 | 2 | 5 | 3 | Apartamento | aguacatal | -76.55700 | 3.45900 |
Para entender la distribución de las propiedades en la Zona Sur, se ha creado un mapa de puntos que muestra que, están distribuidas en estratos 3, 4, 5 y 6, y el área construida varía entre 40 m² y 932 m². Los precios de estas propiedades oscilan entre 75 y 1,750 millones, dependiendo del número de baños, habitaciones y parqueaderos.
Es importante destacar que la mayoría de las viviendas se encuentran en esta zona pero existe un porcentaje significativo de inmueble asociados a áreas distintas a las del objetivo de análisis. Esta discrepancia puede deberse a errores de digitación al registrar las propiedades, problemas durante el proceso de georreferenciación, o errores en la codificación de zonas o barrios.
## id zona estrato preciom
## Min. : 3 Length:2787 Min. :3.00 Min. : 75.0
## 1st Qu.:2292 Class :character 1st Qu.:4.00 1st Qu.: 175.0
## Median :4004 Mode :character Median :5.00 Median : 245.0
## Mean :4131 Mean :4.63 Mean : 297.3
## 3rd Qu.:5876 3rd Qu.:5.00 3rd Qu.: 335.0
## Max. :8302 Max. :6.00 Max. :1750.0
##
## areaconst parqueaderos banios habitaciones
## Min. : 40.00 Min. : 1.000 Min. :0.000 Min. :0.000
## 1st Qu.: 65.00 1st Qu.: 1.000 1st Qu.:2.000 1st Qu.:3.000
## Median : 85.00 Median : 1.000 Median :2.000 Median :3.000
## Mean : 97.47 Mean : 1.415 Mean :2.488 Mean :2.966
## 3rd Qu.:110.00 3rd Qu.: 2.000 3rd Qu.:3.000 3rd Qu.:3.000
## Max. :932.00 Max. :10.000 Max. :8.000 Max. :6.000
## NA's :406
## tipo barrio longitud latitud
## Length:2787 Length:2787 Min. :-76.57 Min. :3.334
## Class :character Class :character 1st Qu.:-76.54 1st Qu.:3.370
## Mode :character Mode :character Median :-76.53 Median :3.383
## Mean :-76.53 Mean :3.390
## 3rd Qu.:-76.52 3rd Qu.:3.406
## Max. :-76.46 Max. :3.497
##
## Warning: Unknown or uninitialised column: `piso`.
##Análisis exploratorio
Al igual que en el caso anterior se realiza un analisis para conocer la relación entre el precio y las diferentes variables de cada apartamento.
Al analizar el costo de las viviendas en relación con el estrato en el que se encuentran, se observa una tendencia general en la que el precio de las viviendas varía según el estrato. En términos generales, a medida que disminuye el estrato, también lo hace el valor de la vivienda. Sin embargo, para las propiedades ubicadas en estratos 4 a 6, se nota un incremento significativo en los precios. Esta tendencia es consistente con la expectativa de que viviendas en estratos más altos tienden a tener características y ubicaciones que justifican precios más altos.
A pesar de esta tendencia, se identifican algunos precios que se desvían considerablemente del promedio, lo cual puede deberse a varios factores. Entre estos, se incluyen posibles errores en el registro de datos, anotaciones incorrectas de los costos o, en algunos casos, ajustes o renovaciones en las propiedades que pueden haber aumentado su valor.
e observa que las variables presentan una correlación positiva con
respecto al valor de las casas. En este caso, el área es el factor más
relevante para definir el costo de la vivienda, seguido por el estrato y
el número de baños. Aunque también existe una correlación entre el
número de habitaciones y los parqueaderos, estos factores no son
decisivos en la determinación del precio.
## Estimación del Modelo
Asumiendo que la relación entre las variables de las viviendas son lineales, se crea una ecuación que relacione cada una de ellas y así identificar las variables dependiente e independientes en la información. Como resultado del mismo se obtuvo el siguiente modelo:
Modelo Estimado = -28.38+1.28X1+30,40X2+50.88X3+204.40X4-17.10X5+62.13X6+41.95X7
##
## Call:
## lm(formula = preciom ~ areaconst + estrato + habitaciones + parqueaderos +
## banios, data = base2)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1058.69 -39.21 0.38 36.96 898.14
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -28.38462 12.93336 -2.195 0.02828 *
## areaconst 1.28595 0.05105 25.189 < 2e-16 ***
## estrato4 30.40026 9.55717 3.181 0.00149 **
## estrato5 50.88889 9.61940 5.290 1.33e-07 ***
## estrato6 204.40443 11.17300 18.294 < 2e-16 ***
## habitaciones -17.10675 3.70357 -4.619 4.06e-06 ***
## parqueaderos 62.13696 3.79229 16.385 < 2e-16 ***
## banios 41.95467 3.24893 12.913 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 92.52 on 2373 degrees of freedom
## (406 observations deleted due to missingness)
## Multiple R-squared: 0.7762, Adjusted R-squared: 0.7755
## F-statistic: 1175 on 7 and 2373 DF, p-value: < 2.2e-16
Teniendo en cuenta que posterior al ajuste el valor del error residual es menor al F Estadistico se puede decir que el modelo responde a la variabilidad con un 77.62% y así mismo la variablidad explicada es alta frente a la no explicada.
A continuación se presenta el análisis de los coeficientes del Modelo.
Area Construida: Para este coeficiente significa que por cada metro cuadrado construido en la vivienda se esperará un aumento de 1.28 millones, siempre y cuando otras factores no intervengan dentro de los costos finales.
Estrato: Los resultados de los coeficiente indican que el costo de la vivienda aumentará 30.40,50.88 y 2204.40 millones respectivamentede acuerdo con el estrato que se decida adquirir el inmueble, esto aplica siempre y cuando se mantengan las variables restantes en 0.
Habitaciones: En este caso el coeficiente dio un valor de -17.10, lo que quiere decir que por cada unidad que se aumente el calor disminuye 17.10 millones. Lo que representa que la variación entre los datos es alta.
Parqueaderos: Por cada unidad de parqueadero adicional que se presente en el aparamento su valor aumenta 62.13 millones de pesos, siempre y cuando las variables restantes sean equivalentes.
Parqueaderos: Por cada unidad de parqueadero adicional que se presente el apartamento su valor aumenta 62.13 millones de pesos, siempre y cuando las variables restantes sean equivalentes.
Banios: El coeficiente relacionado a la cantidad de baños en el inmueble arroja lo siguiente. Por cada baño adicional que presente la vivienda el valor de la misma aumentará 41.95 millones de pesos si las demás variables equivalen a cero.
##
## Call:
## lm(formula = preciom ~ areaconst + estrato + parqueaderos + banios,
## data = base2)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1027.87 -38.45 -0.36 37.54 907.43
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -65.20796 10.22765 -6.376 2.18e-10 ***
## areaconst 1.25369 0.05079 24.684 < 2e-16 ***
## estrato4 32.61559 9.58592 3.402 0.000679 ***
## estrato5 53.19928 9.64744 5.514 3.88e-08 ***
## estrato6 211.64372 11.10981 19.050 < 2e-16 ***
## parqueaderos 63.18762 3.80164 16.621 < 2e-16 ***
## banios 35.75082 2.97095 12.033 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 92.91 on 2374 degrees of freedom
## (406 observations deleted due to missingness)
## Multiple R-squared: 0.7741, Adjusted R-squared: 0.7736
## F-statistic: 1356 on 6 and 2374 DF, p-value: < 2.2e-16
Posteriormente, se procede a validar lo mencionado anteriormente por medio de los graficos y test.
### Linealidad
De acuerdo con la gráfica Residual vs Fitted y apoyados en el Test de Jarque, podemos observar que no existe una normalidad en los residuales. Adicionalmente, podemos concluir que la relación entre las variables no es lineal, ya que, p es menor al 5% lo cual quiere decir que se rechaza la hipotesis nula.
##
## Jarque Bera Test
##
## data: resid(modeloapto_sel)
## X-squared = 71616, df = 2, p-value < 2.2e-16
De acuerdo con la gráfica Q-Q y apoyados en el Test de Shapiro, se observa que existen datos que nos se ajustan a la línea de normalidad, ya que, tienen un comportamiento creciente. De igual manera, al obtener un p menor al 5% se descarta la hipotesis nula y lo cual nos permite concluir que la hipotesis 1 no presenta una distribución normal.
##
## Shapiro-Wilk normality test
##
## data: resid(modeloapto_sel)
## W = 0.78047, p-value < 2.2e-16
En este caso observamos en la grafica Scale - Location que la distribución es aleatoria con respecto a la linea de normalidad y apoyados en el resultado de test el cual es inferior al 5%, concluimos que no se rechaza la hipotesis nula y la varianza de la hipotesis 1 no es constante.
##
## Bartlett test of homogeneity of variances
##
## data: list(base2$preciom, base2$areaconst, base2$parqueaderos, base2$banios)
## Bartlett's K-squared = 50076, df = 3, p-value < 2.2e-16
De acuerdo eon el Test Durbin Watson se puede rechazar la hipotesis nula, al tener un valor de p inferior al 5% .
##
## Durbin-Watson test
##
## data: modeloapto_sel
## DW = 1.6812, p-value = 2.625e-15
## alternative hypothesis: true autocorrelation is greater than 0
Tomando como punto de partida las caracteristicas dadas para la compra de vivienda en la Zona Sur de la ciudad de Cali que cuente con las siguiente caracteristicas: área construida de 300 mt2, 3 parqueadero, 3 baños, 5 habitaciones y se encuentre en estrato 5 ó 6 los precios promedio son:
Una vivienda ubicada en la Zona Sur - Estrato 5 tiene un rango de valor entre 641.67 a 680.15 millones con un costo promedio de 660.91 millones.
Una vivienda ubicada en la Zona Sur - Estrato 6 tiene un rango de valor entre 800.65 a 838.057 millones con un costo promedio de 819.35 millones.
## fit lwr upr
## 1 660.9127 641.6724 680.153
## fit lwr upr
## 1 819.3571 800.6572 838.057
Finalmente, presentamos la oferta más acorde de acuerdo a la solicitud realizada inicialmente
id | zona | estrato | preciom | areaconst | parqueaderos | banios | habitaciones | tipo | barrio | longitud | latitud | precio |
---|---|---|---|---|---|---|---|---|---|---|---|---|
7512 | Zona Sur | 5 | 670 | 300 | 3 | 5 | 6 | Apartamento | seminario | -76.55 | 3.409 | 732.4143 |
## Warning: Unknown or uninitialised column: `piso`.