Maria comenzó como agente de bienes raíces en Cali hace 10 años. Después de laborar dos años para una empresa nacional, se traslado a Bogotá y trabajó para otra agencia de bienes raíces. Sus amigos y familiares la convencieron de que con su experiencia y conocimientos del negocio debía abrir su propia agencia. Terminó por adquirir la licencia de intermediario y al poco tiempo fundó su propia compañía, C&A (Casas y Apartamentos) en Cali. Santiago y Lina, dos vendedores de la empresa anterior aceptaron trabajar en la nueva compaña. En la actualidad ocho agentes de bienes raíces colaboran con ella en C&A.
Actualmente las ventas de bienes raíces en Cali se han visto disminuidas de manera significativa en lo corrido del año. Durante este periodo muchas instituciones bancarias de ahorro y vivienda están prestando grandes sumas de dinero para la industria y la construcción comercial y residencial. Cuando el efecto producto de las tensiones políticas y sociales disminuya, se espera que la actividad económica de este sector se reactive.
Hace dos días, María recibió una carta solicitando asesoría para la compra de dos viviendas por parte de una compañía internacional que desea ubicar a dos de sus empleados con sus familias en la ciudad. Las solicitudes incluyen las siguientes condiciones:
Características Vivienda 1 Vivienda 2
Tipo Casa Apartamento área construida 200 300 parqueaderos 1 3 baños 2 3 habitaciones 4 5 estrato 4 o 5 5 o 6 zona Norte Sur crédito preaprobado 350 millones 850 millones
Ayude a María a responder la solicitud, mediante técnicas modelación que usted conoce. Ella requiere le envíe un informe ejecutivo donde analice los dos casos y sus recomendaciones (Informe). Como soporte del informe debe anexar las estimaciones, validaciones y comparación de modelos requeridos (Anexos) .
Datos Los datos de los tres últimos meses se adjuntan en la base que puede obtener con el siguiente código en R
variable descripción zona ubicación de la vivienda : Zona Centro, Zona Norte,… piso piso que ocupa la vivienda : primer piso, segundo piso… estrato estrato socio-económico : 3,4,5,6 preciom precio de la vivienda en millones de pesos areaconst área construida parqueaderos número de parqueaderos banios número de baños habitaciones número de habitaciones tipo tipo de vivienda : Casa, Apartamento barrio barrio de ubicación de la vivienda : 20 de Julio, alamos,.. longitud coordenada geográfica latitud coordenada geográfica
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
## Warning: package 'corrplot' was built under R version 4.3.2
## corrplot 0.92 loaded
## Warning: package 'plotly' was built under R version 4.3.2
## Loading required package: ggplot2
##
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
##
## last_plot
## The following object is masked from 'package:stats':
##
## filter
## The following object is masked from 'package:graphics':
##
## layout
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ forcats 1.0.0 ✔ stringr 1.5.0
## ✔ lubridate 1.9.2 ✔ tibble 3.2.1
## ✔ purrr 1.0.1 ✔ tidyr 1.3.0
## ✔ readr 2.1.4
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ plotly::filter() masks dplyr::filter(), stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
## Loading required package: zoo
##
##
## Attaching package: 'zoo'
##
##
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
Zona norte de la ciudad.
Se presentan de la zona norte:
Los primeros 3 registros de las bases
## id zona piso estrato preciom areaconst parquea banios habitac tipo
## 1 8088 Zona Norte NA 3 149 130 NA 2 3 Casa
## 2 6812 Zona Norte 7 4 670 470 4 5 5 Casa
## 3 6673 Zona Norte NA 5 750 300 2 3 5 Casa
## barrio longitud latitud
## 1 brisas de los -76555 3417.00
## 2 tejares de san -76545 3.44
## 3 el gran limonar -76544 3397.00
Los tipos de viviendas
##
## Casa
## 714
La base de viviendas de la zona norte cuanta con 714 registros de tipo de vivienda “Casa”
Los estratos de la zona elegida
##
## 3 4 5 6
## 229 160 270 55
Se puede evidenciar que la distribucion de la zonn a norte en la ciudad de Cali el mayor numero de casas se encuentran en el estrato 5 con 270 casas, segido por el estrato 3 con 229 casa y con menor numero los estratos 4 con 160 casas y el estrato 6 con 55 casas
Mapa
## Loading required package: leaflet
Como podemos evidenciar la mayor cantidad de viviendas se encuentran ubicadas en la zona norte de la ciudad de Cali, sin embargo podemos observar una serie de viviendas dispersas por la ciudad de cali en otras zonas diferentes a la filtrada, esto puede obedecer a una mala georreferenciacion, fueron ubicados en la Zona Norte, pero los datos de longitud y latitud, no corresponden y seria necesario verificar los datos y barrio en el cual estan ubicadas las residencia, para garatizar la mejor calidad en el analisis.
## preciom areaconst estrato banios habitac
## preciom 1.0000000 0.7286395 0.6092542 0.5234220 0.3250035
## areaconst 0.7286395 1.0000000 0.4524809 0.4630139 0.3804218
## estrato 0.6092542 0.4524809 1.0000000 0.4098563 0.1112624
## banios 0.5234220 0.4630139 0.4098563 1.0000000 0.5777713
## habitac 0.3250035 0.3804218 0.1112624 0.5777713 1.0000000
Se evidencia que la correlacion mas fuerte se encuentra entre el area construida y el precio de la vivienda, ya que las casas con mayor area tiene un mayor costo, y la segunda relacion importante es entre el estrato y el precio, por lo cual el area y el estrato influyen en los precios de las viviendas.
Relacion de estrato con precio
Como podemos evidenciar en la gráfica de cajas, la relación de los estratos de la zona norte con respecto al valor de las viviendas tipos “Casa”, En el estrato 3 la mediana en el valor de las viviendas es 215 millones, y el valor de las viviendas oscilan entre el primer cuartil (q1) de 161 millones y el tercer cuartil (q3) de 300 millones, sin embargo hay valores atípicos entre 515 y 1000 millones de pesos para este estrato. Para el estrato 4 la mediana en el valor es de 386 millones con valores que oscilan entre el primer cuartil (q1) de 320 millones y el tercer cuartil (q3) de 530 millones, sin embargo hay valores atípicos entre 900 y 1800 millones de pesos para este estrato, evidenciando un dispersión mayor entre los precios en comparación con el estrato 3, para el estrato 5 la mediana en el valor de las viviendas es de 480 millones de pesos, con valores que oscilan entre el primer cuartil (q1) entre 390 millones y el tercer cuartil (q3) hasta 650 millones, sin embargo hay valores atípicos con una mayor dispersión de los cuatro estratos en la zona norte entre 1050 y 1940 millones de pesos siendo el valor más alto de una vivienda en la zona norte de la ciudad de Cali, finalmente para el estrato 6 la mediana en el valor de las viviendas es de 800 millones de pesos, con valores que oscilan entre el primer cuartil (q1) entre 592 millones y el tercer cuartil (q3) hasta 945 millones, y con una mínima cantidad de valores atípicos en comparación de los otros estratos.
Relacion de area construida con precio
Histograma de las areas contruidas en la zona norte
Se eviencia que el mayor numero de viviendas tipo casa en la zona norte de la ciudad de Cali se encuentran entre los 50 m2 y 549 m2
La realacion que tiene el area de construccion de las viviendas con el valor es proporcional, a medida que aumenta el area aumenta el valor sindo una realcion directamente proporcional. Podemos evidenciar una mayor concentracion de viviendas entre los 400 millones de pesos y 500 metros cuadrados Relacion de cantidad de baños con el precio de la vivienda
Podemos observar que las viviendas con valora de 500 millones o menos predominan de a 5 baños y las viviendas de 5 o mas baños se encuentran en la escala de 5000 a 1000 millones, de este valor en adelante son pocas viviendas pero en su mayoría tienen de 4 baños en adelante, solo hay dos casas con 3 casa con 9 y 10, siendo datos atípicos al promedio, también evidenciamos viviendas sin baños, entre los valores de los valores de 190 millones y 1200 millones, lo cual se convierten en datos atípicos al promedio
Relación de cantidad de habitaciones con el precio de la vivienda
La relación de habitación y precio de la viviendas está concentrado entre 3 y 6 habitaciones en su mayoría inferior a los 500 millones, sin embargo se observa que entre mayor número de habitaciones el precio aumento en menor cantidad de viviendas y se observa una relación directa con los baños, puesto que tiene un comportamiento similar.
Relación de zona con el precio de la vivienda
Fianlmente en la relacion de zona de residencia con el valor de las viviendas tipo casa, tenemos una mediana de 395 millones en el valor de las casas, los valores oscilan el primer cuartil (q1) entre 270 millones y el tercer cuartil (q3) entre 550 millones, y el valor minimo es de 89 millones y el maximo de 950 millones.
Estime un modelo de regresión lineal múltiple con las variables del punto anterior (precio = f(área construida, estrato, número de cuartos, número de parqueaderos, número de baños ) ) e interprete los coeficientes si son estadísticamente significativos. Las interpretaciones deber están contextualizadas y discutir si los resultados son lógicos. Adicionalmente interprete el coeficiente R2 y discuta el ajuste del modelo e implicaciones (que podrían hacer para mejorarlo).
##
## Call:
## lm(formula = preciom ~ areaconst + estrato + habitac + parquea +
## banios, data = Vivienda_Zona_Norte)
##
## Residuals:
## Min 1Q Median 3Q Max
## -783.72 -78.53 -16.56 47.88 978.59
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -235.99591 44.75458 -5.273 2.14e-07 ***
## areaconst 0.67815 0.05315 12.758 < 2e-16 ***
## estrato 80.25743 9.86998 8.131 4.65e-15 ***
## habitac 7.04493 5.75972 1.223 0.22195
## parquea 23.98928 5.88921 4.073 5.52e-05 ***
## banios 19.49301 7.51547 2.594 0.00982 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 155.5 on 427 degrees of freedom
## (281 observations deleted due to missingness)
## Multiple R-squared: 0.6008, Adjusted R-squared: 0.5962
## F-statistic: 128.6 on 5 and 427 DF, p-value: < 2.2e-16
## [1] 0.6008423
El análisis del modelo de regresión múltiple, el coeficiente de determinación múltiple (R-cuadrado) es de 60.08% aproximadamente, lo cual nos indica que el precio de las viviendas, se puede explicar con las variables independientes incluidas en el modelo (Área construida, estrato, número de habitaciones, numero de parqueaderos y cantidad de baños), por lo cual el valor de las viviendas están relacionados en un 60.08%. En el modelo el valor estimado del intercepto es de 235 millones de pesos para la zona norte de la ciudad de Cali, los cual significa, cuando todas las variables independientes están en cero este es el valor estimado de la vivienda. Podemos evidenciar que el valor P de todas las variables independientes son muy pequeños, lo cual nos sugiere que todas las variables son significativas al modelo. El análisis por coeficiente nos genera el siguiente resultado: Para el área construida, por cada metro cuadrado adicional de vivienda se estima un aumento en el valor de 67 millones de pesos, para el estrato socioeconómico segun su valor entre más alto el estrato el valor aumento en 80 millones de pesos, cada habitación adicional en la vivienda aumento el valor en 70 millones de pesos, por cada parqueadero adicional con que cuenta la vivienda el valor aumenta en 23 millones de pesos y por cada baño adicional con que cuenta las viviendas el valor aumenta en 19 millones de pesos.
El modelo podria mejorar, si incluyeran y codificaran los barrios de la zona norte, de esta menera se podria segmentar la inforamcion de forma mas adecuada, de esta forma se analisaria cual es el sector con mayor agrado para los clientes.
Validación de supuestos del modelo
Podemor observar que la distribucion teorica normal, en el grafico los
puentos tiene una aliniecion lienal, en la grafica de residuos se
observa una buena homocedasticidad puesto que la variancia en los
residuos es constante, con una distribucion de puntos cercanos a la
linea horizonatal
##
## Durbin-Watson test
##
## data: modelo
## DW = 2.057, p-value = 0.7137
## alternative hypothesis: true autocorrelation is greater than 0
##
## Shapiro-Wilk normality test
##
## data: normalidad
## W = 0.8537, p-value < 0.00000000000000022
La prueba de shapiro es muy ceracno a 1 (W = 0.8537), por lo cual la informacion tiende a seguir una distribucion normal y el valor p-value es muy pequeño (p-value < 0.00000000000000022) por lo cual se rechaza la hipotesis nula.
Con el modelo identificado debe predecir el precio de la vivienda con las características de la primera solicitud (Vivienda 1), tipo = casa, area construida = 200, parqueaderos = 1, baños = 2, habitaciones = 4, estratos 4 o 5, en la zona norte y valor aprovado de 350 millones.
## fit lwr upr
## 1 311.8189 286.6614 336.9763
## 2 392.0763 360.0767 424.0759
Las predicciones nos da dos opciones, la primera opcion en estrato 4 con un valor aproximado de 311 millones, y con un intervalo entre 286 y 336 millones y la segunda opcion en estrato 5 con un valor aproximado de 392 millones, y con un intervalo entre 360 y 424 millones
Se presentan las opciones de vivienda segun las caracteristicas solicitadas por parte de una compañía internacional que desea ubicar a dos de sus empleados con sus familias en la ciudad.
## id zona piso estrato preciom areaconst parquea banios habitac tipo
## 22 4800 Zona Norte 1 5 340 250.0 2 4 4 Casa
## 89 3352 Zona Norte NA 4 335 300.0 3 4 4 Casa
## 124 1842 Zona Norte 2 5 350 240.0 2 3 4 Casa
## 127 1849 Zona Norte NA 5 330 246.0 2 4 4 Casa
## 157 1151 Zona Norte NA 5 320 210.0 2 3 5 Casa
## 349 766 Zona Norte NA 5 321 249.0 1 5 5 Casa
## 354 819 Zona Norte 2 5 350 264.0 2 3 4 Casa
## 368 937 Zona Norte 2 4 350 280.0 2 3 4 Casa
## 369 952 Zona Norte 2 4 330 275.0 2 3 5 Casa
## 380 1009 Zona Norte NA 5 250 243.0 1 4 5 Casa
## 382 1020 Zona Norte 2 4 230 250.0 2 3 5 Casa
## 393 1108 Zona Norte 2 4 330 260.0 1 3 4 Casa
## 399 1144 Zona Norte NA 4 320 200.0 2 4 4 Casa
## 402 1163 Zona Norte NA 5 350 216.0 2 2 4 Casa
## 422 1270 Zona Norte NA 5 350 203.0 2 2 5 Casa
## 427 1343 Zona Norte 2 5 320 200.0 2 4 4 Casa
## 449 1822 Zona Norte NA 4 340 295.0 2 2 4 Casa
## 454 1887 Zona Norte 1 5 340 203.0 2 3 4 Casa
## 458 1914 Zona Norte 2 5 300 205.0 2 5 6 Casa
## 462 1943 Zona Norte NA 5 350 346.0 1 2 4 Casa
## 484 2544 Zona Norte 1 4 340 264.5 2 4 4 Casa
## 518 3043 Zona Norte NA 5 330 275.0 2 3 5 Casa
## 520 3053 Zona Norte 2 5 320 230.0 2 4 4 Casa
## 532 3101 Zona Norte 2 5 340 355.0 2 5 8 Casa
## 553 3453 Zona Norte NA 5 340 240.0 2 5 6 Casa
## 585 4209 Zona Norte 2 5 350 300.0 3 5 6 Casa
## 586 4210 Zona Norte 1 5 350 200.0 3 3 4 Casa
## 589 4267 Zona Norte 1 5 335 202.0 1 4 5 Casa
## 602 4422 Zona Norte 2 5 350 240.0 2 3 6 Casa
## 608 4458 Zona Norte 2 4 315 270.0 2 4 4 Casa
## 612 4483 Zona Norte 2 5 342 250.0 1 4 6 Casa
## 646 5031 Zona Norte 3 4 350 350.0 1 4 5 Casa
## 703 7432 Zona Norte 1 4 260 280.0 2 4 6 Casa
## 705 7470 Zona Norte 2 4 340 264.0 2 5 7 Casa
## barrio longitud latitud
## 22 el bosque -76533.00000 3465.00000
## 89 el bosque -76526.00000 3434.00000
## 124 vipasa -76518.00000 3481.00000
## 127 prados del norte -76518.00000 3.47000
## 157 urbanización la merced -76512.00000 3476.00000
## 349 la merced -76.50291 3.46757
## 354 la flora -76.50330 3.46412
## 368 la merced -76.50603 3.46643
## 369 la merced -76.50647 3.47516
## 380 el bosque -76.50755 3.47838
## 382 la merced -76.50799 3.47424
## 393 la merced -76.51060 3.48108
## 399 la merced -76.51156 3.48029
## 402 la merced -76.51218 3.48181
## 422 el bosque -76.51448 3.48531
## 427 la flora -76.51524 3.48893
## 449 vipasa -76.51777 3.48060
## 454 vipasa -76.51803 3.48257
## 458 vipasa -76.51832 3.48138
## 462 vipasa -76.51847 3.47503
## 484 vipasa -76.52096 3.47665
## 518 la merced -76.52350 3.48329
## 520 la flora -76.52353 3.48352
## 532 san vicente -76.52377 3.46384
## 553 la campiña -76.52640 3.48211
## 585 el bosque -76.53010 3.48577
## 586 el bosque -76.53010 3.48503
## 589 el bosque -76.53044 3.48399
## 602 el bosque -76.53136 3.48635
## 608 el bosque -76.53176 3.48780
## 612 el bosque -76.53197 3.48752
## 646 salomia -76.53464 3.44987
## 703 los andes -76.54973 3.42484
## 705 vipasa -76.54980 3.37556
Se presentan 34 opciones, las cuales se presentan en el mapa de la ciudad.
De las 34 casa presentadas tenemos 3 que estan mal clasificadas y deberan ser verificadas por que segun la zona correponden a norte, pero en la ubicacion geografica estan en el centro y sur de la ciudad, y no cumplen con las carcateriticas solcitadas las cuales son las casas con ID 705, 89 y 703, las restantes 31 casas cumplen con las caracteristicas minimas requeridas y el valor corresponde al credito pre aprovado.
Zona norte de la ciudad.
Se presentan de la zona norte:
Los primeros 3 registros de las bases
## id zona piso estrato preciom areaconst parquea banios habitac
## 1 8025 Zona Norte NA 4 310 120 1 3 2
## 2 7815 Zona Norte NA 6 490 227 NA 3 4
## 3 7351 Zona Norte NA 4 145 55 1 2 2
## tipo barrio longitud latitud
## 1 Apartamento san pedro -76554 3426.00000
## 2 Apartamento acopi -76552 3.45147
## 3 Apartamento el lido -76549 3418.00000
Los tipos de viviendas
##
## Apartamento
## 1172
La base de viviendas de la zona norte cuanta con 1172 registros de tipo de vivienda “Apartamento”
Los estratos de la zona elegida
##
## 3 4 5 6
## 326 238 492 116
Se puede evidenciar que la distribucion de la zonn a norte en la ciudad de Cali el mayor numero de apartamentos se encuentran en el estrato 5 con 492 apartamentos, segido por el estrato 3 con 326 apartamentos y con menor numero los estratos 4 con 238 apartamentos y el estrato 6 con 116 apartamentos
Mapa
Como podemos evidenciar la mayor cantidad de viviendas se encuentran ubicadas en la zona norte de la ciudad de Cali, sin embargo podemos observar una serie de viviendas dispersas por la ciudad de cali en otras zonas diferentes a la filtrada, esto puede obedecer a una mala georreferenciacion, fueron ubicados en la Zona Norte, pero los datos de longitud y latitud, no corresponden y seria necesario verificar los datos y barrio en el cual estan ubicadas las residencia, para garatizar la mejor calidad en el analisis.
## preciom areaconst estrato banios habitac
## preciom 1.00000000 0.79572934 0.71959643 0.72132033 0.19605437
## areaconst 0.79572934 1.00000000 0.57237299 0.72636202 0.31314263
## estrato 0.71959643 0.57237299 1.00000000 0.59749314 0.06210816
## banios 0.72132033 0.72636202 0.59749314 1.00000000 0.36191696
## habitac 0.19605437 0.31314263 0.06210816 0.36191696 1.00000000
Se evidencia que la correlacion mas fuerte se encuentra entre el area construida y el precio de la vivienda, ya que los apartamentoss con mayor area tiene un mayor costo, y la segunda relacion importante es entre la cantidad de baños y estrato con el precio, por lo cual estos tres factores influyen en los precios de las viviendas.
Relacion de estrato con precio
Como podemos evidenciar en la gráfica de cajas, la relación de los estratos de la zona norte con respecto al valor de las viviendas tipos “Apartamento”, En el estrato 3 la mediana en el valor de las viviendas es 119 millones, y el valor de las viviendas oscilan entre el primer cuartil (q1) de 99 millones y el tercer cuartil (q3) de 135 millones, sin embargo hay valores atípicos entre 377 y 435 millones de pesos para este estrato, finalmente evidenciamos un grean consentracion en el valor de los apartamentos. Para el estrato 4 la mediana en el valor es de 300 millones con valores que oscilan entre el primer cuartil (q1) de 155 millones y el tercer cuartil (q3) de 250 millones, sin embargo hay valores atípicos entre 510 y 750 millones de pesos para este estrato, evidenciando un dispersión mayor entre los precios en comparación con el estrato 3, para el estrato 5 la mediana en el valor de las viviendas es de 320 millones de pesos, con valores que oscilan entre el primer cuartil (q1) entre 266 millones y el tercer cuartil (q3) hasta 400 millones, sin embargo hay valores atípicos con una mayor dispersión de los cuatro estratos en la zona norte entre 650 y 1500 millones de pesos, finalmente para el estrato 6 la mediana en el valor de las viviendas es de 592 millones de pesos, con valores que oscilan entre el primer cuartil (q1) entre 430 millones y el tercer cuartil (q3) hasta 850 millones, y con una mínima cantidad de valores atípicos en comparación de los otros estratos.
Relacion de area construida con precio
Histograma de las areas contruidas en la zona norte
Se eviencia que el mayor numero de viviendas tipo casa en la zona norte de la ciudad de Cali se encuentran entre los 50 m2 y 549 m2
La realacion que tiene el area de construccion de las viviendas con el valor es proporcional, a medida que aumenta el area aumenta el valor sindo una realcion directamente proporcional. Podemos evidenciar una mayor concentracion de viviendas entre los 70 millones de pesos y 203 metros cuadrados
Podemos observar que las viviendas con valora de 525 millones o menos predominan de 1 a 3 baños y las viviendas de 4 o mas baños se encuentran en la escala de 246 a 1500 millones, de este valor en adelante son pocas viviendas pero en su mayoría tienen de 4 baños en adelante, tan solo un apartamento cuenta con 6 balos y su valor es de 880 millones, también evidenciamos viviendas sin baños, entre los valores de 220 millones y 380 millones, lo cual se convierten en datos atípicos.
Relación de cantidad de habitaciones con el precio de la vivienda
La relación de habitación y precio de la viviendas está concentrado entre 2 y 3 habitaciones en su mayoría inferior a los 600 millones, sin embargo se observa que entre mayor número de habitaciones el precio aumento en menor cantidad de viviendas y se observa una relación directa con los baños, puesto que tiene un comportamiento similar.
Relación de zona con el precio de la vivienda
Fianlmente en la relacion de zona de residencia con el valor de las viviendas tipo apartamento, tenemos una mediana de 250 millones en el valor de los apartamentos, los valores oscilan el primer cuartil (q1) entre 140 millones y el tercer cuartil (q3) entre 360 millones, y el valor minimo es de 65 millones y el maximo de 690 millones.
Estime un modelo de regresión lineal múltiple con las variables del punto anterior (precio = f(área construida, estrato, número de cuartos, número de parqueaderos, número de baños ) ) e interprete los coeficientes si son estadísticamente significativos. Las interpretaciones deber están contextualizadas y discutir si los resultados son lógicos. Adicionalmente interprete el coeficiente R2 y discuta el ajuste del modelo e implicaciones (que podrían hacer para mejorarlo).
##
## Call:
## lm(formula = preciom ~ areaconst + estrato + habitac + parquea +
## banios, data = Vivienda_Zona_Norte)
##
## Residuals:
## Min 1Q Median 3Q Max
## -765.31 -37.70 2.77 36.72 697.10
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -237.17231 24.16009 -9.817 < 0.0000000000000002 ***
## areaconst 1.48539 0.09728 15.269 < 0.0000000000000002 ***
## estrato 57.46203 4.76742 12.053 < 0.0000000000000002 ***
## habitac -21.99925 6.05978 -3.630 0.0003 ***
## parquea 68.18418 7.91538 8.614 < 0.0000000000000002 ***
## banios 43.32490 6.40466 6.765 0.0000000000252 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 99 on 833 degrees of freedom
## (333 observations deleted due to missingness)
## Multiple R-squared: 0.7526, Adjusted R-squared: 0.7511
## F-statistic: 506.7 on 5 and 833 DF, p-value: < 0.00000000000000022
## [1] 0.7525712
El análisis del modelo de regresión múltiple, el coeficiente de determinación múltiple (R-cuadrado) es de 75.26% aproximadamente, lo cual nos indica que el precio de las viviendas, se puede explicar con las variables independientes incluidas en el modelo (Área construida, estrato, número de habitaciones, numero de parqueaderos y cantidad de baños), por lo cual el valor de las viviendas están relacionados en un 75.26%, en comparacion con las casas la significacion es de un 15% superior a las casa En el modelo el valor estimado del intercepto es de 237 millones de pesos para la zona norte de la ciudad de Cali, los cual significa, cuando todas las variables independientes están en cero este es el valor estimado de la vivienda. Podemos evidenciar que el valor P de todas las variables independientes son muy pequeños, lo cual nos sugiere que todas las variables son significativas al modelo. El análisis por coeficiente nos genera el siguiente resultado: Para el área construida, por cada metro cuadrado adicional de vivienda se estima un aumento en el valor de 14 millones de pesos, para el estrato socioeconómico segun su valor entre más alto el estrato el valor aumento en 57 millones de pesos, cada habitación adicional en la vivienda aumento el valor en 21 millones de pesos, por cada parqueadero adicional con que cuenta la vivienda el valor aumenta en 68 millones de pesos y por cada baño adicional con que cuenta las viviendas el valor aumenta en 43 millones de pesos.
El modelo podria mejorar, si incluyeran y codificaran los barrios de la zona norte, de esta menera se podria segmentar la inforamcion de forma mas adecuada, de esta forma se analisaria cual es el sector con mayor agrado para los clientes.
Validación de supuestos del modelo
Podemor observar que la distribucion teorica normal, en el grafico los
puentos tiene una aliniecion lienal, en la grafica de residuos se
observa una buena homocedasticidad puesto que la variancia en los
residuos es constante, con una distribucion de puntos cercanos a la
linea horizonatal
##
## Durbin-Watson test
##
## data: modelo
## DW = 1.6355, p-value = 0.00000005187
## alternative hypothesis: true autocorrelation is greater than 0
##
## Shapiro-Wilk normality test
##
## data: normalidad
## W = 0.85007, p-value < 0.00000000000000022
La prueba de shapiro es muy ceracno a 1 (W = 0.85007), por lo cual la informacion tiende a seguir una distribucion normal y el valor p-value es muy pequeño (p-value < 0.00000000000000022) por lo cual se rechaza la hipotesis nula.
Con el modelo identificado debe predecir el precio de la vivienda con las características de la primera solicitud (Vivienda 1), tipo = apartamento, area construida = 300, parqueaderos = 3, baños = 3, habitaciones = 5, estratos 5 o 6, en la zona norte y valor aprovado de 850 millones.
## fit lwr upr
## 1 720.2864 679.3945 761.1783
## 2 777.7484 736.7610 818.7359
Las predicciones nos da dos opciones, la primera opcion en estrato 5 con un valor aproximado de 720 millones, y con un intervalo entre 679 y 761 millones y la segunda opcion en estrato 6 con un valor aproximado de 777 millones, y con un intervalo entre 736 y 818 millones
Se presentan las opciones de vivienda segun las caracteristicas solicitadas por parte de una compañía internacional que desea ubicar a dos de sus empleados con sus familias en la ciudad.
## id zona piso estrato preciom areaconst parquea banios habitac
## 945 3572 Zona Norte 5 5 450 307 4 4 5
## tipo barrio longitud latitud
## 945 Apartamento versalles -76.52708 3.46439
Se presenta 1 opciones, la cual se presenta en el mapa de la ciudad.
El apartamento que cumple con las caracteristicas solicitadas, se puede ubicar en el mapa de la ciudad de Cali, es con el Id 3572