Caso Inmobiliaria C&A

Problema

Maria comenzó como agente de bienes raíces en Cali hace 10 años. Después de laborar dos años para una empresa nacional, se traslado a Bogotá y trabajó para otra agencia de bienes raíces. Sus amigos y familiares la convencieron de que con su experiencia y conocimientos del negocio debía abrir su propia agencia. Terminó por adquirir la licencia de intermediario y al poco tiempo fundó su propia compañía, C&A (Casas y Apartamentos) en Cali. Santiago y Lina, dos vendedores de la empresa anterior aceptaron trabajar en la nueva compaña. En la actualidad ocho agentes de bienes raíces colaboran con ella en C&A.

Actualmente las ventas de bienes raíces en Cali se han visto disminuidas de manera significativa en lo corrido del año. Durante este periodo muchas instituciones bancarias de ahorro y vivienda están prestando grandes sumas de dinero para la industria y la construcción comercial y residencial. Cuando el efecto producto de las tensiones políticas y sociales disminuya, se espera que la actividad económica de este sector se reactive.

Hace dos días, María recibió una carta solicitando asesoría para la compra de dos viviendas por parte de una compañía internacional que desea ubicar a dos de sus empleados con sus familias en la ciudad. Las solicitudes incluyen las siguientes condiciones:

Características Vivienda 1 Vivienda 2

Tipo Casa Apartamento área construida 200 300 parqueaderos 1 3 baños 2 3 habitaciones 4 5 estrato 4 o 5 5 o 6 zona Norte Sur crédito preaprobado 350 millones 850 millones

Ayude a María a responder la solicitud, mediante técnicas modelación que usted conoce. Ella requiere le envíe un informe ejecutivo donde analice los dos casos y sus recomendaciones (Informe). Como soporte del informe debe anexar las estimaciones, validaciones y comparación de modelos requeridos (Anexos) .

Datos Los datos de los tres últimos meses se adjuntan en la base que puede obtener con el siguiente código en R

variable descripción zona ubicación de la vivienda : Zona Centro, Zona Norte,… piso piso que ocupa la vivienda : primer piso, segundo piso… estrato estrato socio-económico : 3,4,5,6 preciom precio de la vivienda en millones de pesos areaconst área construida parqueaderos número de parqueaderos banios número de baños habitaciones número de habitaciones tipo tipo de vivienda : Casa, Apartamento barrio barrio de ubicación de la vivienda : 20 de Julio, alamos,.. longitud coordenada geográfica latitud coordenada geográfica

## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
## Warning: package 'corrplot' was built under R version 4.3.2
## corrplot 0.92 loaded
## Warning: package 'plotly' was built under R version 4.3.2
## Loading required package: ggplot2
## 
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## The following object is masked from 'package:stats':
## 
##     filter
## The following object is masked from 'package:graphics':
## 
##     layout
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ forcats   1.0.0     ✔ stringr   1.5.0
## ✔ lubridate 1.9.2     ✔ tibble    3.2.1
## ✔ purrr     1.0.1     ✔ tidyr     1.3.0
## ✔ readr     2.1.4     
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ plotly::filter() masks dplyr::filter(), stats::filter()
## ✖ dplyr::lag()     masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
## Loading required package: zoo
## 
## 
## Attaching package: 'zoo'
## 
## 
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric

Pasos requeridos para la obtención de los resultados

Punto 1

Base 1

Zona norte de la ciudad.

Se presentan de la zona norte:

Los primeros 3 registros de las bases

##     id       zona piso estrato preciom areaconst parquea banios habitac tipo
## 1 8088 Zona Norte   NA       3     149       130      NA      2       3 Casa
## 2 6812 Zona Norte    7       4     670       470       4      5       5 Casa
## 3 6673 Zona Norte   NA       5     750       300       2      3       5 Casa
##            barrio longitud latitud
## 1   brisas de los   -76555 3417.00
## 2  tejares de san   -76545    3.44
## 3 el gran limonar   -76544 3397.00

Los tipos de viviendas

## 
## Casa 
##  714

La base de viviendas de la zona norte cuanta con 714 registros de tipo de vivienda “Casa”

Los estratos de la zona elegida

## 
##   3   4   5   6 
## 229 160 270  55

Se puede evidenciar que la distribucion de la zonn a norte en la ciudad de Cali el mayor numero de casas se encuentran en el estrato 5 con 270 casas, segido por el estrato 3 con 229 casa y con menor numero los estratos 4 con 160 casas y el estrato 6 con 55 casas

Mapa

## Loading required package: leaflet

Como podemos evidenciar la mayor cantidad de viviendas se encuentran ubicadas en la zona norte de la ciudad de Cali, sin embargo podemos observar una serie de viviendas dispersas por la ciudad de cali en otras zonas diferentes a la filtrada, esto puede obedecer a una mala georreferenciacion, fueron ubicados en la Zona Norte, pero los datos de longitud y latitud, no corresponden y seria necesario verificar los datos y barrio en el cual estan ubicadas las residencia, para garatizar la mejor calidad en el analisis.

Paso 2

##             preciom areaconst   estrato    banios   habitac
## preciom   1.0000000 0.7286395 0.6092542 0.5234220 0.3250035
## areaconst 0.7286395 1.0000000 0.4524809 0.4630139 0.3804218
## estrato   0.6092542 0.4524809 1.0000000 0.4098563 0.1112624
## banios    0.5234220 0.4630139 0.4098563 1.0000000 0.5777713
## habitac   0.3250035 0.3804218 0.1112624 0.5777713 1.0000000

Se evidencia que la correlacion mas fuerte se encuentra entre el area construida y el precio de la vivienda, ya que las casas con mayor area tiene un mayor costo, y la segunda relacion importante es entre el estrato y el precio, por lo cual el area y el estrato influyen en los precios de las viviendas.

Punto 2

Realacion de atributos

Relacion de estrato con precio

Como podemos evidenciar en la gráfica de cajas, la relación de los estratos de la zona norte con respecto al valor de las viviendas tipos “Casa”, En el estrato 3 la mediana en el valor de las viviendas es 215 millones, y el valor de las viviendas oscilan entre el primer cuartil (q1) de 161 millones y el tercer cuartil (q3) de 300 millones, sin embargo hay valores atípicos entre 515 y 1000 millones de pesos para este estrato. Para el estrato 4 la mediana en el valor es de 386 millones con valores que oscilan entre el primer cuartil (q1) de 320 millones y el tercer cuartil (q3) de 530 millones, sin embargo hay valores atípicos entre 900 y 1800 millones de pesos para este estrato, evidenciando un dispersión mayor entre los precios en comparación con el estrato 3, para el estrato 5 la mediana en el valor de las viviendas es de 480 millones de pesos, con valores que oscilan entre el primer cuartil (q1) entre 390 millones y el tercer cuartil (q3) hasta 650 millones, sin embargo hay valores atípicos con una mayor dispersión de los cuatro estratos en la zona norte entre 1050 y 1940 millones de pesos siendo el valor más alto de una vivienda en la zona norte de la ciudad de Cali, finalmente para el estrato 6 la mediana en el valor de las viviendas es de 800 millones de pesos, con valores que oscilan entre el primer cuartil (q1) entre 592 millones y el tercer cuartil (q3) hasta 945 millones, y con una mínima cantidad de valores atípicos en comparación de los otros estratos.

Relacion de area construida con precio

Histograma de las areas contruidas en la zona norte

Se eviencia que el mayor numero de viviendas tipo casa en la zona norte de la ciudad de Cali se encuentran entre los 50 m2 y 549 m2

La realacion que tiene el area de construccion de las viviendas con el valor es proporcional, a medida que aumenta el area aumenta el valor sindo una realcion directamente proporcional. Podemos evidenciar una mayor concentracion de viviendas entre los 400 millones de pesos y 500 metros cuadrados Relacion de cantidad de baños con el precio de la vivienda

Podemos observar que las viviendas con valora de 500 millones o menos predominan de a 5 baños y las viviendas de 5 o mas baños se encuentran en la escala de 5000 a 1000 millones, de este valor en adelante son pocas viviendas pero en su mayoría tienen de 4 baños en adelante, solo hay dos casas con 3 casa con 9 y 10, siendo datos atípicos al promedio, también evidenciamos viviendas sin baños, entre los valores de los valores de 190 millones y 1200 millones, lo cual se convierten en datos atípicos al promedio

Relación de cantidad de habitaciones con el precio de la vivienda

La relación de habitación y precio de la viviendas está concentrado entre 3 y 6 habitaciones en su mayoría inferior a los 500 millones, sin embargo se observa que entre mayor número de habitaciones el precio aumento en menor cantidad de viviendas y se observa una relación directa con los baños, puesto que tiene un comportamiento similar.

Relación de zona con el precio de la vivienda

Fianlmente en la relacion de zona de residencia con el valor de las viviendas tipo casa, tenemos una mediana de 395 millones en el valor de las casas, los valores oscilan el primer cuartil (q1) entre 270 millones y el tercer cuartil (q3) entre 550 millones, y el valor minimo es de 89 millones y el maximo de 950 millones.

Punto 3

Estime un modelo de regresión lineal múltiple con las variables del punto anterior (precio = f(área construida, estrato, número de cuartos, número de parqueaderos, número de baños ) ) e interprete los coeficientes si son estadísticamente significativos. Las interpretaciones deber están contextualizadas y discutir si los resultados son lógicos. Adicionalmente interprete el coeficiente R2 y discuta el ajuste del modelo e implicaciones (que podrían hacer para mejorarlo).

## 
## Call:
## lm(formula = preciom ~ areaconst + estrato + habitac + parquea + 
##     banios, data = Vivienda_Zona_Norte)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -783.72  -78.53  -16.56   47.88  978.59 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -235.99591   44.75458  -5.273 2.14e-07 ***
## areaconst      0.67815    0.05315  12.758  < 2e-16 ***
## estrato       80.25743    9.86998   8.131 4.65e-15 ***
## habitac        7.04493    5.75972   1.223  0.22195    
## parquea       23.98928    5.88921   4.073 5.52e-05 ***
## banios        19.49301    7.51547   2.594  0.00982 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 155.5 on 427 degrees of freedom
##   (281 observations deleted due to missingness)
## Multiple R-squared:  0.6008, Adjusted R-squared:  0.5962 
## F-statistic: 128.6 on 5 and 427 DF,  p-value: < 2.2e-16
## [1] 0.6008423

El análisis del modelo de regresión múltiple, el coeficiente de determinación múltiple (R-cuadrado) es de 60.08% aproximadamente, lo cual nos indica que el precio de las viviendas, se puede explicar con las variables independientes incluidas en el modelo (Área construida, estrato, número de habitaciones, numero de parqueaderos y cantidad de baños), por lo cual el valor de las viviendas están relacionados en un 60.08%. En el modelo el valor estimado del intercepto es de 235 millones de pesos para la zona norte de la ciudad de Cali, los cual significa, cuando todas las variables independientes están en cero este es el valor estimado de la vivienda. Podemos evidenciar que el valor P de todas las variables independientes son muy pequeños, lo cual nos sugiere que todas las variables son significativas al modelo. El análisis por coeficiente nos genera el siguiente resultado: Para el área construida, por cada metro cuadrado adicional de vivienda se estima un aumento en el valor de 67 millones de pesos, para el estrato socioeconómico segun su valor entre más alto el estrato el valor aumento en 80 millones de pesos, cada habitación adicional en la vivienda aumento el valor en 70 millones de pesos, por cada parqueadero adicional con que cuenta la vivienda el valor aumenta en 23 millones de pesos y por cada baño adicional con que cuenta las viviendas el valor aumenta en 19 millones de pesos.

El modelo podria mejorar, si incluyeran y codificaran los barrios de la zona norte, de esta menera se podria segmentar la inforamcion de forma mas adecuada, de esta forma se analisaria cual es el sector con mayor agrado para los clientes.

Punto 4

Validación de supuestos del modelo

Podemor observar que la distribucion teorica normal, en el grafico los puentos tiene una aliniecion lienal, en la grafica de residuos se observa una buena homocedasticidad puesto que la variancia en los residuos es constante, con una distribucion de puntos cercanos a la linea horizonatal

## 
##  Durbin-Watson test
## 
## data:  modelo
## DW = 2.057, p-value = 0.7137
## alternative hypothesis: true autocorrelation is greater than 0
## 
##  Shapiro-Wilk normality test
## 
## data:  normalidad
## W = 0.8537, p-value < 0.00000000000000022

La prueba de shapiro es muy ceracno a 1 (W = 0.8537), por lo cual la informacion tiende a seguir una distribucion normal y el valor p-value es muy pequeño (p-value < 0.00000000000000022) por lo cual se rechaza la hipotesis nula.

Punto 5

Con el modelo identificado debe predecir el precio de la vivienda con las características de la primera solicitud (Vivienda 1), tipo = casa, area construida = 200, parqueaderos = 1, baños = 2, habitaciones = 4, estratos 4 o 5, en la zona norte y valor aprovado de 350 millones.

##        fit      lwr      upr
## 1 311.8189 286.6614 336.9763
## 2 392.0763 360.0767 424.0759

Las predicciones nos da dos opciones, la primera opcion en estrato 4 con un valor aproximado de 311 millones, y con un intervalo entre 286 y 336 millones y la segunda opcion en estrato 5 con un valor aproximado de 392 millones, y con un intervalo entre 360 y 424 millones

Punto 6

Se presentan las opciones de vivienda segun las caracteristicas solicitadas por parte de una compañía internacional que desea ubicar a dos de sus empleados con sus familias en la ciudad.

##       id       zona piso estrato preciom areaconst parquea banios habitac tipo
## 22  4800 Zona Norte    1       5     340     250.0       2      4       4 Casa
## 89  3352 Zona Norte   NA       4     335     300.0       3      4       4 Casa
## 124 1842 Zona Norte    2       5     350     240.0       2      3       4 Casa
## 127 1849 Zona Norte   NA       5     330     246.0       2      4       4 Casa
## 157 1151 Zona Norte   NA       5     320     210.0       2      3       5 Casa
## 349  766 Zona Norte   NA       5     321     249.0       1      5       5 Casa
## 354  819 Zona Norte    2       5     350     264.0       2      3       4 Casa
## 368  937 Zona Norte    2       4     350     280.0       2      3       4 Casa
## 369  952 Zona Norte    2       4     330     275.0       2      3       5 Casa
## 380 1009 Zona Norte   NA       5     250     243.0       1      4       5 Casa
## 382 1020 Zona Norte    2       4     230     250.0       2      3       5 Casa
## 393 1108 Zona Norte    2       4     330     260.0       1      3       4 Casa
## 399 1144 Zona Norte   NA       4     320     200.0       2      4       4 Casa
## 402 1163 Zona Norte   NA       5     350     216.0       2      2       4 Casa
## 422 1270 Zona Norte   NA       5     350     203.0       2      2       5 Casa
## 427 1343 Zona Norte    2       5     320     200.0       2      4       4 Casa
## 449 1822 Zona Norte   NA       4     340     295.0       2      2       4 Casa
## 454 1887 Zona Norte    1       5     340     203.0       2      3       4 Casa
## 458 1914 Zona Norte    2       5     300     205.0       2      5       6 Casa
## 462 1943 Zona Norte   NA       5     350     346.0       1      2       4 Casa
## 484 2544 Zona Norte    1       4     340     264.5       2      4       4 Casa
## 518 3043 Zona Norte   NA       5     330     275.0       2      3       5 Casa
## 520 3053 Zona Norte    2       5     320     230.0       2      4       4 Casa
## 532 3101 Zona Norte    2       5     340     355.0       2      5       8 Casa
## 553 3453 Zona Norte   NA       5     340     240.0       2      5       6 Casa
## 585 4209 Zona Norte    2       5     350     300.0       3      5       6 Casa
## 586 4210 Zona Norte    1       5     350     200.0       3      3       4 Casa
## 589 4267 Zona Norte    1       5     335     202.0       1      4       5 Casa
## 602 4422 Zona Norte    2       5     350     240.0       2      3       6 Casa
## 608 4458 Zona Norte    2       4     315     270.0       2      4       4 Casa
## 612 4483 Zona Norte    2       5     342     250.0       1      4       6 Casa
## 646 5031 Zona Norte    3       4     350     350.0       1      4       5 Casa
## 703 7432 Zona Norte    1       4     260     280.0       2      4       6 Casa
## 705 7470 Zona Norte    2       4     340     264.0       2      5       7 Casa
##                     barrio     longitud    latitud
## 22               el bosque -76533.00000 3465.00000
## 89               el bosque -76526.00000 3434.00000
## 124                 vipasa -76518.00000 3481.00000
## 127       prados del norte -76518.00000    3.47000
## 157 urbanización la merced -76512.00000 3476.00000
## 349              la merced    -76.50291    3.46757
## 354               la flora    -76.50330    3.46412
## 368              la merced    -76.50603    3.46643
## 369              la merced    -76.50647    3.47516
## 380              el bosque    -76.50755    3.47838
## 382              la merced    -76.50799    3.47424
## 393              la merced    -76.51060    3.48108
## 399              la merced    -76.51156    3.48029
## 402              la merced    -76.51218    3.48181
## 422              el bosque    -76.51448    3.48531
## 427               la flora    -76.51524    3.48893
## 449                 vipasa    -76.51777    3.48060
## 454                 vipasa    -76.51803    3.48257
## 458                 vipasa    -76.51832    3.48138
## 462                 vipasa    -76.51847    3.47503
## 484                 vipasa    -76.52096    3.47665
## 518              la merced    -76.52350    3.48329
## 520               la flora    -76.52353    3.48352
## 532            san vicente    -76.52377    3.46384
## 553             la campiña    -76.52640    3.48211
## 585              el bosque    -76.53010    3.48577
## 586              el bosque    -76.53010    3.48503
## 589              el bosque    -76.53044    3.48399
## 602              el bosque    -76.53136    3.48635
## 608              el bosque    -76.53176    3.48780
## 612              el bosque    -76.53197    3.48752
## 646                salomia    -76.53464    3.44987
## 703              los andes    -76.54973    3.42484
## 705                 vipasa    -76.54980    3.37556

Se presentan 34 opciones, las cuales se presentan en el mapa de la ciudad.

De las 34 casa presentadas tenemos 3 que estan mal clasificadas y deberan ser verificadas por que segun la zona correponden a norte, pero en la ubicacion geografica estan en el centro y sur de la ciudad, y no cumplen con las carcateriticas solcitadas las cuales son las casas con ID 705, 89 y 703, las restantes 31 casas cumplen con las caracteristicas minimas requeridas y el valor corresponde al credito pre aprovado.

Punto 7

Base 1

Zona norte de la ciudad.

Se presentan de la zona norte:

Los primeros 3 registros de las bases

##     id       zona piso estrato preciom areaconst parquea banios habitac
## 1 8025 Zona Norte   NA       4     310       120       1      3       2
## 2 7815 Zona Norte   NA       6     490       227      NA      3       4
## 3 7351 Zona Norte   NA       4     145        55       1      2       2
##          tipo    barrio longitud    latitud
## 1 Apartamento san pedro   -76554 3426.00000
## 2 Apartamento     acopi   -76552    3.45147
## 3 Apartamento   el lido   -76549 3418.00000

Los tipos de viviendas

## 
## Apartamento 
##        1172

La base de viviendas de la zona norte cuanta con 1172 registros de tipo de vivienda “Apartamento”

Los estratos de la zona elegida

## 
##   3   4   5   6 
## 326 238 492 116

Se puede evidenciar que la distribucion de la zonn a norte en la ciudad de Cali el mayor numero de apartamentos se encuentran en el estrato 5 con 492 apartamentos, segido por el estrato 3 con 326 apartamentos y con menor numero los estratos 4 con 238 apartamentos y el estrato 6 con 116 apartamentos

Mapa

Como podemos evidenciar la mayor cantidad de viviendas se encuentran ubicadas en la zona norte de la ciudad de Cali, sin embargo podemos observar una serie de viviendas dispersas por la ciudad de cali en otras zonas diferentes a la filtrada, esto puede obedecer a una mala georreferenciacion, fueron ubicados en la Zona Norte, pero los datos de longitud y latitud, no corresponden y seria necesario verificar los datos y barrio en el cual estan ubicadas las residencia, para garatizar la mejor calidad en el analisis.

Paso 2

##              preciom  areaconst    estrato     banios    habitac
## preciom   1.00000000 0.79572934 0.71959643 0.72132033 0.19605437
## areaconst 0.79572934 1.00000000 0.57237299 0.72636202 0.31314263
## estrato   0.71959643 0.57237299 1.00000000 0.59749314 0.06210816
## banios    0.72132033 0.72636202 0.59749314 1.00000000 0.36191696
## habitac   0.19605437 0.31314263 0.06210816 0.36191696 1.00000000

Se evidencia que la correlacion mas fuerte se encuentra entre el area construida y el precio de la vivienda, ya que los apartamentoss con mayor area tiene un mayor costo, y la segunda relacion importante es entre la cantidad de baños y estrato con el precio, por lo cual estos tres factores influyen en los precios de las viviendas.

Punto 2

Realacion de atributos

Relacion de estrato con precio

Como podemos evidenciar en la gráfica de cajas, la relación de los estratos de la zona norte con respecto al valor de las viviendas tipos “Apartamento”, En el estrato 3 la mediana en el valor de las viviendas es 119 millones, y el valor de las viviendas oscilan entre el primer cuartil (q1) de 99 millones y el tercer cuartil (q3) de 135 millones, sin embargo hay valores atípicos entre 377 y 435 millones de pesos para este estrato, finalmente evidenciamos un grean consentracion en el valor de los apartamentos. Para el estrato 4 la mediana en el valor es de 300 millones con valores que oscilan entre el primer cuartil (q1) de 155 millones y el tercer cuartil (q3) de 250 millones, sin embargo hay valores atípicos entre 510 y 750 millones de pesos para este estrato, evidenciando un dispersión mayor entre los precios en comparación con el estrato 3, para el estrato 5 la mediana en el valor de las viviendas es de 320 millones de pesos, con valores que oscilan entre el primer cuartil (q1) entre 266 millones y el tercer cuartil (q3) hasta 400 millones, sin embargo hay valores atípicos con una mayor dispersión de los cuatro estratos en la zona norte entre 650 y 1500 millones de pesos, finalmente para el estrato 6 la mediana en el valor de las viviendas es de 592 millones de pesos, con valores que oscilan entre el primer cuartil (q1) entre 430 millones y el tercer cuartil (q3) hasta 850 millones, y con una mínima cantidad de valores atípicos en comparación de los otros estratos.

Relacion de area construida con precio

Histograma de las areas contruidas en la zona norte

Se eviencia que el mayor numero de viviendas tipo casa en la zona norte de la ciudad de Cali se encuentran entre los 50 m2 y 549 m2

La realacion que tiene el area de construccion de las viviendas con el valor es proporcional, a medida que aumenta el area aumenta el valor sindo una realcion directamente proporcional. Podemos evidenciar una mayor concentracion de viviendas entre los 70 millones de pesos y 203 metros cuadrados

Podemos observar que las viviendas con valora de 525 millones o menos predominan de 1 a 3 baños y las viviendas de 4 o mas baños se encuentran en la escala de 246 a 1500 millones, de este valor en adelante son pocas viviendas pero en su mayoría tienen de 4 baños en adelante, tan solo un apartamento cuenta con 6 balos y su valor es de 880 millones, también evidenciamos viviendas sin baños, entre los valores de 220 millones y 380 millones, lo cual se convierten en datos atípicos.

Relación de cantidad de habitaciones con el precio de la vivienda

La relación de habitación y precio de la viviendas está concentrado entre 2 y 3 habitaciones en su mayoría inferior a los 600 millones, sin embargo se observa que entre mayor número de habitaciones el precio aumento en menor cantidad de viviendas y se observa una relación directa con los baños, puesto que tiene un comportamiento similar.

Relación de zona con el precio de la vivienda

Fianlmente en la relacion de zona de residencia con el valor de las viviendas tipo apartamento, tenemos una mediana de 250 millones en el valor de los apartamentos, los valores oscilan el primer cuartil (q1) entre 140 millones y el tercer cuartil (q3) entre 360 millones, y el valor minimo es de 65 millones y el maximo de 690 millones.

Punto 3

Estime un modelo de regresión lineal múltiple con las variables del punto anterior (precio = f(área construida, estrato, número de cuartos, número de parqueaderos, número de baños ) ) e interprete los coeficientes si son estadísticamente significativos. Las interpretaciones deber están contextualizadas y discutir si los resultados son lógicos. Adicionalmente interprete el coeficiente R2 y discuta el ajuste del modelo e implicaciones (que podrían hacer para mejorarlo).

## 
## Call:
## lm(formula = preciom ~ areaconst + estrato + habitac + parquea + 
##     banios, data = Vivienda_Zona_Norte)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -765.31  -37.70    2.77   36.72  697.10 
## 
## Coefficients:
##               Estimate Std. Error t value             Pr(>|t|)    
## (Intercept) -237.17231   24.16009  -9.817 < 0.0000000000000002 ***
## areaconst      1.48539    0.09728  15.269 < 0.0000000000000002 ***
## estrato       57.46203    4.76742  12.053 < 0.0000000000000002 ***
## habitac      -21.99925    6.05978  -3.630               0.0003 ***
## parquea       68.18418    7.91538   8.614 < 0.0000000000000002 ***
## banios        43.32490    6.40466   6.765      0.0000000000252 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 99 on 833 degrees of freedom
##   (333 observations deleted due to missingness)
## Multiple R-squared:  0.7526, Adjusted R-squared:  0.7511 
## F-statistic: 506.7 on 5 and 833 DF,  p-value: < 0.00000000000000022
## [1] 0.7525712

El análisis del modelo de regresión múltiple, el coeficiente de determinación múltiple (R-cuadrado) es de 75.26% aproximadamente, lo cual nos indica que el precio de las viviendas, se puede explicar con las variables independientes incluidas en el modelo (Área construida, estrato, número de habitaciones, numero de parqueaderos y cantidad de baños), por lo cual el valor de las viviendas están relacionados en un 75.26%, en comparacion con las casas la significacion es de un 15% superior a las casa En el modelo el valor estimado del intercepto es de 237 millones de pesos para la zona norte de la ciudad de Cali, los cual significa, cuando todas las variables independientes están en cero este es el valor estimado de la vivienda. Podemos evidenciar que el valor P de todas las variables independientes son muy pequeños, lo cual nos sugiere que todas las variables son significativas al modelo. El análisis por coeficiente nos genera el siguiente resultado: Para el área construida, por cada metro cuadrado adicional de vivienda se estima un aumento en el valor de 14 millones de pesos, para el estrato socioeconómico segun su valor entre más alto el estrato el valor aumento en 57 millones de pesos, cada habitación adicional en la vivienda aumento el valor en 21 millones de pesos, por cada parqueadero adicional con que cuenta la vivienda el valor aumenta en 68 millones de pesos y por cada baño adicional con que cuenta las viviendas el valor aumenta en 43 millones de pesos.

El modelo podria mejorar, si incluyeran y codificaran los barrios de la zona norte, de esta menera se podria segmentar la inforamcion de forma mas adecuada, de esta forma se analisaria cual es el sector con mayor agrado para los clientes.

Punto 4

Validación de supuestos del modelo

Podemor observar que la distribucion teorica normal, en el grafico los puentos tiene una aliniecion lienal, en la grafica de residuos se observa una buena homocedasticidad puesto que la variancia en los residuos es constante, con una distribucion de puntos cercanos a la linea horizonatal

## 
##  Durbin-Watson test
## 
## data:  modelo
## DW = 1.6355, p-value = 0.00000005187
## alternative hypothesis: true autocorrelation is greater than 0
## 
##  Shapiro-Wilk normality test
## 
## data:  normalidad
## W = 0.85007, p-value < 0.00000000000000022

La prueba de shapiro es muy ceracno a 1 (W = 0.85007), por lo cual la informacion tiende a seguir una distribucion normal y el valor p-value es muy pequeño (p-value < 0.00000000000000022) por lo cual se rechaza la hipotesis nula.

Punto 5

Con el modelo identificado debe predecir el precio de la vivienda con las características de la primera solicitud (Vivienda 1), tipo = apartamento, area construida = 300, parqueaderos = 3, baños = 3, habitaciones = 5, estratos 5 o 6, en la zona norte y valor aprovado de 850 millones.

##        fit      lwr      upr
## 1 720.2864 679.3945 761.1783
## 2 777.7484 736.7610 818.7359

Las predicciones nos da dos opciones, la primera opcion en estrato 5 con un valor aproximado de 720 millones, y con un intervalo entre 679 y 761 millones y la segunda opcion en estrato 6 con un valor aproximado de 777 millones, y con un intervalo entre 736 y 818 millones

Punto 6

Se presentan las opciones de vivienda segun las caracteristicas solicitadas por parte de una compañía internacional que desea ubicar a dos de sus empleados con sus familias en la ciudad.

##       id       zona piso estrato preciom areaconst parquea banios habitac
## 945 3572 Zona Norte    5       5     450       307       4      4       5
##            tipo    barrio  longitud latitud
## 945 Apartamento versalles -76.52708 3.46439

Se presenta 1 opciones, la cual se presenta en el mapa de la ciudad.

El apartamento que cumple con las caracteristicas solicitadas, se puede ubicar en el mapa de la ciudad de Cali, es con el Id 3572