1 Introduccion

El presente es un informe dirigido a la compañia C&A en Cali, en el cual podrá encontrar la recomendación de 2 viviendas de acuerdo a las caracteristicas descritas a continuación:

Vivienda 1:

Vivienda 2:

Por lo cual aplicaremos técnicas de modeloación que permita mediante información sugerir las mejores opciones correspondiente.

Por ello el Siguiente Informe se dividirá en:

1.1 Zona Norte

Como estructura General observamos una información tabulada de manera estructura diferenciada por un ID


##  Primeros 3 registros de casas en la Zona Norte
ID Barrio Precio Área Estrato Habitaciones Baños Parqueaderos
1209 acopi $320 150 5 6 4 2
1592 acopi $780 380 5 3 3 2
4057 acopi $750 445 6 6 7 NA
Note:
Fuente: Base de datos de vivienda
## 
##  Verificación de filtros aplicados
Variable Categoría Frecuencia Porcentaje
Tipo de vivienda Casa 722 100%
Zona Zona Norte 722 100%

Dentro de la información geoespacial, podemos observar dispersión de la información, sin embargo para este escenario asumiremos que la información reportada y categorizada se encuentra correcta, con oportunidad de ajuste de coordenadas que se encuentren mal georeferenciadas, esto en linea con experiencia dentro del sector similares donde se observa particularidades similares

  • La relación Precio Vs Área Construida en la Zona norte muestra una dispersión de puntos con relación positiva creciente entre el área construida y el precio de vivienda, esto significa que en terminos generales, a mayor área construida, mayor precios
  • Tambien podemos observar que se observa desviaciones notables en los precios, especialmente en propiedades de mayor área de 500 m2, sugeriendo que otros factores además del tamaño esta fuertemente relacionados.
  • Para los estratos observamos que aunque se aprecio que los estratos 5 y 6 tienden a ubicarse en zonas de mayor área y precio, mientras que los estratos bajos 3 y 4 se concentran en viviendas de menor metraje y precios, generando una menor dispersión.
  • Es vital resaltar que la relación precio-área no es estrictamente lineal, sino que muestra heterocedasticidad a medida que aumenta el metraje, también aumenta la dispersión de precios. Esto implifca que en un mismo incremento de área puede tener un impacto distinto en el precio según el metriaje y el estrato.
  • Se observa que a medida que el estrato aumenta progresivamente el estrato lo realiza de igual manera por ejemplo: Estrato 3 de 200-250 millones, entrato 4 de 400 millones, estrato 5 entre 500-600 millones y estrato 6 de 800-900 millones , siendo esto muy influenciado en el valor del mercado
Variable Coeficiente Significancia Impacto L. Inferior L. Superior
Intercepto -238.2 *** Negativo -325.5 -150.9
Área construida (m²) 0.7 *** Positivo 0.6 0.8
Estrato 80.6 *** Positivo 61.3 99.9
Habitaciones 7.6 Positivo -3.5 18.8
Parqueaderos 24.0 *** Positivo 12.5 35.5
Baños 18.9
Positivo 4.2 33.6
Niveles de significancia:
*** p < 0.001, ** p < 0.01, * p < 0.05
R² Ajustado Error Estándar Estadístico F Valor p Observaciones
0.604 0.599 155.1 130.9 < 0.001 434
## Interpretación
## El modelo de regresión explica el 60.4 % de la variación en los precios de las viviendas.
## 
##  Las variables con mayor impacto en el precio son:
##  -  Estrato  (cada unidad aumenta el precio en  80.6  millones de COP)
##  -  Parqueaderos  (cada unidad aumenta el precio en  24  millones de COP)
## 
##  El modelo es estadísticamente significativo (p  < 0.001 ), lo que indica que las variables consideradas tienen un efecto real
##  sobre el precio de las viviendas en la Zona Norte de Cali.
  • El estrato socioeconómico es el principal determinante del precio, reflejando el efecto de la localización, prestigio
  • El área construida tiene un efecto positivo y robusto, aunque de mejor magnitud marginal, pero acumulativamente relevente
  • Los baños y parqueaderos influyen significativamente en la valorización, mostrando que los compradores valoran la calidad de vida y facilidades urbanas
  • El número de habitaciones no es predictor confiable del precio, lo que implica que su efecto está mediado por otras variables como el área
  • El modelo explica el 60% de la variación de los precios, pero sugiere la novedad de incluir otras variables contextuales puede llegar a sugerirse temas como seguridad, próximidad a centros de interés entre otros

  • Se observa cierta violación del supuesto de linealidad, es decir el modelo lineal no captura perfectamente la relación entre predictores y precio
  • El error del modelo crece en viviendas más costosas, lo que indica una heterocedasticidad leve
  • Se observa outliers del mercado seguramente propiedades de lujo o de un tamaño representativo
  • El modelo tiende a ser menor preciso para viviendas de alto precio, lo que sugiere la necesidad de un segmento premium
## Se estima un Precio predicho casa estrato 4: $ 312.1 millones
## Se estima un Precio predicho casa estrato 5: $ 392.7 millones

Se propone las siguientes 5 casas que cumplen con las especificaciones e indicaciones establecidas por el cliente, se genera una visual gráfica de su ubicación geográfica

1.2 Zona Sur

Así mismo para la Zona sur de Cali

Análisis de Apartamentos en la Zona Sur
ID Zona Piso Estrato Precio (Millones) Área (m²) Parqueaderos Baños Habitaciones Tipo Barrio Longitud Latitud
5098 Zona Sur 05 4 290 96 1 2 3 Apartamento acopi -76.53464 3.44987
698 Zona Sur 02 3 78 40 1 1 2 Apartamento aguablanca -76.50100 3.40000
8199 Zona Sur NA 6 875 194 2 5 3 Apartamento aguacatal -76.55700 3.45900
1241 Zona Sur NA 3 135 117 NA 2 3 Apartamento alameda -76.51400 3.44100
5370 Zona Sur NA 3 135 78 NA 1 3 Apartamento alameda -76.53600 3.43600
6975 Zona Sur 06 4 220 75 1 2 3 Apartamento alférez real -76.54627 3.39109
## 
## Call:
## lm(formula = preciom ~ areaconst + estrato + habitaciones + parqueaderos + 
##     banios, data = base2)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -1092.02   -42.28    -1.33    40.58   926.56 
## 
## Coefficients:
##                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  -261.62501   15.63220 -16.736  < 2e-16 ***
## areaconst       1.28505    0.05403  23.785  < 2e-16 ***
## estrato        60.89709    3.08408  19.746  < 2e-16 ***
## habitaciones  -24.83693    3.89229  -6.381 2.11e-10 ***
## parqueaderos   72.91468    3.95797  18.422  < 2e-16 ***
## banios         50.69675    3.39637  14.927  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 98.02 on 2375 degrees of freedom
##   (406 observations deleted due to missingness)
## Multiple R-squared:  0.7485, Adjusted R-squared:  0.748 
## F-statistic:  1414 on 5 and 2375 DF,  p-value: < 2.2e-16
## [1] "Precio predicho para apto estrato 5: $ 675 millones"
## [1] "Precio predicho para apto estrato 6: $ 735.9 millones"
  • Cada metro cuadrado adicional incrementa en promedio el precio de la vivienda en 1.285 millones, este resultado es altamente significativo
  • Por Cada incremento de una unidad en el estrato socioeconómico, el precio aumenta en promedio 60,9 millones
  • En el caso de las habitaciones muestra un efecto negativo, esto quiere decir que cada habitación adicional reduce el precio en promedio en 24,8 millones, esto puede deverse a un efecto de multicolinealidad ya que no presente una lógica muy acertiva
  • Cada parqueadero adicional incrementa en promedio el precio en 72.9 millones , confirma que el estacionamiento es un recurso escaso y altamente valorizado en el mercado urbano
  • Cada Baño adicional eleva el precio en 50.7 millones lo que refleja la asociación con el confort y la necesidad del mercado.
  • El modelo explica aproximadamente el 75% de la variabilidad de los precios
  • La variación promedio no explicada por el modelo es de uno 98 millones lo que indicad que el modelo sigue existiendo una dispersión significativa en los precios.
  • Aunque se eliminaron 406 casos por datos faltantes y se usaron 2.375 viviendas, sigue siendo una muestra suficiente para garantizar robustez estadística
  • Dentro de la predicción reportada se puede observar una diferentcia de más de 60 millones unicamente por pertenecer a estratos diferentes, lo que refuerza el mensaje de su importancia