Cargar datos
En esta primera parte de filtrar en la base de datos e incluir solo las ofertas de la Base1,
se Filtra solo:viviendas tipo Casa ubicadas en Zona Norte
Se Guarda el subconjunto en base1, para obtener lo siguiente Una nueva base de datos más pequeña solo con las casas de la zona norte.
Esto permitiendo hacer un análisis más específico, porque los precios de casas pueden ser diferentes según: el tipo de vivienda,la zona de la ciudad
Asi podemos Analizar cómo se comporta el mercado de casas en la zona norte, por ejemplo:
si son más costosas si tienen mayor área si tienen más habitaciones
| id | zona | piso | estrato | preciom | areaconst | parqueaderos | banios | habitaciones | tipo | barrio | longitud | latitud |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1209 | Zona Norte | 02 | 5 | 320 | 150 | 2 | 4 | 6 | Casa | acopi | -76.51341 | 3.47968 |
| 1592 | Zona Norte | 02 | 5 | 780 | 380 | 2 | 3 | 3 | Casa | acopi | -76.51674 | 3.48721 |
| 4057 | Zona Norte | 02 | 6 | 750 | 445 | NA | 7 | 6 | Casa | acopi | -76.52950 | 3.38527 |
Los resultados de las tablas de frecuencia muestran que la base filtrada contiene 722 registros correspondientes a viviendas tipo casa ubicadas en la Zona Norte de la ciudad, lo cual confirma que el proceso de filtrado fue realizado correctamente
##
## Casa
## 722
##
## Zona Norte
## 722
Como se emplea el Mapa interactivo.
leaflet(base1) Usa la base de datos para crear un mapa interactivo.
addTiles() Carga el mapa base (tipo Google Maps).
addCircleMarkers() Coloca un punto en cada vivienda usando: longitud y latitud
El mapa permite visualizar la distribución geográfica de las viviendas filtradas en la zona norte de la ciudad. En general los puntos se concentran en esta zona, aunque podrían aparecer algunos desplazamientos debido a errores de georreferenciación o a límites imprecisos entre zonas.una de las razones tambien puede ser porque La variable zona suele representar zonas urbanas definidas por el estudio o la inmobiliaria, no necesariamente límites geográficos exactos.
Por ejemplo:
Un barrio puede considerarse zona norte comercialmente pero sus coordenadas pueden caer cerca del centro o del occidente
Precio vs área construida
Aqui podemos identificar un factor importante, la area construida y el estrato suelen determinar mucho el precio de la vivienda, en este caso observamos un dato de una casa estrato 3 con area construida sobre los 1400 mts, pero su valor se mantiene sobre los 370millones, mientras que una casa estrato 5 de 265 mts, su valor puede rondar los 1400millones. a la hora de considerar el area construida es importante analizar el estrato de la vivienda.
Precio vs baños
Tener mas baño dentro de la vivienda, va directamente relacionado con el tamaño del area construida, lo cual revisando la grafica anterior entre mas grande es el area construida mas incrementa su valor considerando el estrato de la casa,
Estrato 3, suelen tener de 1 a 2 baño en promedio, sin embargo hay casas que suelen llegar maximo a 4 baños
Precio vs habitaciones
Este factor es fundamental, debido a que observamos mediante esta grafica que el numero de habitaciones si influye bastante en el valor de la casa, donde el estrato pase hacer un factor secundario, asi que entre mas habitaciones mayor valor es el valor de la vivienda.
Matriz de correlación - Existe relación positiva entre precio y área construida - También se observa relación entre precio y número de baños - Viviendas con mayor estrato tienden a ser más costosas
| ID | Zona | Estrato | Precio ($M) | Área (m2) | Habitaciones |
|---|---|---|---|---|---|
| 1209 | Zona Norte | 5 | 320 | 150 | 6 |
| 141 | Zona Norte | 3 | 230 | 160 | 3 |
| 243 | Zona Norte | 3 | 190 | 435 | 0 |
| 504 | Zona Norte | 3 | 180 | 120 | 3 |
| 1276 | Zona Norte | 4 | 305 | 117 | 4 |
| 1667 | Zona Norte | 4 | 350 | 118 | 3 |
Modelo de regresión múltiple
Precio = f(area, estrato, habitaciones, parqueaderos, baños)
Interpretación:
El modelo que estimaste es:
Precio=f(areaconst+estrato+habitaciones+parqueaderos+baños)
Es decir, el precio de la vivienda depende de: área construida, estrato, número de habitaciones, parqueaderos, baños
Pero al correr el modelo tenemos
habitaciones = 7.65 p-value = 0.177 Agregar una habitación aumentaría el precio en 7.6 millones, pero no es estadísticamente significativo
parqueaderos = 24.0 p-value = 5.14e-05 Cada parqueadero adicional aumenta el precio en aproximadamente 24 millones, es Significativa
banios = 18.9 p-value = 0.012 Cada baño adicional aumenta el precio en aproximadamente 18.9 millones, es significativa
Variables más importantes
Según el modelo, las variables que más influyen en el precio son:
Estrato Área construida Parqueaderos Baños
La variable habitaciones no resultó significativa. por lo tanto, El modelo de regresión múltiple muestra que el precio de la vivienda está significativamente influenciado por el área construida, el estrato socioeconómico, el número de parqueaderos y el número de baños. En particular, el estrato presenta el mayor impacto sobre el precio, indicando que viviendas ubicadas en estratos más altos tienden a tener valores significativamente mayores. El modelo explica aproximadamente el 60% de la variabilidad en los precios de las viviendas, lo cual indica un buen ajuste, aunque existen otros factores que también influyen en el valor de los inmuebles
##
## Call:
## lm(formula = preciom ~ areaconst + estrato + habitaciones + parqueaderos +
## banios, data = base1)
##
## Residuals:
## Min 1Q Median 3Q Max
## -784.29 -77.56 -16.03 47.67 978.61
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -238.17090 44.40551 -5.364 1.34e-07 ***
## areaconst 0.67673 0.05281 12.814 < 2e-16 ***
## estrato 80.63495 9.82632 8.206 2.70e-15 ***
## habitaciones 7.64511 5.65873 1.351 0.177
## parqueaderos 24.00598 5.86889 4.090 5.14e-05 ***
## banios 18.89938 7.48800 2.524 0.012 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 155.1 on 429 degrees of freedom
## (287 observations deleted due to missingness)
## Multiple R-squared: 0.6041, Adjusted R-squared: 0.5995
## F-statistic: 130.9 on 5 and 429 DF, p-value: < 2.2e-16
Validación de supuestos
Predicción Vivienda 1
Características
el valor de la casa segun estas caracteristicas esta por un valor de 392millone
## 1
## 392.7359
Buscar ofertas ≤ 350 millones que nos permita analizar posible oportunidades de compra
| ID | Zona | Estrato | Precio ($M) | Área (m2) | Baños | Habitaciones |
|---|---|---|---|---|---|---|
| 1209 | Zona Norte | 5 | 320 | 150 | 4 | 6 |
| 141 | Zona Norte | 3 | 230 | 160 | 2 | 3 |
| 243 | Zona Norte | 3 | 190 | 435 | 0 | 0 |
| 504 | Zona Norte | 3 | 180 | 120 | 3 | 3 |
| 1276 | Zona Norte | 4 | 305 | 117 | 3 | 4 |
| 1667 | Zona Norte | 4 | 350 | 118 | 3 | 3 |
En este mapa podemos identificar la ubicacion geografica de las propuestas obtenidas anteriormente, de las cuales al tener un credito-preaprobado por 350millones, una de las mejores opciones segun las caracteristicas de la vivienda1, sera optar por la primera opcion de la tabla anterior,
Segunda vivienda
Filtro
Apartamento en zona sur
De acuerdo a las caracteristicas para la vivienda 2, que es el apartamento.
Obtenemos las siguiente propuesta en la Zona sur
| ID | Zona | Estrato | Precio ($M) | Baños | Habitaciones |
|---|---|---|---|---|---|
| 5098 | Zona Sur | 4 | 290 | 2 | 3 |
| 698 | Zona Sur | 3 | 78 | 1 | 2 |
| 8199 | Zona Sur | 6 | 875 | 5 | 3 |
| 1241 | Zona Sur | 3 | 135 | 2 | 3 |
| 5370 | Zona Sur | 3 | 135 | 1 | 3 |
| 6975 | Zona Sur | 4 | 220 | 2 | 3 |
Luego repites:
Predicción vivienda 2
## 1
## 615.6008