Los siguientes datos corresponden a una muestra de ofertas de vivienda de la pagina fincaraiz para la ciudad de Cali en el año 2021:
library(readxl)
datos = read_excel("~/Desktop/Datos_Vivienda.xlsx")
head(datos)
Zona | piso | Estrato | precio_millon | Area_contruida | parqueaderos | Banos | Habitaciones | Tipo | Barrio | cordenada_longitud | Cordenada_latitud |
---|---|---|---|---|---|---|---|---|---|---|---|
Zona Sur | 2 | 6 | 880 | 237 | 2 | 5 | 4 | Casa | pance | -76.46300 | 3.43000 |
Zona Oeste | 2 | 4 | 1200 | 800 | 3 | 6 | 7 | Casa | miraflores | -76.46400 | 3.42800 |
Zona Sur | 3 | 5 | 250 | 86 | NA | 2 | 3 | Apartamento | multicentro | -76.46400 | 3.42900 |
Zona Sur | NA | 6 | 1280 | 346 | 4 | 6 | 5 | Apartamento | ciudad jardín | -76.46400 | 3.43300 |
Zona Sur | 2 | 6 | 1300 | 600 | 4 | 7 | 5 | Casa | pance | -76.46438 | 3.43463 |
Zona Sur | 3 | 6 | 513 | 160 | 2 | 4 | 4 | Casa | pance | -76.46438 | 3.43463 |
La base de datos contiene un total de 8322 y 12 variables dentro de las cuales se encuentra el precio de la vivienda, el area contruida, estrato entre otras.
require(leaflet)
leaflet() %>% addCircleMarkers(lng = datos$cordenada_longitud,lat = datos$Cordenada_latitud,radius = 0.2,label = datos$precio_millon) %>% addTiles()
¿En que zona de la ciudad se tiene mayor oferta de vivienda?
Hacer un intervalo de confianza entre los dos primeros.
oferta_zona=data.frame(table(datos$Zona))
oferta_zona
Var1 | Freq |
---|---|
Zona Centro | 124 |
Zona Norte | 1920 |
Zona Oeste | 1198 |
Zona Oriente | 351 |
Zona Sur | 4726 |
#sum(datos$Zona=="Zona Sur",na.rm=TRUE)
inter_sur=prop.test(x = 4726,n = 8322,conf.level = 0.95)
inter_norte=prop.test(x = 1920,n = 8322,conf.level = 0.95)
data.frame(inter_sur$conf.int,inter_norte$conf.int)*100
inter_sur.conf.int | inter_norte.conf.int |
---|---|
55.71602 | 22.17286 |
57.85615 | 23.99490 |
Podemos observar que en la ciudad la zona sur registra la mayor cantididad de oferta de vivienda con un porcentaje entre el 55 y 58% aproximadamente, seguida de la zona norte con un 22 a 24% de la oferta.
¿Una persona de acuerdo a la zona con mas oferta quiere comprar en un barrio del sur, en este caso es multicentro y cuenta con un presupuesto de 200 millones. Realice una estimación del precio promedio de las viviendas en este barrio y comente si el presupuesto de la persona es apropiado para comprar en este sector?
pos=which(datos$Barrio=="multicentro")
datos_multi=datos[pos,]
# datos_multi$precio_millon[-25]
# summary(datos_multi$precio_millon[-25])
int_prom_multi=t.test(x=datos_multi$precio_millon[-25],conf.level = 0.95)
data.frame(int_prom_multi$conf.int)
int_prom_multi.conf.int |
---|
298.8982 |
365.2557 |
Por lo tanto el intervalo de confianza para el precio promedio de una vivienda en multicentro se encuentra entre 299 y 365 millones. Es decir que con 200 millones no es suficiente para una compra en la zona y tener opciones para seleccionar (habitaciones, acabados…).
¿Realizar el ejercicio anterior para apartamentos en el caney?
pos=which(datos$Barrio=="caney" & datos$Tipo=="Apartamento")
datos_caney=datos[pos,]
# datos_multi$precio_millon[-25]
# summary(datos_multi$precio_millon[-25])
int_prom_caney=t.test(x=datos_caney$precio_millon,conf.level = 0.95)
data.frame(int_prom_caney$conf.int)
int_prom_caney.conf.int |
---|
185.9938 |
220.5579 |
El intervalo de confianza nos muestra que un apartamento en el caney tiene un precio promedio aproximado entre 186 y 220 millones de pesos. Por lo tanto el presupuesto del comprador (200 millones) se adapta a los apartamentos de esta zona.