Importar Datos y Visualizar

Los siguientes datos corresponden a una muestra de ofertas de vivienda de la pagina fincaraiz para la ciudad de Cali en el año 2021:

library(readxl)
datos = read_excel("~/Desktop/Datos_Vivienda.xlsx")
head(datos)
Zona piso Estrato precio_millon Area_contruida parqueaderos Banos Habitaciones Tipo Barrio cordenada_longitud Cordenada_latitud
Zona Sur 2 6 880 237 2 5 4 Casa pance -76.46300 3.43000
Zona Oeste 2 4 1200 800 3 6 7 Casa miraflores -76.46400 3.42800
Zona Sur 3 5 250 86 NA 2 3 Apartamento multicentro -76.46400 3.42900
Zona Sur NA 6 1280 346 4 6 5 Apartamento ciudad jardín -76.46400 3.43300
Zona Sur 2 6 1300 600 4 7 5 Casa pance -76.46438 3.43463
Zona Sur 3 6 513 160 2 4 4 Casa pance -76.46438 3.43463

La base de datos contiene un total de 8322 y 12 variables dentro de las cuales se encuentra el precio de la vivienda, el area contruida, estrato entre otras.

require(leaflet)
leaflet() %>% addCircleMarkers(lng = datos$cordenada_longitud,lat = datos$Cordenada_latitud,radius = 0.2,label = datos$precio_millon) %>% addTiles()

¿En que zona de la ciudad se tiene mayor oferta de vivienda?

Hacer un intervalo de confianza entre los dos primeros.

oferta_zona=data.frame(table(datos$Zona))
oferta_zona
Var1 Freq
Zona Centro 124
Zona Norte 1920
Zona Oeste 1198
Zona Oriente 351
Zona Sur 4726
#sum(datos$Zona=="Zona Sur",na.rm=TRUE)
inter_sur=prop.test(x = 4726,n = 8322,conf.level = 0.95)
inter_norte=prop.test(x = 1920,n = 8322,conf.level = 0.95)

data.frame(inter_sur$conf.int,inter_norte$conf.int)*100
inter_sur.conf.int inter_norte.conf.int
55.71602 22.17286
57.85615 23.99490

Podemos observar que en la ciudad la zona sur registra la mayor cantididad de oferta de vivienda con un porcentaje entre el 55 y 58% aproximadamente, seguida de la zona norte con un 22 a 24% de la oferta.

¿Una persona de acuerdo a la zona con mas oferta quiere comprar en un barrio del sur, en este caso es multicentro y cuenta con un presupuesto de 200 millones. Realice una estimación del precio promedio de las viviendas en este barrio y comente si el presupuesto de la persona es apropiado para comprar en este sector?

pos=which(datos$Barrio=="multicentro")
datos_multi=datos[pos,]

# datos_multi$precio_millon[-25]
# summary(datos_multi$precio_millon[-25])

int_prom_multi=t.test(x=datos_multi$precio_millon[-25],conf.level = 0.95)
data.frame(int_prom_multi$conf.int)
int_prom_multi.conf.int
298.8982
365.2557

Por lo tanto el intervalo de confianza para el precio promedio de una vivienda en multicentro se encuentra entre 299 y 365 millones. Es decir que con 200 millones no es suficiente para una compra en la zona y tener opciones para seleccionar (habitaciones, acabados…).

¿Realizar el ejercicio anterior para apartamentos en el caney?

pos=which(datos$Barrio=="caney" & datos$Tipo=="Apartamento")
datos_caney=datos[pos,]

# datos_multi$precio_millon[-25]
# summary(datos_multi$precio_millon[-25])

int_prom_caney=t.test(x=datos_caney$precio_millon,conf.level = 0.95)
data.frame(int_prom_caney$conf.int)
int_prom_caney.conf.int
185.9938
220.5579

El intervalo de confianza nos muestra que un apartamento en el caney tiene un precio promedio aproximado entre 186 y 220 millones de pesos. Por lo tanto el presupuesto del comprador (200 millones) se adapta a los apartamentos de esta zona.