##Importar datos y visualizar los siguientes datos correspondientes a una muestra de oferta de Vivienda de la pagina Finza Raiz para la Ciudad en el año 2021:
library(readxl)
datos=read_excel("C:/Datos/Datos_Vivienda.xlsx")
head(datos)
## # A tibble: 6 x 12
## Zona piso Estrato precio_millon Area_contruida parqueaderos Banos
## <chr> <chr> <dbl> <dbl> <dbl> <chr> <dbl>
## 1 Zona Sur 2 6 880 237 2 5
## 2 Zona Oeste 2 4 1200 800 3 6
## 3 Zona Sur 3 5 250 86 NA 2
## 4 Zona Sur NA 6 1280 346 4 6
## 5 Zona Sur 2 6 1300 600 4 7
## 6 Zona Sur 3 6 513 160 2 4
## # ... with 5 more variables: Habitaciones <dbl>, Tipo <chr>, Barrio <chr>,
## # cordenada_longitud <dbl>, Cordenada_latitud <dbl>
La base de datos en total contiene 8.322 registros con 12 variables dentro de las cuales se encuentra el precios de la vivienda, el área y otras
require(leaflet)
## Loading required package: leaflet
## Warning: package 'leaflet' was built under R version 4.0.5
leaflet() %>% addCircleMarkers(lng=datos$cordenada_longitud,lat=datos$Cordenada_latitud,radius=0.2,label=datos$precio_millon)%>% addTiles()
## Warning in validateCoords(lng, lat, funcName): Data contains 3 rows with either
## missing or invalid lat/lon values and will be ignored
¿En que zonas de la ciudad se ofertan más Viviendas ?
Hacer un intervalo de confinza entre los dos primeros .
Oferta_zona=data.frame(table(datos$Zona))
Oferta_zona
## Var1 Freq
## 1 Zona Centro 124
## 2 Zona Norte 1920
## 3 Zona Oeste 1198
## 4 Zona Oriente 351
## 5 Zona Sur 4726
## sum(data$Zona=="Zona Sur", na.rm=TRUE)
inter_sur=prop.test (x= 4726,n=8322,conf.level=0.95)
inter_norte=prop.test (x= 4726,n=8322,conf.level=0.95)
data.frame(inter_sur$conf.int,inter_norte$conf.int)*100
## inter_sur.conf.int inter_norte.conf.int
## 1 55.71602 55.71602
## 2 57.85615 57.85615
Podemos observar que en la ciudad la zona sur registra la mayor cantidad de oferta de la vivienda con un porcentaje entre el 55 y 58% aproximadamente, seguida de la zona norte con un 22 a 24% de la oferta
¿ una persona de acuerdo a la zona con más oferta quiere comprar en un barrio del sur, en este caso es multicentro y cuenta con un presupuesto de 200 millones , realice una estimación del precio promedio de las viviendas en este barrio y comente si el presupuesto de la persona es apropiada para comprar en este sector.
pos=which(datos$Barrio=="multicentro")
datos_multi=datos[pos,]
## summary(datos_multi$precio_millon[-25])
## datos_multi$precio_millon[25]
int_prom_multi=t.test(x=datos_multi$precio_millon[-25],conf.level = 0.95)
data.frame(int_prom_multi$conf.int)
## int_prom_multi.conf.int
## 1 298.8982
## 2 365.2557
Por lo tanto el intervalo de confianza para el precio promedio de una vivienda en multicentro se encuentra entre 299 y 365 millones . Es decir que con 200 millones no es suficiente para una compra en la zona y tener opciones para seleccionar ( habitaciones , acabados …)
¿ Realizar el ejercicio anterior para apartamentos en el Caney ?
pos=which(datos$Barrio=="caney"& datos$Tipo=="Apartamento")
datos_caney=datos[pos,]
int_prom_caney=t.test(x=datos_caney$precio_millon,conf.level = 0.95)
data.frame(int_prom_caney$conf.int)
## int_prom_caney.conf.int
## 1 185.9938
## 2 220.5579
##pos=which(datos$Barrio=="caney")
##datos_multi=datos[pos,]
##int_prom_multi=t.test(x=datos_multi$precio_millon[-25],conf.level = 0.95)
##data.frame(int_prom_multi$conf.int)
El intervalo de confinaza nos muestra que un apartamento en el caney tiene un precio promedio aproximado entre 186 y 220 millones de pesos . Por lo tanot el presupuesto del comprador (200 millones )se adapta a los apartamentos de esta zona