Paso 1. Filtrar un barrio de interes y solo apartamentos:
Barrio elegido: cristales
Tipo:Apartamento
library(readxl)
datos = read_excel("C:/Users/PACHO/Desktop/Metodos/Datos_Vivienda.xlsx")
ID=1:dim(datos)[1]
datos=data.frame(ID,datos)
require(RecordLinkage)
pos2=which(jarowinkler("cristales",datos$Barrio)>0.8 & datos$Tipo=="Apartamento")
datos_sub=datos[pos2,]
head(datos_sub)
| ID | Zona | piso | Estrato | precio_millon | Area_contruida | parqueaderos | Banos | Habitaciones | Tipo | Barrio | cordenada_longitud | Cordenada_latitud | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 400 | 400 | Zona Oeste | NA | 5 | 165 | 70 | NA | 1 | 2 | Apartamento | cristales | -76.49500 | 3.4510 |
| 1197 | 1197 | Zona Oeste | NA | 6 | 1350 | 221 | 3 | 3 | 3 | Apartamento | cristales | -76.51300 | 3.4210 |
| 1198 | 1198 | Zona Oeste | NA | 6 | 320 | 84 | 2 | 2 | 2 | Apartamento | cristales | -76.51300 | 3.4630 |
| 1237 | 1237 | Zona Oeste | NA | 6 | 850 | 178 | 2 | 4 | 3 | Apartamento | cristales | -76.51400 | 3.4620 |
| 1712 | 1712 | Zona Oeste | 1 | 6 | 330 | 85 | 1 | 2 | 2 | Apartamento | cristales | -76.51700 | 3.4100 |
| 2985 | 2985 | Zona Sur | 2 | 3 | 100 | 60 | NA | 2 | 2 | Apartamento | cristobal colv=n | -76.52312 | 3.4195 |
Paso 2. Exploración inicial de datos
##Tabla de indicadores importantes
cantidad_ofertas=length(datos_sub$Zona)
maximo_precio=max(datos_sub$precio_millon,na.rm = TRUE)
minimo_precio=min(datos_sub$precio_millon,na.rm = TRUE)
promedio_precio=mean(datos_sub$precio_millon,na.rm = TRUE)
mediana_precio=median(datos_sub$precio_millon,na.rm = TRUE)
resultado=data.frame(cantidad_ofertas,maximo_precio,minimo_precio,promedio_precio,mediana_precio)
resultado
| cantidad_ofertas | maximo_precio | minimo_precio | promedio_precio | mediana_precio |
|---|---|---|---|---|
| 74 | 1390 | 100 | 528.2027 | 435 |
Paso 3. Visualización en mapa interactivo
require(leaflet)
leaflet() %>% addCircleMarkers(lng = datos_sub$cordenada_longitud,lat = datos_sub$Cordenada_latitud,radius = 0.3,color = "black",label = datos_sub$ID )%>% addTiles()
4.Exploración Bivariada entre Precio vs Área Construida
require(ggplot2)
require(plotly)
g1=ggplot(data = datos_sub,aes(y=precio_millon,x=Area_contruida)) + geom_point() + geom_smooth()
ggplotly(g1)
pos3=which(datos_sub$Area_contruida<250)
datos_sub2=datos_sub[pos3,]
g2=ggplot(data = datos_sub2,aes(y=precio_millon,x=Area_contruida)) + geom_point() + geom_smooth()
ggplotly(g2)