Paso 1. Filtrar un barrio de interes y solo apartamentos:

Barrio elegido: cristales

Tipo:Apartamento

library(readxl)
datos = read_excel("C:/Users/PACHO/Desktop/Metodos/Datos_Vivienda.xlsx")
ID=1:dim(datos)[1]
datos=data.frame(ID,datos)

require(RecordLinkage)

pos2=which(jarowinkler("cristales",datos$Barrio)>0.8 & datos$Tipo=="Apartamento")
datos_sub=datos[pos2,]
head(datos_sub)
ID Zona piso Estrato precio_millon Area_contruida parqueaderos Banos Habitaciones Tipo Barrio cordenada_longitud Cordenada_latitud
400 400 Zona Oeste NA 5 165 70 NA 1 2 Apartamento cristales -76.49500 3.4510
1197 1197 Zona Oeste NA 6 1350 221 3 3 3 Apartamento cristales -76.51300 3.4210
1198 1198 Zona Oeste NA 6 320 84 2 2 2 Apartamento cristales -76.51300 3.4630
1237 1237 Zona Oeste NA 6 850 178 2 4 3 Apartamento cristales -76.51400 3.4620
1712 1712 Zona Oeste 1 6 330 85 1 2 2 Apartamento cristales -76.51700 3.4100
2985 2985 Zona Sur 2 3 100 60 NA 2 2 Apartamento cristobal colv=n -76.52312 3.4195

Paso 2. Exploración inicial de datos

##Tabla de indicadores importantes

cantidad_ofertas=length(datos_sub$Zona)
maximo_precio=max(datos_sub$precio_millon,na.rm = TRUE)
minimo_precio=min(datos_sub$precio_millon,na.rm = TRUE)
promedio_precio=mean(datos_sub$precio_millon,na.rm = TRUE)
mediana_precio=median(datos_sub$precio_millon,na.rm = TRUE)

resultado=data.frame(cantidad_ofertas,maximo_precio,minimo_precio,promedio_precio,mediana_precio)
resultado
cantidad_ofertas maximo_precio minimo_precio promedio_precio mediana_precio
74 1390 100 528.2027 435

Paso 3. Visualización en mapa interactivo

require(leaflet)
leaflet() %>% addCircleMarkers(lng = datos_sub$cordenada_longitud,lat = datos_sub$Cordenada_latitud,radius = 0.3,color = "black",label = datos_sub$ID )%>% addTiles()

4.Exploración Bivariada entre Precio vs Área Construida

require(ggplot2)
require(plotly)

g1=ggplot(data = datos_sub,aes(y=precio_millon,x=Area_contruida)) + geom_point() + geom_smooth()
ggplotly(g1)
pos3=which(datos_sub$Area_contruida<250)
datos_sub2=datos_sub[pos3,]

g2=ggplot(data = datos_sub2,aes(y=precio_millon,x=Area_contruida)) + geom_point() + geom_smooth()
ggplotly(g2)