Emerson Trujillo Sierra

17/Feb/2022

Barrio: Valle del Lili

Paso 1. Filtrar un barrio de interes y solo apartamentos:

library(readxl)
datos = read_excel("C:/Users/portatil/Desktop/Datos R/Datos_Vivienda.xlsx")
ID=1:dim(datos)[1]
datos=data.frame(ID,datos)

pos=which(datos$Barrio=="valle del lili")
datos_sub=datos[pos,]

require(RecordLinkage)

pos2=which(jarowinkler("valle del lili",datos$Barrio)>0.8 & datos$Tipo=="Apartamento")
datos_sub=datos[pos2,]
head(datos_sub)
ID Zona piso Estrato precio_millon Area_contruida parqueaderos Banos Habitaciones Tipo Barrio cordenada_longitud Cordenada_latitud
8 8 Zona Sur 5 5 310 82.5 1 2 3 Apartamento valle del lili -76.46438 3.43463
9 9 Zona Sur 9 4 240 80.0 1 2 3 Apartamento valle del lili -76.46438 3.43463
12 12 Zona Sur NA 5 230 70.0 1 2 2 Apartamento valle del lili -76.46500 3.43600
13 13 Zona Sur NA 5 160 63.0 NA 2 2 Apartamento valle del lili -76.46500 3.43600
14 14 Zona Sur 6 5 200 71.0 1 2 3 Apartamento valle del lili -76.46500 3.43600
15 15 Zona Sur NA 5 270 76.0 NA 2 3 Apartamento valle del lili -76.46500 3.43600

Paso 2. Exploración Inicial

## Tabla de indicadores importantes

promedio_precio=mean(datos_sub$precio_millon,na.rm=TRUE)
mediana_precio=median(datos_sub$precio_millon,na.rm=TRUE)
promedio_area=mean(datos_sub$Area_contruida,na.rm=TRUE)
cantidad_ofertas=length(datos_sub$Zona)

resultado=data.frame(promedio_precio,mediana_precio,promedio_area,cantidad_ofertas)
resultado
promedio_precio mediana_precio promedio_area cantidad_ofertas
224.5718 225 74.97807 843

Paso 3. Visualización en Mapa Interactivo

require(leaflet)

leaflet() %>% addCircleMarkers(lng = datos_sub$cordenada_longitud,lat = datos_sub$Cordenada_latitud,radius = 0.3,color = "black",label = datos_sub$ID) %>% addTiles()

Paso 4. Exploración Bivariada entre Precio vs Area Construida

require(ggplot2)
require(plotly)
g1=ggplot(data = datos_sub,aes(y=precio_millon,x=Area_contruida)) + geom_point() + geom_smooth()
ggplotly(g1)
pos3=which(datos_sub$Area_contruida<400)
datos_sub2=datos_sub[pos3,]

g2=ggplot(data = datos_sub2,aes(y=precio_millon,x=Area_contruida)) + geom_point() + geom_smooth()
ggplotly(g2)