Emerson Trujillo Sierra
17/Feb/2022
Barrio: Valle del Lili
Paso 1. Filtrar un barrio de interes y solo apartamentos:
library(readxl)
datos = read_excel("C:/Users/portatil/Desktop/Datos R/Datos_Vivienda.xlsx")
ID=1:dim(datos)[1]
datos=data.frame(ID,datos)
pos=which(datos$Barrio=="valle del lili")
datos_sub=datos[pos,]
require(RecordLinkage)
pos2=which(jarowinkler("valle del lili",datos$Barrio)>0.8 & datos$Tipo=="Apartamento")
datos_sub=datos[pos2,]
head(datos_sub)
| ID | Zona | piso | Estrato | precio_millon | Area_contruida | parqueaderos | Banos | Habitaciones | Tipo | Barrio | cordenada_longitud | Cordenada_latitud | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 8 | 8 | Zona Sur | 5 | 5 | 310 | 82.5 | 1 | 2 | 3 | Apartamento | valle del lili | -76.46438 | 3.43463 |
| 9 | 9 | Zona Sur | 9 | 4 | 240 | 80.0 | 1 | 2 | 3 | Apartamento | valle del lili | -76.46438 | 3.43463 |
| 12 | 12 | Zona Sur | NA | 5 | 230 | 70.0 | 1 | 2 | 2 | Apartamento | valle del lili | -76.46500 | 3.43600 |
| 13 | 13 | Zona Sur | NA | 5 | 160 | 63.0 | NA | 2 | 2 | Apartamento | valle del lili | -76.46500 | 3.43600 |
| 14 | 14 | Zona Sur | 6 | 5 | 200 | 71.0 | 1 | 2 | 3 | Apartamento | valle del lili | -76.46500 | 3.43600 |
| 15 | 15 | Zona Sur | NA | 5 | 270 | 76.0 | NA | 2 | 3 | Apartamento | valle del lili | -76.46500 | 3.43600 |
Paso 2. Exploración Inicial
## Tabla de indicadores importantes
promedio_precio=mean(datos_sub$precio_millon,na.rm=TRUE)
mediana_precio=median(datos_sub$precio_millon,na.rm=TRUE)
promedio_area=mean(datos_sub$Area_contruida,na.rm=TRUE)
cantidad_ofertas=length(datos_sub$Zona)
resultado=data.frame(promedio_precio,mediana_precio,promedio_area,cantidad_ofertas)
resultado
| promedio_precio | mediana_precio | promedio_area | cantidad_ofertas |
|---|---|---|---|
| 224.5718 | 225 | 74.97807 | 843 |
Paso 3. Visualización en Mapa Interactivo
require(leaflet)
leaflet() %>% addCircleMarkers(lng = datos_sub$cordenada_longitud,lat = datos_sub$Cordenada_latitud,radius = 0.3,color = "black",label = datos_sub$ID) %>% addTiles()
Paso 4. Exploración Bivariada entre Precio vs Area Construida
require(ggplot2)
require(plotly)
g1=ggplot(data = datos_sub,aes(y=precio_millon,x=Area_contruida)) + geom_point() + geom_smooth()
ggplotly(g1)
pos3=which(datos_sub$Area_contruida<400)
datos_sub2=datos_sub[pos3,]
g2=ggplot(data = datos_sub2,aes(y=precio_millon,x=Area_contruida)) + geom_point() + geom_smooth()
ggplotly(g2)