Paso 1. Filtrar un barrio de interes y solo apartamentos:
library(readxl)
datos = read_excel("~/Desktop/Datos_Vivienda.xlsx")
ID=1:dim(datos)[1]
datos=data.frame(ID,datos)
pos=which(datos$Barrio=="multicentro")
datos_sub=datos[pos,]
require(RecordLinkage)
pos2=which(jarowinkler("ingenio",datos$Barrio)>0.8 & datos$Tipo=="Apartamento")
datos_sub=datos[pos2,]
head(datos_sub)
ID | Zona | piso | Estrato | precio_millon | Area_contruida | parqueaderos | Banos | Habitaciones | Tipo | Barrio | cordenada_longitud | Cordenada_latitud | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
123 | 123 | Zona Sur | 3 | 5 | 290 | 100 | 1 | 3 | 3 | Apartamento | el ingenio | -76.48498 | 3.41789 |
221 | 221 | Zona Sur | 4 | 5 | 360 | 99 | 1 | 3 | 2 | Apartamento | el ingenio | -76.48953 | 3.49684 |
582 | 582 | Zona Sur | NA | 4 | 550 | 197 | 2 | 4 | 3 | Apartamento | el ingenio | -76.49900 | 3.47100 |
2397 | 2397 | Zona Sur | 2 | 5 | 410 | 136 | 2 | 4 | 4 | Apartamento | el ingenio | -76.52000 | 3.37900 |
2446 | 2446 | Zona Sur | 4 | 5 | 390 | 198 | 1 | 4 | 3 | Apartamento | el ingenio | -76.52030 | 3.38197 |
2792 | 2792 | Zona Sur | NA | 5 | 300 | 147 | 2 | 3 | 3 | Apartamento | el ingenio | -76.52200 | 3.38100 |
Paso 2. Exploración Inicial
##Tabla de Indicadores Importantes
promedio_precio=mean(datos_sub$precio_millon,na.rm=TRUE)
mediana_precio=median(datos_sub$precio_millon,na.rm=TRUE)
promedio_area=mean(datos_sub$Area_contruida,na.rm=TRUE)
cantidad_ofertas=length(datos_sub$Zona)
resultado=data.frame(promedio_precio,mediana_precio,promedio_area,cantidad_ofertas)
resultado
promedio_precio | mediana_precio | promedio_area | cantidad_ofertas |
---|---|---|---|
316.6846 | 300 | 117.7467 | 130 |
Paso 3. Visualización en Mapa Interactivo
require(leaflet)
## Loading required package: leaflet
leaflet() %>% addCircleMarkers(lng = datos_sub$cordenada_longitud,lat = datos_sub$Cordenada_latitud,radius = 0.3,color = "black",label = datos_sub$ID) %>% addTiles()
Paso 4. Exploración Bivariada entre Precio vs Area Construida
require(ggplot2)
## Loading required package: ggplot2
require(plotly)
## Loading required package: plotly
##
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
##
## last_plot
## The following object is masked from 'package:stats':
##
## filter
## The following object is masked from 'package:graphics':
##
## layout
g1=ggplot(data = datos_sub,aes(y=precio_millon,x=Area_contruida)) + geom_point() + geom_smooth()
ggplotly(g1)
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
pos3=which(datos_sub$Area_contruida<400)
datos_sub2=datos_sub[pos3,]
g2=ggplot(data = datos_sub2,aes(y=precio_millon,x=Area_contruida)) + geom_point() + geom_smooth()
ggplotly(g2)
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'