Paso 1. Filtrar un barrio de interés y solo apartamentos
library(readxl)
Datos = read_excel("C:/Users/Wilfredo Gomez/iCloudDrive/Downloads/Maestria/Metodos y Simulacion/Material Clase/Actividad 1/Datos_Vivienda.xlsx")
ID=1:dim(Datos)[1]
Datos=data.frame(ID,Datos)
pos=which(Datos$Barrio=="Valle de lili")
datos_sub=Datos[pos,]
require(RecordLinkage)
pos2=which(jarowinkler("pance",Datos$Barrio)>0.8 & Datos$Tipo=="Apartamento")
datos_sub=Datos[pos2,]
head(datos_sub)
| ID | Zona | piso | Estrato | precio_millon | Area_contruida | parqueaderos | Banos | Habitaciones | Tipo | Barrio | cordenada_longitud | Cordenada_latitud | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 10 | 10 | Zona Sur | 6 | 6 | 690 | 150 | 2 | 5 | 4 | Apartamento | pance | -76.46478 | 3.42783 |
| 19 | 19 | Zona Sur | 3 | 6 | 550 | 136 | 2 | 4 | 4 | Apartamento | pance | -76.46554 | 3.42933 |
| 35 | 35 | Zona Sur | NA | 6 | 570 | 137 | 2 | 5 | 4 | Apartamento | pance | -76.46851 | 3.42544 |
| 39 | 39 | Zona Sur | 4 | 6 | 510 | 148 | 2 | 3 | 3 | Apartamento | pance | -76.46947 | 3.42527 |
| 44 | 44 | Zona Sur | 6 | 6 | 1200 | 211 | 2 | 3 | 3 | Apartamento | pance | -76.47039 | 3.41435 |
| 46 | 46 | Zona Sur | 2 | 6 | 550 | 143 | 3 | 3 | 3 | Apartamento | pance | -76.47112 | 3.42049 |
Paso 2. Exploración Inicial
##Tabla de Indicadores Importantes
Promedio_precio = mean(datos_sub$precio_millon,na.rm = TRUE)
Mediana_precio = median(datos_sub$precio_millon,na.rm = TRUE)
Promedio_area = mean(datos_sub$Area_contruida,na.rm = TRUE)
Cantidad_ofertas = length(datos_sub$Zona)
Resultado=data.frame(Promedio_precio,Mediana_precio,Promedio_area,Cantidad_ofertas)
Resultado
| Promedio_precio | Mediana_precio | Promedio_area | Cantidad_ofertas |
|---|---|---|---|
| 641.5455 | 600 | 152.6554 | 209 |
Paso 3. Visualización en Mapa Interactivo
require(leaflet)
leaflet() %>% addCircleMarkers(lng = datos_sub$cordenada_longitud,lat = datos_sub$Cordenada_latitud,radius = 0.3,color = "red",label = datos_sub$ID)%>% addTiles()
Paso 4. Exploración Bivariada entre Precio vs Area Construida
require(ggplot2)
require(plotly)
g1=ggplot(data = datos_sub,aes(y=precio_millon,x=Area_contruida)) + geom_point() + geom_smooth()
ggplotly(g1)
pos3=which(datos_sub$Area_contruida<400)
datos_sub2=datos_sub[pos3,]
g2=ggplot(data = datos_sub2,aes(y=precio_millon,x=Area_contruida)) + geom_point() + geom_smooth()
ggplotly(g2)
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'