Actividad 1

Paso 1. Filtrar un barrio de interés y solo apartamentos

library(readxl)
Datos = read_excel("C:/Users/Wilfredo Gomez/iCloudDrive/Downloads/Maestria/Metodos y Simulacion/Material Clase/Actividad 1/Datos_Vivienda.xlsx")
ID=1:dim(Datos)[1]
Datos=data.frame(ID,Datos)

pos=which(Datos$Barrio=="Valle de lili")
datos_sub=Datos[pos,]

require(RecordLinkage)
pos2=which(jarowinkler("pance",Datos$Barrio)>0.8 & Datos$Tipo=="Apartamento")
datos_sub=Datos[pos2,]
head(datos_sub)
ID Zona piso Estrato precio_millon Area_contruida parqueaderos Banos Habitaciones Tipo Barrio cordenada_longitud Cordenada_latitud
10 10 Zona Sur 6 6 690 150 2 5 4 Apartamento pance -76.46478 3.42783
19 19 Zona Sur 3 6 550 136 2 4 4 Apartamento pance -76.46554 3.42933
35 35 Zona Sur NA 6 570 137 2 5 4 Apartamento pance -76.46851 3.42544
39 39 Zona Sur 4 6 510 148 2 3 3 Apartamento pance -76.46947 3.42527
44 44 Zona Sur 6 6 1200 211 2 3 3 Apartamento pance -76.47039 3.41435
46 46 Zona Sur 2 6 550 143 3 3 3 Apartamento pance -76.47112 3.42049

Paso 2. Exploración Inicial

##Tabla de Indicadores Importantes

Promedio_precio  = mean(datos_sub$precio_millon,na.rm = TRUE)
Mediana_precio   = median(datos_sub$precio_millon,na.rm = TRUE)
Promedio_area    = mean(datos_sub$Area_contruida,na.rm = TRUE)
Cantidad_ofertas = length(datos_sub$Zona)

Resultado=data.frame(Promedio_precio,Mediana_precio,Promedio_area,Cantidad_ofertas)
Resultado
Promedio_precio Mediana_precio Promedio_area Cantidad_ofertas
641.5455 600 152.6554 209

Paso 3. Visualización en Mapa Interactivo

require(leaflet)
leaflet() %>% addCircleMarkers(lng = datos_sub$cordenada_longitud,lat = datos_sub$Cordenada_latitud,radius = 0.3,color = "red",label = datos_sub$ID)%>% addTiles()

Paso 4. Exploración Bivariada entre Precio vs Area Construida

require(ggplot2)
require(plotly)
g1=ggplot(data = datos_sub,aes(y=precio_millon,x=Area_contruida)) + geom_point() + geom_smooth()
ggplotly(g1)
pos3=which(datos_sub$Area_contruida<400)
datos_sub2=datos_sub[pos3,]
g2=ggplot(data = datos_sub2,aes(y=precio_millon,x=Area_contruida)) + geom_point() + geom_smooth()
ggplotly(g2)
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'