##Actividad 1

Paso 1. Filtrar un barrio de interes y solo casas: Se filtro con el barrio Pance (y sus parecidos al 70%)

library(readxl)
datos = read_excel("C:/Users/pocho/Downloads/Datos_Vivienda.xlsx")
ID=1:dim(datos)[1]
datos=data.frame(ID, datos)


pos=which(datos$Barrio=="pance")
datos_sub=datos[pos,]

require(RecordLinkage)

pos2=which(jarowinkler("pance", datos$Barrio)>0.7 & datos$Tipo=="Casa")
datos_sub=datos[pos2,]
head(datos_sub)
ID Zona piso Estrato precio_millon Area_contruida parqueaderos Banos Habitaciones Tipo Barrio cordenada_longitud Cordenada_latitud
1 1 Zona Sur 2 6 880 237 2 5 4 Casa pance -76.46300 3.43000
5 5 Zona Sur 2 6 1300 600 4 7 5 Casa pance -76.46438 3.43463
6 6 Zona Sur 3 6 513 160 2 4 4 Casa pance -76.46438 3.43463
33 33 Zona Sur 1 6 900 330 2 4 4 Casa pance -76.46809 3.41664
38 38 Zona Sur 2 6 1500 980 6 5 3 Casa parcelaciones pance -76.46878 3.42561
59 59 Zona Sur 3 6 700 280 2 4 4 Casa pance -76.47355 3.41248

Paso 2. Exploración Inicial

##Tabla de Indicadores Importantes

prom_precio=mean(datos_sub$precio_millon,na.rm = TRUE)
med_precio=median(datos_sub$precio_millon,na.rm = TRUE)
prom_area=mean(datos_sub$Area_contruida,na.rm = TRUE)
cant_ofertas=length(datos_sub$Zona)

resultado=data.frame(prom_precio,med_precio,prom_area,cant_ofertas)
resultado
prom_precio med_precio prom_area cant_ofertas
949.0769 900 375.5628 338

Paso3. Visualización de Mapa interactivo

require(leaflet)
leaflet() %>% addCircleMarkers(lng = datos_sub$cordenada_longitud, lat = datos_sub$Cordenada_latitud,radius = 0.3, color = "red", label = datos_sub$ID) %>% addTiles()

Paso 4. Exploración Bivariada entre precio vs area construida

require(ggplot)
require(plotly)

g1=ggplot(data=datos_sub,aes(y=precio_millon,x=Area_contruida)) + geom_point() + geom_smooth()
g1