##Actividad 1
Paso 1. Filtrar un barrio de interes y solo casas: Se filtro con el barrio Pance (y sus parecidos al 70%)
library(readxl)
datos = read_excel("C:/Users/pocho/Downloads/Datos_Vivienda.xlsx")
ID=1:dim(datos)[1]
datos=data.frame(ID, datos)
pos=which(datos$Barrio=="pance")
datos_sub=datos[pos,]
require(RecordLinkage)
pos2=which(jarowinkler("pance", datos$Barrio)>0.7 & datos$Tipo=="Casa")
datos_sub=datos[pos2,]
head(datos_sub)
| ID | Zona | piso | Estrato | precio_millon | Area_contruida | parqueaderos | Banos | Habitaciones | Tipo | Barrio | cordenada_longitud | Cordenada_latitud | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1 | 1 | Zona Sur | 2 | 6 | 880 | 237 | 2 | 5 | 4 | Casa | pance | -76.46300 | 3.43000 |
| 5 | 5 | Zona Sur | 2 | 6 | 1300 | 600 | 4 | 7 | 5 | Casa | pance | -76.46438 | 3.43463 |
| 6 | 6 | Zona Sur | 3 | 6 | 513 | 160 | 2 | 4 | 4 | Casa | pance | -76.46438 | 3.43463 |
| 33 | 33 | Zona Sur | 1 | 6 | 900 | 330 | 2 | 4 | 4 | Casa | pance | -76.46809 | 3.41664 |
| 38 | 38 | Zona Sur | 2 | 6 | 1500 | 980 | 6 | 5 | 3 | Casa | parcelaciones pance | -76.46878 | 3.42561 |
| 59 | 59 | Zona Sur | 3 | 6 | 700 | 280 | 2 | 4 | 4 | Casa | pance | -76.47355 | 3.41248 |
Paso 2. Exploración Inicial
##Tabla de Indicadores Importantes
prom_precio=mean(datos_sub$precio_millon,na.rm = TRUE)
med_precio=median(datos_sub$precio_millon,na.rm = TRUE)
prom_area=mean(datos_sub$Area_contruida,na.rm = TRUE)
cant_ofertas=length(datos_sub$Zona)
resultado=data.frame(prom_precio,med_precio,prom_area,cant_ofertas)
resultado
| prom_precio | med_precio | prom_area | cant_ofertas |
|---|---|---|---|
| 949.0769 | 900 | 375.5628 | 338 |
Paso3. Visualización de Mapa interactivo
require(leaflet)
leaflet() %>% addCircleMarkers(lng = datos_sub$cordenada_longitud, lat = datos_sub$Cordenada_latitud,radius = 0.3, color = "red", label = datos_sub$ID) %>% addTiles()
Paso 4. Exploración Bivariada entre precio vs area construida
require(ggplot)
require(plotly)
g1=ggplot(data=datos_sub,aes(y=precio_millon,x=Area_contruida)) + geom_point() + geom_smooth()
g1