#Con base en los datos de olx realizar los siguientes pasos:
## Paso 1: Se filtra un barrio de interés (capri) con sólo apartamentos.
library(readxl)
Datos=read_excel("C:/Users/Asus/Downloads/Datos_Vivienda.xlsx")
View(Datos)
ID=1:dim(Datos)[1]
Datos=data.frame(ID,Datos)
pos=which(Datos$Barrio=="capri")
Datos_sub=Datos[pos,]
require(RecordLinkage)
pos2=which(jarowinkler("capri",Datos$Barrio)>0.8 & Datos$Tipo=="Apartamento")
Datos_sub=Datos[pos2,]
head(Datos_sub)
## ID Zona piso Estrato precio_millon Area_contruida parqueaderos Banos
## 75 75 Zona Sur 3 5 270 118 2 3
## 120 120 Zona Sur NA 5 195 68 1 2
## 3978 3978 Zona Sur 5 5 320 96 NA 3
## 4071 4071 Zona Sur 5 4 220 95 1 3
## 4732 4732 Zona Sur NA 5 275 98 1 3
## 5013 5013 Zona Sur 2 5 250 108 2 2
## Habitaciones Tipo Barrio cordenada_longitud Cordenada_latitud
## 75 4 Apartamento capri -76.47922 3.43222
## 120 2 Apartamento capri -76.48456 3.45308
## 3978 3 Apartamento capri -76.52900 3.41300
## 4071 4 Apartamento capri -76.52959 3.39289
## 4732 4 Apartamento capri -76.53271 3.45091
## 5013 3 Apartamento capri -76.53455 3.42197
## Paso 2: Exploración inicial de la base de datos
#Tabla de Indicadores Importantes
promedio_precio=mean(Datos_sub$precio_millon,na.rm=TRUE)
mediana_precio=median(Datos_sub$precio_millon,na.rm=TRUE)
promedio_area=mean(Datos_sub$Area_contruida,na.rm=TRUE)
cantidad_ofertas=length(Datos_sub$Zona)
resultado=data.frame(promedio_precio,mediana_precio,promedio_area,cantidad_ofertas)
resultado
## promedio_precio mediana_precio promedio_area cantidad_ofertas
## 1 245.4651 245 105.4747 43
## Paso 3: Visualización en Mapa Interactivo
require(leaflet)
leaflet() %>% addCircleMarkers(lng = Datos_sub$cordenada_longitud,
lat = Datos_sub$Cordenada_latitud,
radius = 0.3,
color = "red",
label = Datos_sub$ID) %>% addTiles()
## Paso 4: Exploración Bivariada entre Precio vs Area Construida
require(ggplot2)
require(plotly)
g1=ggplot(data=Datos_sub,aes(y=precio_millon,x=Area_contruida))+ geom_point() + geom_smooth()
ggplotly(g1)
pos3=which(Datos_sub$Area_contruida<200)
Datos_sub2=Datos_sub[pos3,]
g2=ggplot(data=Datos_sub2,aes(y=precio_millon,x=Area_contruida)) + geom_point() + geom_smooth()
ggplotly(g2)