#Con base en los datos de olx realizar los siguientes pasos:

## Paso 1: Se filtra un barrio de interés (capri) con sólo apartamentos.

library(readxl)
Datos=read_excel("C:/Users/Asus/Downloads/Datos_Vivienda.xlsx")
View(Datos)
ID=1:dim(Datos)[1]
Datos=data.frame(ID,Datos)
pos=which(Datos$Barrio=="capri")
Datos_sub=Datos[pos,]

require(RecordLinkage)
pos2=which(jarowinkler("capri",Datos$Barrio)>0.8 & Datos$Tipo=="Apartamento")
Datos_sub=Datos[pos2,]
head(Datos_sub)
##        ID     Zona piso Estrato precio_millon Area_contruida parqueaderos Banos
## 75     75 Zona Sur    3       5           270            118            2     3
## 120   120 Zona Sur   NA       5           195             68            1     2
## 3978 3978 Zona Sur    5       5           320             96           NA     3
## 4071 4071 Zona Sur    5       4           220             95            1     3
## 4732 4732 Zona Sur   NA       5           275             98            1     3
## 5013 5013 Zona Sur    2       5           250            108            2     2
##      Habitaciones        Tipo Barrio cordenada_longitud Cordenada_latitud
## 75              4 Apartamento  capri          -76.47922           3.43222
## 120             2 Apartamento  capri          -76.48456           3.45308
## 3978            3 Apartamento  capri          -76.52900           3.41300
## 4071            4 Apartamento  capri          -76.52959           3.39289
## 4732            4 Apartamento  capri          -76.53271           3.45091
## 5013            3 Apartamento  capri          -76.53455           3.42197
## Paso 2: Exploración inicial de la base de datos

#Tabla de Indicadores Importantes

promedio_precio=mean(Datos_sub$precio_millon,na.rm=TRUE)
mediana_precio=median(Datos_sub$precio_millon,na.rm=TRUE)
promedio_area=mean(Datos_sub$Area_contruida,na.rm=TRUE)
cantidad_ofertas=length(Datos_sub$Zona)

resultado=data.frame(promedio_precio,mediana_precio,promedio_area,cantidad_ofertas)
resultado
##   promedio_precio mediana_precio promedio_area cantidad_ofertas
## 1        245.4651            245      105.4747               43
## Paso 3: Visualización en Mapa Interactivo
require(leaflet)
leaflet() %>% addCircleMarkers(lng = Datos_sub$cordenada_longitud,
                               lat = Datos_sub$Cordenada_latitud,
                               radius = 0.3,
                               color = "red",
                               label = Datos_sub$ID) %>% addTiles()
## Paso 4: Exploración Bivariada entre Precio vs Area Construida
require(ggplot2)
require(plotly)
g1=ggplot(data=Datos_sub,aes(y=precio_millon,x=Area_contruida))+ geom_point() + geom_smooth()
ggplotly(g1)
pos3=which(Datos_sub$Area_contruida<200)
Datos_sub2=Datos_sub[pos3,]
g2=ggplot(data=Datos_sub2,aes(y=precio_millon,x=Area_contruida)) + geom_point() + geom_smooth()
ggplotly(g2)