##Actividad1

Paso 1: Filtrar el barrio de interes y escoger solo apartamentos:

library(readxl)
datos = read_excel("C:/Users/Big Bang Data/OneDrive - Big Bang Data S.A.S/Escritorio/LC/YDRAY-Datos_Vivienda.xlsx")

id=1:dim(datos)[1]
datos=data.frame(id,datos)

require(RecordLinkage)

pos = which(jarowinkler("acopi",datos$Barrio)>0.8&datos$Tipo=="Apartamento")
datos_sub=datos[pos,]
head(datos_sub)
id Zona piso Estrato precio_millon Area_contruida parqueaderos Banos Habitaciones Tipo Barrio cordenada_longitud Cordenada_latitud
238 238 Zona Norte NA 5 430 105 NA 3 3 Apartamento acopi -76.49006 3.46819
509 509 Zona Norte 5 6 820 377 1 4 4 Apartamento acopi -76.49780 3.47663
567 567 Zona Norte NA 3 199 176 NA 1 5 Apartamento acopi -76.49899 3.44843
589 589 Zona Norte NA 5 320 235 NA 4 4 Apartamento acopi -76.49911 3.44901
816 816 Zona Norte NA 5 345 85 NA 2 2 Apartamento acopi -76.50324 3.48174
827 827 Zona Norte NA 3 130 61 NA 1 3 Apartamento acopi -76.50356 3.44845

Paso 2. Exploracion de datos

##Datos importantes

promedio_precio= mean(datos_sub$precio_millon,na.rm=TRUE)
promedio_area= mean(datos_sub$Area_contruida,na.rm =TRUE)
promedio_habitaciones= mean(datos_sub$Habitaciones,na.rm=TRUE)
Promedio_banos= mean(datos_sub$Banos,na.rm=TRUE)
cantidad_ofertas= length(datos_sub$Zona)

resultado=data.frame(promedio_precio,promedio_area,promedio_habitaciones,Promedio_banos,cantidad_ofertas)
resultado
promedio_precio promedio_area promedio_habitaciones Promedio_banos cantidad_ofertas
309.1591 109.8068 3.022727 2.5 88

Paso 3. Mapa interactivo

require(leaflet)
leaflet() %>% addCircleMarkers(lng= datos_sub$cordenada_longitud, lat= datos_sub$Cordenada_latitud, radius= 0.2, color= "purple", label= datos_sub$id)%>% addTiles()

Paso4. Exploracion bivariada

require(ggplot2)
require(plotly)

g1=ggplot(data = datos_sub,aes(y=precio_millon, x=Area_contruida)) + geom_point() + geom_smooth()
ggplotly(g1)
pos3=which(datos_sub$Area_contruida<200)
datos_sub2=datos_sub[pos3,]

g2=ggplot(data = datos_sub2,aes(y=precio_millon, x=Area_contruida)) + geom_point() + geom_smooth()
ggplotly(g2)