##Actividad1
Paso 1: Filtrar el barrio de interes y escoger solo apartamentos:
library(readxl)
datos = read_excel("C:/Users/Big Bang Data/OneDrive - Big Bang Data S.A.S/Escritorio/LC/YDRAY-Datos_Vivienda.xlsx")
id=1:dim(datos)[1]
datos=data.frame(id,datos)
require(RecordLinkage)
pos = which(jarowinkler("acopi",datos$Barrio)>0.8&datos$Tipo=="Apartamento")
datos_sub=datos[pos,]
head(datos_sub)
| id | Zona | piso | Estrato | precio_millon | Area_contruida | parqueaderos | Banos | Habitaciones | Tipo | Barrio | cordenada_longitud | Cordenada_latitud | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 238 | 238 | Zona Norte | NA | 5 | 430 | 105 | NA | 3 | 3 | Apartamento | acopi | -76.49006 | 3.46819 |
| 509 | 509 | Zona Norte | 5 | 6 | 820 | 377 | 1 | 4 | 4 | Apartamento | acopi | -76.49780 | 3.47663 |
| 567 | 567 | Zona Norte | NA | 3 | 199 | 176 | NA | 1 | 5 | Apartamento | acopi | -76.49899 | 3.44843 |
| 589 | 589 | Zona Norte | NA | 5 | 320 | 235 | NA | 4 | 4 | Apartamento | acopi | -76.49911 | 3.44901 |
| 816 | 816 | Zona Norte | NA | 5 | 345 | 85 | NA | 2 | 2 | Apartamento | acopi | -76.50324 | 3.48174 |
| 827 | 827 | Zona Norte | NA | 3 | 130 | 61 | NA | 1 | 3 | Apartamento | acopi | -76.50356 | 3.44845 |
Paso 2. Exploracion de datos
##Datos importantes
promedio_precio= mean(datos_sub$precio_millon,na.rm=TRUE)
promedio_area= mean(datos_sub$Area_contruida,na.rm =TRUE)
promedio_habitaciones= mean(datos_sub$Habitaciones,na.rm=TRUE)
Promedio_banos= mean(datos_sub$Banos,na.rm=TRUE)
cantidad_ofertas= length(datos_sub$Zona)
resultado=data.frame(promedio_precio,promedio_area,promedio_habitaciones,Promedio_banos,cantidad_ofertas)
resultado
| promedio_precio | promedio_area | promedio_habitaciones | Promedio_banos | cantidad_ofertas |
|---|---|---|---|---|
| 309.1591 | 109.8068 | 3.022727 | 2.5 | 88 |
Paso 3. Mapa interactivo
require(leaflet)
leaflet() %>% addCircleMarkers(lng= datos_sub$cordenada_longitud, lat= datos_sub$Cordenada_latitud, radius= 0.2, color= "purple", label= datos_sub$id)%>% addTiles()
Paso4. Exploracion bivariada
require(ggplot2)
require(plotly)
g1=ggplot(data = datos_sub,aes(y=precio_millon, x=Area_contruida)) + geom_point() + geom_smooth()
ggplotly(g1)
pos3=which(datos_sub$Area_contruida<200)
datos_sub2=datos_sub[pos3,]
g2=ggplot(data = datos_sub2,aes(y=precio_millon, x=Area_contruida)) + geom_point() + geom_smooth()
ggplotly(g2)