IMPORTACION DE LOS DATOS
library(readxl)
datos <- data.frame()
datos <- Datos_Vivienda <- read_excel("C:/R/Datos_Vivienda.xlsx")
ID <- 1:dim(datos)[1]
datos <- data.frame(ID, datos)
library(kableExtra)
datos[10:16,] %>%
kableExtra::kable(caption="head(datos)", align = 'c') %>%
kableExtra::kable_classic(full_width=FALSE, html_font = "Cambria", font_size=12)
| ID | Zona | piso | Estrato | precio_millon | Area_contruida | parqueaderos | Banos | Habitaciones | Tipo | Barrio | cordenada_longitud | Cordenada_latitud | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 10 | 10 | Zona Sur | 6 | 6 | 690 | 150 | 2 | 5 | 4 | Apartamento | pance | -76.46478 | 3.42783 |
| 11 | 11 | Zona Oeste | 4 | 5 | 220 | 92 | 2 | 3 | 3 | Apartamento | zona oeste | -76.46498 | 3.42881 |
| 12 | 12 | Zona Sur | NA | 5 | 230 | 70 | 1 | 2 | 2 | Apartamento | valle del lili | -76.46500 | 3.43600 |
| 13 | 13 | Zona Sur | NA | 5 | 160 | 63 | NA | 2 | 2 | Apartamento | valle del lili | -76.46500 | 3.43600 |
| 14 | 14 | Zona Sur | 6 | 5 | 200 | 71 | 1 | 2 | 3 | Apartamento | valle del lili | -76.46500 | 3.43600 |
| 15 | 15 | Zona Sur | NA | 5 | 270 | 76 | NA | 2 | 3 | Apartamento | valle del lili | -76.46500 | 3.43600 |
| 16 | 16 | Zona Sur | 10 | 4 | 170 | 60 | NA | 2 | 3 | Apartamento | valle del lili | -76.46516 | 3.43519 |
require(RecordLinkage)
Barrio <- which(jarowinkler("valle del lili",datos$Barrio)>0.8 & datos$Tipo=="Apartamento")
promedio_precio <- median(datos[Barrio,]$precio_millon)
promedio_area <- median(datos[Barrio,]$Area_contruida)
promedio_banos <- median(datos[Barrio,]$Banos)
promedio_parqueaderos <- median(datos[Barrio,]$parqueaderos)
promedio_estrato <- median(datos[Barrio,]$Estrato)
promedio <- data.frame(length(Barrio), promedio_precio, promedio_area, promedio_banos, promedio_parqueaderos, promedio_estrato)
names(promedio) <- c("Ofertas Encontradas", "Precio Promedio (MCOP)", "Area Promedio (Mts2)", "Numero de Banos", "Numero de Parqueaderos", "Estrato")
promedio %>%
kableExtra::kable(caption="Información Relevante de la Exploracion Incial (Valle del Lili & Apartamentos)", align = 'c') %>%
kableExtra::kable_classic(full_width=FALSE, html_font = "Cambria", font_size=12, position = "l")
| Ofertas Encontradas | Precio Promedio (MCOP) | Area Promedio (Mts2) | Numero de Banos | Numero de Parqueaderos | Estrato |
|---|---|---|---|---|---|
| 843 | 225 | 72 | 2 | 1 | 4 |
Mapa de Apartamentos en el Valle del Lili
require(leaflet)
long_lat <- data.frame(datos[Barrio,]$cordenada_longitud, datos[Barrio,]$Cordenada_latitud)
names(long_lat) <- c("Longitud", "Latitud")
leaflet(long_lat) %>%
addCircleMarkers(lng = long_lat$Longitud, lat = long_lat$Latitud, radius = 0.3, label = datos[Barrio,]$ID) %>%
addTiles()
require(ggplot2)
require(plotly)
datos_sub <- data.frame()
datos_sub <- datos[Barrio,]
Grafica1 <- ggplot2::ggplot(data = datos_sub, mapping = aes(y=precio_millon, x=Area_contruida)) %>%
+ ggplot2::geom_point() %>%
+ ggplot2::geom_smooth() %>%
+ ggplot2::ggtitle("Grafica Bivariada entre el Precio y Area Construida") %>%
+ ggplot2::xlab("Area (Mts2)") %>%
+ ggplot2::ylab("Precio (MCOP)")
plotly::ggplotly(Grafica1)
datos_sub2 <- data.frame()
datos_sub2 <- datos_sub[which(datos_sub$Area_contruida > 60 & datos_sub$Area_contruida < 90) & datos_sub$precio_millon > 200 & datos_sub$precio_millon < 250,]
Grafica2 <- ggplot2::ggplot(data=datos_sub2, mapping = aes(y=precio_millon, x=Area_contruida)) %>%
+ ggplot2::geom_point() %>%
+ ggplot2::geom_smooth() %>%
+ ggplot2::ggtitle("Precio (200 MCOP > < 250 MCOP) y Area Construida (60 Mts2 > < 90 Mts2)") %>%
+ ggplot2::xlab("Area (Mts2)") %>%
+ ggplot2::ylab("Precio (MCOP)")
plotly::ggplotly(Grafica2)