##ACTIVIDAD 1
AUTOR : Hermilso Cruz Valencia
fecha: 24/02/2022
Paso1. Filtrar un barrio de interes y solo apartamentos:
library(readxl)
datosvi = read_excel("C:/Users/TELEMATICA/Desktop/Datos_Vivienda.xlsx")
ID=1:dim(datosvi)[1]
datosvi=data.frame(ID,datosvi)
pos=which(datosvi$Barrio=="pance")
datos_sub=datosvi[pos,]
##llamamos una libreria
require(RecordLinkage)
##desarrollo Punto 1
pos2=which(jarowinkler("pance",datosvi$Barrio)>0.8 & datosvi$Tipo=="Apartamento")
datos_sub=datosvi[pos2,]
head (datos_sub)
| ID | Zona | piso | Estrato | precio_millon | Area_contruida | parqueaderos | Banos | Habitaciones | Tipo | Barrio | cordenada_longitud | Cordenada_latitud | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 10 | 10 | Zona Sur | 6 | 6 | 690 | 150 | 2 | 5 | 4 | Apartamento | pance | -76.46478 | 3.42783 |
| 19 | 19 | Zona Sur | 3 | 6 | 550 | 136 | 2 | 4 | 4 | Apartamento | pance | -76.46554 | 3.42933 |
| 35 | 35 | Zona Sur | NA | 6 | 570 | 137 | 2 | 5 | 4 | Apartamento | pance | -76.46851 | 3.42544 |
| 39 | 39 | Zona Sur | 4 | 6 | 510 | 148 | 2 | 3 | 3 | Apartamento | pance | -76.46947 | 3.42527 |
| 44 | 44 | Zona Sur | 6 | 6 | 1200 | 211 | 2 | 3 | 3 | Apartamento | pance | -76.47039 | 3.41435 |
| 46 | 46 | Zona Sur | 2 | 6 | 550 | 143 | 3 | 3 | 3 | Apartamento | pance | -76.47112 | 3.42049 |
##llamar valores o cantidades
table(datosvi$Tipo)
##
## Apartamento Casa
## 5100 3219
Paso No 2: Exploracion Inicial
##Tabla de Indicadores Importantes
Prom_precio=mean(datos_sub$precio_millon,na.rm = TRUE)
Mediana_precio=median(datos_sub$precio_millon,na.rm = TRUE)
Prom_area=mean(datos_sub$Area_contruida,na.rm = TRUE)
Cantidad_ofertas=length(datos_sub$Zona)
Prom_cuartos=mean(datosvi$Habitaciones,na.rm = TRUE)
Mediana_estrato=median(datosvi$Estrato,na.rm = TRUE)
resultado=data.frame(Prom_precio,Mediana_precio,Prom_area,Cantidad_ofertas,Prom_cuartos,Mediana_estrato)
resultado
| Prom_precio | Mediana_precio | Prom_area | Cantidad_ofertas | Prom_cuartos | Mediana_estrato |
|---|---|---|---|---|---|
| 641.5455 | 600 | 152.6554 | 209 | 3.605361 | 5 |
Paso No 3: Visualizacion de mapa interactivo
require(leaflet)
leaflet()%>%addCircleMarkers(lng =datos_sub$cordenada_longitud,lat =datos_sub$Cordenada_latitud,radius = 0.4, color = "red",label = datos_sub$ID)%>%addTiles()
ANALISIS: en la georefereciacion se puede observar que algunos apartamentos se encuentran fuera del area de cobertura.
Paso No4: Exploracion bivariada entre precio Vs Area construida
require(ggplot2)
require(plotly)
g1=ggplot(data = datos_sub,aes(y=precio_millon,x=Area_contruida))+geom_point()+geom_smooth()
ggplotly(g1)
##en caso que se quiera suprimir valores
pos3=which(datos_sub$Area_contruida<400)
datos_sub2=datos_sub[pos3,]
g2=ggplot(data = datos_sub2,aes(y=precio_millon,x=Area_contruida))+geom_point()+geom_smooth()
ggplotly(g2)