##ACTIVIDAD 1

AUTOR : Hermilso Cruz Valencia

fecha: 24/02/2022

Paso1. Filtrar un barrio de interes y solo apartamentos:

library(readxl)
datosvi = read_excel("C:/Users/TELEMATICA/Desktop/Datos_Vivienda.xlsx")
ID=1:dim(datosvi)[1]
datosvi=data.frame(ID,datosvi)

pos=which(datosvi$Barrio=="pance")
datos_sub=datosvi[pos,]

##llamamos una libreria
require(RecordLinkage)

##desarrollo Punto 1
pos2=which(jarowinkler("pance",datosvi$Barrio)>0.8 & datosvi$Tipo=="Apartamento")
datos_sub=datosvi[pos2,]
head (datos_sub)
ID Zona piso Estrato precio_millon Area_contruida parqueaderos Banos Habitaciones Tipo Barrio cordenada_longitud Cordenada_latitud
10 10 Zona Sur 6 6 690 150 2 5 4 Apartamento pance -76.46478 3.42783
19 19 Zona Sur 3 6 550 136 2 4 4 Apartamento pance -76.46554 3.42933
35 35 Zona Sur NA 6 570 137 2 5 4 Apartamento pance -76.46851 3.42544
39 39 Zona Sur 4 6 510 148 2 3 3 Apartamento pance -76.46947 3.42527
44 44 Zona Sur 6 6 1200 211 2 3 3 Apartamento pance -76.47039 3.41435
46 46 Zona Sur 2 6 550 143 3 3 3 Apartamento pance -76.47112 3.42049
##llamar valores o cantidades
table(datosvi$Tipo)
## 
## Apartamento        Casa 
##        5100        3219

Paso No 2: Exploracion Inicial

##Tabla de Indicadores Importantes
Prom_precio=mean(datos_sub$precio_millon,na.rm = TRUE)
Mediana_precio=median(datos_sub$precio_millon,na.rm = TRUE)
Prom_area=mean(datos_sub$Area_contruida,na.rm = TRUE)
Cantidad_ofertas=length(datos_sub$Zona)
Prom_cuartos=mean(datosvi$Habitaciones,na.rm = TRUE)
Mediana_estrato=median(datosvi$Estrato,na.rm = TRUE)

resultado=data.frame(Prom_precio,Mediana_precio,Prom_area,Cantidad_ofertas,Prom_cuartos,Mediana_estrato)
resultado
Prom_precio Mediana_precio Prom_area Cantidad_ofertas Prom_cuartos Mediana_estrato
641.5455 600 152.6554 209 3.605361 5

Paso No 3: Visualizacion de mapa interactivo

require(leaflet)
leaflet()%>%addCircleMarkers(lng =datos_sub$cordenada_longitud,lat =datos_sub$Cordenada_latitud,radius = 0.4, color = "red",label = datos_sub$ID)%>%addTiles()

ANALISIS: en la georefereciacion se puede observar que algunos apartamentos se encuentran fuera del area de cobertura.

Paso No4: Exploracion bivariada entre precio Vs Area construida

  require(ggplot2)
require(plotly)
g1=ggplot(data = datos_sub,aes(y=precio_millon,x=Area_contruida))+geom_point()+geom_smooth()
ggplotly(g1)
##en caso que se quiera suprimir valores
pos3=which(datos_sub$Area_contruida<400)
datos_sub2=datos_sub[pos3,]

g2=ggplot(data = datos_sub2,aes(y=precio_millon,x=Area_contruida))+geom_point()+geom_smooth()
ggplotly(g2)