##ACTIVIDAD 1

Paso1. Filtrar un barrio de interes y solo apartamentos:

library(readxl)
datosvi = read_excel("C:/Users/TELEMATICA/Desktop/Datos_Vivienda.xlsx")
ID=1:dim(datosvi)[1]
datosvi=data.frame(ID,datosvi)

pos=which(datosvi$Barrio=="ingenio")
datos_sub=datosvi[pos,]

##llamamos una libreria
require(RecordLinkage)

##desarrollo Punto 1
pos2=which(jarowinkler("ingenio",datosvi$Barrio)>0.8 & datosvi$Tipo=="Apartamento")
datos_sub=datosvi[pos2,]
head (datos_sub)
ID Zona piso Estrato precio_millon Area_contruida parqueaderos Banos Habitaciones Tipo Barrio cordenada_longitud Cordenada_latitud
123 123 Zona Sur 3 5 290 100 1 3 3 Apartamento el ingenio -76.48498 3.41789
221 221 Zona Sur 4 5 360 99 1 3 2 Apartamento el ingenio -76.48953 3.49684
582 582 Zona Sur NA 4 550 197 2 4 3 Apartamento el ingenio -76.49900 3.47100
2397 2397 Zona Sur 2 5 410 136 2 4 4 Apartamento el ingenio -76.52000 3.37900
2446 2446 Zona Sur 4 5 390 198 1 4 3 Apartamento el ingenio -76.52030 3.38197
2792 2792 Zona Sur NA 5 300 147 2 3 3 Apartamento el ingenio -76.52200 3.38100
##llamar valores o cantidades
table(datosvi$Tipo)
## 
## Apartamento        Casa 
##        5100        3219

Paso No 2: Exploracion Inicial

##Tabla de Indicadores Importantes
prom_precio=mean(datos_sub$precio_millon,na.rm = TRUE)
mediana_precio=median(datos_sub$precio_millon,na.rm = TRUE)
prom_area=mean(datos_sub$Area_contruida,na.rm = TRUE)
cantidad_ofertas=length(datos_sub$Zona)
prom_cuartos=mean(datosvi$Habitaciones,na.rm = TRUE)
mediana_estrato=median(datosvi$Estrato,na.rm = TRUE)

resultado=data.frame(prom_precio,mediana_precio,prom_area,cantidad_ofertas,prom_cuartos,mediana_estrato)
resultado
prom_precio mediana_precio prom_area cantidad_ofertas prom_cuartos mediana_estrato
316.6846 300 117.7467 130 3.605361 5

Paso No 3: Visualizacion de mapa interactivo

require(leaflet)
leaflet()%>%addCircleMarkers(lng =datos_sub$cordenada_longitud,lat =datos_sub$Cordenada_latitud,radius = 0.4, color = "red",label = datos_sub$ID)%>%addTiles()

Paso No4: Exploracion bivariada entre precio Vs Area construida

  require(ggplot2)
require(plotly)
g1=ggplot(data = datos_sub,aes(y=precio_millon,x=Area_contruida))+geom_point()+geom_smooth()
ggplotly(g1)
##en caso que se quiera suprimir valores
pos3=which(datos_sub$Area_contruida<400)
datos_sub2=datos_sub[pos3,]

g2=ggplot(data = datos_sub2,aes(y=precio_millon,x=Area_contruida))+geom_point()+geom_smooth()
ggplotly(g2)