##ACTIVIDAD 1
Paso1. Filtrar un barrio de interes y solo apartamentos:
library(readxl)
datosvi = read_excel("C:/Users/TELEMATICA/Desktop/Datos_Vivienda.xlsx")
ID=1:dim(datosvi)[1]
datosvi=data.frame(ID,datosvi)
pos=which(datosvi$Barrio=="ingenio")
datos_sub=datosvi[pos,]
##llamamos una libreria
require(RecordLinkage)
##desarrollo Punto 1
pos2=which(jarowinkler("ingenio",datosvi$Barrio)>0.8 & datosvi$Tipo=="Apartamento")
datos_sub=datosvi[pos2,]
head (datos_sub)
| ID | Zona | piso | Estrato | precio_millon | Area_contruida | parqueaderos | Banos | Habitaciones | Tipo | Barrio | cordenada_longitud | Cordenada_latitud | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 123 | 123 | Zona Sur | 3 | 5 | 290 | 100 | 1 | 3 | 3 | Apartamento | el ingenio | -76.48498 | 3.41789 |
| 221 | 221 | Zona Sur | 4 | 5 | 360 | 99 | 1 | 3 | 2 | Apartamento | el ingenio | -76.48953 | 3.49684 |
| 582 | 582 | Zona Sur | NA | 4 | 550 | 197 | 2 | 4 | 3 | Apartamento | el ingenio | -76.49900 | 3.47100 |
| 2397 | 2397 | Zona Sur | 2 | 5 | 410 | 136 | 2 | 4 | 4 | Apartamento | el ingenio | -76.52000 | 3.37900 |
| 2446 | 2446 | Zona Sur | 4 | 5 | 390 | 198 | 1 | 4 | 3 | Apartamento | el ingenio | -76.52030 | 3.38197 |
| 2792 | 2792 | Zona Sur | NA | 5 | 300 | 147 | 2 | 3 | 3 | Apartamento | el ingenio | -76.52200 | 3.38100 |
##llamar valores o cantidades
table(datosvi$Tipo)
##
## Apartamento Casa
## 5100 3219
Paso No 2: Exploracion Inicial
##Tabla de Indicadores Importantes
prom_precio=mean(datos_sub$precio_millon,na.rm = TRUE)
mediana_precio=median(datos_sub$precio_millon,na.rm = TRUE)
prom_area=mean(datos_sub$Area_contruida,na.rm = TRUE)
cantidad_ofertas=length(datos_sub$Zona)
prom_cuartos=mean(datosvi$Habitaciones,na.rm = TRUE)
mediana_estrato=median(datosvi$Estrato,na.rm = TRUE)
resultado=data.frame(prom_precio,mediana_precio,prom_area,cantidad_ofertas,prom_cuartos,mediana_estrato)
resultado
| prom_precio | mediana_precio | prom_area | cantidad_ofertas | prom_cuartos | mediana_estrato |
|---|---|---|---|---|---|
| 316.6846 | 300 | 117.7467 | 130 | 3.605361 | 5 |
Paso No 3: Visualizacion de mapa interactivo
require(leaflet)
leaflet()%>%addCircleMarkers(lng =datos_sub$cordenada_longitud,lat =datos_sub$Cordenada_latitud,radius = 0.4, color = "red",label = datos_sub$ID)%>%addTiles()
Paso No4: Exploracion bivariada entre precio Vs Area construida
require(ggplot2)
require(plotly)
g1=ggplot(data = datos_sub,aes(y=precio_millon,x=Area_contruida))+geom_point()+geom_smooth()
ggplotly(g1)
##en caso que se quiera suprimir valores
pos3=which(datos_sub$Area_contruida<400)
datos_sub2=datos_sub[pos3,]
g2=ggplot(data = datos_sub2,aes(y=precio_millon,x=Area_contruida))+geom_point()+geom_smooth()
ggplotly(g2)