La empresa **B&C** (Bines y Casas) es una agencia de bienes raíces que opera en la ciudad de Cali, Colombia. La empresa fue fundada por Sandra Milena hace 10 años y actualmente cuenta con ocho agentes de bienes raíces.
El mercado de bienes raíces en Cali ha crecido significativamente en los últimos años, impulsado por el crecimiento de la población, la inversión extranjera directa y el desarrollo de nuevos proyectos inmobiliarios. En 2022, las ventas del sector en Cali llegaron a \$6700 millones y en 2023 a \$6100 mil millones. Se espera que este sector continue creciendo durante los próximos años, permitiendo un desarrollo dinámico en la economía regional.
La empresa **B&C** ha recogido información sobre viviendas que incluye información sobre el precio, la ubicación, las características y la venta de viviendas en Cali. Esta base de datos puede ser utilizada para realizar un informe estadístico que sería de gran interés para la empresa.
El informe estadístico podría proporcionar información sobre los siguientes temas:
Precio de las viviendas en diferentes zonas de Cali.
Tipo de viviendas más ofertadas en Cali.
Características más relevantes de la oferta de vivienda en Cali.
Analisis exploratorio: Como primer paso se inicia con la identificacion de datos faltantes
borrar <- c("id","longitud","latitud")
vivienda_faltantes2 <- vivienda_faltantes[ , !(names(vivienda_faltantes) %in% borrar)]
names (vivienda_faltantes2) = c("PRECIO", "ZONA", "ESTR", "AREA", "WC", "HAB", "TIPO","BARRIO","PARQ","PISO")
head(vivienda_faltantes2, n=9)
## # A tibble: 9 × 10
## PRECIO ZONA ESTR AREA WC HAB TIPO BARRIO PARQ PISO
## <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <chr> <chr>
## 1 Zona Oeste 4 6 1300 318 2 4 2 Apartamento arboleda
## 2 Zona Oeste 1 6 480 300 1 4 4 Casa normandía
## 3 Zona Oeste NA 5 1200 800 4 7 5 Casa miraflores
## 4 Zona Sur 2 3 220 150 1 2 4 Casa el guabal
## 5 Zona Oeste NA 5 330 112 2 4 3 Casa bella suiza…
## 6 Zona Sur NA 5 1350 390 8 10 10 Casa bella suiza…
## 7 Zona Sur 2 6 305 125 2 3 3 Apartamento bella suiza
## 8 Zona Oeste NA 5 480 280 4 4 4 Apartamento bella suiza…
## 9 Zona Sur NA 5 275 74 1 2 3 Apartamento valle del l…
md.pattern(vivienda_faltantes2)
## AREA PRECIO ESTR WC TIPO BARRIO PARQ PISO HAB ZONA
## 4812 1 1 1 1 1 1 1 1 1 1 0
## 1912 1 1 1 1 1 1 1 1 1 0 1
## 877 1 1 1 1 1 1 1 1 0 1 1
## 726 1 1 1 1 1 1 1 1 0 0 2
## 1 1 0 0 0 0 0 0 0 0 0 9
## 2 0 0 0 0 0 0 0 0 0 0 10
## 2 3 3 3 3 3 3 3 1606 2641 4270
El gráfico anterior muestra que 1912 registros no tienen el dato de zona de ubicación de la vivienda (22.95%), 877 no tienen dato correspondiente al número de habitaciones (10.53%), 726 no tienen ni número de pisos ni zona de ubicación ni número de habitaciones (8.71%), 1 registro solamente contiene información referente al área construida (0.01%) y que hay 2 registros con ausencia total de información (0.024%). Por otra parte, hay un total de 4812 registros completos (57.75%)
El número de valores ausentes por cada variable es:
colSums(is.na(vivienda_faltantes2))
## PRECIO ZONA ESTR AREA WC HAB TIPO BARRIO PARQ PISO
## 3 2641 3 2 3 1606 3 3 3 3
El número de valores ausentes por cada variable es;
Zona de ubicación: 2641 valores ausentes
Número de habitaciones: 1606 valores ausentes
Precio, estrato, numero de baños, tipo de vivienda, barrio, numero de parqueaderos y numero de pisos de la vivienda tienen un total de 3 valores ausentes cada uno.
Área construida: tiene 2 valores ausentes