La empresa **B&C** (Bines y Casas) es una agencia de bienes raíces que opera en la ciudad de Cali, Colombia. La empresa fue fundada por Sandra Milena hace 10 años y actualmente cuenta con ocho agentes de bienes raíces.

El mercado de bienes raíces en Cali ha crecido significativamente en los últimos años, impulsado por el crecimiento de la población, la inversión extranjera directa y el desarrollo de nuevos proyectos inmobiliarios. En 2022, las ventas del sector en Cali llegaron a \$6700 millones y en 2023 a \$6100 mil millones. Se espera que este sector continue creciendo durante los próximos años, permitiendo un desarrollo dinámico en la economía regional.

La empresa **B&C** ha recogido información sobre viviendas que incluye información sobre el precio, la ubicación, las características y la venta de viviendas en Cali. Esta base de datos puede ser utilizada para realizar un informe estadístico que sería de gran interés para la empresa.

El informe estadístico podría proporcionar información sobre los siguientes temas:

Analisis exploratorio: Como primer paso se inicia con la identificacion de datos faltantes

borrar <- c("id","longitud","latitud")
vivienda_faltantes2 <- vivienda_faltantes[ , !(names(vivienda_faltantes) %in% borrar)]
names (vivienda_faltantes2) = c("PRECIO", "ZONA", "ESTR", "AREA", "WC", "HAB", "TIPO","BARRIO","PARQ","PISO")
head(vivienda_faltantes2, n=9)
## # A tibble: 9 × 10
##   PRECIO      ZONA  ESTR  AREA    WC   HAB  TIPO BARRIO PARQ        PISO        
##   <chr>      <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>  <dbl> <chr>       <chr>       
## 1 Zona Oeste     4     6  1300   318     2     4      2 Apartamento arboleda    
## 2 Zona Oeste     1     6   480   300     1     4      4 Casa        normandía   
## 3 Zona Oeste    NA     5  1200   800     4     7      5 Casa        miraflores  
## 4 Zona Sur       2     3   220   150     1     2      4 Casa        el guabal   
## 5 Zona Oeste    NA     5   330   112     2     4      3 Casa        bella suiza…
## 6 Zona Sur      NA     5  1350   390     8    10     10 Casa        bella suiza…
## 7 Zona Sur       2     6   305   125     2     3      3 Apartamento bella suiza 
## 8 Zona Oeste    NA     5   480   280     4     4      4 Apartamento bella suiza…
## 9 Zona Sur      NA     5   275    74     1     2      3 Apartamento valle del l…
md.pattern(vivienda_faltantes2)

##      AREA PRECIO ESTR WC TIPO BARRIO PARQ PISO  HAB ZONA     
## 4812    1      1    1  1    1      1    1    1    1    1    0
## 1912    1      1    1  1    1      1    1    1    1    0    1
## 877     1      1    1  1    1      1    1    1    0    1    1
## 726     1      1    1  1    1      1    1    1    0    0    2
## 1       1      0    0  0    0      0    0    0    0    0    9
## 2       0      0    0  0    0      0    0    0    0    0   10
##         2      3    3  3    3      3    3    3 1606 2641 4270

El gráfico anterior muestra que 1912 registros no tienen el dato de zona de ubicación de la vivienda (22.95%), 877 no tienen dato correspondiente al número de habitaciones (10.53%), 726 no tienen ni número de pisos ni zona de ubicación ni número de habitaciones (8.71%), 1 registro solamente contiene información referente al área construida (0.01%) y que hay 2 registros con ausencia total de información (0.024%). Por otra parte, hay un total de 4812 registros completos (57.75%)

El número de valores ausentes por cada variable es:

colSums(is.na(vivienda_faltantes2))
## PRECIO   ZONA   ESTR   AREA     WC    HAB   TIPO BARRIO   PARQ   PISO 
##      3   2641      3      2      3   1606      3      3      3      3