1. Introducción:

En Colombia, así como en el resto de los países del mundo, el mercado de bienes raíces es uno de los pilares importantes en la economía. Por consiguiente, hay diversos factores que hacen que el sector sea de gran importancia para el país, entre estos, se encuentra la generación de empleos que favorecen la economía nacional.

Se espera que en Colombia se vendan más de 250,000 viviendas en 2023, incluyendo viviendas de interés social y no VIS. De esta manera se traduce en una evolución del mercado inmobiliario. Esto, según el último informe de Coordenada Urbana, el sistema de información de la Cámara Colombiana de la Construcción (Camacol). La cifra estimada representa un aumento del 6.6% en comparación con el año 2022, cuando se previó la venta de 234,592 viviendas. El cierre esperado para 2022 mostró un aumento del 0.8% en comparación con el año anterior.

El mercado de bienes raíces en Cali ha crecido significativamente en los últimos años, impulsado por el crecimiento de la población, la inversión extranjera directa y el desarrollo de nuevos proyectos inmobiliarios. En 2021, las ventas del sector en Cali llegaron a $6700 millones y en 2022 a $6100 mil millones. Se espera que este sector continúe creciendo durante los próximos años, permitiendo un desarrollo dinámico en la economía regional.

Por lo anterior surge la necesidad en la empresa B&C de generar un informe en donde se utilizaran herramientas estadísticas para generar un tratamiento de datos y facilitar la interpretación de la información recogida por la compañía sobre viviendas, que incluye información sobre el precio, la ubicación, las características y la venta de viviendas en Cali.

2. Objetivo:

Realizar un informe estadístico para la empresa B&C (Bienes y Casas) que opera en la ciudad de Cali.

3. Métodos

Se va a realizar un análisis exploratorio y descriptivo donde se van a calcular medias de tendencia central, disposicion y dispersion para las variables cuantitativas.Para las variables cualitativas se realizaran histogramas.

4.Resultados

4.1. La base de datos utilizada corresponde a:

#install.packages("devtools") # solo una vez
devtools::install_github("dgonxalex80/paqueteMET")
library(paqueteMET)
data(vivienda_faltantes)

Base de datos con 8330 observaciones y 13 variables entre las cuales estan : zona, id, estrato, piso, precio, área construida, parqueadero,habitaciones, baños, tipo, barrio, longitud y latitud.

4.2.Datos faltantes

library(paqueteMET)
library(dplyr)
data("vivienda_faltantes")
set.seed(123)
datosNA<-sample_n(vivienda_faltantes, 1000)
faltantes <- colSums(is.na(datosNA))
faltantes
##        id      zona      piso   estrato   preciom areaconst   parquea    banios 
##         0         0       344         0         0         0       208         0 
##   habitac      tipo    barrio  longitud   latitud 
##         0         0         0         0         0

Los datos faltantes se encuentran en las variables de Piso para 344 datos y parqueadero con 208 datos faltantes. Tener en cuenta para futuras recolección de datos el diligenciamiento completo en las variables de piso y parqueadero.

4.3.Gráfica de datos faltantes

#install.packages("naniar")
library(naniar)
gg_miss_var(datosNA)

Esta función muestra el número total de datos faltantes por variable, los cuales coinciden con la función anterior.

4.4 Registros con información incompleta

La base de datos tiene 546 registros con informaciçon completa (sin datos faltantes), se presentan 246 registros con datos faltantes en la variable piso, 110 registros les hace falta información en la variables parqueadero y a 98 registros les hace falta información en dos variables (parqueadero y piso)

4.5 Eliminar todos los registros contenidos en la base de datos que contenga datos faltantes (NA)

##  /\     /\
## {  `---'  }
## {  O   O  }
## ==>  V <==  No need for mice. This data set is completely observed.
##  \  \|/  /
##   `-----'

4.6.Imputación: Sustituir NA por cero

4.7.Imputación: reemplazar el NA por el valor correspondiente a la media

##  /\     /\
## {  `---'  }
## {  O   O  }
## ==>  V <==  No need for mice. This data set is completely observed.
##  \  \|/  /
##   `-----'

4.8.Estadística descriptiva de las variables de la base de datos

summarytools::descr(vivienda_faltantes)
## Descriptive Statistics  
## vivienda_faltantes  
## N: 8330  
## 
##                     areaconst    banios   estrato   habitac        id   latitud    longitud
## ----------------- ----------- --------- --------- --------- --------- --------- -----------
##              Mean      174.99      3.11      4.63      3.61   4163.99    970.37   -21845.13
##           Std.Dev      142.95      1.43      1.03      1.46   2403.93   1539.16    34503.90
##               Min       30.00      0.00      3.00      0.00      1.00      3.33   -76576.00
##                Q1       80.00      2.00      4.00      3.00   2082.00      3.39   -76506.00
##            Median      123.00      3.00      5.00      3.00   4164.00      3.45      -76.54
##                Q3      229.00      4.00      5.00      4.00   6246.00   3367.00      -76.52
##               Max     1745.00     10.00      6.00     10.00   8319.00   3497.00      -76.46
##               MAD       84.51      1.48      1.48      1.48   3086.77      0.10        0.03
##               IQR      149.00      2.00      1.00      1.00   4163.00   3363.61    76429.48
##                CV        0.82      0.46      0.22      0.40      0.58      1.59       -1.58
##          Skewness        2.69      0.92     -0.18      1.64      0.00      0.96       -0.95
##       SE.Skewness        0.03      0.03      0.03      0.03      0.03      0.03        0.03
##          Kurtosis       12.90      1.12     -1.11      3.99     -1.20     -1.07       -1.09
##           N.Valid     8327.00   8327.00   8327.00   8327.00   8327.00   8327.00     8327.00
##         Pct.Valid       99.96     99.96     99.96     99.96     99.96     99.96       99.96
## 
## Table: Table continues below
## 
##  
## 
##                     parquea      piso   preciom
## ----------------- --------- --------- ---------
##              Mean      1.84      3.77    434.24
##           Std.Dev      1.13      2.62    329.02
##               Min      1.00      1.00     58.00
##                Q1      1.00      2.00    220.00
##            Median      2.00      3.00    330.00
##                Q3      2.00      5.00    540.00
##               Max     10.00     12.00   1999.00
##               MAD      1.48      1.48    209.05
##               IQR      1.00      3.00    320.00
##                CV      0.61      0.69      0.76
##          Skewness      2.32      1.28      1.85
##       SE.Skewness      0.03      0.03      0.03
##          Kurtosis      8.29      1.05      3.66
##           N.Valid   6724.00   5689.00   8328.00
##         Pct.Valid     80.72     68.30     99.98

4.9.Precio de las viviendas en diferentes zonas de Cali

hist(x = vivienda_faltantes$preciom, main = "Histograma de Precio", 
     xlab = "Preciom", ylab = "Frecuencia", 
     col= "blue")

Los datos se encuentran sesgados hacia la izquierda, la mayor cantidad de datos se encuentran ubicados de 200 a 500 millones de pesos.

4.10.Zonas de viviendas en Cali

x<- table(vivienda_faltantes$zona)

plot (x, main = "Grafica de Zonas de vivienda en Cali", xlab = "Zonas", ylab = "Frecuencia",  col = c("royalblue", "yellow", "purple", "green", "pink"))

La parte de Cali que mas datos registra corresponde a la Zona Sur, con un total de 4716. La zona Oriente cuenta con 351 registros siendo la mas pequeña.

4.11 Estratos en Cali

x <- table(vivienda_faltantes$estrato)
proporciones <- prop.table(x) * 100
etiquetas <- c("Tres", "Cuatro", "Cinco", "Seis")

etiquetas_con_pct <- paste(etiquetas, round(proporciones), "%", sep=" ")

pie(proporciones, labels = etiquetas_con_pct,
    col = rainbow(length(etiquetas)),
    main = "Estratos en Cali")

El estrato 5 cuenta con mayor cantidad de registros obteniendo el 30% y el estrato 3 en oposición con la menor cantidad para un 17%.

4.12 Tipo de Vivienda mas vendida en Cali

x<- table(vivienda_faltantes$tipo)
library(tidyverse)
Viviendas_faltantes_tipo <-str_to_lower(vivienda_faltantes$tipo)
view(Viviendas_faltantes_tipo )

xx<- str_replace(Viviendas_faltantes_tipo, "apto", "apartamento")
table(xx)
## xx
## apartamento        casa 
##        5106        3221

5. Conclusiones: