En Colombia, así como en el resto de los países del mundo, el mercado de bienes raíces es uno de los pilares importantes en la economía. Por consiguiente, hay diversos factores que hacen que el sector sea de gran importancia para el país, entre estos, se encuentra la generación de empleos que favorecen la economía nacional.
Se espera que en Colombia se vendan más de 250,000 viviendas en 2023, incluyendo viviendas de interés social y no VIS. De esta manera se traduce en una evolución del mercado inmobiliario. Esto, según el último informe de Coordenada Urbana, el sistema de información de la Cámara Colombiana de la Construcción (Camacol). La cifra estimada representa un aumento del 6.6% en comparación con el año 2022, cuando se previó la venta de 234,592 viviendas. El cierre esperado para 2022 mostró un aumento del 0.8% en comparación con el año anterior.
El mercado de bienes raíces en Cali ha crecido significativamente en los últimos años, impulsado por el crecimiento de la población, la inversión extranjera directa y el desarrollo de nuevos proyectos inmobiliarios. En 2021, las ventas del sector en Cali llegaron a $6700 millones y en 2022 a $6100 mil millones. Se espera que este sector continúe creciendo durante los próximos años, permitiendo un desarrollo dinámico en la economía regional.
Por lo anterior surge la necesidad en la empresa B&C de generar un informe en donde se utilizaran herramientas estadísticas para generar un tratamiento de datos y facilitar la interpretación de la información recogida por la compañía sobre viviendas, que incluye información sobre el precio, la ubicación, las características y la venta de viviendas en Cali.
Realizar un informe estadístico para la empresa B&C (Bienes y Casas) que opera en la ciudad de Cali.
Se va a realizar un análisis exploratorio y descriptivo donde se van a calcular medias de tendencia central, disposicion y dispersion para las variables cuantitativas.Para las variables cualitativas se realizaran histogramas.
#install.packages("devtools") # solo una vez
devtools::install_github("dgonxalex80/paqueteMET")
library(paqueteMET)
data(vivienda_faltantes)
Base de datos con 8330 observaciones y 13 variables entre las cuales estan : zona, id, estrato, piso, precio, área construida, parqueadero,habitaciones, baños, tipo, barrio, longitud y latitud.
library(paqueteMET)
library(dplyr)
data("vivienda_faltantes")
set.seed(123)
datosNA<-sample_n(vivienda_faltantes, 1000)
faltantes <- colSums(is.na(datosNA))
faltantes
## id zona piso estrato preciom areaconst parquea banios
## 0 0 344 0 0 0 208 0
## habitac tipo barrio longitud latitud
## 0 0 0 0 0
Los datos faltantes se encuentran en las variables de Piso para 344 datos y parqueadero con 208 datos faltantes. Tener en cuenta para futuras recolección de datos el diligenciamiento completo en las variables de piso y parqueadero.
#install.packages("naniar")
library(naniar)
gg_miss_var(datosNA)
Esta función muestra el número total de datos faltantes por variable, los cuales coinciden con la función anterior.
La base de datos tiene 546 registros con informaciçon completa (sin datos faltantes), se presentan 246 registros con datos faltantes en la variable piso, 110 registros les hace falta información en la variables parqueadero y a 98 registros les hace falta información en dos variables (parqueadero y piso)
## /\ /\
## { `---' }
## { O O }
## ==> V <== No need for mice. This data set is completely observed.
## \ \|/ /
## `-----'
## /\ /\
## { `---' }
## { O O }
## ==> V <== No need for mice. This data set is completely observed.
## \ \|/ /
## `-----'
summarytools::descr(vivienda_faltantes)
## Descriptive Statistics
## vivienda_faltantes
## N: 8330
##
## areaconst banios estrato habitac id latitud longitud
## ----------------- ----------- --------- --------- --------- --------- --------- -----------
## Mean 174.99 3.11 4.63 3.61 4163.99 970.37 -21845.13
## Std.Dev 142.95 1.43 1.03 1.46 2403.93 1539.16 34503.90
## Min 30.00 0.00 3.00 0.00 1.00 3.33 -76576.00
## Q1 80.00 2.00 4.00 3.00 2082.00 3.39 -76506.00
## Median 123.00 3.00 5.00 3.00 4164.00 3.45 -76.54
## Q3 229.00 4.00 5.00 4.00 6246.00 3367.00 -76.52
## Max 1745.00 10.00 6.00 10.00 8319.00 3497.00 -76.46
## MAD 84.51 1.48 1.48 1.48 3086.77 0.10 0.03
## IQR 149.00 2.00 1.00 1.00 4163.00 3363.61 76429.48
## CV 0.82 0.46 0.22 0.40 0.58 1.59 -1.58
## Skewness 2.69 0.92 -0.18 1.64 0.00 0.96 -0.95
## SE.Skewness 0.03 0.03 0.03 0.03 0.03 0.03 0.03
## Kurtosis 12.90 1.12 -1.11 3.99 -1.20 -1.07 -1.09
## N.Valid 8327.00 8327.00 8327.00 8327.00 8327.00 8327.00 8327.00
## Pct.Valid 99.96 99.96 99.96 99.96 99.96 99.96 99.96
##
## Table: Table continues below
##
##
##
## parquea piso preciom
## ----------------- --------- --------- ---------
## Mean 1.84 3.77 434.24
## Std.Dev 1.13 2.62 329.02
## Min 1.00 1.00 58.00
## Q1 1.00 2.00 220.00
## Median 2.00 3.00 330.00
## Q3 2.00 5.00 540.00
## Max 10.00 12.00 1999.00
## MAD 1.48 1.48 209.05
## IQR 1.00 3.00 320.00
## CV 0.61 0.69 0.76
## Skewness 2.32 1.28 1.85
## SE.Skewness 0.03 0.03 0.03
## Kurtosis 8.29 1.05 3.66
## N.Valid 6724.00 5689.00 8328.00
## Pct.Valid 80.72 68.30 99.98
hist(x = vivienda_faltantes$preciom, main = "Histograma de Precio",
xlab = "Preciom", ylab = "Frecuencia",
col= "blue")
Los datos se encuentran sesgados hacia la izquierda, la mayor cantidad de datos se encuentran ubicados de 200 a 500 millones de pesos.
x<- table(vivienda_faltantes$zona)
plot (x, main = "Grafica de Zonas de vivienda en Cali", xlab = "Zonas", ylab = "Frecuencia", col = c("royalblue", "yellow", "purple", "green", "pink"))
La parte de Cali que mas datos registra corresponde a la Zona Sur, con un total de 4716. La zona Oriente cuenta con 351 registros siendo la mas pequeña.
x <- table(vivienda_faltantes$estrato)
proporciones <- prop.table(x) * 100
etiquetas <- c("Tres", "Cuatro", "Cinco", "Seis")
etiquetas_con_pct <- paste(etiquetas, round(proporciones), "%", sep=" ")
pie(proporciones, labels = etiquetas_con_pct,
col = rainbow(length(etiquetas)),
main = "Estratos en Cali")
El estrato 5 cuenta con mayor cantidad de registros obteniendo el 30% y el estrato 3 en oposición con la menor cantidad para un 17%.
x<- table(vivienda_faltantes$tipo)
library(tidyverse)
Viviendas_faltantes_tipo <-str_to_lower(vivienda_faltantes$tipo)
view(Viviendas_faltantes_tipo )
xx<- str_replace(Viviendas_faltantes_tipo, "apto", "apartamento")
table(xx)
## xx
## apartamento casa
## 5106 3221
Mayor nicho de mercado de la empresa B&C se encuentra en los apartamentos, como tipo de vivienda.
El principal sector socio-economico en el cual se encuentran el mayor porcentaje de bienes es el 5 con un 33%.
La zona Sur presenta la maypr cantidad de bienes con un total de 4716.
La mayor cantidad de casas y apartamentos oscialn entre los 200 y 500 millones de pesos.