Introducción

El mercado inmobiliario juega un papel central en la economía mundial y en la vida diaria de las personas. Las inversiones y la adquisición de bienes inmuebles son decisiones importantes tanto para particulares como para empresas y están intrínsecamente ligadas al crecimiento económico y al desarrollo urbano. Este informe analiza a profundidad el estado actual del mercado inmobiliario en la ciudad de Cali y examina las tendencias y los factores clave que afectan a la compra, venta y valoración de inmuebles para realizar una proyección del mercado dentro de la compañía.

Objetivos

Metodología

En un inicio se procede a inspeccionar la base de datos suministrada “Vivienda_faltantes” en donde se evidencia que hay 8330 registros, en dicha base de datos se reflejan casillas sin información, por lo que se procede a realizar una limpieza de la misma con el fin de realizar un informe estadístico preciso haciendo uso de un análisis descriptivo de las variables suministradas.

datos_faltantes <- sapply(vivienda_faltantes, function(x) sum(is.na(x)))
print(datos_faltantes)
##        id      zona      piso   estrato   preciom areaconst   parquea    banios 
##         3         3      2641         3         2         3      1606         3 
##   habitac      tipo    barrio  longitud   latitud 
##         3         3         3         3         3

aquí podemos observar con exactitud que la variable con más información faltante es “piso” seguida de la variable “parqueadero”, dicha información faltante se puede dar debido a que las personas no sabían cómo contestar. Para proceder a realizar el análisis de estas variables se optó por completar la información de la variable piso con el valor de 1, ya que se pudo entender que esta variable contaba la cantidad de pisos con la que contaba el inmueble, en el caso de la variable parqueadero, se procede a completar los registros con un valor de 0 ya que esto hace referencia a que el inmueble no cuenta con parqueaderos.

copia_vivienda_faltantes<-vivienda_faltantes

Resultados

Uno de los factores mas importantes a la hora de adquirir un bien imbueble es la zona en la que este se encuentra ubicado, es por esto que tomando en cuenta esta variable se obtiene que

#Copia de la base de datos
eliminadoszona<-drop_na(copia_vivienda_faltantes,zona)
#Estandarización de la variable Tipo
eliminadoszona$tipo <- str_replace (eliminadoszona$tipo, "APARTAMENTO", " Apartamento ")
eliminadoszona$tipo <- str_replace (eliminadoszona$tipo, "apto", " Apartamento ")
eliminadoszona$tipo <- str_replace (eliminadoszona$tipo, " Apartamento ", "Apartamento")
eliminadoszona$tipo <- str_replace (eliminadoszona$tipo, "CASA", "Casa")
eliminadoszona$tipo <- str_replace (eliminadoszona$tipo, "casa", "Casa")
eliminadoszona$tipo <- str_replace (eliminadoszona$tipo, " Casa ", "Casa")
reemplazo_apartamento<- table(eliminadoszona$tipo)
print(reemplazo_apartamento)
## 
## Apartamento        Casa 
##        5106        3221
#Asignación de valores a las variables piso y parquea
eliminadoszona$piso[is.na(eliminadoszona$piso)] <- 1
eliminadoszona$parquea[is.na(eliminadoszona$parquea)] <- 0
#Tabla de frecuencia variable Zona
tabla_zona<-as.data.frame(table(eliminadoszona$zona))
transform(tabla_zona,
          rel=round(prop.table(tabla_zona$Freq),3))
##           Var1 Freq   rel
## 1  Zona Centro  124 0.015
## 2   Zona Norte 1922 0.231
## 3   Zona Oeste 1204 0.145
## 4 Zona Oriente  351 0.042
## 5     Zona Sur 4726 0.568
#Diagrama circular Zona
porcentajezona<-c(1.5,23.1,14.5,4.2,56.8)
etiquetazona<-paste(porcentajezona,"%",sep = " ")
coloreszona<- c("purple","orange","blue","yellow","green")
pie(porcentajezona,labels = etiquetazona,clockwise = TRUE,col = coloreszona,main = "Viviendas en Cali segun la zona")
legend("topright", c("Centro", "Norte", "Oeste", "Oriente", "Sur"),
      cex = 1, fill = coloreszona)

zona_sur<-filter(eliminadoszona, zona == "Zona Sur")
Minimo <-min(zona_sur$preciom)
Maximo <- max(zona_sur$preciom)
Promedio <- mean(zona_sur$preciom)
print(paste(" Los valores de los inmuebles en esta zona van desde los",Minimo, "millones, hasta los", Maximo, "millones y el valor promedio de los imbuebles es de ", Promedio, "millones"))
## [1] " Los valores de los inmuebles en esta zona van desde los 75 millones, hasta los 1900 millones y el valor promedio de los imbuebles es de  426.51840880237 millones"
table(eliminadoszona$zona, eliminadoszona$tipo)
##               
##                Apartamento Casa
##   Zona Centro           24  100
##   Zona Norte          1199  723
##   Zona Oeste          1035  169
##   Zona Oriente          62  289
##   Zona Sur            2786 1940

Donde encontramos que la zona con la mayor cantidad de inmuebles es la zona Sur, en donde los inmuebles varían de estrato 3 hasta estrato 6 y los precios se encuentran entre los 75 millones hasta los 1900 millones, es importante mencionar que en la zona sur hay disponible 2786 apartamentos y 1940 casas, la zona norte cuenta con 1199 apartamentos y 723 casas disponibles.

grafico <-md.pattern(eliminadoszona, rotate.names = TRUE)
##  /\     /\
## {  `---'  }
## {  O   O  }
## ==>  V <==  No need for mice. This data set is completely observed.
##  \  \|/  /
##   `-----'

Si se observa el grafico de manera detenida, se logra apreciar que la información faltante ya fue completada segun las especificaciones que se mencionaron anteriormente.

summary(eliminadoszona$piso)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.000   1.000   2.000   2.894   4.000  12.000
categoria_apartamento<-filter(eliminadoszona, tipo == "Apartamento")
hist(x = categoria_apartamento$piso, main = "Apartamentos", 
     xlab = "Piso en el que se encuentra el apartamento", ylab = "Frecuencia",
     col = "purple")

Teniendo en cuenta el grafico Apartamentos se logra concluir que la mayoria de los apartamentos disponibles se encuentran entre el piso 1 y 5.

plot(x = categoria_apartamento$piso, y = categoria_apartamento$preciom,
      main = "Piso del apartamento VS Precio", xlab = "Piso", ylab = "Valor")

Teniendo en cuenta el piso del apartamento los precios pueden variar un poco, ya que si observamos la gráfica a partir del piso 6 el valor mínimo de un apartamento es un poco más elevado con respecto a los pisos inferiores.

categoria_casa<-filter(eliminadoszona, tipo == "Casa")
hist(x = categoria_casa$piso, main = "Casas", 
     xlab = "Pisos que tiene una casa", ylab = "Frecuencia",
     col = "blue")

plot(x = categoria_casa$piso, y = categoria_casa$preciom,
      main = "Cantidad de pisos de una casa VS Precio", xlab = "Pisos", ylab = "Valor")

En el caso de las casas disponibles, encontramos que hay propiedades que cuentan hasta con 10 pisos, sin embargo, la mayoria de las casas en venta cuentan con 1 hasta 3 pisos y los precios van desde los 75 millones hasta los 1900 millones.

summary(eliminadoszona$estrato)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   3.000   4.000   5.000   4.634   5.000   6.000
hist(x = eliminadoszona$estrato, main = "Estrato del inmueble", 
     xlab = "Estrato del inmueble", ylab = "Frecuencia",
     col = "green")

# Crear una paleta de colores personalizada basada en la cantidad de tipos únicos
n_tipos <- length(unique(eliminadoszona$tipo))
colores <- colorRampPalette(c("blue", "red"))(n_tipos)

# Gráfico con colores personalizados
plot(x = eliminadoszona$estrato, y = eliminadoszona$preciom,
     col = colores[as.numeric(factor(eliminadoszona$tipo))],
     main = "Estrato Vs Precio", xlab = "Estrato", ylab = "Valor")
legend("topleft", legend = unique(eliminadoszona$tipo), fill = colores)

# encontrar los valores medios segun el estrato
 estrato_precio<-aggregate(eliminadoszona$preciom, list(eliminadoszona$estrato), FUN = mean )
 colnames(estrato_precio) <- c("Estrato", "valor promedio")
print(estrato_precio)
##   Estrato valor promedio
## 1       3       210.3235
## 2       4       275.1840
## 3       5       410.2472
## 4       6       800.9132

En cuanto al estrato de los inmuebles, podemos encontrar predios desde el estrato 3 hasta el estrato 6, donde la mayor parte de los inmuebles se encuentran en estrato 5, sin embargo, una cantidad considerable se encuentran en estrato 4, donde podemos concluir que en promedio las propiedades se encuentran en estrato 5. En cuanto a los precios, se logró determinar que los inmuebles más económicos en los diferentes estratos son de tipo apartamento y las propiedades más costosas son de tipo casa, en el estrato 3 el valor promedio de un imbuele es de 210 millones, en el estrato 4 la mayoría de los inmuebles en venta son de tipo casa y su valor promedio es de 275 millones, en el estrato 5 logramos identificar una gran cantidad de casa y de apartamentos cuyo valor promedio es de 410 millones y en el estrato 6, en su mayoría son apartamentos con valor promedio de 801 millones.

summary(eliminadoszona$areaconst)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##      30      80     123     175     229    1745
#Tabla de frecuencia areacont
areaconstruida = eliminadoszona$areaconst
listadoarea = hist(areaconstruida, plot = FALSE)
tabla_area = table.freq(listadoarea)
tabla_area
##    Lower Upper Main Frequency Percentage   CF   CPF
## 1      0   100   50      3294       39.6 3294  39.6
## 2    100   200  150      2621       31.5 5915  71.0
## 3    200   300  250      1242       14.9 7157  85.9
## 4    300   400  350       620        7.4 7777  93.4
## 5    400   500  450       307        3.7 8084  97.1
## 6    500   600  550       113        1.4 8197  98.4
## 7    600   700  650        46        0.6 8243  99.0
## 8    700   800  750        34        0.4 8277  99.4
## 9    800   900  850        17        0.2 8294  99.6
## 10   900  1000  950        17        0.2 8311  99.8
## 11  1000  1100 1050         5        0.1 8316  99.9
## 12  1100  1200 1150         3        0.0 8319  99.9
## 13  1200  1300 1250         1        0.0 8320  99.9
## 14  1300  1400 1350         1        0.0 8321  99.9
## 15  1400  1500 1450         3        0.0 8324 100.0
## 16  1500  1600 1550         2        0.0 8326 100.0
## 17  1600  1700 1650         0        0.0 8326 100.0
## 18  1700  1800 1750         1        0.0 8327 100.0
#area promedio construida segun estrato
estrato_area<- aggregate(eliminadoszona$areaconst, list(eliminadoszona$estrato), FUN = mean )
colnames(estrato_area) <- c("Estrato", "Area construida promedio")
print(estrato_area)
##   Estrato Area construida promedio
## 1       3                 141.6812
## 2       4                 131.2354
## 3       5                 173.2978
## 4       6                 248.4207

Con respecto al área construida, podemos encontrar inmuebles desde 30 m2 hasta los 1745m2, donde el 40% de las viviendas cuentan con un área construida entre los 30 y 100m2, en promedio los inmuebles cuentan con un área construida de 175m2, por otro lado, las viviendas que se encuentran en estrato 3 en promedio tienen 142m2, las de estrato 4 cuentan con 131m2 en promedio, las propiedades categorizadas con estrato 5 cuentan con 173m2 en promedio y las de estrato 6 con 248m2.

summary(eliminadoszona$parquea)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.000   1.000   1.000   1.483   2.000  10.000
hist(x = eliminadoszona$parquea, main = "Parqueaderos en el inmueble", 
     xlab = "Cantidad de parqueaderos", ylab = "Frecuencia",
     col = "yellow")

# Gráfico con colores personalizados
plot(x = eliminadoszona$parquea, y = eliminadoszona$preciom,
     col = colores[as.numeric(factor(eliminadoszona$tipo))],
     main = "Parqueaderos VS precio ", xlab = "Parqueaderos", ylab = "Valor")
legend("topright", legend = unique(eliminadoszona$tipo), fill = colores)

Uno de los factores de gran relevancia a la hora de adquirir una vivienda es la cantidad de parqueaderos, en los inmuebles disponibles observamos que hay viviendas que no cuentan con parqueaderos y algunas hasta con 10 de ellos, sin embargo, la gran mayoría de las viviendas cuentas con al menos un parqueadero, los inmuebles que cuentan con 2 parqueaderos son apartamentos en su gran mayoría y a partir de 4 parqueaderos en adelante son viviendas de tipo casa en donde los precios tienden a ser más elevados.

summary(eliminadoszona$banios)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.000   2.000   3.000   3.112   4.000  10.000
hist(x = eliminadoszona$banios, main = "Baños del inmueble", 
     xlab = "Cantidad de baños", ylab = "Frecuencia",
     col = "red")

# Gráfico con colores personalizados
plot(x = eliminadoszona$banios, y = eliminadoszona$preciom,
     col = colores[as.numeric(factor(eliminadoszona$tipo))],
     main = "Baños VS precio ", xlab = "Baños", ylab = "Valor")
legend("topright", legend = unique(eliminadoszona$tipo), fill = colores)

Otra de las características importantes al momento de adquirir vivienda es la cantidad de baños con la que esta cuenta, en los inmuebles disponibles se evidencia que hay propiedades que no cuentan con baño y otras que tienen hasta 10 baños, las propiedades que cuentan con un solo baño en su mayoría son apartamentos que pueden tener un valor desde los 75 millones hasta 500 millones aproximadamente, sin embargo, la mayoría de las propiedades disponibles cuentan con 2 baños y suelen ser apartamentos con precios a partir de los 100 millones hasta más de 1000 millones, las propiedades que cuentas con 6 baños en adelante suelen ser casas que pueden superar los 1500 millones.

summary(eliminadoszona$habitac)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.000   3.000   3.000   3.605   4.000  10.000
hist(x = eliminadoszona$habitac, main = "Habitaciones del inmueble", 
     xlab = "Cantidad de habitaciones", ylab = "Frecuencia",
     col = "orange")

# Gráfico con colores personalizados
plot(x = eliminadoszona$habitac, y = eliminadoszona$preciom,
     col = colores[as.numeric(factor(eliminadoszona$tipo))],
     main = "Habitaciones VS precio ", xlab = "Habitaciones", ylab = "Valor")
legend("topright", legend = unique(eliminadoszona$tipo), fill = colores)

estrato_habitaciones<- aggregate(eliminadoszona$habitac, list(eliminadoszona$estrato), FUN = mean )
colnames(estrato_habitaciones) <- c("Estrato", "Habitaciones promedio")
print(estrato_habitaciones)
##   Estrato Habitaciones promedio
## 1       3              4.061253
## 2       4              3.367433
## 3       5              3.575791
## 4       6              3.567269

En cuanto a las habitaciones hay inmuebles que no cuentan con ninguna habitación y otras que poseen 10 habitaciones, en su gran mayoría las viviendas cuentan con 3 habitaciones y son de tipo apartamento y su precio esta desde los 100 millones hasta los 1500 millones, otra gran cantidad de viviendas cuentan con 4 habitaciones y se pueden encontrar de tipo apartamento o casa, si se desea una propiedad con 5 habitaciones o más, por lo general son de tipo casa y pueden alcanzar hasta los 1900 millones. Las viviendas categorizadas como estrato 3 en promedio cuentan con 4 habitaciones al igual que las de estrato 5 y 6, las de estrato 4 en promedio cuentan con 3 habitaciones.

#Tabla de frecuencia variable Tipo
tabla_tipo<-as.data.frame(table(eliminadoszona$tipo))
transform(tabla_tipo,
          rel=round(prop.table(tabla_tipo$Freq),3))
##          Var1 Freq   rel
## 1 Apartamento 5106 0.613
## 2        Casa 3221 0.387
#Diagrama circular Zona
porcentajetipo<- c(61.3,38.7)
etiquetatipo<-paste(porcentajetipo,"%",sep = " ")
colorestipo<- c("blue","yellow")
pie(porcentajetipo,labels = etiquetatipo,clockwise = TRUE,col = colorestipo,main = "Viviendas en Cali segun su tipo")
legend("topright", c("Apartamento", "Casa"),
      cex = 1, fill = colorestipo)

El 61,3% de los inmuebles disponibles son de tipo apartamento, todos los inmuebles se encuentran distribuidos en 438 barrios diferentes en las distintas zonas de la ciudad.

Conclusiones

Una vez realizado un análisis descriptivo de la base de datos suministrada, es claro que la mayor parte de las propiedades disponibles son de tipo apartamento, ya que en total hay 5106 de estos listos para la venta, donde la mayor concentración de apartamentos esta en la zona sur, dichos apartamentos se pueden encontrar en diferentes piso, desde el primer piso hasta el doceavo piso del complejo, la mayor parte de estos apartamentos cuentan con 2 y 3 habitaciones, lo cual los hace muy atractivos para las familias, además de que estos cuentan con 2 baños, aunque algunos cuentan con menos o mas baños, otro factor que los hace aún más atractivos es el espacio de parqueo, ya que en su mayoría cuenta con al menos una zona de parqueo. La mayor parte de los apartamentos se encuentran en estrato 6, donde se pueden encontrar apartamentos a partir de los 128 millones hasta los 1950 millones, sin embargo, se promedia que el costo de un inmueble en este estrato es de 801 millones.

En cuanto a las casas, estas se encuentran en su gran mayoría ubicadas en la zona sur y constan de diferentes niveles, pero en gran parte son viviendas de un solo piso. Este tipo de vivienda puede estar categorizada desde estrato 3 hasta estrato 6, sin embargo, la mayor parte de las casas son de estrato 4 donde el valor promedio es de 275 millones y cuenta con un área construida de 131m^2 en promedio.

Es de suma importancia crear campañas enfocadas en al venta de apartamentos ya que es la mayor cantidad de inmuebles disponibles con precios muy asequibles.