Cali, es la tercera ciudad más grande de Colombia, y se destaca por su vibrante cultura, su rica historia y su enérgico ambiente. En los últimos años, esta ciudad ha experimentado un crecimiento acelerado y una demanda sostenida en el mercado inmobiliario, convirtiéndose en un polo atractivo para inversores y compradores por igual.
En este informe se presentan lo métodos, resultados, discusiones y conclusiones que se hicieron sobre la base de datos “vivienda_faltantes” que la empresa B&C recogió del mercado inmobiliario.
El objetivo principal de este informe es proporcionar a la empresa B&C un análisis descriptivo exhaustivo y basado en datos del mercado de bienes raíces en Cali.
Los métodos que se utilizaron fueron:
Tenemos comoresultado una tabla de valores faltantes
## Suma Porcentaje
## 1 Suma Porcentaje
## id 3 0.04
## zona 3 0.04
## piso 2641 31.7
## estrato 3 0.04
## preciom 2 0.02
## areaconst 3 0.04
## parquea 1606 19.28
## banios 3 0.04
## habitac 3 0.04
## tipo 3 0.04
## barrio 3 0.04
## longitud 3 0.04
## latitud 3 0.04
Hay un gran porcentaje de elementos faltantes en Piso y en parqueadero.
## # A tibble: 5 × 7
## zona Media_Precio Moda_Precio Mediana_Precio Desviacion_Precio Max_Precio
## <fct> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 Zona Cen… 310. 150 297 162. 1100
## 2 Zona Nor… 346. 320 300 241. 1940
## 3 Zona Oes… 679. 450 580 393. 1999
## 4 Zona Ori… 229. 240 210 122. 1350
## 5 Zona Sur 427. 250 320 323. 1900
## # ℹ 1 more variable: Min_Precio <dbl>
## # A tibble: 5 × 7
## zona Media_Area Moda_Area Mediana_Area Desviacion_Area Max_Area Min_Area
## <fct> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 Zona Cent… 194. 150 160 110. 750 52
## 2 Zona Norte 161. 60 107 138. 1440 30
## 3 Zona Oeste 197. 125 166 122. 1200 44
## 4 Zona Orie… 192. 60 160 157. 1745 40
## 5 Zona Sur 173. 60 113 149. 1600 40
## # A tibble: 20 × 3
## tipo banios Frecuencia
## <fct> <fct> <int>
## 1 Apartamento 0 14
## 2 Apartamento 1 400
## 3 Apartamento 2 2502
## 4 Apartamento 3 1201
## 5 Apartamento 4 639
## 6 Apartamento 5 301
## 7 Apartamento 6 40
## 8 Apartamento 7 8
## 9 Apartamento 8 1
## 10 Casa 0 31
## 11 Casa 1 97
## 12 Casa 2 444
## 13 Casa 3 793
## 14 Casa 4 821
## 15 Casa 5 590
## 16 Casa 6 275
## 17 Casa 7 99
## 18 Casa 8 47
## 19 Casa 9 15
## 20 Casa 10 9
El gráfico muestra cómo se distribuyen las viviendas en función de la cantidad de baños que tienen, y cómo esta distribución varía según el tipo de vivienda (Apartamento o Casa).
El gráfico muestra cómo se distribuyen las viviendas según su tipo (Apartamento o Casa) y su zona geográfica. Cada barra agrupada representa la cantidad de viviendas de un tipo específico en cada zona.
El gráfico muestra cómo se distribuyen las viviendas según el estrato al que pertenecen. Cada barra representa la cantidad de viviendas en cada estrato.
El gráfico muestra cómo se distribuyen las viviendas según la cantidad de habitaciones que tienen. Cada barra representa la cantidad de viviendas que tienen un número específico de habitaciones.
El gráfico de puntos muestra la relación entre dos variables: “areaconst” en el eje x (área construida de las viviendas) y “preciom” en el eje y (precio de las viviendas). Cada punto en el gráfico representa una vivienda.
## `geom_smooth()` using formula = 'y ~ x'
El gráfico muestra la distribución de viviendas por zona y estrato utilizando barras agrupadas
Este gráfico de dispersión con una línea de regresión lineal muestra la relación entre el área construida de las viviendas y su precio, diferenciando las zonas geográficas por color.
## `geom_smooth()` using formula = 'y ~ x'
## Discusión
Diferencias en precios por zonas: Hay diferencias notables en los precios de las propiedades según las zonas de la ciudad. Por ejemplo, la “Zona Oriente” tiene la media de precios más baja (229) en comparación con la “Zona Oeste” con la media más alta (679). Esto indica una variación significativa en los valores de las propiedades entre diferentes áreas de la ciudad.
Desviación en precios: La “Desviación_Precio” es mayor en la “Zona Norte” y la “Zona Sur,” lo que sugiere una mayor variabilidad en los precios dentro de estas zonas. Esto podría indicar que estas áreas tienen propiedades con una amplia gama de valores, desde propiedades más asequibles hasta propiedades de lujo.
Valores extremos: La “Zona Centro” tiene el “Max_Precio” más alto (1100), mientras que la “Zona Norte” tiene el valor máximo más alto (1940). Estos valores extremos podrían representar propiedades excepcionales en términos de tamaño, ubicación o características especiales.
Diferencias en precios centrales: Las medidas de tendencia central (mediana y moda) varían en las diferentes zonas. Esto indica que en algunas zonas, como la “Zona Norte,” los precios tienden a agruparse alrededor de un valor específico (moda), mientras que en otras zonas, como la “Zona Centro,” los precios pueden estar más distribuidos alrededor de valores medios (mediana).
Diferencias en áreas construidas: al igual que con los precios, hay diferencias notables en el área construida de las propiedades en diferentes zonas. La “Zona Oeste” tiene la media de área construida más alta (197), mientras que la “Zona Norte” tiene la media más baja (161). Esto indica que las propiedades en diferentes áreas pueden tener tamaños significativamente diferentes.
Desviación en áreas construidas: la “Desviacion_Area” es mayor en la “Zona Oeste,” lo que sugiere una mayor variabilidad en los tamaños de las propiedades dentro de esta zona. Esto podría indicar que en la “Zona Oeste” hay propiedades con áreas construidas muy diversas, desde propiedades pequeñas hasta propiedades más grandes.
Valores extremos de área: la “Zona Norte” tiene el “Max_Area” más alto (1440), lo que indica que esta zona puede tener propiedades con áreas construidas excepcionalmente grandes.
Diferencias en áreas centrales: al igual que con los precios, las medidas de tendencia central (mediana y moda) varían en las diferentes zonas en términos de área construida. Esto sugiere que, en algunas zonas, como la “Zona Sur,” las áreas construidas pueden agruparse alrededor de valores específicos (moda), mientras que, en otras zonas, como la “Zona Norte,” pueden estar más distribuidas alrededor de valores medios (mediana).
El gráfico permite comparar las frecuencias relativas de diferentes números de baños en cada tipo de vivienda. Por ejemplo, se puede observar que, en los Apartamentos, la mayoría tiene 2 o 3 baños, mientras que, en las Casas, los números de baños más comunes parecen ser 3 o 4. También se muestra claramente la diferencia en la distribución de baños entre Apartamentos y Casas. También se pueden observar algunas viviendas atípicas con un número inusualmente alto de baños. Esto puede ser que sean casas con áreas muy grandes o de lujo. También podemos hablar de que hay 31 casas y 15 apartamentos que no tienen baños. Podemos inferir que esta casilla se obvio y se diligencio en “0”
Este gráfico evidencia la alta oferta de casas y apartamento que existe en la Zona Sur de Cali, continuando con la Zona Norte, que se ubica por encima de los 1000 apartamentos y debajo de las 1000 casas. Igualmente la Zona Oeste evidencia gran cantidad de apartamentos.
El gráfico de barras sobre la “Distribución de Viviendas por Estrato” proporciona una instantánea visual de cómo se dividen las viviendas en función de su clasificación socioeconómica. Podemos observar que el estrato predominante es el 5 y casi están a la par el estrato 6 y 4. Este análisis da herramientas para que la empresa pueda comprender los diferentes segmentos de mercado y ajustar tus estrategias en consecuencia.
El gráfico permite observar las frecuencias relativas de diferentes números de habitaciones en las viviendas. Puedes identificar cuántas viviendas tienen 1 habitación, 2 habitaciones, 3 habitaciones, etc. El número más común son 3 habitaciones por vivienda seguidas por aquellas con 2 y 4 habitaciones. Acá podemos mirar las preferencias de los compradores y las características del mercado inmobiliario en Cali, relacionadas con el tamaño de las viviendas.
En este análisis la línea de regresión tiene una pendiente positiva, lo que sugiere que, en promedio, a medida que aumenta el área construida de las viviendas, sus precios también tienden a aumentar. Esto sugiere una relación directa y coherente en la que un incremento en el tamaño construido se correlaciona con un aumento en el precio.
La gráfica nos permite analizar que la Zona Sur y Norte predominan los estratos 4 y 5. Para las zonas Sur y Oeste, se evidencia que son áreas de alto nivel, ya que el estrato 6 tienen gran cantidad de viviendas. Según lo anterior la Zona Sur es el mejor punto de la ciudad para comprar vivienda, porque los estratos 4, 5 y 6 son los que resaltan.
El gráfico muestra una tendencia general en la relación entre el área construida de las viviendas y su precio. A medida que el área construida aumenta, el precio tiende a aumentar también. Esta relación positiva sugiere que, en promedio, las viviendas más grandes tienden a tener precios más altos. El evidente que en la Zona Oeste los precios suben muy rápido a medida que la línea de regresión lineal sube, en comparación con la Zona Norte, que los precios mantienen un incremento normal. Como último hay un caso extraño en la Zona Oriente, porque la línea de regresión lineal se mantiene estable y no sube demasiado, esto quiere decir que los precios en esta zona son mejores, porque las áreas construidas son más grandes y los precios no están muy altos.
Para las zonas y las áreas las diferencias en las medidas de área en diferentes zonas tienen implicaciones significativas para la planificación urbana y la toma de decisiones. Comprender estas diferencias puede ayudar a desarrollar estrategias adaptadas a las necesidades y características únicas de cada zona.
Para el tema de los baños y el tipo de vivienda podemos concluir que las personas prefieren apartamento de 2 baños en su mayoría y casas de 3 a 4 baños. La distribución de baños en diferentes tipos de viviendas puede sugerir las preferencias y demandas de los compradores o inquilinos. Las casas tienden a tener más baños, lo que podría relacionarse con la idea de que las familias prefieren casas más grandes con más baños
En resumen, las visualizaciones y análisis proporcionan una comprensión rica y detallada de cómo se distribuyen las viviendas en la ciudad de Cali en función de distintos atributos. Se observa una variedad de patrones en función de la zona, el tipo de vivienda, el número de habitaciones, el estrato, el área construida y el precio. Estos patrones pueden ser útiles para compradores, vendedores y planificadores urbanos al tomar decisiones informadas sobre propiedades en la ciudad. A continuación, unas apreciaciones:
Los precios de viviendas varían significativamente según la zona geográfica.
Las zonas de mayor precio promedio pueden estar relacionadas con ubicaciones privilegiadas.
Existe diversidad en los precios dentro de cada zona, mostrando opciones de vivienda para diferentes presupuestos.
El tamaño de las viviendas, medido por el área construida, varía en cada zona.
Algunas zonas pueden tener viviendas más grandes que otras, posiblemente debido a características urbanas o planificación.
Los apartamentos son más comunes que las casas.
La mayoría de los apartamentos tienen 2 o 3 baños, mientras que casas tienden a tener de 3 a 4 baños.
Hay una distribución diversa de tipos de viviendas en todas las zonas.
Cada zona tiene su propia mezcla de viviendas tipo apartamento y casa, lo que refleja diversidad en la oferta.
Hay una variedad de estratos representados en todas las zonas.
Algunas zonas pueden estar más orientadas hacia ciertos estratos, pero en general, hay diversidad en cada zona.
La mayoría de las viviendas tienen entre 2 y 4 habitaciones.
Las viviendas con 1 habitación o más de 5 son menos comunes.
A medida que aumenta el área construida, generalmente aumenta el precio.
Las viviendas más grandes tienden a tener precios más altos, con puntos dispersos alrededor de la línea de regresión.
Las zonas geográficas tienen diferentes distribuciones de precios en función del estrato.
Cada zona muestra una variedad de precios para diferentes estratos, lo que indica opciones diversas.
Según la información anteriormente presentada las viviendas más vendidas o que tienen mayor oferta son los apartamentos.
Las preferencias de las personas a la hora de conseguir una vivienda están enfocadas en el área construida, la cantidad de baños que tenga que están entre 2 a 3 baños, de 2 a 4 habitaciones.
La zona preferida es la Oriente, la media de precios es de 229 millones lo que hace a las viviendas asequibles.
suma_faltantes <- colSums(is.na(vivienda_faltantes))
total_filas <- nrow(vivienda_faltantes) porcentaje_faltantes <- round((suma_faltantes / total_filas) * 100,2)
tabla_faltantes <- data.frame(Suma = suma_faltantes, Porcentaje = porcentaje_faltantes)
tabla_faltantes <- rbind(c(“Suma”, “Porcentaje”), tabla_faltantes)
print(tabla_faltantes)
vivienda_faltantes_nuevo <- vivienda_faltantes[,!(colnames(vivienda_faltantes) %in% c(“piso”, “parquea”))] vivienda_faltantes_nuevo <- na.omit(vivienda_faltantes_nuevo)
resumen_cuantitativas <- vivienda_faltantes_nuevo %>% select(preciom, areaconst, longitud, latitud) %>% summary()
print(resumen_cuantitativas)
vivienda_faltantes_nuevo <- vivienda_faltantes_nuevo %>% mutate(tipo = case_when( tolower(tipo) %in% c(“apartamento”, “apto”) ~ “Apartamento”, tolower(tipo) %in% c(“casa”) ~ “Casa”, TRUE ~ “Otro” ))
vivienda_faltantes_nuevo\(zona <- as.factor(vivienda_faltantes_nuevo\)zona) vivienda_faltantes_nuevo\(estrato <- as.factor(vivienda_faltantes_nuevo\)estrato) vivienda_faltantes_nuevo\(tipo <- as.factor(vivienda_faltantes_nuevo\)tipo) vivienda_faltantes_nuevo\(barrio <- as.factor(vivienda_faltantes_nuevo\)barrio) vivienda_faltantes_nuevo\(banios <- as.factor(vivienda_faltantes_nuevo\)banios) vivienda_faltantes_nuevo\(habitac <- as.factor(vivienda_faltantes_nuevo\)habitac)
resumen_cualitativas <- vivienda_faltantes_nuevo %>% select(zona, estrato, tipo, barrio, banios, habitac) %>% summary()
print(resumen_cualitativas)
resumen_por_zona <- vivienda_faltantes_nuevo %>% group_by(zona) %>% summarise( Media_Precio = mean(preciom, na.rm = TRUE), Moda_Precio = as.numeric(names(sort(table(preciom), decreasing = TRUE)[1])), Mediana_Precio = median(preciom, na.rm = TRUE), Desviacion_Precio = sd(preciom, na.rm = TRUE), Max_Precio = max(preciom, na.rm = TRUE), Min_Precio = min(preciom, na.rm = TRUE), )
print(resumen_por_zona)
resumen_por_zona <- vivienda_faltantes_nuevo %>% group_by(zona) %>% summarise( Media_Area = mean(areaconst, na.rm = TRUE), Moda_Area = as.numeric(names(sort(table(areaconst), decreasing = TRUE)[1])), Mediana_Area = median(areaconst, na.rm = TRUE), Desviacion_Area = sd(areaconst, na.rm = TRUE), Max_Area = max(areaconst, na.rm = TRUE), Min_Area = min(areaconst, na.rm = TRUE) )
print(resumen_por_zona)
tabla_frecuencias <- vivienda_faltantes_nuevo %>% count(tipo, banios, name = “Frecuencia”)
print(tabla_frecuencias)
ggplot(vivienda_faltantes_nuevo, aes(x = banios, fill = tipo)) + geom_bar()+ coord_flip()+ labs(title = “Distribucion de viviendas por Tipo/Baños”, x = “Cantidad de baños”, y = “Cantidad”)
ggplot(vivienda_faltantes_nuevo, aes(x = tipo, fill = zona)) + geom_bar(position = “dodge”) + labs(title = “Distribucion de viviendas por Tipo/Zona”, x = “Tipo”, y = “Cantidad”)
ggplot(vivienda_faltantes_nuevo, aes(x = estrato)) + geom_bar(fill = “skyblue”) + labs(title = “Distribucion de viviendas por estrato”, x = “Estrato”, y = “Cantidad”)
ggplot(vivienda_faltantes_nuevo, aes(x = habitac)) + geom_bar(fill = “orange”) + labs(title = “Distribucion de viviendas por Habitaciones”, x = “Cantidad de Habitaciones”, y = “Cantidad”)
ggplot(vivienda_faltantes_nuevo, aes(x = areaconst, y = preciom)) + geom_point(color = “blue”) + geom_smooth(method = “lm”,color = ‘red’)
ggplot(vivienda_faltantes_nuevo, aes(x = zona, fill=estrato)) + geom_bar(position = “dodge”) + coord_flip()+ labs(title = “Distribucion de viviendas por Tipo/Zona”, x = “Tipo de Habitaciones”, y = “Cantidad”)
ggplot(vivienda_faltantes_nuevo, aes(x = areaconst, y = preciom, color = zona)) + geom_point() + geom_smooth(method = “lm”)