El presente informe ofrece un análisis exhaustivo de los datos de bienes raíces en la ciudad de Cali, con el propósito de brindarles a ustedes directivos de la empresa B&C una comprensión profunda de las tendencias del mercado inmobiliario y las preferencias de los compradores. Mediante el empleo de diversas técnicas estadísticas y herramientas de visualización, se exploraron patrones y relaciones entre las variables clave que influencian el mercado de viviendas en Cali.
El objetivo principal de este informe es proporcionar a los directivos de la empresa B&C un análisis comprensivo y detallado de los datos del mercado inmobiliario en Cali. A través de una combinación de técnicas estadísticas y visualización, se persiguen los siguientes objetivos:
A través de la consecución de estos objetivos, este informe busca brindar una visión integral y fundamentada del mercado inmobiliario en Cali, apoyando a B&C en la toma de decisiones estratégicas y en la identificación de oportunidades en este competitivo sector.
Se utilizaron los datos proporcionados por B&C, los cuales incluyen información detallada sobre propiedades, como tipo, zona,estrato, precio, área construida, entre otros. Se realizó un análisis estadístico descriptivo utilizando herramientas de programación en R Studio.Se utilizaron los siguientes métodos:
Análisis Descriptivo: Se calcularon medidas estadísticas como medias, medianas y desviaciones estándar para describir características numéricas.
Visualización Gráfica: Se generaron histogramas, diagramas de cajas y bigotes, gráficos de barras y gráficos de dispersión para visualizar patrones y relaciones.
Comparación de Variables: Se compararon variables como zonas, estratos y tipos de viviendas para identificar tendencias y diferencias.
Tratamiento de Datos Faltantes: Se implementaron técnicas para manejar los valores faltantes en los datos.
Segmentación del Mercado: Se segmentó el mercado en función de variables clave para adaptar estrategias.
# Configurar un repositorio de CRAN
options(repos = c(CRAN = "https://cran.rstudio.com"))
# Instalar el paquete dplyr
install.packages("dplyr")
## Installing package into 'C:/Users/LAURA/AppData/Local/R/win-library/4.3'
## (as 'lib' is unspecified)
## package 'dplyr' successfully unpacked and MD5 sums checked
## Warning: cannot remove prior installation of package 'dplyr'
## Warning in file.copy(savedcopy, lib, recursive = TRUE): problema al copiar
## C:\Users\LAURA\AppData\Local\R\win-library\4.3\00LOCK\dplyr\libs\x64\dplyr.dll
## a C:\Users\LAURA\AppData\Local\R\win-library\4.3\dplyr\libs\x64\dplyr.dll:
## Permission denied
## Warning: restored 'dplyr'
##
## The downloaded binary packages are in
## C:\Users\LAURA\AppData\Local\Temp\RtmpCI8ikG\downloaded_packages
# Instalar paquetes
install.packages("dplyr")
## Installing package into 'C:/Users/LAURA/AppData/Local/R/win-library/4.3'
## (as 'lib' is unspecified)
## package 'dplyr' successfully unpacked and MD5 sums checked
## Warning: cannot remove prior installation of package 'dplyr'
## Warning in file.copy(savedcopy, lib, recursive = TRUE): problema al copiar
## C:\Users\LAURA\AppData\Local\R\win-library\4.3\00LOCK\dplyr\libs\x64\dplyr.dll
## a C:\Users\LAURA\AppData\Local\R\win-library\4.3\dplyr\libs\x64\dplyr.dll:
## Permission denied
## Warning: restored 'dplyr'
##
## The downloaded binary packages are in
## C:\Users\LAURA\AppData\Local\Temp\RtmpCI8ikG\downloaded_packages
install.packages("ggplot2")
## Installing package into 'C:/Users/LAURA/AppData/Local/R/win-library/4.3'
## (as 'lib' is unspecified)
##
## There is a binary version available but the source version is later:
## binary source needs_compilation
## ggplot2 3.4.2 3.4.3 FALSE
## installing the source package 'ggplot2'
install.packages("kableExtra")
## Installing package into 'C:/Users/LAURA/AppData/Local/R/win-library/4.3'
## (as 'lib' is unspecified)
## package 'kableExtra' successfully unpacked and MD5 sums checked
##
## The downloaded binary packages are in
## C:\Users\LAURA\AppData\Local\Temp\RtmpCI8ikG\downloaded_packages
install.packages("ggpubr")
## Installing package into 'C:/Users/LAURA/AppData/Local/R/win-library/4.3'
## (as 'lib' is unspecified)
## package 'ggpubr' successfully unpacked and MD5 sums checked
##
## The downloaded binary packages are in
## C:\Users\LAURA\AppData\Local\Temp\RtmpCI8ikG\downloaded_packages
install.packages("patchwork")
## Installing package into 'C:/Users/LAURA/AppData/Local/R/win-library/4.3'
## (as 'lib' is unspecified)
##
## There is a binary version available but the source version is later:
## binary source needs_compilation
## patchwork 1.1.2 1.1.3 FALSE
## installing the source package 'patchwork'
install.packages("ggdist")
## Installing package into 'C:/Users/LAURA/AppData/Local/R/win-library/4.3'
## (as 'lib' is unspecified)
## package 'ggdist' successfully unpacked and MD5 sums checked
##
## The downloaded binary packages are in
## C:\Users\LAURA\AppData\Local\Temp\RtmpCI8ikG\downloaded_packages
install.packages("forcats")
## Installing package into 'C:/Users/LAURA/AppData/Local/R/win-library/4.3'
## (as 'lib' is unspecified)
## package 'forcats' successfully unpacked and MD5 sums checked
##
## The downloaded binary packages are in
## C:\Users\LAURA\AppData\Local\Temp\RtmpCI8ikG\downloaded_packages
install.packages("carData")
## Installing package into 'C:/Users/LAURA/AppData/Local/R/win-library/4.3'
## (as 'lib' is unspecified)
## package 'carData' successfully unpacked and MD5 sums checked
##
## The downloaded binary packages are in
## C:\Users\LAURA\AppData\Local\Temp\RtmpCI8ikG\downloaded_packages
install.packages("devtools")
## Installing package into 'C:/Users/LAURA/AppData/Local/R/win-library/4.3'
## (as 'lib' is unspecified)
## package 'devtools' successfully unpacked and MD5 sums checked
##
## The downloaded binary packages are in
## C:\Users\LAURA\AppData\Local\Temp\RtmpCI8ikG\downloaded_packages
devtools::install_github("dgonxalex80/paqueteMET")
## Skipping install of 'paqueteMET' from a github remote, the SHA1 (624823ee) has not changed since last install.
## Use `force = TRUE` to force installation
# Cargar paquetes
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2)
library(kableExtra)
##
## Attaching package: 'kableExtra'
## The following object is masked from 'package:dplyr':
##
## group_rows
library(ggpubr)
library(patchwork)
library(ggdist)
library(forcats)
library(paqueteMET)
data("vivienda_faltantes")
El manejo de valores faltantes en los datos es una parte crucial del análisis de datos
# Identificación de valores faltantes por variable
valores_faltantes <- vivienda_faltantes %>%
summarise_all(~ sum(is.na(.)))
# Muestra la cantidad de valores faltantes por variable
print(valores_faltantes)
## # A tibble: 1 × 13
## id zona piso estrato preciom areaconst parquea banios habitac tipo
## <int> <int> <int> <int> <int> <int> <int> <int> <int> <int>
## 1 3 3 2641 3 2 3 1606 3 3 3
## # ℹ 3 more variables: barrio <int>, longitud <int>, latitud <int>
# Cálculo de la cantidad total de valores faltantes
total_valores_faltantes <- sum(is.na(vivienda_faltantes))
Se puede observar que hay 4.279 datos faltantes en la base de datos.
# Análisis de datos faltantes de las variables "piso" y "parquea"
datos_faltantes_piso_parquea <- vivienda_faltantes %>%
select(piso, parquea) %>%
summarise(
cant_faltantes_piso = sum(is.na(piso)),
cant_faltantes_parquea = sum(is.na(parquea)),
porcentaje_faltantes_piso = (cant_faltantes_piso / n()) * 100,
porcentaje_faltantes_parquea = (cant_faltantes_parquea / n()) * 100)
# Muestra el análisis de datos faltantes de "piso" y "parquea", el total de datos faltantes y el porcentaje total
print(c("Total de Valores Faltantes:", total_valores_faltantes))
## [1] "Total de Valores Faltantes:" "4279"
print(datos_faltantes_piso_parquea)
## # A tibble: 1 × 4
## cant_faltantes_piso cant_faltantes_parquea porcentaje_faltantes_piso
## <int> <int> <dbl>
## 1 2641 1606 31.7
## # ℹ 1 more variable: porcentaje_faltantes_parquea <dbl>
La variable piso tiene 2641 datos faltantes, que equivale a un 31.70%.
La variable parquea tiene 1606 de datos faltantes. que equivale a un 19.30%
# Imputación de valores faltantes en la variable "piso" con la media de la variable
media_piso <- mean(vivienda_faltantes $piso, na.rm = TRUE)
# Calculo de la media de la variable "piso"
vivienda_faltantes_imputado <- vivienda_faltantes %>%
mutate(piso = ifelse(is.na(piso), media_piso, piso))
# Muestra el conjunto de datos con valores faltantes imputados
print(vivienda_faltantes_imputado)
## # A tibble: 8,330 × 13
## id zona piso estrato preciom areaconst parquea banios habitac tipo
## <dbl> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <chr>
## 1 8312 Zona Oeste 4 6 1300 318 2 4 2 Apar…
## 2 8311 Zona Oeste 1 6 480 300 1 4 4 Casa
## 3 8307 Zona Oeste 3.77 5 1200 800 4 7 5 Casa
## 4 8296 Zona Sur 2 3 220 150 1 2 4 Casa
## 5 8297 Zona Oeste 3.77 5 330 112 2 4 3 Casa
## 6 8298 Zona Sur 3.77 5 1350 390 8 10 10 Casa
## 7 8299 Zona Sur 2 6 305 125 2 3 3 Apar…
## 8 8300 Zona Oeste 3.77 5 480 280 4 4 4 Apar…
## 9 8286 Zona Sur 3.77 5 275 74 1 2 3 Apar…
## 10 8287 Zona Sur 2 5 285 120 2 4 3 Apar…
## # ℹ 8,320 more rows
## # ℹ 3 more variables: barrio <chr>, longitud <dbl>, latitud <dbl>
Impacto en el análisis: ya que los valores faltantes de la variabe piso son una proporción significativa de los datos (31.70%), omitirlos por completo podría afectar la representatividad del análisis. Por ende, en este caso, se decidió imputar los valores faltantes de la variable piso con la media.
##” Eliminación de Observaciones
# Eliminar filas con valores faltantes en cualquier variable
vivienda_sin_faltantes <- na.omit(vivienda_faltantes_imputado)
# Muestra el conjunto de datos sin filas con valores faltantes
print(vivienda_sin_faltantes)
## # A tibble: 6,724 × 13
## id zona piso estrato preciom areaconst parquea banios habitac tipo
## <dbl> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <chr>
## 1 8312 Zona Oeste 4 6 1300 318 2 4 2 Apar…
## 2 8311 Zona Oeste 1 6 480 300 1 4 4 Casa
## 3 8307 Zona Oeste 3.77 5 1200 800 4 7 5 Casa
## 4 8296 Zona Sur 2 3 220 150 1 2 4 Casa
## 5 8297 Zona Oeste 3.77 5 330 112 2 4 3 Casa
## 6 8298 Zona Sur 3.77 5 1350 390 8 10 10 Casa
## 7 8299 Zona Sur 2 6 305 125 2 3 3 Apar…
## 8 8300 Zona Oeste 3.77 5 480 280 4 4 4 Apar…
## 9 8286 Zona Sur 3.77 5 275 74 1 2 3 Apar…
## 10 8287 Zona Sur 2 5 285 120 2 4 3 Apar…
## # ℹ 6,714 more rows
## # ℹ 3 more variables: barrio <chr>, longitud <dbl>, latitud <dbl>
Sesgo potencial: Imputar con la media todas las variables puede introducir un sesgo si los valores faltantes no son MCAR o si hay alguna relación sistemática entre los valores faltantes y otras variables. Este sesgo podría afectar la validez de los resultados, por ende se decide eliminar el resto de variables faltantes.
# Estandarizar los valores de la variable "tipo"
vivienda_sin_faltantes <- vivienda_sin_faltantes %>% mutate(tipo = recode(tipo, "Apartamento" = "apartamento", "APARTAMENTO" = "apartamento", "apto" = "apartamento", "Casa" = "casa", "casa" = "casa", "CASA" = "casa", "NA" = "NA"))
# Verificar los cambios de la variable tipo
unique(vivienda_sin_faltantes$tipo)
## [1] "apartamento" "casa"
head (vivienda_sin_faltantes)
## # A tibble: 6 × 13
## id zona piso estrato preciom areaconst parquea banios habitac tipo
## <dbl> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <chr>
## 1 8312 Zona Oeste 4 6 1300 318 2 4 2 apart…
## 2 8311 Zona Oeste 1 6 480 300 1 4 4 casa
## 3 8307 Zona Oeste 3.77 5 1200 800 4 7 5 casa
## 4 8296 Zona Sur 2 3 220 150 1 2 4 casa
## 5 8297 Zona Oeste 3.77 5 330 112 2 4 3 casa
## 6 8298 Zona Sur 3.77 5 1350 390 8 10 10 casa
## # ℹ 3 more variables: barrio <chr>, longitud <dbl>, latitud <dbl>
La base datos cuenta con datos en forma de texto que contienen mayúsculas o combinación con minúsculas, por tanto, se decide cambiar todas las opciones de la variable tipo a minúscula, de tal forma que se encuentran solo como “casa” y “apartamento”.
# muestra la base de datos vivienda con las columnas seleccionadas
vivienda_faltantes [, c(2, 4, 5, 6, 9, 10)]
## # A tibble: 8,330 × 6
## zona estrato preciom areaconst habitac tipo
## <chr> <dbl> <dbl> <dbl> <dbl> <chr>
## 1 Zona Oeste 6 1300 318 2 Apartamento
## 2 Zona Oeste 6 480 300 4 Casa
## 3 Zona Oeste 5 1200 800 5 Casa
## 4 Zona Sur 3 220 150 4 Casa
## 5 Zona Oeste 5 330 112 3 Casa
## 6 Zona Sur 5 1350 390 10 Casa
## 7 Zona Sur 6 305 125 3 Apartamento
## 8 Zona Oeste 5 480 280 4 Apartamento
## 9 Zona Sur 5 275 74 3 Apartamento
## 10 Zona Sur 5 285 120 3 Apartamento
## # ℹ 8,320 more rows
La base de datos contiene variables que no son relevantes para el análisis de información, por ende hemos decidido filtrar dichos campos para mayor objetividad. Se trabajo con las variables: preciom, areaconst, estrato, habitac, zona y tipo.
De las variables seleccionas 4 son de valor numérico, las cuales son:
De las variables seleccionas 2 son de valor categórico, las cuales son:
# Gráfico de caja y bigotes para analizar el precio de viviendas en diferentes zonas
ggplot(vivienda_sin_faltantes, aes(x = zona, y = preciom, fill = zona)) +
geom_boxplot() +
labs(x = "Zona", y = "Precio de Vivienda", title = "Análisis de Precio de Viviendas por Zona") +
theme_minimal() +
theme(legend.position = "none")
En este gráfico, cada caja representa la distribución de los precios de las viviendas en una zona específica de Cali. Los extremos de las cajas representan el primer y tercer cuartil (Q1 y Q3), mientras que la línea dentro de la caja es la mediana. Los “bigotes” se extienden hasta los valores que están dentro de 1.5 veces el rango intercuartil (IQR) desde los cuartiles. Los puntos fuera de los bigotes son los valores atípicos.
Las medianas de los precios de viviendas en las zonas Centro, Norte y Sur son similares entre sí y son menores en comparación con la Zona Oeste. Los precios más bajos se encuentran en la Zona Oriente.
Este análisis sugiere que, a pesar de que las medianas de precios son similares en las zonas Centro, Norte y Sur, las viviendas en la Zona Oeste tienen precios más altos en promedio. Además, el hecho de que los precios más bajos se encuentren en la Zona Oriente indica que esta zona podría ser un mercado más asequible en términos de vivienda.
Basándonos en estos resultados se sugiere:
Segmentación de Mercado: Pueden considerar que las zonas Centro, Norte y Sur atraen a un público con niveles de ingresos similares y preferencias de vivienda comparables. Pueden desarrollar estrategias de marketing que se centren en las características únicas de cada zona para atraer a diferentes segmentos de compradores potenciales.
Diferenciación de Precios: Dado que los precios son más bajos en la Zona Oriente, pueden ajustar las estrategias de precios para esta área. Ofrecer viviendas más asequibles en esta zona podría atraer a compradores que buscan opciones más económicas.
Enfoque en la Zona Oeste: ya que las viviendas en la Zona Oeste son más costosas en promedio, podrían desarrollar estrategias de marketing que destaquen los aspectos exclusivos y lujosos de esta zona para atraer a compradores con un presupuesto más alto.
# Tabla de frecuencia de tipos de viviendas
tabla_tipo <- table(vivienda_sin_faltantes$tipo)
# Gráfico de barras para analizar tipos de viviendas más vendidos
ggplot(data = vivienda_sin_faltantes, aes(x = reorder(tipo, -tabla_tipo), fill = tipo)) +
geom_bar() +
labs(x = "Tipo de Vivienda", y = "Frecuencia", title = "Tipos de Viviendas mas Vendidos") +
theme_minimal() +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
## Warning in split.default(X, group): largo de datos no es múltiplo de la
## variable de separación
## Warning in split.default(X, group): largo de datos no es múltiplo de la
## variable de separación
En este gráfico, cada barra representa la frecuencia de un tipo de vivienda vendido en Cali. Los tipos de vivienda están en el eje x (apartamento;casa), y la frecuencia se muestra en el eje y. Cada color de barra representa un tipo de vivienda diferente.
Los apartamentos son los tipos de vivienda más vendidos en Cali, con una frecuencia significativamente alta. Esto sugiere que hay una demanda considerable de unidades de vivienda en forma de apartamentos en la ciudad.
Dado que los apartamentos son los tipos de vivienda más vendidos, podrían desarrollar estrategias de marketing específicas para satisfacer esta demanda. Esto podría incluir promociones, características destacadas de apartamentos y opciones de financiamiento atractivas para los compradores. También es importante mantener una oferta diversificada que incluya opciones de casas y otros tipos de viviendas como chalets, dúplex, etc. Esto asegurará que están atendiendo a diferentes segmentos de compradores con diferentes preferencias y necesidades.
Las casas también tienen una frecuencia considerable en las ventas de viviendas. Aunque un poco menos frecuentes que los apartamentos, las casas todavía representan una parte importante del mercado de viviendas.
# Histograma de la variable estrato
ggplot(data = vivienda_sin_faltantes, aes(x = estrato)) +
geom_histogram(binwidth = 1, fill = "blue", color = "black") +
labs(x = "Estrato", y = "Frecuencia", title = "Histograma de Estrato en Viviendas") +
theme_minimal()
En este histograma, el eje x representa los valores de estrato y el eje y muestra la frecuencia de esos valores en los intervalos. Cada barra en el histograma representa la cantidad de viviendas que caen dentro de un rango de estrato específico.
El histograma muestra la distribución de los estratos en las viviendas en Cali. Se puede observar que el estrato más común es el 5, seguido por el estrato 6 y el estrato 4.
El estrato 3 es el menos comun, lo cual sugiere que hay menos viviendas en este estrato, la ausencia de estratos 1 y 2 puede ser una oportunidad para explorar la posibilidad de desarrollar ofertas específicas para estos estratos en el futuro.
La mayoría de las viviendas se encuentran en los estratos altos (5, 6 y 4), lo que podría reflejar la composición general del mercado de viviendas en Cali.
Basándonos en la distribución de estratos, podrían considerar dirigir los esfuerzos de marketing y desarrollo de productos hacia los estratos más comunes (5, 6 y 4), ya que ahí se encuentra la mayor concentración de viviendas.
Aunque el estrato 3 es el menos comun, podría representar oportunidades de mercado nicho. Dependiendo de la estrategia, podrían explorar cómo atraer a compradores interesados en viviendas de estrato medio.
# Gráfico de barras para comparar los datos de la variable "habitac"
ggplot(data = vivienda_sin_faltantes, aes(x = factor(habitac))) +
geom_bar(fill = "blue") +
labs(x = "Numero de Habitaciones", y = "Cantidad de Propiedades",
title = "Comparacion de Propiedades por Numero de Habitaciones en Cali") +
theme(axis.text.x = element_text(angle = 0))
En este gráfico, cada barra representa la cantidad de propiedades que tienen un cierto número de habitaciones. Estos son los resultados basados en el gráfico:
El hecho de que 3 habitaciones tengan la mayor cantidad de propiedades sugiere que este tipo de viviendas es altamente demandado en el mercado. Puede ser una opción popular para familias o grupos más grandes que buscan espacio adicional.
Dado que las propiedades con 3 habitaciones son las más comunes, también es probable que haya más competencia en este segmento del mercado. Esto podría influir la definición de precios, estrategias de marketing y servicios para destacar en un mercado saturado.
Las propiedades con 4 habitaciones también son populares, lo que sugiere que hay una demanda considerable para viviendas más grandes. Esto podría representar familias más grandes o personas que desean espacio adicional para oficinas en el hogar u otros fines.
Las propiedades con 2 habitaciones tienen una cantidad significativa, lo que puede indicar una demanda de opciones más pequeñas y asequibles. Esto podría ser una oportunidad para atender a un mercado más amplio que busca opciones más compactas.
Las propiedades con 5 habitaciones o más pueden representar opciones de lujo o casas más grandes. Aunque su cantidad es menor, podrían tener un mercado específico de compradores que buscan espacios amplios y lujosos.
Podrían considerar adquirir más propiedades con 3 habitaciones debido a la alta demanda, pero también podrían diversificar su cartera para incluir opciones con 4 habitaciones y 2 habitaciones para abarcar diferentes segmentos del mercado.
# Gráfico de barras para comparar el tipo de vivienda y el estrato
ggplot(data = vivienda_sin_faltantes, aes(x = tipo, fill = factor(estrato))) +
geom_bar(position = "dodge") +
labs(x = "Tipo de Vivienda", y = "Cantidad",
title = "Comparacion de Tipo de Vivienda por Estrato en Cali") +
theme(axis.text.x = element_text(angle = 45, hjust = 1)) +
scale_fill_discrete(name = "Estrato")
De acuerdo al gráfico de barras, podemos hacer las siguientes observaciones:
En ambos tipos de vivienda (casa y apartamento), la mayoría de las propiedades se encuentran en los estratos 5 y 6. Esto podría indicar una preferencia por propiedades de estratos altos en el mercado inmobiliario de Cali.
Aunque los estratos 5 y 6 son populares en ambos tipos de vivienda, los apartamentos tienen una proporción mayor en el estrato 5 en comparación con las casas. Esto podría sugerir que algunas personas prefieren apartamentos en estratos altos.
Una observación importante es que no hay propiedades en los estratos 1 y 2 para ninguno de los dos tipos de vivienda. Esto podría deberse a varias razones, como características de la zona, demanda del mercado o políticas de construcción.
# Gráfico de dispersión para comparar el área construida con el precio
ggplot(data = vivienda_sin_faltantes, aes(x = areaconst, y = preciom)) +
geom_point() +
labs(x = "Area Construida", y = "Precio",
title = "Comparacion de Area Construida vs Precio en Cali") +
theme_minimal()
La mayoría de los puntos se concentran en la zona inferior izquierda del gráfico, esto podría indicar a medida que el área construida disminuye, es probable que el precio también disminuya. Esto es coherente con la intuición común en el mercado inmobiliario: propiedades más pequeñas tienden a tener precios más bajos. Hay puntos que no se encuentran concentrados, los cuales pueden representar propiedades excepcionales con áreas construidas más grandes y precios más altos.
Este patrón sugiere que el área construida tiene un efecto considerable en el precio. Sin embargo, no es la unica varibale determinante para establecer el precio, es necesario tener en cuenta el tipo de vivienda, zona, estrato, entre otras.
Los análisis de precios, zonas, estratos y tipos de viviendas han revelado tendencias en el mercado inmobiliario de Cali. Por ejemplo, se observa que la zona oeste tiende a tener precios más altos y que las viviendas de estrato 5 son predominantes en ambos tipos de viviendas (casa y apartamento). Esto podría indicar preferencias específicas en cuanto a ubicación y estrato.
El análisis del gráfico de dispersión entre el área construida y el precio sugiere que, en general, existe una tendencia a que propiedades con áreas construidas más pequeñas tengan precios más bajos. Esta relación puede ser útil para evaluar la influencia del tamaño de la propiedad en su valor. Sin embargo, es importante considerar que esta relación puede no ser lineal y que otros factores también podrían estar influyendo en los precios.
El análisis de características más buscadas, como el número de habitaciones, baños, área construida y parqueaderos, proporciona una visión de las preferencias de los compradores. Las propiedades con 3 habitaciones y 2 baños parecen ser las más populares, lo que podría ser relevante para la estrategia de comercialización. Esto sugiere que ajustar las propiedades para incluir estas características podría atraer a más compradores.
La comparación de variables como tipo de vivienda y estrato, así como el análisis del precio en función del número de habitaciones, brinda información valiosa sobre cómo ciertos factores pueden influir en el valor de una propiedad. Esto podría ser utilizado para segmentar el mercado y ajustar estrategias de marketing. Por ejemplo, se podría enfocar la publicidad en viviendas de estrato 5, que parecen ser más demandadas.
Los análisis resaltan que las propiedades de estrato 5 son populares en ambos tipos de viviendas. Además, la zona oeste presenta precios más altos en promedio. Estas tendencias pueden influir en las decisiones de la empresa B&C en términos de ubicación y estrategias de precios.
Existe una tendencia visual de que propiedades con áreas construidas más pequeñas tienden a tener precios más bajos. Esta relación puede ser utilizada para orientar a los compradores sobre el impacto del tamaño en el precio.
Las propiedades con 3 habitaciones y 2 baños son las más buscadas, lo que sugiere que ofrecer propiedades con estas características podría ser una estrategia efectiva para atraer a más compradores.
Los análisis de comparación de variables permiten segmentar el mercado y adaptar la oferta de la empresa a las preferencias identificadas. Por ejemplo, podría haber un enfoque especial en las viviendas de estrato 5 y con ciertas características para atraer a los compradores objetivo.