Introducción

El presente informe ofrece un análisis exhaustivo de los datos de bienes raíces en la ciudad de Cali, con el propósito de brindarles a ustedes directivos de la empresa B&C una comprensión profunda de las tendencias del mercado inmobiliario y las preferencias de los compradores. Mediante el empleo de diversas técnicas estadísticas y herramientas de visualización, se exploraron patrones y relaciones entre las variables clave que influencian el mercado de viviendas en Cali.

Objetivos

El objetivo principal de este informe es proporcionar a los directivos de la empresa B&C un análisis comprensivo y detallado de los datos del mercado inmobiliario en Cali. A través de una combinación de técnicas estadísticas y visualización, se persiguen los siguientes objetivos:

Identificar Patrones de Mercado: Analizar las tendencias y patrones en los precios y características de las propiedades para comprender la dinámica del mercado inmobiliario en Cali.
Reconocer Preferencias del Mercado: Determinar las características específicas de las viviendas que son más atractivas para los compradores, como el número de habitaciones, estrato y ubicación.
Segmentar Audiencia y Proponer Estrategias: Segmentar el mercado en grupos basados en variables clave y proponer estrategias de marketing y precios que se adapten a las preferencias de estos segmentos.
Explorar Relaciones entre Variables: Evaluar las relaciones entre las características de las viviendas, como el área construida y el número de habitaciones, y su influencia en los precios.
Generar Recomendaciones Accionables: Proponer recomendaciones concretas basadas en los resultados del análisis, que permitan a la empresa B&C tomar decisiones informadas sobre su estrategia de mercado.

A través de la consecución de estos objetivos, este informe busca brindar una visión integral y fundamentada del mercado inmobiliario en Cali, apoyando a B&C en la toma de decisiones estratégicas y en la identificación de oportunidades en este competitivo sector.

Métodos

Se utilizaron los datos proporcionados por B&C, los cuales incluyen información detallada sobre propiedades, como tipo, zona,estrato, precio, área construida, entre otros. Se realizó un análisis estadístico descriptivo utilizando herramientas de programación en R Studio.Se utilizaron los siguientes métodos:

Análisis Descriptivo: Se calcularon medidas estadísticas como medias, medianas y desviaciones estándar para describir características numéricas.

Visualización Gráfica: Se generaron histogramas, diagramas de cajas y bigotes, gráficos de barras y gráficos de dispersión para visualizar patrones y relaciones.

Comparación de Variables: Se compararon variables como zonas, estratos y tipos de viviendas para identificar tendencias y diferencias.

Tratamiento de Datos Faltantes: Se implementaron técnicas para manejar los valores faltantes en los datos.

Segmentación del Mercado: Se segmentó el mercado en función de variables clave para adaptar estrategias.

# Configurar un repositorio de CRAN
options(repos = c(CRAN = "https://cran.rstudio.com"))

# Instalar el paquete dplyr
install.packages("dplyr")

## Installing package into 'C:/Users/LAURA/AppData/Local/R/win-library/4.3'
## (as 'lib' is unspecified)

## package 'dplyr' successfully unpacked and MD5 sums checked

## Warning: cannot remove prior installation of package 'dplyr'

## Warning in file.copy(savedcopy, lib, recursive = TRUE): problema al copiar
## C:\Users\LAURA\AppData\Local\R\win-library\4.3\00LOCK\dplyr\libs\x64\dplyr.dll
## a C:\Users\LAURA\AppData\Local\R\win-library\4.3\dplyr\libs\x64\dplyr.dll:
## Permission denied

## Warning: restored 'dplyr'

## 
## The downloaded binary packages are in
##  C:\Users\LAURA\AppData\Local\Temp\RtmpCI8ikG\downloaded_packages

# Instalar paquetes
install.packages("dplyr")

## Installing package into 'C:/Users/LAURA/AppData/Local/R/win-library/4.3'
## (as 'lib' is unspecified)

## package 'dplyr' successfully unpacked and MD5 sums checked

## Warning: cannot remove prior installation of package 'dplyr'

## Warning in file.copy(savedcopy, lib, recursive = TRUE): problema al copiar
## C:\Users\LAURA\AppData\Local\R\win-library\4.3\00LOCK\dplyr\libs\x64\dplyr.dll
## a C:\Users\LAURA\AppData\Local\R\win-library\4.3\dplyr\libs\x64\dplyr.dll:
## Permission denied

## Warning: restored 'dplyr'

## 
## The downloaded binary packages are in
##  C:\Users\LAURA\AppData\Local\Temp\RtmpCI8ikG\downloaded_packages

install.packages("ggplot2")

## Installing package into 'C:/Users/LAURA/AppData/Local/R/win-library/4.3'
## (as 'lib' is unspecified)

## 
##   There is a binary version available but the source version is later:
##         binary source needs_compilation
## ggplot2  3.4.2  3.4.3             FALSE

## installing the source package 'ggplot2'

install.packages("kableExtra")

## Installing package into 'C:/Users/LAURA/AppData/Local/R/win-library/4.3'
## (as 'lib' is unspecified)

## package 'kableExtra' successfully unpacked and MD5 sums checked
## 
## The downloaded binary packages are in
##  C:\Users\LAURA\AppData\Local\Temp\RtmpCI8ikG\downloaded_packages

install.packages("ggpubr")

## Installing package into 'C:/Users/LAURA/AppData/Local/R/win-library/4.3'
## (as 'lib' is unspecified)

## package 'ggpubr' successfully unpacked and MD5 sums checked
## 
## The downloaded binary packages are in
##  C:\Users\LAURA\AppData\Local\Temp\RtmpCI8ikG\downloaded_packages

install.packages("patchwork")

## Installing package into 'C:/Users/LAURA/AppData/Local/R/win-library/4.3'
## (as 'lib' is unspecified)

## 
##   There is a binary version available but the source version is later:
##           binary source needs_compilation
## patchwork  1.1.2  1.1.3             FALSE

## installing the source package 'patchwork'

install.packages("ggdist")

## Installing package into 'C:/Users/LAURA/AppData/Local/R/win-library/4.3'
## (as 'lib' is unspecified)

## package 'ggdist' successfully unpacked and MD5 sums checked
## 
## The downloaded binary packages are in
##  C:\Users\LAURA\AppData\Local\Temp\RtmpCI8ikG\downloaded_packages

install.packages("forcats")

## Installing package into 'C:/Users/LAURA/AppData/Local/R/win-library/4.3'
## (as 'lib' is unspecified)

## package 'forcats' successfully unpacked and MD5 sums checked
## 
## The downloaded binary packages are in
##  C:\Users\LAURA\AppData\Local\Temp\RtmpCI8ikG\downloaded_packages

install.packages("carData")

## Installing package into 'C:/Users/LAURA/AppData/Local/R/win-library/4.3'
## (as 'lib' is unspecified)

## package 'carData' successfully unpacked and MD5 sums checked
## 
## The downloaded binary packages are in
##  C:\Users\LAURA\AppData\Local\Temp\RtmpCI8ikG\downloaded_packages

install.packages("devtools")

## Installing package into 'C:/Users/LAURA/AppData/Local/R/win-library/4.3'
## (as 'lib' is unspecified)

## package 'devtools' successfully unpacked and MD5 sums checked
## 
## The downloaded binary packages are in
##  C:\Users\LAURA\AppData\Local\Temp\RtmpCI8ikG\downloaded_packages

devtools::install_github("dgonxalex80/paqueteMET")

## Skipping install of 'paqueteMET' from a github remote, the SHA1 (624823ee) has not changed since last install.
##   Use `force = TRUE` to force installation

# Cargar paquetes
library(dplyr)

## 
## Attaching package: 'dplyr'

## The following objects are masked from 'package:stats':
## 
##     filter, lag

## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

library(ggplot2)
library(kableExtra)

## 
## Attaching package: 'kableExtra'

## The following object is masked from 'package:dplyr':
## 
##     group_rows

library(ggpubr)
library(patchwork)
library(ggdist)
library(forcats)
library(paqueteMET)
data("vivienda_faltantes")

Manejo de valores faltantes

El manejo de valores faltantes en los datos es una parte crucial del análisis de datos

Identificación de Valores Faltantes

# Identificación de valores faltantes por variable
valores_faltantes <- vivienda_faltantes %>%
  summarise_all(~ sum(is.na(.)))

# Muestra la cantidad de valores faltantes por variable
print(valores_faltantes)

## # A tibble: 1 × 13
##      id  zona  piso estrato preciom areaconst parquea banios habitac  tipo
##   <int> <int> <int>   <int>   <int>     <int>   <int>  <int>   <int> <int>
## 1     3     3  2641       3       2         3    1606      3       3     3
## # ℹ 3 more variables: barrio <int>, longitud <int>, latitud <int>

# Cálculo de la cantidad total de valores faltantes
total_valores_faltantes <- sum(is.na(vivienda_faltantes))

Se puede observar que hay 4.279 datos faltantes en la base de datos.

Análisis de Patrones

# Análisis de datos faltantes de las variables "piso" y "parquea"
datos_faltantes_piso_parquea <- vivienda_faltantes  %>%
  select(piso, parquea) %>%
  summarise(
    cant_faltantes_piso = sum(is.na(piso)),
    cant_faltantes_parquea = sum(is.na(parquea)),
    porcentaje_faltantes_piso = (cant_faltantes_piso / n()) * 100,
    porcentaje_faltantes_parquea = (cant_faltantes_parquea / n()) * 100)


# Muestra el análisis de datos faltantes de "piso" y "parquea", el total de datos faltantes y el porcentaje total
print(c("Total de Valores Faltantes:", total_valores_faltantes))

## [1] "Total de Valores Faltantes:" "4279"

print(datos_faltantes_piso_parquea)

## # A tibble: 1 × 4
##   cant_faltantes_piso cant_faltantes_parquea porcentaje_faltantes_piso
##                 <int>                  <int>                     <dbl>
## 1                2641                   1606                      31.7
## # ℹ 1 more variable: porcentaje_faltantes_parquea <dbl>

La variable piso tiene 2641 datos faltantes, que equivale a un 31.70%.

La variable parquea tiene 1606 de datos faltantes. que equivale a un 19.30%

Imputación de Valores Faltantes

# Imputación de valores faltantes en la variable "piso" con la media de la variable
media_piso <- mean(vivienda_faltantes $piso, na.rm = TRUE) 

# Calculo de la media de la variable "piso"
vivienda_faltantes_imputado <- vivienda_faltantes %>%
  mutate(piso = ifelse(is.na(piso), media_piso, piso))

# Muestra el conjunto de datos con valores faltantes imputados
print(vivienda_faltantes_imputado)

## # A tibble: 8,330 × 13
##       id zona        piso estrato preciom areaconst parquea banios habitac tipo 
##    <dbl> <chr>      <dbl>   <dbl>   <dbl>     <dbl>   <dbl>  <dbl>   <dbl> <chr>
##  1  8312 Zona Oeste  4          6    1300       318       2      4       2 Apar…
##  2  8311 Zona Oeste  1          6     480       300       1      4       4 Casa 
##  3  8307 Zona Oeste  3.77       5    1200       800       4      7       5 Casa 
##  4  8296 Zona Sur    2          3     220       150       1      2       4 Casa 
##  5  8297 Zona Oeste  3.77       5     330       112       2      4       3 Casa 
##  6  8298 Zona Sur    3.77       5    1350       390       8     10      10 Casa 
##  7  8299 Zona Sur    2          6     305       125       2      3       3 Apar…
##  8  8300 Zona Oeste  3.77       5     480       280       4      4       4 Apar…
##  9  8286 Zona Sur    3.77       5     275        74       1      2       3 Apar…
## 10  8287 Zona Sur    2          5     285       120       2      4       3 Apar…
## # ℹ 8,320 more rows
## # ℹ 3 more variables: barrio <chr>, longitud <dbl>, latitud <dbl>

Impacto en el análisis: ya que los valores faltantes de la variabe piso son una proporción significativa de los datos (31.70%), omitirlos por completo podría afectar la representatividad del análisis. Por ende, en este caso, se decidió imputar los valores faltantes de la variable piso con la media.

##” Eliminación de Observaciones

# Eliminar filas con valores faltantes en cualquier variable
vivienda_sin_faltantes <- na.omit(vivienda_faltantes_imputado)

# Muestra el conjunto de datos sin filas con valores faltantes
print(vivienda_sin_faltantes)

## # A tibble: 6,724 × 13
##       id zona        piso estrato preciom areaconst parquea banios habitac tipo 
##    <dbl> <chr>      <dbl>   <dbl>   <dbl>     <dbl>   <dbl>  <dbl>   <dbl> <chr>
##  1  8312 Zona Oeste  4          6    1300       318       2      4       2 Apar…
##  2  8311 Zona Oeste  1          6     480       300       1      4       4 Casa 
##  3  8307 Zona Oeste  3.77       5    1200       800       4      7       5 Casa 
##  4  8296 Zona Sur    2          3     220       150       1      2       4 Casa 
##  5  8297 Zona Oeste  3.77       5     330       112       2      4       3 Casa 
##  6  8298 Zona Sur    3.77       5    1350       390       8     10      10 Casa 
##  7  8299 Zona Sur    2          6     305       125       2      3       3 Apar…
##  8  8300 Zona Oeste  3.77       5     480       280       4      4       4 Apar…
##  9  8286 Zona Sur    3.77       5     275        74       1      2       3 Apar…
## 10  8287 Zona Sur    2          5     285       120       2      4       3 Apar…
## # ℹ 6,714 more rows
## # ℹ 3 more variables: barrio <chr>, longitud <dbl>, latitud <dbl>

Sesgo potencial: Imputar con la media todas las variables puede introducir un sesgo si los valores faltantes no son MCAR o si hay alguna relación sistemática entre los valores faltantes y otras variables. Este sesgo podría afectar la validez de los resultados, por ende se decide eliminar el resto de variables faltantes.

Estandarización de Variables

# Estandarizar los valores de la variable "tipo"
vivienda_sin_faltantes <- vivienda_sin_faltantes %>% mutate(tipo = recode(tipo, "Apartamento" = "apartamento", "APARTAMENTO" = "apartamento", "apto" = "apartamento", "Casa" = "casa", "casa" = "casa", "CASA" = "casa", "NA" = "NA"))

# Verificar los cambios de la variable tipo
unique(vivienda_sin_faltantes$tipo)

## [1] "apartamento" "casa"

head (vivienda_sin_faltantes)

## # A tibble: 6 × 13
##      id zona        piso estrato preciom areaconst parquea banios habitac tipo  
##   <dbl> <chr>      <dbl>   <dbl>   <dbl>     <dbl>   <dbl>  <dbl>   <dbl> <chr> 
## 1  8312 Zona Oeste  4          6    1300       318       2      4       2 apart…
## 2  8311 Zona Oeste  1          6     480       300       1      4       4 casa  
## 3  8307 Zona Oeste  3.77       5    1200       800       4      7       5 casa  
## 4  8296 Zona Sur    2          3     220       150       1      2       4 casa  
## 5  8297 Zona Oeste  3.77       5     330       112       2      4       3 casa  
## 6  8298 Zona Sur    3.77       5    1350       390       8     10      10 casa  
## # ℹ 3 more variables: barrio <chr>, longitud <dbl>, latitud <dbl>

La base datos cuenta con datos en forma de texto que contienen mayúsculas o combinación con minúsculas, por tanto, se decide cambiar todas las opciones de la variable tipo a minúscula, de tal forma que se encuentran solo como “casa” y “apartamento”.

Selección de Variables

# muestra la base de datos vivienda con las columnas seleccionadas 
vivienda_faltantes [, c(2, 4, 5, 6, 9, 10)]

## # A tibble: 8,330 × 6
##    zona       estrato preciom areaconst habitac tipo       
##    <chr>        <dbl>   <dbl>     <dbl>   <dbl> <chr>      
##  1 Zona Oeste       6    1300       318       2 Apartamento
##  2 Zona Oeste       6     480       300       4 Casa       
##  3 Zona Oeste       5    1200       800       5 Casa       
##  4 Zona Sur         3     220       150       4 Casa       
##  5 Zona Oeste       5     330       112       3 Casa       
##  6 Zona Sur         5    1350       390      10 Casa       
##  7 Zona Sur         6     305       125       3 Apartamento
##  8 Zona Oeste       5     480       280       4 Apartamento
##  9 Zona Sur         5     275        74       3 Apartamento
## 10 Zona Sur         5     285       120       3 Apartamento
## # ℹ 8,320 more rows

La base de datos contiene variables que no son relevantes para el análisis de información, por ende hemos decidido filtrar dichos campos para mayor objetividad. Se trabajo con las variables: preciom, areaconst, estrato, habitac, zona y tipo.

Variables Cuantitativas

De las variables seleccionas 4 son de valor numérico, las cuales son:

preciom (Precio de la propiedad)
areaconst (Área construida)
estrato (Estrato)
habitac (Cantidad de habitaciones)

Variables Cualitativas

De las variables seleccionas 2 son de valor categórico, las cuales son:

zona (Zona)
tipo (Tipo de propiedad)

Resultados

Precio de las viviendas en diferentes zonas de Cali

# Gráfico de caja y bigotes para analizar el precio de viviendas en diferentes zonas
ggplot(vivienda_sin_faltantes, aes(x = zona, y = preciom, fill = zona)) +
  geom_boxplot() +
  labs(x = "Zona", y = "Precio de Vivienda", title = "Análisis de Precio de Viviendas por Zona") +
  theme_minimal() +
  theme(legend.position = "none")

En este gráfico, cada caja representa la distribución de los precios de las viviendas en una zona específica de Cali. Los extremos de las cajas representan el primer y tercer cuartil (Q1 y Q3), mientras que la línea dentro de la caja es la mediana. Los “bigotes” se extienden hasta los valores que están dentro de 1.5 veces el rango intercuartil (IQR) desde los cuartiles. Los puntos fuera de los bigotes son los valores atípicos.

Las medianas de los precios de viviendas en las zonas Centro, Norte y Sur son similares entre sí y son menores en comparación con la Zona Oeste. Los precios más bajos se encuentran en la Zona Oriente.

Este análisis sugiere que, a pesar de que las medianas de precios son similares en las zonas Centro, Norte y Sur, las viviendas en la Zona Oeste tienen precios más altos en promedio. Además, el hecho de que los precios más bajos se encuentren en la Zona Oriente indica que esta zona podría ser un mercado más asequible en términos de vivienda.

Basándonos en estos resultados se sugiere:

Segmentación de Mercado: Pueden considerar que las zonas Centro, Norte y Sur atraen a un público con niveles de ingresos similares y preferencias de vivienda comparables. Pueden desarrollar estrategias de marketing que se centren en las características únicas de cada zona para atraer a diferentes segmentos de compradores potenciales.

Diferenciación de Precios: Dado que los precios son más bajos en la Zona Oriente, pueden ajustar las estrategias de precios para esta área. Ofrecer viviendas más asequibles en esta zona podría atraer a compradores que buscan opciones más económicas.

Enfoque en la Zona Oeste: ya que las viviendas en la Zona Oeste son más costosas en promedio, podrían desarrollar estrategias de marketing que destaquen los aspectos exclusivos y lujosos de esta zona para atraer a compradores con un presupuesto más alto.

Tipo de viviendas más vendidas en Cali

# Tabla de frecuencia de tipos de viviendas
tabla_tipo <- table(vivienda_sin_faltantes$tipo)

# Gráfico de barras para analizar tipos de viviendas más vendidos
ggplot(data = vivienda_sin_faltantes, aes(x = reorder(tipo, -tabla_tipo), fill = tipo)) +
  geom_bar() +
  labs(x = "Tipo de Vivienda", y = "Frecuencia", title = "Tipos de Viviendas mas Vendidos") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

## Warning in split.default(X, group): largo de datos no es múltiplo de la
## variable de separación

## Warning in split.default(X, group): largo de datos no es múltiplo de la
## variable de separación

En este gráfico, cada barra representa la frecuencia de un tipo de vivienda vendido en Cali. Los tipos de vivienda están en el eje x (apartamento;casa), y la frecuencia se muestra en el eje y. Cada color de barra representa un tipo de vivienda diferente.

Los apartamentos son los tipos de vivienda más vendidos en Cali, con una frecuencia significativamente alta. Esto sugiere que hay una demanda considerable de unidades de vivienda en forma de apartamentos en la ciudad.

Dado que los apartamentos son los tipos de vivienda más vendidos, podrían desarrollar estrategias de marketing específicas para satisfacer esta demanda. Esto podría incluir promociones, características destacadas de apartamentos y opciones de financiamiento atractivas para los compradores. También es importante mantener una oferta diversificada que incluya opciones de casas y otros tipos de viviendas como chalets, dúplex, etc. Esto asegurará que están atendiendo a diferentes segmentos de compradores con diferentes preferencias y necesidades.

Las casas también tienen una frecuencia considerable en las ventas de viviendas. Aunque un poco menos frecuentes que los apartamentos, las casas todavía representan una parte importante del mercado de viviendas.

Características más buscadas en las viviendas en Cali

Datos de la variable estrato

# Histograma de la variable estrato
ggplot(data = vivienda_sin_faltantes, aes(x = estrato)) +
  geom_histogram(binwidth = 1, fill = "blue", color = "black") +
  labs(x = "Estrato", y = "Frecuencia", title = "Histograma de Estrato en Viviendas") +
  theme_minimal()

En este histograma, el eje x representa los valores de estrato y el eje y muestra la frecuencia de esos valores en los intervalos. Cada barra en el histograma representa la cantidad de viviendas que caen dentro de un rango de estrato específico.

El histograma muestra la distribución de los estratos en las viviendas en Cali. Se puede observar que el estrato más común es el 5, seguido por el estrato 6 y el estrato 4.

El estrato 3 es el menos comun, lo cual sugiere que hay menos viviendas en este estrato, la ausencia de estratos 1 y 2 puede ser una oportunidad para explorar la posibilidad de desarrollar ofertas específicas para estos estratos en el futuro.

La mayoría de las viviendas se encuentran en los estratos altos (5, 6 y 4), lo que podría reflejar la composición general del mercado de viviendas en Cali.

Basándonos en la distribución de estratos, podrían considerar dirigir los esfuerzos de marketing y desarrollo de productos hacia los estratos más comunes (5, 6 y 4), ya que ahí se encuentra la mayor concentración de viviendas.

Aunque el estrato 3 es el menos comun, podría representar oportunidades de mercado nicho. Dependiendo de la estrategia, podrían explorar cómo atraer a compradores interesados en viviendas de estrato medio.

Datos de la variable habitaciones

# Gráfico de barras para comparar los datos de la variable "habitac"
ggplot(data = vivienda_sin_faltantes, aes(x = factor(habitac))) +
  geom_bar(fill = "blue") +
  labs(x = "Numero de Habitaciones", y = "Cantidad de Propiedades", 
       title = "Comparacion de Propiedades por Numero de Habitaciones en Cali") +
  theme(axis.text.x = element_text(angle = 0))

En este gráfico, cada barra representa la cantidad de propiedades que tienen un cierto número de habitaciones. Estos son los resultados basados en el gráfico:

El hecho de que 3 habitaciones tengan la mayor cantidad de propiedades sugiere que este tipo de viviendas es altamente demandado en el mercado. Puede ser una opción popular para familias o grupos más grandes que buscan espacio adicional.

Dado que las propiedades con 3 habitaciones son las más comunes, también es probable que haya más competencia en este segmento del mercado. Esto podría influir la definición de precios, estrategias de marketing y servicios para destacar en un mercado saturado.

Las propiedades con 4 habitaciones también son populares, lo que sugiere que hay una demanda considerable para viviendas más grandes. Esto podría representar familias más grandes o personas que desean espacio adicional para oficinas en el hogar u otros fines.

Las propiedades con 2 habitaciones tienen una cantidad significativa, lo que puede indicar una demanda de opciones más pequeñas y asequibles. Esto podría ser una oportunidad para atender a un mercado más amplio que busca opciones más compactas.

Las propiedades con 5 habitaciones o más pueden representar opciones de lujo o casas más grandes. Aunque su cantidad es menor, podrían tener un mercado específico de compradores que buscan espacios amplios y lujosos.

Podrían considerar adquirir más propiedades con 3 habitaciones debido a la alta demanda, pero también podrían diversificar su cartera para incluir opciones con 4 habitaciones y 2 habitaciones para abarcar diferentes segmentos del mercado.

Evolución del mercado de bienes raíces en Cali

Comparación de Tipo de Vivienda y Estrato

# Gráfico de barras para comparar el tipo de vivienda y el estrato
ggplot(data = vivienda_sin_faltantes, aes(x = tipo, fill = factor(estrato))) +
  geom_bar(position = "dodge") +
  labs(x = "Tipo de Vivienda", y = "Cantidad", 
       title = "Comparacion de Tipo de Vivienda por Estrato en Cali") +
  theme(axis.text.x = element_text(angle = 45, hjust = 1)) +
  scale_fill_discrete(name = "Estrato")

De acuerdo al gráfico de barras, podemos hacer las siguientes observaciones:

En ambos tipos de vivienda (casa y apartamento), la mayoría de las propiedades se encuentran en los estratos 5 y 6. Esto podría indicar una preferencia por propiedades de estratos altos en el mercado inmobiliario de Cali.

Aunque los estratos 5 y 6 son populares en ambos tipos de vivienda, los apartamentos tienen una proporción mayor en el estrato 5 en comparación con las casas. Esto podría sugerir que algunas personas prefieren apartamentos en estratos altos.

Una observación importante es que no hay propiedades en los estratos 1 y 2 para ninguno de los dos tipos de vivienda. Esto podría deberse a varias razones, como características de la zona, demanda del mercado o políticas de construcción.

Comparación del área construida y el precio

# Gráfico de dispersión para comparar el área construida con el precio
ggplot(data = vivienda_sin_faltantes, aes(x = areaconst, y = preciom)) +
  geom_point() +
  labs(x = "Area Construida", y = "Precio", 
       title = "Comparacion de Area Construida vs Precio en Cali") +
  theme_minimal()

La mayoría de los puntos se concentran en la zona inferior izquierda del gráfico, esto podría indicar a medida que el área construida disminuye, es probable que el precio también disminuya. Esto es coherente con la intuición común en el mercado inmobiliario: propiedades más pequeñas tienden a tener precios más bajos. Hay puntos que no se encuentran concentrados, los cuales pueden representar propiedades excepcionales con áreas construidas más grandes y precios más altos.

Este patrón sugiere que el área construida tiene un efecto considerable en el precio. Sin embargo, no es la unica varibale determinante para establecer el precio, es necesario tener en cuenta el tipo de vivienda, zona, estrato, entre otras.

Discusiones

Los análisis de precios, zonas, estratos y tipos de viviendas han revelado tendencias en el mercado inmobiliario de Cali. Por ejemplo, se observa que la zona oeste tiende a tener precios más altos y que las viviendas de estrato 5 son predominantes en ambos tipos de viviendas (casa y apartamento). Esto podría indicar preferencias específicas en cuanto a ubicación y estrato.

El análisis del gráfico de dispersión entre el área construida y el precio sugiere que, en general, existe una tendencia a que propiedades con áreas construidas más pequeñas tengan precios más bajos. Esta relación puede ser útil para evaluar la influencia del tamaño de la propiedad en su valor. Sin embargo, es importante considerar que esta relación puede no ser lineal y que otros factores también podrían estar influyendo en los precios.

El análisis de características más buscadas, como el número de habitaciones, baños, área construida y parqueaderos, proporciona una visión de las preferencias de los compradores. Las propiedades con 3 habitaciones y 2 baños parecen ser las más populares, lo que podría ser relevante para la estrategia de comercialización. Esto sugiere que ajustar las propiedades para incluir estas características podría atraer a más compradores.

La comparación de variables como tipo de vivienda y estrato, así como el análisis del precio en función del número de habitaciones, brinda información valiosa sobre cómo ciertos factores pueden influir en el valor de una propiedad. Esto podría ser utilizado para segmentar el mercado y ajustar estrategias de marketing. Por ejemplo, se podría enfocar la publicidad en viviendas de estrato 5, que parecen ser más demandadas.

Conclusiones

Los análisis resaltan que las propiedades de estrato 5 son populares en ambos tipos de viviendas. Además, la zona oeste presenta precios más altos en promedio. Estas tendencias pueden influir en las decisiones de la empresa B&C en términos de ubicación y estrategias de precios.

Existe una tendencia visual de que propiedades con áreas construidas más pequeñas tienden a tener precios más bajos. Esta relación puede ser utilizada para orientar a los compradores sobre el impacto del tamaño en el precio.

Las propiedades con 3 habitaciones y 2 baños son las más buscadas, lo que sugiere que ofrecer propiedades con estas características podría ser una estrategia efectiva para atraer a más compradores.

Los análisis de comparación de variables permiten segmentar el mercado y adaptar la oferta de la empresa a las preferencias identificadas. Por ejemplo, podría haber un enfoque especial en las viviendas de estrato 5 y con ciertas características para atraer a los compradores objetivo.

Análisis del mercado inmobiliario en Cali para B&C

Laura Natalia Losada Sandoval

2023 08 14