En el dinámico entorno de bienes raíces urbanos, comprender a fondo las complejidades y tendencias del mercado es fundamental para tomar decisiones informadas y estratégicas. El mercado inmobiliario está en constante evolución, impulsado por factores socioeconómicos, demográficos y urbanísticos. En este contexto, este informe se presenta como una herramienta esencial para la toma de decisiones de la empresa inmobiliaria líder en nuestra ciudad.
La base de datos “vivienda.csv” ha sido sometida a un riguroso análisis utilizando técnicas avanzadas de análisis de datos. El objetivo es obtener una comprensión en profundidad del mercado, identificar patrones emergentes y segmentaciones significativas, y traducir estos insights en recomendaciones concretas.
El informe abarca un análisis integral y multidimensional del mercado inmobiliario urbano, con especial atención a los siguientes aspectos clave:
Análisis de Componentes Principales: A través de la reducción de la dimensionalidad y la visualización en componentes principales, se identifica las características que tienen un impacto fundamental en la variación de precios y en las preferencias del mercado. Estas claves ofrecen una comprensión profunda de las dinámicas que impulsan la demanda.
Análisis de Conglomerados: La segmentación de propiedades residenciales en grupos homogéneos, basados en características similares, revela los diferentes comportamientos del mercado en distintas áreas de la ciudad y entre diferentes estratos socioeconómicos. Esta segmentación proporciona una base sólida para decisiones de marketing y estrategias de expansión.
Análisis de Correspondencia: se examina la relación entre las variables categóricas y numéricas para desentrañar patrones de comportamiento. Este análisis muestra cómo factores geográficos y características de propiedad influyen en las decisiones de compra y en la fijación de precios.
Visualización de Resultados: Los resultados del análisis se presentan en gráficos, mapas y visualizaciones, permitiendo una comunicación efectiva y una comprensión rápida de las conclusiones clave.
Este análisis no solo proporciona información valiosa para la toma de decisiones en un mercado altamente competitivo, sino que también brinda ventajas estratégicas al optimizar la inversión y maximizar los beneficios. El informe está diseñado para guiar las decisiones estratégicas y operativas de la empresa, impulsando su éxito en un entorno cambiante y desafiante.
El análisis de Componentes Principales (PCA) es una técnica poderosa que nos permite reducir la dimensionalidad de un conjunto de datos y visualizar las relaciones subyacentes entre variables. En nuestro caso, aplicamos PCA a la base de datos “vivienda.csv” para identificar las características clave que influyen en la variación de precios y preferencias del mercado inmobiliario urbano.
El proceso comenzó con la selección de características relevantes que podrían influir en los precios y las preferencias de los compradores. Estas características incluyen el precio, los metros cuadrados, el número de habitaciones y baños. Con el fin de tratar con datos faltantes y asegurar que todas las variables tuvieran el mismo peso en el análisis, imputamos los valores faltantes utilizando la técnica de imputación de promedio.
A continuación, se realiza el análisis de Componentes Principales
utilizando el paquete FactoMineR en R. Se obtuvieron los
valores de las componentes principales y se calcularon las proporciones
de varianza explicada por cada componente. Primero, cargamos las
librerías necesarias y leemos el conjunto de datos:
# Cargar las librerías necesarias
library(dplyr)
library(ggplot2)
library(FactoMineR)
# Cargar el conjunto de datos
data <- read.csv("H:/Mi unidad/CIENCIA DE DATOS/SEMESTRE 2/MODELOS ESTADISTICOS PARA LA TOMA DE DESICIONES/vivienda.csv", stringsAsFactors = FALSE)
# Seleccionar las variables numéricas relevantes para el PCA
numeric_vars <- data %>%
select("preciom", "areaconst", "parquea", "banios", "habitac")
A continuación, realizamos el PCA y visualizamos la varianza explicada por cada componente principal:
# Realizar el PCA
pca_result <- PCA(numeric_vars, scale.unit = TRUE)
# Visualizar la varianza explicada por cada componente
barplot(pca_result$eig[, 2], main = "Varianza Explicada por Componente")
En la Figura 1, el
gráfico de barras muestra cómo la varianza se distribuye en cada
componente principal. Este paso nos ayuda a comprender cuánta
información retiene cada componente.
Ahora visualizamos el gráfico de componentes principales:
# Visualizar el gráfico de componentes principales
plot.PCA(pca_result, choix = "var", habillage = 1)
En la Figura 2, muestra el grafico de componentes principales
Figura 2: Grafica de Variables.
En esta visualización, cada variable se proyecta en el espacio de los componentes principales. Las flechas indican la dirección en la que cada variable contribuye más a cada componente principal. Las distancias entre los puntos y el origen representan la contribución de cada observación a los componentes. Esto nos ayuda a identificar las relaciones entre las variables y cómo afectan la variación en los datos.
Una vez calculadas las componentes principales, generamos un gráfico de dispersión de las propiedades en el espacio de las dos primeras componentes principales.
# Biplot para visualizar la estructura de las variables y los individuos
biplot(pca_result$ind$coord, pca_result$var$coord,
col = c("blue", "red", "green", "purple"),
cex = 0.7, main = "Biplot de Componentes Principales")
En la Figura 3, muestra el grafico de dispersion, cada punto en el gráfico representa una propiedad y su posición está determinada por sus valores en las componentes principales. Además, coloreamos los puntos según el cluster al que pertenecen, lo que nos permite identificar patrones de agrupación.
Figura 3: Gráfico de Componentes Principales.
Este gráfico de dispersión, presentado en la Figura 3, revela una estructura clara en los datos. Podemos observar cómo las propiedades se agrupan en función de sus características, lo que sugiere segmentaciones naturales en el mercado inmobiliario.
Estos hallazgos aportan una comprensión más profunda de las relaciones entre las características de las propiedades y sus ubicaciones en el espacio de las componentes principales. Esta información será esencial para tomar decisiones informadas en términos de precios, estrategias de marketing y desarrollo de propiedades.
El análisis de conglomerados es una técnica esencial para comprender las dinámicas y demandas específicas en diferentes partes del mercado inmobiliario urbano. A través de esta técnica, se busca agrupar propiedades residenciales en segmentos homogéneos basados en sus características similares. Estos segmentos proporcionan información valiosa para adaptar estrategias y tomar decisiones informadas en el mercado.
Se implemento el algoritmo de K-Means para realizar la segmentación de propiedades. se eligio un número de clusters basado en consideraciones prácticas y de negocio. Una vez aplicado el algoritmo, cada propiedad fue asignada a un cluster en función de sus características. Estos clusters reflejan grupos de propiedades con características y comportamientos similares.
# Cargar las bibliotecas necesarias
library(tidyverse)
library(cluster)
library(ggplot2)
library(leaflet)
# Cargar los datos desde el archivo CSV
vivienda <- read.csv("H:/Mi unidad/CIENCIA DE DATOS/SEMESTRE 2/MODELOS ESTADISTICOS PARA LA TOMA DE DESICIONES/vivienda.csv", stringsAsFactors = FALSE)
# Eliminar filas con valores faltantes
datos_sin_nans <- vivienda %>% na.omit()
# Seleccionar las características relevantes para el análisis de conglomerados
features <- datos_sin_nans[, c("preciom", "areaconst", "parquea", "banios", "habitac")]
features2 <- datos_sin_nans[, c("longitud", "latitud")]
# Normalizar las variables
scaled_features <- scale(features)
# Realizar el análisis de conglomerados (K-means, por ejemplo)
num_clusters <- 5
kmeans_result <- kmeans(scaled_features, centers = num_clusters)
# Agregar el resultado del análisis de conglomerados a los datos originales
data_clustered <- datos_sin_nans %>%
mutate(cluster = as.factor(kmeans_result$cluster))
# Visualizar los conglomerados en un gráfico de dispersión
ggplot(data_clustered, aes(x = areaconst, y = preciom, color = cluster)) +
geom_point() +
labs(title = "Análisis de Conglomerados")
centro_latitud <- 3.424839
centro_longitud <- -76.531483
# Crear un mapa interactivo con los clusters
map <- leaflet(data_clustered) %>%
addTiles() %>%
setView(lng = centro_longitud, lat = centro_latitud, zoom = 12) %>%
addMarkers(lng = ~longitud, lat = ~latitud, popup = ~cluster)
map
La Figura 3 muestra un mapa interactivo que presenta la distribución de los clusters en la ciudad. Cada marcador en el mapa representa una propiedad y está coloreado de acuerdo con el cluster al que pertenece. Esta visualización geográfica nos permite identificar áreas con concentraciones específicas de clusters, lo que a su vez revela patrones de demanda y preferencias en diferentes partes de la ciudad.
Figura 3: Mapa de Clusters en la Ciudad.
Además, se calculo estadísticas clave para cada cluster, incluyendo la media del precio, área construida, número de habitaciones y baños. La Tabla 1 resume estas estadísticas para cada cluster. Esta información es fundamental para adaptar las estrategias de marketing, fijación de precios y desarrollo de propiedades según las características y preferencias de cada segmento de mercado.
# Resumen de los clusters
cluster_summary <- data_clustered %>%
group_by(cluster) %>%
summarise(Media_Precio = mean(preciom),
Media_Metros = mean(areaconst),
Media_parquea = mean(parquea),
Media_Habitaciones = mean(habitac),
Media_Banos = mean(banios))
# Visualizar los resúmenes de los clusters
print(cluster_summary)
| Cluster | Media Precio | Media Área Construida | Media Parqueadero | Media Habitaciones | Media Baños |
|---|---|---|---|---|---|
| 1 | $267 | 98.0 m² | 1.26 | 3.16 | 2.36 |
| 2 | $568 | 206 m² | 2.09 | 3.75 | 3.96 |
| 3 | $262 | 81.7 m² | 1.24 | 1.87 | 2.02 |
| 4 | $1168 | 423 m² | 4.07 | 4.43 | 5.26 |
| 5 | $498 | 339 m² | 1.82 | 7.08 | 4.80 |
Tabla 1: Estadísticas Clave de Propiedades por Cluster.
Figura 4: Analisis de Conglomerados.
Este análisis de conglomerados brinda una comprensión más profunda de las diferentes dinámicas en el mercado inmobiliario. Los clusters representan segmentos de mercado con preferencias y comportamientos únicos. Estos insights permitirán a la empresa inmobiliaria dirigir sus esfuerzos y recursos de manera más efectiva para satisfacer las demandas específicas de cada grupo de compradores.
Mediante el Análisis de Correspondencia, se explora la relación entre las variables categóricas y numéricas. Se identificaron patrones de comportamiento del mercado inmobiliario en función del tipo de vivienda, la zona y el barrio. Esto proporciona información clave para adaptar estrategias según las preferencias locales.
El análisis de correspondencia es una técnica poderosa para explorar la relación entre variables categóricas y numéricas en un conjunto de datos. Seutilizo el análisis de correspondencia para examinar cómo las variables categóricas, como el tipo de vivienda, la zona y el barrio, se relacionan con las variables numéricas, como el precio, el área construida, el número de habitaciones, los baños y otros atributos clave de las propiedades.
La visualización de estas relaciones puede proporcionar una comprensión más profunda de cómo ciertas características influyen en las preferencias de compra y los precios en diferentes partes del mercado inmobiliario.
Para llevar a cabo el análisis de correspondencia, se utilizo el
paquete FactoMineR en R. Las variables categóricas se
codificaron en matrices de indicadores y se realizó un análisis de
inercia para determinar la relevancia de los componentes
principales.
# Cargar las bibliotecas necesarias
library(FactoMineR)
# Cargar los datos desde el archivo CSV
vivienda <- read.csv("H:/Mi unidad/CIENCIA DE DATOS/SEMESTRE 2/MODELOS ESTADISTICOS PARA LA TOMA DE DESICIONES/vivienda.csv", stringsAsFactors = FALSE)
# Seleccionar las variables categóricas y numéricas para el análisis de correspondencia
variables_categoricas <- vivienda[, c("zona", "tipo", "barrio")]
variables_numericas <- vivienda[, c("preciom", "areaconst", "parquea", "banios", "habitac")]
# Realizar el análisis de correspondencia múltiple (MCA)
mca_result <- MCA(cbind(variables_categoricas, variables_numericas))
La Figura 5 muestra un gráfico de análisis de correspondencia en el que se representan las variables categóricas y numéricas en un espacio bidimensional. Cada variable se proyecta en este espacio según su relación con otras variables. La distancia entre las variables en el gráfico refleja su grado de asociación. Este análisis visual nos ayuda a identificar patrones, relaciones y posibles agrupaciones en los datos.
Figura 5: Gráfico de Análisis de Correspondencia.
Al explorar el gráfico de análisis de correspondencia, se observa cómo ciertas variables categóricas se asocian con determinados valores numéricos. Por ejemplo, podríamos identificar si ciertos tipos de vivienda tienden a tener más habitaciones y baños en comparación con otros. También podríamos detectar si ciertas zonas o barrios están relacionados con propiedades de mayor o menor precio.
Este análisis enriquece nuestra comprensión de cómo los factores geográficos y las características de propiedad interactúan para influir en las preferencias y precios del mercado inmobiliario. Estos conocimientos son esenciales para tomar decisiones estratégicas y ajustar las estrategias de marketing y fijación de precios en función de los patrones del mercado.
El análisis de conglomerados permitio identificar segmentos específicos dentro del mercado inmobiliario. Se encontro que las propiedades en determinadas zonas atraen a compradores con preferencias similares en términos de tamaño, características y precios. Esto proporciona una oportunidad para adaptar estrategias de marketing y ofertas específicas para cada segmento.
El análisis de componentes principales (PCA) reveló que características como el área construida, el número de habitaciones y baños son factores clave en la variación de precios de las propiedades. Estos resultados sugieren la importancia de resaltar estas características al valorar y promocionar las propiedades.
Mediante el análisis de correspondencia, se detecto relaciones entre el tipo de vivienda, la zona y las preferencias del mercado. Las preferencias varían según la ubicación, lo que sugiere que la estrategia de precios y marketing debe adaptarse a las dinámicas únicas de cada zona.