Objetivo

El artículo a continuación, plantea explorar y analizar la relación entre el tipo de vivienda, su precio y área construída, con el fin de determinar si el tipo de vivienda influye significativamente en el precio y el tamaño de la propiedad.

Introducción

En el mercado inmobiliario, comprender cómo el tipo de vivienda impacta tanto en el precio como en el área construida es esencial para compradores, vendedores y desarrolladores inmobiliarios. Este estudio se propone analizar esta relación mediante la recopilación y análisis descriptivo de datos, buscando comprender cómo las distintas características de las viviendas afectan su valor y tamaño. El objetivo es ofrecer una visión detallada que permita a los actores del mercado tomar decisiones informadas en sus transacciones inmobiliarias.

Resultados

Antes de iniciar el análisis descriptivo, se presenta una revisión de las variables disponibles en el conjunto de datos. Aunque los datos ya han sido previamente limpiados, se lleva a cabo una revisión adicional para asegurar la consistencia y claridad en la nomenclatura de las variables, con el objetivo de facilitar su interpretación y análisis posterior.

library(readxl)
Datos_ejercicio_1 <- read_excel("C:/Users/Usuario/Downloads/Datos_ejercicio_1.xlsx")

# 1. LIMPIEZA DE DATOS #

# Revisión de variables: Renombrar variables. #
library(tidyverse)
Datos_limpios <- rename(Datos_ejercicio_1, c(Precio = preciom, `Área construída` = areaconst, `Tipo de vivienda` = tipo))

Análisis descriptivo

Representaciones estadísticas gráficas

Se presentan a continuación gráficos que exploran la relación entre el tipo de vivienda, su precio y área construida. Estos gráficos proporcionan una representación visual para identificar patrones, tendencias y posibles relaciones entre las variables mencionadas. Se incluyen gráficos de dispersión para visualizar la relación entre el precio y el área construida, segmentados por tipo de vivienda; así como diagramas de cajas y alambres para examinar la distribución del precio y el área construida en cada categoría de vivienda. Además, se presentan diagramas de barras apiladas para analizar la distribución de cada variable por separado, agrupados por tipo de vivienda y ojivas. Estos gráficos permiten una comprensión intuitiva de los datos, representando una base visual que permita guiar el análisis posterior.

Gráficos de barras apiladas:

# 2. GRÁFICOS ESTADÍSTICOS #



# 2.1 Gráficos de barras apiladas: #
library(ggplot2)



# 2.1.1 Gráfico de barras para el precio por tipo de vivienda. #

# 2.1.1.1 Calcular la frecuencia absoluta del precio máximo para cada tipo de vivienda. #
frecuencia_max <- tapply(Datos_limpios$Precio, Datos_limpios$`Tipo de vivienda`, max)

# 2.1.1.2 Crear el gráfico de barras apiladas. #
barplot(frecuencia_max, main = "Análisis comparativo de los precios por tipo de Vivienda", xlab = "Tipo de vivienda", ylab = "Frecuencia absoluta del precio de vivienda", col = "#bfa4ff", ylim = c(0, 320), names.arg = names(frecuencia_max))

# 2.1.2 Gráfico de barras para el área construida por tipo de vivienda. #

# 2.1.2.1 Calcular la frecuencia absoluta del precio máximo para cada tipo de vivienda. #
frecuencia_max <- tapply(Datos_limpios$`Área construída`, Datos_limpios$`Tipo de vivienda`, max)

# 2.1.2.2 Crear el gráfico de barras apiladas. #
barplot(frecuencia_max, main = "Análisis comparativo de los tamaños de la vivienda según su tipo", xlab = "Tipo de vivienda", ylab = "Frecuencia absoluta del área construída", col = "#b0b5ff", ylim = c(0, 220), names.arg = names(frecuencia_max))

Ojivas:

Un gráfico de ojiva adicional permite visualizar de manera acumulada la distribución de los datos, destacando las diferencias en la frecuencia acumulada de precios o áreas construidas entre apartamentos y casas, lo cual no es posible apreciar con los gráficos de barras apiladas.

# 2.2 Ojivas: #


# 2.2.1 Ajustar los márgenes de la figura. #
par(mar = c(4, 4, 2, 2))

# 2.2.2 Función para obtener las coordenadas de la ojiva. #
obtener_ojiva_ecdf <- function(datos, col) {
  if (length(datos) > 0) {
    ecdf_datos <- ecdf(datos)
    x <- seq(min(datos), max(datos), length.out = 100)
    y <- ecdf_datos(x)
    lines(x, y, col = col, lwd = 2)
  }
}

# 2.2.3 Gráfico de ojivas para los precios y áreas construídas. #
par(mfrow = c(2, 1))

# 2.2.4 Datos de precios para apartamentos y casas. #
datos_precios_apartamento <- Datos_limpios$Precio[Datos_limpios$`Tipo de vivienda` == "Apartamento"]
datos_precios_casa <- Datos_limpios$Precio[Datos_limpios$`Tipo de vivienda` == "Casa"]

# 2.2.5 Gráfico de ojivas para precios. #
plot(1, type = "n", xlim = range(c(datos_precios_apartamento, datos_precios_casa)), ylim = c(0, 1), main = "Distribución del precio de la vivienda según su tipo", xlab = "Precio", ylab = "Frecuencia acumulada")
obtener_ojiva_ecdf(datos_precios_apartamento, "#bfa4ff")
obtener_ojiva_ecdf(datos_precios_casa, "#b0b5ff") 
legend("bottomright", legend = c("Apartamento", "Casa"), col = c("#bfa4ff", "#b0b5ff"), lty = 1, cex = 0.6, bg = "transparent", box.col = "transparent")

# 2.2.6 Datos de áreas construidas para apartamentos y casas. #
datos_areas_apartamento <- Datos_limpios$`Área construída`[Datos_limpios$`Tipo de vivienda` == "Apartamento"]
datos_areas_casa <- Datos_limpios$`Área construída`[Datos_limpios$`Tipo de vivienda` == "Casa"]

# 2.2.7 Gráfico de ojivas para áreas construidas
plot(1, type = "n", xlim = range(c(datos_areas_apartamento, datos_areas_casa)), ylim = c(0, 1), main = "Distribución del tamaño de la vivienda según su tipo", xlab = "Área construída", ylab = "Frecuencia acumulada")
obtener_ojiva_ecdf(datos_areas_apartamento, "#bfa4ff")
obtener_ojiva_ecdf(datos_areas_casa, "#b0b5ff")
legend("bottomright", legend = c("Apartamento", "Casa"), col = c("#bfa4ff", "#b0b5ff"), lty = 1, cex = 0.6, bg = "transparent", box.col = "transparent")

Diagramas de cajas y alambres:

# 2.3 Gráficos de cajas y alambres: #

# 2.3.1 Colores personalizados para los gráficos. #
colores <- c("#bfa4ff", "#b0b5ff")  

# 2.3.2 Gráfico de cajas y alambres para precios. #
boxplot(Precio ~ `Tipo de vivienda`, data = Datos_limpios, main = "Distribución del precio de la vivienda según su tipo", xlab = "Tipo de vivienda", ylab = "Precio", col = colores)

# 2.3.3 Gráfico de cajas y alambres para áreas construidas. #
boxplot(`Área construída` ~ `Tipo de vivienda`, data = Datos_limpios, main = "Distribución del tamaño de la vivienda según su tipo", xlab = "Tipo de vivienda", ylab = "Área construída", col = colores)

Diagrama de dispersión:

# 2.4 Diagrama de dispersión para precios y áreas construidas por tipo de vivienda: #

plot(Datos_limpios$`Área construída`, Datos_limpios$Precio, col = ifelse(Datos_limpios$`Tipo de vivienda` == "Apartamento", "#bfa4ff", "#012249"), xlab = "Área construída", ylab = "Precio", main = "Relación entre precio y área construída según el tipo de vivienda")
legend("topleft", legend = c("Apartamento", "Casa"), col = c("#bfa4ff", "#012249"), bty="n", cex=0.6, lty=2, ncol = 1,  xpd = TRUE)

Resúmen estadístico

Para complementar los resultados gráficos y comprender mejor las características de las variables de interés en el conjunto de datos, se presenta a continuación el cálculo de algunos indicadores estadísticos de tendencia central y posición.

1. Para analizar el precio de la vivienda en función de su tipo.

1.1 Generales, para cualquier tipo de vivienda:

# 3. INDICADORES ESTADÍSTICOS #
library(knitr)

# 3.1 Generales: Para cualquier tipo de vivienda. #

# Tabla de frecuencias absolutas para el número de suicidios. #
Tabla_precio=table(Datos_limpios$Precio)

# Tabla de frecuencias absolutas para el precio de las viviendas. #
X_precio=mean(Datos_limpios$Precio)
Me_precio=median(Datos_limpios$Precio)
Mo_precio=as.numeric(names(Tabla_precio)[which.max(Tabla_precio)])
S_precio=sd(Datos_limpios$Precio)
CV_precio=(S_precio  / abs(X_precio)) * 100

Tabla_3.1.1=data.frame(Indicador=c("Promedio", "Mediana (Me)", "Moda (Mo)", "Desv. Est. (S)", "Coef.Var. (CV)"), Valor=c(X_precio, Me_precio, Mo_precio, S_precio, CV_precio))
kable(Tabla_3.1.1, align = "c", caption = NULL)
Indicador Valor
Promedio 243.703063
Mediana (Me) 238.770218
Moda (Mo) 207.406256
Desv. Est. (S) 19.555372
Coef.Var. (CV) 8.024262

1.2 Sectorizados por tipo de vivienda:

1.2.1 Por apartamento:

library(dplyr)

# 3.1.1 Por apartamento: #
Datos_apartamento <- Datos_limpios %>% filter(`Tipo de vivienda` == "Apartamento")

# 3.1.1.1 Tabla de frecuencias absolutas para el precio de los apartamentos. #
Tabla_precio=table(Datos_apartamento$Precio)

# 3.1.1.2 Calcular la media (X), mediana (Me), moda (Mo), desviación estándar (S) y coeficiente de variación (CV) del precio de los apartamentos. #
X_precio=mean(Datos_apartamento$Precio)
Me_precio=median(Datos_apartamento$Precio)
Mo_precio=as.numeric(names(Tabla_precio)[which.max(Tabla_precio)])
S_precio=sd(Datos_apartamento$Precio)
CV_precio=(S_precio / abs(X_precio)) * 100
Min_precio=summary(Datos_apartamento$Precio)[1]
Q1_precio=summary(Datos_apartamento$Precio)[2]
Q2_precio=Me_precio
Q3_precio=summary(Datos_apartamento$Precio)[5]
Max_precio=summary(Datos_apartamento$Precio)[6]
RIC_precio=Q3_precio-Q1_precio
LI_precio=Q1_precio-(1.5 * RIC_precio)
LS_precio=Q3_precio+(1.5 * RIC_precio)

Tabla_3.1.2=data.frame(Indicador=c("Promedio", "Moda (Mo)", "Desv. Est.(S)", "Coef.Var. (CV)", "Mínimo (Mín)", "Q1", "Mediana (Q2)", "Q3", "Máximo (Máx)", "RIC", "LI", "LS"), Valor=c(X_precio, Mo_precio, S_precio, CV_precio, Min_precio, Q1_precio, Me_precio, Q3_precio, Max_precio, RIC_precio, LI_precio, LS_precio))
kable(Tabla_3.1.2, align = "c", caption = NULL)
Indicador Valor
Promedio 237.683103
Moda (Mo) 207.406256
Desv. Est.(S) 13.288680
Coef.Var. (CV) 5.590923
Mínimo (Mín) 207.406256
Q1 228.793518
Mediana (Q2) 236.138198
Q3 243.584644
Máximo (Máx) 305.190020
RIC 14.791126
LI 206.606830
LS 265.771332

1.2.2 Por casa:

# 3.1.2 Por casa: #
Datos_casa <- Datos_limpios %>% filter(`Tipo de vivienda` == "Casa")

# 3.1.2.1 Tabla de frecuencias absolutas para el precio de las casas. #
Tabla_precio=table(Datos_casa$Precio)

# 3.1.2.2 Calcular la media (X), mediana (Me), moda (Mo), desviación estándar (S) y coeficiente de variación (CV) del precio de las casas. #
X_precio=mean(Datos_casa$Precio)
Me_precio=median(Datos_casa$Precio)
Mo_precio=as.numeric(names(Tabla_precio)[which.max(Tabla_precio)])
S_precio=sd(Datos_casa$Precio)
CV_precio=(S_precio / abs(X_precio)) * 100
Min_precio=summary(Datos_casa$Precio)[1]
Q1_precio=summary(Datos_casa$Precio)[2]
Q2_precio=Me_precio
Q3_precio=summary(Datos_casa$Precio)[5]
Max_precio=summary(Datos_casa$Precio)[6]
RIC_precio=Q3_precio-Q1_precio
LI_precio=Q1_precio-(1.5 * RIC_precio)
LS_precio=Q3_precio+(1.5 * RIC_precio)

Tabla_3.1.3=data.frame(Indicador=c("Promedio", "Moda (Mo)", "Desv. Est.(S)", "Coef.Var. (CV)", "Mínimo (Mín)", "Q1", "Mediana (Q2)", "Q3", "Máximo (Máx)", "RIC", "LI", "LS"), Valor=c(X_precio, Mo_precio, S_precio, CV_precio, Min_precio, Q1_precio, Me_precio, Q3_precio, Max_precio, RIC_precio, LI_precio, LS_precio))
kable(Tabla_3.1.3, align = "c", caption = NULL)
Indicador Valor
Promedio 267.624942
Moda (Mo) 221.293528
Desv. Est.(S) 22.019414
Coef.Var. (CV) 8.227714
Mínimo (Mín) 221.293528
Q1 251.075079
Mediana (Q2) 264.646540
Q3 287.327460
Máximo (Máx) 309.699932
RIC 36.252382
LI 196.696506
LS 341.706033

2. Para analizar el tamaño de la vivienda en función de su tipo.

2.1 Generales, para cualquier tipo de vivienda:

# 3.2 Generales: Para cualquier tipo de vivienda. #

# Tabla de frecuencias absolutas para el área construída de las viviendas. #
Tabla_area=table(Datos_limpios$`Área construída`)

# Tabla de frecuencias absolutas para el área construída de las viviendas. #
X_area=mean(Datos_limpios$`Área construída`)
Me_area=median(Datos_limpios$`Área construída`)
Mo_area=as.numeric(names(Tabla_area)[which.max(Tabla_area)])
S_area=sd(Datos_limpios$`Área construída`)
CV_area=(S_area  / abs(X_area)) * 100

Tabla_3.2.1=data.frame(Indicador=c("Promedio", "Mediana (Me)", "Moda (Mo)", "Desv. Est. (S)", "Coef.Var. (CV)"), Valor=c(X_area, Me_area, Mo_area, S_area, CV_area))
kable(Tabla_3.2.1, align = "c", caption = NULL)
Indicador Valor
Promedio 87.62954
Mediana (Me) 75.00000
Moda (Mo) 60.00000
Desv. Est. (S) 36.34651
Coef.Var. (CV) 41.47746

2.2 Sectorizados por tipo de vivienda:

2.2.1 Por apartamento:

# 3.2.1 Por apartamento: #
Datos_apartamento <- Datos_limpios %>% filter(`Tipo de vivienda` == "Apartamento")

# 3.2.1.1 Tabla de frecuencias absolutas para el área construída de los apartamentos. #
Tabla_area=table(Datos_apartamento$`Área construída`)

# 3.2.1.2 Calcular la media (X), mediana (Me), moda (Mo), desviación estándar (S) y coeficiente de variación (CV) del área construída del apartamento. #
X_area=mean(Datos_apartamento$`Área construída`)
Me_area=median(Datos_apartamento$`Área construída`)
Mo_area=as.numeric(names(Tabla_area)[which.max(Tabla_area)])
S_area=sd(Datos_apartamento$`Área construída`)
CV_area=(S_area / abs(X_area)) * 100
Min_area=summary(Datos_apartamento$`Área construída`)[1]
Q1_area=summary(Datos_apartamento$`Área construída`)[2]
Q2_area=Me_area
Q3_area=summary(Datos_apartamento$`Área construída`)[5]
Max_area=summary(Datos_apartamento$`Área construída`)[6]
RIC_area=Q3_area-Q1_area
LI_area=Q1_area-(1.5 * RIC_area)
LS_area=Q3_area+(1.5 * RIC_area)

Tabla_3.1.3=data.frame(Indicador=c("Promedio", "Moda (Mo)", "Desv. Est.(S)", "Coef.Var. (CV)", "Mínimo (Mín)", "Q1", "Mediana (Q2)", "Q3", "Máximo (Máx)", "RIC", "LI", "LS"), Valor=c(X_area, Mo_area, S_area, CV_area, Min_area, Q1_area, Me_area, Q3_area, Max_area, RIC_area, LI_area, LS_area))
kable(Tabla_3.1.3, align = "c", caption = NULL)
Indicador Valor
Promedio 75.47836
Moda (Mo) 60.00000
Desv. Est.(S) 22.56461
Coef.Var. (CV) 29.89547
Mínimo (Mín) 40.00000
Q1 60.00000
Mediana (Q2) 70.00000
Q3 84.00000
Máximo (Máx) 200.00000
RIC 24.00000
LI 24.00000
LS 120.00000

2.2.2 Por casa:

# 3.2.2 Por casa: #
Datos_casa <- Datos_limpios %>% filter(`Tipo de vivienda` == "Casa")

# 3.2.2.1 Tabla de frecuencias absolutas para el área construída de la casa. #
Tabla_area=table(Datos_casa$`Área construída`)

# 3.2.2.2 Calcular la media (X), mediana (Me), moda (Mo), desviación estándar (S) y coeficiente de variación (CV) del área construída de la casa. #
X_area=mean(Datos_casa$`Área construída`)
Me_area=median(Datos_casa$`Área construída`)
Mo_area=as.numeric(names(Tabla_area)[which.max(Tabla_area)])
S_area=sd(Datos_casa$`Área construída`)
CV_area=(S_area / abs(X_area)) * 100
Min_area=summary(Datos_casa$`Área construída`)[1]
Q1_area=summary(Datos_casa$`Área construída`)[2]
Q2_area=Me_area
Q3_area=summary(Datos_casa$`Área construída`)[5]
Max_area=summary(Datos_casa$`Área construída`)[6]
RIC_area=Q3_area-Q1_area
LI_area=Q1_area-(1.5 * RIC_area)
LS_area=Q3_area+(1.5 * RIC_area)

Tabla_3.2.3=data.frame(Indicador=c("Promedio", "Moda (Mo)", "Desv. Est.(S)", "Coef.Var. (CV)", "Mínimo (Mín)", "Q1", "Mediana (Q2)", "Q3", "Máximo (Máx)", "RIC", "LI", "LS"), Valor=c(X_area, Mo_area, S_area, CV_area, Min_area, Q1_area, Me_area, Q3_area, Max_area, RIC_area, LI_area, LS_area))
kable(Tabla_3.2.3, align = "c", caption = NULL)
Indicador Valor
Promedio 135.91545
Moda (Mo) 120.00000
Desv. Est.(S) 40.39210
Coef.Var. (CV) 29.71855
Mínimo (Mín) 54.00000
Q1 100.00000
Mediana (Q2) 130.00000
Q3 170.00000
Máximo (Máx) 200.00000
RIC 70.00000
LI -5.00000
LS 275.00000

Discusión

Al observar los gráficos de barras apiladas, donde cada barra representa la frecuencia absoluta o proporción de cada categoría del tipo de vivienda (ya sea apartamento o casa), y las barras están apiladas una al lado de la otra para mostrar la contribución de cada categoría al total, se puede visualizar cómo se distribuyen los precios y tamaños de las viviendas según su tipología.

En el análisis de la variación del precio de la vivienda según su tipo, se observa que el tipo de vivienda no ejerce una influencia dominante sobre su precio. Los apartamentos exhiben frecuencias absolutas de precios ligeramente menores en comparación con las casas, con una diferencia menor al 10%. Esto indica que los precios máximos de los apartamentos y las casas son altamente precisos, sugiriendo que el tipo de vivienda no es un factor determinante en la fijación de precios en el mercado inmobiliario estudiado. La discrepancia mínima en las frecuencias absolutas de precios más costosos entre apartamentos y casas (de 4’509.912 millones de pesos) indica que las propiedades más costosas (entre ambos tipos de propiedad) tienen precios similares (lo cual se evidencia en los indicadores estadísticos del precio sectorizado por el tipo de vivienda, donde las casas más castosas tienen un precio de 309’699.932 millones de pesos, y los apartamentos más costosos presentan un precio de 305’190.020 millones de pesos); lo cual señala que los compradores y vendedores pueden no tener preferencias claras basadas en el tipo de vivienda.

De manera similar, el análisis del gráfico de barras donde se observa la variación del tamaño de la vivienda según el tipo de la misma, revela una tendencia similar en cuanto a la relación entre el tamaño y el tipo de vivienda, sin una influencia dominante evidente. Se observa que tanto los apartamentos como las casas exhiben frecuencias absolutas de áreas construidas similares, con un valor máximo idéntico. Esta igualdad en las frecuencias absolutas de áreas construidas sugiere que, independientemente del tipo de vivienda, los compradores y vendedores pueden tener preferencias equilibradas en cuanto al tamaño de la propiedad.

De manera similar, el análisis del gráfico de barras que muestra la variación del tamaño de la vivienda según su tipo revela una tendencia similar en cuanto a la relación entre el tamaño y el tipo de vivienda (sin una influencia dominante evidente). Tanto los apartamentos como las casas exhiben exactitud en el tamaño máximo alcanzado en los datos comprendidos (áreas máximas construidas iguales para apartamentos y casas), con un valor máximo de 200 metros cuadrados. Esta igualdad de tamaño sugiere que, independientemente del tipo de vivienda, los compradores y vendedores pueden tener preferencias equilibradas en cuanto al tamaño de la propiedad.

Continuando con los diagramas de cajas y alambres, se observa que las casas presentan una caja más ancha que las de los apartamentos en ambos gráficos. Esto indica que hay una variabilidad mayor en los precios y tamaños de las casas en comparación con los apartamentos, lo cual sugiere que los precios y tamaños de las casas tienden a ser más diversos o dispersos que los de los apartamentos (quizá se deba a una mayor diversidad y flexibilidad en la demanda y oferta en el mercado de viviendas, lo que puede tener diversas implicaciones para los compradores y/o vendedores). Además, la mediana de los precios para cada tivo de vivienda respectivo, indica que al menos el 50% de los apartamentos y casas cuestan 236’138.198 y 264’646.540 millones de pesos, respectivamente, lo que sugiere que, en general, el al menos el 50% las casas tienen precios ligeramente más altos que los apartamentos en el conjunto de datos estudiado.

En cuanto a otros indicadores estadísticos como los rangos intercuartílicos (RIC), se evidencia una tendencia donde los RIC de las casas son mayores que los de los apartamentos en ambos conceptos: precio y tamaño. Por ejemplo, el RIC de los precios de las casas es de 36’252.382 millones de pesos, mientras que para los apartamentos es de 14’791.126 millones de pesos. Esto sugiere que hay una mayor dispersión en los precios de las casas en comparación con los apartamentos. Mientras los tamaños de las viviendas, el RIC para las casas y apartamentos es de 70 y 24 metros cuadrados, correspondientemente. Esta diferencia en los RIC indica que hay una mayor variabilidad en los tamaños de las casas en comparación con los apartamentos, lo cual está respaldado por los resultados de coeficientes de variación (CV), los cuales exhiben que las áreas construidas de las casas o apartamentos varían significativamente entre sí (los datos de los tamaños de las viviendas son heterogéneos, pues sus CV esán entre el 20% y 50%). En contraste con sus precios, que no presentan variaciones significativas entre sí (los datos de los precios de los apartamentos y casas son homogéneos, pues sus CV están entre el 5% y 20%).

Los diagramas también permiten realizar una interpretación en cuanto al tipo de asimetría correspondiente, donde se observan asimetrías positivas en todos los gráficos, indicando que la parte más larga de la distribución está por encima de la mediana en cada caso. De hecho, si se enfoca en sus valores correpondientes a las medianas y mínimos de los precios y áreas construídas por vivienda,se observa que respecto a la mediana, el mínimo de cada variable comprendida es más largo, lo cual sugiere una asimetría positiva en ambas distribuciones de precios y tamaños de las viviendas. Este hallazgo confirma que, en promedio, los precios y tamaños tienden a estar sesgados hacia valores más altos y áreas construidas más grandes, respectivamente, lo que puede tener diversas implicaciones para los compradores y vendedores en el mercado inmobiliario: Una asimetría positiva en los precios de las viviendas significa que la distribución de los precios está sesgada hacia la derecha, es decir, que hay más viviendas con precios altos que con precios bajos. Esto sugiere que hay una cantidad significativa de viviendas con precios relativamente altos en comparación con las viviendas más económicas. De igual modo, una asimetría positiva en las áreas construidas de las viviendas indica que la distribución de las áreas construidas está sesgada hacia la derecha, lo que significa que hay más viviendas con áreas construidas grandes que con áreas construidas pequeñas. Esto implica que hay una proporción considerable de viviendas con áreas construidas relativamente grandes en comparación con las viviendas con áreas más pequeñas. En conclusión, la asimetría positiva en ambas distribuciones de precios y tamaños de las viviendas puede reflejar una demanda por propiedades más grandes y lujosas, así como una oferta que se enfoca en desarrollar viviendas de mayor tamaño y valor

Otro aspecto a destacar es que sólo se observan datos atípicos en los apartamentos, tanto en precio como en área construida. Estos datos atípicos están más concentrados al inicio del último cuartil, cerca de la caja, y se desvanecen hacia el último bigote del gráfico, lo que sugiere una distribución de datos sesgada positivamente con una presencia de valores atípicos en el extremo superior de la distribución. En contraste, no se observan datos atípicos en los precios y tamaños de las casas, lo que sugiere una distribución más homogénea y predecible en el mercado de las casas, donde las variaciones tienden a ser menos extremas y más consistentes en comparación con los apartamentos. Para verificar esta tendencia en los precios y el tamaño de las viviendas, puede observarse los rangos intercuartílicos (RIC) proporcionados en la sección de indicadores estadísticos. En el caso de los precios, el RIC para las casas es de 36’252.382 millones de pesos, mientras que para los apartamentos es de 14’791.126 millones de pesos. Esto indica que la variabilidad en los precios de las casas es mayor que la de los apartamentos (los precios de las casas pueden variar en un rango más amplio que los precios de los apartamentos). De manera similar, para el tamaño de las viviendas, el RIC para las casas es de 70 metros cuadrados, mientras que para los apartamentos es de 24 metros cuadrados. Esto sugiere que la variabilidad en el tamaño de las casas es mayor que la de los apartamentos.

Sumado a ésto, en el análisis del gráfico de dispersión que relaciona el precio y el área construida según el tipo de vivienda, se evidencia una correlación positiva entre ambas variables para casas y apartamentos, presentados conjuntamente en el mismo gráfico. Esto sugiere que, en promedio, conforme aumenta el tamaño de la vivienda, también lo hace su precio, una dinámica esperada en el mercado inmobiliario, donde las propiedades más grandes suelen tener precios más elevados. La correlación positiva es respaldada por el coeficiente de correlación lineal, que muestra una relación directa entre el precio y el área construida en ambos tipos de vivienda. Notablemente, los apartamentos se concentran mayormente en la parte inferior izquierda del gráfico, indicando una mayor presencia de propiedades con precios más bajos y áreas construidas más reducidas en comparación con las casas. Esta distinción refleja una preferencia marcada de algunos compradores por apartamentos compactos y accesibles, mientras que otros optan por casas más amplias y costosas. La moda, que representa el valor más frecuente en cada distribución, confirma esta tendencia al mostrar que los precios y áreas construidas más comunes para los apartamentos tienden a ser más bajos que para las casas.

Adicionalmente, conforme aumenta tanto el precio como el área construida de la vivienda, se observa una dispersión más amplia de los puntos representativos de los apartamentos, sugiriendo una menor disponibilidad de unidades en el segmento de precios y tamaños más altos. Esta tendencia puede indicar una escasez de apartamentos de lujo o de mayor tamaño en el mercado, lo que influye en la dinámica de precios y en la demanda de viviendas. En contraste, las casas exhiben una dispersión más amplia en todo el gráfico en comparación con los apartamentos, reflejando una mayor variabilidad en precios y tamaños. Esta variabilidad puede estar influenciada por diversos factores, como la ubicación, el diseño arquitectónico, la antigüedad y las características específicas de cada propiedad.

Conclusiones

El análisis detallado de los gráficos de barras apiladas sugiere que el tipo de vivienda no determina completamente los precios y tamaños en el mercado inmobiliario estudiado. Aunque las diferencias de precios entre apartamentos y casas son mínimas, se destaca una mayor variabilidad en los precios y tamaños de las casas en comparación con los apartamentos.

Este análisis se respalda con los diagramas de cajas y alambres, donde se destaca una mayor variabilidad en los precios y tamaños de las casas en comparación con los apartamentos. Esto indica que las casas tienden a ser más diversas en términos de precios y tamaños, lo cual puede reflejar una mayor flexibilidad en la oferta y la demanda en el mercado de viviendas.

Por otro lado, al observar la distribución de datos sesgada positivamente en los apartamentos, se evidencia la presencia de valores atípicos en el extremo superior de la distribución, sugiriendo una demanda específica por apartamentos de lujo o de mayor tamaño. Esta tendencia contrasta con la distribución más homogénea y predecible en el mercado de las casas, donde las variaciones tienden a ser menos extremas y más consistentes.

En conclusión, los datos muestran que el tipo de vivienda no es el factor determinante en la fijación de precios y tamaños en el mercado inmobiliario estudiado; es decir, los precios y tamaños de las viviendas parecen estar influenciados por factores adicionales, como la ubicación y las comodidades, más allá del tipo de vivienda; ésto sugiere una tendencia hacia la disponibilidad de viviendas con precios altos y áreas construidas grandes en el mercado inmobiliario, lo que podría influir en la competencia y la dinámica del mercado.Sin embargo, se observa una mayor variabilidad en las casas, lo que puede reflejar una oferta más diversificada para satisfacer las preferencias de los compradores.