PONTIFICIA UNIVERSIDAD JAVERIANA DE CALI
El Área de Conurbación de Cali (ACC), el comportamiento es similar al departamental. En 2023 Se vendieron 10.477 unidades que corresponde a Cali, Candelaria, Jamundí, Palmira y Yumbo, con una disminución de 67,6% respecto a 2022. La disminución de oferta de vivienda nueva en el ACC se debe a que predominan los proyectos de vivienda de interés social. Las unidades de vivienda nueva vendidas en Cali representaron 57,0% del total de ventas registradas en el ACC, seguido de Jamundí (19,6%) y Candelaria (13,4%)[2].
Por lo anterior, el propósito del informe es presentar realizar un análisis integral y multidimensional de la base de datos para obtener una comprensión del mercado inmobiliario urbano.
Este informe incluye: Análisis de Componentes Principales Análisis de Conglomerados Análisis de Correspondencia Visualización de resultados
Problema
Una empresa inmobiliaria líder en una gran ciudad está buscando comprender en profundidad el mercado de viviendas urbanas para tomar decisiones estratégicas más informadas. La empresa posee una base de datos extensa que contiene información detallada sobre diversas propiedades residenciales disponibles en el mercado. Se requiere realizar un análisis holístico de estos datos para identificar patrones, relaciones y segmentaciones relevantes que permitan mejorar la toma de decisiones en cuanto a la compra, venta y valoración de propiedades.
Base de datos y variables
#devtools::install_github("centromagis/paqueteMODELOS", force = TRUE)
library(paqueteMODELOS)
data("vivienda")
Tratamiento de Datos:
Lo primero que se realizo fue un análisis exploratorio con el propósito de ordenar y limpiar la base de datos, se observó la codificación de las variables, encontrando cinco variables cualitativas (tipo, barrio, piso, estrato y zona) y siete de tipo cuantitativo (precio, área construida, parqueadero, baños, habitación y coordenadas de longitud y altitud) como se observa en la Tabla 1.
Nombre de variable | Tipo de variable |
---|---|
Id | Variable de identificación |
Zona | Cualitativa nominal |
Tipo | Cualitativa nominal |
Barrio | Cualitativa nominal |
Piso | Cualitativa ordinal |
Estrato | Cualitativa ordinal |
Precio | Cuantitativa continua |
Área construida | Cuantitativa continua |
Parqueaderos | Cuantitativa discreta |
Baños | Cuantitativa discreta |
Habitación | Cuantitativa discreta |
Longitud | Cuantitativa continua |
Latitud | Cuantitativa continua |
Variable | Categorías |
---|---|
Tipo | Casa, Apartamento, NA |
Zona | Zona Oriente, Zona Sur, Zona Norte, Zona Oeste, Zona Centro, NA |
Estrato | 3, 4, 5, 6, NA |
Piso | NA, 02, 01, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12 |
Barrio | 20 de julio, 3 de julio, acopi, agua blanca, aguablanca, aguacatal, alameda, alameda del río, alameda del rio, alamos, alborada, alcazares, alf√©rez real, alferez real, alfonso lópez, alfonso lópez i, alfonso lopez, alto jordán, altos de guadalupe, altos de menga, altos de santa, antonio nariño, aranjuez, arboleda, arboleda campestre candelaria, arboledas, atanasio girardot, autopista sur, bajo aguacatal, barranquilla, barrio 7de agosto, barrio el recuerdo, barrio eucarístico, barrio obrero, barrio tranquilo y, base a√©rea, belalcazar, Belalcazar, belisario caicedo, bella suiza, bella suiza alta, bellavista, benjamín herrera, berlin, bloques del limonar, bochalema, bolivariano, bosques de alboleda, bosques del limonar, boyacá, bretaña, brisas de guadalupe, brisas de los, Brisas De Los, brisas del guabito, brisas del limonar, Bueno Madrid, buenos aires, cañasgordas, cañaveralejo, cañaverales, cañaverales los samanes, caldas, Cali, cali bella, cali canto, calibella, calicanto, calicanto viii, calima, calimio norte, calipso, cambulos, camino real, Camino Real, campestre, caney, caney especial, capri, cascajal, cataya real, ceibas, centelsa, centenario, Centenario, centro, cerro cristales, cerros de guadalupe, champagnat, chapinero, chiminangos, Chiminangos, chiminangos 1 etapa, chiminangos 2 etapa, chipichape, ciudad 2000, Ciudad 2000, ciudad antejardin, ciudad bochalema, ciudad córdoba, ciudad córdoba reservado, ciudad capri, ciudad cordoba, ciudad country, ciudad del campo, ciudad jardín, Ciudad Jardín, ciudad jardin, ciudad jardin pance, ciudad los álamos, ciudad los alamos, ciudad mel√©ndez, ciudad melendez, ciudad modelo, ciudad pacifica, Ciudad Pacifica, ciudad real, ciudad talanga, ciudad universitaria, ciudadela comfandi, ciudadela del río, ciudadela melendez, ciudadela paso ancho, ciudadela pasoancho, colinas de menga, colinas del bosque, colinas del sur, colon, colseguros, colseguros andes, Colseguros Andes, comfenalco, compartir, conjunto gibraltar, cristóbal colón, cristales, cristobal colón, cuarto de legua, departamental, ed benjamin herrera, el bosque, El Bosque, el caney, El Caney, el castillo, el cedro, el diamante, el dorado, el gran limonar, el guabal, el guabito, el ingenio, El Ingenio, el ingenio 3, el ingenio i, el ingenio ii, el ingenio iii, el jardín, el jordán, el lido, el limonar, el nacional, el paraíso, el peñon, el prado, el refugio, el rodeo, el sena, el tr√©bol, el troncal, el vallado, eucarístico, evaristo garcía, farrallones de pance, fenalco kennedy, fepicol, flora, flora industrial, floralia, fonaviemcali, francisco eladio ramirez, fuentes de la, gaitan, gran limonar, granada, guadalupe, guadalupe alto, guaduales, guayaquil, hacienda alferez real, ingenio, ingenio i, ingenio ii, jamundi, jamundi alfaguara, jorge eliecer gaitán, jorge isaacs, jose manuel marroquín, juanamb√∫, juanambu, junín, junin, la alborada, la alianza, la arboleda, la base, la buitrera, la campiña, la cascada, la ceibas, la esmeralda, la flora, La Flora, la floresta, la fortaleza, la gran colombia, la hacienda, La Hacienda, la independencia, la libertad, la luisa, la merced, la morada, la nueva base, la playa, la portada al, la primavera, la reforma, la rivera, la rivera i, la rivera ii, la riverita, la riviera, la selva, la villa del, laflora, lares de comfenalco, las acacias, las am√©ricas, las camelias, las ceibas, las delicias, las granjas, las quintas de, las vegas, las vegas de, libertadores, los alamos, los alcázares, los alcazares, los andes, los cámbulos, los cambulos, los cristales, los cristales club, los farallones, los guaduales, Los Guaduales, los guayacanes, los jockeys, los libertadores, los parques barranquilla, los robles, lourdes, mamellan, manzanares, mariano ramos, marroquín iii, mayapan las vegas, mel√©ndez, melendez, menga, metropolitano del norte, miradol del aguacatal, miraflores, Miraflores, morichal de comfandi, multicentro, municipal, nápoles, napoles, normandía, normandía west point, normandia, norte, norte la flora, nueva base, nueva floresta, nueva tequendama, oasis de comfandi, oasis de pasoancho, occidente, pacará, pacara, palmas del ingenio, pampa linda, pampalinda, panamericano, pance, Pance, parcelaciones pance, parque residencial el, paseo de los, paso del comercio, pasoancho, poblado campestre, ponce, popular, portada de comfandi, portales de comfandi, porvenir, prados de oriente, prados del limonar, Prados Del Limonar, prados del norte, Prados Del Norte, prados del sur, primavera, primero de mayo, primitivo crespo, puente del comercio, puente palma, quintas de don, Quintas De Don, quintas de salomia, rafael uribe uribe, refugio, rep√∫blica de israel, rincón de salomia, rincon de la, riveras del valle, rozo la torre, saavedra galindo, salomia, samanes, samanes de guadalupe, sameco, san antonio, san bosco, san carlos, san cayetano, san fernando, San Fernando, san fernando nuevo, san fernando viejo, san joaquín, san joaquin, san juan bosco, san judas, san judas tadeo, san luís, san luis, san nicolás, san nicolas, san pedro, san vicente, santa, santa anita, Santa Anita, santa anita sur, santa bárbara, santa elena, santa fe, santa helena de, santa isabel, Santa Isabel, santa mónica, santa mónica alta, santa mónica popular, santa mónica residencial, santa monica, Santa Monica, santa monica norte, santa monica popular, santa monica residencial, santa rita, santa rosa, santa teresita, Santa Teresita, Santafe, santander, santo domingo, Santo Domingo, sector aguacatal, sector cañaveralejo guadalupe, seminario, sierras de normandía, siete de agosto, simón bolivar, tejares cristales, tejares de san, templete, tequendama, tequendema, terrón colorado, torres de comfandi, unión de vivienda, unicentro cali, urbanización barranquilla, urbanización boyacá, urbanización colseguros, urbanización la flora, urbanización la merced, urbanización la nueva, urbanización las cascadas, urbanización nueva granada, urbanización pacara, urbanización río lili, urbanización san joaquin, urbanización tequendama, urbanizacion el saman, urbanizacion gratamira, urbanizacion lili, valle de lili, valle del lili, Valle Del Lili, valle grande, versalles, villa colombia, villa de veracruz, villa del lago, villa del parque, villa del prado, Villa Del Prado, villa del sol, villa del sur, Villas De Veracruz, villas de veracruz, vipasa, zona centro, zona norte, zona norte los, zona oeste, zona oriente, zona residencial, zona sur, NA |
Se observó que la variable barrio tiene problemas de codificación y se corrigio los errores de codificación en los nombres de la variable.
ANÁLISIS DESCRIPTIVO
Se realizó un análisis descriptivo para las variables cuantitativas, encontrando asimetria positiva y heterogeneidad en las variables de área construida, baños, habitaciones parquederos y precios (Tabla 3).
Tabla 3. Análisis descriptivo
summarytools::descr(vivienda[,c("areaconst", "banios", "preciom", "habitaciones", "latitud", "longitud", "parqueaderos")])
Descriptive Statistics
areaconst banios habitaciones latitud longitud parqueaderos preciom
----------------- ----------- --------- -------------- --------- ---------- -------------- ---------
Mean 174.93 3.11 3.61 3.42 -76.53 1.84 433.89
Std.Dev 142.96 1.43 1.46 0.04 0.02 1.12 328.65
Min 30.00 0.00 0.00 3.33 -76.59 1.00 58.00
Q1 80.00 2.00 3.00 3.38 -76.54 1.00 220.00
Median 123.00 3.00 3.00 3.42 -76.53 2.00 330.00
Q3 229.00 4.00 4.00 3.45 -76.52 2.00 540.00
Max 1745.00 10.00 10.00 3.50 -76.46 10.00 1999.00
MAD 84.51 1.48 1.48 0.05 0.02 1.48 207.56
IQR 149.00 2.00 1.00 0.07 0.02 1.00 320.00
CV 0.82 0.46 0.40 0.01 0.00 0.61 0.76
Skewness 2.69 0.93 1.63 0.03 0.65 2.33 1.85
SE.Skewness 0.03 0.03 0.03 0.03 0.03 0.03 0.03
Kurtosis 12.91 1.13 3.98 -1.15 0.58 8.31 3.67
N.Valid 8319.00 8319.00 8319.00 8319.00 8319.00 6717.00 8320.00
Pct.Valid 99.96 99.96 99.96 99.96 99.96 80.71 99.98
library(ggplot2)
library(cowplot)
# Lista de variables a graficar
variables <- c("areaconst", "banios", "preciom", "habitaciones", "latitud", "longitud", "parqueaderos")
# Crear histogramas para cada variable
graficos <- lapply(variables, function(var) {
ggplot(vivienda, aes(x = .data[[var]])) +
geom_histogram(bins = 30, fill = "steelblue", color = "black", alpha = 0.7) +
labs(title = paste("Histograma de", var), x = var, y = "Frecuencia") +
theme_minimal()
})
# Organizar gráficos
final_plot <- plot_grid(plotlist = graficos, ncol = 4)
print(final_plot)
Figura 1. Histogramas de las variables cuantitativas.
Datos faltantes
Se revisó la presencia de datos faltantes, encontrando que la variable piso tenían 31.70% y parqueadero con 19.28% de datos faltantes, por lo que se decidió imputar estas variables con la mediana y la moda, dado a que estas presentaban asimetría positiva y para las variables que tenían menos del 1% de datos faltantes se decidió omitir estos datos.
preciom id zona estrato areaconst banios habitaciones tipo barrio longitud
4808 1 1 1 1 1 1 1 1 1 1
1909 1 1 1 1 1 1 1 1 1 1
876 1 1 1 1 1 1 1 1 1 1
726 1 1 1 1 1 1 1 1 1 1
1 1 0 0 0 0 0 0 0 0 0
2 0 0 0 0 0 0 0 0 0 0
2 3 3 3 3 3 3 3 3 3
latitud parqueaderos piso
4808 1 1 1 0
1909 1 1 0 1
876 1 0 1 1
726 1 0 0 2
1 0 0 0 12
2 0 0 0 13
3 1605 2638 4275
#Eliminar filas
vivienda_sf <- vivienda[!is.na(vivienda$id),]
library(naniar)
grafi=gg_miss_var(vivienda_sf)
print(grafi)
Figura 2. Datos faltantes.
# Calcula la mediana de la variable "piso"
moda_piso <- as.numeric(names(which.max(table(vivienda$piso))))
round(0)
[1] 0
vivienda$piso[is.na(vivienda$piso)] <- moda_piso
# Calcula la mediana de la variable "parquedero"
mediana_parquedero<- median(vivienda$parqueaderos, na.rm = TRUE) %>%
round(0)
vivienda$parqueaderos[is.na(vivienda$parqueaderos)] <- mediana_parquedero
p2=VIM::aggr(vivienda, cex.axis = 0.4, cex.lab= 0.8)
print(p2)
Missings in variables:
Variable Count
id 3
zona 3
estrato 3
preciom 2
areaconst 3
banios 3
habitaciones 3
tipo 3
barrio 3
longitud 3
latitud 3
Figura 3. Porcesamiento de datos faltantes.
/\ /\
{ `---' }
{ O O }
==> V <== No need for mice. This data set is completely observed.
\ \|/ /
`-----'
Figura 4. Variables sin datos faltantes.
Se encontró que el 56,8% de las viviendas se encuentran ubicadas en la zona sur de la ciudad, seguido de la zona norte con un 23,1%, la Zona Oeste (14,5%), la zona Oriente (4,2%) y finalmente la menor zona con immuebles es la zona Centro con un 1.5% que correponde a 124 viviendas (Figura 5).
Figura 5. Análisis descriptivo
Se puede observar que la zona Oriente presenta un menor promedio de precio de vivienda comparada con las demás zonas con un valor de $228.530.000. siendo la zona con menor número de inmuebles. Además, cabe mencionar que las demas zonas presentaban bastante variablilidad de la información, por lo que el análisis se realiza a partir de la mediana encontrando que el 50% de las viviendas en esta zona tienen un precio de $210.000.000, tambien se evidencia el precio es muy variable en cada una de las zonas, donde la zona con mayor valorización es la zona Oeste encontrando que el 50% de las viviendas tienen un precio por encima o por debajo de $580.000.000, seguidos de la zona sur donde el 50% tienen un valor de $320.000.000, la zona norte presenta un precio de $300.000.000 y las zona centro tiene una valorización de $297.000.000.
Así mismo, se observa de acuerdo a la oferta de vivienda se observa que el 61,3% (5106 inmuebles) corresponde a apartamentos, mientras que el 38,7% (3221) corresponden a casas. En la zona sur se concentra la mayor cantidad de inmuebles donde el 59% son apartamentos y el 41% son casas. Así mismo, es misma tendencia se observa en las zonas Oeste (1035 inmuebles) y Norte (1199), mientras que en la zona Oriente y centro se tiene mayor porcentaje de casas.
Datos atípicos
A traves de graficos de boxplot (Figura 6) se identifico las variables que presentaban outliers, que en este caso fueron las variables precio de vivienda, área construida, baños, parquedero, habitaciones y coordenadas de longitud.
Figura 6. Boxplot para variables cuantitativas.
Estandarización o normalización de las variables
Con el fin de evitar que las variables que tiene una escala con valores más grandes afecten las estimaciones realizadas (sesgos) se realiza la estandarización de las variables antes de proceder a realizar el proceso de estimación de los componentes principales.
viviendaZ= scale(vivienda[c("areaconst", "banios", "preciom", "habitaciones", "parqueaderos")])
head(viviendaZ)
areaconst banios preciom habitaciones parqueaderos
[1,] -0.7339949 -0.07793773 -0.5595498 1.6406840 -0.8559050
[2,] -0.3842568 -0.77811479 -0.3465670 -0.4147626 -0.8559050
[3,] 0.3152194 -0.77811479 -0.2552886 0.2703863 0.1313764
[4,] 0.7349051 1.32241640 -0.1031580 -0.4147626 1.1186578
[5,] -0.5940997 -0.77811479 -0.5291236 -0.4147626 -0.8559050
[6,] -0.6150839 -0.07793773 -0.5899759 -0.4147626 -0.8559050
Con este análisis se buscó reducir la dimensionalidad del conjunto de datos y visualizar la estructura de las variables en componentes principales, con el propósito de identificar características clave que influyen en la variación de precios y oferta del mercado.
library(PerformanceAnalytics)
columna <- viviendaZ[, c("preciom", "areaconst", "habitaciones","banios","parqueaderos")]
chart.Correlation(columna, histogram = TRUE, method = "spearman")
Figura 7 Correlación de variables
prcomp(viviendaZ)
Standard deviations (1, .., p=5):
[1] 1.7690482 0.9399329 0.6688397 0.5886205 0.4395158
Rotation (n x k) = (5 x 5):
PC1 PC2 PC3 PC4 PC5
areaconst 0.4895828 0.03382407 -0.2492969 0.75082122 0.36507963
banios 0.4897691 0.18974131 -0.2284402 -0.64791742 0.50213802
preciom 0.4743947 -0.37561823 -0.4283944 -0.11301216 -0.66148860
habitaciones 0.3589444 0.75751618 0.3548862 0.04950563 -0.41101476
parqueaderos 0.4080975 -0.49793007 0.7590785 -0.03532650 0.08985529
PC1 PC2 PC3 PC4 PC5
areaconst 23.96913 0.1144068 6.214896 56.3732503 13.3283136
banios 23.98737 3.6001766 5.218492 41.9796980 25.2142591
preciom 22.50503 14.1089052 18.352174 1.2771748 43.7567167
habitaciones 12.88411 57.3830763 12.594422 0.2450808 16.8933134
parqueaderos 16.65436 24.7934352 57.620015 0.1247961 0.8073972
Figura 8 Contribución de variables a cada componente.
De acuerdo, a los resultados se encuentra que la variabilidad del primer componente esta siendo explicada por el área construida con una contribución del 23.96%, el número de baños con una contribución del 23.98% y el precio del inmueble (22.5%). En el segundo componente la variable con mayor contribución es el número de habitaciones con un 57.38% y el número de parquederos con un 24.79%.
library(factoextra)
res.pca <- prcomp(viviendaZ)
fviz_eig(res.pca, addlabels = TRUE)
Figura 9. Porcentaje de variabilidad explicada en cada componente.
En la figura 9 se puede inferir que los dos primeros componentes estan explicando el 80.3% de la varaiblilidad de las variables de estudio.
eig.val <- get_eigenvalue(res.pca)
eig.val
eigenvalue variance.percent cumulative.variance.percent
Dim.1 3.1295314 62.590628 62.59063
Dim.2 0.8834738 17.669476 80.26010
Dim.3 0.4473465 8.946930 89.20703
Dim.4 0.3464741 6.929482 96.13652
Dim.5 0.1931742 3.863483 100.00000
Figura 10. Circulo de correlación de las variables.
Se infiere que el primer componente PC1 que explica el mayor porcentaje de variabilidad de las variables con un 62.6%,tiene información importante del precio de las viviendas, el área construtida, el número de baños y número de parquederos, las cuales tienen una correlación positiva alta, lo que puede indicar que a mayor área construida, mayor número de parqueaderos y mayor número de baños el precio del inmueble incrementa.
En el segundo componente PC2 se encuentra explicada el 17.7% de la variabilidad y contiene información importante de las variables de número de habitaciones y parquederos, para el caso de las habitaciones estas tienen una correlación positiva lo que indica que pueden tener un mayor precio, mientras que el número de parqueaderos tienen una correlación negativa, lo que puede estar relacionado con el hecho de que viviendas con más habitaciones pueden no tener tantos parqueaderos o lo contrario.
Agrupar las propiedades residenciales en segmentos homogéneos con características similares para entender las dinámicas de las ofertas específicas en diferentes partes de la ciudad y en diferentes estratos socioeconómicos.
#dist(viviendaZ, method = "euclidean")
#dist(viviendaZ, method = "manhattan")
Las distancias euclídea y de Manhattan son adecuadas cuando trabajamos con variables continuas y que además estén en una misma escala.
# Elección del número de conglomerados
Método Silhouette
Figura 11. Número óptimo de Cluster método Silhouette
Método de suma de cuadrados dentro del Clúster
Figura 12. Número óptimo de Clúster método uma de cuadrados dentro del Clúster
De acuerdo a los dos métodos el número de cluster adecuado puede ser 3.
Coeficiente de Silhouette promedio k=3 : 0.3857564
Distribución de los individuos por distancias
Figura 13. Distribución de los individuos por componentes
En la Figura 13 se observa que el primer cluster se concentra en valores más bajos de ambas dimensiones, representando un grupo más homogéneo. El segundo cluster tiene valores más altos en Dim2, lo que sugiere que está determinado por variables como numero de habitaciones y parquederos. El tercer cluster se extiende más sobre la Dim1, lo que indica que las variables como precio, área construida y baños son más influyentes en este grupo.
# Graficar dendrograma sin etiquetas individuales
plot(hc_emp, labels = FALSE, cex = 0.6, main = "Dendrograma de viviendas",
las = 1, ylab = "Distancia euclidiana", xlab = "Grupos", hang = -1)
rect.hclust(hc_emp, k = 3, border = 2:5)
Figura 14. Dendograma
De acuerdo a los resultados se pueden formar tres grandes grupos de conglomerados, encontrando que el primer y segundo grupo concentra a la mayoria de las observaciones.
Examinar la relación entre las variables categóricas (tipo de vivienda, zona y estrato), para identificar patrones de comportamiento de la oferta en mercado inmobiliario.
# Cargar librerías necesarias
library(FactoMineR)
library(factoextra)
# Convertir estrato a variable categórica
vivienda$estrato <- as.factor(vivienda$estrato)
vivienda$tipo<-as.factor(vivienda$tipo)
vivienda$zona<-as.factor(vivienda$zona)
# Selección de variables categóricas
vivienda_cat <- vivienda[, c("tipo", "zona", "estrato")]
# Crear tabla de contingencia
tabla <- table(vivienda_cat$estrato, vivienda_cat$zona)
# Ver tabla de frecuencias
print(tabla)
Zona Centro Zona Norte Zona Oeste Zona Oriente Zona Sur
3 105 572 54 340 382
4 14 407 84 8 1616
5 4 769 290 2 1685
6 1 172 770 1 1043
De acuerdo al test de independencia existe una dependencia entre el estrato y la zona como se observa en la figura 15.
chisq.test(tabla)
Pearson's Chi-squared test
data: tabla
X-squared = 3830.4, df = 12, p-value < 2.2e-16
Figura 15. Relación zona y estrato
eigenvalue percentage of variance cumulative percentage of variance
dim 1 0.32215213 69.965515 69.96551
dim 2 0.12745096 27.680002 97.64552
dim 3 0.01084108 2.354483 100.00000
Figura 16. Porcentaje de varianza explicada
**Results of the Multiple Correspondence Analysis (MCA)**
The analysis was performed on 8319 individuals, described by 3 variables
*The results are available in the following objects:
name description
1 "$eig" "eigenvalues"
2 "$var" "results for the variables"
3 "$var$coord" "coord. of the categories"
4 "$var$cos2" "cos2 for the categories"
5 "$var$contrib" "contributions of the categories"
6 "$var$v.test" "v-test for the categories"
7 "$var$eta2" "coord. of variables"
8 "$ind" "results for the individuals"
9 "$ind$coord" "coord. for the individuals"
10 "$ind$cos2" "cos2 for the individuals"
11 "$ind$contrib" "contributions of the individuals"
12 "$call" "intermediate results"
13 "$call$marge.col" "weights of columns"
14 "$call$marge.li" "weights of rows"
Figura 17. Porcentaje de varianza explicada
Multiple Correspondence Analysis Results for variables
===================================================
Name Description
1 "$coord" "Coordinates for categories"
2 "$cos2" "Cos2 for categories"
3 "$contrib" "contributions of categories"
Figura 18. Análisis de correspondencia tipo, estrato y zona del inmueble
Figura 19. Nube de puntos de las Modalidades/Categorias
En la Figura 19 se observa que en la zona norte hay mayor numero de casas y que este es un mercado potencial para este tipo de inmueble, así mismo en la zona sur de la ciudad se encuentra estratos socioeconomicos altos 4 y 5 además estan realcionados con que el inmueble sea un apartamento lo que indica que el precio de los inmuebles es alto y en la zona oeste se encuentra inmuebles en estrato 6. La zona oriente y centro tiene caraacteristicas muy similares encontrando los estratos socioeconomicos más bajos, lo que podria ser un mercado potencial para vivienedas de interes social.
De acuerdo a los resultados obtenidos se encuentra una relación fuerte entre la zona y el estrato socieconómico donde se encuentra el inmueble independiente del tipo de vivienda (casa, apartamento), lo que indica que si un estrato socieconómico es alto se encontrara en las zonas residenciales más costosas o donde los inmuebles adquieren un valor más elevado de acuerdo al promedio como se observa en la zona Oeste y sur de la ciudad.
Por lo que, las decisiones estratégicas que debe asumir la inmobiliaria, deben estar alineadas a la relación entre el estrato socieconómico y las zonas residenciales; y que tambien estan estrechamente relacionadas con el área construída y el precio de los inmuebles.
Se debe tener en cuenta que en la zona sur se encuentra el mayor número de inmuebles, donde se encuentran viviendas de estrato 4 y 5 principalmente y el mayor porcentaje son apartamentos, con precios altos.
En la zona norte se encuentran principalmente casas, con areas de construcción amplias, que indican un mayor número de habitaciones.
La zona Oeste es la que tiene mayor valorización y se encuentran principalmente apartamentos que estan en estrato 6.
En la zona oriente y centro tienen la menor cantidad de viviendas, lo que puede ser un mercado potencial para la urbanización, además los precios de estos inmuebles son bajos comparados con otras zonas encontrando viviendas en estrato 3 principalmente.
REFERENCIAS
[1] E. C. de C. C. DANE, “Balance Económico 2022 Cali - Valle del Cauca,” 2022.
[2] C. de C. de Cali, “Balance Económico 2023 Cali-Valle del Cauca,” 2023.