Introducción

La empresa B&C (Bienes y Casas) es una agencia inmobiliaria que opera en Cali, Colombia. La empresa fue fundada hace 10 años por Sandra Milena y actualmente emplea a 8 agentes inmobiliarios.

El mercado inmobiliario de Cali ha crecido significativamente en los últimos años, impulsado por el crecimiento de la población, la inversión extranjera directa y el desarrollo de nuevos proyectos inmobiliarios. En 2021, la industria generó ventas por $6.700 millones en Cali y $6.100 millones en 2022. Se espera que la industria continúe creciendo en los próximos años, contribuyendo así al crecimiento económico regional.

Objetivos

El objetivo de este informe es dar a conocer información de interes para los directivos de la empresa B & C inmobiliaria y así poder tomar decisiones sobre su negocio como lo sería: definir su nicho de mercado, desarrollar estrategias de marketing, establecer precios de venta y ofrecer servicios personalizados a sus clientes.

Analisis exploratorio

Comenzamos con un análisis exploratorio de los datos disponibles. Se examinan 13 columnas y 8322 filas. Identificamos que las variables “Piso” y “Parqueaderos” tienen una cantidad significativa de valores faltantes, lo que representa más del 30% y casi el 20% de los datos, respectivamente.

library(paqueteMOD)
library(ggplot2)
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.1.3
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(naniar)
## Warning: package 'naniar' was built under R version 4.1.3
library(paqueteMET)
## 
## Attaching package: 'paqueteMET'
## The following objects are masked from 'package:paqueteMOD':
## 
##     adjusted_size, Cnk, intervalo.var, Pnk, sizemu, sizep
library(dplyr)
library(mice)
## 
## Attaching package: 'mice'
## The following object is masked from 'package:stats':
## 
##     filter
## The following objects are masked from 'package:base':
## 
##     cbind, rbind
library(modeest)
## Warning: package 'modeest' was built under R version 4.1.3
library(plotrix)
library(psych)
## Registered S3 method overwritten by 'psych':
##   method         from  
##   plot.residuals rmutil
## 
## Attaching package: 'psych'
## The following object is masked from 'package:plotrix':
## 
##     rescale
## The following objects are masked from 'package:ggplot2':
## 
##     %+%, alpha
library(corrplot)
## Warning: package 'corrplot' was built under R version 4.1.3
## corrplot 0.92 loaded
library(cluster)
library(FactoMineR)
library(factoextra)
## Warning: package 'factoextra' was built under R version 4.1.3
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
library(ggplot2)
library(cluster)
library(vcd)
## Loading required package: grid
library(dplyr)
library(viridis)
## Loading required package: viridisLite
data(vivienda)
head(vivienda)
## # A tibble: 6 x 13
##      id zona    piso  estrato preciom areaconst parqueaderos banios habitaciones
##   <dbl> <chr>   <chr>   <dbl>   <dbl>     <dbl>        <dbl>  <dbl>        <dbl>
## 1  1147 Zona O~ <NA>        3     250        70            1      3            6
## 2  1169 Zona O~ <NA>        3     320       120            1      2            3
## 3  1350 Zona O~ <NA>        3     350       220            2      2            4
## 4  5992 Zona S~ 02          4     400       280            3      5            3
## 5  1212 Zona N~ 01          5     260        90            1      2            3
## 6  1724 Zona N~ 01          5     240        87            1      3            3
## # i 4 more variables: tipo <chr>, barrio <chr>, longitud <dbl>, latitud <dbl>
dimension <- dim(vivienda)
dimension 
## [1] 8322   13
str(vivienda)
## spc_tbl_ [8,322 x 13] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
##  $ id          : num [1:8322] 1147 1169 1350 5992 1212 ...
##  $ zona        : chr [1:8322] "Zona Oriente" "Zona Oriente" "Zona Oriente" "Zona Sur" ...
##  $ piso        : chr [1:8322] NA NA NA "02" ...
##  $ estrato     : num [1:8322] 3 3 3 4 5 5 4 5 5 5 ...
##  $ preciom     : num [1:8322] 250 320 350 400 260 240 220 310 320 780 ...
##  $ areaconst   : num [1:8322] 70 120 220 280 90 87 52 137 150 380 ...
##  $ parqueaderos: num [1:8322] 1 1 2 3 1 1 2 2 2 2 ...
##  $ banios      : num [1:8322] 3 2 2 5 2 3 2 3 4 3 ...
##  $ habitaciones: num [1:8322] 6 3 4 3 3 3 3 4 6 3 ...
##  $ tipo        : chr [1:8322] "Casa" "Casa" "Casa" "Casa" ...
##  $ barrio      : chr [1:8322] "20 de julio" "20 de julio" "20 de julio" "3 de julio" ...
##  $ longitud    : num [1:8322] -76.5 -76.5 -76.5 -76.5 -76.5 ...
##  $ latitud     : num [1:8322] 3.43 3.43 3.44 3.44 3.46 ...
##  - attr(*, "spec")=List of 3
##   ..$ cols   :List of 13
##   .. ..$ id          : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   .. ..$ zona        : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
##   .. ..$ piso        : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
##   .. ..$ estrato     : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   .. ..$ preciom     : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   .. ..$ areaconst   : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   .. ..$ parqueaderos: list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   .. ..$ banios      : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   .. ..$ habitaciones: list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   .. ..$ tipo        : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
##   .. ..$ barrio      : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
##   .. ..$ longitud    : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   .. ..$ latitud     : list()
##   .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
##   ..$ default: list()
##   .. ..- attr(*, "class")= chr [1:2] "collector_guess" "collector"
##   ..$ delim  : chr ";"
##   ..- attr(*, "class")= chr "col_spec"
##  - attr(*, "problems")=<externalptr>
vivienda %>% 
  summarise_all(funs(sum(is.na(.))))
## Warning: `funs()` was deprecated in dplyr 0.8.0.
## i Please use a list of either functions or lambdas:
## 
## # Simple named list: list(mean = mean, median = median)
## 
## # Auto named with `tibble::lst()`: tibble::lst(mean, median)
## 
## # Using lambdas list(~ mean(., trim = .2), ~ median(., na.rm = TRUE))
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
## # A tibble: 1 x 13
##      id  zona  piso estrato preciom areaconst parqueaderos banios habitaciones
##   <int> <int> <int>   <int>   <int>     <int>        <int>  <int>        <int>
## 1     3     3  2638       3       2         3         1605      3            3
## # i 4 more variables: tipo <int>, barrio <int>, longitud <int>, latitud <int>
gg_miss_var(vivienda, show_pct = TRUE)

Tratamiento para Missing values

Dado que las variables que presentan mayor número de datos perdidos son: Piso y Parqueadero con 2630 y 1605 respectivamente excluiremos estos NA de nuestro análisis ya que al ser un porcentaje de NA altos en caso de realizar una imputación tan grande, esto podría tener un impacto en la representatividad de los datos, es decir, podría cambiar la naturaleza de la distribución original de los datos, además de posible introducción de sesgo.

Inicialmente se calcula la media para las variables numericas ignorando los valores faltantes, posterior a esto se asigna la media calculada a los valores faltantes.

Se calcula la moda para las variables categoricas utilizando la función mfv() y se asigna la moda calculada a los valores faltantes de cada variable categorica.

media_parqueaderos <- mean(vivienda$parqueaderos, na.rm = TRUE)
vivienda$parqueaderos[is.na(vivienda$parqueaderos)] <- media_parqueaderos

if(is.numeric(vivienda$piso)) {
    vivienda$piso[is.na(vivienda$piso)] <- mean(vivienda$piso, na.rm = TRUE)
} else {
  vivienda$piso <- as.numeric(vivienda$piso)
  vivienda$piso[is.na(vivienda$piso)] <- mean(vivienda$piso, na.rm = TRUE)
}

media_latitud <- mean(vivienda$latitud, na.rm = TRUE)
vivienda$latitud[is.na(vivienda$latitud)] <- media_latitud

media_longitud <- mean(vivienda$longitud, na.rm = TRUE)
vivienda$longitud[is.na(vivienda$longitud)] <- media_longitud

moda_barrio <- mfv(vivienda$barrio, na.rm = TRUE)
## argument 'na.rm' is soft-deprecated, please start using 'na_rm' instead
vivienda$barrio[is.na(vivienda$barrio)] <- moda_barrio

moda_tipo <- mfv(vivienda$tipo, na.rm = TRUE)
## argument 'na.rm' is soft-deprecated, please start using 'na_rm' instead
vivienda$tipo[is.na(vivienda$tipo)] <- moda_tipo

media_habitaciones <- mean(vivienda$habitaciones, na.rm = TRUE)
vivienda$habitaciones[is.na(vivienda$habitaciones)] <- media_habitaciones

media_banios <- mean(vivienda$banios, na.rm = TRUE)
vivienda$banios[is.na(vivienda$banios)] <- media_banios

media_areaconst <- mean(vivienda$areaconst, na.rm = TRUE)
vivienda$areaconst[is.na(vivienda$areaconst)] <- media_areaconst

media_estrato <- mean(vivienda$estrato, na.rm = TRUE)
vivienda$estrato[is.na(vivienda$estrato)] <- media_estrato

moda_zona <- mfv(vivienda$zona, na.rm = TRUE)
## argument 'na.rm' is soft-deprecated, please start using 'na_rm' instead
vivienda$zona[is.na(vivienda$zona)] <- moda_zona

media_preciom <- mean(vivienda$preciom, na.rm = TRUE)
vivienda$preciom[is.na(vivienda$preciom)] <- media_preciom

media_id <- mean(vivienda$id, na.rm = TRUE)
vivienda$id[is.na(vivienda$id)] <- media_id

grafico <-md.pattern(vivienda, rotate.names = TRUE)
##  /\     /\
## {  `---'  }
## {  O   O  }
## ==>  V <==  No need for mice. This data set is completely observed.
##  \  \|/  /
##   `-----'

Estadisticas Descriptivas

Exploramos las variables cualitativas y cuantitativas en el conjunto de datos. Observamos que la zona más común de residencia es la zona sur, seguida de la zona norte y la zona oeste. Además, encontramos que la mayoría de las personas viven en apartamentos en comparación con casas.

Distribucion por zona

table(vivienda$zona)
## 
##  Zona Centro   Zona Norte   Zona Oeste Zona Oriente     Zona Sur 
##          124         1920         1198          351         4729
barplot(prop.table(table(vivienda1$zona)),col=c("orange","blue", "red", "green", "yellow"),
        legend.text=c("Zona Centro","Zona Norte","Zona Oeste","Zona Oriente", "Zona Sur"),
        ylim=c(0,1.2),ylab="Frecuencias Relativas")

Distribucion por tipo de vivienda

La variable tipo que hace referencia al tipo de vivienda, como análisis tenemos que 5103 personas viven en apartamento y 3219 personas viven en casa.

table(vivienda$tipo)
## 
## Apartamento        Casa 
##        5103        3219
proporciones <- c(5103, 3219) # creamos un vector con proporciones
etiquetas <- c("apartamento", "casa") # vector con etiquetas

pct <- round(proporciones/sum(proporciones)*100)
etiquetas <- paste(etiquetas, pct) # Añadimos porcentajes a etiquetas
etiquetas <- paste(etiquetas,"%",sep="") # Añadimos el símbolo de %

pie(proporciones,labels = etiquetas,
    col=rainbow(length(etiquetas)),
    main="Diagrama de torta: tipo de vivienda")

# Añadimos un cuadro con leyendas
legend("topright", c("apartamento","casa"), cex = 0.8,
       fill = rainbow(length(proporciones)))

Precio vs Tamaño de la vivienda

Podemos ver que hay una relacion entre el precio y tamaño de la vivienda donde a medida que el tamaño de la vivienda es mas grande, esto va a tomar un precio mayor.

ggplot(vivienda, aes(x = areaconst, y = preciom)) +
  geom_point() +
  labs(x = "Área Construida", y = "Precio", title = "Precio vs. Tamaño de la Vivienda")

ANALISIS DE COMPONENTES PRINCIPALES

ANALISIS DE CONGLOMERADOS

Se realiza un análisis de componentes principales para comprender mejor la estructura de las variables relacionadas con las características de las viviendas. Se encuentra una asociación fuerte entre el tamaño de la vivienda, la ubicación (estrato) y el precio. Sin embargo, la variable que indica el tipo de piso muestra una correlación baja con el precio, posiblemente debido a la alta proporción de valores faltantes en esta variable.

vivienda$piso <- round(vivienda$piso)
head(vivienda)
## # A tibble: 6 x 13
##      id zona     piso estrato preciom areaconst parqueaderos banios habitaciones
##   <dbl> <chr>   <dbl>   <dbl>   <dbl>     <dbl>        <dbl>  <dbl>        <dbl>
## 1  1147 Zona O~     4       3     250        70            1      3            6
## 2  1169 Zona O~     4       3     320       120            1      2            3
## 3  1350 Zona O~     4       3     350       220            2      2            4
## 4  5992 Zona S~     2       4     400       280            3      5            3
## 5  1212 Zona N~     1       5     260        90            1      2            3
## 6  1724 Zona N~     1       5     240        87            1      3            3
## # i 4 more variables: tipo <chr>, barrio <chr>, longitud <dbl>, latitud <dbl>
housing_num = vivienda[, c("piso","estrato","preciom","areaconst","parqueaderos","habitaciones","longitud","latitud")]
housing_scaled = scale(housing_num)

print(cor(housing_scaled[, c("piso","estrato","areaconst","parqueaderos","habitaciones","longitud","latitud")], housing_scaled[, c("preciom")]), method = "render")
##                      [,1]
## piso         -0.009597976
## estrato       0.609802978
## areaconst     0.687347834
## parqueaderos  0.630822172
## habitaciones  0.264089619
## longitud     -0.343586159
## latitud      -0.115666874

Al observar la correlación entre las variables numéricas y el precio de la vivienda, podemos notar lo siguiente:

  1. Hay una asociación fuerte entre el tamaño de la vivienda (representado por la variable ‘areaconst’), la ubicación (estrato), y el precio de la vivienda (‘preciom’). Esto sugiere que, en general, las viviendas más grandes y ubicadas en estratos más altos tienden a tener precios más altos.

  2. La variable que indica el número de pisos (‘piso’) parece tener una correlación baja con el precio de la vivienda.

Tenemos de acuerdo al grafico siguiente que tener en cuenta que la desviación estándar mide la cantidad de variación o dispersión de un conjunto de valores. Una desviación estándar más alta indica que los puntos de datos están más dispersos en un rango más amplio. En este caso, PC1 tiene la desviación estándar más alta (1.7091), seguida de PC2 (1.2301).

En cuanto a la proporción de varianza muestra la proporción de la varianza total en los datos originales que explica cada componente principal. PC1 explica el 36.51% de la varianza total, PC2 explica el 18.91% y la proporción acumulada indica la proporción acumulada de varianza explicada por cada componente principal y todos los componentes anteriores a él. Muestra cuánta varianza total se explica al agregar más componentes principales. Por ejemplo, la proporción acumulada para PC1 es del 36.51%, para PC1 y PC2 combinados es del 55.43%.

En resumen, este análisis nos dice que PC1 captura la mayor variación en los datos, seguida por PC2, PC3, y así sucesivamente. Juntos, estos componentes explican una parte significativa de la varianza en el conjunto de datos, con PC1 solo explicando el 36.51% y los dos primeros componentes combinados explicando el 55.43%.

pca_result <- prcomp(housing_scaled, scale. = TRUE)
summary(pca_result)
## Importance of components:
##                           PC1    PC2    PC3     PC4     PC5     PC6     PC7
## Standard deviation     1.7091 1.2301 1.0237 0.87702 0.84688 0.69425 0.59926
## Proportion of Variance 0.3651 0.1891 0.1310 0.09614 0.08965 0.06025 0.04489
## Cumulative Proportion  0.3651 0.5543 0.6852 0.78139 0.87104 0.93129 0.97617
##                            PC8
## Standard deviation     0.43658
## Proportion of Variance 0.02383
## Cumulative Proportion  1.00000
biplot(pca_result)

Dado que graficamente no es tan claro cuantos clusters agrupan la información utilizaremos K-means, en especifico Elbow method el cual consiste en ejecutar el algoritmo de clustering para diferentes valores de K y luego trazar la suma de las distancias al cuadrado de los puntos de datos al centroide más cercano para cada valor de K.Se debe buscar el “codo” en el gráfico, es decir, el punto donde la tasa de disminución de la suma de las distancias al cuadrado se reduce significativamente.

Utilizando el método del codo, determinamos que tres clusters serían adecuados para agrupar la información. También realizamos un análisis de correspondencia para comprender las relaciones entre las variables cualitativas y cuantitativas en el conjunto de datos.

Para la visualización de los clusters en el espacio de los componentes principales procedemos a aplicar el algoritmo K-means con el numero de clusters determinado, se asigna las observaciones a los clusters correspondientes y se visualizan las observaciones en el espacio de los dos primeros componentes principales (PC1 y PC2) obtenidos del PCA, coloreadas por los clusters asignados por el algoritmo K-means.

k_values <- 2:10  # Prueba con diferentes valores de K
ss <- numeric(length(k_values))

for (i in 1:length(k_values)) {
  kmeans_model <- kmeans(housing_scaled, centers = k_values[i])
  ss[i] <- kmeans_model$tot.withinss
}

# Método del codo
plot(k_values, ss, type = "b", pch = 19, frame = FALSE, 
     xlab = "Número de clusters (K)", ylab = "Suma de cuadrados dentro del grupo (SSW)",
     main = "Método del codo")

optimal_k_elbow <- k_values[which.max(-diff(ss))]
optimal_k_elbow
## [1] 2
optimal_k <- optimal_k_elbow
kmeans_model <- kmeans(housing_scaled, centers = optimal_k)
clusters <- kmeans_model$cluster

housing_pca <- prcomp(housing_scaled, scale = TRUE)
housing_pca_df <- data.frame(housing_pca$x, cluster = clusters)
ggplot(housing_pca_df, aes(x = PC1, y = PC2, color = factor(clusters))) + geom_point() + labs(x = "PC1", y = "PC2")

Las cargas indican la correlación entre cada variable original y el primer componente principal. Variables con cargas más altas en valor absoluto (tanto positivas como negativas) tienen una mayor influencia en la formación del componente principal. En este caso, las variables “preciom”, “areaconst”, “parqueaderos” y “estrato” tienen las cargas más altas, lo que significa que estas variables tienen una mayor influencia en la variabilidad capturada por el primer componente principal.

El primer componente principal parece estar relacionado principalmente con características relacionadas con el precio de la vivienda y sus características físicas, como el área de construcción, el número de parqueaderos, el estrato socioeconómico y la longitud. Las habitaciones y la latitud tienen una contribución menor en comparación con las otras variables mencionadas.

loadings <- pca_result$rotation
print(loadings[,1])
##         piso      estrato      preciom    areaconst parqueaderos habitaciones 
##  -0.06432899   0.38435183   0.52621261   0.46485417   0.43896802   0.24325677 
##     longitud      latitud 
##  -0.28559628  -0.14735787

Mediante el análisis de silueta proporciona una medida de cuán bien agrupadas están las observaciones en los clusters.

  1. El primer cluster tiene 2653 unidades y un ancho de silueta promedio de 0.3198881.
  2. El segundo cluster tiene 5669 unidades y un ancho de silueta promedio de 0.1164419.

Estos valores indican que, en general, las observaciones en el primer cluster están más bien agrupadas y tienen una mayor cohesión en comparación con el segundo cluster, donde las observaciones están más dispersas y tienen una menor cohesión.

En cuanto a los anchos de la silueta individuales disponemos de:

  1. El ancho de silueta mínimo es -0.5334.
  2. El primer cuartil es -0.1334.
  3. La mediana es 0.4006.
  4. El ancho de silueta promedio es 0.1813.
  5. El tercer cuartil es 0.4567.
  6. El ancho de silueta máximo es 0.5448.

Estos valores dan una idea de la distribución de los anchos de silueta individuales dentro de los clusters. Una silueta más cercana a 1 indica que la observación está bien clasificada, mientras que una silueta más cercana a -1 indica que la observación puede estar mal clasificada en su cluster y estar más cerca de otro cluster.

En resumen, estos resultados indican que el primer cluster tiene una mejor estructura y cohesión en comparación con el segundo cluster, donde las observaciones están más dispersas. Esto sugiere que el primer cluster puede representar un grupo más homogéneo de propiedades residenciales en comparación con el segundo cluster.

silhouette_avg <- silhouette(clusters, dist(vivienda))
## Warning in dist(vivienda): NAs introducidos por coerción
summary(silhouette_avg)
## Silhouette of 8322 units in 2 clusters from silhouette.default(x = clusters, dist = dist(vivienda)) :
##  Cluster sizes and average silhouette widths:
##        1220        7102 
## 0.003118355 0.007569338 
## Individual silhouette widths:
##      Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
## -0.086941 -0.042000  0.028248  0.006917  0.048061  0.085709

ANALISIS DE CORRESPONDENCIA

res.famd <- FAMD(vivienda[,c("zona","tipo","barrio")], graph = FALSE)
## Warning in do.call("cbind", lapply(x, "is.na")): unable to translate
## 'juanambv<U+222B>' to native encoding
## Warning in do.call("cbind", lapply(x, "is.na")): unable to translate
## 'repv<U+222B>blica de israel' to native encoding
fviz_screeplot(res.famd, addlabels = TRUE)

  1. Distribución por tipo de vivienda: Podemos ver que hay una cantidad significativa de apartamentos en la mayoría de las zonas, con números especialmente altos en algunas como Zona Norte y Zona Sur. Por otro lado, las casas tienden a ser más comunes en áreas como Zona Norte y Zona Oeste.
  2. Variación geográfica: La distribución de los tipos de vivienda varía según la zona geográfica. Por ejemplo, en Zona Norte hay una cantidad notablemente mayor de apartamentos en comparación con las casas, mientras que en Zona Centro la proporción es más equilibrada.
  3. Barrios específicos: Algunos barrios pueden tener una preferencia por un tipo particular de vivienda. Por ejemplo, en barrios como Pance y Ciudad Jardín hay una cantidad significativa de apartamentos, mientras que en otros como El Peñón y Granada predominan las casas.
# Creamos una tabla de contingencia para examinar la relación entre tipo de vivienda y zona
tabla_tipo_zona <- table(vivienda$tipo, vivienda$zona)
print(tabla_tipo_zona)
##              
##               Zona Centro Zona Norte Zona Oeste Zona Oriente Zona Sur
##   Apartamento          24       1198       1029           62     2790
##   Casa                100        722        169          289     1939
# Creamos una tabla de contingencia para examinar la relación entre tipo de vivienda y barrio
tabla_tipo_barrio <- table(vivienda$tipo, vivienda$barrio)
print(tabla_tipo_barrio)
##              
##               20 de julio 3 de julio acopi agua blanca aguablanca aguacatal
##   Apartamento           0          0    88           0          1        98
##   Casa                  3          1    70           1          1        11
##              
##               alameda alameda del rio alameda del río alamos alborada alcazares
##   Apartamento       4               1               1     11        0         2
##   Casa             12               0               1      3        1         0
##              
##               alferez real alfonso lopez alfonso lópez alfonso lópez i
##   Apartamento            1             0             2               0
##   Casa                   1             1            19               1
##              
##               alfv©rez real alto jordán altos de guadalupe altos de menga
##   Apartamento             4           1                  1              3
##   Casa                    1           0                  3              0
##              
##               altos de santa antonio nariño aranjuez arboleda
##   Apartamento              1              0        0        5
##   Casa                     0              2       15        0
##              
##               arboleda campestre candelaria arboledas atanasio girardot
##   Apartamento                             0        38                 1
##   Casa                                    1         0                 8
##              
##               autopista sur bajo aguacatal barranquilla barrio 7de agosto
##   Apartamento             0              1            3                 0
##   Casa                    1              0            3                 1
##              
##               barrio el recuerdo barrio eucarístico barrio obrero
##   Apartamento                  0                  0             0
##   Casa                         1                  1             1
##              
##               barrio tranquilo y base av©rea belalcazar Belalcazar
##   Apartamento                  0           0          0          0
##   Casa                         1           2          3          1
##              
##               belisario caicedo bella suiza bella suiza alta bellavista
##   Apartamento                 2          11                1         36
##   Casa                        0           7                3          7
##              
##               benjamín herrera berlin bloques del limonar bochalema bolivariano
##   Apartamento                0      0                   1        33           1
##   Casa                       8      1                   0         0           0
##              
##               bosques de alboleda bosques del limonar boyacá bretaña
##   Apartamento                   1                  12      0       2
##   Casa                          0                   9      1      14
##              
##               brisas de guadalupe brisas de los Brisas De Los
##   Apartamento                   0            59             1
##   Casa                          1            22             0
##              
##               brisas del guabito brisas del limonar Bueno Madrid buenos aires
##   Apartamento                  0                  1            1            4
##   Casa                         1                  0            0            3
##              
##               caldas Cali cali bella cali canto calibella calicanto
##   Apartamento      1   23          1          0         0         2
##   Casa             0   14          0          1         1         6
##              
##               calicanto viii calima calimio norte calipso cambulos camino real
##   Apartamento              0      0             2       4        2          14
##   Casa                     1      6             3       7        1          21
##              
##               Camino Real campestre caney caney especial cañasgordas
##   Apartamento           1         1    58              1           5
##   Casa                  0         0    30              4           2
##              
##               cañaveralejo cañaverales cañaverales los samanes capri cascajal
##   Apartamento            9          19                       1    43        0
##   Casa                   3           2                       0    13        1
##              
##               cataya real ceibas centelsa centenario Centenario centro
##   Apartamento           1      0        1         12          1      1
##   Casa                  0      1        0          3          0      3
##              
##               cerro cristales cerros de guadalupe champagnat chapinero
##   Apartamento              22                   0          1         0
##   Casa                      0                   1         13         7
##              
##               chiminangos Chiminangos chiminangos 1 etapa chiminangos 2 etapa
##   Apartamento          17           1                   1                   2
##   Casa                  0           0                   0                   0
##              
##               chipichape ciudad 2000 Ciudad 2000 ciudad antejardin
##   Apartamento         25          19           0                 0
##   Casa                 5          76           1                 1
##              
##               ciudad bochalema ciudad capri ciudad cordoba ciudad córdoba
##   Apartamento               48            9              0              1
##   Casa                       0            4             20             14
##              
##               ciudad córdoba reservado ciudad country ciudad del campo
##   Apartamento                        0              0                0
##   Casa                               1              1                1
##              
##               ciudad jardin ciudad jardín Ciudad Jardín ciudad jardin pance
##   Apartamento             9           221             0                   1
##   Casa                   13           295             2                   0
##              
##               ciudad los alamos ciudad los álamos ciudad melendez
##   Apartamento                 1                14               1
##   Casa                        0                11               0
##              
##               ciudad melv©ndez ciudad modelo ciudad pacifica Ciudad Pacifica
##   Apartamento                1             1               2               1
##   Casa                       0             6               0               0
##              
##               ciudad real ciudad talanga ciudad universitaria
##   Apartamento           0              0                    1
##   Casa                  3              1                    0
##              
##               ciudadela comfandi ciudadela del río ciudadela melendez
##   Apartamento                  2                 0                  1
##   Casa                        15                 1                  0
##              
##               ciudadela paso ancho ciudadela pasoancho colinas de menga
##   Apartamento                    0                   3                3
##   Casa                           1                  18                0
##              
##               colinas del bosque colinas del sur colon colseguros
##   Apartamento                  0               3     0         22
##   Casa                         1               5     1         22
##              
##               colseguros andes Colseguros Andes comfenalco compartir
##   Apartamento                1                0          1         0
##   Casa                       3                1          0         1
##              
##               conjunto gibraltar cristales cristobal colón cristóbal colón
##   Apartamento                  1        72               2               0
##   Casa                         0        11              12               2
##              
##               cuarto de legua departamental ed benjamin herrera el bosque
##   Apartamento              30            16                   1        12
##   Casa                     14            13                   0        37
##              
##               El Bosque el caney El Caney el castillo el cedro el diamante
##   Apartamento         1      124        1           0        0           0
##   Casa                0       84        0           6        8           2
##              
##               el dorado el gran limonar el guabal el guabito el ingenio
##   Apartamento         6               3         4          0        128
##   Casa                0               5        15          1         74
##              
##               El Ingenio el ingenio 3 el ingenio i el ingenio ii el ingenio iii
##   Apartamento          0            1           13             9             10
##   Casa                 1            0            6            12             10
##              
##               el jardín el jordán el lido el limonar el nacional el paraíso
##   Apartamento         4         1      34         59           0          0
##   Casa               11         0      25         76           1          3
##              
##               el peñon el prado el refugio el rodeo el sena el troncal
##   Apartamento       56        1         77        0       0          7
##   Casa               4        1         43        1       1         12
##              
##               el trv©bol el vallado eucarístico evaristo garcía
##   Apartamento          0          0           0               1
##   Casa                 5          1           2               1
##              
##               farrallones de pance fenalco kennedy fepicol flora
##   Apartamento                    0               0       1     1
##   Casa                           1               1       0     0
##              
##               flora industrial floralia fonaviemcali francisco eladio ramirez
##   Apartamento               12        3            0                        0
##   Casa                       4        3            1                        1
##              
##               fuentes de la gaitan gran limonar granada guadalupe
##   Apartamento             1      0            8       5        10
##   Casa                    0      1           16      10        11
##              
##               guadalupe alto guaduales guayaquil hacienda alferez real ingenio
##   Apartamento              1         2         2                     0       1
##   Casa                     0         0        14                     1       0
##              
##               ingenio i ingenio ii jamundi jamundi alfaguara
##   Apartamento         0          1       0                 0
##   Casa                1          0       4                 1
##              
##               jorge eliecer gaitán jorge isaacs jose manuel marroquín juanambu
##   Apartamento                    0            0                     0        2
##   Casa                           1            1                     1        0
##              
##                      juanambv<U+222B> junin junín la alborada la alianza la arboleda
##   Apartamento               41     2     0           4          5          18
##   Casa                      12    16     6           1          0           0
##              
##               la base la buitrera la campiña la cascada la ceibas la esmeralda
##   Apartamento       4           0          9          2         0            0
##   Casa             11           3          4          5         1            1
##              
##               la flora La Flora la floresta la fortaleza la gran colombia
##   Apartamento      267        1           5            0                0
##   Casa              99        1          13            4                1
##              
##               la hacienda La Hacienda la independencia la libertad la luisa
##   Apartamento         108           1                0           0        1
##   Casa                 56           1               12           2        0
##              
##               la merced la morada la nueva base la playa la portada al
##   Apartamento         2         0             3        0             0
##   Casa               24         1             5        1             1
##              
##               la primavera la reforma la rivera la rivera i la rivera ii
##   Apartamento            0          0         2           0            0
##   Casa                   1          1         9           2            2
##              
##               la riverita la riviera la selva la villa del laflora
##   Apartamento           0          0        7            0       1
##   Casa                  1          1        4            1       0
##              
##               lares de comfenalco las acacias las amv©ricas las camelias
##   Apartamento                   1           1             1            1
##   Casa                          0          11             2            0
##              
##               las ceibas las delicias las granjas las quintas de las vegas
##   Apartamento          8            2           7              0         0
##   Casa                15            3           3              1         1
##              
##               las vegas de libertadores los alamos los alcazares los alcázares
##   Apartamento            1            0          1            17             5
##   Casa                   0            3          0             0             0
##              
##               los andes los cambulos los cámbulos los cristales
##   Apartamento         8           19            4           137
##   Casa               13            6            2            17
##              
##               los cristales club los farallones los guaduales Los Guaduales
##   Apartamento                  1              2            15             1
##   Casa                         0              2            10             0
##              
##               los guayacanes los jockeys los libertadores
##   Apartamento              1           0                0
##   Casa                     2           1                4
##              
##               los parques barranquilla los robles lourdes mamellan manzanares
##   Apartamento                        6          1       0        0          4
##   Casa                               0          0       2        1          1
##              
##               mariano ramos marroquín iii mayapan las vegas melendez melv©ndez
##   Apartamento             0             0                32       40        21
##   Casa                    1             1                14       12         2
##              
##               menga metropolitano del norte miradol del aguacatal miraflores
##   Apartamento    21                      20                     1          6
##   Casa            2                       1                     0         19
##              
##               Miraflores morichal de comfandi multicentro municipal napoles
##   Apartamento          0                    1          27         0       1
##   Casa                 1                    2           0         3       1
##              
##               nápoles normandia normandía normandía west point norte
##   Apartamento      12         5       150                    1     8
##   Casa             17         0         4                    0     1
##              
##               norte la flora nueva base nueva floresta nueva tequendama
##   Apartamento              1          0              1               37
##   Casa                     0          1             14               36
##              
##               oasis de comfandi oasis de pasoancho occidente pacara pacará
##   Apartamento                 5                  1        10     17      4
##   Casa                        1                  0         1      2      0
##              
##               palmas del ingenio pampa linda pampalinda panamericano pance
##   Apartamento                  0          13          3            2   206
##   Casa                         1          13          9            7   203
##              
##               Pance parcelaciones pance parque residencial el paseo de los
##   Apartamento     0                  18                     0            0
##   Casa            3                  43                     1            2
##              
##               paso del comercio pasoancho poblado campestre ponce popular
##   Apartamento                 4         5                 0     1       1
##   Casa                        2         1                 2     0       5
##              
##               portada de comfandi portales de comfandi porvenir
##   Apartamento                   1                    0        1
##   Casa                          1                    1        2
##              
##               prados de oriente prados del limonar Prados Del Limonar
##   Apartamento                 2                  3                  1
##   Casa                        4                 17                  0
##              
##               prados del norte Prados Del Norte prados del sur primavera
##   Apartamento               95                1              0         0
##   Casa                      31                0              2         2
##              
##               primero de mayo primitivo crespo puente del comercio puente palma
##   Apartamento              24                0                   6            0
##   Casa                     13                3                   0            1
##              
##               quintas de don Quintas De Don quintas de salomia
##   Apartamento             58              0                  0
##   Casa                    14              1                  4
##              
##               rafael uribe uribe refugio        repv<U+222B>blica de israel
##   Apartamento                  0       2                           0
##   Casa                         1       0                           1
##              
##               rincon de la rincón de salomia riveras del valle rozo la torre
##   Apartamento            1                 1                 0             0
##   Casa                   0                 0                 1             1
##              
##               saavedra galindo salomia samanes samanes de guadalupe sameco
##   Apartamento                1      20       1                    1      1
##   Casa                       3      20       0                    0      0
##              
##               san antonio san bosco san carlos san cayetano san fernando
##   Apartamento           1         4          0            0           21
##   Casa                 23         4          4            9           33
##              
##               San Fernando san fernando nuevo san fernando viejo san joaquin
##   Apartamento            1                  4                  6           1
##   Casa                   0                  6                 12           3
##              
##               san joaquín san juan bosco san judas san judas tadeo san luis
##   Apartamento           0              1         0               0        0
##   Casa                 16              6         1               2        2
##              
##               san luís san nicolas san nicolás san pedro san vicente santa
##   Apartamento        0           0           0         3          16     1
##   Casa               1           1           1         0          32     0
##              
##               santa anita Santa Anita santa anita sur santa bárbara santa elena
##   Apartamento          37           2               0             1           1
##   Casa                 11           0               1             2           9
##              
##               santa fe santa helena de santa isabel Santa Isabel santa monica
##   Apartamento        0               0           43            1           35
##   Casa               8               1           20            0           16
##              
##               Santa Monica santa mónica santa mónica alta santa monica norte
##   Apartamento            0            2                 1                  1
##   Casa                   1            1                 0                  1
##              
##               santa monica popular santa mónica popular
##   Apartamento                    1                    2
##   Casa                           1                    5
##              
##               santa monica residencial santa mónica residencial santa rita
##   Apartamento                        0                       23         37
##   Casa                               5                       16          8
##              
##               santa rosa santa teresita Santa Teresita Santafe santander
##   Apartamento          1            250              1       0         0
##   Casa                 0             12              0       1         1
##              
##               santo domingo Santo Domingo sector aguacatal
##   Apartamento             1             0                1
##   Casa                    4             1                0
##              
##               sector cañaveralejo guadalupe seminario sierras de normandía
##   Apartamento                             2        23                    1
##   Casa                                    0         9                    0
##              
##               siete de agosto simón bolivar tejares cristales tejares de san
##   Apartamento               1             0                 1              2
##   Casa                      7             1                 3             12
##              
##               templete tequendama tequendema terrón colorado torres de comfandi
##   Apartamento        2         15          0               0                 55
##   Casa               2         29          1               1                  2
##              
##               unicentro cali unión de vivienda urbanización barranquilla
##   Apartamento              1                 2                         2
##   Casa                     0                 1                         2
##              
##               urbanización boyacá urbanización colseguros urbanizacion el saman
##   Apartamento                   0                       2                     0
##   Casa                          1                       1                     1
##              
##               urbanizacion gratamira urbanización la flora
##   Apartamento                      1                    60
##   Casa                             0                    23
##              
##               urbanización la merced urbanización la nueva
##   Apartamento                      0                     1
##   Casa                             4                     3
##              
##               urbanización las cascadas urbanizacion lili
##   Apartamento                         0                 0
##   Casa                                1                 2
##              
##               urbanización nueva granada urbanización pacara
##   Apartamento                          1                   1
##   Casa                                 2                   0
##              
##               urbanización río lili urbanización san joaquin
##   Apartamento                     3                        0
##   Casa                            2                        4
##              
##               urbanización tequendama valle de lili valle del lili
##   Apartamento                       2             1            843
##   Casa                              5             0            168
##              
##               Valle Del Lili valle grande versalles villa colombia
##   Apartamento              1            1        55              0
##   Casa                     0            0        16              6
##              
##               villa de veracruz villa del lago villa del parque villa del prado
##   Apartamento                 2              4                1              11
##   Casa                        4              6                0              40
##              
##               Villa Del Prado villa del sol villa del sur villas de veracruz
##   Apartamento               0            13             3                  1
##   Casa                      1            12             2                  7
##              
##               Villas De Veracruz vipasa zona centro zona norte zona norte los
##   Apartamento                  0      1           0         13              1
##   Casa                         1     31           1         19              0
##              
##               zona oeste zona oriente zona residencial zona sur
##   Apartamento         22            2                1       32
##   Casa                 4           16                0       42

Procedemos a realizar un analisis mas detallado para determinar si existe una asociacion significativa entre el tipo de vivienda y la zona o el barrio.

resultado_chi_cuadrado <- chisq.test(tabla_tipo_zona)
print(resultado_chi_cuadrado)
## 
##  Pearson's Chi-squared test
## 
## data:  tabla_tipo_zona
## X-squared = 690.79, df = 4, p-value < 2.2e-16

El resultado de la prueba de chi-cuadrado para la asociación entre el tipo de vivienda y la zona es significativo (p < 2.2e-16), lo que indica que hay una asociación estadísticamente significativa entre estas dos variables. En otras palabras, el tipo de vivienda está asociado de manera significativa con la zona geográfica en la que se encuentra.

resultado_chi_cuadrado <- chisq.test(tabla_tipo_barrio)
## Warning in chisq.test(tabla_tipo_barrio): Chi-squared approximation may be
## incorrect
print(resultado_chi_cuadrado)
## 
##  Pearson's Chi-squared test
## 
## data:  tabla_tipo_barrio
## X-squared = 2470.1, df = 435, p-value < 2.2e-16

El resultado de la prueba de chi-cuadrado para la asociación entre el tipo de vivienda y el barrio también es altamente significativo (p < 2.2e-16), lo que indica que hay una asociación estadísticamente significativa entre estas dos variables. Esto sugiere que el tipo de vivienda está relacionado de manera significativa con el barrio en el que se encuentra. En otras palabras, el tipo de vivienda no se distribuye de manera uniforme entre los diferentes barrios, sino que hay una asociación entre el tipo de vivienda y el barrio.

vivienda$tipo <- as.factor(vivienda$tipo)
vivienda$zona <- as.factor(vivienda$zona)
vivienda$barrio <- as.factor(vivienda$barrio)

class(vivienda$tipo)
## [1] "factor"
class(vivienda$zona)
## [1] "factor"
class(vivienda$barrio)
## [1] "factor"
res_mca <- MCA(vivienda[, c("tipo", "zona", "barrio")], graph = FALSE)
## Warning in do.call(data.frame, c(x, alis)): unable to translate
## 'juanambv<U+222B>' to native encoding
## Warning in do.call(data.frame, c(x, alis)): unable to translate
## 'repv<U+222B>blica de israel' to native encoding
summary(res_mca)
## 
## Call:
## MCA(X = vivienda[, c("tipo", "zona", "barrio")], graph = FALSE) 
## 
## 
## Eigenvalues
##                        Dim.1   Dim.2   Dim.3   Dim.4   Dim.5   Dim.6   Dim.7
## Variance               0.711   0.660   0.651   0.623   0.444   0.333   0.333
## % of var.              0.485   0.450   0.444   0.425   0.303   0.227   0.227
## Cumulative % of var.   0.485   0.935   1.379   1.804   2.106   2.334   2.561
##                        Dim.8   Dim.9  Dim.10  Dim.11  Dim.12  Dim.13  Dim.14
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.   2.788   3.016   3.243   3.470   3.697   3.925   4.152
##                       Dim.15  Dim.16  Dim.17  Dim.18  Dim.19  Dim.20  Dim.21
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.   4.379   4.606   4.834   5.061   5.288   5.516   5.743
##                       Dim.22  Dim.23  Dim.24  Dim.25  Dim.26  Dim.27  Dim.28
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.   5.970   6.197   6.425   6.652   6.879   7.106   7.334
##                       Dim.29  Dim.30  Dim.31  Dim.32  Dim.33  Dim.34  Dim.35
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.   7.561   7.788   8.016   8.243   8.470   8.697   8.925
##                       Dim.36  Dim.37  Dim.38  Dim.39  Dim.40  Dim.41  Dim.42
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.   9.152   9.379   9.606   9.834  10.061  10.288  10.516
##                       Dim.43  Dim.44  Dim.45  Dim.46  Dim.47  Dim.48  Dim.49
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  10.743  10.970  11.197  11.425  11.652  11.879  12.106
##                       Dim.50  Dim.51  Dim.52  Dim.53  Dim.54  Dim.55  Dim.56
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  12.334  12.561  12.788  13.016  13.243  13.470  13.697
##                       Dim.57  Dim.58  Dim.59  Dim.60  Dim.61  Dim.62  Dim.63
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  13.925  14.152  14.379  14.606  14.834  15.061  15.288
##                       Dim.64  Dim.65  Dim.66  Dim.67  Dim.68  Dim.69  Dim.70
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  15.516  15.743  15.970  16.197  16.425  16.652  16.879
##                       Dim.71  Dim.72  Dim.73  Dim.74  Dim.75  Dim.76  Dim.77
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  17.106  17.334  17.561  17.788  18.016  18.243  18.470
##                       Dim.78  Dim.79  Dim.80  Dim.81  Dim.82  Dim.83  Dim.84
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  18.697  18.925  19.152  19.379  19.606  19.834  20.061
##                       Dim.85  Dim.86  Dim.87  Dim.88  Dim.89  Dim.90  Dim.91
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  20.288  20.516  20.743  20.970  21.197  21.425  21.652
##                       Dim.92  Dim.93  Dim.94  Dim.95  Dim.96  Dim.97  Dim.98
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  21.879  22.106  22.334  22.561  22.788  23.016  23.243
##                       Dim.99 Dim.100 Dim.101 Dim.102 Dim.103 Dim.104 Dim.105
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  23.470  23.697  23.925  24.152  24.379  24.606  24.834
##                      Dim.106 Dim.107 Dim.108 Dim.109 Dim.110 Dim.111 Dim.112
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  25.061  25.288  25.516  25.743  25.970  26.197  26.425
##                      Dim.113 Dim.114 Dim.115 Dim.116 Dim.117 Dim.118 Dim.119
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  26.652  26.879  27.106  27.334  27.561  27.788  28.016
##                      Dim.120 Dim.121 Dim.122 Dim.123 Dim.124 Dim.125 Dim.126
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  28.243  28.470  28.697  28.925  29.152  29.379  29.606
##                      Dim.127 Dim.128 Dim.129 Dim.130 Dim.131 Dim.132 Dim.133
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  29.834  30.061  30.288  30.516  30.743  30.970  31.197
##                      Dim.134 Dim.135 Dim.136 Dim.137 Dim.138 Dim.139 Dim.140
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  31.425  31.652  31.879  32.106  32.334  32.561  32.788
##                      Dim.141 Dim.142 Dim.143 Dim.144 Dim.145 Dim.146 Dim.147
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  33.016  33.243  33.470  33.697  33.925  34.152  34.379
##                      Dim.148 Dim.149 Dim.150 Dim.151 Dim.152 Dim.153 Dim.154
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  34.606  34.834  35.061  35.288  35.516  35.743  35.970
##                      Dim.155 Dim.156 Dim.157 Dim.158 Dim.159 Dim.160 Dim.161
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  36.197  36.425  36.652  36.879  37.106  37.334  37.561
##                      Dim.162 Dim.163 Dim.164 Dim.165 Dim.166 Dim.167 Dim.168
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  37.788  38.016  38.243  38.470  38.697  38.925  39.152
##                      Dim.169 Dim.170 Dim.171 Dim.172 Dim.173 Dim.174 Dim.175
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  39.379  39.606  39.834  40.061  40.288  40.516  40.743
##                      Dim.176 Dim.177 Dim.178 Dim.179 Dim.180 Dim.181 Dim.182
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  40.970  41.197  41.425  41.652  41.879  42.106  42.334
##                      Dim.183 Dim.184 Dim.185 Dim.186 Dim.187 Dim.188 Dim.189
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  42.561  42.788  43.016  43.243  43.470  43.697  43.925
##                      Dim.190 Dim.191 Dim.192 Dim.193 Dim.194 Dim.195 Dim.196
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  44.152  44.379  44.606  44.834  45.061  45.288  45.516
##                      Dim.197 Dim.198 Dim.199 Dim.200 Dim.201 Dim.202 Dim.203
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  45.743  45.970  46.197  46.425  46.652  46.879  47.106
##                      Dim.204 Dim.205 Dim.206 Dim.207 Dim.208 Dim.209 Dim.210
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  47.334  47.561  47.788  48.016  48.243  48.470  48.697
##                      Dim.211 Dim.212 Dim.213 Dim.214 Dim.215 Dim.216 Dim.217
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  48.925  49.152  49.379  49.606  49.834  50.061  50.288
##                      Dim.218 Dim.219 Dim.220 Dim.221 Dim.222 Dim.223 Dim.224
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  50.516  50.743  50.970  51.197  51.425  51.652  51.879
##                      Dim.225 Dim.226 Dim.227 Dim.228 Dim.229 Dim.230 Dim.231
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  52.106  52.334  52.561  52.788  53.016  53.243  53.470
##                      Dim.232 Dim.233 Dim.234 Dim.235 Dim.236 Dim.237 Dim.238
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  53.697  53.925  54.152  54.379  54.606  54.834  55.061
##                      Dim.239 Dim.240 Dim.241 Dim.242 Dim.243 Dim.244 Dim.245
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  55.288  55.516  55.743  55.970  56.197  56.425  56.652
##                      Dim.246 Dim.247 Dim.248 Dim.249 Dim.250 Dim.251 Dim.252
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  56.879  57.106  57.334  57.561  57.788  58.016  58.243
##                      Dim.253 Dim.254 Dim.255 Dim.256 Dim.257 Dim.258 Dim.259
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  58.470  58.697  58.925  59.152  59.379  59.606  59.834
##                      Dim.260 Dim.261 Dim.262 Dim.263 Dim.264 Dim.265 Dim.266
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  60.061  60.288  60.516  60.743  60.970  61.197  61.425
##                      Dim.267 Dim.268 Dim.269 Dim.270 Dim.271 Dim.272 Dim.273
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  61.652  61.879  62.106  62.334  62.561  62.788  63.016
##                      Dim.274 Dim.275 Dim.276 Dim.277 Dim.278 Dim.279 Dim.280
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  63.243  63.470  63.697  63.925  64.152  64.379  64.606
##                      Dim.281 Dim.282 Dim.283 Dim.284 Dim.285 Dim.286 Dim.287
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  64.834  65.061  65.288  65.516  65.743  65.970  66.197
##                      Dim.288 Dim.289 Dim.290 Dim.291 Dim.292 Dim.293 Dim.294
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  66.425  66.652  66.879  67.106  67.334  67.561  67.788
##                      Dim.295 Dim.296 Dim.297 Dim.298 Dim.299 Dim.300 Dim.301
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  68.016  68.243  68.470  68.697  68.925  69.152  69.379
##                      Dim.302 Dim.303 Dim.304 Dim.305 Dim.306 Dim.307 Dim.308
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  69.606  69.834  70.061  70.288  70.516  70.743  70.970
##                      Dim.309 Dim.310 Dim.311 Dim.312 Dim.313 Dim.314 Dim.315
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  71.197  71.425  71.652  71.879  72.106  72.334  72.561
##                      Dim.316 Dim.317 Dim.318 Dim.319 Dim.320 Dim.321 Dim.322
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  72.788  73.016  73.243  73.470  73.697  73.925  74.152
##                      Dim.323 Dim.324 Dim.325 Dim.326 Dim.327 Dim.328 Dim.329
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  74.379  74.606  74.834  75.061  75.288  75.516  75.743
##                      Dim.330 Dim.331 Dim.332 Dim.333 Dim.334 Dim.335 Dim.336
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  75.970  76.197  76.425  76.652  76.879  77.106  77.334
##                      Dim.337 Dim.338 Dim.339 Dim.340 Dim.341 Dim.342 Dim.343
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  77.561  77.788  78.016  78.243  78.470  78.697  78.925
##                      Dim.344 Dim.345 Dim.346 Dim.347 Dim.348 Dim.349 Dim.350
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  79.152  79.379  79.606  79.834  80.061  80.288  80.516
##                      Dim.351 Dim.352 Dim.353 Dim.354 Dim.355 Dim.356 Dim.357
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  80.743  80.970  81.197  81.425  81.652  81.879  82.106
##                      Dim.358 Dim.359 Dim.360 Dim.361 Dim.362 Dim.363 Dim.364
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  82.334  82.561  82.788  83.016  83.243  83.470  83.697
##                      Dim.365 Dim.366 Dim.367 Dim.368 Dim.369 Dim.370 Dim.371
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  83.925  84.152  84.379  84.606  84.834  85.061  85.288
##                      Dim.372 Dim.373 Dim.374 Dim.375 Dim.376 Dim.377 Dim.378
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  85.516  85.743  85.970  86.197  86.425  86.652  86.879
##                      Dim.379 Dim.380 Dim.381 Dim.382 Dim.383 Dim.384 Dim.385
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  87.106  87.334  87.561  87.788  88.016  88.243  88.470
##                      Dim.386 Dim.387 Dim.388 Dim.389 Dim.390 Dim.391 Dim.392
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  88.697  88.925  89.152  89.379  89.606  89.834  90.061
##                      Dim.393 Dim.394 Dim.395 Dim.396 Dim.397 Dim.398 Dim.399
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  90.288  90.516  90.743  90.970  91.197  91.425  91.652
##                      Dim.400 Dim.401 Dim.402 Dim.403 Dim.404 Dim.405 Dim.406
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  91.879  92.106  92.334  92.561  92.788  93.016  93.243
##                      Dim.407 Dim.408 Dim.409 Dim.410 Dim.411 Dim.412 Dim.413
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  93.470  93.697  93.925  94.152  94.379  94.606  94.834
##                      Dim.414 Dim.415 Dim.416 Dim.417 Dim.418 Dim.419 Dim.420
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  95.061  95.288  95.516  95.743  95.970  96.197  96.425
##                      Dim.421 Dim.422 Dim.423 Dim.424 Dim.425 Dim.426 Dim.427
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  96.652  96.879  97.106  97.334  97.561  97.788  98.016
##                      Dim.428 Dim.429 Dim.430 Dim.431 Dim.432 Dim.433 Dim.434
## Variance               0.333   0.333   0.333   0.333   0.333   0.333   0.333
## % of var.              0.227   0.227   0.227   0.227   0.227   0.227   0.227
## Cumulative % of var.  98.243  98.470  98.697  98.925  99.152  99.379  99.606
##                      Dim.435 Dim.436 Dim.437 Dim.438 Dim.439 Dim.440
## Variance               0.333   0.161   0.046   0.018   0.012   0.006
## % of var.              0.227   0.110   0.032   0.012   0.008   0.004
## Cumulative % of var.  99.834  99.944  99.975  99.988  99.996 100.000
## 
## Individuals (the 10 first)
##                 Dim.1    ctr   cos2    Dim.2    ctr   cos2    Dim.3    ctr
## 1            |  2.720  0.125  0.008 |  0.908  0.015  0.001 |  2.620  0.127
## 2            |  2.720  0.125  0.008 |  0.908  0.015  0.001 |  2.620  0.127
## 3            |  2.720  0.125  0.008 |  0.908  0.015  0.001 |  2.620  0.127
## 4            |  0.680  0.008  0.000 | -0.637  0.007  0.000 | -0.223  0.001
## 5            | -0.198  0.001  0.002 |  1.319  0.032  0.094 | -0.723  0.010
## 6            | -0.198  0.001  0.002 |  1.319  0.032  0.094 | -0.723  0.010
## 7            | -0.198  0.001  0.002 |  1.319  0.032  0.094 | -0.723  0.010
## 8            | -0.198  0.001  0.002 |  1.319  0.032  0.094 | -0.723  0.010
## 9            |  0.268  0.001  0.004 |  1.325  0.032  0.093 | -0.697  0.009
## 10           |  0.268  0.001  0.004 |  1.325  0.032  0.093 | -0.697  0.009
##                cos2  
## 1             0.007 |
## 2             0.007 |
## 3             0.007 |
## 4             0.000 |
## 5             0.028 |
## 6             0.028 |
## 7             0.028 |
## 8             0.028 |
## 9             0.026 |
## 10            0.026 |
## 
## Categories (the 10 first)
##                  Dim.1     ctr    cos2  v.test     Dim.2     ctr    cos2
## Apartamento  |  -0.457   5.993   0.330 -52.437 |  -0.006   0.001   0.000
## Casa         |   0.724   9.500   0.330  52.437 |   0.009   0.002   0.000
## Zona Centro  |   2.007   2.813   0.061  22.512 |   0.239   0.043   0.001
## Zona Norte   |  -0.056   0.033   0.001  -2.775 |   1.602  29.903   0.770
## Zona Oeste   |  -1.725  20.081   0.500 -64.525 |   0.159   0.184   0.004
## Zona Oriente |   2.931  16.982   0.378  56.096 |   1.087   2.515   0.052
## Zona Sur     |   0.189   0.956   0.047  19.822 |  -0.778  17.354   0.796
## 20 de julio  |   3.225   0.176   0.004   5.587 |   1.117   0.023   0.000
## 3 de julio   |   0.806   0.004   0.000   0.806 |  -0.784   0.004   0.000
## acopi        |   0.011   0.000   0.000   0.139 |   1.619   2.514   0.051
##               v.test     Dim.3     ctr    cos2  v.test  
## Apartamento   -0.644 |  -0.024   0.019   0.001  -2.808 |
## Casa           0.644 |   0.039   0.030   0.001   2.808 |
## Zona Centro    2.684 |   0.773   0.456   0.009   8.673 |
## Zona Norte    80.039 |  -0.845   8.445   0.214 -42.232 |
## Zona Oeste     5.947 |   1.573  18.251   0.416  58.855 |
## Zona Oriente  20.802 |   3.054  20.152   0.411  58.465 |
## Zona Sur     -81.390 |  -0.302   2.660   0.120 -31.637 |
## 20 de julio    1.935 |   3.247   0.195   0.004   5.625 |
## 3 de julio    -0.784 |  -0.277   0.000   0.000  -0.277 |
## acopi         20.550 |  -0.880   0.753   0.015 -11.170 |
## 
## Categorical variables (eta2)
##                Dim.1 Dim.2 Dim.3  
## tipo         | 0.330 0.000 0.001 |
## zona         | 0.872 0.990 0.976 |
## barrio       | 0.931 0.990 0.976 |
plot(res_mca, invisible = "ind") 

El análisis de correspondencia múltiple (MCA) realizado en el conjunto de datos de vivienda muestra que las primeras dimensiones capturan una cantidad significativa de varianza. Las dos primeras dimensiones explican el 93.5% de la varianza total, mientras que las cinco primeras dimensiones explican el 100% de la varianza acumulada. Esto sugiere que las primeras dimensiones son importantes para describir la estructura de los datos.

Resultados

Analisis exploratorio de datos:

  1. Se identificaron variables críticas como tamaño de la vivienda, ubicación, estrato y precio.
  2. Se observó una cantidad significativa de valores faltantes en las variables de Piso y Parqueaderos.

Estadisticas descriptivas:

  1. Se encontró una distribución desigual en la preferencia por tipo de vivienda en diferentes zonas de Cali.
  2. La relación entre el precio y el tamaño de la vivienda mostró una tendencia clara, donde las viviendas más grandes tienden a tener precios más altos.

Analisis de componentes principales y conglomerados:

  1. El PCA reveló una fuerte asociación entre el tamaño de la vivienda, la ubicación, destacando la importancia de estas variables en la determinación del precio de una propiedad.
  2. El análisis de conglomerados identificó segmentos de mercado distintos, lo que sugiere la necesidad de estrategias de marketing diferenciadas para cada uno.

Analisis de correspondencia:

  1. Se encontraron asociaciones significativas entre el tipo de vivienda y la zona o el barrio, lo que indica la importancia de adaptar la oferta de viviendas a las preferencias locales.

Conclusiones

Basado en el análisis realizado, se extraen las siguientes conclusiones clave:

  1. Existe una fuerte asociación entre el tamaño de la vivienda, la ubicación y el precio.
  2. Se identificaron segmentos de mercado distintos a través del análisis de conglomerados, lo que sugiere la posibilidad de desarrollar estrategias de marketing personalizadas.
  3. Las preferencias del mercado varían según la zona geográfica y el barrio, lo que resalta la importancia de adaptar la oferta de viviendas a las necesidades locales.

Recomendaciones

Con base en las conclusiones anteriores, se formulan las siguientes recomendaciones específicas para la empresa B&C:

  1. Desarrollar estrategias de marketing personalizadas para cada segmento identificado, aprovechando las diferencias en preferencias y comportamientos de compra.
  2. Priorizar la expansión en áreas con alta demanda de ciertos tipos de vivienda, según lo indicado por el análisis de correspondencia.
  3. Implementar sistemas de seguimiento continuo del mercado para adaptarse rápidamente a los cambios en las preferencias del cliente y las condiciones del mercado.