La empresa B&C (Bienes y Casas) es una agencia inmobiliaria que opera en Cali, Colombia. La empresa fue fundada hace 10 años por Sandra Milena y actualmente emplea a 8 agentes inmobiliarios.
El mercado inmobiliario de Cali ha crecido significativamente en los últimos años, impulsado por el crecimiento de la población, la inversión extranjera directa y el desarrollo de nuevos proyectos inmobiliarios. En 2021, la industria generó ventas por $6.700 millones en Cali y $6.100 millones en 2022. Se espera que la industria continúe creciendo en los próximos años, contribuyendo así al crecimiento económico regional.
El objetivo de este informe es dar a conocer información de interes para los directivos de la empresa B & C inmobiliaria y así poder tomar decisiones sobre su negocio como lo sería: definir su nicho de mercado, desarrollar estrategias de marketing, establecer precios de venta y ofrecer servicios personalizados a sus clientes.
Comenzamos con un análisis exploratorio de los datos disponibles. Se examinan 13 columnas y 8322 filas. Identificamos que las variables “Piso” y “Parqueaderos” tienen una cantidad significativa de valores faltantes, lo que representa más del 30% y casi el 20% de los datos, respectivamente.
library(paqueteMOD)
library(ggplot2)
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.1.3
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(naniar)
## Warning: package 'naniar' was built under R version 4.1.3
library(paqueteMET)
##
## Attaching package: 'paqueteMET'
## The following objects are masked from 'package:paqueteMOD':
##
## adjusted_size, Cnk, intervalo.var, Pnk, sizemu, sizep
library(dplyr)
library(mice)
##
## Attaching package: 'mice'
## The following object is masked from 'package:stats':
##
## filter
## The following objects are masked from 'package:base':
##
## cbind, rbind
library(modeest)
## Warning: package 'modeest' was built under R version 4.1.3
library(plotrix)
library(psych)
## Registered S3 method overwritten by 'psych':
## method from
## plot.residuals rmutil
##
## Attaching package: 'psych'
## The following object is masked from 'package:plotrix':
##
## rescale
## The following objects are masked from 'package:ggplot2':
##
## %+%, alpha
library(corrplot)
## Warning: package 'corrplot' was built under R version 4.1.3
## corrplot 0.92 loaded
library(cluster)
library(FactoMineR)
library(factoextra)
## Warning: package 'factoextra' was built under R version 4.1.3
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
library(ggplot2)
library(cluster)
library(vcd)
## Loading required package: grid
library(dplyr)
library(viridis)
## Loading required package: viridisLite
data(vivienda)
head(vivienda)
## # A tibble: 6 x 13
## id zona piso estrato preciom areaconst parqueaderos banios habitaciones
## <dbl> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 1147 Zona O~ <NA> 3 250 70 1 3 6
## 2 1169 Zona O~ <NA> 3 320 120 1 2 3
## 3 1350 Zona O~ <NA> 3 350 220 2 2 4
## 4 5992 Zona S~ 02 4 400 280 3 5 3
## 5 1212 Zona N~ 01 5 260 90 1 2 3
## 6 1724 Zona N~ 01 5 240 87 1 3 3
## # i 4 more variables: tipo <chr>, barrio <chr>, longitud <dbl>, latitud <dbl>
dimension <- dim(vivienda)
dimension
## [1] 8322 13
str(vivienda)
## spc_tbl_ [8,322 x 13] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
## $ id : num [1:8322] 1147 1169 1350 5992 1212 ...
## $ zona : chr [1:8322] "Zona Oriente" "Zona Oriente" "Zona Oriente" "Zona Sur" ...
## $ piso : chr [1:8322] NA NA NA "02" ...
## $ estrato : num [1:8322] 3 3 3 4 5 5 4 5 5 5 ...
## $ preciom : num [1:8322] 250 320 350 400 260 240 220 310 320 780 ...
## $ areaconst : num [1:8322] 70 120 220 280 90 87 52 137 150 380 ...
## $ parqueaderos: num [1:8322] 1 1 2 3 1 1 2 2 2 2 ...
## $ banios : num [1:8322] 3 2 2 5 2 3 2 3 4 3 ...
## $ habitaciones: num [1:8322] 6 3 4 3 3 3 3 4 6 3 ...
## $ tipo : chr [1:8322] "Casa" "Casa" "Casa" "Casa" ...
## $ barrio : chr [1:8322] "20 de julio" "20 de julio" "20 de julio" "3 de julio" ...
## $ longitud : num [1:8322] -76.5 -76.5 -76.5 -76.5 -76.5 ...
## $ latitud : num [1:8322] 3.43 3.43 3.44 3.44 3.46 ...
## - attr(*, "spec")=List of 3
## ..$ cols :List of 13
## .. ..$ id : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ zona : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
## .. ..$ piso : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
## .. ..$ estrato : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ preciom : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ areaconst : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ parqueaderos: list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ banios : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ habitaciones: list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ tipo : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
## .. ..$ barrio : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_character" "collector"
## .. ..$ longitud : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## .. ..$ latitud : list()
## .. .. ..- attr(*, "class")= chr [1:2] "collector_double" "collector"
## ..$ default: list()
## .. ..- attr(*, "class")= chr [1:2] "collector_guess" "collector"
## ..$ delim : chr ";"
## ..- attr(*, "class")= chr "col_spec"
## - attr(*, "problems")=<externalptr>
vivienda %>%
summarise_all(funs(sum(is.na(.))))
## Warning: `funs()` was deprecated in dplyr 0.8.0.
## i Please use a list of either functions or lambdas:
##
## # Simple named list: list(mean = mean, median = median)
##
## # Auto named with `tibble::lst()`: tibble::lst(mean, median)
##
## # Using lambdas list(~ mean(., trim = .2), ~ median(., na.rm = TRUE))
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
## # A tibble: 1 x 13
## id zona piso estrato preciom areaconst parqueaderos banios habitaciones
## <int> <int> <int> <int> <int> <int> <int> <int> <int>
## 1 3 3 2638 3 2 3 1605 3 3
## # i 4 more variables: tipo <int>, barrio <int>, longitud <int>, latitud <int>
gg_miss_var(vivienda, show_pct = TRUE)
Dado que las variables que presentan mayor número de datos perdidos son: Piso y Parqueadero con 2630 y 1605 respectivamente excluiremos estos NA de nuestro análisis ya que al ser un porcentaje de NA altos en caso de realizar una imputación tan grande, esto podría tener un impacto en la representatividad de los datos, es decir, podría cambiar la naturaleza de la distribución original de los datos, además de posible introducción de sesgo.
Inicialmente se calcula la media para las variables numericas ignorando los valores faltantes, posterior a esto se asigna la media calculada a los valores faltantes.
Se calcula la moda para las variables categoricas utilizando la función mfv() y se asigna la moda calculada a los valores faltantes de cada variable categorica.
media_parqueaderos <- mean(vivienda$parqueaderos, na.rm = TRUE)
vivienda$parqueaderos[is.na(vivienda$parqueaderos)] <- media_parqueaderos
if(is.numeric(vivienda$piso)) {
vivienda$piso[is.na(vivienda$piso)] <- mean(vivienda$piso, na.rm = TRUE)
} else {
vivienda$piso <- as.numeric(vivienda$piso)
vivienda$piso[is.na(vivienda$piso)] <- mean(vivienda$piso, na.rm = TRUE)
}
media_latitud <- mean(vivienda$latitud, na.rm = TRUE)
vivienda$latitud[is.na(vivienda$latitud)] <- media_latitud
media_longitud <- mean(vivienda$longitud, na.rm = TRUE)
vivienda$longitud[is.na(vivienda$longitud)] <- media_longitud
moda_barrio <- mfv(vivienda$barrio, na.rm = TRUE)
## argument 'na.rm' is soft-deprecated, please start using 'na_rm' instead
vivienda$barrio[is.na(vivienda$barrio)] <- moda_barrio
moda_tipo <- mfv(vivienda$tipo, na.rm = TRUE)
## argument 'na.rm' is soft-deprecated, please start using 'na_rm' instead
vivienda$tipo[is.na(vivienda$tipo)] <- moda_tipo
media_habitaciones <- mean(vivienda$habitaciones, na.rm = TRUE)
vivienda$habitaciones[is.na(vivienda$habitaciones)] <- media_habitaciones
media_banios <- mean(vivienda$banios, na.rm = TRUE)
vivienda$banios[is.na(vivienda$banios)] <- media_banios
media_areaconst <- mean(vivienda$areaconst, na.rm = TRUE)
vivienda$areaconst[is.na(vivienda$areaconst)] <- media_areaconst
media_estrato <- mean(vivienda$estrato, na.rm = TRUE)
vivienda$estrato[is.na(vivienda$estrato)] <- media_estrato
moda_zona <- mfv(vivienda$zona, na.rm = TRUE)
## argument 'na.rm' is soft-deprecated, please start using 'na_rm' instead
vivienda$zona[is.na(vivienda$zona)] <- moda_zona
media_preciom <- mean(vivienda$preciom, na.rm = TRUE)
vivienda$preciom[is.na(vivienda$preciom)] <- media_preciom
media_id <- mean(vivienda$id, na.rm = TRUE)
vivienda$id[is.na(vivienda$id)] <- media_id
grafico <-md.pattern(vivienda, rotate.names = TRUE)
## /\ /\
## { `---' }
## { O O }
## ==> V <== No need for mice. This data set is completely observed.
## \ \|/ /
## `-----'
Exploramos las variables cualitativas y cuantitativas en el conjunto de datos. Observamos que la zona más común de residencia es la zona sur, seguida de la zona norte y la zona oeste. Además, encontramos que la mayoría de las personas viven en apartamentos en comparación con casas.
table(vivienda$zona)
##
## Zona Centro Zona Norte Zona Oeste Zona Oriente Zona Sur
## 124 1920 1198 351 4729
barplot(prop.table(table(vivienda1$zona)),col=c("orange","blue", "red", "green", "yellow"),
legend.text=c("Zona Centro","Zona Norte","Zona Oeste","Zona Oriente", "Zona Sur"),
ylim=c(0,1.2),ylab="Frecuencias Relativas")
La variable tipo que hace referencia al tipo de vivienda, como análisis tenemos que 5103 personas viven en apartamento y 3219 personas viven en casa.
table(vivienda$tipo)
##
## Apartamento Casa
## 5103 3219
proporciones <- c(5103, 3219) # creamos un vector con proporciones
etiquetas <- c("apartamento", "casa") # vector con etiquetas
pct <- round(proporciones/sum(proporciones)*100)
etiquetas <- paste(etiquetas, pct) # Añadimos porcentajes a etiquetas
etiquetas <- paste(etiquetas,"%",sep="") # Añadimos el símbolo de %
pie(proporciones,labels = etiquetas,
col=rainbow(length(etiquetas)),
main="Diagrama de torta: tipo de vivienda")
# Añadimos un cuadro con leyendas
legend("topright", c("apartamento","casa"), cex = 0.8,
fill = rainbow(length(proporciones)))
Podemos ver que hay una relacion entre el precio y tamaño de la vivienda donde a medida que el tamaño de la vivienda es mas grande, esto va a tomar un precio mayor.
ggplot(vivienda, aes(x = areaconst, y = preciom)) +
geom_point() +
labs(x = "Área Construida", y = "Precio", title = "Precio vs. Tamaño de la Vivienda")
Se realiza un análisis de componentes principales para comprender mejor la estructura de las variables relacionadas con las características de las viviendas. Se encuentra una asociación fuerte entre el tamaño de la vivienda, la ubicación (estrato) y el precio. Sin embargo, la variable que indica el tipo de piso muestra una correlación baja con el precio, posiblemente debido a la alta proporción de valores faltantes en esta variable.
vivienda$piso <- round(vivienda$piso)
head(vivienda)
## # A tibble: 6 x 13
## id zona piso estrato preciom areaconst parqueaderos banios habitaciones
## <dbl> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 1147 Zona O~ 4 3 250 70 1 3 6
## 2 1169 Zona O~ 4 3 320 120 1 2 3
## 3 1350 Zona O~ 4 3 350 220 2 2 4
## 4 5992 Zona S~ 2 4 400 280 3 5 3
## 5 1212 Zona N~ 1 5 260 90 1 2 3
## 6 1724 Zona N~ 1 5 240 87 1 3 3
## # i 4 more variables: tipo <chr>, barrio <chr>, longitud <dbl>, latitud <dbl>
housing_num = vivienda[, c("piso","estrato","preciom","areaconst","parqueaderos","habitaciones","longitud","latitud")]
housing_scaled = scale(housing_num)
print(cor(housing_scaled[, c("piso","estrato","areaconst","parqueaderos","habitaciones","longitud","latitud")], housing_scaled[, c("preciom")]), method = "render")
## [,1]
## piso -0.009597976
## estrato 0.609802978
## areaconst 0.687347834
## parqueaderos 0.630822172
## habitaciones 0.264089619
## longitud -0.343586159
## latitud -0.115666874
Al observar la correlación entre las variables numéricas y el precio de la vivienda, podemos notar lo siguiente:
Hay una asociación fuerte entre el tamaño de la vivienda (representado por la variable ‘areaconst’), la ubicación (estrato), y el precio de la vivienda (‘preciom’). Esto sugiere que, en general, las viviendas más grandes y ubicadas en estratos más altos tienden a tener precios más altos.
La variable que indica el número de pisos (‘piso’) parece tener una correlación baja con el precio de la vivienda.
Tenemos de acuerdo al grafico siguiente que tener en cuenta que la desviación estándar mide la cantidad de variación o dispersión de un conjunto de valores. Una desviación estándar más alta indica que los puntos de datos están más dispersos en un rango más amplio. En este caso, PC1 tiene la desviación estándar más alta (1.7091), seguida de PC2 (1.2301).
En cuanto a la proporción de varianza muestra la proporción de la varianza total en los datos originales que explica cada componente principal. PC1 explica el 36.51% de la varianza total, PC2 explica el 18.91% y la proporción acumulada indica la proporción acumulada de varianza explicada por cada componente principal y todos los componentes anteriores a él. Muestra cuánta varianza total se explica al agregar más componentes principales. Por ejemplo, la proporción acumulada para PC1 es del 36.51%, para PC1 y PC2 combinados es del 55.43%.
En resumen, este análisis nos dice que PC1 captura la mayor variación en los datos, seguida por PC2, PC3, y así sucesivamente. Juntos, estos componentes explican una parte significativa de la varianza en el conjunto de datos, con PC1 solo explicando el 36.51% y los dos primeros componentes combinados explicando el 55.43%.
pca_result <- prcomp(housing_scaled, scale. = TRUE)
summary(pca_result)
## Importance of components:
## PC1 PC2 PC3 PC4 PC5 PC6 PC7
## Standard deviation 1.7091 1.2301 1.0237 0.87702 0.84688 0.69425 0.59926
## Proportion of Variance 0.3651 0.1891 0.1310 0.09614 0.08965 0.06025 0.04489
## Cumulative Proportion 0.3651 0.5543 0.6852 0.78139 0.87104 0.93129 0.97617
## PC8
## Standard deviation 0.43658
## Proportion of Variance 0.02383
## Cumulative Proportion 1.00000
biplot(pca_result)
Dado que graficamente no es tan claro cuantos clusters agrupan la información utilizaremos K-means, en especifico Elbow method el cual consiste en ejecutar el algoritmo de clustering para diferentes valores de K y luego trazar la suma de las distancias al cuadrado de los puntos de datos al centroide más cercano para cada valor de K.Se debe buscar el “codo” en el gráfico, es decir, el punto donde la tasa de disminución de la suma de las distancias al cuadrado se reduce significativamente.
Utilizando el método del codo, determinamos que tres clusters serían adecuados para agrupar la información. También realizamos un análisis de correspondencia para comprender las relaciones entre las variables cualitativas y cuantitativas en el conjunto de datos.
Para la visualización de los clusters en el espacio de los componentes principales procedemos a aplicar el algoritmo K-means con el numero de clusters determinado, se asigna las observaciones a los clusters correspondientes y se visualizan las observaciones en el espacio de los dos primeros componentes principales (PC1 y PC2) obtenidos del PCA, coloreadas por los clusters asignados por el algoritmo K-means.
k_values <- 2:10 # Prueba con diferentes valores de K
ss <- numeric(length(k_values))
for (i in 1:length(k_values)) {
kmeans_model <- kmeans(housing_scaled, centers = k_values[i])
ss[i] <- kmeans_model$tot.withinss
}
# Método del codo
plot(k_values, ss, type = "b", pch = 19, frame = FALSE,
xlab = "Número de clusters (K)", ylab = "Suma de cuadrados dentro del grupo (SSW)",
main = "Método del codo")
optimal_k_elbow <- k_values[which.max(-diff(ss))]
optimal_k_elbow
## [1] 2
optimal_k <- optimal_k_elbow
kmeans_model <- kmeans(housing_scaled, centers = optimal_k)
clusters <- kmeans_model$cluster
housing_pca <- prcomp(housing_scaled, scale = TRUE)
housing_pca_df <- data.frame(housing_pca$x, cluster = clusters)
ggplot(housing_pca_df, aes(x = PC1, y = PC2, color = factor(clusters))) + geom_point() + labs(x = "PC1", y = "PC2")
Las cargas indican la correlación entre cada variable original y el primer componente principal. Variables con cargas más altas en valor absoluto (tanto positivas como negativas) tienen una mayor influencia en la formación del componente principal. En este caso, las variables “preciom”, “areaconst”, “parqueaderos” y “estrato” tienen las cargas más altas, lo que significa que estas variables tienen una mayor influencia en la variabilidad capturada por el primer componente principal.
El primer componente principal parece estar relacionado principalmente con características relacionadas con el precio de la vivienda y sus características físicas, como el área de construcción, el número de parqueaderos, el estrato socioeconómico y la longitud. Las habitaciones y la latitud tienen una contribución menor en comparación con las otras variables mencionadas.
loadings <- pca_result$rotation
print(loadings[,1])
## piso estrato preciom areaconst parqueaderos habitaciones
## -0.06432899 0.38435183 0.52621261 0.46485417 0.43896802 0.24325677
## longitud latitud
## -0.28559628 -0.14735787
Mediante el análisis de silueta proporciona una medida de cuán bien agrupadas están las observaciones en los clusters.
Estos valores indican que, en general, las observaciones en el primer cluster están más bien agrupadas y tienen una mayor cohesión en comparación con el segundo cluster, donde las observaciones están más dispersas y tienen una menor cohesión.
En cuanto a los anchos de la silueta individuales disponemos de:
Estos valores dan una idea de la distribución de los anchos de silueta individuales dentro de los clusters. Una silueta más cercana a 1 indica que la observación está bien clasificada, mientras que una silueta más cercana a -1 indica que la observación puede estar mal clasificada en su cluster y estar más cerca de otro cluster.
En resumen, estos resultados indican que el primer cluster tiene una mejor estructura y cohesión en comparación con el segundo cluster, donde las observaciones están más dispersas. Esto sugiere que el primer cluster puede representar un grupo más homogéneo de propiedades residenciales en comparación con el segundo cluster.
silhouette_avg <- silhouette(clusters, dist(vivienda))
## Warning in dist(vivienda): NAs introducidos por coerción
summary(silhouette_avg)
## Silhouette of 8322 units in 2 clusters from silhouette.default(x = clusters, dist = dist(vivienda)) :
## Cluster sizes and average silhouette widths:
## 1220 7102
## 0.003118355 0.007569338
## Individual silhouette widths:
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## -0.086941 -0.042000 0.028248 0.006917 0.048061 0.085709
res.famd <- FAMD(vivienda[,c("zona","tipo","barrio")], graph = FALSE)
## Warning in do.call("cbind", lapply(x, "is.na")): unable to translate
## 'juanambv<U+222B>' to native encoding
## Warning in do.call("cbind", lapply(x, "is.na")): unable to translate
## 'repv<U+222B>blica de israel' to native encoding
fviz_screeplot(res.famd, addlabels = TRUE)
# Creamos una tabla de contingencia para examinar la relación entre tipo de vivienda y zona
tabla_tipo_zona <- table(vivienda$tipo, vivienda$zona)
print(tabla_tipo_zona)
##
## Zona Centro Zona Norte Zona Oeste Zona Oriente Zona Sur
## Apartamento 24 1198 1029 62 2790
## Casa 100 722 169 289 1939
# Creamos una tabla de contingencia para examinar la relación entre tipo de vivienda y barrio
tabla_tipo_barrio <- table(vivienda$tipo, vivienda$barrio)
print(tabla_tipo_barrio)
##
## 20 de julio 3 de julio acopi agua blanca aguablanca aguacatal
## Apartamento 0 0 88 0 1 98
## Casa 3 1 70 1 1 11
##
## alameda alameda del rio alameda del río alamos alborada alcazares
## Apartamento 4 1 1 11 0 2
## Casa 12 0 1 3 1 0
##
## alferez real alfonso lopez alfonso lópez alfonso lópez i
## Apartamento 1 0 2 0
## Casa 1 1 19 1
##
## alfv©rez real alto jordán altos de guadalupe altos de menga
## Apartamento 4 1 1 3
## Casa 1 0 3 0
##
## altos de santa antonio nariño aranjuez arboleda
## Apartamento 1 0 0 5
## Casa 0 2 15 0
##
## arboleda campestre candelaria arboledas atanasio girardot
## Apartamento 0 38 1
## Casa 1 0 8
##
## autopista sur bajo aguacatal barranquilla barrio 7de agosto
## Apartamento 0 1 3 0
## Casa 1 0 3 1
##
## barrio el recuerdo barrio eucarístico barrio obrero
## Apartamento 0 0 0
## Casa 1 1 1
##
## barrio tranquilo y base av©rea belalcazar Belalcazar
## Apartamento 0 0 0 0
## Casa 1 2 3 1
##
## belisario caicedo bella suiza bella suiza alta bellavista
## Apartamento 2 11 1 36
## Casa 0 7 3 7
##
## benjamín herrera berlin bloques del limonar bochalema bolivariano
## Apartamento 0 0 1 33 1
## Casa 8 1 0 0 0
##
## bosques de alboleda bosques del limonar boyacá bretaña
## Apartamento 1 12 0 2
## Casa 0 9 1 14
##
## brisas de guadalupe brisas de los Brisas De Los
## Apartamento 0 59 1
## Casa 1 22 0
##
## brisas del guabito brisas del limonar Bueno Madrid buenos aires
## Apartamento 0 1 1 4
## Casa 1 0 0 3
##
## caldas Cali cali bella cali canto calibella calicanto
## Apartamento 1 23 1 0 0 2
## Casa 0 14 0 1 1 6
##
## calicanto viii calima calimio norte calipso cambulos camino real
## Apartamento 0 0 2 4 2 14
## Casa 1 6 3 7 1 21
##
## Camino Real campestre caney caney especial cañasgordas
## Apartamento 1 1 58 1 5
## Casa 0 0 30 4 2
##
## cañaveralejo cañaverales cañaverales los samanes capri cascajal
## Apartamento 9 19 1 43 0
## Casa 3 2 0 13 1
##
## cataya real ceibas centelsa centenario Centenario centro
## Apartamento 1 0 1 12 1 1
## Casa 0 1 0 3 0 3
##
## cerro cristales cerros de guadalupe champagnat chapinero
## Apartamento 22 0 1 0
## Casa 0 1 13 7
##
## chiminangos Chiminangos chiminangos 1 etapa chiminangos 2 etapa
## Apartamento 17 1 1 2
## Casa 0 0 0 0
##
## chipichape ciudad 2000 Ciudad 2000 ciudad antejardin
## Apartamento 25 19 0 0
## Casa 5 76 1 1
##
## ciudad bochalema ciudad capri ciudad cordoba ciudad córdoba
## Apartamento 48 9 0 1
## Casa 0 4 20 14
##
## ciudad córdoba reservado ciudad country ciudad del campo
## Apartamento 0 0 0
## Casa 1 1 1
##
## ciudad jardin ciudad jardín Ciudad Jardín ciudad jardin pance
## Apartamento 9 221 0 1
## Casa 13 295 2 0
##
## ciudad los alamos ciudad los álamos ciudad melendez
## Apartamento 1 14 1
## Casa 0 11 0
##
## ciudad melv©ndez ciudad modelo ciudad pacifica Ciudad Pacifica
## Apartamento 1 1 2 1
## Casa 0 6 0 0
##
## ciudad real ciudad talanga ciudad universitaria
## Apartamento 0 0 1
## Casa 3 1 0
##
## ciudadela comfandi ciudadela del río ciudadela melendez
## Apartamento 2 0 1
## Casa 15 1 0
##
## ciudadela paso ancho ciudadela pasoancho colinas de menga
## Apartamento 0 3 3
## Casa 1 18 0
##
## colinas del bosque colinas del sur colon colseguros
## Apartamento 0 3 0 22
## Casa 1 5 1 22
##
## colseguros andes Colseguros Andes comfenalco compartir
## Apartamento 1 0 1 0
## Casa 3 1 0 1
##
## conjunto gibraltar cristales cristobal colón cristóbal colón
## Apartamento 1 72 2 0
## Casa 0 11 12 2
##
## cuarto de legua departamental ed benjamin herrera el bosque
## Apartamento 30 16 1 12
## Casa 14 13 0 37
##
## El Bosque el caney El Caney el castillo el cedro el diamante
## Apartamento 1 124 1 0 0 0
## Casa 0 84 0 6 8 2
##
## el dorado el gran limonar el guabal el guabito el ingenio
## Apartamento 6 3 4 0 128
## Casa 0 5 15 1 74
##
## El Ingenio el ingenio 3 el ingenio i el ingenio ii el ingenio iii
## Apartamento 0 1 13 9 10
## Casa 1 0 6 12 10
##
## el jardín el jordán el lido el limonar el nacional el paraíso
## Apartamento 4 1 34 59 0 0
## Casa 11 0 25 76 1 3
##
## el peñon el prado el refugio el rodeo el sena el troncal
## Apartamento 56 1 77 0 0 7
## Casa 4 1 43 1 1 12
##
## el trv©bol el vallado eucarístico evaristo garcía
## Apartamento 0 0 0 1
## Casa 5 1 2 1
##
## farrallones de pance fenalco kennedy fepicol flora
## Apartamento 0 0 1 1
## Casa 1 1 0 0
##
## flora industrial floralia fonaviemcali francisco eladio ramirez
## Apartamento 12 3 0 0
## Casa 4 3 1 1
##
## fuentes de la gaitan gran limonar granada guadalupe
## Apartamento 1 0 8 5 10
## Casa 0 1 16 10 11
##
## guadalupe alto guaduales guayaquil hacienda alferez real ingenio
## Apartamento 1 2 2 0 1
## Casa 0 0 14 1 0
##
## ingenio i ingenio ii jamundi jamundi alfaguara
## Apartamento 0 1 0 0
## Casa 1 0 4 1
##
## jorge eliecer gaitán jorge isaacs jose manuel marroquín juanambu
## Apartamento 0 0 0 2
## Casa 1 1 1 0
##
## juanambv<U+222B> junin junín la alborada la alianza la arboleda
## Apartamento 41 2 0 4 5 18
## Casa 12 16 6 1 0 0
##
## la base la buitrera la campiña la cascada la ceibas la esmeralda
## Apartamento 4 0 9 2 0 0
## Casa 11 3 4 5 1 1
##
## la flora La Flora la floresta la fortaleza la gran colombia
## Apartamento 267 1 5 0 0
## Casa 99 1 13 4 1
##
## la hacienda La Hacienda la independencia la libertad la luisa
## Apartamento 108 1 0 0 1
## Casa 56 1 12 2 0
##
## la merced la morada la nueva base la playa la portada al
## Apartamento 2 0 3 0 0
## Casa 24 1 5 1 1
##
## la primavera la reforma la rivera la rivera i la rivera ii
## Apartamento 0 0 2 0 0
## Casa 1 1 9 2 2
##
## la riverita la riviera la selva la villa del laflora
## Apartamento 0 0 7 0 1
## Casa 1 1 4 1 0
##
## lares de comfenalco las acacias las amv©ricas las camelias
## Apartamento 1 1 1 1
## Casa 0 11 2 0
##
## las ceibas las delicias las granjas las quintas de las vegas
## Apartamento 8 2 7 0 0
## Casa 15 3 3 1 1
##
## las vegas de libertadores los alamos los alcazares los alcázares
## Apartamento 1 0 1 17 5
## Casa 0 3 0 0 0
##
## los andes los cambulos los cámbulos los cristales
## Apartamento 8 19 4 137
## Casa 13 6 2 17
##
## los cristales club los farallones los guaduales Los Guaduales
## Apartamento 1 2 15 1
## Casa 0 2 10 0
##
## los guayacanes los jockeys los libertadores
## Apartamento 1 0 0
## Casa 2 1 4
##
## los parques barranquilla los robles lourdes mamellan manzanares
## Apartamento 6 1 0 0 4
## Casa 0 0 2 1 1
##
## mariano ramos marroquín iii mayapan las vegas melendez melv©ndez
## Apartamento 0 0 32 40 21
## Casa 1 1 14 12 2
##
## menga metropolitano del norte miradol del aguacatal miraflores
## Apartamento 21 20 1 6
## Casa 2 1 0 19
##
## Miraflores morichal de comfandi multicentro municipal napoles
## Apartamento 0 1 27 0 1
## Casa 1 2 0 3 1
##
## nápoles normandia normandía normandía west point norte
## Apartamento 12 5 150 1 8
## Casa 17 0 4 0 1
##
## norte la flora nueva base nueva floresta nueva tequendama
## Apartamento 1 0 1 37
## Casa 0 1 14 36
##
## oasis de comfandi oasis de pasoancho occidente pacara pacará
## Apartamento 5 1 10 17 4
## Casa 1 0 1 2 0
##
## palmas del ingenio pampa linda pampalinda panamericano pance
## Apartamento 0 13 3 2 206
## Casa 1 13 9 7 203
##
## Pance parcelaciones pance parque residencial el paseo de los
## Apartamento 0 18 0 0
## Casa 3 43 1 2
##
## paso del comercio pasoancho poblado campestre ponce popular
## Apartamento 4 5 0 1 1
## Casa 2 1 2 0 5
##
## portada de comfandi portales de comfandi porvenir
## Apartamento 1 0 1
## Casa 1 1 2
##
## prados de oriente prados del limonar Prados Del Limonar
## Apartamento 2 3 1
## Casa 4 17 0
##
## prados del norte Prados Del Norte prados del sur primavera
## Apartamento 95 1 0 0
## Casa 31 0 2 2
##
## primero de mayo primitivo crespo puente del comercio puente palma
## Apartamento 24 0 6 0
## Casa 13 3 0 1
##
## quintas de don Quintas De Don quintas de salomia
## Apartamento 58 0 0
## Casa 14 1 4
##
## rafael uribe uribe refugio repv<U+222B>blica de israel
## Apartamento 0 2 0
## Casa 1 0 1
##
## rincon de la rincón de salomia riveras del valle rozo la torre
## Apartamento 1 1 0 0
## Casa 0 0 1 1
##
## saavedra galindo salomia samanes samanes de guadalupe sameco
## Apartamento 1 20 1 1 1
## Casa 3 20 0 0 0
##
## san antonio san bosco san carlos san cayetano san fernando
## Apartamento 1 4 0 0 21
## Casa 23 4 4 9 33
##
## San Fernando san fernando nuevo san fernando viejo san joaquin
## Apartamento 1 4 6 1
## Casa 0 6 12 3
##
## san joaquín san juan bosco san judas san judas tadeo san luis
## Apartamento 0 1 0 0 0
## Casa 16 6 1 2 2
##
## san luís san nicolas san nicolás san pedro san vicente santa
## Apartamento 0 0 0 3 16 1
## Casa 1 1 1 0 32 0
##
## santa anita Santa Anita santa anita sur santa bárbara santa elena
## Apartamento 37 2 0 1 1
## Casa 11 0 1 2 9
##
## santa fe santa helena de santa isabel Santa Isabel santa monica
## Apartamento 0 0 43 1 35
## Casa 8 1 20 0 16
##
## Santa Monica santa mónica santa mónica alta santa monica norte
## Apartamento 0 2 1 1
## Casa 1 1 0 1
##
## santa monica popular santa mónica popular
## Apartamento 1 2
## Casa 1 5
##
## santa monica residencial santa mónica residencial santa rita
## Apartamento 0 23 37
## Casa 5 16 8
##
## santa rosa santa teresita Santa Teresita Santafe santander
## Apartamento 1 250 1 0 0
## Casa 0 12 0 1 1
##
## santo domingo Santo Domingo sector aguacatal
## Apartamento 1 0 1
## Casa 4 1 0
##
## sector cañaveralejo guadalupe seminario sierras de normandía
## Apartamento 2 23 1
## Casa 0 9 0
##
## siete de agosto simón bolivar tejares cristales tejares de san
## Apartamento 1 0 1 2
## Casa 7 1 3 12
##
## templete tequendama tequendema terrón colorado torres de comfandi
## Apartamento 2 15 0 0 55
## Casa 2 29 1 1 2
##
## unicentro cali unión de vivienda urbanización barranquilla
## Apartamento 1 2 2
## Casa 0 1 2
##
## urbanización boyacá urbanización colseguros urbanizacion el saman
## Apartamento 0 2 0
## Casa 1 1 1
##
## urbanizacion gratamira urbanización la flora
## Apartamento 1 60
## Casa 0 23
##
## urbanización la merced urbanización la nueva
## Apartamento 0 1
## Casa 4 3
##
## urbanización las cascadas urbanizacion lili
## Apartamento 0 0
## Casa 1 2
##
## urbanización nueva granada urbanización pacara
## Apartamento 1 1
## Casa 2 0
##
## urbanización río lili urbanización san joaquin
## Apartamento 3 0
## Casa 2 4
##
## urbanización tequendama valle de lili valle del lili
## Apartamento 2 1 843
## Casa 5 0 168
##
## Valle Del Lili valle grande versalles villa colombia
## Apartamento 1 1 55 0
## Casa 0 0 16 6
##
## villa de veracruz villa del lago villa del parque villa del prado
## Apartamento 2 4 1 11
## Casa 4 6 0 40
##
## Villa Del Prado villa del sol villa del sur villas de veracruz
## Apartamento 0 13 3 1
## Casa 1 12 2 7
##
## Villas De Veracruz vipasa zona centro zona norte zona norte los
## Apartamento 0 1 0 13 1
## Casa 1 31 1 19 0
##
## zona oeste zona oriente zona residencial zona sur
## Apartamento 22 2 1 32
## Casa 4 16 0 42
Procedemos a realizar un analisis mas detallado para determinar si existe una asociacion significativa entre el tipo de vivienda y la zona o el barrio.
resultado_chi_cuadrado <- chisq.test(tabla_tipo_zona)
print(resultado_chi_cuadrado)
##
## Pearson's Chi-squared test
##
## data: tabla_tipo_zona
## X-squared = 690.79, df = 4, p-value < 2.2e-16
El resultado de la prueba de chi-cuadrado para la asociación entre el tipo de vivienda y la zona es significativo (p < 2.2e-16), lo que indica que hay una asociación estadísticamente significativa entre estas dos variables. En otras palabras, el tipo de vivienda está asociado de manera significativa con la zona geográfica en la que se encuentra.
resultado_chi_cuadrado <- chisq.test(tabla_tipo_barrio)
## Warning in chisq.test(tabla_tipo_barrio): Chi-squared approximation may be
## incorrect
print(resultado_chi_cuadrado)
##
## Pearson's Chi-squared test
##
## data: tabla_tipo_barrio
## X-squared = 2470.1, df = 435, p-value < 2.2e-16
El resultado de la prueba de chi-cuadrado para la asociación entre el tipo de vivienda y el barrio también es altamente significativo (p < 2.2e-16), lo que indica que hay una asociación estadísticamente significativa entre estas dos variables. Esto sugiere que el tipo de vivienda está relacionado de manera significativa con el barrio en el que se encuentra. En otras palabras, el tipo de vivienda no se distribuye de manera uniforme entre los diferentes barrios, sino que hay una asociación entre el tipo de vivienda y el barrio.
vivienda$tipo <- as.factor(vivienda$tipo)
vivienda$zona <- as.factor(vivienda$zona)
vivienda$barrio <- as.factor(vivienda$barrio)
class(vivienda$tipo)
## [1] "factor"
class(vivienda$zona)
## [1] "factor"
class(vivienda$barrio)
## [1] "factor"
res_mca <- MCA(vivienda[, c("tipo", "zona", "barrio")], graph = FALSE)
## Warning in do.call(data.frame, c(x, alis)): unable to translate
## 'juanambv<U+222B>' to native encoding
## Warning in do.call(data.frame, c(x, alis)): unable to translate
## 'repv<U+222B>blica de israel' to native encoding
summary(res_mca)
##
## Call:
## MCA(X = vivienda[, c("tipo", "zona", "barrio")], graph = FALSE)
##
##
## Eigenvalues
## Dim.1 Dim.2 Dim.3 Dim.4 Dim.5 Dim.6 Dim.7
## Variance 0.711 0.660 0.651 0.623 0.444 0.333 0.333
## % of var. 0.485 0.450 0.444 0.425 0.303 0.227 0.227
## Cumulative % of var. 0.485 0.935 1.379 1.804 2.106 2.334 2.561
## Dim.8 Dim.9 Dim.10 Dim.11 Dim.12 Dim.13 Dim.14
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 2.788 3.016 3.243 3.470 3.697 3.925 4.152
## Dim.15 Dim.16 Dim.17 Dim.18 Dim.19 Dim.20 Dim.21
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 4.379 4.606 4.834 5.061 5.288 5.516 5.743
## Dim.22 Dim.23 Dim.24 Dim.25 Dim.26 Dim.27 Dim.28
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 5.970 6.197 6.425 6.652 6.879 7.106 7.334
## Dim.29 Dim.30 Dim.31 Dim.32 Dim.33 Dim.34 Dim.35
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 7.561 7.788 8.016 8.243 8.470 8.697 8.925
## Dim.36 Dim.37 Dim.38 Dim.39 Dim.40 Dim.41 Dim.42
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 9.152 9.379 9.606 9.834 10.061 10.288 10.516
## Dim.43 Dim.44 Dim.45 Dim.46 Dim.47 Dim.48 Dim.49
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 10.743 10.970 11.197 11.425 11.652 11.879 12.106
## Dim.50 Dim.51 Dim.52 Dim.53 Dim.54 Dim.55 Dim.56
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 12.334 12.561 12.788 13.016 13.243 13.470 13.697
## Dim.57 Dim.58 Dim.59 Dim.60 Dim.61 Dim.62 Dim.63
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 13.925 14.152 14.379 14.606 14.834 15.061 15.288
## Dim.64 Dim.65 Dim.66 Dim.67 Dim.68 Dim.69 Dim.70
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 15.516 15.743 15.970 16.197 16.425 16.652 16.879
## Dim.71 Dim.72 Dim.73 Dim.74 Dim.75 Dim.76 Dim.77
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 17.106 17.334 17.561 17.788 18.016 18.243 18.470
## Dim.78 Dim.79 Dim.80 Dim.81 Dim.82 Dim.83 Dim.84
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 18.697 18.925 19.152 19.379 19.606 19.834 20.061
## Dim.85 Dim.86 Dim.87 Dim.88 Dim.89 Dim.90 Dim.91
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 20.288 20.516 20.743 20.970 21.197 21.425 21.652
## Dim.92 Dim.93 Dim.94 Dim.95 Dim.96 Dim.97 Dim.98
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 21.879 22.106 22.334 22.561 22.788 23.016 23.243
## Dim.99 Dim.100 Dim.101 Dim.102 Dim.103 Dim.104 Dim.105
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 23.470 23.697 23.925 24.152 24.379 24.606 24.834
## Dim.106 Dim.107 Dim.108 Dim.109 Dim.110 Dim.111 Dim.112
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 25.061 25.288 25.516 25.743 25.970 26.197 26.425
## Dim.113 Dim.114 Dim.115 Dim.116 Dim.117 Dim.118 Dim.119
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 26.652 26.879 27.106 27.334 27.561 27.788 28.016
## Dim.120 Dim.121 Dim.122 Dim.123 Dim.124 Dim.125 Dim.126
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 28.243 28.470 28.697 28.925 29.152 29.379 29.606
## Dim.127 Dim.128 Dim.129 Dim.130 Dim.131 Dim.132 Dim.133
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 29.834 30.061 30.288 30.516 30.743 30.970 31.197
## Dim.134 Dim.135 Dim.136 Dim.137 Dim.138 Dim.139 Dim.140
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 31.425 31.652 31.879 32.106 32.334 32.561 32.788
## Dim.141 Dim.142 Dim.143 Dim.144 Dim.145 Dim.146 Dim.147
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 33.016 33.243 33.470 33.697 33.925 34.152 34.379
## Dim.148 Dim.149 Dim.150 Dim.151 Dim.152 Dim.153 Dim.154
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 34.606 34.834 35.061 35.288 35.516 35.743 35.970
## Dim.155 Dim.156 Dim.157 Dim.158 Dim.159 Dim.160 Dim.161
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 36.197 36.425 36.652 36.879 37.106 37.334 37.561
## Dim.162 Dim.163 Dim.164 Dim.165 Dim.166 Dim.167 Dim.168
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 37.788 38.016 38.243 38.470 38.697 38.925 39.152
## Dim.169 Dim.170 Dim.171 Dim.172 Dim.173 Dim.174 Dim.175
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 39.379 39.606 39.834 40.061 40.288 40.516 40.743
## Dim.176 Dim.177 Dim.178 Dim.179 Dim.180 Dim.181 Dim.182
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 40.970 41.197 41.425 41.652 41.879 42.106 42.334
## Dim.183 Dim.184 Dim.185 Dim.186 Dim.187 Dim.188 Dim.189
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 42.561 42.788 43.016 43.243 43.470 43.697 43.925
## Dim.190 Dim.191 Dim.192 Dim.193 Dim.194 Dim.195 Dim.196
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 44.152 44.379 44.606 44.834 45.061 45.288 45.516
## Dim.197 Dim.198 Dim.199 Dim.200 Dim.201 Dim.202 Dim.203
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 45.743 45.970 46.197 46.425 46.652 46.879 47.106
## Dim.204 Dim.205 Dim.206 Dim.207 Dim.208 Dim.209 Dim.210
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 47.334 47.561 47.788 48.016 48.243 48.470 48.697
## Dim.211 Dim.212 Dim.213 Dim.214 Dim.215 Dim.216 Dim.217
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 48.925 49.152 49.379 49.606 49.834 50.061 50.288
## Dim.218 Dim.219 Dim.220 Dim.221 Dim.222 Dim.223 Dim.224
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 50.516 50.743 50.970 51.197 51.425 51.652 51.879
## Dim.225 Dim.226 Dim.227 Dim.228 Dim.229 Dim.230 Dim.231
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 52.106 52.334 52.561 52.788 53.016 53.243 53.470
## Dim.232 Dim.233 Dim.234 Dim.235 Dim.236 Dim.237 Dim.238
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 53.697 53.925 54.152 54.379 54.606 54.834 55.061
## Dim.239 Dim.240 Dim.241 Dim.242 Dim.243 Dim.244 Dim.245
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 55.288 55.516 55.743 55.970 56.197 56.425 56.652
## Dim.246 Dim.247 Dim.248 Dim.249 Dim.250 Dim.251 Dim.252
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 56.879 57.106 57.334 57.561 57.788 58.016 58.243
## Dim.253 Dim.254 Dim.255 Dim.256 Dim.257 Dim.258 Dim.259
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 58.470 58.697 58.925 59.152 59.379 59.606 59.834
## Dim.260 Dim.261 Dim.262 Dim.263 Dim.264 Dim.265 Dim.266
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 60.061 60.288 60.516 60.743 60.970 61.197 61.425
## Dim.267 Dim.268 Dim.269 Dim.270 Dim.271 Dim.272 Dim.273
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 61.652 61.879 62.106 62.334 62.561 62.788 63.016
## Dim.274 Dim.275 Dim.276 Dim.277 Dim.278 Dim.279 Dim.280
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 63.243 63.470 63.697 63.925 64.152 64.379 64.606
## Dim.281 Dim.282 Dim.283 Dim.284 Dim.285 Dim.286 Dim.287
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 64.834 65.061 65.288 65.516 65.743 65.970 66.197
## Dim.288 Dim.289 Dim.290 Dim.291 Dim.292 Dim.293 Dim.294
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 66.425 66.652 66.879 67.106 67.334 67.561 67.788
## Dim.295 Dim.296 Dim.297 Dim.298 Dim.299 Dim.300 Dim.301
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 68.016 68.243 68.470 68.697 68.925 69.152 69.379
## Dim.302 Dim.303 Dim.304 Dim.305 Dim.306 Dim.307 Dim.308
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 69.606 69.834 70.061 70.288 70.516 70.743 70.970
## Dim.309 Dim.310 Dim.311 Dim.312 Dim.313 Dim.314 Dim.315
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 71.197 71.425 71.652 71.879 72.106 72.334 72.561
## Dim.316 Dim.317 Dim.318 Dim.319 Dim.320 Dim.321 Dim.322
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 72.788 73.016 73.243 73.470 73.697 73.925 74.152
## Dim.323 Dim.324 Dim.325 Dim.326 Dim.327 Dim.328 Dim.329
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 74.379 74.606 74.834 75.061 75.288 75.516 75.743
## Dim.330 Dim.331 Dim.332 Dim.333 Dim.334 Dim.335 Dim.336
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 75.970 76.197 76.425 76.652 76.879 77.106 77.334
## Dim.337 Dim.338 Dim.339 Dim.340 Dim.341 Dim.342 Dim.343
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 77.561 77.788 78.016 78.243 78.470 78.697 78.925
## Dim.344 Dim.345 Dim.346 Dim.347 Dim.348 Dim.349 Dim.350
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 79.152 79.379 79.606 79.834 80.061 80.288 80.516
## Dim.351 Dim.352 Dim.353 Dim.354 Dim.355 Dim.356 Dim.357
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 80.743 80.970 81.197 81.425 81.652 81.879 82.106
## Dim.358 Dim.359 Dim.360 Dim.361 Dim.362 Dim.363 Dim.364
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 82.334 82.561 82.788 83.016 83.243 83.470 83.697
## Dim.365 Dim.366 Dim.367 Dim.368 Dim.369 Dim.370 Dim.371
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 83.925 84.152 84.379 84.606 84.834 85.061 85.288
## Dim.372 Dim.373 Dim.374 Dim.375 Dim.376 Dim.377 Dim.378
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 85.516 85.743 85.970 86.197 86.425 86.652 86.879
## Dim.379 Dim.380 Dim.381 Dim.382 Dim.383 Dim.384 Dim.385
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 87.106 87.334 87.561 87.788 88.016 88.243 88.470
## Dim.386 Dim.387 Dim.388 Dim.389 Dim.390 Dim.391 Dim.392
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 88.697 88.925 89.152 89.379 89.606 89.834 90.061
## Dim.393 Dim.394 Dim.395 Dim.396 Dim.397 Dim.398 Dim.399
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 90.288 90.516 90.743 90.970 91.197 91.425 91.652
## Dim.400 Dim.401 Dim.402 Dim.403 Dim.404 Dim.405 Dim.406
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 91.879 92.106 92.334 92.561 92.788 93.016 93.243
## Dim.407 Dim.408 Dim.409 Dim.410 Dim.411 Dim.412 Dim.413
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 93.470 93.697 93.925 94.152 94.379 94.606 94.834
## Dim.414 Dim.415 Dim.416 Dim.417 Dim.418 Dim.419 Dim.420
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 95.061 95.288 95.516 95.743 95.970 96.197 96.425
## Dim.421 Dim.422 Dim.423 Dim.424 Dim.425 Dim.426 Dim.427
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 96.652 96.879 97.106 97.334 97.561 97.788 98.016
## Dim.428 Dim.429 Dim.430 Dim.431 Dim.432 Dim.433 Dim.434
## Variance 0.333 0.333 0.333 0.333 0.333 0.333 0.333
## % of var. 0.227 0.227 0.227 0.227 0.227 0.227 0.227
## Cumulative % of var. 98.243 98.470 98.697 98.925 99.152 99.379 99.606
## Dim.435 Dim.436 Dim.437 Dim.438 Dim.439 Dim.440
## Variance 0.333 0.161 0.046 0.018 0.012 0.006
## % of var. 0.227 0.110 0.032 0.012 0.008 0.004
## Cumulative % of var. 99.834 99.944 99.975 99.988 99.996 100.000
##
## Individuals (the 10 first)
## Dim.1 ctr cos2 Dim.2 ctr cos2 Dim.3 ctr
## 1 | 2.720 0.125 0.008 | 0.908 0.015 0.001 | 2.620 0.127
## 2 | 2.720 0.125 0.008 | 0.908 0.015 0.001 | 2.620 0.127
## 3 | 2.720 0.125 0.008 | 0.908 0.015 0.001 | 2.620 0.127
## 4 | 0.680 0.008 0.000 | -0.637 0.007 0.000 | -0.223 0.001
## 5 | -0.198 0.001 0.002 | 1.319 0.032 0.094 | -0.723 0.010
## 6 | -0.198 0.001 0.002 | 1.319 0.032 0.094 | -0.723 0.010
## 7 | -0.198 0.001 0.002 | 1.319 0.032 0.094 | -0.723 0.010
## 8 | -0.198 0.001 0.002 | 1.319 0.032 0.094 | -0.723 0.010
## 9 | 0.268 0.001 0.004 | 1.325 0.032 0.093 | -0.697 0.009
## 10 | 0.268 0.001 0.004 | 1.325 0.032 0.093 | -0.697 0.009
## cos2
## 1 0.007 |
## 2 0.007 |
## 3 0.007 |
## 4 0.000 |
## 5 0.028 |
## 6 0.028 |
## 7 0.028 |
## 8 0.028 |
## 9 0.026 |
## 10 0.026 |
##
## Categories (the 10 first)
## Dim.1 ctr cos2 v.test Dim.2 ctr cos2
## Apartamento | -0.457 5.993 0.330 -52.437 | -0.006 0.001 0.000
## Casa | 0.724 9.500 0.330 52.437 | 0.009 0.002 0.000
## Zona Centro | 2.007 2.813 0.061 22.512 | 0.239 0.043 0.001
## Zona Norte | -0.056 0.033 0.001 -2.775 | 1.602 29.903 0.770
## Zona Oeste | -1.725 20.081 0.500 -64.525 | 0.159 0.184 0.004
## Zona Oriente | 2.931 16.982 0.378 56.096 | 1.087 2.515 0.052
## Zona Sur | 0.189 0.956 0.047 19.822 | -0.778 17.354 0.796
## 20 de julio | 3.225 0.176 0.004 5.587 | 1.117 0.023 0.000
## 3 de julio | 0.806 0.004 0.000 0.806 | -0.784 0.004 0.000
## acopi | 0.011 0.000 0.000 0.139 | 1.619 2.514 0.051
## v.test Dim.3 ctr cos2 v.test
## Apartamento -0.644 | -0.024 0.019 0.001 -2.808 |
## Casa 0.644 | 0.039 0.030 0.001 2.808 |
## Zona Centro 2.684 | 0.773 0.456 0.009 8.673 |
## Zona Norte 80.039 | -0.845 8.445 0.214 -42.232 |
## Zona Oeste 5.947 | 1.573 18.251 0.416 58.855 |
## Zona Oriente 20.802 | 3.054 20.152 0.411 58.465 |
## Zona Sur -81.390 | -0.302 2.660 0.120 -31.637 |
## 20 de julio 1.935 | 3.247 0.195 0.004 5.625 |
## 3 de julio -0.784 | -0.277 0.000 0.000 -0.277 |
## acopi 20.550 | -0.880 0.753 0.015 -11.170 |
##
## Categorical variables (eta2)
## Dim.1 Dim.2 Dim.3
## tipo | 0.330 0.000 0.001 |
## zona | 0.872 0.990 0.976 |
## barrio | 0.931 0.990 0.976 |
plot(res_mca, invisible = "ind")
El análisis de correspondencia múltiple (MCA) realizado en el conjunto de datos de vivienda muestra que las primeras dimensiones capturan una cantidad significativa de varianza. Las dos primeras dimensiones explican el 93.5% de la varianza total, mientras que las cinco primeras dimensiones explican el 100% de la varianza acumulada. Esto sugiere que las primeras dimensiones son importantes para describir la estructura de los datos.
Analisis exploratorio de datos:
Estadisticas descriptivas:
Analisis de componentes principales y conglomerados:
Analisis de correspondencia:
Basado en el análisis realizado, se extraen las siguientes conclusiones clave:
Con base en las conclusiones anteriores, se formulan las siguientes recomendaciones específicas para la empresa B&C: