Importar Librerias


library(mice)
## Warning: package 'mice' was built under R version 4.2.3
## 
## Attaching package: 'mice'
## The following object is masked from 'package:stats':
## 
##     filter
## The following objects are masked from 'package:base':
## 
##     cbind, rbind
library(magrittr)
## Warning: package 'magrittr' was built under R version 4.2.3
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.2.3
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(factoextra)
## Warning: package 'factoextra' was built under R version 4.2.3
## Loading required package: ggplot2
## Warning: package 'ggplot2' was built under R version 4.2.3
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
library(rlang)
## Warning: package 'rlang' was built under R version 4.2.3
## 
## Attaching package: 'rlang'
## The following object is masked from 'package:magrittr':
## 
##     set_names
library(ggplot2)
library(tidyverse)
## Warning: package 'tidyverse' was built under R version 4.2.3
## Warning: package 'tibble' was built under R version 4.2.3
## Warning: package 'readr' was built under R version 4.2.3
## Warning: package 'forcats' was built under R version 4.2.3
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ forcats   1.0.0     ✔ stringr   1.5.0
## ✔ lubridate 1.9.1     ✔ tibble    3.2.1
## ✔ purrr     1.0.1     ✔ tidyr     1.3.0
## ✔ readr     2.1.4
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ purrr::%@%()         masks rlang::%@%()
## ✖ tidyr::extract()     masks magrittr::extract()
## ✖ dplyr::filter()      masks mice::filter(), stats::filter()
## ✖ purrr::flatten()     masks rlang::flatten()
## ✖ purrr::flatten_chr() masks rlang::flatten_chr()
## ✖ purrr::flatten_dbl() masks rlang::flatten_dbl()
## ✖ purrr::flatten_int() masks rlang::flatten_int()
## ✖ purrr::flatten_lgl() masks rlang::flatten_lgl()
## ✖ purrr::flatten_raw() masks rlang::flatten_raw()
## ✖ purrr::invoke()      masks rlang::invoke()
## ✖ dplyr::lag()         masks stats::lag()
## ✖ purrr::set_names()   masks rlang::set_names(), magrittr::set_names()
## ✖ purrr::splice()      masks rlang::splice()
## ℹ Use the ]8;;http://conflicted.r-lib.org/conflicted package]8;; to force all conflicts to become errors
library(corrplot)
## Warning: package 'corrplot' was built under R version 4.2.3
## corrplot 0.92 loaded
library(FactoMineR)
## Warning: package 'FactoMineR' was built under R version 4.2.3
library(gridExtra)
## Warning: package 'gridExtra' was built under R version 4.2.3
## 
## Attaching package: 'gridExtra'
## 
## The following object is masked from 'package:dplyr':
## 
##     combine

Importar datos, se decide importar los datos desde el CSV enviado por el profesor debido a que se presentaron fallas con el paquete modelos. A continuacion se muestra el resumen de variables


df <- read.csv("C:/Users/jcrestrepob/Documents/Maestria/2. Semestre/vivienda.csv")

# Reordenar df
df <- df %>% select(id, zona, tipo, barrio, piso, estrato, preciom, areaconst, parquea, banios, habitac, longitud, latitud)
head(df, n = 5)
##     id       zona        tipo           barrio piso estrato preciom areaconst
## 1 8312 Zona Oeste Apartamento         arboleda    4       6    1300       318
## 2 8311 Zona Oeste        Casa        normandía    1       6     480       300
## 3 8307 Zona Oeste        Casa       miraflores   NA       5    1200       800
## 4 8296   Zona Sur        Casa        el guabal    2       3     220       150
## 5 8297 Zona Oeste        Casa bella suiza alta   NA       5     330       112
##   parquea banios habitac longitud latitud
## 1       2      4       2   -76576    3454
## 2       1      4       4   -76571    3454
## 3       4      7       5   -76568    3455
## 4       1      2       4   -76565    3417
## 5       2      4       3   -76565    3408
summary(df)
##        id           zona               tipo              barrio         
##  Min.   :   1   Length:8322        Length:8322        Length:8322       
##  1st Qu.:2080   Class :character   Class :character   Class :character  
##  Median :4160   Mode  :character   Mode  :character   Mode  :character  
##  Mean   :4160                                                           
##  3rd Qu.:6240                                                           
##  Max.   :8319                                                           
##  NA's   :3                                                              
##       piso           estrato         preciom         areaconst     
##  Min.   : 1.000   Min.   :3.000   Min.   :  58.0   Min.   :  30.0  
##  1st Qu.: 2.000   1st Qu.:4.000   1st Qu.: 220.0   1st Qu.:  80.0  
##  Median : 3.000   Median :5.000   Median : 330.0   Median : 123.0  
##  Mean   : 3.771   Mean   :4.634   Mean   : 433.9   Mean   : 174.9  
##  3rd Qu.: 5.000   3rd Qu.:5.000   3rd Qu.: 540.0   3rd Qu.: 229.0  
##  Max.   :12.000   Max.   :6.000   Max.   :1999.0   Max.   :1745.0  
##  NA's   :2638     NA's   :3       NA's   :2        NA's   :3       
##     parquea           banios          habitac          longitud        
##  Min.   : 1.000   Min.   : 0.000   Min.   : 0.000   Min.   :-76576.00  
##  1st Qu.: 1.000   1st Qu.: 2.000   1st Qu.: 3.000   1st Qu.:-76507.00  
##  Median : 2.000   Median : 3.000   Median : 3.000   Median :   -76.54  
##  Mean   : 1.835   Mean   : 3.111   Mean   : 3.605   Mean   :-21866.06  
##  3rd Qu.: 2.000   3rd Qu.: 4.000   3rd Qu.: 4.000   3rd Qu.:   -76.52  
##  Max.   :10.000   Max.   :10.000   Max.   :10.000   Max.   :   -76.46  
##  NA's   :1605     NA's   :3        NA's   :3        NA's   :3          
##     latitud        
##  Min.   :   3.333  
##  1st Qu.:   3.390  
##  Median :   3.449  
##  Mean   : 971.300  
##  3rd Qu.:3367.000  
##  Max.   :3497.000  
##  NA's   :3

Verificar si existe faltante de datos


md.pattern(df)

##      preciom id zona tipo barrio estrato areaconst banios habitac longitud
## 4808       1  1    1    1      1       1         1      1       1        1
## 1909       1  1    1    1      1       1         1      1       1        1
## 876        1  1    1    1      1       1         1      1       1        1
## 726        1  1    1    1      1       1         1      1       1        1
## 1          1  0    0    0      0       0         0      0       0        0
## 2          0  0    0    0      0       0         0      0       0        0
##            2  3    3    3      3       3         3      3       3        3
##      latitud parquea piso     
## 4808       1       1    1    0
## 1909       1       1    0    1
## 876        1       0    1    1
## 726        1       0    0    2
## 1          0       0    0   12
## 2          0       0    0   13
##            3    1605 2638 4275

Se observa 2 registros en el que no existe ningún dato, y un registro que contine el dato de una sola variable. Se procede a eliminar estos tres registros.


df <- df[!is.na(df$id), ]

Se asume que todos los registros que tienen NA en la variable piso pertenecen al piso 1. También se asume que todos los registros que tienen NA en la variable parquea hace referencia a 0.


# Llenar los registros de NA en la columna "piso" con el número 1
df$piso <- ifelse(is.na(df$piso), 1, df$piso)

# Llenar los registros de NA en la columna "parquea" con el número 0
df$parquea <- ifelse(is.na(df$parquea), 0, df$parquea)

md.pattern(df)
##  /\     /\
## {  `---'  }
## {  O   O  }
## ==>  V <==  No need for mice. This data set is completely observed.
##  \  \|/  /
##   `-----'

##      id zona tipo barrio piso estrato preciom areaconst parquea banios habitac
## 8319  1    1    1      1    1       1       1         1       1      1       1
##       0    0    0      0    0       0       0         0       0      0       0
##      longitud latitud  
## 8319        1       1 0
##             0       0 0

Estandarizar los datos. Debido a que tenemos variables con diferentes tipos de mediciones, estandarizamos los datos para evitar darle mayor protagonismo a las variables que por su naturaleza de medición contengan valores mucho mas grande que las demás.


df_est = df[5:13] %>%
scale()
head(df_est) 
##         piso    estrato    preciom  areaconst    parquea     banios    habitac
## 1  0.4397814  1.3275950  2.6351924  1.0007060  0.4168506  0.6222393 -1.0999114
## 2 -0.7523142  1.3275950  0.1402509  0.8748003 -0.3875522  0.6222393  0.2703863
## 3 -0.7523142  0.3559875  2.3309312  4.3721812  2.0256562  2.7227705  0.9555352
## 4 -0.3549490 -1.5872276 -0.6508281 -0.1744140 -0.3875522 -0.7781148  0.2703863
## 5 -0.7523142  0.3559875 -0.3161408 -0.4402149  0.4168506  0.6222393 -0.4147626
## 6 -0.7523142  0.3559875  2.7873229  1.5043289  5.2432674  4.8233017  4.3812795
##    longitud  latitud
## 1 -1.585158 1.612558
## 2 -1.585013 1.612558
## 3 -1.584926 1.613207
## 4 -1.584839 1.588526
## 5 -1.584839 1.582680
## 6 -1.584839 1.583330

ANALISIS DE COMPONENTES PRINCIPALES


df1 <- df_est
res.pca <- prcomp(df1)
print(res.pca)
## Standard deviations (1, .., p=9):
## [1] 1.8538608 1.3594168 1.1832822 0.9193506 0.6763265 0.6528292 0.4904768
## [8] 0.4349364 0.3955792
## 
## Rotation (n x k) = (9 x 9):
##                   PC1         PC2         PC3         PC4         PC5
## piso      -0.06289659 -0.13628232 -0.49243152 -0.84531859  0.05592696
## estrato    0.32377955 -0.07010423 -0.51845975  0.24194991 -0.54431753
## preciom    0.47543001 -0.02690253 -0.17221187  0.10017738 -0.02422696
## areaconst  0.44208140 -0.02229636  0.22127138 -0.02869033  0.18566410
## parquea    0.40521757 -0.05072776 -0.24050265  0.09936500  0.73672468
## banios     0.46406233 -0.05514234  0.13860749 -0.17450236 -0.32026442
## habitac    0.28642612 -0.02017540  0.56874929 -0.40428093 -0.13939342
## longitud  -0.05993003 -0.69676303  0.06716757  0.08217495  0.02548896
## latitud    0.06748702  0.69555150 -0.07107700 -0.07428191  0.01094164
##                    PC6          PC7         PC8          PC9
## piso      -0.127806225 -0.025245252 -0.01776819 -0.001880785
## estrato    0.186735960 -0.453324662 -0.16166020 -0.011079561
## preciom   -0.359775913  0.209096214  0.74767526 -0.028016800
## areaconst -0.656701595 -0.279826763 -0.45800987  0.021875754
## parquea    0.464311755 -0.044512903 -0.06752461  0.024916822
## banios     0.221750218  0.683366132 -0.33569524  0.022788980
## habitac    0.350902193 -0.449836678  0.29137379 -0.028628878
## longitud  -0.009883556  0.021274222 -0.01882808 -0.705769792
## latitud    0.010533702  0.007673714 -0.04748559 -0.706073239

Elección del numero de componentes principales


fviz_eig(res.pca, addlabels = TRUE)

Podemos identificar que los dos primeros componentes logran explicar mas de la mitad de la variabilidad de los datos, a continuación, realizamos un gráfico de correlación para verificar el aporte que realiza cada variable a los componentes o dimensiones.


var <- get_pca_var(res.pca)
print(var)
## Principal Component Analysis Results for variables
##  ===================================================
##   Name       Description                                    
## 1 "$coord"   "Coordinates for the variables"                
## 2 "$cor"     "Correlations between variables and dimensions"
## 3 "$cos2"    "Cos2 for the variables"                       
## 4 "$contrib" "contributions of the variables"
corrplot(var$cos2, is.corr=FALSE)

Graficamos la contribucion total que realizan las variables a PC1 y PC2


fviz_contrib(res.pca, choice = "var", axes = 1:2, top = 10)

Identificamos las variables con mayor aporte y su dirección


fviz_pca_var(res.pca, col.var = "contrib",

gradient.cols = c("#00AFBB", "#E7B800", "#FC4E07"),
repel = TRUE)

Para identificar el sentido de los ejes tomamos varios puntos extremos


datos<- rbind(df[6398,],
              df[2421,],
              df[7761,],
              df[974,])
rownames(datos) = c("Apt 6398","Apt 2421","Apt 7761","Apt 974")
print(datos)
##            id         zona        tipo                barrio piso estrato
## Apt 6398 5684     Zona Sur        Casa         ciudad jardín    1       6
## Apt 2421   69 Zona Oriente        Casa jose manuel marroquín    1       3
## Apt 7761 7522     Zona Sur Apartamento             meléndez    1       3
## Apt 974  4564   Zona Norte        Casa           san vicente    1       5
##          preciom areaconst parquea banios habitac     longitud    latitud
## Apt 6398    1800      1586      10      4       5    -76.53798    3.35961
## Apt 2421     165        80       0      0       0    -76.47766    3.42456
## Apt 7761     148        87       0      0       0    -76.55000 3375.00000
## Apt 974     1940       734       3      8      10 -76532.00000 3452.00000
casos1 <- rbind(res.pca$x[6398,1:2],res.pca$x[2421,1:2]) 
rownames(casos1) = c("6398","2421")
casos1 <- as.data.frame(casos1)

casos2 <- rbind(res.pca$x[7761,1:2], res.pca$x[974,1:2])
rownames(casos2) = c("7761","974")
casos2 <- as.data.frame(casos2)

fviz_pca_ind(res.pca, col.ind = "#DEDEDE", gradient.cols = c("#00AFBB", "#E7B800", "#FC4E07")) +
  geom_point(data = casos1, aes(x = PC1, y = PC2), color = "red", size = 3) +
  geom_point(data = casos2, aes(x = PC1, y = PC2), color = "blue", size = 3)

Se puede concluir que a medida que los datos aumentan su valor en el eje x, su precio y area de construccion aumenta, mientras que aumentan o disminuyen en el eje Y al variar la latitud y longitud. Con las dimenciones 1 & 2 estamos explicando el 58.7% de la variabilidad de los datos. Se logra una reduccion de 13 variables iniciales a solo 2 dimensiones



ANALISIS DE CONGLOMERADOS


fviz_nbclust(df_est, kmeans, method = "wss")

fviz_nbclust(df_est, kmeans, method = "silhouette")

Se sugiere el uso de 3 cluster. A continuación se crea una variable con el numero de cluster que se seleccionaron


k3 <- kmeans(df_est, centers = 3, nstart = 25)
str(k3)
## List of 9
##  $ cluster     : Named int [1:8319] 1 2 1 2 2 1 2 2 2 2 ...
##   ..- attr(*, "names")= chr [1:8319] "1" "2" "3" "4" ...
##  $ centers     : num [1:3, 1:9] -0.167 -0.169 0.143 0.794 -0.105 ...
##   ..- attr(*, "dimnames")=List of 2
##   .. ..$ : chr [1:3] "1" "2" "3"
##   .. ..$ : chr [1:9] "piso" "estrato" "preciom" "areaconst" ...
##  $ totss       : num 74862
##  $ withinss    : num [1:3] 17971 10146 17307
##  $ tot.withinss: num 45424
##  $ betweenss   : num 29438
##  $ size        : int [1:3] 1848 1983 4488
##  $ iter        : int 4
##  $ ifault      : int 0
##  - attr(*, "class")= chr "kmeans"

El primer clúster tiene un tamaño de 1848 datos, el segundo con 1983 y el tercero con 4488. A continuacion Se grafica la distribución de los datos


fviz_cluster(k3, data = df_est, ellipse.type = "norm",palette = "Set2", ggtheme = theme_minimal())

Realizamos el dendograma


#Tomamos una muestra aleatoria de 60 datos
set.seed(123)  
sample_size <- 60
sample_data <- df_est[sample(1:nrow(df_est), sample_size), ]

#Realizamos el cálculo de clústeres
res <- hcut(sample_data, k=3, stand = TRUE)

# Visualizamos el dendograma de los clústeres
fviz_dend(res, rect = TRUE, cex = 0.5, k_colors = c("#7FFFD4","#FF4040","#FFD39B"))
## Warning: The `<scale>` argument of `guides()` cannot be `FALSE`. Use "none" instead as
## of ggplot2 3.3.4.
## ℹ The deprecated feature was likely used in the factoextra package.
##   Please report the issue at <]8;;https://github.com/kassambara/factoextra/issueshttps://github.com/kassambara/factoextra/issues]8;;>.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.


En conclusion se logra agrupar en tres cluster los datos, donde en cada uno de ellos podemos observar los registros que son mar cercanos entre si. Se tomo una muestra de 60 registros de forma aleatoria para la realizacion del dendograma para optimizar el procesamiento del grafico.


ANALISIS DE CORRESPONDENCIA


vivienda_mca <- subset(df, select = c("tipo", "zona", "barrio"))
str(vivienda_mca)
## 'data.frame':    8319 obs. of  3 variables:
##  $ tipo  : chr  "Apartamento" "Casa" "Casa" "Casa" ...
##  $ zona  : chr  "Zona Oeste" "Zona Oeste" "Zona Oeste" "Zona Sur" ...
##  $ barrio: chr  "arboleda" "normandía" "miraflores" "el guabal" ...
resultado_mca <- MCA(vivienda_mca, quali.sup = 1)

summary(resultado_mca)
## 
## Call:
## MCA(X = vivienda_mca, quali.sup = 1) 
## 
## 
## Eigenvalues
##                        Dim.1   Dim.2   Dim.3   Dim.4   Dim.5   Dim.6   Dim.7
## Variance               0.990   0.982   0.973   0.930   0.500   0.500   0.500
## % of var.              0.451   0.447   0.443   0.424   0.228   0.228   0.228
## Cumulative % of var.   0.451   0.899   1.342   1.766   1.994   2.221   2.449
##                        Dim.8   Dim.9  Dim.10  Dim.11  Dim.12  Dim.13  Dim.14
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.   2.677   2.905   3.132   3.360   3.588   3.816   4.044
##                       Dim.15  Dim.16  Dim.17  Dim.18  Dim.19  Dim.20  Dim.21
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.   4.271   4.499   4.727   4.955   5.183   5.410   5.638
##                       Dim.22  Dim.23  Dim.24  Dim.25  Dim.26  Dim.27  Dim.28
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.   5.866   6.094   6.322   6.549   6.777   7.005   7.233
##                       Dim.29  Dim.30  Dim.31  Dim.32  Dim.33  Dim.34  Dim.35
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.   7.461   7.688   7.916   8.144   8.372   8.599   8.827
##                       Dim.36  Dim.37  Dim.38  Dim.39  Dim.40  Dim.41  Dim.42
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.   9.055   9.283   9.511   9.738   9.966  10.194  10.422
##                       Dim.43  Dim.44  Dim.45  Dim.46  Dim.47  Dim.48  Dim.49
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  10.650  10.877  11.105  11.333  11.561  11.789  12.016
##                       Dim.50  Dim.51  Dim.52  Dim.53  Dim.54  Dim.55  Dim.56
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  12.244  12.472  12.700  12.927  13.155  13.383  13.611
##                       Dim.57  Dim.58  Dim.59  Dim.60  Dim.61  Dim.62  Dim.63
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  13.839  14.066  14.294  14.522  14.750  14.978  15.205
##                       Dim.64  Dim.65  Dim.66  Dim.67  Dim.68  Dim.69  Dim.70
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  15.433  15.661  15.889  16.117  16.344  16.572  16.800
##                       Dim.71  Dim.72  Dim.73  Dim.74  Dim.75  Dim.76  Dim.77
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  17.028  17.255  17.483  17.711  17.939  18.167  18.394
##                       Dim.78  Dim.79  Dim.80  Dim.81  Dim.82  Dim.83  Dim.84
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  18.622  18.850  19.078  19.306  19.533  19.761  19.989
##                       Dim.85  Dim.86  Dim.87  Dim.88  Dim.89  Dim.90  Dim.91
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  20.217  20.445  20.672  20.900  21.128  21.356  21.584
##                       Dim.92  Dim.93  Dim.94  Dim.95  Dim.96  Dim.97  Dim.98
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  21.811  22.039  22.267  22.495  22.722  22.950  23.178
##                       Dim.99 Dim.100 Dim.101 Dim.102 Dim.103 Dim.104 Dim.105
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  23.406  23.634  23.861  24.089  24.317  24.545  24.773
##                      Dim.106 Dim.107 Dim.108 Dim.109 Dim.110 Dim.111 Dim.112
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  25.000  25.228  25.456  25.684  25.912  26.139  26.367
##                      Dim.113 Dim.114 Dim.115 Dim.116 Dim.117 Dim.118 Dim.119
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  26.595  26.823  27.050  27.278  27.506  27.734  27.962
##                      Dim.120 Dim.121 Dim.122 Dim.123 Dim.124 Dim.125 Dim.126
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  28.189  28.417  28.645  28.873  29.101  29.328  29.556
##                      Dim.127 Dim.128 Dim.129 Dim.130 Dim.131 Dim.132 Dim.133
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  29.784  30.012  30.240  30.467  30.695  30.923  31.151
##                      Dim.134 Dim.135 Dim.136 Dim.137 Dim.138 Dim.139 Dim.140
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  31.379  31.606  31.834  32.062  32.290  32.517  32.745
##                      Dim.141 Dim.142 Dim.143 Dim.144 Dim.145 Dim.146 Dim.147
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  32.973  33.201  33.429  33.656  33.884  34.112  34.340
##                      Dim.148 Dim.149 Dim.150 Dim.151 Dim.152 Dim.153 Dim.154
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  34.568  34.795  35.023  35.251  35.479  35.707  35.934
##                      Dim.155 Dim.156 Dim.157 Dim.158 Dim.159 Dim.160 Dim.161
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  36.162  36.390  36.618  36.845  37.073  37.301  37.529
##                      Dim.162 Dim.163 Dim.164 Dim.165 Dim.166 Dim.167 Dim.168
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  37.757  37.984  38.212  38.440  38.668  38.896  39.123
##                      Dim.169 Dim.170 Dim.171 Dim.172 Dim.173 Dim.174 Dim.175
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  39.351  39.579  39.807  40.035  40.262  40.490  40.718
##                      Dim.176 Dim.177 Dim.178 Dim.179 Dim.180 Dim.181 Dim.182
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  40.946  41.173  41.401  41.629  41.857  42.085  42.312
##                      Dim.183 Dim.184 Dim.185 Dim.186 Dim.187 Dim.188 Dim.189
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  42.540  42.768  42.996  43.224  43.451  43.679  43.907
##                      Dim.190 Dim.191 Dim.192 Dim.193 Dim.194 Dim.195 Dim.196
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  44.135  44.363  44.590  44.818  45.046  45.274  45.502
##                      Dim.197 Dim.198 Dim.199 Dim.200 Dim.201 Dim.202 Dim.203
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  45.729  45.957  46.185  46.413  46.640  46.868  47.096
##                      Dim.204 Dim.205 Dim.206 Dim.207 Dim.208 Dim.209 Dim.210
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  47.324  47.552  47.779  48.007  48.235  48.463  48.691
##                      Dim.211 Dim.212 Dim.213 Dim.214 Dim.215 Dim.216 Dim.217
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  48.918  49.146  49.374  49.602  49.830  50.057  50.285
##                      Dim.218 Dim.219 Dim.220 Dim.221 Dim.222 Dim.223 Dim.224
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  50.513  50.741  50.968  51.196  51.424  51.652  51.880
##                      Dim.225 Dim.226 Dim.227 Dim.228 Dim.229 Dim.230 Dim.231
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  52.107  52.335  52.563  52.791  53.019  53.246  53.474
##                      Dim.232 Dim.233 Dim.234 Dim.235 Dim.236 Dim.237 Dim.238
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  53.702  53.930  54.158  54.385  54.613  54.841  55.069
##                      Dim.239 Dim.240 Dim.241 Dim.242 Dim.243 Dim.244 Dim.245
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  55.296  55.524  55.752  55.980  56.208  56.435  56.663
##                      Dim.246 Dim.247 Dim.248 Dim.249 Dim.250 Dim.251 Dim.252
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  56.891  57.119  57.347  57.574  57.802  58.030  58.258
##                      Dim.253 Dim.254 Dim.255 Dim.256 Dim.257 Dim.258 Dim.259
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  58.486  58.713  58.941  59.169  59.397  59.625  59.852
##                      Dim.260 Dim.261 Dim.262 Dim.263 Dim.264 Dim.265 Dim.266
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  60.080  60.308  60.536  60.763  60.991  61.219  61.447
##                      Dim.267 Dim.268 Dim.269 Dim.270 Dim.271 Dim.272 Dim.273
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  61.675  61.902  62.130  62.358  62.586  62.814  63.041
##                      Dim.274 Dim.275 Dim.276 Dim.277 Dim.278 Dim.279 Dim.280
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  63.269  63.497  63.725  63.953  64.180  64.408  64.636
##                      Dim.281 Dim.282 Dim.283 Dim.284 Dim.285 Dim.286 Dim.287
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  64.864  65.091  65.319  65.547  65.775  66.003  66.230
##                      Dim.288 Dim.289 Dim.290 Dim.291 Dim.292 Dim.293 Dim.294
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  66.458  66.686  66.914  67.142  67.369  67.597  67.825
##                      Dim.295 Dim.296 Dim.297 Dim.298 Dim.299 Dim.300 Dim.301
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  68.053  68.281  68.508  68.736  68.964  69.192  69.420
##                      Dim.302 Dim.303 Dim.304 Dim.305 Dim.306 Dim.307 Dim.308
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  69.647  69.875  70.103  70.331  70.558  70.786  71.014
##                      Dim.309 Dim.310 Dim.311 Dim.312 Dim.313 Dim.314 Dim.315
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  71.242  71.470  71.697  71.925  72.153  72.381  72.609
##                      Dim.316 Dim.317 Dim.318 Dim.319 Dim.320 Dim.321 Dim.322
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  72.836  73.064  73.292  73.520  73.748  73.975  74.203
##                      Dim.323 Dim.324 Dim.325 Dim.326 Dim.327 Dim.328 Dim.329
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  74.431  74.659  74.886  75.114  75.342  75.570  75.798
##                      Dim.330 Dim.331 Dim.332 Dim.333 Dim.334 Dim.335 Dim.336
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  76.025  76.253  76.481  76.709  76.937  77.164  77.392
##                      Dim.337 Dim.338 Dim.339 Dim.340 Dim.341 Dim.342 Dim.343
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  77.620  77.848  78.076  78.303  78.531  78.759  78.987
##                      Dim.344 Dim.345 Dim.346 Dim.347 Dim.348 Dim.349 Dim.350
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  79.214  79.442  79.670  79.898  80.126  80.353  80.581
##                      Dim.351 Dim.352 Dim.353 Dim.354 Dim.355 Dim.356 Dim.357
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  80.809  81.037  81.265  81.492  81.720  81.948  82.176
##                      Dim.358 Dim.359 Dim.360 Dim.361 Dim.362 Dim.363 Dim.364
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  82.404  82.631  82.859  83.087  83.315  83.543  83.770
##                      Dim.365 Dim.366 Dim.367 Dim.368 Dim.369 Dim.370 Dim.371
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  83.998  84.226  84.454  84.681  84.909  85.137  85.365
##                      Dim.372 Dim.373 Dim.374 Dim.375 Dim.376 Dim.377 Dim.378
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  85.593  85.820  86.048  86.276  86.504  86.732  86.959
##                      Dim.379 Dim.380 Dim.381 Dim.382 Dim.383 Dim.384 Dim.385
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  87.187  87.415  87.643  87.871  88.098  88.326  88.554
##                      Dim.386 Dim.387 Dim.388 Dim.389 Dim.390 Dim.391 Dim.392
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  88.782  89.009  89.237  89.465  89.693  89.921  90.148
##                      Dim.393 Dim.394 Dim.395 Dim.396 Dim.397 Dim.398 Dim.399
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  90.376  90.604  90.832  91.060  91.287  91.515  91.743
##                      Dim.400 Dim.401 Dim.402 Dim.403 Dim.404 Dim.405 Dim.406
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  91.971  92.199  92.426  92.654  92.882  93.110  93.337
##                      Dim.407 Dim.408 Dim.409 Dim.410 Dim.411 Dim.412 Dim.413
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  93.565  93.793  94.021  94.249  94.476  94.704  94.932
##                      Dim.414 Dim.415 Dim.416 Dim.417 Dim.418 Dim.419 Dim.420
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  95.160  95.388  95.615  95.843  96.071  96.299  96.527
##                      Dim.421 Dim.422 Dim.423 Dim.424 Dim.425 Dim.426 Dim.427
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  96.754  96.982  97.210  97.438  97.666  97.893  98.121
##                      Dim.428 Dim.429 Dim.430 Dim.431 Dim.432 Dim.433 Dim.434
## Variance               0.500   0.500   0.500   0.500   0.500   0.500   0.500
## % of var.              0.228   0.228   0.228   0.228   0.228   0.228   0.228
## Cumulative % of var.  98.349  98.577  98.804  99.032  99.260  99.488  99.716
##                      Dim.435 Dim.436 Dim.437 Dim.438 Dim.439
## Variance               0.500   0.070   0.027   0.018   0.010
## % of var.              0.228   0.032   0.012   0.008   0.004
## Cumulative % of var.  99.943  99.975  99.987  99.996 100.000
## 
## Individuals (the 10 first)
##                 Dim.1    ctr   cos2    Dim.2    ctr   cos2    Dim.3    ctr
## 1            |  0.263  0.001  0.000 | -2.157  0.057  0.006 |  0.214  0.001
## 2            |  0.380  0.002  0.005 | -2.425  0.072  0.199 |  0.254  0.001
## 3            |  0.356  0.002  0.001 | -2.330  0.066  0.032 |  0.254  0.001
## 4            | -0.815  0.008  0.003 |  0.286  0.001  0.000 | -0.149  0.000
## 5            |  0.082  0.000  0.000 | -1.742  0.037  0.003 |  0.152  0.000
## 6            | -0.512  0.003  0.000 | -0.406  0.002  0.000 | -0.045  0.000
## 7            | -0.378  0.002  0.001 | -0.714  0.006  0.002 |  0.001  0.000
## 8            |  0.082  0.000  0.000 | -1.742  0.037  0.003 |  0.152  0.000
## 9            | -0.810  0.008  0.164 |  0.287  0.001  0.021 | -0.150  0.000
## 10           | -0.378  0.002  0.001 | -0.714  0.006  0.002 |  0.001  0.000
##                cos2  
## 1             0.000 |
## 2             0.002 |
## 3             0.000 |
## 4             0.000 |
## 5             0.000 |
## 6             0.000 |
## 7             0.000 |
## 8             0.000 |
## 9             0.006 |
## 10            0.000 |
## 
## Categories (the 10 first)
##                  Dim.1     ctr    cos2  v.test     Dim.2     ctr    cos2
## Zona Centro  |   0.175   0.023   0.000   1.967 |  -0.046   0.002   0.000
## Zona Norte   |   1.576  28.936   0.745  78.727 |   0.603   4.275   0.109
## Zona Oeste   |   0.379   1.043   0.024  14.166 |  -2.368  41.121   0.944
## Zona Oriente |   0.839   1.499   0.031  16.060 |   1.047   2.356   0.048
## Zona Sur     |  -0.803  18.499   0.848 -84.006 |   0.279   2.247   0.102
## 20 de julio  |   0.855   0.013   0.000   1.482 |   1.086   0.022   0.000
## 3 de julio   |  -0.819   0.004   0.000  -0.819 |   0.289   0.001   0.000
## acopi        |   1.591   2.428   0.049  20.195 |   0.623   0.376   0.008
## agua blanca  |   0.855   0.004   0.000   0.855 |   1.086   0.007   0.000
## aguablanca   |   0.018   0.000   0.000   0.026 |   0.688   0.006   0.000
##               v.test     Dim.3     ctr    cos2  v.test  
## Zona Centro   -0.515 |   0.565   0.244   0.005   6.338 |
## Zona Norte    30.132 |  -0.657   5.117   0.129 -32.816 |
## Zona Oeste   -88.595 |   0.245   0.445   0.010   9.174 |
## Zona Oriente  20.046 |   4.484  43.595   0.886  85.837 |
## Zona Sur      29.156 |  -0.143   0.598   0.027 -14.975 |
## 20 de julio    1.881 |   4.739   0.416   0.008   8.210 |
## 3 de julio     0.289 |  -0.151   0.000   0.000  -0.151 |
## acopi          7.911 |  -0.691   0.466   0.009  -8.767 |
## agua blanca    1.086 |   4.739   0.139   0.003   4.739 |
## aguablanca     0.972 |   2.294   0.065   0.001   3.245 |
## 
## Categorical variables (eta2)
##                Dim.1 Dim.2 Dim.3  
## zona         | 0.990 0.982 0.973 |
## barrio       | 0.990 0.982 0.973 |
## 
## Supplementary categories
##                  Dim.1    cos2  v.test     Dim.2    cos2  v.test     Dim.3
## Apartamento  |   0.016   0.000   1.790 |  -0.179   0.049 -20.203 |  -0.133
## APARTAMENTO  |   0.064   0.000   0.503 |  -0.036   0.000  -0.284 |  -0.176
## apto         |   1.357   0.003   4.897 |   0.634   0.001   2.287 |  -0.222
## casa         |   0.742   0.001   2.777 |   0.701   0.001   2.626 |   1.788
## Casa         |  -0.036   0.001  -2.628 |   0.276   0.047  19.876 |   0.205
## CASA         |   0.398   0.000   1.379 |   0.308   0.000   1.067 |   0.265
##                 cos2  v.test  
## Apartamento    0.027 -15.005 |
## APARTAMENTO    0.000  -1.382 |
## apto           0.000  -0.802 |
## casa           0.005   6.697 |
## Casa           0.026  14.760 |
## CASA           0.000   0.917 |
## 
## Supplementary categorical variables (eta2)
##                Dim.1 Dim.2 Dim.3  
## tipo         | 0.005 0.050 0.033 |
fviz_mca_ind(resultado_mca, axes = c(1, 2))


Se observa información como listas y matrices que son producto del proceso de MCA. A continuacion sacamos la proporcion de varianzas que retiene cada dimension


eig_val <- factoextra::get_eigenvalue(resultado_mca)
head(eig_val)
##       eigenvalue variance.percent cumulative.variance.percent
## Dim.1  0.9903947        0.4512049                   0.4512049
## Dim.2  0.9821378        0.4474432                   0.8986481
## Dim.3  0.9730727        0.4433133                   1.3419614
## Dim.4  0.9302069        0.4237844                   1.7657458
## Dim.5  0.5000000        0.2277904                   1.9935362
## Dim.6  0.5000000        0.2277904                   2.2213267

Obtenemos los porcentajes de inercia por dimensión


fviz_screeplot(resultado_mca, addlabels = TRUE)

Podemos concluir que las variables Zona y barrio tienen una alta correlación mientras que la variable tipo no se correlaciona con ninguna de las dos variables mencionadas.