Importar Librerias
library(mice)
## Warning: package 'mice' was built under R version 4.2.3
##
## Attaching package: 'mice'
## The following object is masked from 'package:stats':
##
## filter
## The following objects are masked from 'package:base':
##
## cbind, rbind
library(magrittr)
## Warning: package 'magrittr' was built under R version 4.2.3
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.2.3
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(factoextra)
## Warning: package 'factoextra' was built under R version 4.2.3
## Loading required package: ggplot2
## Warning: package 'ggplot2' was built under R version 4.2.3
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
library(rlang)
## Warning: package 'rlang' was built under R version 4.2.3
##
## Attaching package: 'rlang'
## The following object is masked from 'package:magrittr':
##
## set_names
library(ggplot2)
library(tidyverse)
## Warning: package 'tidyverse' was built under R version 4.2.3
## Warning: package 'tibble' was built under R version 4.2.3
## Warning: package 'readr' was built under R version 4.2.3
## Warning: package 'forcats' was built under R version 4.2.3
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ forcats 1.0.0 ✔ stringr 1.5.0
## ✔ lubridate 1.9.1 ✔ tibble 3.2.1
## ✔ purrr 1.0.1 ✔ tidyr 1.3.0
## ✔ readr 2.1.4
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ purrr::%@%() masks rlang::%@%()
## ✖ tidyr::extract() masks magrittr::extract()
## ✖ dplyr::filter() masks mice::filter(), stats::filter()
## ✖ purrr::flatten() masks rlang::flatten()
## ✖ purrr::flatten_chr() masks rlang::flatten_chr()
## ✖ purrr::flatten_dbl() masks rlang::flatten_dbl()
## ✖ purrr::flatten_int() masks rlang::flatten_int()
## ✖ purrr::flatten_lgl() masks rlang::flatten_lgl()
## ✖ purrr::flatten_raw() masks rlang::flatten_raw()
## ✖ purrr::invoke() masks rlang::invoke()
## ✖ dplyr::lag() masks stats::lag()
## ✖ purrr::set_names() masks rlang::set_names(), magrittr::set_names()
## ✖ purrr::splice() masks rlang::splice()
## ℹ Use the ]8;;http://conflicted.r-lib.org/conflicted package]8;; to force all conflicts to become errors
library(corrplot)
## Warning: package 'corrplot' was built under R version 4.2.3
## corrplot 0.92 loaded
library(FactoMineR)
## Warning: package 'FactoMineR' was built under R version 4.2.3
library(gridExtra)
## Warning: package 'gridExtra' was built under R version 4.2.3
##
## Attaching package: 'gridExtra'
##
## The following object is masked from 'package:dplyr':
##
## combine
Importar datos, se decide importar los datos desde el CSV enviado por el profesor debido a que se presentaron fallas con el paquete modelos. A continuacion se muestra el resumen de variables
df <- read.csv("C:/Users/jcrestrepob/Documents/Maestria/2. Semestre/vivienda.csv")
# Reordenar df
df <- df %>% select(id, zona, tipo, barrio, piso, estrato, preciom, areaconst, parquea, banios, habitac, longitud, latitud)
head(df, n = 5)
## id zona tipo barrio piso estrato preciom areaconst
## 1 8312 Zona Oeste Apartamento arboleda 4 6 1300 318
## 2 8311 Zona Oeste Casa normandía 1 6 480 300
## 3 8307 Zona Oeste Casa miraflores NA 5 1200 800
## 4 8296 Zona Sur Casa el guabal 2 3 220 150
## 5 8297 Zona Oeste Casa bella suiza alta NA 5 330 112
## parquea banios habitac longitud latitud
## 1 2 4 2 -76576 3454
## 2 1 4 4 -76571 3454
## 3 4 7 5 -76568 3455
## 4 1 2 4 -76565 3417
## 5 2 4 3 -76565 3408
summary(df)
## id zona tipo barrio
## Min. : 1 Length:8322 Length:8322 Length:8322
## 1st Qu.:2080 Class :character Class :character Class :character
## Median :4160 Mode :character Mode :character Mode :character
## Mean :4160
## 3rd Qu.:6240
## Max. :8319
## NA's :3
## piso estrato preciom areaconst
## Min. : 1.000 Min. :3.000 Min. : 58.0 Min. : 30.0
## 1st Qu.: 2.000 1st Qu.:4.000 1st Qu.: 220.0 1st Qu.: 80.0
## Median : 3.000 Median :5.000 Median : 330.0 Median : 123.0
## Mean : 3.771 Mean :4.634 Mean : 433.9 Mean : 174.9
## 3rd Qu.: 5.000 3rd Qu.:5.000 3rd Qu.: 540.0 3rd Qu.: 229.0
## Max. :12.000 Max. :6.000 Max. :1999.0 Max. :1745.0
## NA's :2638 NA's :3 NA's :2 NA's :3
## parquea banios habitac longitud
## Min. : 1.000 Min. : 0.000 Min. : 0.000 Min. :-76576.00
## 1st Qu.: 1.000 1st Qu.: 2.000 1st Qu.: 3.000 1st Qu.:-76507.00
## Median : 2.000 Median : 3.000 Median : 3.000 Median : -76.54
## Mean : 1.835 Mean : 3.111 Mean : 3.605 Mean :-21866.06
## 3rd Qu.: 2.000 3rd Qu.: 4.000 3rd Qu.: 4.000 3rd Qu.: -76.52
## Max. :10.000 Max. :10.000 Max. :10.000 Max. : -76.46
## NA's :1605 NA's :3 NA's :3 NA's :3
## latitud
## Min. : 3.333
## 1st Qu.: 3.390
## Median : 3.449
## Mean : 971.300
## 3rd Qu.:3367.000
## Max. :3497.000
## NA's :3
Verificar si existe faltante de datos
md.pattern(df)
## preciom id zona tipo barrio estrato areaconst banios habitac longitud
## 4808 1 1 1 1 1 1 1 1 1 1
## 1909 1 1 1 1 1 1 1 1 1 1
## 876 1 1 1 1 1 1 1 1 1 1
## 726 1 1 1 1 1 1 1 1 1 1
## 1 1 0 0 0 0 0 0 0 0 0
## 2 0 0 0 0 0 0 0 0 0 0
## 2 3 3 3 3 3 3 3 3 3
## latitud parquea piso
## 4808 1 1 1 0
## 1909 1 1 0 1
## 876 1 0 1 1
## 726 1 0 0 2
## 1 0 0 0 12
## 2 0 0 0 13
## 3 1605 2638 4275
Se observa 2 registros en el que no existe ningún dato, y un registro que contine el dato de una sola variable. Se procede a eliminar estos tres registros.
df <- df[!is.na(df$id), ]
Se asume que todos los registros que tienen NA en la variable piso pertenecen al piso 1. También se asume que todos los registros que tienen NA en la variable parquea hace referencia a 0.
# Llenar los registros de NA en la columna "piso" con el número 1
df$piso <- ifelse(is.na(df$piso), 1, df$piso)
# Llenar los registros de NA en la columna "parquea" con el número 0
df$parquea <- ifelse(is.na(df$parquea), 0, df$parquea)
md.pattern(df)
## /\ /\
## { `---' }
## { O O }
## ==> V <== No need for mice. This data set is completely observed.
## \ \|/ /
## `-----'
## id zona tipo barrio piso estrato preciom areaconst parquea banios habitac
## 8319 1 1 1 1 1 1 1 1 1 1 1
## 0 0 0 0 0 0 0 0 0 0 0
## longitud latitud
## 8319 1 1 0
## 0 0 0
Estandarizar los datos. Debido a que tenemos variables con diferentes tipos de mediciones, estandarizamos los datos para evitar darle mayor protagonismo a las variables que por su naturaleza de medición contengan valores mucho mas grande que las demás.
df_est = df[5:13] %>%
scale()
head(df_est)
## piso estrato preciom areaconst parquea banios habitac
## 1 0.4397814 1.3275950 2.6351924 1.0007060 0.4168506 0.6222393 -1.0999114
## 2 -0.7523142 1.3275950 0.1402509 0.8748003 -0.3875522 0.6222393 0.2703863
## 3 -0.7523142 0.3559875 2.3309312 4.3721812 2.0256562 2.7227705 0.9555352
## 4 -0.3549490 -1.5872276 -0.6508281 -0.1744140 -0.3875522 -0.7781148 0.2703863
## 5 -0.7523142 0.3559875 -0.3161408 -0.4402149 0.4168506 0.6222393 -0.4147626
## 6 -0.7523142 0.3559875 2.7873229 1.5043289 5.2432674 4.8233017 4.3812795
## longitud latitud
## 1 -1.585158 1.612558
## 2 -1.585013 1.612558
## 3 -1.584926 1.613207
## 4 -1.584839 1.588526
## 5 -1.584839 1.582680
## 6 -1.584839 1.583330
ANALISIS DE COMPONENTES PRINCIPALES
df1 <- df_est
res.pca <- prcomp(df1)
print(res.pca)
## Standard deviations (1, .., p=9):
## [1] 1.8538608 1.3594168 1.1832822 0.9193506 0.6763265 0.6528292 0.4904768
## [8] 0.4349364 0.3955792
##
## Rotation (n x k) = (9 x 9):
## PC1 PC2 PC3 PC4 PC5
## piso -0.06289659 -0.13628232 -0.49243152 -0.84531859 0.05592696
## estrato 0.32377955 -0.07010423 -0.51845975 0.24194991 -0.54431753
## preciom 0.47543001 -0.02690253 -0.17221187 0.10017738 -0.02422696
## areaconst 0.44208140 -0.02229636 0.22127138 -0.02869033 0.18566410
## parquea 0.40521757 -0.05072776 -0.24050265 0.09936500 0.73672468
## banios 0.46406233 -0.05514234 0.13860749 -0.17450236 -0.32026442
## habitac 0.28642612 -0.02017540 0.56874929 -0.40428093 -0.13939342
## longitud -0.05993003 -0.69676303 0.06716757 0.08217495 0.02548896
## latitud 0.06748702 0.69555150 -0.07107700 -0.07428191 0.01094164
## PC6 PC7 PC8 PC9
## piso -0.127806225 -0.025245252 -0.01776819 -0.001880785
## estrato 0.186735960 -0.453324662 -0.16166020 -0.011079561
## preciom -0.359775913 0.209096214 0.74767526 -0.028016800
## areaconst -0.656701595 -0.279826763 -0.45800987 0.021875754
## parquea 0.464311755 -0.044512903 -0.06752461 0.024916822
## banios 0.221750218 0.683366132 -0.33569524 0.022788980
## habitac 0.350902193 -0.449836678 0.29137379 -0.028628878
## longitud -0.009883556 0.021274222 -0.01882808 -0.705769792
## latitud 0.010533702 0.007673714 -0.04748559 -0.706073239
Elección del numero de componentes principales
fviz_eig(res.pca, addlabels = TRUE)
Podemos identificar que los dos primeros componentes logran explicar mas de la mitad de la variabilidad de los datos, a continuación, realizamos un gráfico de correlación para verificar el aporte que realiza cada variable a los componentes o dimensiones.
var <- get_pca_var(res.pca)
print(var)
## Principal Component Analysis Results for variables
## ===================================================
## Name Description
## 1 "$coord" "Coordinates for the variables"
## 2 "$cor" "Correlations between variables and dimensions"
## 3 "$cos2" "Cos2 for the variables"
## 4 "$contrib" "contributions of the variables"
corrplot(var$cos2, is.corr=FALSE)
Graficamos la contribucion total que realizan las variables a PC1 y PC2
fviz_contrib(res.pca, choice = "var", axes = 1:2, top = 10)
Identificamos las variables con mayor aporte y su dirección
fviz_pca_var(res.pca, col.var = "contrib",
gradient.cols = c("#00AFBB", "#E7B800", "#FC4E07"),
repel = TRUE)
Para identificar el sentido de los ejes tomamos varios puntos extremos
datos<- rbind(df[6398,],
df[2421,],
df[7761,],
df[974,])
rownames(datos) = c("Apt 6398","Apt 2421","Apt 7761","Apt 974")
print(datos)
## id zona tipo barrio piso estrato
## Apt 6398 5684 Zona Sur Casa ciudad jardín 1 6
## Apt 2421 69 Zona Oriente Casa jose manuel marroquín 1 3
## Apt 7761 7522 Zona Sur Apartamento meléndez 1 3
## Apt 974 4564 Zona Norte Casa san vicente 1 5
## preciom areaconst parquea banios habitac longitud latitud
## Apt 6398 1800 1586 10 4 5 -76.53798 3.35961
## Apt 2421 165 80 0 0 0 -76.47766 3.42456
## Apt 7761 148 87 0 0 0 -76.55000 3375.00000
## Apt 974 1940 734 3 8 10 -76532.00000 3452.00000
casos1 <- rbind(res.pca$x[6398,1:2],res.pca$x[2421,1:2])
rownames(casos1) = c("6398","2421")
casos1 <- as.data.frame(casos1)
casos2 <- rbind(res.pca$x[7761,1:2], res.pca$x[974,1:2])
rownames(casos2) = c("7761","974")
casos2 <- as.data.frame(casos2)
fviz_pca_ind(res.pca, col.ind = "#DEDEDE", gradient.cols = c("#00AFBB", "#E7B800", "#FC4E07")) +
geom_point(data = casos1, aes(x = PC1, y = PC2), color = "red", size = 3) +
geom_point(data = casos2, aes(x = PC1, y = PC2), color = "blue", size = 3)
Se puede concluir que a medida que los datos aumentan su valor en el eje x, su precio y area de construccion aumenta, mientras que aumentan o disminuyen en el eje Y al variar la latitud y longitud. Con las dimenciones 1 & 2 estamos explicando el 58.7% de la variabilidad de los datos. Se logra una reduccion de 13 variables iniciales a solo 2 dimensiones
ANALISIS DE CONGLOMERADOS
fviz_nbclust(df_est, kmeans, method = "wss")
fviz_nbclust(df_est, kmeans, method = "silhouette")
Se sugiere el uso de 3 cluster. A continuación se crea una variable con el numero de cluster que se seleccionaron
k3 <- kmeans(df_est, centers = 3, nstart = 25)
str(k3)
## List of 9
## $ cluster : Named int [1:8319] 1 2 1 2 2 1 2 2 2 2 ...
## ..- attr(*, "names")= chr [1:8319] "1" "2" "3" "4" ...
## $ centers : num [1:3, 1:9] -0.167 -0.169 0.143 0.794 -0.105 ...
## ..- attr(*, "dimnames")=List of 2
## .. ..$ : chr [1:3] "1" "2" "3"
## .. ..$ : chr [1:9] "piso" "estrato" "preciom" "areaconst" ...
## $ totss : num 74862
## $ withinss : num [1:3] 17971 10146 17307
## $ tot.withinss: num 45424
## $ betweenss : num 29438
## $ size : int [1:3] 1848 1983 4488
## $ iter : int 4
## $ ifault : int 0
## - attr(*, "class")= chr "kmeans"
El primer clúster tiene un tamaño de 1848 datos, el segundo con 1983 y el tercero con 4488. A continuacion Se grafica la distribución de los datos
fviz_cluster(k3, data = df_est, ellipse.type = "norm",palette = "Set2", ggtheme = theme_minimal())
Realizamos el dendograma
#Tomamos una muestra aleatoria de 60 datos
set.seed(123)
sample_size <- 60
sample_data <- df_est[sample(1:nrow(df_est), sample_size), ]
#Realizamos el cálculo de clústeres
res <- hcut(sample_data, k=3, stand = TRUE)
# Visualizamos el dendograma de los clústeres
fviz_dend(res, rect = TRUE, cex = 0.5, k_colors = c("#7FFFD4","#FF4040","#FFD39B"))
## Warning: The `<scale>` argument of `guides()` cannot be `FALSE`. Use "none" instead as
## of ggplot2 3.3.4.
## ℹ The deprecated feature was likely used in the factoextra package.
## Please report the issue at <]8;;https://github.com/kassambara/factoextra/issueshttps://github.com/kassambara/factoextra/issues]8;;>.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
En conclusion se logra agrupar en tres cluster los datos, donde en cada uno de ellos podemos observar los registros que son mar cercanos entre si. Se tomo una muestra de 60 registros de forma aleatoria para la realizacion del dendograma para optimizar el procesamiento del grafico.
ANALISIS DE CORRESPONDENCIA
vivienda_mca <- subset(df, select = c("tipo", "zona", "barrio"))
str(vivienda_mca)
## 'data.frame': 8319 obs. of 3 variables:
## $ tipo : chr "Apartamento" "Casa" "Casa" "Casa" ...
## $ zona : chr "Zona Oeste" "Zona Oeste" "Zona Oeste" "Zona Sur" ...
## $ barrio: chr "arboleda" "normandía" "miraflores" "el guabal" ...
resultado_mca <- MCA(vivienda_mca, quali.sup = 1)
summary(resultado_mca)
##
## Call:
## MCA(X = vivienda_mca, quali.sup = 1)
##
##
## Eigenvalues
## Dim.1 Dim.2 Dim.3 Dim.4 Dim.5 Dim.6 Dim.7
## Variance 0.990 0.982 0.973 0.930 0.500 0.500 0.500
## % of var. 0.451 0.447 0.443 0.424 0.228 0.228 0.228
## Cumulative % of var. 0.451 0.899 1.342 1.766 1.994 2.221 2.449
## Dim.8 Dim.9 Dim.10 Dim.11 Dim.12 Dim.13 Dim.14
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 2.677 2.905 3.132 3.360 3.588 3.816 4.044
## Dim.15 Dim.16 Dim.17 Dim.18 Dim.19 Dim.20 Dim.21
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 4.271 4.499 4.727 4.955 5.183 5.410 5.638
## Dim.22 Dim.23 Dim.24 Dim.25 Dim.26 Dim.27 Dim.28
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 5.866 6.094 6.322 6.549 6.777 7.005 7.233
## Dim.29 Dim.30 Dim.31 Dim.32 Dim.33 Dim.34 Dim.35
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 7.461 7.688 7.916 8.144 8.372 8.599 8.827
## Dim.36 Dim.37 Dim.38 Dim.39 Dim.40 Dim.41 Dim.42
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 9.055 9.283 9.511 9.738 9.966 10.194 10.422
## Dim.43 Dim.44 Dim.45 Dim.46 Dim.47 Dim.48 Dim.49
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 10.650 10.877 11.105 11.333 11.561 11.789 12.016
## Dim.50 Dim.51 Dim.52 Dim.53 Dim.54 Dim.55 Dim.56
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 12.244 12.472 12.700 12.927 13.155 13.383 13.611
## Dim.57 Dim.58 Dim.59 Dim.60 Dim.61 Dim.62 Dim.63
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 13.839 14.066 14.294 14.522 14.750 14.978 15.205
## Dim.64 Dim.65 Dim.66 Dim.67 Dim.68 Dim.69 Dim.70
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 15.433 15.661 15.889 16.117 16.344 16.572 16.800
## Dim.71 Dim.72 Dim.73 Dim.74 Dim.75 Dim.76 Dim.77
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 17.028 17.255 17.483 17.711 17.939 18.167 18.394
## Dim.78 Dim.79 Dim.80 Dim.81 Dim.82 Dim.83 Dim.84
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 18.622 18.850 19.078 19.306 19.533 19.761 19.989
## Dim.85 Dim.86 Dim.87 Dim.88 Dim.89 Dim.90 Dim.91
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 20.217 20.445 20.672 20.900 21.128 21.356 21.584
## Dim.92 Dim.93 Dim.94 Dim.95 Dim.96 Dim.97 Dim.98
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 21.811 22.039 22.267 22.495 22.722 22.950 23.178
## Dim.99 Dim.100 Dim.101 Dim.102 Dim.103 Dim.104 Dim.105
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 23.406 23.634 23.861 24.089 24.317 24.545 24.773
## Dim.106 Dim.107 Dim.108 Dim.109 Dim.110 Dim.111 Dim.112
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 25.000 25.228 25.456 25.684 25.912 26.139 26.367
## Dim.113 Dim.114 Dim.115 Dim.116 Dim.117 Dim.118 Dim.119
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 26.595 26.823 27.050 27.278 27.506 27.734 27.962
## Dim.120 Dim.121 Dim.122 Dim.123 Dim.124 Dim.125 Dim.126
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 28.189 28.417 28.645 28.873 29.101 29.328 29.556
## Dim.127 Dim.128 Dim.129 Dim.130 Dim.131 Dim.132 Dim.133
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 29.784 30.012 30.240 30.467 30.695 30.923 31.151
## Dim.134 Dim.135 Dim.136 Dim.137 Dim.138 Dim.139 Dim.140
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 31.379 31.606 31.834 32.062 32.290 32.517 32.745
## Dim.141 Dim.142 Dim.143 Dim.144 Dim.145 Dim.146 Dim.147
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 32.973 33.201 33.429 33.656 33.884 34.112 34.340
## Dim.148 Dim.149 Dim.150 Dim.151 Dim.152 Dim.153 Dim.154
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 34.568 34.795 35.023 35.251 35.479 35.707 35.934
## Dim.155 Dim.156 Dim.157 Dim.158 Dim.159 Dim.160 Dim.161
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 36.162 36.390 36.618 36.845 37.073 37.301 37.529
## Dim.162 Dim.163 Dim.164 Dim.165 Dim.166 Dim.167 Dim.168
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 37.757 37.984 38.212 38.440 38.668 38.896 39.123
## Dim.169 Dim.170 Dim.171 Dim.172 Dim.173 Dim.174 Dim.175
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 39.351 39.579 39.807 40.035 40.262 40.490 40.718
## Dim.176 Dim.177 Dim.178 Dim.179 Dim.180 Dim.181 Dim.182
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 40.946 41.173 41.401 41.629 41.857 42.085 42.312
## Dim.183 Dim.184 Dim.185 Dim.186 Dim.187 Dim.188 Dim.189
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 42.540 42.768 42.996 43.224 43.451 43.679 43.907
## Dim.190 Dim.191 Dim.192 Dim.193 Dim.194 Dim.195 Dim.196
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 44.135 44.363 44.590 44.818 45.046 45.274 45.502
## Dim.197 Dim.198 Dim.199 Dim.200 Dim.201 Dim.202 Dim.203
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 45.729 45.957 46.185 46.413 46.640 46.868 47.096
## Dim.204 Dim.205 Dim.206 Dim.207 Dim.208 Dim.209 Dim.210
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 47.324 47.552 47.779 48.007 48.235 48.463 48.691
## Dim.211 Dim.212 Dim.213 Dim.214 Dim.215 Dim.216 Dim.217
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 48.918 49.146 49.374 49.602 49.830 50.057 50.285
## Dim.218 Dim.219 Dim.220 Dim.221 Dim.222 Dim.223 Dim.224
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 50.513 50.741 50.968 51.196 51.424 51.652 51.880
## Dim.225 Dim.226 Dim.227 Dim.228 Dim.229 Dim.230 Dim.231
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 52.107 52.335 52.563 52.791 53.019 53.246 53.474
## Dim.232 Dim.233 Dim.234 Dim.235 Dim.236 Dim.237 Dim.238
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 53.702 53.930 54.158 54.385 54.613 54.841 55.069
## Dim.239 Dim.240 Dim.241 Dim.242 Dim.243 Dim.244 Dim.245
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 55.296 55.524 55.752 55.980 56.208 56.435 56.663
## Dim.246 Dim.247 Dim.248 Dim.249 Dim.250 Dim.251 Dim.252
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 56.891 57.119 57.347 57.574 57.802 58.030 58.258
## Dim.253 Dim.254 Dim.255 Dim.256 Dim.257 Dim.258 Dim.259
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 58.486 58.713 58.941 59.169 59.397 59.625 59.852
## Dim.260 Dim.261 Dim.262 Dim.263 Dim.264 Dim.265 Dim.266
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 60.080 60.308 60.536 60.763 60.991 61.219 61.447
## Dim.267 Dim.268 Dim.269 Dim.270 Dim.271 Dim.272 Dim.273
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 61.675 61.902 62.130 62.358 62.586 62.814 63.041
## Dim.274 Dim.275 Dim.276 Dim.277 Dim.278 Dim.279 Dim.280
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 63.269 63.497 63.725 63.953 64.180 64.408 64.636
## Dim.281 Dim.282 Dim.283 Dim.284 Dim.285 Dim.286 Dim.287
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 64.864 65.091 65.319 65.547 65.775 66.003 66.230
## Dim.288 Dim.289 Dim.290 Dim.291 Dim.292 Dim.293 Dim.294
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 66.458 66.686 66.914 67.142 67.369 67.597 67.825
## Dim.295 Dim.296 Dim.297 Dim.298 Dim.299 Dim.300 Dim.301
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 68.053 68.281 68.508 68.736 68.964 69.192 69.420
## Dim.302 Dim.303 Dim.304 Dim.305 Dim.306 Dim.307 Dim.308
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 69.647 69.875 70.103 70.331 70.558 70.786 71.014
## Dim.309 Dim.310 Dim.311 Dim.312 Dim.313 Dim.314 Dim.315
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 71.242 71.470 71.697 71.925 72.153 72.381 72.609
## Dim.316 Dim.317 Dim.318 Dim.319 Dim.320 Dim.321 Dim.322
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 72.836 73.064 73.292 73.520 73.748 73.975 74.203
## Dim.323 Dim.324 Dim.325 Dim.326 Dim.327 Dim.328 Dim.329
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 74.431 74.659 74.886 75.114 75.342 75.570 75.798
## Dim.330 Dim.331 Dim.332 Dim.333 Dim.334 Dim.335 Dim.336
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 76.025 76.253 76.481 76.709 76.937 77.164 77.392
## Dim.337 Dim.338 Dim.339 Dim.340 Dim.341 Dim.342 Dim.343
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 77.620 77.848 78.076 78.303 78.531 78.759 78.987
## Dim.344 Dim.345 Dim.346 Dim.347 Dim.348 Dim.349 Dim.350
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 79.214 79.442 79.670 79.898 80.126 80.353 80.581
## Dim.351 Dim.352 Dim.353 Dim.354 Dim.355 Dim.356 Dim.357
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 80.809 81.037 81.265 81.492 81.720 81.948 82.176
## Dim.358 Dim.359 Dim.360 Dim.361 Dim.362 Dim.363 Dim.364
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 82.404 82.631 82.859 83.087 83.315 83.543 83.770
## Dim.365 Dim.366 Dim.367 Dim.368 Dim.369 Dim.370 Dim.371
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 83.998 84.226 84.454 84.681 84.909 85.137 85.365
## Dim.372 Dim.373 Dim.374 Dim.375 Dim.376 Dim.377 Dim.378
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 85.593 85.820 86.048 86.276 86.504 86.732 86.959
## Dim.379 Dim.380 Dim.381 Dim.382 Dim.383 Dim.384 Dim.385
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 87.187 87.415 87.643 87.871 88.098 88.326 88.554
## Dim.386 Dim.387 Dim.388 Dim.389 Dim.390 Dim.391 Dim.392
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 88.782 89.009 89.237 89.465 89.693 89.921 90.148
## Dim.393 Dim.394 Dim.395 Dim.396 Dim.397 Dim.398 Dim.399
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 90.376 90.604 90.832 91.060 91.287 91.515 91.743
## Dim.400 Dim.401 Dim.402 Dim.403 Dim.404 Dim.405 Dim.406
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 91.971 92.199 92.426 92.654 92.882 93.110 93.337
## Dim.407 Dim.408 Dim.409 Dim.410 Dim.411 Dim.412 Dim.413
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 93.565 93.793 94.021 94.249 94.476 94.704 94.932
## Dim.414 Dim.415 Dim.416 Dim.417 Dim.418 Dim.419 Dim.420
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 95.160 95.388 95.615 95.843 96.071 96.299 96.527
## Dim.421 Dim.422 Dim.423 Dim.424 Dim.425 Dim.426 Dim.427
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 96.754 96.982 97.210 97.438 97.666 97.893 98.121
## Dim.428 Dim.429 Dim.430 Dim.431 Dim.432 Dim.433 Dim.434
## Variance 0.500 0.500 0.500 0.500 0.500 0.500 0.500
## % of var. 0.228 0.228 0.228 0.228 0.228 0.228 0.228
## Cumulative % of var. 98.349 98.577 98.804 99.032 99.260 99.488 99.716
## Dim.435 Dim.436 Dim.437 Dim.438 Dim.439
## Variance 0.500 0.070 0.027 0.018 0.010
## % of var. 0.228 0.032 0.012 0.008 0.004
## Cumulative % of var. 99.943 99.975 99.987 99.996 100.000
##
## Individuals (the 10 first)
## Dim.1 ctr cos2 Dim.2 ctr cos2 Dim.3 ctr
## 1 | 0.263 0.001 0.000 | -2.157 0.057 0.006 | 0.214 0.001
## 2 | 0.380 0.002 0.005 | -2.425 0.072 0.199 | 0.254 0.001
## 3 | 0.356 0.002 0.001 | -2.330 0.066 0.032 | 0.254 0.001
## 4 | -0.815 0.008 0.003 | 0.286 0.001 0.000 | -0.149 0.000
## 5 | 0.082 0.000 0.000 | -1.742 0.037 0.003 | 0.152 0.000
## 6 | -0.512 0.003 0.000 | -0.406 0.002 0.000 | -0.045 0.000
## 7 | -0.378 0.002 0.001 | -0.714 0.006 0.002 | 0.001 0.000
## 8 | 0.082 0.000 0.000 | -1.742 0.037 0.003 | 0.152 0.000
## 9 | -0.810 0.008 0.164 | 0.287 0.001 0.021 | -0.150 0.000
## 10 | -0.378 0.002 0.001 | -0.714 0.006 0.002 | 0.001 0.000
## cos2
## 1 0.000 |
## 2 0.002 |
## 3 0.000 |
## 4 0.000 |
## 5 0.000 |
## 6 0.000 |
## 7 0.000 |
## 8 0.000 |
## 9 0.006 |
## 10 0.000 |
##
## Categories (the 10 first)
## Dim.1 ctr cos2 v.test Dim.2 ctr cos2
## Zona Centro | 0.175 0.023 0.000 1.967 | -0.046 0.002 0.000
## Zona Norte | 1.576 28.936 0.745 78.727 | 0.603 4.275 0.109
## Zona Oeste | 0.379 1.043 0.024 14.166 | -2.368 41.121 0.944
## Zona Oriente | 0.839 1.499 0.031 16.060 | 1.047 2.356 0.048
## Zona Sur | -0.803 18.499 0.848 -84.006 | 0.279 2.247 0.102
## 20 de julio | 0.855 0.013 0.000 1.482 | 1.086 0.022 0.000
## 3 de julio | -0.819 0.004 0.000 -0.819 | 0.289 0.001 0.000
## acopi | 1.591 2.428 0.049 20.195 | 0.623 0.376 0.008
## agua blanca | 0.855 0.004 0.000 0.855 | 1.086 0.007 0.000
## aguablanca | 0.018 0.000 0.000 0.026 | 0.688 0.006 0.000
## v.test Dim.3 ctr cos2 v.test
## Zona Centro -0.515 | 0.565 0.244 0.005 6.338 |
## Zona Norte 30.132 | -0.657 5.117 0.129 -32.816 |
## Zona Oeste -88.595 | 0.245 0.445 0.010 9.174 |
## Zona Oriente 20.046 | 4.484 43.595 0.886 85.837 |
## Zona Sur 29.156 | -0.143 0.598 0.027 -14.975 |
## 20 de julio 1.881 | 4.739 0.416 0.008 8.210 |
## 3 de julio 0.289 | -0.151 0.000 0.000 -0.151 |
## acopi 7.911 | -0.691 0.466 0.009 -8.767 |
## agua blanca 1.086 | 4.739 0.139 0.003 4.739 |
## aguablanca 0.972 | 2.294 0.065 0.001 3.245 |
##
## Categorical variables (eta2)
## Dim.1 Dim.2 Dim.3
## zona | 0.990 0.982 0.973 |
## barrio | 0.990 0.982 0.973 |
##
## Supplementary categories
## Dim.1 cos2 v.test Dim.2 cos2 v.test Dim.3
## Apartamento | 0.016 0.000 1.790 | -0.179 0.049 -20.203 | -0.133
## APARTAMENTO | 0.064 0.000 0.503 | -0.036 0.000 -0.284 | -0.176
## apto | 1.357 0.003 4.897 | 0.634 0.001 2.287 | -0.222
## casa | 0.742 0.001 2.777 | 0.701 0.001 2.626 | 1.788
## Casa | -0.036 0.001 -2.628 | 0.276 0.047 19.876 | 0.205
## CASA | 0.398 0.000 1.379 | 0.308 0.000 1.067 | 0.265
## cos2 v.test
## Apartamento 0.027 -15.005 |
## APARTAMENTO 0.000 -1.382 |
## apto 0.000 -0.802 |
## casa 0.005 6.697 |
## Casa 0.026 14.760 |
## CASA 0.000 0.917 |
##
## Supplementary categorical variables (eta2)
## Dim.1 Dim.2 Dim.3
## tipo | 0.005 0.050 0.033 |
fviz_mca_ind(resultado_mca, axes = c(1, 2))
Se observa información como listas y matrices que son producto del proceso de MCA. A continuacion sacamos la proporcion de varianzas que retiene cada dimension
eig_val <- factoextra::get_eigenvalue(resultado_mca)
head(eig_val)
## eigenvalue variance.percent cumulative.variance.percent
## Dim.1 0.9903947 0.4512049 0.4512049
## Dim.2 0.9821378 0.4474432 0.8986481
## Dim.3 0.9730727 0.4433133 1.3419614
## Dim.4 0.9302069 0.4237844 1.7657458
## Dim.5 0.5000000 0.2277904 1.9935362
## Dim.6 0.5000000 0.2277904 2.2213267
Obtenemos los porcentajes de inercia por dimensión
fviz_screeplot(resultado_mca, addlabels = TRUE)
Podemos concluir que las variables Zona y barrio tienen una alta correlación mientras que la variable tipo no se correlaciona con ninguna de las dos variables mencionadas.