El Análisis de Conglomerados, es una técnica estadística multivariante que busca agrupar un conjunto de elementos (o variables) tratando de lograr la máxima homogeneidad en cada grupo y la mayor heterogeneidad entre los grupos, de tal forma que cada elemento sea muy parecido a los que hay en el conglomerado con respecto a algún criterio de selección predeterminado.
Los datos sobre las Necesidades Básicas Insatisfechas en los departamentos de Colombia. De acuerdo con el Departamento nacional de Estadística (DANE) de Colombia: “La metodología de NBI busca determinar, con ayuda de algunos indicadores simples, si las necesidades básicas de la población se encuentran cubiertas. Los grupos que no alcancen un umbral mínimo fijado, son clasificados como pobres. Los indicadores simples seleccionados, son: Viviendas inadecuadas, Viviendas con hacinamiento crítico, Viviendas con servicios inadecuados, Viviendas con alta dependencia económica, Viviendas con niños en edad escolar que no asisten a la escuela”
datos<-data.frame(vivienda,servicios,hacinamiento,inasistencia, dependencia,nbi)
rownames(datos)<-Dpto
datos
## vivienda servicios hacinamiento inasistencia dependencia nbi
## ANTI 3.53 1.89 2.77 1.73 4.15 10.73
## ATLA 2.16 1.49 4.07 2.95 3.39 11.37
## BOGO 0.36 0.10 1.43 1.04 0.81 3.47
## BOLI 13.16 9.55 4.82 3.20 6.22 26.73
## BOYA 2.33 1.80 3.21 1.32 4.53 10.15
## CALD 1.74 1.55 2.07 1.22 4.37 8.95
## CAQU 10.12 5.91 4.71 2.93 7.68 23.62
## CAUC 5.99 5.88 4.09 1.58 5.18 18.81
## CESA 9.31 5.04 8.06 3.12 7.73 23.04
## CORDO 25.99 6.17 7.20 1.86 8.67 35.08
## CUND 1.41 0.63 1.93 1.35 1.87 6.36
## CHOC 8.52 57.47 12.80 4.57 10.98 65.51
## HUIL 4.02 1.70 2.80 1.41 5.24 12.86
## GUAJ 29.24 15.23 32.69 6.80 18.19 53.33
## MAGD 11.54 8.04 7.76 3.30 8.07 26.71
## META 6.99 2.67 3.46 1.76 3.87 13.45
## NARI 3.30 10.11 6.52 1.91 5.72 21.98
## NDES 5.65 3.29 6.54 2.57 6.52 18.43
## QUIN 1.14 0.34 1.35 1.42 3.32 6.76
## RISA 0.82 1.25 2.42 1.79 4.21 8.19
## SANT 2.92 0.86 2.58 1.45 3.50 9.58
## SUCR 16.60 4.47 6.28 1.58 10.10 29.13
## TOLI 3.26 1.61 3.53 1.87 4.63 12.22
## VALL 0.70 0.68 1.39 1.61 2.69 6.25
## ARAU 24.20 2.96 8.46 2.63 6.87 32.45
## CASA 7.00 1.33 6.10 1.62 4.59 16.08
## PUTU 3.54 7.55 5.60 1.61 4.81 18.96
## SANA 0.80 9.40 3.61 1.85 0.38 14.89
## AMAZ 5.72 19.13 16.18 3.71 6.15 35.24
## GUAI 32.84 39.72 22.69 5.98 14.14 59.46
## GUAV 14.76 11.79 4.94 2.25 6.90 27.91
## VAUP 37.33 56.68 28.44 8.84 11.84 68.94
## VICH 56.59 45.70 34.02 10.08 16.75 67.76
summary(datos)
## vivienda servicios hacinamiento inasistencia
## Min. : 0.36 Min. : 0.10 Min. : 1.350 Min. : 1.040
## 1st Qu.: 2.33 1st Qu.: 1.55 1st Qu.: 2.800 1st Qu.: 1.580
## Median : 5.72 Median : 4.47 Median : 4.820 Median : 1.860
## Mean :10.71 Mean :10.36 Mean : 8.016 Mean : 2.815
## 3rd Qu.:13.16 3rd Qu.: 9.55 3rd Qu.: 7.760 3rd Qu.: 3.120
## Max. :56.59 Max. :57.47 Max. :34.020 Max. :10.080
## dependencia nbi
## Min. : 0.380 Min. : 3.47
## 1st Qu.: 4.150 1st Qu.:10.73
## Median : 5.240 Median :18.81
## Mean : 6.487 Mean :24.38
## 3rd Qu.: 7.730 3rd Qu.:29.13
## Max. :18.190 Max. :68.94
df_status(datos)
## variable q_zeros p_zeros q_na p_na q_inf p_inf type unique
## 1 vivienda 0 0 0 0 0 0 numeric 33
## 2 servicios 0 0 0 0 0 0 numeric 33
## 3 hacinamiento 0 0 0 0 0 0 numeric 33
## 4 inasistencia 0 0 0 0 0 0 numeric 31
## 5 dependencia 0 0 0 0 0 0 numeric 33
## 6 nbi 0 0 0 0 0 0 numeric 33
plot_num(datos)
## Warning: `guides(<scale> = FALSE)` is deprecated. Please use `guides(<scale> =
## "none")` instead.
profiling_num(datos)
## variable mean std_dev variation_coef p_01 p_05 p_25 p_50
## 1 vivienda 10.714545 12.931849 1.2069433 0.4688 0.760 2.33 5.72
## 2 servicios 10.363333 15.791027 1.5237401 0.1768 0.514 1.55 4.47
## 3 hacinamiento 8.015758 8.820378 1.1003799 1.3628 1.414 2.80 4.82
## 4 inasistencia 2.815455 2.164476 0.7687839 1.0976 1.280 1.58 1.86
## 5 dependencia 6.486970 4.133758 0.6372403 0.5176 1.446 4.15 5.24
## 6 nbi 24.375758 18.802166 0.7713470 4.3596 6.316 10.73 18.81
## p_75 p_95 p_99 skewness kurtosis iqr range_98
## 1 13.16 34.636 50.4268 1.884165 6.303414 10.83 [0.4688, 50.4268]
## 2 9.55 50.092 57.2172 2.111858 6.189265 8.00 [0.1768, 57.2172]
## 3 7.76 30.140 33.5944 1.959675 5.684490 4.96 [1.3628, 33.5944]
## 4 3.12 7.616 9.6832 2.074988 6.636664 1.54 [1.0976, 9.6832]
## 5 7.73 15.184 17.7292 1.216311 4.222175 3.58 [0.5176, 17.7292]
## 6 29.13 66.410 68.5624 1.234856 3.467506 18.40 [4.3596, 68.5624]
## range_80
## 1 [0.884, 28.59]
## 2 [0.716, 35.602]
## 3 [1.958, 21.388]
## 4 [1.362, 5.698]
## 5 [2.816, 11.668]
## 6 [7.046, 58.234]
La distancia se emplea dentro del contexto del clustering como la cuantificación de la similitud o diferencia entre observaciones. En tanto más se asemejen dos elementos más próximos estarán.
Una de las medidas más utilizadas para determinar el grado de similitud o disimilitud entre observaciones es la distancia euclídea (o euclidiana)
La correlación también es una medida de distancia muy útil cuando la definición de similitud se hace en términos de patrón o forma y no de magnitud. la correlación puede ser de distintos tipos (Pearson, Spearman).
La distancia basada en la correlación, considera dos observaciones como similares si sus características asociadas están altamente correlacionadas, incluso aunque los valores observados estén alejados en términos de distancia euclídea.
La distancia euclídea entre los puntos \(X=(x_{1}, x_{2},\ldots, x_{n})\) y \(Y=(y_{1}, y_{2}, \ldots y_{n})\) del espacio \(n-\)dimensional está definida como:
\(d= \sqrt{(x_{1}-y_{1})^{2}+(x_{2}-y_{2})^{2}+\cdots+(x_{n}-y_{n})^{2}}=\sqrt{\displaystyle\sum_{i=1}^{n}(x_{i}-y_{i})^{2}}\)
distancia <- dist(datos, method = "euclidean")
fviz_dist(distancia)
corrplot(as.matrix(distancia),is.corr = FALSE, method = "color")
corrplot(as.matrix(distancia), is.corr = FALSE,method = "color",order = "hclust", type = "upper")
distan <- as.matrix(distancia)
heatmap(distan, xlab = "Departamentos",ylab = "Departamentos",main = "Mapa de calor")
Una forma sencilla de estimar el número K óptimo de clusters es aplicar el algoritmo de K-means para un rango de valores de K e identificar aquel valor a partir del cual la reducción en la suma total de varianza intra-cluster deja de ser significativa. A esta estrategia se la conoce como método del codo o elbow method.
num <- (nrow(datos)-1)*sum(apply(datos,2,var))
for (i in 2:15) num[i] <- sum(kmeans(datos,
centers=i)$withinss)
num
## [1] 27829.8465 7459.4143 4546.1756 4008.6331 2248.5150 2705.2870
## [7] 2554.4409 1273.6218 2020.5025 889.9278 828.3037 1938.9068
## [13] 1877.2827 1859.6173 732.9575
plot(1:15, num, type="b", xlab="Numero de Clusters", ylab="Suma de cuadrados dentro de grupos",col="red",lwd=2)
K-medias es un algoritmo de aprendizaje no supervisado que tiene como objetivo generar una partición de un conjunto de \(n\) observaciones en \(k\) grupos. Cada grupo se representa por la media de los puntos que lo componen. El representante de cada grupo se denomina centroide. La cantidad de grupos \(k\), se debe establecer de antemano. El método de clustering comienza con \(k\) centroides ubicados de forma aleatoria, y asigna cada observación al centroide más cercano. Clasifica objetos en múltiples grupos (conglomerados), de modo que los objetos dentro del mismo conglomerado son lo más similares posible mientras que los objetos de diferentes conglomerados son lo más diferentes posible. En el agrupamiento de k-medias, cada grupo está representado por su centro (es decir, centroide) que corresponde a la media de los puntos asignados al grupo. El método comienza con \(k\) centroides ubicados de forma aleatoria, y asigna cada observación al centroide más cercano. Se minimiza la suma total de cuadrados intra-cluster (suma de las distancias al cuadrado de cada observación respecto a su centroide)
grupos<-kmeans(datos,5)
grupos
## K-means clustering with 5 clusters of sizes 4, 13, 1, 8, 7
##
## Cluster means:
## vivienda servicios hacinamiento inasistencia dependencia nbi
## 1 39.000000 39.332500 29.460000 7.925000 15.230000 62.372500
## 2 2.413846 1.274615 2.539231 1.609231 3.583077 9.256923
## 3 8.520000 57.470000 12.800000 4.570000 10.980000 65.510000
## 4 5.713750 6.063750 5.653750 2.148750 5.326250 19.476250
## 5 15.995714 8.872857 7.948571 2.647143 7.568571 30.464286
##
## Clustering vector:
## ANTI ATLA BOGO BOLI BOYA CALD CAQU CAUC CESA CORDO CUND CHOC HUIL
## 2 2 2 5 2 2 4 4 4 5 2 3 2
## GUAJ MAGD META NARI NDES QUIN RISA SANT SUCR TOLI VALL ARAU CASA
## 1 5 2 4 4 2 2 2 5 2 2 5 4
## PUTU SANA AMAZ GUAI GUAV VAUP VICH
## 4 4 5 1 5 1 1
##
## Within cluster sum of squares by cluster:
## [1] 1642.7503 179.7424 0.0000 256.2164 670.1502
## (between_SS / total_SS = 90.1 %)
##
## Available components:
##
## [1] "cluster" "centers" "totss" "withinss" "tot.withinss"
## [6] "betweenss" "size" "iter" "ifault"
grupos$size
## [1] 4 13 1 8 7
grupos$cluster
## ANTI ATLA BOGO BOLI BOYA CALD CAQU CAUC CESA CORDO CUND CHOC HUIL
## 2 2 2 5 2 2 4 4 4 5 2 3 2
## GUAJ MAGD META NARI NDES QUIN RISA SANT SUCR TOLI VALL ARAU CASA
## 1 5 2 4 4 2 2 2 5 2 2 5 4
## PUTU SANA AMAZ GUAI GUAV VAUP VICH
## 4 4 5 1 5 1 1
data.frame(grupos$cluster)
## grupos.cluster
## ANTI 2
## ATLA 2
## BOGO 2
## BOLI 5
## BOYA 2
## CALD 2
## CAQU 4
## CAUC 4
## CESA 4
## CORDO 5
## CUND 2
## CHOC 3
## HUIL 2
## GUAJ 1
## MAGD 5
## META 2
## NARI 4
## NDES 4
## QUIN 2
## RISA 2
## SANT 2
## SUCR 5
## TOLI 2
## VALL 2
## ARAU 5
## CASA 4
## PUTU 4
## SANA 4
## AMAZ 5
## GUAI 1
## GUAV 5
## VAUP 1
## VICH 1
aggregate(datos,by=list(grupos$cluster),FUN=mean)
## Group.1 vivienda servicios hacinamiento inasistencia dependencia nbi
## 1 1 39.000000 39.332500 29.460000 7.925000 15.230000 62.372500
## 2 2 2.413846 1.274615 2.539231 1.609231 3.583077 9.256923
## 3 3 8.520000 57.470000 12.800000 4.570000 10.980000 65.510000
## 4 4 5.713750 6.063750 5.653750 2.148750 5.326250 19.476250
## 5 5 15.995714 8.872857 7.948571 2.647143 7.568571 30.464286
plot(datos, col = grupos$cluster)
points(grupos$centers, col = 1:5, pch = 8)
clusplot(datos,grupos$cluster,color=TRUE,shade=TRUE,labels=2, lines=0)
plotcluster(datos, grupos$cluster)
resu <- pamk(datos,5);resu
## $pamobject
## Medoids:
## ID vivienda servicios hacinamiento inasistencia dependencia nbi
## SANT 21 2.92 0.86 2.58 1.45 3.50 9.58
## MAGD 15 11.54 8.04 7.76 3.30 8.07 26.71
## PUTU 27 3.54 7.55 5.60 1.61 4.81 18.96
## CHOC 12 8.52 57.47 12.80 4.57 10.98 65.51
## GUAI 30 32.84 39.72 22.69 5.98 14.14 59.46
## Clustering vector:
## ANTI ATLA BOGO BOLI BOYA CALD CAQU CAUC CESA CORDO CUND CHOC HUIL
## 1 1 1 2 1 1 2 3 2 2 1 4 1
## GUAJ MAGD META NARI NDES QUIN RISA SANT SUCR TOLI VALL ARAU CASA
## 5 2 1 3 3 1 1 1 2 1 1 2 3
## PUTU SANA AMAZ GUAI GUAV VAUP VICH
## 3 3 2 5 2 5 5
## Objective function:
## build swap
## 6.849995 6.827259
##
## Available components:
## [1] "medoids" "id.med" "clustering" "objective" "isolation"
## [6] "clusinfo" "silinfo" "diss" "call" "data"
##
## $nc
## [1] 5
##
## $crit
## [1] 0.0000000 0.0000000 0.0000000 0.0000000 0.3734445
layout(matrix(c(1, 2), 1, 2))
plot(resu$pamobject)
Este método de manera iterativa agrupa observaciones basado en sus distancias hasta que cada observación pertenece a un grupo más grande.
No requiere especificación previa de clusters-
##cluster jerarquico
dis <- dist(datos, method = "euclidean");dis
## ANTI ATLA BOGO BOLI BOYA CALD
## ATLA 2.490482
## BOGO 8.909989 9.211743
## BOLI 20.446535 20.749147 28.975781
## BOYA 1.513473 2.511872 8.275174 21.476275
## CALD 2.699370 3.740281 6.866797 22.922701 1.784881
## CAQU 15.601445 15.867407 24.424651 5.863438 16.546350 18.035873
## CAUC 9.491254 9.714731 18.079961 11.482295 10.310291 11.785461
## CESA 15.414266 15.319873 24.159071 7.846197 16.197920 17.854770
## CORDO 33.996540 34.507953 42.292775 16.100258 35.124759 36.570484
## CUND 5.588139 5.987671 3.347417 25.753891 5.029344 3.734956
## CHOC 79.184596 79.005031 86.325146 62.529667 79.663842 80.883224
## HUIL 2.470729 3.623645 11.214562 18.595266 3.300076 4.672783
## GUAJ 61.414596 61.120557 69.723888 43.947316 62.086406 63.817631
## MAGD 20.001860 20.046035 28.740524 4.120801 20.860244 22.449281
## META 4.531424 5.573715 12.812693 16.468376 5.835598 7.179178
## NARI 14.517011 14.166478 22.410643 11.175858 14.922004 16.358154
## NDES 9.288692 9.016978 17.972727 12.958511 9.920302 11.602241
## QUIN 5.164969 5.775742 4.235682 25.528899 4.469172 2.877690
## RISA 3.786159 4.087310 6.075780 24.014275 2.715069 1.409610
## SANT 1.814525 2.942924 7.293147 22.135372 1.741063 1.826280
## SUCR 23.744187 24.178435 32.425118 7.950497 24.728922 26.215740
## TOLI 1.788575 2.223173 10.341368 19.430769 2.366601 3.953302
## VALL 5.796016 6.202427 3.470058 26.078972 5.089538 3.544771
## ARAU 30.671431 31.044706 38.794822 14.561082 31.807023 33.283027
## CASA 7.229910 7.277713 15.525730 15.024254 8.101876 9.746907
## PUTU 10.403245 10.118745 18.419251 12.729568 10.863577 12.338829
## SANA 9.802627 9.342901 14.922915 18.176080 10.011588 10.792511
## AMAZ 33.022754 32.380046 40.662149 18.677920 33.434810 34.993164
## GUAI 71.968513 72.020075 80.085298 52.522147 72.758509 74.288047
## GUAV 23.061160 23.494438 31.499238 3.217033 24.066518 25.486434
## VAUP 91.112158 91.088756 98.825296 72.169303 91.867393 93.348847
## VICH 95.875678 96.038066 103.789644 76.728766 96.775988 98.330705
## CAQU CAUC CESA CORDO CUND CHOC
## ATLA
## BOGO
## BOLI
## BOYA
## CALD
## CAQU
## CAUC 6.975013
## CESA 3.607007 7.365860
## CORDO 19.788411 26.205488 20.680225
## CUND 21.109974 14.805945 20.859767 39.166049
## CHOC 67.043220 70.478814 67.737453 62.505328 83.615654
## HUIL 13.513837 7.645417 13.400146 32.058035 7.894580 77.752804
## GUAJ 47.364948 53.236115 46.347772 34.503372 66.603846 53.051461
## MAGD 5.068816 11.075085 5.261160 16.885008 25.453465 63.193100
## META 11.881536 6.494544 11.869145 29.633503 9.595577 76.559182
## NARI 8.660260 6.440753 8.415723 26.667154 19.329540 65.109604
## NDES 7.655423 3.968161 6.464302 26.547970 14.666325 72.272504
## QUIN 20.700343 14.505496 20.524120 38.943195 1.661566 83.483917
## RISA 19.101704 12.834489 18.786580 37.729992 3.160807 81.650882
## SANT 17.281892 11.177549 17.034914 35.481156 3.973764 80.835328
## SUCR 9.196081 15.813447 10.085336 11.376920 29.166126 65.192144
## TOLI 14.398892 8.355483 14.040413 33.012372 7.012168 78.239227
## VALL 21.341769 15.042231 21.147492 39.629182 1.245110 83.699928
## ARAU 17.312608 23.435776 17.768689 5.083857 35.704067 65.951932
## CASA 10.037863 5.793557 9.137450 27.621725 12.291326 75.443751
## PUTU 8.858499 3.351388 8.549708 27.987201 15.276236 69.154753
## SANA 15.196111 8.833810 15.273837 33.678144 12.463483 71.672325
## AMAZ 21.532835 24.438212 20.713162 25.870319 37.707174 49.290581
## GUAI 57.603252 62.961037 57.845348 45.318261 77.061342 32.448624
## GUAV 8.696655 14.098965 10.495813 14.747841 28.325635 60.192760
## VAUP 77.377167 82.254715 77.611693 65.850301 95.949916 33.256386
## VICH 81.752725 87.430056 81.806088 66.476541 100.863733 54.481756
## HUIL GUAJ MAGD META NARI NDES
## ATLA
## BOGO
## BOLI
## BOYA
## CALD
## CAQU
## CAUC
## CESA
## CORDO
## CUND
## CHOC
## HUIL
## GUAJ 59.557509
## MAGD 18.020852 42.541507
## META 3.541878 57.689578 16.244033
## NARI 12.989985 50.459909 10.175834 12.431380
## NDES 7.292565 52.487770 11.412134 6.644200 8.106380
## QUIN 7.289925 66.425476 25.152286 9.448688 19.091776 14.273405
## RISA 5.796646 64.634123 23.445857 8.303674 17.144054 12.460618
## SANT 3.968829 62.962945 21.689479 5.985424 16.128562 10.850654
## SUCR 21.596321 40.637074 7.312633 19.704116 16.708471 15.800285
## TOLI 1.453238 60.074795 18.751928 4.140531 13.328128 7.760206
## VALL 8.017824 67.004751 25.742265 10.053059 19.460360 14.892280
## ARAU 28.788348 36.668148 14.879802 26.306370 24.559273 23.336330
## CASA 5.544574 54.719380 14.011460 4.027431 11.275008 4.000950
## PUTU 8.929043 53.297260 11.935322 8.459474 4.182834 5.254512
## SANA 9.912043 59.226692 18.313129 9.894104 9.695850 10.963079
## AMAZ 31.507171 36.369469 17.446269 30.300955 18.967997 25.056989
## GUAI 70.309173 27.701478 52.884848 68.197649 59.186521 63.878141
## GUAV 21.253212 42.260022 6.024508 19.085343 13.165231 15.745453
## VAUP 89.629780 45.713995 72.711165 87.489334 78.089776 83.382252
## VICH 94.318356 43.580606 77.095908 91.816923 84.539579 87.995136
## QUIN RISA SANT SUCR TOLI VALL
## ATLA
## BOGO
## BOLI
## BOYA
## CALD
## CAQU
## CAUC
## CESA
## CORDO
## CUND
## CHOC
## HUIL
## GUAJ
## MAGD
## META
## NARI
## NDES
## QUIN
## RISA 2.247065
## SANT 3.596860 2.671984
## SUCR 28.753857 27.340377 25.291182
## TOLI 6.526094 4.872268 3.162831 22.575447
## VALL 1.001948 2.739818 4.259988 29.487109 7.174273
## ARAU 35.541846 34.385446 32.056341 9.346138 29.655676 36.226870
## CASA 12.099483 10.684877 8.527878 17.398741 5.969472 12.748945
## PUTU 15.063293 13.175208 11.999458 17.661435 9.229003 15.460437
## SANA 12.737040 11.287227 10.797101 24.050004 9.588217 12.689370
## AMAZ 37.660759 35.667836 34.599980 22.108177 31.759107 37.962464
## GUAI 76.981985 75.238741 73.698460 52.260680 70.946486 77.409913
## GUAV 28.112680 26.609992 24.767095 8.422642 22.121119 28.653228
## VAUP 95.978013 94.238990 92.824767 72.713506 90.175946 96.309350
## VICH 100.875773 99.293585 97.542401 75.348324 94.956028 101.331703
## ARAU CASA PUTU SANA AMAZ GUAI
## ATLA
## BOGO
## BOLI
## BOYA
## CALD
## CAQU
## CAUC
## CESA
## CORDO
## CUND
## CHOC
## HUIL
## GUAJ
## MAGD
## META
## NARI
## NDES
## QUIN
## RISA
## SANT
## SUCR
## TOLI
## VALL
## ARAU
## CASA 24.047077
## PUTU 25.364294 7.697591
## SANA 31.042522 11.355972 7.151056
## AMAZ 25.923862 28.177865 22.847958 26.977012
## GUAI 49.214384 66.398511 62.704568 67.102830 43.097842
## GUAV 14.150258 17.794850 15.138752 20.360584 17.842584 49.837404
## VAUP 69.657884 85.915525 81.712183 85.369564 61.268958 21.076152
## VICH 70.207167 89.986949 87.596609 92.119102 69.444040 28.647930
## GUAV VAUP
## ATLA
## BOGO
## BOLI
## BOYA
## CALD
## CAQU
## CAUC
## CESA
## CORDO
## CUND
## CHOC
## HUIL
## GUAJ
## MAGD
## META
## NARI
## NDES
## QUIN
## RISA
## SANT
## SUCR
## TOLI
## VALL
## ARAU
## CASA
## PUTU
## SANA
## AMAZ
## GUAI
## GUAV
## VAUP 69.484240
## VICH 74.105582 23.445309
gru <- hclust(dis, method="ward.D") ;gru
##
## Call:
## hclust(d = dis, method = "ward.D")
##
## Cluster method : ward.D
## Distance : euclidean
## Number of objects: 33
plot(gru)
group <- cutree(gru, k=5);group
## ANTI ATLA BOGO BOLI BOYA CALD CAQU CAUC CESA CORDO CUND CHOC HUIL
## 1 1 1 2 1 1 2 3 2 2 1 4 1
## GUAJ MAGD META NARI NDES QUIN RISA SANT SUCR TOLI VALL ARAU CASA
## 5 2 3 3 3 1 1 1 2 1 1 2 3
## PUTU SANA AMAZ GUAI GUAV VAUP VICH
## 3 3 2 5 2 5 5
rect.hclust(gru, k=5, border="red")
pam.res <- pam(datos, 5)
# Visualización
fviz_cluster(pam.res, geom = "point", ellipse.type = "norm",
show.clust.cent = TRUE,star.plot = TRUE)+
labs(title = "Resultados clustering K-means")+ theme_bw()
## Too few points to calculate an ellipse