Definición

El Análisis de Conglomerados, es una técnica estadística multivariante que busca agrupar un conjunto de elementos (o variables) tratando de lograr la máxima homogeneidad en cada grupo y la mayor heterogeneidad entre los grupos, de tal forma que cada elemento sea muy parecido a los que hay en el conglomerado con respecto a algún criterio de selección predeterminado.

Datos

Los datos sobre las Necesidades Básicas Insatisfechas en los departamentos de Colombia. De acuerdo con el Departamento nacional de Estadística (DANE) de Colombia: “La metodología de NBI busca determinar, con ayuda de algunos indicadores simples, si las necesidades básicas de la población se encuentran cubiertas. Los grupos que no alcancen un umbral mínimo fijado, son clasificados como pobres. Los indicadores simples seleccionados, son: Viviendas inadecuadas, Viviendas con hacinamiento crítico, Viviendas con servicios inadecuados, Viviendas con alta dependencia económica, Viviendas con niños en edad escolar que no asisten a la escuela”

datos<-data.frame(vivienda,servicios,hacinamiento,inasistencia, dependencia,nbi)
rownames(datos)<-Dpto
datos

##       vivienda servicios hacinamiento inasistencia dependencia   nbi
## ANTI      3.53      1.89         2.77         1.73        4.15 10.73
## ATLA      2.16      1.49         4.07         2.95        3.39 11.37
## BOGO      0.36      0.10         1.43         1.04        0.81  3.47
## BOLI     13.16      9.55         4.82         3.20        6.22 26.73
## BOYA      2.33      1.80         3.21         1.32        4.53 10.15
## CALD      1.74      1.55         2.07         1.22        4.37  8.95
## CAQU     10.12      5.91         4.71         2.93        7.68 23.62
## CAUC      5.99      5.88         4.09         1.58        5.18 18.81
## CESA      9.31      5.04         8.06         3.12        7.73 23.04
## CORDO    25.99      6.17         7.20         1.86        8.67 35.08
## CUND      1.41      0.63         1.93         1.35        1.87  6.36
## CHOC      8.52     57.47        12.80         4.57       10.98 65.51
## HUIL      4.02      1.70         2.80         1.41        5.24 12.86
## GUAJ     29.24     15.23        32.69         6.80       18.19 53.33
## MAGD     11.54      8.04         7.76         3.30        8.07 26.71
## META      6.99      2.67         3.46         1.76        3.87 13.45
## NARI      3.30     10.11         6.52         1.91        5.72 21.98
## NDES      5.65      3.29         6.54         2.57        6.52 18.43
## QUIN      1.14      0.34         1.35         1.42        3.32  6.76
## RISA      0.82      1.25         2.42         1.79        4.21  8.19
## SANT      2.92      0.86         2.58         1.45        3.50  9.58
## SUCR     16.60      4.47         6.28         1.58       10.10 29.13
## TOLI      3.26      1.61         3.53         1.87        4.63 12.22
## VALL      0.70      0.68         1.39         1.61        2.69  6.25
## ARAU     24.20      2.96         8.46         2.63        6.87 32.45
## CASA      7.00      1.33         6.10         1.62        4.59 16.08
## PUTU      3.54      7.55         5.60         1.61        4.81 18.96
## SANA      0.80      9.40         3.61         1.85        0.38 14.89
## AMAZ      5.72     19.13        16.18         3.71        6.15 35.24
## GUAI     32.84     39.72        22.69         5.98       14.14 59.46
## GUAV     14.76     11.79         4.94         2.25        6.90 27.91
## VAUP     37.33     56.68        28.44         8.84       11.84 68.94
## VICH     56.59     45.70        34.02        10.08       16.75 67.76

Descriptivos

summary(datos)

##     vivienda       servicios      hacinamiento     inasistencia   
##  Min.   : 0.36   Min.   : 0.10   Min.   : 1.350   Min.   : 1.040  
##  1st Qu.: 2.33   1st Qu.: 1.55   1st Qu.: 2.800   1st Qu.: 1.580  
##  Median : 5.72   Median : 4.47   Median : 4.820   Median : 1.860  
##  Mean   :10.71   Mean   :10.36   Mean   : 8.016   Mean   : 2.815  
##  3rd Qu.:13.16   3rd Qu.: 9.55   3rd Qu.: 7.760   3rd Qu.: 3.120  
##  Max.   :56.59   Max.   :57.47   Max.   :34.020   Max.   :10.080  
##   dependencia          nbi       
##  Min.   : 0.380   Min.   : 3.47  
##  1st Qu.: 4.150   1st Qu.:10.73  
##  Median : 5.240   Median :18.81  
##  Mean   : 6.487   Mean   :24.38  
##  3rd Qu.: 7.730   3rd Qu.:29.13  
##  Max.   :18.190   Max.   :68.94

df_status(datos)

##       variable q_zeros p_zeros q_na p_na q_inf p_inf    type unique
## 1     vivienda       0       0    0    0     0     0 numeric     33
## 2    servicios       0       0    0    0     0     0 numeric     33
## 3 hacinamiento       0       0    0    0     0     0 numeric     33
## 4 inasistencia       0       0    0    0     0     0 numeric     31
## 5  dependencia       0       0    0    0     0     0 numeric     33
## 6          nbi       0       0    0    0     0     0 numeric     33

plot_num(datos)

## Warning: `guides(<scale> = FALSE)` is deprecated. Please use `guides(<scale> =
## "none")` instead.

profiling_num(datos)

##       variable      mean   std_dev variation_coef   p_01  p_05  p_25  p_50
## 1     vivienda 10.714545 12.931849      1.2069433 0.4688 0.760  2.33  5.72
## 2    servicios 10.363333 15.791027      1.5237401 0.1768 0.514  1.55  4.47
## 3 hacinamiento  8.015758  8.820378      1.1003799 1.3628 1.414  2.80  4.82
## 4 inasistencia  2.815455  2.164476      0.7687839 1.0976 1.280  1.58  1.86
## 5  dependencia  6.486970  4.133758      0.6372403 0.5176 1.446  4.15  5.24
## 6          nbi 24.375758 18.802166      0.7713470 4.3596 6.316 10.73 18.81
##    p_75   p_95    p_99 skewness kurtosis   iqr          range_98
## 1 13.16 34.636 50.4268 1.884165 6.303414 10.83 [0.4688, 50.4268]
## 2  9.55 50.092 57.2172 2.111858 6.189265  8.00 [0.1768, 57.2172]
## 3  7.76 30.140 33.5944 1.959675 5.684490  4.96 [1.3628, 33.5944]
## 4  3.12  7.616  9.6832 2.074988 6.636664  1.54  [1.0976, 9.6832]
## 5  7.73 15.184 17.7292 1.216311 4.222175  3.58 [0.5176, 17.7292]
## 6 29.13 66.410 68.5624 1.234856 3.467506 18.40 [4.3596, 68.5624]
##          range_80
## 1  [0.884, 28.59]
## 2 [0.716, 35.602]
## 3 [1.958, 21.388]
## 4  [1.362, 5.698]
## 5 [2.816, 11.668]
## 6 [7.046, 58.234]

Distancias

La distancia se emplea dentro del contexto del clustering como la cuantificación de la similitud o diferencia entre observaciones. En tanto más se asemejen dos elementos más próximos estarán.

Una de las medidas más utilizadas para determinar el grado de similitud o disimilitud entre observaciones es la distancia euclídea (o euclidiana)

La correlación también es una medida de distancia muy útil cuando la definición de similitud se hace en términos de patrón o forma y no de magnitud. la correlación puede ser de distintos tipos (Pearson, Spearman).

La distancia basada en la correlación, considera dos observaciones como similares si sus características asociadas están altamente correlacionadas, incluso aunque los valores observados estén alejados en términos de distancia euclídea.

La distancia euclídea entre los puntos \(X=(x_{1}, x_{2},\ldots, x_{n})\) y \(Y=(y_{1}, y_{2}, \ldots y_{n})\) del espacio \(n-\)dimensional está definida como:

\(d= \sqrt{(x_{1}-y_{1})^{2}+(x_{2}-y_{2})^{2}+\cdots+(x_{n}-y_{n})^{2}}=\sqrt{\displaystyle\sum_{i=1}^{n}(x_{i}-y_{i})^{2}}\)

distancia <- dist(datos, method = "euclidean")
fviz_dist(distancia)

corrplot(as.matrix(distancia),is.corr = FALSE, method = "color")

corrplot(as.matrix(distancia), is.corr = FALSE,method = "color",order = "hclust", type = "upper")

distan <- as.matrix(distancia)
heatmap(distan, xlab = "Departamentos",ylab = "Departamentos",main = "Mapa de calor")

Número de grupos

Una forma sencilla de estimar el número K óptimo de clusters es aplicar el algoritmo de K-means para un rango de valores de K e identificar aquel valor a partir del cual la reducción en la suma total de varianza intra-cluster deja de ser significativa. A esta estrategia se la conoce como método del codo o elbow method.

num <- (nrow(datos)-1)*sum(apply(datos,2,var))
for (i in 2:15) num[i] <- sum(kmeans(datos,
   centers=i)$withinss)
num

##  [1] 27829.8465  7459.4143  4546.1756  4008.6331  2248.5150  2705.2870
##  [7]  2554.4409  1273.6218  2020.5025   889.9278   828.3037  1938.9068
## [13]  1877.2827  1859.6173   732.9575

plot(1:15, num, type="b", xlab="Numero de Clusters",  ylab="Suma de cuadrados dentro de grupos",col="red",lwd=2)

K-means

K-medias es un algoritmo de aprendizaje no supervisado que tiene como objetivo generar una partición de un conjunto de \(n\) observaciones en \(k\) grupos. Cada grupo se representa por la media de los puntos que lo componen. El representante de cada grupo se denomina centroide. La cantidad de grupos \(k\), se debe establecer de antemano. El método de clustering comienza con \(k\) centroides ubicados de forma aleatoria, y asigna cada observación al centroide más cercano. Clasifica objetos en múltiples grupos (conglomerados), de modo que los objetos dentro del mismo conglomerado son lo más similares posible mientras que los objetos de diferentes conglomerados son lo más diferentes posible. En el agrupamiento de k-medias, cada grupo está representado por su centro (es decir, centroide) que corresponde a la media de los puntos asignados al grupo. El método comienza con \(k\) centroides ubicados de forma aleatoria, y asigna cada observación al centroide más cercano. Se minimiza la suma total de cuadrados intra-cluster (suma de las distancias al cuadrado de cada observación respecto a su centroide)

grupos<-kmeans(datos,5)
grupos

## K-means clustering with 5 clusters of sizes 4, 13, 1, 8, 7
## 
## Cluster means:
##    vivienda servicios hacinamiento inasistencia dependencia       nbi
## 1 39.000000 39.332500    29.460000     7.925000   15.230000 62.372500
## 2  2.413846  1.274615     2.539231     1.609231    3.583077  9.256923
## 3  8.520000 57.470000    12.800000     4.570000   10.980000 65.510000
## 4  5.713750  6.063750     5.653750     2.148750    5.326250 19.476250
## 5 15.995714  8.872857     7.948571     2.647143    7.568571 30.464286
## 
## Clustering vector:
##  ANTI  ATLA  BOGO  BOLI  BOYA  CALD  CAQU  CAUC  CESA CORDO  CUND  CHOC  HUIL 
##     2     2     2     5     2     2     4     4     4     5     2     3     2 
##  GUAJ  MAGD  META  NARI  NDES  QUIN  RISA  SANT  SUCR  TOLI  VALL  ARAU  CASA 
##     1     5     2     4     4     2     2     2     5     2     2     5     4 
##  PUTU  SANA  AMAZ  GUAI  GUAV  VAUP  VICH 
##     4     4     5     1     5     1     1 
## 
## Within cluster sum of squares by cluster:
## [1] 1642.7503  179.7424    0.0000  256.2164  670.1502
##  (between_SS / total_SS =  90.1 %)
## 
## Available components:
## 
## [1] "cluster"      "centers"      "totss"        "withinss"     "tot.withinss"
## [6] "betweenss"    "size"         "iter"         "ifault"

grupos$size

## [1]  4 13  1  8  7

grupos$cluster

##  ANTI  ATLA  BOGO  BOLI  BOYA  CALD  CAQU  CAUC  CESA CORDO  CUND  CHOC  HUIL 
##     2     2     2     5     2     2     4     4     4     5     2     3     2 
##  GUAJ  MAGD  META  NARI  NDES  QUIN  RISA  SANT  SUCR  TOLI  VALL  ARAU  CASA 
##     1     5     2     4     4     2     2     2     5     2     2     5     4 
##  PUTU  SANA  AMAZ  GUAI  GUAV  VAUP  VICH 
##     4     4     5     1     5     1     1

data.frame(grupos$cluster)

##       grupos.cluster
## ANTI               2
## ATLA               2
## BOGO               2
## BOLI               5
## BOYA               2
## CALD               2
## CAQU               4
## CAUC               4
## CESA               4
## CORDO              5
## CUND               2
## CHOC               3
## HUIL               2
## GUAJ               1
## MAGD               5
## META               2
## NARI               4
## NDES               4
## QUIN               2
## RISA               2
## SANT               2
## SUCR               5
## TOLI               2
## VALL               2
## ARAU               5
## CASA               4
## PUTU               4
## SANA               4
## AMAZ               5
## GUAI               1
## GUAV               5
## VAUP               1
## VICH               1

aggregate(datos,by=list(grupos$cluster),FUN=mean)

##   Group.1  vivienda servicios hacinamiento inasistencia dependencia       nbi
## 1       1 39.000000 39.332500    29.460000     7.925000   15.230000 62.372500
## 2       2  2.413846  1.274615     2.539231     1.609231    3.583077  9.256923
## 3       3  8.520000 57.470000    12.800000     4.570000   10.980000 65.510000
## 4       4  5.713750  6.063750     5.653750     2.148750    5.326250 19.476250
## 5       5 15.995714  8.872857     7.948571     2.647143    7.568571 30.464286

plot(datos, col = grupos$cluster)
points(grupos$centers, col = 1:5, pch = 8)

clusplot(datos,grupos$cluster,color=TRUE,shade=TRUE,labels=2, lines=0)

plotcluster(datos, grupos$cluster)

resu <- pamk(datos,5);resu

## $pamobject
## Medoids:
##      ID vivienda servicios hacinamiento inasistencia dependencia   nbi
## SANT 21     2.92      0.86         2.58         1.45        3.50  9.58
## MAGD 15    11.54      8.04         7.76         3.30        8.07 26.71
## PUTU 27     3.54      7.55         5.60         1.61        4.81 18.96
## CHOC 12     8.52     57.47        12.80         4.57       10.98 65.51
## GUAI 30    32.84     39.72        22.69         5.98       14.14 59.46
## Clustering vector:
##  ANTI  ATLA  BOGO  BOLI  BOYA  CALD  CAQU  CAUC  CESA CORDO  CUND  CHOC  HUIL 
##     1     1     1     2     1     1     2     3     2     2     1     4     1 
##  GUAJ  MAGD  META  NARI  NDES  QUIN  RISA  SANT  SUCR  TOLI  VALL  ARAU  CASA 
##     5     2     1     3     3     1     1     1     2     1     1     2     3 
##  PUTU  SANA  AMAZ  GUAI  GUAV  VAUP  VICH 
##     3     3     2     5     2     5     5 
## Objective function:
##    build     swap 
## 6.849995 6.827259 
## 
## Available components:
##  [1] "medoids"    "id.med"     "clustering" "objective"  "isolation" 
##  [6] "clusinfo"   "silinfo"    "diss"       "call"       "data"      
## 
## $nc
## [1] 5
## 
## $crit
## [1] 0.0000000 0.0000000 0.0000000 0.0000000 0.3734445

layout(matrix(c(1, 2), 1, 2))
plot(resu$pamobject)

Cluster jerárquico.

Este método de manera iterativa agrupa observaciones basado en sus distancias hasta que cada observación pertenece a un grupo más grande.

No requiere especificación previa de clusters-

##cluster jerarquico
dis <- dist(datos, method = "euclidean");dis

##             ANTI       ATLA       BOGO       BOLI       BOYA       CALD
## ATLA    2.490482                                                       
## BOGO    8.909989   9.211743                                            
## BOLI   20.446535  20.749147  28.975781                                 
## BOYA    1.513473   2.511872   8.275174  21.476275                      
## CALD    2.699370   3.740281   6.866797  22.922701   1.784881           
## CAQU   15.601445  15.867407  24.424651   5.863438  16.546350  18.035873
## CAUC    9.491254   9.714731  18.079961  11.482295  10.310291  11.785461
## CESA   15.414266  15.319873  24.159071   7.846197  16.197920  17.854770
## CORDO  33.996540  34.507953  42.292775  16.100258  35.124759  36.570484
## CUND    5.588139   5.987671   3.347417  25.753891   5.029344   3.734956
## CHOC   79.184596  79.005031  86.325146  62.529667  79.663842  80.883224
## HUIL    2.470729   3.623645  11.214562  18.595266   3.300076   4.672783
## GUAJ   61.414596  61.120557  69.723888  43.947316  62.086406  63.817631
## MAGD   20.001860  20.046035  28.740524   4.120801  20.860244  22.449281
## META    4.531424   5.573715  12.812693  16.468376   5.835598   7.179178
## NARI   14.517011  14.166478  22.410643  11.175858  14.922004  16.358154
## NDES    9.288692   9.016978  17.972727  12.958511   9.920302  11.602241
## QUIN    5.164969   5.775742   4.235682  25.528899   4.469172   2.877690
## RISA    3.786159   4.087310   6.075780  24.014275   2.715069   1.409610
## SANT    1.814525   2.942924   7.293147  22.135372   1.741063   1.826280
## SUCR   23.744187  24.178435  32.425118   7.950497  24.728922  26.215740
## TOLI    1.788575   2.223173  10.341368  19.430769   2.366601   3.953302
## VALL    5.796016   6.202427   3.470058  26.078972   5.089538   3.544771
## ARAU   30.671431  31.044706  38.794822  14.561082  31.807023  33.283027
## CASA    7.229910   7.277713  15.525730  15.024254   8.101876   9.746907
## PUTU   10.403245  10.118745  18.419251  12.729568  10.863577  12.338829
## SANA    9.802627   9.342901  14.922915  18.176080  10.011588  10.792511
## AMAZ   33.022754  32.380046  40.662149  18.677920  33.434810  34.993164
## GUAI   71.968513  72.020075  80.085298  52.522147  72.758509  74.288047
## GUAV   23.061160  23.494438  31.499238   3.217033  24.066518  25.486434
## VAUP   91.112158  91.088756  98.825296  72.169303  91.867393  93.348847
## VICH   95.875678  96.038066 103.789644  76.728766  96.775988  98.330705
##             CAQU       CAUC       CESA      CORDO       CUND       CHOC
## ATLA                                                                   
## BOGO                                                                   
## BOLI                                                                   
## BOYA                                                                   
## CALD                                                                   
## CAQU                                                                   
## CAUC    6.975013                                                       
## CESA    3.607007   7.365860                                            
## CORDO  19.788411  26.205488  20.680225                                 
## CUND   21.109974  14.805945  20.859767  39.166049                      
## CHOC   67.043220  70.478814  67.737453  62.505328  83.615654           
## HUIL   13.513837   7.645417  13.400146  32.058035   7.894580  77.752804
## GUAJ   47.364948  53.236115  46.347772  34.503372  66.603846  53.051461
## MAGD    5.068816  11.075085   5.261160  16.885008  25.453465  63.193100
## META   11.881536   6.494544  11.869145  29.633503   9.595577  76.559182
## NARI    8.660260   6.440753   8.415723  26.667154  19.329540  65.109604
## NDES    7.655423   3.968161   6.464302  26.547970  14.666325  72.272504
## QUIN   20.700343  14.505496  20.524120  38.943195   1.661566  83.483917
## RISA   19.101704  12.834489  18.786580  37.729992   3.160807  81.650882
## SANT   17.281892  11.177549  17.034914  35.481156   3.973764  80.835328
## SUCR    9.196081  15.813447  10.085336  11.376920  29.166126  65.192144
## TOLI   14.398892   8.355483  14.040413  33.012372   7.012168  78.239227
## VALL   21.341769  15.042231  21.147492  39.629182   1.245110  83.699928
## ARAU   17.312608  23.435776  17.768689   5.083857  35.704067  65.951932
## CASA   10.037863   5.793557   9.137450  27.621725  12.291326  75.443751
## PUTU    8.858499   3.351388   8.549708  27.987201  15.276236  69.154753
## SANA   15.196111   8.833810  15.273837  33.678144  12.463483  71.672325
## AMAZ   21.532835  24.438212  20.713162  25.870319  37.707174  49.290581
## GUAI   57.603252  62.961037  57.845348  45.318261  77.061342  32.448624
## GUAV    8.696655  14.098965  10.495813  14.747841  28.325635  60.192760
## VAUP   77.377167  82.254715  77.611693  65.850301  95.949916  33.256386
## VICH   81.752725  87.430056  81.806088  66.476541 100.863733  54.481756
##             HUIL       GUAJ       MAGD       META       NARI       NDES
## ATLA                                                                   
## BOGO                                                                   
## BOLI                                                                   
## BOYA                                                                   
## CALD                                                                   
## CAQU                                                                   
## CAUC                                                                   
## CESA                                                                   
## CORDO                                                                  
## CUND                                                                   
## CHOC                                                                   
## HUIL                                                                   
## GUAJ   59.557509                                                       
## MAGD   18.020852  42.541507                                            
## META    3.541878  57.689578  16.244033                                 
## NARI   12.989985  50.459909  10.175834  12.431380                      
## NDES    7.292565  52.487770  11.412134   6.644200   8.106380           
## QUIN    7.289925  66.425476  25.152286   9.448688  19.091776  14.273405
## RISA    5.796646  64.634123  23.445857   8.303674  17.144054  12.460618
## SANT    3.968829  62.962945  21.689479   5.985424  16.128562  10.850654
## SUCR   21.596321  40.637074   7.312633  19.704116  16.708471  15.800285
## TOLI    1.453238  60.074795  18.751928   4.140531  13.328128   7.760206
## VALL    8.017824  67.004751  25.742265  10.053059  19.460360  14.892280
## ARAU   28.788348  36.668148  14.879802  26.306370  24.559273  23.336330
## CASA    5.544574  54.719380  14.011460   4.027431  11.275008   4.000950
## PUTU    8.929043  53.297260  11.935322   8.459474   4.182834   5.254512
## SANA    9.912043  59.226692  18.313129   9.894104   9.695850  10.963079
## AMAZ   31.507171  36.369469  17.446269  30.300955  18.967997  25.056989
## GUAI   70.309173  27.701478  52.884848  68.197649  59.186521  63.878141
## GUAV   21.253212  42.260022   6.024508  19.085343  13.165231  15.745453
## VAUP   89.629780  45.713995  72.711165  87.489334  78.089776  83.382252
## VICH   94.318356  43.580606  77.095908  91.816923  84.539579  87.995136
##             QUIN       RISA       SANT       SUCR       TOLI       VALL
## ATLA                                                                   
## BOGO                                                                   
## BOLI                                                                   
## BOYA                                                                   
## CALD                                                                   
## CAQU                                                                   
## CAUC                                                                   
## CESA                                                                   
## CORDO                                                                  
## CUND                                                                   
## CHOC                                                                   
## HUIL                                                                   
## GUAJ                                                                   
## MAGD                                                                   
## META                                                                   
## NARI                                                                   
## NDES                                                                   
## QUIN                                                                   
## RISA    2.247065                                                       
## SANT    3.596860   2.671984                                            
## SUCR   28.753857  27.340377  25.291182                                 
## TOLI    6.526094   4.872268   3.162831  22.575447                      
## VALL    1.001948   2.739818   4.259988  29.487109   7.174273           
## ARAU   35.541846  34.385446  32.056341   9.346138  29.655676  36.226870
## CASA   12.099483  10.684877   8.527878  17.398741   5.969472  12.748945
## PUTU   15.063293  13.175208  11.999458  17.661435   9.229003  15.460437
## SANA   12.737040  11.287227  10.797101  24.050004   9.588217  12.689370
## AMAZ   37.660759  35.667836  34.599980  22.108177  31.759107  37.962464
## GUAI   76.981985  75.238741  73.698460  52.260680  70.946486  77.409913
## GUAV   28.112680  26.609992  24.767095   8.422642  22.121119  28.653228
## VAUP   95.978013  94.238990  92.824767  72.713506  90.175946  96.309350
## VICH  100.875773  99.293585  97.542401  75.348324  94.956028 101.331703
##             ARAU       CASA       PUTU       SANA       AMAZ       GUAI
## ATLA                                                                   
## BOGO                                                                   
## BOLI                                                                   
## BOYA                                                                   
## CALD                                                                   
## CAQU                                                                   
## CAUC                                                                   
## CESA                                                                   
## CORDO                                                                  
## CUND                                                                   
## CHOC                                                                   
## HUIL                                                                   
## GUAJ                                                                   
## MAGD                                                                   
## META                                                                   
## NARI                                                                   
## NDES                                                                   
## QUIN                                                                   
## RISA                                                                   
## SANT                                                                   
## SUCR                                                                   
## TOLI                                                                   
## VALL                                                                   
## ARAU                                                                   
## CASA   24.047077                                                       
## PUTU   25.364294   7.697591                                            
## SANA   31.042522  11.355972   7.151056                                 
## AMAZ   25.923862  28.177865  22.847958  26.977012                      
## GUAI   49.214384  66.398511  62.704568  67.102830  43.097842           
## GUAV   14.150258  17.794850  15.138752  20.360584  17.842584  49.837404
## VAUP   69.657884  85.915525  81.712183  85.369564  61.268958  21.076152
## VICH   70.207167  89.986949  87.596609  92.119102  69.444040  28.647930
##             GUAV       VAUP
## ATLA                       
## BOGO                       
## BOLI                       
## BOYA                       
## CALD                       
## CAQU                       
## CAUC                       
## CESA                       
## CORDO                      
## CUND                       
## CHOC                       
## HUIL                       
## GUAJ                       
## MAGD                       
## META                       
## NARI                       
## NDES                       
## QUIN                       
## RISA                       
## SANT                       
## SUCR                       
## TOLI                       
## VALL                       
## ARAU                       
## CASA                       
## PUTU                       
## SANA                       
## AMAZ                       
## GUAI                       
## GUAV                       
## VAUP   69.484240           
## VICH   74.105582  23.445309

gru <- hclust(dis, method="ward.D") ;gru

## 
## Call:
## hclust(d = dis, method = "ward.D")
## 
## Cluster method   : ward.D 
## Distance         : euclidean 
## Number of objects: 33

plot(gru)
group <- cutree(gru, k=5);group

##  ANTI  ATLA  BOGO  BOLI  BOYA  CALD  CAQU  CAUC  CESA CORDO  CUND  CHOC  HUIL 
##     1     1     1     2     1     1     2     3     2     2     1     4     1 
##  GUAJ  MAGD  META  NARI  NDES  QUIN  RISA  SANT  SUCR  TOLI  VALL  ARAU  CASA 
##     5     2     3     3     3     1     1     1     2     1     1     2     3 
##  PUTU  SANA  AMAZ  GUAI  GUAV  VAUP  VICH 
##     3     3     2     5     2     5     5

rect.hclust(gru, k=5, border="red")

pam.res <- pam(datos, 5)
# Visualización
fviz_cluster(pam.res, geom = "point", ellipse.type = "norm",
             show.clust.cent = TRUE,star.plot = TRUE)+
  labs(title = "Resultados clustering K-means")+ theme_bw()

## Too few points to calculate an ellipse

Análisis de conglomerados (cluster)

Orlando Moscote Flórez

22/2/2022