Practicando clustering:

Pasos previos:

## 'data.frame':    155 obs. of  8 variables:
##  $ Country    : chr  "Finland" "Norway" "Denmark" "Iceland" ...
##  $ ScoreHappy : num  7.63 7.59 7.55 7.5 7.49 ...
##  $ GDP        : num  1.3 1.46 1.35 1.34 1.42 ...
##  $ Social     : num  1.59 1.58 1.59 1.64 1.55 ...
##  $ Healthy    : num  0.874 0.861 0.868 0.914 0.927 0.878 0.896 0.876 0.913 0.91 ...
##  $ Freedom    : num  0.681 0.686 0.683 0.677 0.66 0.638 0.653 0.669 0.659 0.647 ...
##  $ Generosity : num  0.202 0.286 0.284 0.353 0.256 0.333 0.321 0.365 0.285 0.361 ...
##  $ Perceptions: num  0.393 0.34 0.408 0.138 0.357 0.295 0.291 0.389 0.383 0.302 ...
##  - attr(*, "na.action")= 'omit' Named int 20
##   ..- attr(*, "names")= chr "21"
##    Country            ScoreHappy         GDP             Social     
##  Length:155         Min.   :2.905   Min.   :0.0000   Min.   :0.000  
##  Class :character   1st Qu.:4.452   1st Qu.:0.6125   1st Qu.:1.075  
##  Mode  :character   Median :5.358   Median :0.9400   Median :1.258  
##                     Mean   :5.367   Mean   :0.8837   Mean   :1.216  
##                     3rd Qu.:6.154   3rd Qu.:1.1925   3rd Qu.:1.464  
##                     Max.   :7.632   Max.   :1.6490   Max.   :1.644  
##     Healthy          Freedom         Generosity     Perceptions   
##  Min.   :0.0000   Min.   :0.0000   Min.   :0.000   Min.   :0.000  
##  1st Qu.:0.4205   1st Qu.:0.3575   1st Qu.:0.109   1st Qu.:0.051  
##  Median :0.6430   Median :0.4930   Median :0.173   Median :0.082  
##  Mean   :0.5969   Mean   :0.4556   Mean   :0.181   Mean   :0.112  
##  3rd Qu.:0.7785   3rd Qu.:0.5790   3rd Qu.:0.240   3rd Qu.:0.137  
##  Max.   :1.0300   Max.   :0.7240   Max.   :0.598   Max.   :0.457
## 
##  (0,5]  (5,7] (7,10] 
##     59     83     13

Responda:

  1. ¿Se debió obtener 3 clusters usando pam, u otro valor era mejor?

  2. ¿Se debió obtener 3 clusters usando diana, u otro valor era mejor?

  3. Si se mantiene pedir tres clusters en ambos procedimientos ¿Cuál clusterizó mejor?

  4. Si se mantiene pedir tres clusters en ambos procedimientos ¿ Cuántos países de los mal clusterizados por diana no fueron mal clusterizados por pam?

  5. Si usamos dbscan, ¿Cuántos clusters se formarían si usamos un epsilo de 0.08?

  6. Si usamos dbscan, ¿Qué países no fueron clusterizados (atípicos)?

  7. ¿Qué paises coinciden entre los atipicos de dbscan y los mal clusterizados por pam:

  8. ¿Hay alguno de los países del intervalo mas bajo (calculado al inicio con cut) que sea parte de los paises dificiles de clusterizar en las dbscan?