Pasos previos:
Descargue las puntuaciones de felicidad de cada país de este link
Si la estructura de los datos tiene está apariencia, prosiga; de lo contrario no debe avanzar:
## 'data.frame': 155 obs. of 8 variables:
## $ Country : chr "Finland" "Norway" "Denmark" "Iceland" ...
## $ ScoreHappy : num 7.63 7.59 7.55 7.5 7.49 ...
## $ GDP : num 1.3 1.46 1.35 1.34 1.42 ...
## $ Social : num 1.59 1.58 1.59 1.64 1.55 ...
## $ Healthy : num 0.874 0.861 0.868 0.914 0.927 0.878 0.896 0.876 0.913 0.91 ...
## $ Freedom : num 0.681 0.686 0.683 0.677 0.66 0.638 0.653 0.669 0.659 0.647 ...
## $ Generosity : num 0.202 0.286 0.284 0.353 0.256 0.333 0.321 0.365 0.285 0.361 ...
## $ Perceptions: num 0.393 0.34 0.408 0.138 0.357 0.295 0.291 0.389 0.383 0.302 ...
## - attr(*, "na.action")= 'omit' Named int 20
## ..- attr(*, "names")= chr "21"
## Country ScoreHappy GDP Social
## Length:155 Min. :2.905 Min. :0.0000 Min. :0.000
## Class :character 1st Qu.:4.452 1st Qu.:0.6125 1st Qu.:1.075
## Mode :character Median :5.358 Median :0.9400 Median :1.258
## Mean :5.367 Mean :0.8837 Mean :1.216
## 3rd Qu.:6.154 3rd Qu.:1.1925 3rd Qu.:1.464
## Max. :7.632 Max. :1.6490 Max. :1.644
## Healthy Freedom Generosity Perceptions
## Min. :0.0000 Min. :0.0000 Min. :0.000 Min. :0.000
## 1st Qu.:0.4205 1st Qu.:0.3575 1st Qu.:0.109 1st Qu.:0.051
## Median :0.6430 Median :0.4930 Median :0.173 Median :0.082
## Mean :0.5969 Mean :0.4556 Mean :0.181 Mean :0.112
## 3rd Qu.:0.7785 3rd Qu.:0.5790 3rd Qu.:0.240 3rd Qu.:0.137
## Max. :1.0300 Max. :0.7240 Max. :0.598 Max. :0.457
##
## (0,5] (5,7] (7,10]
## 59 83 13
Prepare los datos para el analisis cluster, use como semilla aleatoria al numero 123:
Calcule 3 intervalos usando la técnica de k-medoides y la jerarquica divisiva:
¿Se debió obtener 3 clusters usando pam, u otro valor era mejor?
¿Se debió obtener 3 clusters usando diana, u otro valor era mejor?
Si se mantiene pedir tres clusters en ambos procedimientos ¿Cuál clusterizó mejor?
Si se mantiene pedir tres clusters en ambos procedimientos ¿ Cuántos países de los mal clusterizados por diana no fueron mal clusterizados por pam?
Si usamos dbscan, ¿Cuántos clusters se formarían si usamos un epsilo de 0.08?
Si usamos dbscan, ¿Qué países no fueron clusterizados (atípicos)?
¿Qué paises coinciden entre los atipicos de dbscan y los mal clusterizados por pam:
¿Hay alguno de los países del intervalo mas bajo (calculado al inicio con cut) que sea parte de los paises dificiles de clusterizar en las dbscan?