R-Markdown ini berisi tentang tahapan melakukan analisis klasterisasi data menggunakan metode K-Medoids.
K-medoids adalah sebuah algoritma dalam analisis clustering yang merupakan variasi dari algoritma K-means. Tujuan dari algoritma k-medoids adalah untuk membagi sekumpulan data menjadi beberapa kelompok (klaster) yang serupa berdasarkan jarak antara data.
Perbedaan utama antara k-medoids dan k-means adalah k-medoids menggunakan medoid sebagai representasi pusat klaster, sedangkan k-means menggunakan mean (rata-rata). Medoid dalam k-medoids adalah objek yang merupakan titik data aktual dalam klaster yang memiliki jarak terkecil rata-rata ke semua objek dalam klaster tersebut.
Analisis ini menggunakan data yang diambil dari dataset berikut:
https://onedrive.live.com/View.aspx?resid=142E00AB7215E1CF!317&authkey=!AO-28J608ImVBms
Dengan deskripsi data sebagai berikut:
Berdasarkan dataset tersebut, akan dilakukan klasterisasi status gizi dari 179 negara terdata. Beberapa variabel yang digunakan dalam analisis ini adalah sebagai berikut:
BMI
Thinness_ten_nineteen_years
Thinness_five_nine_years
Economy_status_develop
Economy_status_developing
Dari kelima variabel di atas akan dianalisis sehingga menghasilkan beberapa klaster yang mendeskripsikan setiap negara yang menjadi anggotanya termasuk ke dalam negara dengan kategori status gizi seperti apa. Klasterisasi tidak boleh memakai data time series sehingga perlu dipilih terlebih dahulu tahun berapakah yang ingin dianalisis. Dalam analisis ini, dipilih tahun 2010.
Tahapan dalam melakukan analisis klasterisasi menggunakan metode K-Medoids adalah sebagai berikut :
Menyiapkan data yang sesuai dengan format klasterisasi untuk dianalisis menggunakan algoritma K-Medoids, yaitu data yang hanya boleh berisi variabel numerik.
Melakukan cleaning data dan pre-processing data, seperti normalisasi atau standarisasi agar variabel memiliki skala yang serupa.
Menentukan nilai k dengan membandingkan nilai koefisien Sillhoute jika setiap metode menghasilkan k yang berbeda.
Menjalankan algoritma K-Medoids fungsi pam() (Partitioning Around Medoids) dengan menggunakan nilai k yang dihasilkan dari setiap metode. Fungsi ini akan menghasilkan model klastering berdasarkan data yang dianalisis. Kemudian, dipilih k dengan koefisien Silhouette terbesar.
Menginterpretasikan hasil analisis. Nilai koefisien Sillhouette (Euclidean) berada di antara -1 s.d. 1, semakin mendekati 1 maka semakin baik hasil klasterisasi.
Load package adalah proses memuat paket yang sudah di-install sebelumnya. Maka dari itu, kita perlu meng-install beberapa paket terlebih dahulu.
readxl : untuk meng-import data dari file xls dan
xlxs
cluster : untuk melakukan perintah analisis
klasterisasi
factoextra : untuk memvisualisasikan hasil dari
analisis data multivariat
dplyr : untuk memanipulasi data
library(readxl)
library(cluster)
library(factoextra)
## Loading required package: ggplot2
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
Melakukan import data dari Excel dengan nama file “data_case_method -
dataset.xlsx” menggunakan fungsi read_excel.
dataset <- read_excel("C:/Users/DELL/Downloads/data_case_method - dataset.xlsx") #mengimpor file data dari Excel
Melakukan penyeleksian baris dalam dataset yang sesuai dengan tahun
yang ditentukan, yaitu tahun 2010. Selanjutnya, melakukan slicing data
untuk memilih kolom tertentu, yaitu kolom variabel ke 2, 11, 17, 18, 20,
21. Setelah dilakukan cleaning data, akan dilakukan standarisasi data
menggunakan fungsi scale.
datafix <- subset(dataset, Year == 2010) #memilih hanya baris data yang memiliki nilai kolom "Year" sama dengan 2010
datafix <- datafix[,c(2,11,17,18,20,21)] #memilih kolom yang diinginkan dari subset data menggunakan indeks kolom, yaitu kolom dengan indeks 2, 11, 17, 18, 20 dan 21
datafix <- data.frame(datafix) #mengonversi objek datafix menjadi tipe data frame
head(datafix)
## Country BMI Thinness_ten_nineteen_years Thinness_five_nine_years
## 1 Switzerland 25.1 0.5 0.4
## 2 Germany 26.3 1.1 1.1
## 3 Belize 28.4 3.5 3.4
## 4 Sweden 25.8 1.3 1.3
## 5 Brunei Darussalam 26.4 5.9 5.4
## 6 Norway 26.4 0.7 0.7
## Economy_status_Developed Economy_status_Developing
## 1 1 0
## 2 1 0
## 3 0 1
## 4 1 0
## 5 0 1
## 6 1 0
rownames(datafix) <- datafix[,1] #menggunakan nilai kolom pertama (indeks 1) dari datafix sebagai nama baris data frame
datafix <- datafix[,-1] #menggunakan tanda minus (-) di depan indeks kolom 1 untuk menghapus kolom tersebut dari data frame
head(datafix) ##melihat beberapa baris pertama dari datafix
## BMI Thinness_ten_nineteen_years Thinness_five_nine_years
## Switzerland 25.1 0.5 0.4
## Germany 26.3 1.1 1.1
## Belize 28.4 3.5 3.4
## Sweden 25.8 1.3 1.3
## Brunei Darussalam 26.4 5.9 5.4
## Norway 26.4 0.7 0.7
## Economy_status_Developed Economy_status_Developing
## Switzerland 1 0
## Germany 1 0
## Belize 0 1
## Sweden 1 0
## Brunei Darussalam 0 1
## Norway 1 0
standarisasi <- scale(datafix) #menstandarisasi dengan mengubah setiap kolom menjadi memiliki mean 0 dan standar deviasi 1
data_standar <- data.frame(standarisasi) #mengonversi objek standarisasi menjadi tipe data frame
head(data_standar) #melihat beberapa baris pertama dari data yang telah distandarisasi
## BMI Thinness_ten_nineteen_years
## Switzerland -0.05914483 -0.9886502
## Germany 0.49562851 -0.8465259
## Belize 1.46648187 -0.2780289
## Sweden 0.26447295 -0.7991512
## Brunei Darussalam 0.54185963 0.2904681
## Norway 0.54185963 -0.9412754
## Thinness_five_nine_years Economy_status_Developed
## Switzerland -0.9948719 1.9535602
## Germany -0.8312795 1.9535602
## Belize -0.2937614 -0.5090262
## Sweden -0.7845388 1.9535602
## Brunei Darussalam 0.1736456 -0.5090262
## Norway -0.9247609 1.9535602
## Economy_status_Developing
## Switzerland -1.9535602
## Germany -1.9535602
## Belize 0.5090262
## Sweden -1.9535602
## Brunei Darussalam 0.5090262
## Norway -1.9535602
Mencari k optimum untuk masing-masing metode dengan menggunakan
fungsi fviz_nbclust . Algotima K-Medoids memiliki 3 metode,
yaitu :
Silhouette
Gap Statistics (Elbow)
Within Cluster Sums of Squares (WSS)
Maka, didapatkan nilai k untuk metode Silhouette adalah 2, Gap Statistics adalah 9, dan WSS adalah 4.
Setelah didapatkan kemungkinan klaster optimum, yaitu 2, 4, dan 9,
dilakukan 3 kali running dengan function pam
dengan centers = 2, centers = 4 dan
centers = 9.
kmed2 <- pam(data_standar, k = 2) #membuat model klaster untuk nilai k=2
kmed4 <- pam(data_standar, k = 4) #membuat model klaster untuk nilai k=4
kmed9 <- pam(data_standar, k = 9) #membuat model klaster untuk nilai untuk k=9
kmed2
## Medoids:
## ID BMI Thinness_ten_nineteen_years Thinness_five_nine_years
## Germany 2 0.49562851 -0.8465259 -0.8312795
## Algeria 171 -0.05914483 0.2904681 0.2671270
## Economy_status_Developed Economy_status_Developing
## Germany 1.9535602 -1.9535602
## Algeria -0.5090262 0.5090262
## Clustering vector:
## Switzerland Germany
## 1 1
## Belize Sweden
## 2 1
## Brunei Darussalam Norway
## 2 1
## Guinea-Bissau Namibia
## 2 2
## Slovenia Bhutan
## 1 2
## United Arab Emirates Serbia
## 2 2
## Honduras Haiti
## 2 2
## Tunisia Tajikistan
## 2 2
## Nicaragua India
## 2 2
## Lao PDR Guatemala
## 2 2
## Peru Yemen Rep.
## 2 2
## Trinidad and Tobago Ethiopia
## 2 2
## Morocco Croatia
## 2 1
## Poland Ireland
## 1 1
## China Mauritius
## 2 2
## Uzbekistan Somalia
## 2 2
## Cyprus Cabo Verde
## 1 2
## Venezuela RB Ukraine
## 2 2
## Mongolia Senegal
## 2 2
## Mozambique Cameroon
## 2 2
## Nigeria Thailand
## 2 2
## Antigua and Barbuda Moldova
## 2 2
## Tanzania Belarus
## 2 2
## Solomon Islands Greece
## 2 1
## Australia Timor-Leste
## 1 2
## Guinea Burkina Faso
## 2 2
## Bulgaria Grenada
## 1 2
## Malaysia Philippines
## 2 2
## Malawi Uruguay
## 2 2
## Gambia The Costa Rica
## 2 2
## Kyrgyz Republic Qatar
## 2 2
## Azerbaijan Brazil
## 2 2
## Madagascar Afghanistan
## 2 2
## Kuwait Iraq
## 2 2
## El Salvador Singapore
## 2 2
## Burundi Armenia
## 2 2
## Sierra Leone Kazakhstan
## 2 2
## Bosnia and Herzegovina Zambia
## 2 2
## Liberia France
## 2 1
## Ghana Lebanon
## 2 2
## Latvia Bolivia
## 1 2
## Canada St. Vincent and the Grenadines
## 1 2
## South Africa Panama
## 2 2
## Iran Islamic Rep. Lesotho
## 2 2
## Czechia Turkmenistan
## 1 2
## Djibouti Malta
## 2 1
## Russian Federation North Macedonia
## 2 2
## Myanmar Tonga
## 2 2
## Sri Lanka Sao Tome and Principe
## 2 2
## Egypt Arab Rep. Mauritania
## 2 2
## Lithuania Georgia
## 1 2
## Jordan Kenya
## 2 2
## Barbados Eritrea
## 2 2
## Indonesia Mali
## 2 2
## Ecuador Slovak Republic
## 2 1
## Saudi Arabia Suriname
## 2 2
## Estonia Dominican Republic
## 1 2
## Cambodia Libya
## 2 2
## Netherlands Eswatini
## 1 2
## Nepal Botswana
## 2 2
## Japan Fiji
## 1 2
## Romania United States
## 1 1
## Mexico Samoa
## 2 2
## Seychelles Luxembourg
## 2 1
## Iceland Hungary
## 1 1
## Pakistan Denmark
## 2 1
## Colombia Cote d'Ivoire
## 2 2
## Vanuatu Portugal
## 2 1
## Niger Maldives
## 2 2
## Albania United Kingdom
## 2 1
## Argentina Micronesia Fed. Sts.
## 2 2
## Bangladesh Equatorial Guinea
## 2 2
## Montenegro Syrian Arab Republic
## 2 2
## Finland Cuba
## 1 2
## Spain Belgium
## 1 1
## Vietnam Bahrain
## 2 2
## Papua New Guinea Bahamas The
## 2 2
## St. Lucia Chad
## 2 2
## Congo Rep. New Zealand
## 2 1
## Jamaica Kiribati
## 2 2
## Benin Israel
## 2 1
## Angola Rwanda
## 2 2
## Oman Comoros
## 2 2
## Italy Paraguay
## 1 2
## Turkiye Uganda
## 2 2
## Algeria Chile
## 2 2
## Zimbabwe Togo
## 2 2
## Austria Congo Dem. Rep.
## 1 2
## Guyana Gabon
## 2 2
## Central African Republic
## 2
## Objective function:
## build swap
## 1.283143 1.280068
##
## Available components:
## [1] "medoids" "id.med" "clustering" "objective" "isolation"
## [6] "clusinfo" "silinfo" "diss" "call" "data"
kmed4
## Medoids:
## ID BMI Thinness_ten_nineteen_years Thinness_five_nine_years
## Germany 2 0.4956285 -0.8465259 -0.8312795
## Ukraine 36 0.4956285 -0.5385901 -0.5040946
## Togo 174 -0.9837671 0.6220914 0.5943119
## Sri Lanka 97 -1.2611537 2.5170814 2.4873104
## Economy_status_Developed Economy_status_Developing
## Germany 1.9535602 -1.9535602
## Ukraine -0.5090262 0.5090262
## Togo -0.5090262 0.5090262
## Sri Lanka -0.5090262 0.5090262
## Clustering vector:
## Switzerland Germany
## 1 1
## Belize Sweden
## 2 1
## Brunei Darussalam Norway
## 2 1
## Guinea-Bissau Namibia
## 3 2
## Slovenia Bhutan
## 1 4
## United Arab Emirates Serbia
## 2 2
## Honduras Haiti
## 2 2
## Tunisia Tajikistan
## 2 2
## Nicaragua India
## 2 4
## Lao PDR Guatemala
## 3 2
## Peru Yemen Rep.
## 2 4
## Trinidad and Tobago Ethiopia
## 2 3
## Morocco Croatia
## 3 1
## Poland Ireland
## 1 1
## China Mauritius
## 3 3
## Uzbekistan Somalia
## 2 3
## Cyprus Cabo Verde
## 1 3
## Venezuela RB Ukraine
## 2 2
## Mongolia Senegal
## 2 2
## Mozambique Cameroon
## 3 3
## Nigeria Thailand
## 3 3
## Antigua and Barbuda Moldova
## 2 2
## Tanzania Belarus
## 3 2
## Solomon Islands Greece
## 2 1
## Australia Timor-Leste
## 1 4
## Guinea Burkina Faso
## 3 3
## Bulgaria Grenada
## 1 2
## Malaysia Philippines
## 3 3
## Malawi Uruguay
## 3 2
## Gambia The Costa Rica
## 3 2
## Kyrgyz Republic Qatar
## 2 2
## Azerbaijan Brazil
## 2 2
## Madagascar Afghanistan
## 3 4
## Kuwait Iraq
## 2 2
## El Salvador Singapore
## 2 2
## Burundi Armenia
## 3 2
## Sierra Leone Kazakhstan
## 3 2
## Bosnia and Herzegovina Zambia
## 2 3
## Liberia France
## 3 1
## Ghana Lebanon
## 3 2
## Latvia Bolivia
## 1 2
## Canada St. Vincent and the Grenadines
## 1 2
## South Africa Panama
## 3 2
## Iran Islamic Rep. Lesotho
## 3 3
## Czechia Turkmenistan
## 1 2
## Djibouti Malta
## 3 1
## Russian Federation North Macedonia
## 2 2
## Myanmar Tonga
## 4 2
## Sri Lanka Sao Tome and Principe
## 4 3
## Egypt Arab Rep. Mauritania
## 2 3
## Lithuania Georgia
## 1 2
## Jordan Kenya
## 2 3
## Barbados Eritrea
## 2 3
## Indonesia Mali
## 2 3
## Ecuador Slovak Republic
## 2 1
## Saudi Arabia Suriname
## 2 2
## Estonia Dominican Republic
## 1 2
## Cambodia Libya
## 4 2
## Netherlands Eswatini
## 1 2
## Nepal Botswana
## 4 3
## Japan Fiji
## 1 2
## Romania United States
## 1 1
## Mexico Samoa
## 2 2
## Seychelles Luxembourg
## 2 1
## Iceland Hungary
## 1 1
## Pakistan Denmark
## 2 1
## Colombia Cote d'Ivoire
## 2 3
## Vanuatu Portugal
## 2 1
## Niger Maldives
## 3 4
## Albania United Kingdom
## 2 1
## Argentina Micronesia Fed. Sts.
## 2 2
## Bangladesh Equatorial Guinea
## 4 3
## Montenegro Syrian Arab Republic
## 2 2
## Finland Cuba
## 1 2
## Spain Belgium
## 1 1
## Vietnam Bahrain
## 4 3
## Papua New Guinea Bahamas The
## 2 2
## St. Lucia Chad
## 2 3
## Congo Rep. New Zealand
## 3 1
## Jamaica Kiribati
## 2 2
## Benin Israel
## 3 1
## Angola Rwanda
## 3 3
## Oman Comoros
## 3 3
## Italy Paraguay
## 1 2
## Turkiye Uganda
## 2 3
## Algeria Chile
## 3 2
## Zimbabwe Togo
## 3 3
## Austria Congo Dem. Rep.
## 1 3
## Guyana Gabon
## 2 3
## Central African Republic
## 3
## Objective function:
## build swap
## 0.7676897 0.7008120
##
## Available components:
## [1] "medoids" "id.med" "clustering" "objective" "isolation"
## [6] "clusinfo" "silinfo" "diss" "call" "data"
kmed9
## Medoids:
## ID BMI Thinness_ten_nineteen_years
## Germany 2 0.4956285 -0.84652593
## Turkiye 169 1.0504019 0.05359434
## Guinea 51 -1.2149226 0.83527774
## Indonesia 107 -1.2611537 -0.72808906
## Sri Lanka 97 -1.2611537 2.51708141
## Brazil 64 0.2644730 -0.42015317
## Lesotho 88 -0.2440693 0.59840398
## Venezuela RB 35 0.6343219 -0.72808906
## Kiribati 160 2.0212552 -1.08339969
## Thinness_five_nine_years Economy_status_Developed
## Germany -0.83127947 1.9535602
## Turkiye 0.01005317 -0.5090262
## Guinea 0.82801546 -0.5090262
## Indonesia -0.73779807 -0.5090262
## Sri Lanka 2.48731039 -0.5090262
## Brazil -0.41061315 -0.5090262
## Lesotho 0.54757124 -0.5090262
## Venezuela RB -0.73779807 -0.5090262
## Kiribati -1.06498298 -0.5090262
## Economy_status_Developing
## Germany -1.9535602
## Turkiye 0.5090262
## Guinea 0.5090262
## Indonesia 0.5090262
## Sri Lanka 0.5090262
## Brazil 0.5090262
## Lesotho 0.5090262
## Venezuela RB 0.5090262
## Kiribati 0.5090262
## Clustering vector:
## Switzerland Germany
## 1 1
## Belize Sweden
## 2 1
## Brunei Darussalam Norway
## 2 1
## Guinea-Bissau Namibia
## 3 4
## Slovenia Bhutan
## 1 5
## United Arab Emirates Serbia
## 2 6
## Honduras Haiti
## 6 6
## Tunisia Tajikistan
## 7 6
## Nicaragua India
## 8 5
## Lao PDR Guatemala
## 3 8
## Peru Yemen Rep.
## 8 5
## Trinidad and Tobago Ethiopia
## 2 3
## Morocco Croatia
## 7 1
## Poland Ireland
## 1 1
## China Mauritius
## 4 7
## Uzbekistan Somalia
## 6 3
## Cyprus Cabo Verde
## 1 7
## Venezuela RB Ukraine
## 8 6
## Mongolia Senegal
## 6 4
## Mozambique Cameroon
## 4 7
## Nigeria Thailand
## 3 3
## Antigua and Barbuda Moldova
## 6 6
## Tanzania Belarus
## 3 8
## Solomon Islands Greece
## 8 1
## Australia Timor-Leste
## 1 3
## Guinea Burkina Faso
## 3 3
## Bulgaria Grenada
## 1 6
## Malaysia Philippines
## 7 3
## Malawi Uruguay
## 3 8
## Gambia The Costa Rica
## 3 8
## Kyrgyz Republic Qatar
## 6 2
## Azerbaijan Brazil
## 6 6
## Madagascar Afghanistan
## 3 5
## Kuwait Iraq
## 2 2
## El Salvador Singapore
## 8 4
## Burundi Armenia
## 3 6
## Sierra Leone Kazakhstan
## 3 6
## Bosnia and Herzegovina Zambia
## 6 3
## Liberia France
## 7 1
## Ghana Lebanon
## 7 2
## Latvia Bolivia
## 1 8
## Canada St. Vincent and the Grenadines
## 1 6
## South Africa Panama
## 7 8
## Iran Islamic Rep. Lesotho
## 7 7
## Czechia Turkmenistan
## 1 6
## Djibouti Malta
## 7 1
## Russian Federation North Macedonia
## 6 8
## Myanmar Tonga
## 5 9
## Sri Lanka Sao Tome and Principe
## 5 7
## Egypt Arab Rep. Mauritania
## 2 7
## Lithuania Georgia
## 1 8
## Jordan Kenya
## 2 3
## Barbados Eritrea
## 2 3
## Indonesia Mali
## 4 3
## Ecuador Slovak Republic
## 8 1
## Saudi Arabia Suriname
## 2 6
## Estonia Dominican Republic
## 1 6
## Cambodia Libya
## 3 2
## Netherlands Eswatini
## 1 2
## Nepal Botswana
## 5 7
## Japan Fiji
## 1 2
## Romania United States
## 1 1
## Mexico Samoa
## 8 9
## Seychelles Luxembourg
## 2 1
## Iceland Hungary
## 1 1
## Pakistan Denmark
## 4 1
## Colombia Cote d'Ivoire
## 6 7
## Vanuatu Portugal
## 8 1
## Niger Maldives
## 4 5
## Albania United Kingdom
## 8 1
## Argentina Micronesia Fed. Sts.
## 8 9
## Bangladesh Equatorial Guinea
## 5 3
## Montenegro Syrian Arab Republic
## 8 2
## Finland Cuba
## 1 6
## Spain Belgium
## 1 1
## Vietnam Bahrain
## 5 7
## Papua New Guinea Bahamas The
## 6 8
## St. Lucia Chad
## 2 3
## Congo Rep. New Zealand
## 3 1
## Jamaica Kiribati
## 8 9
## Benin Israel
## 3 1
## Angola Rwanda
## 3 3
## Oman Comoros
## 7 7
## Italy Paraguay
## 1 6
## Turkiye Uganda
## 2 3
## Algeria Chile
## 7 8
## Zimbabwe Togo
## 7 3
## Austria Congo Dem. Rep.
## 1 4
## Guyana Gabon
## 7 7
## Central African Republic
## 3
## Objective function:
## build swap
## 0.4700965 0.4577924
##
## Available components:
## [1] "medoids" "id.med" "clustering" "objective" "isolation"
## [6] "clusinfo" "silinfo" "diss" "call" "data"
Untuk mendapatkan hasil klaster optimum, perlu membandingkan nilai
euclid setiap nilai k menggunakan fungsi fviz_silhouette
dengan data ‘datastd’.
value_kmed2 <- silhouette(kmed2$cluster, dist(data_standar)) #menghitung nilai average silhouette (euclid) k=2
fviz_silhouette(value_kmed2)
## cluster size ave.sil.width
## 1 1 37 0.86
## 2 2 142 0.50
value_kmed4 <- silhouette(kmed4$cluster, dist(data_standar)) #menghitung nilai average silhouette (euclid) k=4
fviz_silhouette(value_kmed4)
## cluster size ave.sil.width
## 1 1 37 0.85
## 2 2 77 0.52
## 3 3 53 0.47
## 4 4 12 0.38
value_kmed9 <- silhouette(kmed9$cluster, dist(data_standar)) #menghitung nilai average silhouette (euclid) k=9
fviz_silhouette(value_kmed9)
## cluster size ave.sil.width
## 1 1 37 0.84
## 2 2 19 0.35
## 3 3 30 0.32
## 4 4 9 0.54
## 5 5 10 0.41
## 6 6 25 0.32
## 7 7 23 0.41
## 8 8 22 0.36
## 9 9 4 0.60
Maka, diperoleh nilai koefisien untuk k=2 adalah 0.58, k=4 adalah
0.56,dan k=9 adalah 0.47. Sehingga diperoleh k optimum adalah 2 dengan
nilai koefisien 0.58.
Hasil klasterisasi yang disimpan ke dalam ‘kmed2’ dengan k=2
digabungkan dalam data sebelum di standarisasi menggunakan
cbind. Kemudian, akan disimpan dalam variabel
data-klasterisasi. Setelah itu, dibuat plot dengan fungsi
fviz_cluster untuk memvisualisasikan hasil
klasterisasi.
data_klasterisasi <- cbind(datafix, cluster = kmed2$clustering) #menambahkan nilai klaster ke datafix
data_klasterisasi
## BMI Thinness_ten_nineteen_years
## Switzerland 25.1 0.5
## Germany 26.3 1.1
## Belize 28.4 3.5
## Sweden 25.8 1.3
## Brunei Darussalam 26.4 5.9
## Norway 26.4 0.7
## Guinea-Bissau 23.0 8.0
## Namibia 23.8 1.4
## Slovenia 26.1 1.6
## Bhutan 23.3 16.6
## United Arab Emirates 28.0 5.1
## Serbia 25.8 2.2
## Honduras 26.1 2.3
## Haiti 24.6 4.0
## Tunisia 25.9 6.3
## Tajikistan 25.2 3.7
## Nicaragua 26.7 1.9
## India 21.4 27.0
## Lao PDR 22.2 9.3
## Guatemala 26.0 1.3
## Peru 26.0 1.1
## Yemen Rep. 23.3 13.7
## Trinidad and Tobago 27.0 5.9
## Ethiopia 20.3 11.0
## Morocco 25.4 6.3
## Croatia 26.7 1.6
## Poland 26.1 2.1
## Ireland 27.1 0.3
## China 23.2 4.2
## Mauritius 25.0 7.2
## Uzbekistan 26.0 3.0
## Somalia 22.8 7.0
## Cyprus 26.7 0.9
## Cabo Verde 24.2 7.4
## Venezuela RB 26.6 1.6
## Ukraine 26.3 2.4
## Mongolia 25.4 2.2
## Senegal 22.7 1.4
## Mozambique 22.3 3.7
## Cameroon 24.0 6.1
## Nigeria 23.0 11.3
## Thailand 23.8 8.2
## Antigua and Barbuda 26.1 3.3
## Moldova 26.6 2.8
## Tanzania 22.8 7.1
## Belarus 26.3 2.0
## Solomon Islands 25.8 1.2
## Greece 27.1 0.8
## Australia 26.9 0.7
## Timor-Leste 20.7 11.5
## Guinea 22.6 8.2
## Burkina Faso 21.8 9.0
## Bulgaria 26.0 2.0
## Grenada 26.4 3.8
## Malaysia 25.0 8.2
## Philippines 22.7 1.0
## Malawi 22.5 6.8
## Uruguay 26.7 1.5
## Gambia The 23.4 8.2
## Costa Rica 26.8 1.8
## Kyrgyz Republic 25.8 3.2
## Qatar 28.5 5.0
## Azerbaijan 26.4 2.8
## Brazil 25.8 2.9
## Madagascar 21.1 7.6
## Afghanistan 22.7 18.4
## Kuwait 29.0 3.3
## Iraq 28.0 5.3
## El Salvador 27.1 1.7
## Singapore 23.5 2.1
## Burundi 21.3 7.7
## Armenia 26.0 2.0
## Sierra Leone 22.6 8.3
## Kazakhstan 26.0 2.3
## Bosnia and Herzegovina 25.4 2.6
## Zambia 22.2 6.7
## Liberia 23.8 7.4
## France 25.1 0.6
## Ghana 23.6 7.1
## Lebanon 27.1 4.7
## Latvia 26.3 2.2
## Bolivia 25.8 1.2
## Canada 26.8 0.5
## St. Vincent and the Grenadines 26.6 3.5
## South Africa 26.9 7.3
## Panama 26.5 2.0
## Iran Islamic Rep. 25.8 7.8
## Lesotho 24.7 7.2
## Czechia 26.8 1.9
## Turkmenistan 25.8 3.2
## Djibouti 23.9 5.6
## Malta 27.1 0.8
## Russian Federation 26.1 2.3
## North Macedonia 26.3 2.3
## Myanmar 22.1 13.1
## Tonga 31.8 0.1
## Sri Lanka 22.5 15.3
## Sao Tome and Principe 24.4 6.1
## Egypt Arab Rep. 28.8 3.0
## Mauritania 24.6 8.7
## Lithuania 26.3 2.8
## Georgia 26.8 2.6
## Jordan 28.5 3.8
## Kenya 22.8 8.2
## Barbados 27.3 3.8
## Eritrea 20.5 8.9
## Indonesia 22.5 1.6
## Mali 22.6 8.8
## Ecuador 26.5 1.3
## Slovak Republic 26.0 1.3
## Saudi Arabia 28.1 7.3
## Suriname 26.1 3.5
## Estonia 26.1 1.9
## Dominican Republic 25.9 3.3
## Cambodia 21.6 11.0
## Libya 27.6 5.6
## Netherlands 25.5 1.0
## Eswatini 26.4 5.4
## Nepal 21.8 16.7
## Botswana 24.1 8.0
## Japan 22.7 1.9
## Fiji 27.2 4.0
## Romania 26.0 3.0
## United States 28.5 0.7
## Mexico 27.5 1.6
## Samoa 31.5 0.2
## Seychelles 26.2 5.8
## Luxembourg 26.1 0.9
## Iceland 26.0 0.9
## Hungary 26.8 1.8
## Pakistan 23.4 2.2
## Denmark 25.3 1.1
## Colombia 25.7 2.2
## Cote d'Ivoire 23.5 6.3
## Vanuatu 25.9 1.5
## Portugal 25.8 0.7
## Niger 21.5 1.7
## Maldives 24.6 14.0
## Albania 26.1 1.4
## United Kingdom 27.0 0.8
## Argentina 27.1 1.0
## Micronesia Fed. Sts. 29.3 0.2
## Bangladesh 21.1 18.9
## Equatorial Guinea 23.5 9.0
## Montenegro 26.1 2.0
## Syrian Arab Republic 27.7 6.4
## Finland 26.0 0.9
## Cuba 25.2 3.4
## Spain 26.2 0.6
## Belgium 25.9 0.9
## Vietnam 21.0 14.5
## Bahrain 25.0 6.0
## Papua New Guinea 25.0 1.4
## Bahamas The 27.5 2.5
## St. Lucia 28.7 4.3
## Chad 21.6 9.4
## Congo Rep. 22.8 8.1
## New Zealand 27.6 0.3
## Jamaica 26.9 1.8
## Kiribati 29.6 0.1
## Benin 23.1 7.8
## Israel 26.9 1.2
## Angola 22.8 9.1
## Rwanda 21.7 6.5
## Oman 25.9 6.9
## Comoros 23.8 7.1
## Italy 25.7 0.5
## Paraguay 26.0 2.1
## Turkiye 27.5 4.9
## Uganda 22.0 6.0
## Algeria 25.1 5.9
## Chile 27.4 0.8
## Zimbabwe 23.6 7.1
## Togo 23.1 7.3
## Austria 25.4 1.7
## Congo Dem. Rep. 21.6 1.4
## Guyana 25.8 5.6
## Gabon 24.7 6.5
## Central African Republic 22.4 9.0
## Thinness_five_nine_years
## Switzerland 0.4
## Germany 1.1
## Belize 3.4
## Sweden 1.3
## Brunei Darussalam 5.4
## Norway 0.7
## Guinea-Bissau 7.9
## Namibia 1.4
## Slovenia 1.6
## Bhutan 17.3
## United Arab Emirates 4.9
## Serbia 2.3
## Honduras 2.2
## Haiti 4.0
## Tunisia 6.3
## Tajikistan 3.8
## Nicaragua 1.8
## India 27.8
## Lao PDR 9.5
## Guatemala 1.3
## Peru 1.1
## Yemen Rep. 13.7
## Trinidad and Tobago 6.3
## Ethiopia 1.7
## Morocco 6.2
## Croatia 1.6
## Poland 2.2
## Ireland 0.2
## China 3.6
## Mauritius 7.2
## Uzbekistan 3.1
## Somalia 6.8
## Cyprus 1.0
## Cabo Verde 7.4
## Venezuela RB 1.5
## Ukraine 2.5
## Mongolia 2.3
## Senegal 1.3
## Mozambique 3.6
## Cameroon 6.2
## Nigeria 11.2
## Thailand 8.3
## Antigua and Barbuda 3.3
## Moldova 3.0
## Tanzania 7.1
## Belarus 2.2
## Solomon Islands 1.2
## Greece 0.7
## Australia 0.6
## Timor-Leste 11.5
## Guinea 8.2
## Burkina Faso 8.6
## Bulgaria 2.0
## Grenada 3.8
## Malaysia 8.0
## Philippines 9.7
## Malawi 6.7
## Uruguay 1.5
## Gambia The 8.1
## Costa Rica 1.8
## Kyrgyz Republic 3.3
## Qatar 4.6
## Azerbaijan 2.9
## Brazil 2.9
## Madagascar 7.5
## Afghanistan 18.4
## Kuwait 3.2
## Iraq 5.1
## El Salvador 1.6
## Singapore 2.1
## Burundi 7.7
## Armenia 2.1
## Sierra Leone 8.2
## Kazakhstan 2.5
## Bosnia and Herzegovina 2.6
## Zambia 6.5
## Liberia 7.2
## France 0.6
## Ghana 7.0
## Lebanon 4.7
## Latvia 2.3
## Bolivia 1.1
## Canada 0.4
## St. Vincent and the Grenadines 3.5
## South Africa 8.9
## Panama 1.9
## Iran Islamic Rep. 8.0
## Lesotho 7.0
## Czechia 2.0
## Turkmenistan 3.3
## Djibouti 5.6
## Malta 0.7
## Russian Federation 2.5
## North Macedonia 2.3
## Myanmar 13.3
## Tonga 0.1
## Sri Lanka 15.3
## Sao Tome and Principe 6.0
## Egypt Arab Rep. 2.9
## Mauritania 8.5
## Lithuania 2.8
## Georgia 2.8
## Jordan 3.8
## Kenya 8.0
## Barbados 3.8
## Eritrea 8.8
## Indonesia 1.5
## Mali 8.5
## Ecuador 1.2
## Slovak Republic 1.3
## Saudi Arabia 7.4
## Suriname 3.4
## Estonia 2.0
## Dominican Republic 3.3
## Cambodia 11.3
## Libya 5.4
## Netherlands 0.9
## Eswatini 5.6
## Nepal 17.2
## Botswana 7.8
## Japan 1.6
## Fiji 3.7
## Romania 3.2
## United States 0.6
## Mexico 1.6
## Samoa 0.2
## Seychelles 6.2
## Luxembourg 0.9
## Iceland 0.9
## Hungary 1.8
## Pakistan 2.7
## Denmark 0.9
## Colombia 2.0
## Cote d'Ivoire 6.2
## Vanuatu 1.4
## Portugal 0.5
## Niger 1.6
## Maldives 14.1
## Albania 1.5
## United Kingdom 0.5
## Argentina 0.9
## Micronesia Fed. Sts. 0.2
## Bangladesh 19.4
## Equatorial Guinea 9.0
## Montenegro 2.0
## Syrian Arab Republic 6.1
## Finland 0.8
## Cuba 3.2
## Spain 0.5
## Belgium 0.9
## Vietnam 15.4
## Bahrain 5.9
## Papua New Guinea 1.3
## Bahamas The 2.5
## St. Lucia 4.3
## Chad 9.3
## Congo Rep. 7.7
## New Zealand 0.3
## Jamaica 1.7
## Kiribati 0.1
## Benin 7.6
## Israel 1.1
## Angola 9.0
## Rwanda 6.3
## Oman 6.8
## Comoros 6.9
## Italy 0.5
## Paraguay 2.0
## Turkiye 4.7
## Uganda 6.0
## Algeria 5.8
## Chile 0.9
## Zimbabwe 7.0
## Togo 7.2
## Austria 1.9
## Congo Dem. Rep. 1.2
## Guyana 5.3
## Gabon 6.4
## Central African Republic 8.9
## Economy_status_Developed
## Switzerland 1
## Germany 1
## Belize 0
## Sweden 1
## Brunei Darussalam 0
## Norway 1
## Guinea-Bissau 0
## Namibia 0
## Slovenia 1
## Bhutan 0
## United Arab Emirates 0
## Serbia 0
## Honduras 0
## Haiti 0
## Tunisia 0
## Tajikistan 0
## Nicaragua 0
## India 0
## Lao PDR 0
## Guatemala 0
## Peru 0
## Yemen Rep. 0
## Trinidad and Tobago 0
## Ethiopia 0
## Morocco 0
## Croatia 1
## Poland 1
## Ireland 1
## China 0
## Mauritius 0
## Uzbekistan 0
## Somalia 0
## Cyprus 1
## Cabo Verde 0
## Venezuela RB 0
## Ukraine 0
## Mongolia 0
## Senegal 0
## Mozambique 0
## Cameroon 0
## Nigeria 0
## Thailand 0
## Antigua and Barbuda 0
## Moldova 0
## Tanzania 0
## Belarus 0
## Solomon Islands 0
## Greece 1
## Australia 1
## Timor-Leste 0
## Guinea 0
## Burkina Faso 0
## Bulgaria 1
## Grenada 0
## Malaysia 0
## Philippines 0
## Malawi 0
## Uruguay 0
## Gambia The 0
## Costa Rica 0
## Kyrgyz Republic 0
## Qatar 0
## Azerbaijan 0
## Brazil 0
## Madagascar 0
## Afghanistan 0
## Kuwait 0
## Iraq 0
## El Salvador 0
## Singapore 0
## Burundi 0
## Armenia 0
## Sierra Leone 0
## Kazakhstan 0
## Bosnia and Herzegovina 0
## Zambia 0
## Liberia 0
## France 1
## Ghana 0
## Lebanon 0
## Latvia 1
## Bolivia 0
## Canada 1
## St. Vincent and the Grenadines 0
## South Africa 0
## Panama 0
## Iran Islamic Rep. 0
## Lesotho 0
## Czechia 1
## Turkmenistan 0
## Djibouti 0
## Malta 1
## Russian Federation 0
## North Macedonia 0
## Myanmar 0
## Tonga 0
## Sri Lanka 0
## Sao Tome and Principe 0
## Egypt Arab Rep. 0
## Mauritania 0
## Lithuania 1
## Georgia 0
## Jordan 0
## Kenya 0
## Barbados 0
## Eritrea 0
## Indonesia 0
## Mali 0
## Ecuador 0
## Slovak Republic 1
## Saudi Arabia 0
## Suriname 0
## Estonia 1
## Dominican Republic 0
## Cambodia 0
## Libya 0
## Netherlands 1
## Eswatini 0
## Nepal 0
## Botswana 0
## Japan 1
## Fiji 0
## Romania 1
## United States 1
## Mexico 0
## Samoa 0
## Seychelles 0
## Luxembourg 1
## Iceland 1
## Hungary 1
## Pakistan 0
## Denmark 1
## Colombia 0
## Cote d'Ivoire 0
## Vanuatu 0
## Portugal 1
## Niger 0
## Maldives 0
## Albania 0
## United Kingdom 1
## Argentina 0
## Micronesia Fed. Sts. 0
## Bangladesh 0
## Equatorial Guinea 0
## Montenegro 0
## Syrian Arab Republic 0
## Finland 1
## Cuba 0
## Spain 1
## Belgium 1
## Vietnam 0
## Bahrain 0
## Papua New Guinea 0
## Bahamas The 0
## St. Lucia 0
## Chad 0
## Congo Rep. 0
## New Zealand 1
## Jamaica 0
## Kiribati 0
## Benin 0
## Israel 1
## Angola 0
## Rwanda 0
## Oman 0
## Comoros 0
## Italy 1
## Paraguay 0
## Turkiye 0
## Uganda 0
## Algeria 0
## Chile 0
## Zimbabwe 0
## Togo 0
## Austria 1
## Congo Dem. Rep. 0
## Guyana 0
## Gabon 0
## Central African Republic 0
## Economy_status_Developing cluster
## Switzerland 0 1
## Germany 0 1
## Belize 1 2
## Sweden 0 1
## Brunei Darussalam 1 2
## Norway 0 1
## Guinea-Bissau 1 2
## Namibia 1 2
## Slovenia 0 1
## Bhutan 1 2
## United Arab Emirates 1 2
## Serbia 1 2
## Honduras 1 2
## Haiti 1 2
## Tunisia 1 2
## Tajikistan 1 2
## Nicaragua 1 2
## India 1 2
## Lao PDR 1 2
## Guatemala 1 2
## Peru 1 2
## Yemen Rep. 1 2
## Trinidad and Tobago 1 2
## Ethiopia 1 2
## Morocco 1 2
## Croatia 0 1
## Poland 0 1
## Ireland 0 1
## China 1 2
## Mauritius 1 2
## Uzbekistan 1 2
## Somalia 1 2
## Cyprus 0 1
## Cabo Verde 1 2
## Venezuela RB 1 2
## Ukraine 1 2
## Mongolia 1 2
## Senegal 1 2
## Mozambique 1 2
## Cameroon 1 2
## Nigeria 1 2
## Thailand 1 2
## Antigua and Barbuda 1 2
## Moldova 1 2
## Tanzania 1 2
## Belarus 1 2
## Solomon Islands 1 2
## Greece 0 1
## Australia 0 1
## Timor-Leste 1 2
## Guinea 1 2
## Burkina Faso 1 2
## Bulgaria 0 1
## Grenada 1 2
## Malaysia 1 2
## Philippines 1 2
## Malawi 1 2
## Uruguay 1 2
## Gambia The 1 2
## Costa Rica 1 2
## Kyrgyz Republic 1 2
## Qatar 1 2
## Azerbaijan 1 2
## Brazil 1 2
## Madagascar 1 2
## Afghanistan 1 2
## Kuwait 1 2
## Iraq 1 2
## El Salvador 1 2
## Singapore 1 2
## Burundi 1 2
## Armenia 1 2
## Sierra Leone 1 2
## Kazakhstan 1 2
## Bosnia and Herzegovina 1 2
## Zambia 1 2
## Liberia 1 2
## France 0 1
## Ghana 1 2
## Lebanon 1 2
## Latvia 0 1
## Bolivia 1 2
## Canada 0 1
## St. Vincent and the Grenadines 1 2
## South Africa 1 2
## Panama 1 2
## Iran Islamic Rep. 1 2
## Lesotho 1 2
## Czechia 0 1
## Turkmenistan 1 2
## Djibouti 1 2
## Malta 0 1
## Russian Federation 1 2
## North Macedonia 1 2
## Myanmar 1 2
## Tonga 1 2
## Sri Lanka 1 2
## Sao Tome and Principe 1 2
## Egypt Arab Rep. 1 2
## Mauritania 1 2
## Lithuania 0 1
## Georgia 1 2
## Jordan 1 2
## Kenya 1 2
## Barbados 1 2
## Eritrea 1 2
## Indonesia 1 2
## Mali 1 2
## Ecuador 1 2
## Slovak Republic 0 1
## Saudi Arabia 1 2
## Suriname 1 2
## Estonia 0 1
## Dominican Republic 1 2
## Cambodia 1 2
## Libya 1 2
## Netherlands 0 1
## Eswatini 1 2
## Nepal 1 2
## Botswana 1 2
## Japan 0 1
## Fiji 1 2
## Romania 0 1
## United States 0 1
## Mexico 1 2
## Samoa 1 2
## Seychelles 1 2
## Luxembourg 0 1
## Iceland 0 1
## Hungary 0 1
## Pakistan 1 2
## Denmark 0 1
## Colombia 1 2
## Cote d'Ivoire 1 2
## Vanuatu 1 2
## Portugal 0 1
## Niger 1 2
## Maldives 1 2
## Albania 1 2
## United Kingdom 0 1
## Argentina 1 2
## Micronesia Fed. Sts. 1 2
## Bangladesh 1 2
## Equatorial Guinea 1 2
## Montenegro 1 2
## Syrian Arab Republic 1 2
## Finland 0 1
## Cuba 1 2
## Spain 0 1
## Belgium 0 1
## Vietnam 1 2
## Bahrain 1 2
## Papua New Guinea 1 2
## Bahamas The 1 2
## St. Lucia 1 2
## Chad 1 2
## Congo Rep. 1 2
## New Zealand 0 1
## Jamaica 1 2
## Kiribati 1 2
## Benin 1 2
## Israel 0 1
## Angola 1 2
## Rwanda 1 2
## Oman 1 2
## Comoros 1 2
## Italy 0 1
## Paraguay 1 2
## Turkiye 1 2
## Uganda 1 2
## Algeria 1 2
## Chile 1 2
## Zimbabwe 1 2
## Togo 1 2
## Austria 0 1
## Congo Dem. Rep. 1 2
## Guyana 1 2
## Gabon 1 2
## Central African Republic 1 2
fviz_cluster(kmed2, data = data_klasterisasi,
main = 'Plot Klasterisasi berdasarkan Klaster',
xlab = 'X',
ylab = 'Y',
geom = "point", #menunjukkan titik-titik data dalam ruang berdasarkan klaster
ggtheme = theme_minimal()) #membuat plot klaster
Menggunakan pipe operator %>% untuk melakukan
manipulasi data agar menghasilkan statistika deskriptif yang diinginkan.
Selanjutnya, dilakukan pengelompokan berdasarkan klaster menggunakan
fungsi group_by() dan fungsi summarize_all() untuk menghitung rata-rata,
nilai minimum, dan nilai maximum setiap kolom.
summary <- data_klasterisasi %>%
group_by(cluster) %>% #mengelompokkan berdasarkan klaster
summarize_all(list(mean = mean, min = min, max = max)) #membuat statistik deskriptif
print(summary)
## # A tibble: 2 x 16
## cluster BMI_mean Thinness_ten_nineteen_years_mean Thinness_five_nine_years_m~1
## <int> <dbl> <dbl> <dbl>
## 1 1 26.2 1.20 1.17
## 2 2 25.0 5.58 5.57
## # i abbreviated name: 1: Thinness_five_nine_years_mean
## # i 12 more variables: Economy_status_Developed_mean <dbl>,
## # Economy_status_Developing_mean <dbl>, BMI_min <dbl>,
## # Thinness_ten_nineteen_years_min <dbl>, Thinness_five_nine_years_min <dbl>,
## # Economy_status_Developed_min <dbl>, Economy_status_Developing_min <dbl>,
## # BMI_max <dbl>, Thinness_ten_nineteen_years_max <dbl>,
## # Thinness_five_nine_years_max <dbl>, Economy_status_Developed_max <dbl>, ...
Berdasarkan hasil analisis menggunakan algoritma k-medoids pada data di atas, diperoleh 2 klaster untuk kategori status gizi dari 179 negara terdata. Interpretasi dari setiap klaster adalah sebagai berikut:
Klaster 1 berisi 37 negara dengan status gizi baik, yaitu
memiliki rata-rata BMI sebesar 26.22162, rata-rata remaja
usia 10-19 tahun yang kekurangan gizi sebesar 1.202703 per
1000 orang, dan rata-rata anak usia 5-9 tahun yang kekurangan gizi
sebesar 1.170270 per 1000 orang. Negara dalam klaster 1 ini
termasuk negara dalam kondisi telah maju.
Klaster 2 berisi 142 negara dengan status gizi sedang, yaitu
memiliki rata-rata BMI sebesar 24.96901, rata-rata remaja
usia 10-19 tahun yang kekurangan gizi sebesar 5.578169 per
1000 orang, dan rata-rata anak usia 5-9 tahun yang kekurangan gizi
sebesar 5.565493 per 1000 orang. Negara dalam klaster 1 ini
termasuk negara dalam kondisi sedang berkembang.
Tinggi redahnya status gizi (Thinness_ten_nineteen_years
dan Thinness_five_nine_years) pada suatu negara dapat
dilihat berdasarkan besaran BMI dan dipengaruhi juga oleh status sebuah
negara, yaitu negara yang termasuk negara berkembang atau negara
maju.