> install.packages("knitr")
> install.packages("rmarkdown")
Error in contrib.url(repos, "source"): trying to use CRAN without setting a mirror
> install.packages("tinytex")
Error in contrib.url(repos, "source"): trying to use CRAN without setting a mirror
> install.packages("prettydoc")
Error in contrib.url(repos, "source"): trying to use CRAN without setting a mirrorPenggunaan internet secara global telah menjadi indikator penting dalam perkembangan sosial, ekonomi, dan teknologi suatu negara. Data dari GapMinder yang digunakan dalam penelitian ini menyediakan gambaran komprehensif tentang penggunaan internet di berbagai negara, memungkinkan analisis mendalam terhadap pola-pola penggunaannya. Dengan memanfaatkan indeks dan data tersebut, studi ini bertujuan untuk mengelompokkan negara-negara di dunia berdasarkan tingkat penggunaan internet mereka, juga mengeksplorasi hubungan antara tingkat penggunaan internet dengan indikator lain seperti pendapatan, dan urbanisasi, serta memetakan negara mana saja yang termasuk kelompok yang sama berdasarkan karakteristik yang ada.
| countryname | inncomeperperson | internetuserate | urbanrate |
|---|---|---|---|
| Albania | 1914,996 | 44,989 | 46,72 |
| Algeria | 2231,993 | 12,500 | 65,22 |
| Andorra | 21943,339 | 81 | 88,92 |
| : | : | : | : |
| Zambia | 432,226 | 10,125 | 35,42 |
| Zimbabwe | 320,771 | 11,500 | 37,34 |
Clustering atau pengelompokan merupakan salah satu metode analisis data yang digunakan untuk mengidentifikasi pola dalam kumpulan data dengan cara mengelompokkan objek-objek yang memiliki kemiripan ke dalam kelompok tertentu (cluster). Sebaliknya, objek yang memiliki karakteristik berbeda akan dimasukkan ke dalam kelompok yang lain. Metode ini penting digunakan dalam berbagai bidang seperti sains, bisnis, dan sosial untuk memahami struktur data dan menemukan hubungan tersembunyi antarobjek (Hair, 2010).
Dalam penelitian ini, pengelompokan negara berdasarkan penggunaan internet menjadi fokus utama. Data yang dianalisis terdiri dari tiga variabel yang mencerminkan karakteristik utama dari setiap negara. Untuk mencapai tujuan ini, analisis clustering hierarki digunakan karena fleksibilitasnya dalam mengelompokkan data dengan pola yang belum diketahui sebelumnya.
Analisis clustering secara umum terbagi menjadi dua pendekatan utama, yaitu clustering hierarki dan clustering non-hierarki. Clustering hierarki bekerja dengan membangun hierarki atau struktur pohon berdasarkan tingkat kemiripan antarobjek. Objek-objek yang memiliki kemiripan tinggi dikelompokkan terlebih dahulu, lalu secara bertahap membentuk cluster yang lebih besar hingga seluruh objek tergabung dalam satu struktur. Proses ini cocok digunakan dalam situasi di mana jumlah cluster belum dapat ditentukan sebelumnya, karena metode ini menghasilkan dendrogram yang memberikan gambaran lengkap tentang bagaimana cluster terbentuk (Yamin, 2009).
Di sisi lain, clustering non-hierarki seperti k-means clustering berguna untuk membagi data ke dalam jumlah cluster tertentu yang telah ditentukan sebelumnya. Metode ini berfokus pada optimalisasi dalam membagi objek ke dalam kelompok berdasarkan karakteristik yang didefinisikan oleh variabel tertentu. Meskipun metode ini efisien, clustering non-hierarki memiliki keterbatasan, terutama jika jumlah cluster yang tepat tidak diketahui atau jika data memiliki pola yang kompleks. Dalam konteks penelitian ini, metode hierarki lebih relevan karena memungkinkan eksplorasi pola hubungan antarnegara secara lebih mendalam tanpa memerlukan asumsi awal tentang jumlah cluster (Hair, 2010).
Salah satu pendekatan yang digunakan dalam clustering hierarki adalah dengan menghitung jarak antarobjek, seperti jarak Euclidean, yang digunakan untuk mengukur kemiripan. Objek dengan jarak lebih kecil dianggap lebih mirip dan cenderung dikelompokkan bersama. Metode ini sangat cocok untuk menganalisis data dengan variabel kuantitatif seperti yang digunakan dalam penelitian ini (Everitt et al., 2011).
Penelitian ini bertujuan untuk mengelompokkan negara-negara di dunia berdasarkan pola penggunaan internetnya. Dengan menggunakan analisis clustering hierarki, penelitian ini ingin mencapai beberapa hal, yaitu:
Mengidentifikasi kelompok negara yang memiliki kemiripan dalam penggunaan internet berdasarkan tiga variabel utama yang dianalisis.
Mengetahui karakteristik cluster yang terbentuk.
> library(rmarkdown)
> library(knitr)
> library(prettydoc)
> library(tinytex)
> library(psych)
> library(GPArotation)
> library(clValid)
> library(ggplot2)
> library(cluster)
> library(factoextra)
> library(tidyverse)
> library(car)
> library(readxl)rmarkdown: Digunakan untuk membuat
dokumen dinamis dalam berbagai format seperti HTML, PDF, dan Word dari
file R Markdown.knitr: Membantu mengintegrasikan R
code dengan teks untuk menghasilkan laporan yang dinamis dan
reproducible.prettydoc: Memberikan tema HTML yang
estetis untuk dokumen R Markdown.tinytex: Paket ringan untuk mengelola
distribusi LaTeX, memungkinkan pembuatan dokumen PDF langsung dari R
Markdown.psych: Digunakan untuk analisis data
psikometrik dan statistik deskriptif, termasuk validasi konstruk dan
reliabilitas.GPArotation: Memfasilitasi rotasi
faktor dalam analisis faktor untuk interpretasi yang lebih baik.clValid: Menyediakan alat untuk
validasi hasil clustering berdasarkan beberapa kriteria validitas.ggplot2: Paket visualisasi data yang
fleksibel dan kuat menggunakan pendekatan berbasis grammer of
graphics.cluster: Berisi algoritma untuk
analisis clustering, termasuk k-means dan metode hierarki.factoextra: Membantu visualisasi hasil
analisis clustering dan komponen utama secara intuitif.tidyverse: Koleksi paket yang
dirancang untuk data science, termasuk manipulasi data dan
visualisasi.car: Digunakan untuk analisis regresi
yang kompleks, termasuk diagnosis model dan uji statistik
tambahan.readxl: Membaca data dari file Excel
(.xls atau .xlsx) ke dalam R dengan mudah.> #input data
> int = read_excel("C:/Users/DELL/Downloads/internetuse.xls")
> data = data.frame(int)
> #statistika deskriptif
> ringkasan = summary(data)
> #uji sampel representatif
> ujikmo = KMO(data[,2:4])
> #uji non multikolinearitas
> ujikor = cor(data[,2:4], method = 'pearson')
> #standarisasi data
> standata = scale(data[,2:4])
> rownames(standata) = 1:nrow(standata)
> #membandingkan koefisien korelasi cophenetik antar metode/linkage
> d1 = dist(data[,2:4])
> hiers = hclust(dist(data[,2:4]), method = "single")
> hc1 = hclust(d1, "single")
> d2 = cophenetic(hc1)
> cors = cor(d1,d2)
> hierave = hclust(dist(data[,2:4]), method = "ave")
> hc2 = hclust(d1, "ave")
> d3 = cophenetic(hc2)
> corave = cor(d1,d3)
> hiercomp = hclust(dist(data[,2:4]), method = "complete")
> hc3 = hclust(d1, "complete")
> d4 = cophenetic(hc3)
> corcomp = cor(d1,d4)
> hiercen = hclust(dist(data[,2:4]), method = "centroid")
> hc4 = hclust(d1, "centroid")
> d5 = cophenetic(hc4)
> corcen = cor(d1,d5)
> hierward = hclust(dist(data[,2:4]), method = "ward.D")
> hc5 = hclust(d1,"ward.D")
> d6 = cophenetic(hc5)
> corward = cor(d1,d6)
> corrcop = data.frame(cors,corave,corcomp,corcen,corward)
> #menentukan cluster optimal
> inval = clValid(standata, 2:4, clMethods = "hierarchical", validation = "internal", metric = "euclidean", method = "average")
> #membuat dendogram berdasarkan cluster yang terbentuk
> hirave = hclust(dist(scale(data[,2:4])), method = "average")
> memberave = data.frame(id = data$country, cutree(hirave, k = 2))
> clushier = eclust(standata, FUNcluster = "hclust", k = 2, hc_method = "average", graph = TRUE)
> #karakteristik cluster
> idclus = clushier$cluster
> mean=aggregate(data,list(idclus),mean) country incomeperperson internetuserate urbanrate
1 Albania 1914.9966 44.9899470 46.72
2 Algeria 2231.9933 12.5000733 65.22
3 Andorra 21943.3399 81.0000000 88.92
4 Angola 1381.0043 9.9999539 56.70
5 Antigua and Barbuda 11894.4641 80.6454545 30.46
6 Argentina 10749.4192 36.0003350 92.00
7 Armenia 1326.7418 44.0010246 63.86
8 Australia 25249.9861 75.8956538 88.74
9 Austria 26692.9841 72.7315755 67.16
10 Azerbaijan 2344.8969 46.6797016 51.92
11 Bahamas 19630.5406 42.9845802 83.70
12 Bahrain 12505.2125 54.9928090 88.52
13 Bangladesh 558.0629 3.7000033 27.14
14 Barbados 9243.5871 70.0285993 39.84
15 Belarus 2737.6704 32.0521439 73.46
16 Belgium 24496.0483 73.7339345 97.36
17 Belize 3545.6522 12.6457333 51.70
18 Benin 377.0397 3.1299618 41.20
19 Bermuda 62682.1470 84.6545141 100.00
20 Bhutan 1324.1949 13.5988760 34.48
21 Bolivia 1232.7941 20.0017101 65.58
22 Bosnia and Herzegovina 2183.3449 52.0020606 47.44
23 Botswana 4189.4366 5.9998356 59.58
24 Brazil 4699.4113 40.6500980 85.58
25 Brunei 17092.4600 49.9899749 74.82
26 Bulgaria 2549.5585 45.9865899 71.10
27 Burkina Faso 276.2004 1.4000607 19.56
28 Burundi 115.3060 2.1002127 10.40
29 Cambodia 557.9475 1.2599336 21.56
30 Cameroon 713.6393 3.9999773 56.76
31 Canada 25575.3526 81.3383927 80.40
32 Cape Verde 1959.8445 29.9999395 59.62
33 Central African Rep. 239.5187 2.3000267 38.58
34 Chad 275.8843 1.7000315 26.68
35 Chile 6334.1052 45.0000000 88.44
36 China 2425.4713 34.3777895 43.10
37 Colombia 3233.4238 36.4998746 74.50
38 Comoros 336.3687 5.0982653 28.08
39 Congo, Dem. Rep. 103.7759 0.7200087 33.96
40 Congo, Rep. 1253.2920 4.9998751 61.34
41 Costa Rica 5188.9009 36.4991147 63.26
42 Cote d'Ivoire 591.0679 2.5999737 48.78
43 Croatia 6338.4947 60.1197070 57.28
44 Cuba 4495.0463 15.8999703 75.66
45 Cyprus 15313.8594 53.0247448 69.90
46 Czech Rep. 7381.3128 68.6381335 73.50
47 Denmark 30532.2770 88.7702539 86.68
48 Djibouti 895.3183 6.4979235 87.30
49 Dominica 6147.7796 47.2804360 73.92
50 Dominican Rep. 4049.1696 39.5312743 69.02
51 Ecuador 1728.0210 28.9994767 65.58
52 Egypt 1975.5519 26.7400254 42.72
53 El Salvador 2557.4336 15.8999820 60.70
54 Equatorial Guinea 8654.5368 6.0034371 39.38
55 Eritrea 131.7962 5.3996670 20.72
56 Estonia 6238.5375 74.1630403 69.46
57 Ethiopia 220.8912 0.7499959 17.00
58 Fiji 2230.6764 14.8307359 52.36
59 Finland 27110.7316 86.8988445 63.30
60 France 22878.4666 77.4986193 77.36
61 Gabon 4180.7658 7.2322242 85.04
62 Gambia 354.5997 9.1967755 56.42
63 Georgia 1258.7626 26.2972515 52.74
64 Germany 25306.1872 82.5268979 73.64
65 Ghana 358.9795 9.5499307 50.02
66 Greece 13577.8799 44.5700744 61.00
67 Greenland 20751.8934 63.8491527 83.52
68 Grenada 5330.4016 33.6166829 30.84
69 Guatemala 1860.7539 10.4999482 48.58
70 Guinea 411.5014 0.9999589 34.44
71 Guinea-Bissau 161.3171 2.4503622 29.84
72 Guyana 1200.6521 29.8799215 28.38
73 Haiti 371.4242 8.3702069 46.84
74 Honduras 1392.4118 11.0907646 47.88
75 Hong Kong, China 35536.0725 71.8491239 100.00
76 Hungary 5634.0039 65.1632509 67.50
77 Iceland 33945.3144 95.6381132 92.26
78 India 786.7001 7.4999959 29.54
79 Indonesia 1143.8315 9.9000387 51.46
80 Iran 2161.5465 13.0001107 68.46
81 Iraq 736.2681 2.4719483 66.60
82 Ireland 27595.0913 69.7703944 61.34
83 Israel 22275.7517 65.3877859 91.66
84 Italy 18982.2693 53.7402166 68.08
85 Jamaica 3665.3484 26.4772232 53.30
86 Japan 39309.4789 77.6385351 66.48
87 Jordan 2534.0004 38.8812016 78.42
88 Kazakhstan 2481.7189 33.3821282 57.94
89 Kenya 468.6960 25.8997967 21.60
90 Kiribati 760.2624 8.9591400 43.84
91 Korea, Rep. 16372.4998 82.5159280 81.46
92 Kyrgyzstan 372.7284 19.5823165 36.28
93 Laos 554.8798 6.9998803 30.88
94 Latvia 5011.2195 71.5147235 68.12
95 Lebanon 6746.6126 31.0043783 86.96
96 Lesotho 495.7342 3.8605654 25.46
97 Liberia 155.0332 7.0002138 60.14
98 Libya 7885.4680 14.0002467 77.54
99 Lithuania 5332.2386 62.8119000 66.96
100 Luxembourg 52301.5872 90.0795266 82.44
101 Macao, China 33923.3139 56.7640824 100.00
102 Macedonia, FYR 2221.1857 51.9141843 66.90
103 Madagascar 242.6775 1.6999851 29.52
104 Malawi 184.1418 2.2599759 18.80
105 Malaysia 5184.7093 56.3000337 70.36
106 Maldives 4038.8578 28.2897010 37.86
107 Mali 269.8929 2.6999664 32.18
108 Malta 11066.7841 63.0779928 94.26
109 Mauritania 609.1312 2.9998032 41.00
110 Mauritius 5182.1437 28.7318835 42.48
111 Mexico 6105.2807 31.0500129 77.20
112 Micronesia, Fed. Sts. 2146.3586 20.0115315 22.54
113 Moldova 595.8745 40.1222347 41.76
114 Mongolia 772.9333 12.9000047 57.18
115 Montenegro 2222.3351 51.9580380 60.18
116 Morocco 1844.3510 49.0006318 56.02
117 Mozambique 389.7636 4.1701364 36.84
118 Namibia 2667.2467 6.5008228 36.84
119 Nepal 268.2594 7.9300963 17.24
120 Netherlands 26551.8442 90.7035551 81.82
121 New Zealand 14778.1639 83.0025842 86.56
122 Nicaragua 948.3560 9.9985542 56.74
123 Niger 180.0834 0.8299975 16.54
124 Nigeria 544.5995 28.4300327 48.36
125 Norway 39972.3528 93.2775079 77.48
126 Oman 11191.8110 61.9874129 71.62
127 Pakistan 668.5479 16.7800370 36.16
128 Panama 5900.6169 42.7478121 73.20
129 Papua New Guinea 744.2394 1.2800496 12.54
130 Paraguay 1621.1771 19.8016812 60.30
131 Peru 3180.4306 34.3006040 71.40
132 Philippines 1383.4019 24.9999458 64.92
133 Poland 6575.7450 62.4712301 61.32
134 Portugal 11744.8342 51.2804784 59.46
135 Puerto Rico 15822.1121 42.6923348 98.32
136 Qatar 33931.8321 81.5903973 95.64
137 Romania 2636.7878 40.0200949 54.24
138 Russia 2923.1444 43.3664977 72.84
139 Rwanda 338.2664 13.0000061 18.34
140 Saint Kitts and Nevis 9175.7960 76.5875385 32.32
141 Saint Lucia 5248.5823 40.0613793 27.84
142 Samoa 1784.0713 6.9650380 23.00
143 Saudi Arabia 9425.3259 41.0001285 82.42
144 Senegal 561.7086 15.9996500 42.38
145 Serbia 1194.7114 43.0550671 52.04
146 Seychelles 8614.1202 40.7728506 54.34
147 Singapore 32535.8325 71.1317073 100.00
148 Slovak Republic 8445.5267 79.8897773 56.56
149 Slovenia 12729.4544 69.3399707 48.60
150 Solomon Islands 1144.1022 5.0013755 17.96
151 South Africa 3745.6499 12.3348933 60.74
152 Spain 15461.7584 65.8085537 77.12
153 Sri Lanka 1295.7427 11.9999707 15.10
154 Suriname 2668.0205 31.5680976 74.92
155 Swaziland 1810.2305 9.0077359 24.94
156 Sweden 32292.4830 90.0161900 84.54
157 Switzerland 37662.7513 82.1666599 73.48
158 Syria 1525.7801 20.6631557 54.22
159 Tajikistan 279.1805 11.5493905 26.46
160 Tanzania 456.3857 11.0000554 25.52
161 Thailand 2712.5172 21.2000718 33.32
162 Timor-Leste 369.5730 0.2100663 27.30
163 Togo 285.2244 5.3798197 42.00
164 Tonga 2025.2827 12.0066923 24.78
165 Trinidad and Tobago 10480.8172 48.5168177 13.22
166 Tunisia 3164.9277 36.5625530 66.50
167 Turkey 5348.5972 39.8201779 68.68
168 Turkmenistan 2062.1252 2.1999978 48.62
169 Uganda 377.4211 12.5002554 12.98
170 Ukraine 1036.8307 44.5853547 67.98
171 United Arab Emirates 21087.3941 77.9967812 77.88
172 United Kingdom 28033.4893 84.7317048 89.94
173 United States 37491.1795 74.2475720 81.70
174 Uruguay 9106.3272 47.8674686 92.30
175 Uzbekistan 952.8273 19.4450205 36.82
176 Vanuatu 1543.9565 7.9883667 24.76
177 Venezuela 5528.3631 35.8504370 93.32
178 Vietnam 722.8076 27.8518216 27.84
179 Yemen, Rep. 610.3574 12.3497505 30.64
180 Zambia 432.2263 10.1249865 35.42
181 Zimbabwe 320.7719 11.5004153 37.34
country incomeperperson internetuserate urbanrate
Length:181 Min. : 103.8 Min. : 0.2101 Min. : 10.40
Class :character 1st Qu.: 744.2 1st Qu.: 9.9000 1st Qu.: 36.28
Mode :character Median : 2549.6 Median :31.0044 Median : 57.28
Mean : 7878.0 Mean :35.0408 Mean : 56.13
3rd Qu.: 9243.6 3rd Qu.:54.9928 3rd Qu.: 73.64
Max. :62682.2 Max. :95.6381 Max. :100.00
Data tersebut terdiri dari 181 Negara. Dimana rentang incomeperperson($) = 108.8 - 62682.2, internetuserate(%) = 0,201-95,6381, dan urbanrate(%) = 10,4-100
\[H_0 : \qquad \text{sampel tidak representatif}\\ H_1 : \qquad \text{sampel representatif}\]
Kaiser-Meyer-Olkin factor adequacy
Call: KMO(r = data[, 2:4])
Overall MSA = 0.71
MSA for each item =
incomeperperson internetuserate urbanrate
0.68 0.66 0.82
Overall MSA (0,71) > (0,5) maka dapat disimpulkan jika sampel representatif
\[H_0 : \qquad \text{tidak ada korelasi linear antarvariabel}\\ H_1 : \qquad \text{ada korelasi linear antarvariabel}\]
incomeperperson internetuserate urbanrate
incomeperperson 1.0000000 0.7824882 0.6086665
internetuserate 0.7824882 1.0000000 0.6502286
urbanrate 0.6086665 0.6502286 1.0000000
Tidak ada korelasi yang > 0,8 maka dapat disimpulkan tidak ada korelasi antarvariabel
incomeperperson internetuserate urbanrate
[1,] -0.528516758 0.35626230 -0.400411253
[2,] -0.500420617 -0.80714967 0.387150764
[3,] 1.246640540 1.64572642 1.396081563
[4,] -0.575845700 -0.89667507 0.024446527
[5,] 0.355985983 1.63303070 -1.092614409
[6,] 0.254498074 0.03435824 1.527199996
[7,] -0.580655109 0.32085052 0.329254313
[8,] 1.539716056 1.46294771 1.388418798
[9,] 1.667612231 1.34964697 0.469738348
[10,] -0.490413718 0.41676979 -0.179042470
[11,] 1.041651911 0.28445322 1.173861362
[12,] 0.410117999 0.71444927 1.379053195
[13,] -0.648784854 -1.12226653 -1.233949862
[14,] 0.121032767 1.25285759 -0.693299181
[15,] -0.455601319 -0.10702036 0.737935143
[16,] 1.472892846 1.38553989 1.755380126
[17,] -0.383988068 -0.80193381 -0.188408072
[18,] -0.664829347 -1.14267883 -0.635402730
[19,] 4.857413008 1.77658890 1.867767355
[20,] -0.580880842 -0.76780325 -0.921479311
[21,] -0.588981898 -0.53852769 0.402476295
[22,] -0.504732441 0.60735521 -0.369760190
[23,] -0.326928002 -1.03991310 0.147050776
[24,] -0.281727795 0.20085904 1.253894691
[25,] 0.816696100 0.53530554 0.795831594
[26,] -0.472274102 0.39195053 0.637467772
[27,] -0.673766960 -1.20462390 -1.556637434
[28,] -0.688027396 -1.17955254 -1.946587060
[29,] -0.648795079 -1.20964163 -1.471495595
[30,] -0.634995764 -1.11152492 0.027000782
[31,] 1.568554029 1.65784374 1.033377326
[32,] -0.524541785 -0.18050661 0.148753613
[33,] -0.677018139 -1.17239752 -0.746938540
[34,] -0.673794979 -1.19388241 -1.253532485
[35,] -0.136841180 0.35662228 1.375647522
[36,] -0.483272229 -0.02374260 -0.554517982
[37,] -0.411661575 0.05224598 0.782208900
[38,] -0.668434105 -1.07219693 -1.193933198
[39,] -0.689049338 -1.22897551 -0.943616189
[40,] -0.587165125 -1.07572013 0.221975595
[41,] -0.238343219 0.05221877 0.303711761
[42,] -0.645859540 -1.16165688 -0.312715158
[43,] -0.136452131 0.89803553 0.049137661
[44,] -0.299841126 -0.68540463 0.831591167
[45,] 0.659054708 0.64397594 0.586382669
[46,] -0.044024809 1.20306716 0.739637980
[47,] 2.007897433 1.92396716 1.300722703
[48,] -0.618893140 -1.02207734 1.327116673
[49,] -0.153355637 0.43828116 0.757517766
[50,] -0.339360179 0.16079570 0.548920259
[51,] -0.545088825 -0.21633163 0.402476295
[52,] -0.523149600 -0.29723908 -0.570694932
[53,] -0.471576108 -0.68540421 0.194730206
[54,] 0.068823917 -1.03978413 -0.712881804
[55,] -0.686565831 -1.06140420 -1.507255167
[56,] -0.145311560 1.40090550 0.567651464
[57,] -0.678669136 -1.22790171 -1.665618989
[58,] -0.500537342 -0.72369226 -0.160311265
[59,] 1.704638134 1.85695489 0.305414598
[60,] 1.329522928 1.52034742 0.903961730
[61,] -0.327696511 -0.99578317 1.230906394
[62,] -0.666818252 -0.92543564 0.012526670
[63,] -0.586680255 -0.31309413 -0.144134315
[64,] 1.544697289 1.70040227 0.745597909
[65,] -0.666430059 -0.91278970 -0.259927217
[66,] 0.505190929 0.34122731 0.207501482
[67,] 1.141039948 1.03158119 1.166198596
[68,] -0.225801695 -0.05099665 -1.076437459
[69,] -0.533324407 -0.87877105 -0.321229342
[70,] -0.661774924 -1.21895092 -0.923182148
[71,] -0.683949324 -1.16701423 -1.119008379
[72,] -0.591830722 -0.18480427 -1.181161922
[73,] -0.665327061 -0.95503378 -0.395302742
[74,] -0.574834622 -0.85761483 -0.351028986
[75,] 2.451395122 1.31804775 1.867767355
[76,] -0.198892734 1.07863701 0.484212461
[77,] 2.310402644 2.16989455 1.538268435
[78,] -0.628520220 -0.98619469 -1.131779655
[79,] -0.596866857 -0.90025288 -0.198625093
[80,] -0.506664478 -0.78924411 0.525080544
[81,] -0.632990126 -1.16624127 0.445898633
[82,] 1.747568033 1.24361167 0.221975595
[83,] 1.276102945 1.08667726 1.512725883
[84,] 0.984194165 0.66959587 0.508903594
[85,] -0.373379124 -0.30664962 -0.120294600
[86,] 2.785840651 1.52535758 0.440790123
[87,] -0.473653051 0.13751760 0.949086905
[88,] -0.478286875 -0.05939569 0.077234468
[89,] -0.656705638 -0.32732637 -1.469792758
[90,] -0.630863456 -0.93394500 -0.523015502
[91,] 0.752884400 1.70000945 1.078502501
[92,] -0.665211466 -0.55354553 -0.844851655
[93,] -0.649066973 -1.00410305 -1.074734622
[94,] -0.254091530 1.30607339 0.510606431
[95,] -0.100279714 -0.14453922 1.312642560
[96,] -0.654309181 -1.11651704 -1.305469008
[97,] -0.684506281 -1.00409111 0.170890491
[98,] 0.000659612 -0.75343079 0.911624496
[99,] -0.225638879 0.99443878 0.461224164
[100,] 3.937360549 1.97085019 1.120222003
[101,] 2.308452685 0.77787582 1.867767355
[102,] -0.501378525 0.60420849 0.458669909
[103,] -0.676738169 -1.19388407 -1.132631073
[104,] -0.681926323 -1.17383167 -1.588991333
[105,] -0.238714731 0.76125895 0.605965292
[106,] -0.340274138 -0.24174760 -0.777589602
[107,] -0.674326011 -1.15807629 -1.019392427
[108,] 0.282626842 1.00396715 1.623410275
[109,] -0.644258552 -1.14733960 -0.643916914
[110,] -0.238942127 -0.22591373 -0.580911953
[111,] -0.157122408 -0.14290512 0.897150383
[112,] -0.508010618 -0.53817601 -1.429776093
[113,] -0.645433521 0.18195707 -0.611563015
[114,] -0.629740399 -0.79282875 0.044880569
[115,] -0.501276653 0.60577882 0.172593328
[116,] -0.534778230 0.49987870 -0.004501698
[117,] -0.663701596 -1.10543179 -0.821011940
[118,] -0.461843128 -1.02197352 -0.821011940
[119,] -0.674470786 -0.97079345 -1.655401968
[120,] 1.655102686 1.99319568 1.093828033
[121,] 0.611574814 1.71743586 1.295614192
[122,] -0.614192297 -0.89672519 0.026149364
[123,] -0.682286030 -1.22503698 -1.685201612
[124,] -0.649978145 -0.23672254 -0.330594944
[125,] 2.844592662 2.08536493 0.909070241
[126,] 0.293708256 0.96491518 0.659604651
[127,] -0.638992313 -0.65389081 -0.849960166
[128,] -0.175262222 0.27597492 0.726866704
[129,] -0.632283607 -1.20892131 -1.855485291
[130,] -0.554558641 -0.54569042 0.177701838
[131,] -0.416358480 -0.02650649 0.650239048
[132,] -0.575633195 -0.35954863 0.374379488
[133,] -0.115424094 0.98223992 0.221124177
[134,] 0.342723947 0.58151647 0.141942266
[135,] 0.704102301 0.27398837 1.796248209
[136,] 2.309207673 1.66686763 1.682158144
[137,] -0.464542770 0.17829960 -0.080277936
[138,] -0.439162342 0.29812910 0.711541173
[139,] -0.668265912 -0.78924785 -1.608573957
[140,] 0.115024294 1.48772302 -1.013432498
[141,] -0.233053523 0.17977793 -1.204150218
[142,] -0.540120960 -1.00535070 -1.410193470
[143,] 0.137140689 0.21339309 1.119370584
[144,] -0.648461726 -0.68183526 -0.585169045
[145,] -0.592357254 0.28697725 -0.173933959
[146,] 0.065241700 0.20525462 -0.076020844
[147,] 2.185477079 1.29235817 1.867767355
[148,] 0.050298875 1.60597107 0.018486598
[149,] 0.429993062 1.22819887 -0.320377923
[150,] -0.596842866 -1.07566641 -1.624750906
[151,] -0.366261822 -0.81306451 0.196433043
[152,] 0.672163332 1.10174430 0.893744709
[153,] -0.583402626 -0.82505757 -1.746503737
[154,] -0.461774543 -0.12435331 0.800088686
[155,] -0.537802407 -0.93220485 -1.327605886
[156,] 2.163908461 1.96858220 1.209620934
[157,] 2.639887464 1.68750270 0.738786561
[158,] -0.563013889 -0.51484236 -0.081129354
[159,] -0.673502833 -0.84119215 -1.262898088
[160,] -0.657796730 -0.86086298 -1.302914752
[161,] -0.457830702 -0.49561622 -0.970861578
[162,] -0.665491141 -1.24723575 -1.227138515
[163,] -0.672967140 -1.06211490 -0.601345994
[164,] -0.518741851 -0.82481688 -1.334417233
[165,] 0.230691269 0.48255406 -1.826537066
[166,] -0.417732538 0.05449039 0.441641541
[167,] -0.224188980 0.17114089 0.534446146
[168,] -0.515476418 -1.17597939 -0.319526505
[169,] -0.664795541 -0.80714315 -1.836754087
[170,] -0.606350578 0.34177447 0.504646502
[171,] 1.170776132 1.53818582 0.926098609
[172,] 1.786424232 1.77935298 1.439503901
[173,] 2.624680674 1.40393245 1.088719522
[174,] 0.108867120 0.45930188 1.539971272
[175,] -0.613795995 -0.55846189 -0.821863359
[176,] -0.561402879 -0.96870689 -1.335268651
[177,] -0.208255920 0.02899062 1.583393610
[178,] -0.634183160 -0.25742738 -1.204150218
[179,] -0.644149875 -0.81253250 -1.084951643
[180,] -0.659938030 -0.89219785 -0.881462646
[181,] -0.669816490 -0.84294587 -0.799726480
attr(,"scaled:center")
incomeperperson internetuserate urbanrate
7878.02592 35.04083 56.12575
attr(,"scaled:scale")
incomeperperson internetuserate urbanrate
11282.57387 27.92637 23.49021
cors corave corcomp corcen corward
1 0.7982266 0.9310717 0.8998647 0.9295781 0.8302226
Koefisien corave (0,9310717) paling mendekati 1 maka linkage Average yang dipilih untuk digunakan dalam analisis cluster
> inval = clValid(standata, 2:4, clMethods = "hierarchical", validation = "internal", metric = "euclidean", method = "average")
> summary(inval)
Clustering Methods:
hierarchical
Cluster sizes:
2 3 4
Validation Measures:
2 3 4
hierarchical Connectivity 4.4837 8.9667 21.7988
Dunn 0.1273 0.1273 0.0780
Silhouette 0.5324 0.4990 0.4380
Optimal Scores:
Score Method Clusters
Connectivity 4.4837 hierarchical 2
Dunn 0.1273 hierarchical 2
Silhouette 0.5324 hierarchical 2
> optimalScores(inval)
Score Method Clusters
Connectivity 4.4837302 hierarchical 2
Dunn 0.1272859 hierarchical 2
Silhouette 0.5324472 hierarchical 2
> plot(inval)
Dari indeks validitas didapatkan hasil cluster optimal adalah 2 maka
data akan dibagi menjadi 2 cluster
> hirave = hclust(dist(scale(data[,2:4])), method = "average")
> plot(hirave, labels=data$country, hang = 1, col = "skyblue", main = "Cluster Dendogram", sub = " ", xlab = "Negara", ylab = "Jarak")> memberave = data.frame(id = data$country, cutree(hirave, k = 2))
> print(memberave)
id cutree.hirave..k...2.
1 Albania 1
2 Algeria 1
3 Andorra 2
4 Angola 1
5 Antigua and Barbuda 1
6 Argentina 1
7 Armenia 1
8 Australia 2
9 Austria 2
10 Azerbaijan 1
11 Bahamas 1
12 Bahrain 1
13 Bangladesh 1
14 Barbados 1
15 Belarus 1
16 Belgium 2
17 Belize 1
18 Benin 1
19 Bermuda 2
20 Bhutan 1
21 Bolivia 1
22 Bosnia and Herzegovina 1
23 Botswana 1
24 Brazil 1
25 Brunei 1
26 Bulgaria 1
27 Burkina Faso 1
28 Burundi 1
29 Cambodia 1
30 Cameroon 1
31 Canada 2
32 Cape Verde 1
33 Central African Rep. 1
34 Chad 1
35 Chile 1
36 China 1
37 Colombia 1
38 Comoros 1
39 Congo, Dem. Rep. 1
40 Congo, Rep. 1
41 Costa Rica 1
42 Cote d'Ivoire 1
43 Croatia 1
44 Cuba 1
45 Cyprus 1
46 Czech Rep. 1
47 Denmark 2
48 Djibouti 1
49 Dominica 1
50 Dominican Rep. 1
51 Ecuador 1
52 Egypt 1
53 El Salvador 1
54 Equatorial Guinea 1
55 Eritrea 1
56 Estonia 1
57 Ethiopia 1
58 Fiji 1
59 Finland 2
60 France 2
61 Gabon 1
62 Gambia 1
63 Georgia 1
64 Germany 2
65 Ghana 1
66 Greece 1
67 Greenland 2
68 Grenada 1
69 Guatemala 1
70 Guinea 1
71 Guinea-Bissau 1
72 Guyana 1
73 Haiti 1
74 Honduras 1
75 Hong Kong, China 2
76 Hungary 1
77 Iceland 2
78 India 1
79 Indonesia 1
80 Iran 1
81 Iraq 1
82 Ireland 2
83 Israel 2
84 Italy 1
85 Jamaica 1
86 Japan 2
87 Jordan 1
88 Kazakhstan 1
89 Kenya 1
90 Kiribati 1
91 Korea, Rep. 2
92 Kyrgyzstan 1
93 Laos 1
94 Latvia 1
95 Lebanon 1
96 Lesotho 1
97 Liberia 1
98 Libya 1
99 Lithuania 1
100 Luxembourg 2
101 Macao, China 2
102 Macedonia, FYR 1
103 Madagascar 1
104 Malawi 1
105 Malaysia 1
106 Maldives 1
107 Mali 1
108 Malta 1
109 Mauritania 1
110 Mauritius 1
111 Mexico 1
112 Micronesia, Fed. Sts. 1
113 Moldova 1
114 Mongolia 1
115 Montenegro 1
116 Morocco 1
117 Mozambique 1
118 Namibia 1
119 Nepal 1
120 Netherlands 2
121 New Zealand 2
122 Nicaragua 1
123 Niger 1
124 Nigeria 1
125 Norway 2
126 Oman 1
127 Pakistan 1
128 Panama 1
129 Papua New Guinea 1
130 Paraguay 1
131 Peru 1
132 Philippines 1
133 Poland 1
134 Portugal 1
135 Puerto Rico 1
136 Qatar 2
137 Romania 1
138 Russia 1
139 Rwanda 1
140 Saint Kitts and Nevis 1
141 Saint Lucia 1
142 Samoa 1
143 Saudi Arabia 1
144 Senegal 1
145 Serbia 1
146 Seychelles 1
147 Singapore 2
148 Slovak Republic 1
149 Slovenia 1
150 Solomon Islands 1
151 South Africa 1
152 Spain 1
153 Sri Lanka 1
154 Suriname 1
155 Swaziland 1
156 Sweden 2
157 Switzerland 2
158 Syria 1
159 Tajikistan 1
160 Tanzania 1
161 Thailand 1
162 Timor-Leste 1
163 Togo 1
164 Tonga 1
165 Trinidad and Tobago 1
166 Tunisia 1
167 Turkey 1
168 Turkmenistan 1
169 Uganda 1
170 Ukraine 1
171 United Arab Emirates 2
172 United Kingdom 2
173 United States 2
174 Uruguay 1
175 Uzbekistan 1
176 Vanuatu 1
177 Venezuela 1
178 Vietnam 1
179 Yemen, Rep. 1
180 Zambia 1
181 Zimbabwe 1
> clushier = eclust(standata, FUNcluster = "hclust", k = 2, hc_method = "average", graph = TRUE)
> fviz_dend(clushier, rect = TRUE, cex = 0.5)
Cluster 1 terdiri dari 152 negara dan cluster 2 terdiri dari 29
negara.
Group.1 country incomeperperson internetuserate urbanrate
1 1 NA 3599.387 26.54595 50.83553
2 2 NA 30303.995 79.56572 83.85379
Dari hasil tersebut menunjukkan jika cluster 1 memiliki tingkat incomeperperson, internetuserate, dan urbanrate yang lebih rendah daridapa cluster 2. Jika dilihat dari pembagiannya cluster 2 terdiri dari negara-negara maju sedangkan cluster 1 berisi negara-negara berkembang.
Berdasarakan 3 variabel (incomeperperson, internetuserate, dan urbanrate) didapatkan cluster 1 yang beranggotakan 152 negara berkembang dan cluster 2 yang beranggotakan 29 negara maju. Dalam pembagian ini dapat diketahui jika kemajuan sebuah negara dapat dilihat dati tingkat pendapatan masyarakat, tingkat penggunaan internet, dan persentase penduduk yang hidup di perkotaan.
Sebagai saran untuk penelitian selanjutnya, disarankan untuk mengeksplorasi metode clustering dengan berbagai jenis linkage, seperti single linkage, complete linkage, average linkage, atau ward’s method, guna memahami bagaimana pilihan metode tersebut memengaruhi hasil pengelompokan. Selain itu, penelitian dapat dilakukan dengan mencoba berbagai jumlah cluster untuk menentukan konfigurasi yang paling optimal sesuai dengan karakteristik data. Perbandingan hasil pengelompokan dari pendekatan yang berbeda ini dapat memberikan wawasan yang lebih mendalam mengenai struktur data serta membantu dalam memilih metode clustering yang paling sesuai untuk konteks tertentu.
Everitt, B. S., Landau, S., Leese, M., & Stahl, D. (2011). Cluster Analysis (5th ed.). Wiley.
Ghaisani, S. Y., Hikmah, N., Prasetyo, A. H., & Widodo, E. (2019). Analisis cluster hirarki untuk pengelompokan provinsi di Indonesia berdasarkan indikator demokrasi Indonesia tahun 2016. Prosiding Konferensi Nasional Penelitian Matematika dan Pembelajarannya.
Hair, J.F., Black, W.C., Babin, B.J., dan Anderson, R.E. (2010). Multivariate Data Analysis, 7th Edition. New Jersey: Pearson Prentice Hall.
Yamin, S.dan Kurniawan, H. (2009). SPSS Complete Teknik Analisis Statistik Terlengkap SPPS Seri1. Jakarta: Salemba.