Library:
> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")
Analisis klaster merupakan analisis yang mengelompokkan objek yang relatif sama sehingga sebuah klaster memiliki objek-objek yang homogen dengan tetap menjaga keheterogenan antar klaster (Hair dkk., 2010). Analisis klaster bertujuan mengelompokkan data dengan karakteristik yang mirip ke dalam suatu klaster. Dalam pengelompokan, digunakan suatu ukuran yang dapat menunjukkan kedekatan antar data, yaitu ukuran jarak (Fathia dkk, 2016). Menurut Hair dkk. (2010), terdapat beberapa metode pengukuran jarak, antara lain Euclidean distance, City-Block distance (Manhattan), dan Mahalanobis distance. Dalam analisis klaster terdapat 2 metode pengelompokkan, yaitu metode hierarki dan metode non-hierarki. Pembentukan klaster baru dilakukan dengan menggunakan metode pengelompokan (linkage) berdasarkan ukuran jarak antar objek, seperti Ward Linkage method, Complete Linkage method, Average Linkage method.
Analisis klaster dapat diaplikasikan dalam berbagai bidang, salah satunya dalam bidang sosial-budaya. Indeks Pembangunan Kebudayaan (IPK) merupakan salah satu instrumen untuk memberikan gambaran kemajuan pembangunan kebudayaan (Kemendikbud, 2021). Indeks Pembangunan Kebudayaan (IPK) digunakan untuk mendukung perencanaan, pelaksanaan, dan evaluasi dalam kebijakan kebudayaan melalui pendekatan berbasis data dan informasi akurat dan dapat dipertanggungjawabkan. IPK tidak hanya memandu perencanaan pembangunan, tetapi juga memantau kinerja program yang tengah berjalan.
Menurut Wustqa, dkk (2018), Analisis multivariat dilakukan untuk menganalisis pengaruh sejumlah variabel bebas terhadap sejumlah variabel tak bebas secara bersamaan dan banyak digunakan pada berbagai bidang seperti ilmu sosial, psikologi, ekonomi, pertanian, kesehatan, dan pendidikan. Beberapa metode dalam analisis multivariat adalah PCA, analisis faktor, analisis korelasi kanonik ,analisis regresi multivariat, analisis klaster, dan analisis diskriminan (Johnson & Wichern, 2007).
Analisis klaster merupakan analisis yang mengelompokkan objek yang relatif sama sehingga sebuah klaster memiliki objek-objek yang homogen dengan tetap menjaga keheterogenan antar klaster (Hair dkk., 2010). Analisis klaster bertujuan mengelompokkan data dengan karakteristik yang mirip ke dalam suatu klaster. Menurut Hair dkk. (2010), terdapat beberapa metode pengukuran jarak, antara lain Euclidean distance, City-Block distance (Manhattan), dan Mahalanobis distance. Dalam analisis klaster terdapat 2 metode pengelompokkan, yaitu metode hierarki dan metode non-hierarki. Pembentukan klaster baru dilakukan dengan menggunakan metode pengelompokan (linkage) berdasarkan ukuran jarak antar objek, seperti Ward Linkage method, Complete Linkage method, Average Linkage method.
Menurut Johnson & Wicern (2002), metode non hirarki digunakan untuk pengelompokan objek dimana banyaknya cluster yang akan dibentuk dapat ditentukan terlebih dahulu sebagai bagian dari prosedur penggerombolan. Metode ini dapat diterapkan pada data yang lebih besar dibandingkan metode hirarki.
Metode hirarki digunakan untuk mengelompokkan objek secara terstuktur
berdasarkan kemiripan sifatnya dan cluster yang diinginkan belum
diketahui banyaknya Mattjik & Sumertajaya (2011). Terdapat dua
prosedur pada metode berhierarki, yaitu prosedur aglomeratif dan
prosedur divisive (Johnson & Winchern, 2002). Menurut Mattjik &
Sumertajaya (2011), banyaknya cluster yang terbentuk ditentukan dari
dendrogram yang terjadi dan tergantung subyektivitas peneliti.
\(d_{manhattan} = \sum_{j=1}^p|x_j - y_j|\)
p : Jumlah objek penelitian
\(SSE = \sum_{j=1}^p(\sum_{i=1}^n X^2 - \frac{1}{n} (\sum_{i=1}^n X_{ij})^2)\)
\(X_{ij}\) : Nilai objek ke-i pada klaster ke-j
p : Jumlah objek penelitian
n : Banyak objek dalam klaster
\(d(K_1, K_2) = \frac{1}{n_{K_{1}}n_{K_{2}}} \sum d_{xy}\)
\(K_1, K_2\) : Klaster
x : Objek pada klaster 1
y : Objek pada klaster 2
d : Jarak antara x dan y
\(n_{K_{1}}\) : Jumlah objek pada klaster 1
\(n_{K_{2}}\) : Jumlah objek pada klaster 2
\(d(K_1, K_2) = (d_{xy})\)
\(K_1, K_2\) : Klaster
x : Objek pada klaster 1
y : Objek pada klaster 2
d : Jarak antara x dan y
\(r =\frac{S_b}{S_w}\)
\(S_b\) : Simpangan baku antarklaster
\({S_w}\) : Simpangan baku dalam klaster
dimana :
\({S_w} =\frac{\sum_{k=1}^K S_k}{K}\)
\(S_k\) : Simpangan baku klaster ke-k
K : Banyak klaster yang terbentuk
\({S_b} =\frac{\sqrt{\sum_{k=1}^K(\bar{X}_k -\bar{X})^2}}{K-1}\)
\(\bar{X}_k\) : Rata-rata klaster ke-k
\(\bar{X}\) : Rata-rata seluruh klaster
K : Banyak klaster yang terbentuk
Data yang digunakan dalam kasus ini adalah data sekunder yang bersumber dari Kemendikbud tentang “Indeks Pembangunan Kebudayaan Tahun 2021” berdasarkan 34 provinsi di Indonesia. Indeks Pembangunan Kebudayaan (IPK) adalah alat ukur yang menggambarkan kemajuan pembangunan kebudayaan. IPK disusun berdasarkan kerangka Culture Development Indicators (CDIs) yang dikembangkan oleh UNESCO. Kerangka tersebut terdiri dari 22 indikator yang dikelompokkan dalam tujuh dimensi, yaitu:
Ekonomi Budaya
Pendidikan
Ketahanan Sosial Budaya
Ekspresi Budaya
Budaya Literasi
Warisan Budaya
Gender
| Ekonomi budaya | Pendidikan | Ketahanan Sosial Budaya | Warisan Budaya | Ekspresi Budaya | Budaya Literasi | Gender | IPK |
|---|---|---|---|---|---|---|---|
| 11.59 | 76.93 | 54.28 | 42.19 | 32.86 | 59.40 | 54.33 | 49.89 |
| 11.27 | 68.55 | 69.75 | 36.48 | 23.22 | 55.66 | 58.79 | 48.74 |
| 18.97 | 72.70 | 58.13 | 52.31 | 24.50 | 61.17 | 60.10 | 52.71 |
| 26.35 | 74.27 | 70.07 | 47.47 | 22.31 | 56.39 | 59.20 | 54.20 |
| 22.12 | 66.09 | 69.70 | 49.35 | 25.67 | 53.88 | 54.63 | 52.39 |
| 18.30 | 64.21 | 64.31 | 53.15 | 15.30 | 55.41 | 60.01 | 50.89 |
| 25.35 | 71.22 | 73.15 | 50.85 | 21.94 | 53.22 | 58.39 | 54.56 |
| 18.57 | 73.00 | 71.54 | 50.11 | 20.14 | 50.20 | 57.18 | 53.19 |
| 18.06 | 64.91 | 69.48 | 50.14 | 14.68 | 55.75 | 51.75 | 50.85 |
| 14.64 | 73.61 | 73.53 | 37.81 | 22.74 | 66.78 | 56.53 | 52.12 |
| 16.05 | 77.81 | 66.81 | 43.70 | 15.00 | 67.11 | 58.23 | 52.58 |
| 24.44 | 67.21 | 59.44 | 49.52 | 21.79 | 56.60 | 55.69 | 50.78 |
| 25.96 | 71.21 | 72.37 | 50.12 | 34.79 | 50.00 | 58.28 | 55.24 |
| 56.79 | 80.68 | 76.50 | 56.57 | 41.11 | 56.20 | 64.61 | 64.22 |
| 19.81 | 70.61 | 66.54 | 49.82 | 34.39 | 50.81 | 56.15 | 53.19 |
| 12.24 | 65.78 | 53.73 | 47.34 | 22.05 | 56.58 | 52.97 | 47.47 |
| 29.41 | 72.85 | 76.75 | 54.67 | 52.99 | 62.99 | 60.33 | 61.14 |
| 47.97 | 71.61 | 64.36 | 47.08 | 31.43 | 54.22 | 48.18 | 54.73 |
| 2.44 | 59.20 | 75.80 | 39.88 | 30.50 | 47.32 | 63.75 | 48.18 |
| 12.43 | 53.02 | 76.09 | 44.66 | 24.25 | 50.91 | 55.70 | 48.53 |
| 20.40 | 68.50 | 75.69 | 53.49 | 24.56 | 52.19 | 65.64 | 55.21 |
| 19.05 | 69.14 | 69.08 | 49.52 | 24.02 | 52.43 | 57.53 | 52.45 |
| 29.65 | 72.20 | 72.46 | 37.44 | 24.33 | 60.09 | 55.88 | 52.49 |
| 9.69 | 71.40 | 73.21 | 40.19 | 22.63 | 52.79 | 52.02 | 50.08 |
| 20.71 | 66.38 | 78.31 | 28.74 | 35.37 | 48.01 | 66.13 | 49.84 |
| 13.74 | 64.12 | 70.37 | 34.69 | 28.24 | 51.09 | 62.78 | 48.02 |
| 10.03 | 72.94 | 69.79 | 44.20 | 20.46 | 54.85 | 61.69 | 51.21 |
| 7.27 | 65.56 | 70.84 | 37.94 | 22.14 | 59.82 | 58.62 | 48.62 |
| 0.46 | 62.91 | 62.99 | 40.11 | 24.63 | 61.21 | 66.05 | 47.14 |
| 7.03 | 61.22 | 71.52 | 35.84 | 21.88 | 47.61 | 53.97 | 45.86 |
| 14.95 | 65.69 | 78.75 | 47.51 | 39.49 | 47.81 | 64.85 | 54.23 |
| 8.10 | 63.33 | 74.94 | 42.55 | 29.62 | 48.26 | 60.35 | 49.91 |
| 18.95 | 63.71 | 74.72 | 25.07 | 33.52 | 47.42 | 56.94 | 46.79 |
| 19.38 | 45.21 | 71.36 | 30.86 | 33.93 | 27.36 | 55.53 | 41.87 |
Berdasarkan uraian di atas, penelitian ini dilakukan dengan tujuan :
- Mengelompokkan 34 Provinsi di Indonesia berdasarkan IPK
- Memandingkan tiga metode pengelompokan, yaitu Complete Linkage Method, Average Linkage Method, dan Ward Linkage Method menggunakan jarak manhattan
- Mendapatkan kombinasi metode terbaik
> # Library
> library(readxl)
> library(car)
> library(lmtest)
> library(tseries)
> library(cluster)
> library(ggplot2)
> library(stats)
> library(tidyverse)
> library(dplyr)
> # Impor data
> Data_IPk <- read_excel("D:/BACKUP DATA C/tugas s5/S5 delita/IPk.xls", sheet = "Sheet2")
> View(Data_IPk)
>
> # DEFINISI VARIABEL
> X1 = Data_IPk$`Ekonomi budaya`
> X2 = Data_IPk$Pendidikan
> X3 = Data_IPk$`Ketahanan Sosial Budaya`
> X4 = Data_IPk$`Warisan Budaya`
> X5 = Data_IPk$`Ekspresi Budaya`
> X6 = Data_IPk$`Budaya Literasi`
> X7 = Data_IPk$Gender
>
> Data1 = data.frame(Data_IPk)
> Data1
Ekonomi.budaya Pendidikan Ketahanan.Sosial.Budaya Warisan.Budaya
1 11.59 76.93 54.28 42.19
2 11.27 68.55 69.75 36.48
3 18.97 72.70 58.13 52.31
4 26.35 74.27 70.07 47.47
5 22.12 66.09 69.70 49.35
6 18.30 64.21 64.31 53.15
7 25.35 71.22 73.15 50.85
8 18.57 73.00 71.54 50.11
9 18.06 64.91 69.48 50.14
10 14.64 73.61 73.53 37.81
11 16.05 77.81 66.81 43.70
12 24.44 67.21 59.44 49.52
13 25.96 71.21 72.37 50.12
14 56.79 80.68 76.50 56.57
15 19.81 70.61 66.54 49.82
16 12.24 65.78 53.73 47.34
17 29.41 72.85 76.75 54.67
18 47.97 71.61 64.36 47.08
19 2.44 59.20 75.80 39.88
20 12.43 53.02 76.09 44.66
21 20.40 68.50 75.69 53.49
22 19.05 69.14 69.08 49.52
23 29.65 72.20 72.46 37.44
24 9.69 71.40 73.21 40.19
25 20.71 66.38 78.31 28.74
26 13.74 64.12 70.37 34.69
27 10.03 72.94 69.79 44.20
28 7.27 65.56 70.84 37.94
29 0.46 62.91 62.99 40.11
30 7.03 61.22 71.52 35.84
31 14.95 65.69 78.75 47.51
32 8.10 63.33 74.94 42.55
33 18.95 63.71 74.72 25.07
34 19.38 45.21 71.36 30.86
Ekspresi.Budaya Budaya.Literasi Gender
1 32.86 59.40 54.33
2 23.22 55.66 58.79
3 24.50 61.17 60.10
4 22.31 56.39 59.20
5 25.67 53.88 54.63
6 15.30 55.41 60.01
7 21.94 53.22 58.39
8 20.14 50.20 57.18
9 14.68 55.75 51.75
10 22.74 66.78 56.53
11 15.00 67.11 58.23
12 21.79 56.60 55.69
13 34.79 50.00 58.28
14 41.11 56.20 64.61
15 34.39 50.81 56.15
16 22.05 56.58 52.97
17 52.99 62.99 60.33
18 31.43 54.22 48.18
19 30.50 47.32 63.75
20 24.25 50.91 55.70
21 24.56 52.19 65.64
22 24.02 52.43 57.53
23 24.33 60.09 55.88
24 22.63 52.79 52.02
25 35.37 48.01 66.13
26 28.24 51.09 62.78
27 20.46 54.85 61.69
28 22.14 59.82 58.62
29 24.63 61.21 66.05
30 21.88 47.61 53.97
31 39.49 47.81 64.85
32 29.62 48.26 60.35
33 33.52 47.42 56.94
34 33.93 27.36 55.53
>
> Data = data.matrix(Data_IPk)
> summary(Data1)
Ekonomi.budaya Pendidikan Ketahanan.Sosial.Budaya Warisan.Budaya
Min. : 0.46 Min. :45.21 Min. :53.73 Min. :25.07
1st Qu.:11.75 1st Qu.:64.39 1st Qu.:67.38 1st Qu.:38.42
Median :18.43 Median :68.53 Median :71.10 Median :45.87
Mean :18.59 Mean :67.88 Mean :69.89 Mean :44.16
3rd Qu.:21.77 3rd Qu.:72.58 3rd Qu.:74.42 3rd Qu.:50.04
Max. :56.79 Max. :80.68 Max. :78.75 Max. :56.57
Ekspresi.Budaya Budaya.Literasi Gender
Min. :14.68 Min. :27.36 Min. :48.18
1st Qu.:22.07 1st Qu.:50.35 1st Qu.:55.69
Median :24.41 Median :54.05 Median :58.26
Mean :26.96 Mean :53.87 Mean :58.32
3rd Qu.:32.50 3rd Qu.:56.59 3rd Qu.:60.34
Max. :52.99 Max. :67.11 Max. :66.13
> library(lmtest)
> model <- lm(dataIPK$IPK ~ dataIPK$`Ekonomi budaya` + dataIPK$Pendidikan + dataIPK$`Ketahanan Sosial Budaya` + dataIPK$`Warisan Budaya` + dataIPK$`Ekspresi Budaya` + dataIPK$`Budaya Literasi`+ dataIPK$Gender, dataIPK)
> vif(model)
dataIPK$`Ekonomi budaya` dataIPK$Pendidikan
2.025967 2.822067
dataIPK$`Ketahanan Sosial Budaya` dataIPK$`Warisan Budaya`
1.484292 1.467377
dataIPK$`Ekspresi Budaya` dataIPK$`Budaya Literasi`
1.499341 2.517359
dataIPK$Gender
1.420335
> clust1 <- agnes(Data, method = "ward")
>
> #compute distance matrix
> d1 <- dist(Data, method = "manhattan")
>
> #perform hierarchical clustering using Ward's method
> final_clust1 <- hclust(d1, method = "ward.D2" )
>
> #produce dendrogram
> print(plot(final_clust1))
NULL
>
> #cut the dendrogram into 3 clusters
> cluster1 <- cutree(final_clust1, k=3)
>
> #find number of observations in each cluster
> table(cluster1)
cluster1
1 2 3
23 2 9
>
> #append cluster labels to original data
> final_data1 <- cbind(Data, cluster = cluster1)
>
> #display first six rows of final data
> head(final_data1)
Ekonomi budaya Pendidikan Ketahanan Sosial Budaya Warisan Budaya
[1,] 11.59 76.93 54.28 42.19
[2,] 11.27 68.55 69.75 36.48
[3,] 18.97 72.70 58.13 52.31
[4,] 26.35 74.27 70.07 47.47
[5,] 22.12 66.09 69.70 49.35
[6,] 18.30 64.21 64.31 53.15
Ekspresi Budaya Budaya Literasi Gender cluster
[1,] 32.86 59.40 54.33 1
[2,] 23.22 55.66 58.79 1
[3,] 24.50 61.17 60.10 1
[4,] 22.31 56.39 59.20 1
[5,] 25.67 53.88 54.63 1
[6,] 15.30 55.41 60.01 1
>
> final_data1 = data.frame(final_data1)
> final_data1
Ekonomi.budaya Pendidikan Ketahanan.Sosial.Budaya Warisan.Budaya
1 11.59 76.93 54.28 42.19
2 11.27 68.55 69.75 36.48
3 18.97 72.70 58.13 52.31
4 26.35 74.27 70.07 47.47
5 22.12 66.09 69.70 49.35
6 18.30 64.21 64.31 53.15
7 25.35 71.22 73.15 50.85
8 18.57 73.00 71.54 50.11
9 18.06 64.91 69.48 50.14
10 14.64 73.61 73.53 37.81
11 16.05 77.81 66.81 43.70
12 24.44 67.21 59.44 49.52
13 25.96 71.21 72.37 50.12
14 56.79 80.68 76.50 56.57
15 19.81 70.61 66.54 49.82
16 12.24 65.78 53.73 47.34
17 29.41 72.85 76.75 54.67
18 47.97 71.61 64.36 47.08
19 2.44 59.20 75.80 39.88
20 12.43 53.02 76.09 44.66
21 20.40 68.50 75.69 53.49
22 19.05 69.14 69.08 49.52
23 29.65 72.20 72.46 37.44
24 9.69 71.40 73.21 40.19
25 20.71 66.38 78.31 28.74
26 13.74 64.12 70.37 34.69
27 10.03 72.94 69.79 44.20
28 7.27 65.56 70.84 37.94
29 0.46 62.91 62.99 40.11
30 7.03 61.22 71.52 35.84
31 14.95 65.69 78.75 47.51
32 8.10 63.33 74.94 42.55
33 18.95 63.71 74.72 25.07
34 19.38 45.21 71.36 30.86
Ekspresi.Budaya Budaya.Literasi Gender cluster
1 32.86 59.40 54.33 1
2 23.22 55.66 58.79 1
3 24.50 61.17 60.10 1
4 22.31 56.39 59.20 1
5 25.67 53.88 54.63 1
6 15.30 55.41 60.01 1
7 21.94 53.22 58.39 1
8 20.14 50.20 57.18 1
9 14.68 55.75 51.75 1
10 22.74 66.78 56.53 1
11 15.00 67.11 58.23 1
12 21.79 56.60 55.69 1
13 34.79 50.00 58.28 1
14 41.11 56.20 64.61 2
15 34.39 50.81 56.15 1
16 22.05 56.58 52.97 1
17 52.99 62.99 60.33 2
18 31.43 54.22 48.18 1
19 30.50 47.32 63.75 3
20 24.25 50.91 55.70 3
21 24.56 52.19 65.64 1
22 24.02 52.43 57.53 1
23 24.33 60.09 55.88 1
24 22.63 52.79 52.02 1
25 35.37 48.01 66.13 3
26 28.24 51.09 62.78 3
27 20.46 54.85 61.69 1
28 22.14 59.82 58.62 1
29 24.63 61.21 66.05 1
30 21.88 47.61 53.97 3
31 39.49 47.81 64.85 3
32 29.62 48.26 60.35 3
33 33.52 47.42 56.94 3
34 33.93 27.36 55.53 3
>
> idclus1 <- final_data1$cluster
> idclus1
[1] 1 1 1 1 1 1 1 1 1 1 1 1 1 2 1 1 2 1 3 3 1 1 1 1 3 3 1 1 1 3 3 3 3 3
>
> #cluster 1 2 3
> c1_1 = subset(final_data1, cluster1 == 1, drop = FALSE)
> c2_1 = subset(final_data1, cluster1 == 2, drop = FALSE)
> c3_1 = subset(final_data1, cluster1 == 3, drop = FALSE)
> c1_1
Ekonomi.budaya Pendidikan Ketahanan.Sosial.Budaya Warisan.Budaya
1 11.59 76.93 54.28 42.19
2 11.27 68.55 69.75 36.48
3 18.97 72.70 58.13 52.31
4 26.35 74.27 70.07 47.47
5 22.12 66.09 69.70 49.35
6 18.30 64.21 64.31 53.15
7 25.35 71.22 73.15 50.85
8 18.57 73.00 71.54 50.11
9 18.06 64.91 69.48 50.14
10 14.64 73.61 73.53 37.81
11 16.05 77.81 66.81 43.70
12 24.44 67.21 59.44 49.52
13 25.96 71.21 72.37 50.12
15 19.81 70.61 66.54 49.82
16 12.24 65.78 53.73 47.34
18 47.97 71.61 64.36 47.08
21 20.40 68.50 75.69 53.49
22 19.05 69.14 69.08 49.52
23 29.65 72.20 72.46 37.44
24 9.69 71.40 73.21 40.19
27 10.03 72.94 69.79 44.20
28 7.27 65.56 70.84 37.94
29 0.46 62.91 62.99 40.11
Ekspresi.Budaya Budaya.Literasi Gender cluster
1 32.86 59.40 54.33 1
2 23.22 55.66 58.79 1
3 24.50 61.17 60.10 1
4 22.31 56.39 59.20 1
5 25.67 53.88 54.63 1
6 15.30 55.41 60.01 1
7 21.94 53.22 58.39 1
8 20.14 50.20 57.18 1
9 14.68 55.75 51.75 1
10 22.74 66.78 56.53 1
11 15.00 67.11 58.23 1
12 21.79 56.60 55.69 1
13 34.79 50.00 58.28 1
15 34.39 50.81 56.15 1
16 22.05 56.58 52.97 1
18 31.43 54.22 48.18 1
21 24.56 52.19 65.64 1
22 24.02 52.43 57.53 1
23 24.33 60.09 55.88 1
24 22.63 52.79 52.02 1
27 20.46 54.85 61.69 1
28 22.14 59.82 58.62 1
29 24.63 61.21 66.05 1
> c2_1
Ekonomi.budaya Pendidikan Ketahanan.Sosial.Budaya Warisan.Budaya
14 56.79 80.68 76.50 56.57
17 29.41 72.85 76.75 54.67
Ekspresi.Budaya Budaya.Literasi Gender cluster
14 41.11 56.20 64.61 2
17 52.99 62.99 60.33 2
> c3_1
Ekonomi.budaya Pendidikan Ketahanan.Sosial.Budaya Warisan.Budaya
19 2.44 59.20 75.80 39.88
20 12.43 53.02 76.09 44.66
25 20.71 66.38 78.31 28.74
26 13.74 64.12 70.37 34.69
30 7.03 61.22 71.52 35.84
31 14.95 65.69 78.75 47.51
32 8.10 63.33 74.94 42.55
33 18.95 63.71 74.72 25.07
34 19.38 45.21 71.36 30.86
Ekspresi.Budaya Budaya.Literasi Gender cluster
19 30.50 47.32 63.75 3
20 24.25 50.91 55.70 3
25 35.37 48.01 66.13 3
26 28.24 51.09 62.78 3
30 21.88 47.61 53.97 3
31 39.49 47.81 64.85 3
32 29.62 48.26 60.35 3
33 33.52 47.42 56.94 3
34 33.93 27.36 55.53 3
>
> #simpangan baku tiap cluster
> sr1_1 = sd(as.matrix(c1_1))
> sr2_1 = sd(as.matrix(c2_1))
> sr3_1 = sd(as.matrix(c3_1))
>
> #Rataan Per Cluster
> #Cluster 1
> avg1_1 = mean(as.matrix(c1_1))
> #Cluster 2
> avg2_1 = mean(as.matrix(c2_1))
> #Cluster 3
> avg3_1 = mean(as.matrix(c3_1))
>
> #Rata-rata rataan 3 cluster
> miu_1 = (sum(avg1_1,avg2_1,avg3_1))/3
>
> #Rasio Simpangan Baku
> sw1 = (sr1_1+sr2_1+sr3_1)/3
> sb1 <- sqrt(((avg1_1-miu_1)^2+(avg2_1-miu_1)^2+(avg3_1-miu_1)^2)/2)
> r1 <- sb1/sw1
> r1
[1] 0.2762403
> clust2 <- agnes(Data, method = "average")
>
> #compute distance matrix
> d2 <- dist(Data, method = "manhattan")
>
> #perform hierarchical clustering using Ward's method
> final_clust2 <- hclust(d2, method = "average" )
>
> #dendogram
> print(plot(final_clust2))
NULL
>
> #cut the dendrogram into 3 clusters
> cluster2 <- cutree(final_clust2, k=3)
>
> #find number of observations in each cluster
> table(cluster2)
cluster2
1 2 3
31 2 1
>
> #append cluster labels to original data
> final_data2 <- cbind(Data, cluster = cluster2)
>
> #display first six rows of final data
> head(final_data2)
Ekonomi budaya Pendidikan Ketahanan Sosial Budaya Warisan Budaya
[1,] 11.59 76.93 54.28 42.19
[2,] 11.27 68.55 69.75 36.48
[3,] 18.97 72.70 58.13 52.31
[4,] 26.35 74.27 70.07 47.47
[5,] 22.12 66.09 69.70 49.35
[6,] 18.30 64.21 64.31 53.15
Ekspresi Budaya Budaya Literasi Gender cluster
[1,] 32.86 59.40 54.33 1
[2,] 23.22 55.66 58.79 1
[3,] 24.50 61.17 60.10 1
[4,] 22.31 56.39 59.20 1
[5,] 25.67 53.88 54.63 1
[6,] 15.30 55.41 60.01 1
>
> final_data2=data.frame(final_data2)
>
> idclus2 <- final_data2$cluster
>
> #cluster 1 2 3
> c1_2 = subset(final_data2, cluster2 == 1, drop = FALSE)
> c2_2 = subset(final_data2, cluster2 == 2, drop = FALSE)
> c3_2 = subset(final_data2, cluster2 == 3, drop = FALSE)
> c1_2
Ekonomi.budaya Pendidikan Ketahanan.Sosial.Budaya Warisan.Budaya
1 11.59 76.93 54.28 42.19
2 11.27 68.55 69.75 36.48
3 18.97 72.70 58.13 52.31
4 26.35 74.27 70.07 47.47
5 22.12 66.09 69.70 49.35
6 18.30 64.21 64.31 53.15
7 25.35 71.22 73.15 50.85
8 18.57 73.00 71.54 50.11
9 18.06 64.91 69.48 50.14
10 14.64 73.61 73.53 37.81
11 16.05 77.81 66.81 43.70
12 24.44 67.21 59.44 49.52
13 25.96 71.21 72.37 50.12
15 19.81 70.61 66.54 49.82
16 12.24 65.78 53.73 47.34
18 47.97 71.61 64.36 47.08
19 2.44 59.20 75.80 39.88
20 12.43 53.02 76.09 44.66
21 20.40 68.50 75.69 53.49
22 19.05 69.14 69.08 49.52
23 29.65 72.20 72.46 37.44
24 9.69 71.40 73.21 40.19
25 20.71 66.38 78.31 28.74
26 13.74 64.12 70.37 34.69
27 10.03 72.94 69.79 44.20
28 7.27 65.56 70.84 37.94
29 0.46 62.91 62.99 40.11
30 7.03 61.22 71.52 35.84
31 14.95 65.69 78.75 47.51
32 8.10 63.33 74.94 42.55
33 18.95 63.71 74.72 25.07
Ekspresi.Budaya Budaya.Literasi Gender cluster
1 32.86 59.40 54.33 1
2 23.22 55.66 58.79 1
3 24.50 61.17 60.10 1
4 22.31 56.39 59.20 1
5 25.67 53.88 54.63 1
6 15.30 55.41 60.01 1
7 21.94 53.22 58.39 1
8 20.14 50.20 57.18 1
9 14.68 55.75 51.75 1
10 22.74 66.78 56.53 1
11 15.00 67.11 58.23 1
12 21.79 56.60 55.69 1
13 34.79 50.00 58.28 1
15 34.39 50.81 56.15 1
16 22.05 56.58 52.97 1
18 31.43 54.22 48.18 1
19 30.50 47.32 63.75 1
20 24.25 50.91 55.70 1
21 24.56 52.19 65.64 1
22 24.02 52.43 57.53 1
23 24.33 60.09 55.88 1
24 22.63 52.79 52.02 1
25 35.37 48.01 66.13 1
26 28.24 51.09 62.78 1
27 20.46 54.85 61.69 1
28 22.14 59.82 58.62 1
29 24.63 61.21 66.05 1
30 21.88 47.61 53.97 1
31 39.49 47.81 64.85 1
32 29.62 48.26 60.35 1
33 33.52 47.42 56.94 1
> c2_2
Ekonomi.budaya Pendidikan Ketahanan.Sosial.Budaya Warisan.Budaya
14 56.79 80.68 76.50 56.57
17 29.41 72.85 76.75 54.67
Ekspresi.Budaya Budaya.Literasi Gender cluster
14 41.11 56.20 64.61 2
17 52.99 62.99 60.33 2
> c3_2
Ekonomi.budaya Pendidikan Ketahanan.Sosial.Budaya Warisan.Budaya
34 19.38 45.21 71.36 30.86
Ekspresi.Budaya Budaya.Literasi Gender cluster
34 33.93 27.36 55.53 3
>
> #simpangan baku tiap cluster
> sr1_2 = sd(as.matrix(c1_2))
> sr2_2 = sd(as.matrix(c2_2))
> sr3_2 = sd(as.matrix(c3_2))
>
> #Rataan Per Cluster
> #Cluster 1
> avg1_2 = mean(as.matrix(c1_2))
> #Cluster 2
> avg2_2 = mean(as.matrix(c2_2))
> #Cluster 3
> avg3_2 = mean(as.matrix(c3_2))
>
> #Rata-rata rataan 3 cluster
> miu_2 = (avg1_2+avg2_2+avg3_2)/3
>
> #Rasio Simpangan Baku
> sw2 = (sr1_2+sr2_2+sr3_2)/3
> sb2 <- sqrt(((avg1_2-miu_2)^2+(avg2_2-miu_2)^2+(avg3_2-miu_2)^2)/2)
> r2 <- sb2/sw2
> r2
[1] 0.3728611
> clust3 <- agnes(Data, method = "complete")
>
> #compute distance matrix
> d3 <- dist(Data, method = "manhattan")
>
> #perform hierarchical clustering using Ward's method
> final_clust3 <- hclust(d3, method = "complete" )
>
> #produce dendrogram
> plot(final_clust3)
>
> #cut the dendrogram into 3 clusters
> cluster3 <- cutree(final_clust3, k=3)
>
> #find number of observations in each cluster
> table(cluster3)
cluster3
1 2 3
22 3 9
>
> #append cluster labels to original data
> final_data3 <- cbind(Data, cluster = cluster3)
>
> #display first six rows of final data
> head(final_data3)
Ekonomi budaya Pendidikan Ketahanan Sosial Budaya Warisan Budaya
[1,] 11.59 76.93 54.28 42.19
[2,] 11.27 68.55 69.75 36.48
[3,] 18.97 72.70 58.13 52.31
[4,] 26.35 74.27 70.07 47.47
[5,] 22.12 66.09 69.70 49.35
[6,] 18.30 64.21 64.31 53.15
Ekspresi Budaya Budaya Literasi Gender cluster
[1,] 32.86 59.40 54.33 1
[2,] 23.22 55.66 58.79 1
[3,] 24.50 61.17 60.10 1
[4,] 22.31 56.39 59.20 1
[5,] 25.67 53.88 54.63 1
[6,] 15.30 55.41 60.01 1
>
> final_data3=data.frame(final_data3)
>
> idclus3 <- final_data3$cluster
>
> #cluster 1 2 3
> c1_3 = subset(final_data3, cluster3 == 1, drop = FALSE)
> c2_3 = subset(final_data3, cluster3 == 2, drop = FALSE)
> c3_3 = subset(final_data3, cluster3 == 3, drop = FALSE)
> c1_3
Ekonomi.budaya Pendidikan Ketahanan.Sosial.Budaya Warisan.Budaya
1 11.59 76.93 54.28 42.19
2 11.27 68.55 69.75 36.48
3 18.97 72.70 58.13 52.31
4 26.35 74.27 70.07 47.47
5 22.12 66.09 69.70 49.35
6 18.30 64.21 64.31 53.15
7 25.35 71.22 73.15 50.85
8 18.57 73.00 71.54 50.11
9 18.06 64.91 69.48 50.14
10 14.64 73.61 73.53 37.81
11 16.05 77.81 66.81 43.70
12 24.44 67.21 59.44 49.52
13 25.96 71.21 72.37 50.12
15 19.81 70.61 66.54 49.82
16 12.24 65.78 53.73 47.34
21 20.40 68.50 75.69 53.49
22 19.05 69.14 69.08 49.52
23 29.65 72.20 72.46 37.44
24 9.69 71.40 73.21 40.19
27 10.03 72.94 69.79 44.20
28 7.27 65.56 70.84 37.94
29 0.46 62.91 62.99 40.11
Ekspresi.Budaya Budaya.Literasi Gender cluster
1 32.86 59.40 54.33 1
2 23.22 55.66 58.79 1
3 24.50 61.17 60.10 1
4 22.31 56.39 59.20 1
5 25.67 53.88 54.63 1
6 15.30 55.41 60.01 1
7 21.94 53.22 58.39 1
8 20.14 50.20 57.18 1
9 14.68 55.75 51.75 1
10 22.74 66.78 56.53 1
11 15.00 67.11 58.23 1
12 21.79 56.60 55.69 1
13 34.79 50.00 58.28 1
15 34.39 50.81 56.15 1
16 22.05 56.58 52.97 1
21 24.56 52.19 65.64 1
22 24.02 52.43 57.53 1
23 24.33 60.09 55.88 1
24 22.63 52.79 52.02 1
27 20.46 54.85 61.69 1
28 22.14 59.82 58.62 1
29 24.63 61.21 66.05 1
> c2_3
Ekonomi.budaya Pendidikan Ketahanan.Sosial.Budaya Warisan.Budaya
14 56.79 80.68 76.50 56.57
17 29.41 72.85 76.75 54.67
18 47.97 71.61 64.36 47.08
Ekspresi.Budaya Budaya.Literasi Gender cluster
14 41.11 56.20 64.61 2
17 52.99 62.99 60.33 2
18 31.43 54.22 48.18 2
> c3_3
Ekonomi.budaya Pendidikan Ketahanan.Sosial.Budaya Warisan.Budaya
19 2.44 59.20 75.80 39.88
20 12.43 53.02 76.09 44.66
25 20.71 66.38 78.31 28.74
26 13.74 64.12 70.37 34.69
30 7.03 61.22 71.52 35.84
31 14.95 65.69 78.75 47.51
32 8.10 63.33 74.94 42.55
33 18.95 63.71 74.72 25.07
34 19.38 45.21 71.36 30.86
Ekspresi.Budaya Budaya.Literasi Gender cluster
19 30.50 47.32 63.75 3
20 24.25 50.91 55.70 3
25 35.37 48.01 66.13 3
26 28.24 51.09 62.78 3
30 21.88 47.61 53.97 3
31 39.49 47.81 64.85 3
32 29.62 48.26 60.35 3
33 33.52 47.42 56.94 3
34 33.93 27.36 55.53 3
>
> #simpangan baku tiap cluster
> sr1_3 = sd(as.matrix(c1_3))
> sr2_3 = sd(as.matrix(c2_3))
> sr3_3 = sd(as.matrix(c3_3))
>
> #Rataan Per Cluster
> #Cluster 1
> avg1_3 = mean(as.matrix(c1_3))
> #Cluster 2
> avg2_3 = mean(as.matrix(c2_3))
> #Cluster 3
> avg3_3 = mean(as.matrix(c3_3))
>
> #Rata-rata rataan 3 cluster
> miu_3 = sum(avg1_3,avg2_3,avg3_3)/3
>
> #Rasio Simpangan Baku
> sw3 = sum(sr1_3,sr2_3,sr3_3)/3
> sb3 <- sqrt(((avg1_3-miu_3)^2+(avg2_3-miu_3)^2+(avg3_3-miu_3)^2)/2)
> r3 <- sb3/sw3
> r3
[1] 0.2241806
> #Tabel Perbandingan Rasio
> rasio <- rbind(r1,r2,r3)
> rasio
[,1]
r1 0.2762403
r2 0.3728611
r3 0.2241806
>
> #Jumlah Anggota Kombinasi Cluster Terbaik
> table(cluster1)
cluster1
1 2 3
23 2 9
> table(cluster2)
cluster2
1 2 3
31 2 1
> table(cluster3)
cluster3
1 2 3
22 3 9
>
> # Profil cluster
> profil=Data_IPk %>% mutate(idclus3) %>% group_by(idclus3) %>% summarise_all("mean")
> pusatdata = data.frame(rowMeans(c1_1[1,]),rowMeans(c2_1[1,]),
+ rowMeans(c3_1[1,]))
> names(pusatdata) = c("Cluster 1","Cluster 2","Cluster 3")
> profil
# A tibble: 3 × 8
idclus3 `Ekonomi budaya` Pendidikan `Ketahanan Sosial Budaya` `Warisan Budaya`
<dbl> <dbl> <dbl> <dbl> <dbl>
1 1 17.3 70.0 67.6 46.1
2 2 44.7 75.0 72.5 52.8
3 3 13.1 60.2 74.7 36.6
# ℹ 3 more variables: `Ekspresi Budaya` <dbl>, `Budaya Literasi` <dbl>,
# Gender <dbl>
> pusatdata
Cluster 1 Cluster 2 Cluster 3
1 41.5725 54.3075 40.23625
> summary(Data1)
Ekonomi.budaya Pendidikan Ketahanan.Sosial.Budaya Warisan.Budaya
Min. : 0.46 Min. :45.21 Min. :53.73 Min. :25.07
1st Qu.:11.75 1st Qu.:64.39 1st Qu.:67.38 1st Qu.:38.42
Median :18.43 Median :68.53 Median :71.10 Median :45.87
Mean :18.59 Mean :67.88 Mean :69.89 Mean :44.16
3rd Qu.:21.77 3rd Qu.:72.58 3rd Qu.:74.42 3rd Qu.:50.04
Max. :56.79 Max. :80.68 Max. :78.75 Max. :56.57
Ekspresi.Budaya Budaya.Literasi Gender
Min. :14.68 Min. :27.36 Min. :48.18
1st Qu.:22.07 1st Qu.:50.35 1st Qu.:55.69
Median :24.41 Median :54.05 Median :58.26
Mean :26.96 Mean :53.87 Mean :58.32
3rd Qu.:32.50 3rd Qu.:56.59 3rd Qu.:60.34
Max. :52.99 Max. :67.11 Max. :66.13
Berdasarkan output tersebut dapat diketahui bahwa :
\1. Rata-rata indeks dimensi Ekonomi Budaya Indonesia sebesar 18,59
\2. Rata-rata indeks dimensi Pendidikan Indonesia sebesar 67,88
\3. Rata-rata indeks dimensi Ketahanan Sosial-Budaya Indonesia sebesar 69,89
\4. Rata-rata indeks dimensi Warisan Budaya Indonesia sebesar 44,16
\5. Rata-rata indeks dimensi Ekspresi Budaya Indonesia sebesar 26,96
\6. Rata-rata indeks dimensi Budaya Literasi Indonesia sebesar 53,87
\7. Rata-rata indeks dimensi Gender Indonesia sebesar 58,32
H0 : VIF Values < 10 Tidak terdapat multikolinearitas VS
H1 : VIF Values > 10 Terdapat multikolinearitas
> library(car)
> vif(model)
dataIPK$`Ekonomi budaya` dataIPK$Pendidikan
2.025967 2.822067
dataIPK$`Ketahanan Sosial Budaya` dataIPK$`Warisan Budaya`
1.484292 1.467377
dataIPK$`Ekspresi Budaya` dataIPK$`Budaya Literasi`
1.499341 2.517359
dataIPK$Gender
1.420335
Berdasarkan output tersebut diketahui bahwa nilai VIF masing-masing variabel bernilai < 10, sehingga H0 diterima. Maka dapat disimpukan bahwa tidak terdapat mutikolinearitas antarvariabel.
> clust1 <- agnes(Data, method = "ward")
>
> #compute distance matrix
> d1 <- dist(Data, method = "manhattan")
>
> #perform hierarchical clustering using Ward's method
> final_clust1 <- hclust(d1, method = "ward.D2" )
>
> #produce dendrogram
> print(plot(final_clust1))
NULL
>
> #cut the dendrogram into 3 clusters
> cluster1 <- cutree(final_clust1, k=3)
>
> #find number of observations in each cluster
> table(cluster1)
cluster1
1 2 3
23 2 9
>
> #simpangan baku tiap cluster
> sr1_1 = sd(as.matrix(c1_1))
> sr2_1 = sd(as.matrix(c2_1))
> sr3_1 = sd(as.matrix(c3_1))
>
> #Rataan Per Cluster
> #Cluster 1
> avg1_1 = mean(as.matrix(c1_1))
> #Cluster 2
> avg2_1 = mean(as.matrix(c2_1))
> #Cluster 3
> avg3_1 = mean(as.matrix(c3_1))
>
> #Rata-rata rataan 3 cluster
> miu_1 = (sum(avg1_1,avg2_1,avg3_1))/3
>
> #Rasio Simpangan Baku
> sw1 = (sr1_1+sr2_1+sr3_1)/3
> sb1 <- sqrt(((avg1_1-miu_1)^2+(avg2_1-miu_1)^2+(avg3_1-miu_1)^2)/2)
> r1 <- sb1/sw1
> r1
[1] 0.2762403
Berdasarkan gambar dendogram, maka akan dibentuk klaster sebanyak 3 klaster. Sehingga didapatkan anggota klaster 1 sebanyak 23 Provinsi, klaster 2 sebanak 2 Provinsi dan klaster 3 sebanyak 9 Provinsi. Ketiga klaster tersebut masing-masing dihitung rata-rata dan simpangan bakunya, kemudian dari hasil tersebut dihitung rasio simpangan baku ketiga klaster. Berdasarkan output diketahui bahwa rasio simpangan baku untuk metode Ward - Manhattan sebesar 0,276.
> clust2 <- agnes(Data, method = "average")
>
> #compute distance matrix
> d2 <- dist(Data, method = "manhattan")
>
> #perform hierarchical clustering using Ward's method
> final_clust2 <- hclust(d2, method = "average" )
>
> #dendogram
> print(plot(final_clust2))
NULL
>
> #cut the dendrogram into 3 clusters
> cluster2 <- cutree(final_clust2, k=3)
>
> #find number of observations in each cluster
> table(cluster2)
cluster2
1 2 3
31 2 1
>
> #simpangan baku tiap cluster
> sr1_2 = sd(as.matrix(c1_2))
> sr2_2 = sd(as.matrix(c2_2))
> sr3_2 = sd(as.matrix(c3_2))
>
> #Rataan Per Cluster
> #Cluster 1
> avg1_2 = mean(as.matrix(c1_2))
> #Cluster 2
> avg2_2 = mean(as.matrix(c2_2))
> #Cluster 3
> avg3_2 = mean(as.matrix(c3_2))
>
> #Rata-rata rataan 3 cluster
> miu_2 = (avg1_2+avg2_2+avg3_2)/3
>
> #Rasio Simpangan Baku
> sw2 = (sr1_2+sr2_2+sr3_2)/3
> sb2 <- sqrt(((avg1_2-miu_2)^2+(avg2_2-miu_2)^2+(avg3_2-miu_2)^2)/2)
> r2 <- sb2/sw2
> r2
[1] 0.3728611
Berdasarkan gambar dendogram, maka akan dibentuk klaster sebanyak 3 klaster. Sehingga didapatkan anggota klaster 1 sebanyak 31 Provinsi, klaster 2 sebanak 2 Provinsi dan klaster 3 sebanyak 1 Provinsi. Ketiga klaster tersebut masing-masing dihitung rata-rata dan simpangan bakunya, kemudian dari hasil tersebut dihitung rasio simpangan baku ketiga klaster. Berdasarkan output diketahui bahwa rasio simpangan baku untuk metode Ward - Manhattan sebesar 0,37.
> clust3 <- agnes(Data, method = "complete")
>
> #compute distance matrix
> d3 <- dist(Data, method = "manhattan")
>
> #perform hierarchical clustering using Ward's method
> final_clust3 <- hclust(d3, method = "complete" )
>
> #produce dendrogram
> plot(final_clust3)
>
> #cut the dendrogram into 3 clusters
> cluster3 <- cutree(final_clust3, k=3)
>
> #find number of observations in each cluster
> table(cluster3)
cluster3
1 2 3
22 3 9
>
> #simpangan baku tiap cluster
> sr1_3 = sd(as.matrix(c1_3))
> sr2_3 = sd(as.matrix(c2_3))
> sr3_3 = sd(as.matrix(c3_3))
>
> #Rataan Per Cluster
> #Cluster 1
> avg1_3 = mean(as.matrix(c1_3))
> #Cluster 2
> avg2_3 = mean(as.matrix(c2_3))
> #Cluster 3
> avg3_3 = mean(as.matrix(c3_3))
>
> #Rata-rata rataan 3 cluster
> miu_3 = sum(avg1_3,avg2_3,avg3_3)/3
>
> #Rasio Simpangan Baku
> sw3 = sum(sr1_3,sr2_3,sr3_3)/3
> sb3 <- sqrt(((avg1_3-miu_3)^2+(avg2_3-miu_3)^2+(avg3_3-miu_3)^2)/2)
> r3 <- sb3/sw3
> r3
[1] 0.2241806
Berdasarkan gambar dendogram, maka akan dibentuk klaster sebanyak 3 klaster. Sehingga didapatkan anggota klaster 1 sebanyak 22 Provinsi, klaster 2 sebanak 3 Provinsi dan klaster 3 sebanyak 9 Provinsi. Ketiga klaster tersebut masing-masing dihitung rata-rata dan simpangan bakunya, kemudian dari hasil tersebut dihitung rasio simpangan baku ketiga klaster. Berdasarkan output diketahui bahwa rasio simpangan baku untuk metode Ward - Manhattan sebesar 0,224.
> #Tabel Perbandingan Rasio
> rasio <- rbind(r1,r2,r3)
> rasio
[,1]
r1 0.2762403
r2 0.3728611
r3 0.2241806
>
> #Jumlah Anggota Kombinasi Cluster Terbaik
> table(cluster2)
cluster2
1 2 3
31 2 1
Kombinasi metode terbaik dipilih berdasarkan rasio simpangan baku terbesar. Dari output di atas diketahui bahwa metode yangg menghasilkan nilai rasio simpangan baku terbesar adalah Average Linkage sebesar 0,37. Pada kombinasi ini, didapatkan hasil anggota klaster 1 sebanyak 31 Provinsi, anggota klaster 2 sebanyak 2 Provinsi, dan anggota klaster 3 sebanyak 1 Provinsi.
> # Profil cluster
> # Rata-rata variabel pada setiap klaster
> profil=Data_IPk %>% mutate(idclus3) %>% group_by(idclus3) %>% summarise_all("mean")
>
> # Rata-rata masing-masing variabel
> pusatdata = data.frame(rowMeans(c1_1[1,]),rowMeans(c2_1[1,]),
+ rowMeans(c3_1[1,]))
> names(pusatdata) = c("Cluster 1","Cluster 2","Cluster 3")
>
> #Hasil
> profil
# A tibble: 3 × 8
idclus3 `Ekonomi budaya` Pendidikan `Ketahanan Sosial Budaya` `Warisan Budaya`
<dbl> <dbl> <dbl> <dbl> <dbl>
1 1 17.3 70.0 67.6 46.1
2 2 44.7 75.0 72.5 52.8
3 3 13.1 60.2 74.7 36.6
# ℹ 3 more variables: `Ekspresi Budaya` <dbl>, `Budaya Literasi` <dbl>,
# Gender <dbl>
> pusatdata
Cluster 1 Cluster 2 Cluster 3
1 41.5725 54.3075 40.23625
Karakteristik pada masing-masing klaster dapat diketahui dengan menghitung rata-rata setiap variabel di masing-masing klaster. Berdasarkan output di atas dapat diketahui klaster 3 memiliki nilai rata-rata paling kecil dibanding klaster lain dan klaster 2 memiliki nilai rata-rata paling besar dibanding klaster lain. Sehingga dapat disimpulkan bahwa klaster 2 merupakan klaster dengan anggota yang memiliki nilai IPK tinggi, klaster 1 merupakan klaster dengan anggota yang memiliki nilai IPK sedang, dan klaster 3 merupakan klaster dengan anggota yang memiliki nilai IPK rendah.
Berdasarkan penerapan menggunakan 3 kombinasi metode pengukuran jarak Manhattan terhadap Metode Linkage (Average Linkage, Complete Linkage, dan Ward Linkage) pada data IPK berdasarkan 34 Provinsi di Indonesia, didapatkan hasil rasio simpangan baku terbesar pada metode Average Linkage sebesar 0,37. Sehingga dapat disimpulkan bahwa metode terbaik terdapat pada kombinasi Jarak Manhattan dengan metode Average Linkage. Pada kombinasi ini, dengan penetapan penelitian menggunakan tiga klaster, didapatkan hasil anggota klaster 1 sebanyak 31 Provinsi, anggota klaster 2 sebanyak 2 Provinsi, dan anggota klaster 3 sebanyak 1 Provinsi. Berdasarkan nilai rata-rata setiap variabel pada masing-masing klaster, dapat diketahui bahwa klaster 3 memiliki nilai rata-rata paling kecil dibanding klaster lain, maka klaster 3 merupakan klaster dengan anggota yang memiliki nilai IPK rendah. Klaster 2 memiliki nilai rata-rata paling besar dibanding klaster lain, maka klaster 2 merupakan klaster dengan anggota yang memiliki nilai IPK tinggi. Sedangkan klaster 1 merupakan klaster dengan anggota yang memiliki nilai IPK sedang.
Penelitian ini masih memiliki banyak kekurangan sehingga diperlukan pengembangan untuk mencapai kinerja yang lebih baik. Penelitian selanjutnya dapat dikembangkan dengan menggunakan data terbaru dan mengkombinasikan ukuran jarak dan metode linkage lain, atau menggunakan metode non-hierarki untuk membandingkan metode mana yang paling optimal dalam pengelompokkan.
Fathia, dkk. 2016. ANALISIS KLASTER KECAMATAN DI KABUPATEN SEMARANG BERDASARKAN POTENSI DESA MENGGUNAKAN METODE WARD DAN SINGLE LINKAGE. Jurnal Gaussian. Vol. 5 No. 4
Goreti, M., Nasution, Y.N., & Wahyuningsih, S. (2016). Perbandingan Hasil Analisis Cluster dengan Menggunakan Metode Single Linkage dan Metode C-Means (Studi Kasus: Data Tingkat Kualitas Udara Ambien pada Perusahaan Perkebunan di Kabupaten Kutai Barat Tahun 2014). Jurnal EKSPONENSIAL Volume 7, Nomor 1.
Hair, Joseph F., Black, William C., Babin, Barry J. dan Anderson, Rolph E. 2010. Multivariate Data Analysis. Seventh edition. Boston: Pearson.
Johnson, R. & Wichern, D. 2001. Applied multivariate statistical analysis 6th edition. New Jersey: Pearson Education.
Johson, R. & Winchern, D. 2007. Applied Multivariate Statistical Analysis. New Jersey: Prentice Hall.
Kementerian Pendidikan Kebudayaan Riset dan Teknologi, Badan Pusat Statistik, & Badan Perencanaan Pembangunan Nasional. (2021). INDEKS PEMBANGUNAN KEBUDAYAAN TAHUN 2021. Retrieved from https://ipk.kemdikbud.go.id
Mattjik, A.A., Sumertajaya, I.M. 2011. Sidik Peubah Ganda dengan Menggunakan SAS. Wibawa GNA, Hadi AF, editor. Bogor(ID): IPB Press.
Paramadina, M., Sudarmin, & Aidid, M. K. (2019). Perbandingan Analisis Cluster Metode Average Linkage dan Metode Ward (Kasus: IPM Provinsi Sulawesi Selatan). Journal of Statistics and Its Application on Teaching and Research Vol. 1 No. 2, 22-31.
Wijaya, T., & Budiman, S. (2016). ANALISIS MULTIVARIAT UNTUK PENELITIAN MANAJEMEN. Yogyakarta: Percetakan Pohon Cahaya. Wutsqa, dkk. 2018. Analisis Data Multivariat Dengan Program R. Jurnal Pengabdian Masyarakat MIPA dan Pendidikan MIPA. Vol. 2 No. 2.
Wutsqa, dkk. 2018. Analisis Data Multivariat Dengan Program R. Jurnal Pengabdian Masyarakat MIPA dan Pendidikan MIPA. Vol. 2 No. 2.