Library:

> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")

1 PENDAHULUAN

1.1 Latar Belakang

Analisis klaster merupakan analisis yang mengelompokkan objek yang relatif sama sehingga sebuah klaster memiliki objek-objek yang homogen dengan tetap menjaga keheterogenan antar klaster (Hair dkk., 2010). Analisis klaster bertujuan mengelompokkan data dengan karakteristik yang mirip ke dalam suatu klaster. Dalam pengelompokan, digunakan suatu ukuran yang dapat menunjukkan kedekatan antar data, yaitu ukuran jarak (Fathia dkk, 2016). Menurut Hair dkk. (2010), terdapat beberapa metode pengukuran jarak, antara lain Euclidean distance, City-Block distance (Manhattan), dan Mahalanobis distance. Dalam analisis klaster terdapat 2 metode pengelompokkan, yaitu metode hierarki dan metode non-hierarki. Pembentukan klaster baru dilakukan dengan menggunakan metode pengelompokan (linkage) berdasarkan ukuran jarak antar objek, seperti Ward Linkage method, Complete Linkage method, Average Linkage method.

Analisis klaster dapat diaplikasikan dalam berbagai bidang, salah satunya dalam bidang sosial-budaya. Indeks Pembangunan Kebudayaan (IPK) merupakan salah satu instrumen untuk memberikan gambaran kemajuan pembangunan kebudayaan (Kemendikbud, 2021). Indeks Pembangunan Kebudayaan (IPK) digunakan untuk mendukung perencanaan, pelaksanaan, dan evaluasi dalam kebijakan kebudayaan melalui pendekatan berbasis data dan informasi akurat dan dapat dipertanggungjawabkan. IPK tidak hanya memandu perencanaan pembangunan, tetapi juga memantau kinerja program yang tengah berjalan.

1.2 Tinjauan Pustaka

1.2.1 Analisis Multivariat

Menurut Wustqa, dkk (2018), Analisis multivariat dilakukan untuk menganalisis pengaruh sejumlah variabel bebas terhadap sejumlah variabel tak bebas secara bersamaan dan banyak digunakan pada berbagai bidang seperti ilmu sosial, psikologi, ekonomi, pertanian, kesehatan, dan pendidikan. Beberapa metode dalam analisis multivariat adalah PCA, analisis faktor, analisis korelasi kanonik ,analisis regresi multivariat, analisis klaster, dan analisis diskriminan (Johnson & Wichern, 2007).

1.2.2 Analisis Cluster

Analisis klaster merupakan analisis yang mengelompokkan objek yang relatif sama sehingga sebuah klaster memiliki objek-objek yang homogen dengan tetap menjaga keheterogenan antar klaster (Hair dkk., 2010). Analisis klaster bertujuan mengelompokkan data dengan karakteristik yang mirip ke dalam suatu klaster. Menurut Hair dkk. (2010), terdapat beberapa metode pengukuran jarak, antara lain Euclidean distance, City-Block distance (Manhattan), dan Mahalanobis distance. Dalam analisis klaster terdapat 2 metode pengelompokkan, yaitu metode hierarki dan metode non-hierarki. Pembentukan klaster baru dilakukan dengan menggunakan metode pengelompokan (linkage) berdasarkan ukuran jarak antar objek, seperti Ward Linkage method, Complete Linkage method, Average Linkage method.

1.2.3 Metode Non-Hirarki

Menurut Johnson & Wicern (2002), metode non hirarki digunakan untuk pengelompokan objek dimana banyaknya cluster yang akan dibentuk dapat ditentukan terlebih dahulu sebagai bagian dari prosedur penggerombolan. Metode ini dapat diterapkan pada data yang lebih besar dibandingkan metode hirarki.

1.2.4 Metode Hirarki

Metode hirarki digunakan untuk mengelompokkan objek secara terstuktur berdasarkan kemiripan sifatnya dan cluster yang diinginkan belum diketahui banyaknya Mattjik & Sumertajaya (2011). Terdapat dua prosedur pada metode berhierarki, yaitu prosedur aglomeratif dan prosedur divisive (Johnson & Winchern, 2002). Menurut Mattjik & Sumertajaya (2011), banyaknya cluster yang terbentuk ditentukan dari dendrogram yang terjadi dan tergantung subyektivitas peneliti.

1.2.5 Jarak Manhattan

\(d_{manhattan} = \sum_{j=1}^p|x_j - y_j|\)

p : Jumlah objek penelitian

1.2.6 Ward Linkage

\(SSE = \sum_{j=1}^p(\sum_{i=1}^n X^2 - \frac{1}{n} (\sum_{i=1}^n X_{ij})^2)\)

\(X_{ij}\) : Nilai objek ke-i pada klaster ke-j

p : Jumlah objek penelitian

n : Banyak objek dalam klaster

1.2.7 Average Linkage

\(d(K_1, K_2) = \frac{1}{n_{K_{1}}n_{K_{2}}} \sum d_{xy}\)

\(K_1, K_2\) : Klaster

x : Objek pada klaster 1

y : Objek pada klaster 2

d : Jarak antara x dan y

\(n_{K_{1}}\) : Jumlah objek pada klaster 1

\(n_{K_{2}}\) : Jumlah objek pada klaster 2

1.2.8 Complete Linkage

\(d(K_1, K_2) = (d_{xy})\)

\(K_1, K_2\) : Klaster

x : Objek pada klaster 1

y : Objek pada klaster 2

d : Jarak antara x dan y

1.2.9 Rasio Simpangan baku

\(r =\frac{S_b}{S_w}\)

\(S_b\) : Simpangan baku antarklaster

\({S_w}\) : Simpangan baku dalam klaster

dimana :

\({S_w} =\frac{\sum_{k=1}^K S_k}{K}\)

\(S_k\) : Simpangan baku klaster ke-k

K : Banyak klaster yang terbentuk

\({S_b} =\frac{\sqrt{\sum_{k=1}^K(\bar{X}_k -\bar{X})^2}}{K-1}\)

\(\bar{X}_k\) : Rata-rata klaster ke-k

\(\bar{X}\) : Rata-rata seluruh klaster

K : Banyak klaster yang terbentuk

1.3 Data

Data yang digunakan dalam kasus ini adalah data sekunder yang bersumber dari Kemendikbud tentang “Indeks Pembangunan Kebudayaan Tahun 2021” berdasarkan 34 provinsi di Indonesia. Indeks Pembangunan Kebudayaan (IPK) adalah alat ukur yang menggambarkan kemajuan pembangunan kebudayaan. IPK disusun berdasarkan kerangka Culture Development Indicators (CDIs) yang dikembangkan oleh UNESCO. Kerangka tersebut terdiri dari 22 indikator yang dikelompokkan dalam tujuh dimensi, yaitu:

Ekonomi Budaya
Pendidikan
Ketahanan Sosial Budaya
Ekspresi Budaya
Budaya Literasi
Warisan Budaya
Gender

1.3.1 Tabel Data

Ekonomi budaya	Pendidikan	Ketahanan Sosial Budaya	Warisan Budaya	Ekspresi Budaya	Budaya Literasi	Gender	IPK
11.59	76.93	54.28	42.19	32.86	59.40	54.33	49.89
11.27	68.55	69.75	36.48	23.22	55.66	58.79	48.74
18.97	72.70	58.13	52.31	24.50	61.17	60.10	52.71
26.35	74.27	70.07	47.47	22.31	56.39	59.20	54.20
22.12	66.09	69.70	49.35	25.67	53.88	54.63	52.39
18.30	64.21	64.31	53.15	15.30	55.41	60.01	50.89
25.35	71.22	73.15	50.85	21.94	53.22	58.39	54.56
18.57	73.00	71.54	50.11	20.14	50.20	57.18	53.19
18.06	64.91	69.48	50.14	14.68	55.75	51.75	50.85
14.64	73.61	73.53	37.81	22.74	66.78	56.53	52.12
16.05	77.81	66.81	43.70	15.00	67.11	58.23	52.58
24.44	67.21	59.44	49.52	21.79	56.60	55.69	50.78
25.96	71.21	72.37	50.12	34.79	50.00	58.28	55.24
56.79	80.68	76.50	56.57	41.11	56.20	64.61	64.22
19.81	70.61	66.54	49.82	34.39	50.81	56.15	53.19
12.24	65.78	53.73	47.34	22.05	56.58	52.97	47.47
29.41	72.85	76.75	54.67	52.99	62.99	60.33	61.14
47.97	71.61	64.36	47.08	31.43	54.22	48.18	54.73
2.44	59.20	75.80	39.88	30.50	47.32	63.75	48.18
12.43	53.02	76.09	44.66	24.25	50.91	55.70	48.53
20.40	68.50	75.69	53.49	24.56	52.19	65.64	55.21
19.05	69.14	69.08	49.52	24.02	52.43	57.53	52.45
29.65	72.20	72.46	37.44	24.33	60.09	55.88	52.49
9.69	71.40	73.21	40.19	22.63	52.79	52.02	50.08
20.71	66.38	78.31	28.74	35.37	48.01	66.13	49.84
13.74	64.12	70.37	34.69	28.24	51.09	62.78	48.02
10.03	72.94	69.79	44.20	20.46	54.85	61.69	51.21
7.27	65.56	70.84	37.94	22.14	59.82	58.62	48.62
0.46	62.91	62.99	40.11	24.63	61.21	66.05	47.14
7.03	61.22	71.52	35.84	21.88	47.61	53.97	45.86
14.95	65.69	78.75	47.51	39.49	47.81	64.85	54.23
8.10	63.33	74.94	42.55	29.62	48.26	60.35	49.91
18.95	63.71	74.72	25.07	33.52	47.42	56.94	46.79
19.38	45.21	71.36	30.86	33.93	27.36	55.53	41.87

1.4 Tujuan

Berdasarkan uraian di atas, penelitian ini dilakukan dengan tujuan :

- Mengelompokkan 34 Provinsi di Indonesia berdasarkan IPK

- Memandingkan tiga metode pengelompokan, yaitu Complete Linkage Method, Average Linkage Method, dan Ward Linkage Method menggunakan jarak manhattan

- Mendapatkan kombinasi metode terbaik

2 SOURCE CODE

2.1 Library

> # Library
> library(readxl)
> library(car)
> library(lmtest)
> library(tseries)
> library(cluster)
> library(ggplot2)
> library(stats)
> library(tidyverse)
> library(dplyr)

2.2 Impor Data

> # Impor data
> Data_IPk <- read_excel("D:/BACKUP DATA C/tugas s5/S5 delita/IPk.xls", sheet = "Sheet2")
> View(Data_IPk)
> 
> # DEFINISI VARIABEL
> X1 = Data_IPk$`Ekonomi budaya`
> X2 = Data_IPk$Pendidikan
> X3 = Data_IPk$`Ketahanan Sosial Budaya`
> X4 = Data_IPk$`Warisan Budaya`
> X5 = Data_IPk$`Ekspresi Budaya`
> X6 = Data_IPk$`Budaya Literasi`
> X7 = Data_IPk$Gender
> 
> Data1 = data.frame(Data_IPk)
> Data1
   Ekonomi.budaya Pendidikan Ketahanan.Sosial.Budaya Warisan.Budaya
1           11.59      76.93                   54.28          42.19
2           11.27      68.55                   69.75          36.48
3           18.97      72.70                   58.13          52.31
4           26.35      74.27                   70.07          47.47
5           22.12      66.09                   69.70          49.35
6           18.30      64.21                   64.31          53.15
7           25.35      71.22                   73.15          50.85
8           18.57      73.00                   71.54          50.11
9           18.06      64.91                   69.48          50.14
10          14.64      73.61                   73.53          37.81
11          16.05      77.81                   66.81          43.70
12          24.44      67.21                   59.44          49.52
13          25.96      71.21                   72.37          50.12
14          56.79      80.68                   76.50          56.57
15          19.81      70.61                   66.54          49.82
16          12.24      65.78                   53.73          47.34
17          29.41      72.85                   76.75          54.67
18          47.97      71.61                   64.36          47.08
19           2.44      59.20                   75.80          39.88
20          12.43      53.02                   76.09          44.66
21          20.40      68.50                   75.69          53.49
22          19.05      69.14                   69.08          49.52
23          29.65      72.20                   72.46          37.44
24           9.69      71.40                   73.21          40.19
25          20.71      66.38                   78.31          28.74
26          13.74      64.12                   70.37          34.69
27          10.03      72.94                   69.79          44.20
28           7.27      65.56                   70.84          37.94
29           0.46      62.91                   62.99          40.11
30           7.03      61.22                   71.52          35.84
31          14.95      65.69                   78.75          47.51
32           8.10      63.33                   74.94          42.55
33          18.95      63.71                   74.72          25.07
34          19.38      45.21                   71.36          30.86
   Ekspresi.Budaya Budaya.Literasi Gender
1            32.86           59.40  54.33
2            23.22           55.66  58.79
3            24.50           61.17  60.10
4            22.31           56.39  59.20
5            25.67           53.88  54.63
6            15.30           55.41  60.01
7            21.94           53.22  58.39
8            20.14           50.20  57.18
9            14.68           55.75  51.75
10           22.74           66.78  56.53
11           15.00           67.11  58.23
12           21.79           56.60  55.69
13           34.79           50.00  58.28
14           41.11           56.20  64.61
15           34.39           50.81  56.15
16           22.05           56.58  52.97
17           52.99           62.99  60.33
18           31.43           54.22  48.18
19           30.50           47.32  63.75
20           24.25           50.91  55.70
21           24.56           52.19  65.64
22           24.02           52.43  57.53
23           24.33           60.09  55.88
24           22.63           52.79  52.02
25           35.37           48.01  66.13
26           28.24           51.09  62.78
27           20.46           54.85  61.69
28           22.14           59.82  58.62
29           24.63           61.21  66.05
30           21.88           47.61  53.97
31           39.49           47.81  64.85
32           29.62           48.26  60.35
33           33.52           47.42  56.94
34           33.93           27.36  55.53
> 
> Data = data.matrix(Data_IPk)

2.3 Statistika Deskriptif

> summary(Data1)
 Ekonomi.budaya    Pendidikan    Ketahanan.Sosial.Budaya Warisan.Budaya 
 Min.   : 0.46   Min.   :45.21   Min.   :53.73           Min.   :25.07  
 1st Qu.:11.75   1st Qu.:64.39   1st Qu.:67.38           1st Qu.:38.42  
 Median :18.43   Median :68.53   Median :71.10           Median :45.87  
 Mean   :18.59   Mean   :67.88   Mean   :69.89           Mean   :44.16  
 3rd Qu.:21.77   3rd Qu.:72.58   3rd Qu.:74.42           3rd Qu.:50.04  
 Max.   :56.79   Max.   :80.68   Max.   :78.75           Max.   :56.57  
 Ekspresi.Budaya Budaya.Literasi     Gender     
 Min.   :14.68   Min.   :27.36   Min.   :48.18  
 1st Qu.:22.07   1st Qu.:50.35   1st Qu.:55.69  
 Median :24.41   Median :54.05   Median :58.26  
 Mean   :26.96   Mean   :53.87   Mean   :58.32  
 3rd Qu.:32.50   3rd Qu.:56.59   3rd Qu.:60.34  
 Max.   :52.99   Max.   :67.11   Max.   :66.13

2.4 Asumsi Multikolinearitas

> library(lmtest)
> model <- lm(dataIPK$IPK ~ dataIPK$`Ekonomi budaya` + dataIPK$Pendidikan + dataIPK$`Ketahanan Sosial Budaya` + dataIPK$`Warisan Budaya` + dataIPK$`Ekspresi Budaya` + dataIPK$`Budaya Literasi`+ dataIPK$Gender, dataIPK)
> vif(model)
         dataIPK$`Ekonomi budaya`                dataIPK$Pendidikan 
                         2.025967                          2.822067 
dataIPK$`Ketahanan Sosial Budaya`          dataIPK$`Warisan Budaya` 
                         1.484292                          1.467377 
        dataIPK$`Ekspresi Budaya`         dataIPK$`Budaya Literasi` 
                         1.499341                          2.517359 
                   dataIPK$Gender 
                         1.420335

2.5 Metode Ward - Manhattan

> clust1 <- agnes(Data, method = "ward")
> 
> #compute distance matrix
> d1 <- dist(Data, method = "manhattan")
> 
> #perform hierarchical clustering using Ward's method
> final_clust1 <- hclust(d1, method = "ward.D2" )
> 
> #produce dendrogram
> print(plot(final_clust1))

NULL
> 
> #cut the dendrogram into 3 clusters
> cluster1 <- cutree(final_clust1, k=3)
> 
> #find number of observations in each cluster
> table(cluster1)
cluster1
 1  2  3 
23  2  9 
> 
> #append cluster labels to original data
> final_data1 <- cbind(Data, cluster = cluster1)
> 
> #display first six rows of final data
> head(final_data1)
     Ekonomi budaya Pendidikan Ketahanan Sosial Budaya Warisan Budaya
[1,]          11.59      76.93                   54.28          42.19
[2,]          11.27      68.55                   69.75          36.48
[3,]          18.97      72.70                   58.13          52.31
[4,]          26.35      74.27                   70.07          47.47
[5,]          22.12      66.09                   69.70          49.35
[6,]          18.30      64.21                   64.31          53.15
     Ekspresi Budaya Budaya Literasi Gender cluster
[1,]           32.86           59.40  54.33       1
[2,]           23.22           55.66  58.79       1
[3,]           24.50           61.17  60.10       1
[4,]           22.31           56.39  59.20       1
[5,]           25.67           53.88  54.63       1
[6,]           15.30           55.41  60.01       1
> 
> final_data1 = data.frame(final_data1)
> final_data1
   Ekonomi.budaya Pendidikan Ketahanan.Sosial.Budaya Warisan.Budaya
1           11.59      76.93                   54.28          42.19
2           11.27      68.55                   69.75          36.48
3           18.97      72.70                   58.13          52.31
4           26.35      74.27                   70.07          47.47
5           22.12      66.09                   69.70          49.35
6           18.30      64.21                   64.31          53.15
7           25.35      71.22                   73.15          50.85
8           18.57      73.00                   71.54          50.11
9           18.06      64.91                   69.48          50.14
10          14.64      73.61                   73.53          37.81
11          16.05      77.81                   66.81          43.70
12          24.44      67.21                   59.44          49.52
13          25.96      71.21                   72.37          50.12
14          56.79      80.68                   76.50          56.57
15          19.81      70.61                   66.54          49.82
16          12.24      65.78                   53.73          47.34
17          29.41      72.85                   76.75          54.67
18          47.97      71.61                   64.36          47.08
19           2.44      59.20                   75.80          39.88
20          12.43      53.02                   76.09          44.66
21          20.40      68.50                   75.69          53.49
22          19.05      69.14                   69.08          49.52
23          29.65      72.20                   72.46          37.44
24           9.69      71.40                   73.21          40.19
25          20.71      66.38                   78.31          28.74
26          13.74      64.12                   70.37          34.69
27          10.03      72.94                   69.79          44.20
28           7.27      65.56                   70.84          37.94
29           0.46      62.91                   62.99          40.11
30           7.03      61.22                   71.52          35.84
31          14.95      65.69                   78.75          47.51
32           8.10      63.33                   74.94          42.55
33          18.95      63.71                   74.72          25.07
34          19.38      45.21                   71.36          30.86
   Ekspresi.Budaya Budaya.Literasi Gender cluster
1            32.86           59.40  54.33       1
2            23.22           55.66  58.79       1
3            24.50           61.17  60.10       1
4            22.31           56.39  59.20       1
5            25.67           53.88  54.63       1
6            15.30           55.41  60.01       1
7            21.94           53.22  58.39       1
8            20.14           50.20  57.18       1
9            14.68           55.75  51.75       1
10           22.74           66.78  56.53       1
11           15.00           67.11  58.23       1
12           21.79           56.60  55.69       1
13           34.79           50.00  58.28       1
14           41.11           56.20  64.61       2
15           34.39           50.81  56.15       1
16           22.05           56.58  52.97       1
17           52.99           62.99  60.33       2
18           31.43           54.22  48.18       1
19           30.50           47.32  63.75       3
20           24.25           50.91  55.70       3
21           24.56           52.19  65.64       1
22           24.02           52.43  57.53       1
23           24.33           60.09  55.88       1
24           22.63           52.79  52.02       1
25           35.37           48.01  66.13       3
26           28.24           51.09  62.78       3
27           20.46           54.85  61.69       1
28           22.14           59.82  58.62       1
29           24.63           61.21  66.05       1
30           21.88           47.61  53.97       3
31           39.49           47.81  64.85       3
32           29.62           48.26  60.35       3
33           33.52           47.42  56.94       3
34           33.93           27.36  55.53       3
> 
> idclus1 <- final_data1$cluster
> idclus1
 [1] 1 1 1 1 1 1 1 1 1 1 1 1 1 2 1 1 2 1 3 3 1 1 1 1 3 3 1 1 1 3 3 3 3 3
> 
> #cluster 1 2 3
> c1_1 = subset(final_data1, cluster1 == 1, drop = FALSE)
> c2_1 = subset(final_data1, cluster1 == 2, drop = FALSE)
> c3_1 = subset(final_data1, cluster1 == 3, drop = FALSE)
> c1_1
   Ekonomi.budaya Pendidikan Ketahanan.Sosial.Budaya Warisan.Budaya
1           11.59      76.93                   54.28          42.19
2           11.27      68.55                   69.75          36.48
3           18.97      72.70                   58.13          52.31
4           26.35      74.27                   70.07          47.47
5           22.12      66.09                   69.70          49.35
6           18.30      64.21                   64.31          53.15
7           25.35      71.22                   73.15          50.85
8           18.57      73.00                   71.54          50.11
9           18.06      64.91                   69.48          50.14
10          14.64      73.61                   73.53          37.81
11          16.05      77.81                   66.81          43.70
12          24.44      67.21                   59.44          49.52
13          25.96      71.21                   72.37          50.12
15          19.81      70.61                   66.54          49.82
16          12.24      65.78                   53.73          47.34
18          47.97      71.61                   64.36          47.08
21          20.40      68.50                   75.69          53.49
22          19.05      69.14                   69.08          49.52
23          29.65      72.20                   72.46          37.44
24           9.69      71.40                   73.21          40.19
27          10.03      72.94                   69.79          44.20
28           7.27      65.56                   70.84          37.94
29           0.46      62.91                   62.99          40.11
   Ekspresi.Budaya Budaya.Literasi Gender cluster
1            32.86           59.40  54.33       1
2            23.22           55.66  58.79       1
3            24.50           61.17  60.10       1
4            22.31           56.39  59.20       1
5            25.67           53.88  54.63       1
6            15.30           55.41  60.01       1
7            21.94           53.22  58.39       1
8            20.14           50.20  57.18       1
9            14.68           55.75  51.75       1
10           22.74           66.78  56.53       1
11           15.00           67.11  58.23       1
12           21.79           56.60  55.69       1
13           34.79           50.00  58.28       1
15           34.39           50.81  56.15       1
16           22.05           56.58  52.97       1
18           31.43           54.22  48.18       1
21           24.56           52.19  65.64       1
22           24.02           52.43  57.53       1
23           24.33           60.09  55.88       1
24           22.63           52.79  52.02       1
27           20.46           54.85  61.69       1
28           22.14           59.82  58.62       1
29           24.63           61.21  66.05       1
> c2_1
   Ekonomi.budaya Pendidikan Ketahanan.Sosial.Budaya Warisan.Budaya
14          56.79      80.68                   76.50          56.57
17          29.41      72.85                   76.75          54.67
   Ekspresi.Budaya Budaya.Literasi Gender cluster
14           41.11           56.20  64.61       2
17           52.99           62.99  60.33       2
> c3_1
   Ekonomi.budaya Pendidikan Ketahanan.Sosial.Budaya Warisan.Budaya
19           2.44      59.20                   75.80          39.88
20          12.43      53.02                   76.09          44.66
25          20.71      66.38                   78.31          28.74
26          13.74      64.12                   70.37          34.69
30           7.03      61.22                   71.52          35.84
31          14.95      65.69                   78.75          47.51
32           8.10      63.33                   74.94          42.55
33          18.95      63.71                   74.72          25.07
34          19.38      45.21                   71.36          30.86
   Ekspresi.Budaya Budaya.Literasi Gender cluster
19           30.50           47.32  63.75       3
20           24.25           50.91  55.70       3
25           35.37           48.01  66.13       3
26           28.24           51.09  62.78       3
30           21.88           47.61  53.97       3
31           39.49           47.81  64.85       3
32           29.62           48.26  60.35       3
33           33.52           47.42  56.94       3
34           33.93           27.36  55.53       3
> 
> #simpangan baku tiap cluster
> sr1_1 = sd(as.matrix(c1_1))
> sr2_1 = sd(as.matrix(c2_1))
> sr3_1 = sd(as.matrix(c3_1))
> 
> #Rataan Per Cluster
> #Cluster 1
> avg1_1 = mean(as.matrix(c1_1))
> #Cluster 2
> avg2_1 = mean(as.matrix(c2_1))
> #Cluster 3
> avg3_1 = mean(as.matrix(c3_1))
> 
> #Rata-rata rataan 3 cluster
> miu_1 = (sum(avg1_1,avg2_1,avg3_1))/3
> 
> #Rasio Simpangan Baku
> sw1 = (sr1_1+sr2_1+sr3_1)/3
> sb1 <- sqrt(((avg1_1-miu_1)^2+(avg2_1-miu_1)^2+(avg3_1-miu_1)^2)/2)
> r1 <- sb1/sw1
> r1
[1] 0.2762403

2.6 Metode Average - Manhattan

> clust2 <- agnes(Data, method = "average")
> 
> #compute distance matrix
> d2 <- dist(Data, method = "manhattan")
> 
> #perform hierarchical clustering using Ward's method
> final_clust2 <- hclust(d2, method = "average" )
> 
> #dendogram
> print(plot(final_clust2))

NULL
> 
> #cut the dendrogram into 3 clusters
> cluster2 <- cutree(final_clust2, k=3)
> 
> #find number of observations in each cluster
> table(cluster2)
cluster2
 1  2  3 
31  2  1 
> 
> #append cluster labels to original data
> final_data2 <- cbind(Data, cluster = cluster2)
> 
> #display first six rows of final data
> head(final_data2)
     Ekonomi budaya Pendidikan Ketahanan Sosial Budaya Warisan Budaya
[1,]          11.59      76.93                   54.28          42.19
[2,]          11.27      68.55                   69.75          36.48
[3,]          18.97      72.70                   58.13          52.31
[4,]          26.35      74.27                   70.07          47.47
[5,]          22.12      66.09                   69.70          49.35
[6,]          18.30      64.21                   64.31          53.15
     Ekspresi Budaya Budaya Literasi Gender cluster
[1,]           32.86           59.40  54.33       1
[2,]           23.22           55.66  58.79       1
[3,]           24.50           61.17  60.10       1
[4,]           22.31           56.39  59.20       1
[5,]           25.67           53.88  54.63       1
[6,]           15.30           55.41  60.01       1
> 
> final_data2=data.frame(final_data2)
> 
> idclus2 <- final_data2$cluster
> 
> #cluster 1 2 3
> c1_2 = subset(final_data2, cluster2 == 1, drop = FALSE)
> c2_2 = subset(final_data2, cluster2 == 2, drop = FALSE)
> c3_2 = subset(final_data2, cluster2 == 3, drop = FALSE)
> c1_2
   Ekonomi.budaya Pendidikan Ketahanan.Sosial.Budaya Warisan.Budaya
1           11.59      76.93                   54.28          42.19
2           11.27      68.55                   69.75          36.48
3           18.97      72.70                   58.13          52.31
4           26.35      74.27                   70.07          47.47
5           22.12      66.09                   69.70          49.35
6           18.30      64.21                   64.31          53.15
7           25.35      71.22                   73.15          50.85
8           18.57      73.00                   71.54          50.11
9           18.06      64.91                   69.48          50.14
10          14.64      73.61                   73.53          37.81
11          16.05      77.81                   66.81          43.70
12          24.44      67.21                   59.44          49.52
13          25.96      71.21                   72.37          50.12
15          19.81      70.61                   66.54          49.82
16          12.24      65.78                   53.73          47.34
18          47.97      71.61                   64.36          47.08
19           2.44      59.20                   75.80          39.88
20          12.43      53.02                   76.09          44.66
21          20.40      68.50                   75.69          53.49
22          19.05      69.14                   69.08          49.52
23          29.65      72.20                   72.46          37.44
24           9.69      71.40                   73.21          40.19
25          20.71      66.38                   78.31          28.74
26          13.74      64.12                   70.37          34.69
27          10.03      72.94                   69.79          44.20
28           7.27      65.56                   70.84          37.94
29           0.46      62.91                   62.99          40.11
30           7.03      61.22                   71.52          35.84
31          14.95      65.69                   78.75          47.51
32           8.10      63.33                   74.94          42.55
33          18.95      63.71                   74.72          25.07
   Ekspresi.Budaya Budaya.Literasi Gender cluster
1            32.86           59.40  54.33       1
2            23.22           55.66  58.79       1
3            24.50           61.17  60.10       1
4            22.31           56.39  59.20       1
5            25.67           53.88  54.63       1
6            15.30           55.41  60.01       1
7            21.94           53.22  58.39       1
8            20.14           50.20  57.18       1
9            14.68           55.75  51.75       1
10           22.74           66.78  56.53       1
11           15.00           67.11  58.23       1
12           21.79           56.60  55.69       1
13           34.79           50.00  58.28       1
15           34.39           50.81  56.15       1
16           22.05           56.58  52.97       1
18           31.43           54.22  48.18       1
19           30.50           47.32  63.75       1
20           24.25           50.91  55.70       1
21           24.56           52.19  65.64       1
22           24.02           52.43  57.53       1
23           24.33           60.09  55.88       1
24           22.63           52.79  52.02       1
25           35.37           48.01  66.13       1
26           28.24           51.09  62.78       1
27           20.46           54.85  61.69       1
28           22.14           59.82  58.62       1
29           24.63           61.21  66.05       1
30           21.88           47.61  53.97       1
31           39.49           47.81  64.85       1
32           29.62           48.26  60.35       1
33           33.52           47.42  56.94       1
> c2_2
   Ekonomi.budaya Pendidikan Ketahanan.Sosial.Budaya Warisan.Budaya
14          56.79      80.68                   76.50          56.57
17          29.41      72.85                   76.75          54.67
   Ekspresi.Budaya Budaya.Literasi Gender cluster
14           41.11           56.20  64.61       2
17           52.99           62.99  60.33       2
> c3_2
   Ekonomi.budaya Pendidikan Ketahanan.Sosial.Budaya Warisan.Budaya
34          19.38      45.21                   71.36          30.86
   Ekspresi.Budaya Budaya.Literasi Gender cluster
34           33.93           27.36  55.53       3
> 
> #simpangan baku tiap cluster
> sr1_2 = sd(as.matrix(c1_2))
> sr2_2 = sd(as.matrix(c2_2))
> sr3_2 = sd(as.matrix(c3_2))
> 
> #Rataan Per Cluster
> #Cluster 1
> avg1_2 = mean(as.matrix(c1_2))
> #Cluster 2
> avg2_2 = mean(as.matrix(c2_2))
> #Cluster 3
> avg3_2 = mean(as.matrix(c3_2))
> 
> #Rata-rata rataan 3 cluster
> miu_2 = (avg1_2+avg2_2+avg3_2)/3
> 
> #Rasio Simpangan Baku
> sw2 = (sr1_2+sr2_2+sr3_2)/3
> sb2 <- sqrt(((avg1_2-miu_2)^2+(avg2_2-miu_2)^2+(avg3_2-miu_2)^2)/2)
> r2 <- sb2/sw2
> r2
[1] 0.3728611

2.7 Metode Complete - Manhattan

> clust3 <- agnes(Data, method = "complete")
> 
> #compute distance matrix
> d3 <- dist(Data, method = "manhattan")
> 
> #perform hierarchical clustering using Ward's method
> final_clust3 <- hclust(d3, method = "complete" )
> 
> #produce dendrogram
> plot(final_clust3)

> 
> #cut the dendrogram into 3 clusters
> cluster3 <- cutree(final_clust3, k=3)
> 
> #find number of observations in each cluster
> table(cluster3)
cluster3
 1  2  3 
22  3  9 
> 
> #append cluster labels to original data
> final_data3 <- cbind(Data, cluster = cluster3)
> 
> #display first six rows of final data
> head(final_data3)
     Ekonomi budaya Pendidikan Ketahanan Sosial Budaya Warisan Budaya
[1,]          11.59      76.93                   54.28          42.19
[2,]          11.27      68.55                   69.75          36.48
[3,]          18.97      72.70                   58.13          52.31
[4,]          26.35      74.27                   70.07          47.47
[5,]          22.12      66.09                   69.70          49.35
[6,]          18.30      64.21                   64.31          53.15
     Ekspresi Budaya Budaya Literasi Gender cluster
[1,]           32.86           59.40  54.33       1
[2,]           23.22           55.66  58.79       1
[3,]           24.50           61.17  60.10       1
[4,]           22.31           56.39  59.20       1
[5,]           25.67           53.88  54.63       1
[6,]           15.30           55.41  60.01       1
> 
> final_data3=data.frame(final_data3)
> 
> idclus3 <- final_data3$cluster
> 
> #cluster 1 2 3
> c1_3 = subset(final_data3, cluster3 == 1, drop = FALSE)
> c2_3 = subset(final_data3, cluster3 == 2, drop = FALSE)
> c3_3 = subset(final_data3, cluster3 == 3, drop = FALSE)
> c1_3
   Ekonomi.budaya Pendidikan Ketahanan.Sosial.Budaya Warisan.Budaya
1           11.59      76.93                   54.28          42.19
2           11.27      68.55                   69.75          36.48
3           18.97      72.70                   58.13          52.31
4           26.35      74.27                   70.07          47.47
5           22.12      66.09                   69.70          49.35
6           18.30      64.21                   64.31          53.15
7           25.35      71.22                   73.15          50.85
8           18.57      73.00                   71.54          50.11
9           18.06      64.91                   69.48          50.14
10          14.64      73.61                   73.53          37.81
11          16.05      77.81                   66.81          43.70
12          24.44      67.21                   59.44          49.52
13          25.96      71.21                   72.37          50.12
15          19.81      70.61                   66.54          49.82
16          12.24      65.78                   53.73          47.34
21          20.40      68.50                   75.69          53.49
22          19.05      69.14                   69.08          49.52
23          29.65      72.20                   72.46          37.44
24           9.69      71.40                   73.21          40.19
27          10.03      72.94                   69.79          44.20
28           7.27      65.56                   70.84          37.94
29           0.46      62.91                   62.99          40.11
   Ekspresi.Budaya Budaya.Literasi Gender cluster
1            32.86           59.40  54.33       1
2            23.22           55.66  58.79       1
3            24.50           61.17  60.10       1
4            22.31           56.39  59.20       1
5            25.67           53.88  54.63       1
6            15.30           55.41  60.01       1
7            21.94           53.22  58.39       1
8            20.14           50.20  57.18       1
9            14.68           55.75  51.75       1
10           22.74           66.78  56.53       1
11           15.00           67.11  58.23       1
12           21.79           56.60  55.69       1
13           34.79           50.00  58.28       1
15           34.39           50.81  56.15       1
16           22.05           56.58  52.97       1
21           24.56           52.19  65.64       1
22           24.02           52.43  57.53       1
23           24.33           60.09  55.88       1
24           22.63           52.79  52.02       1
27           20.46           54.85  61.69       1
28           22.14           59.82  58.62       1
29           24.63           61.21  66.05       1
> c2_3
   Ekonomi.budaya Pendidikan Ketahanan.Sosial.Budaya Warisan.Budaya
14          56.79      80.68                   76.50          56.57
17          29.41      72.85                   76.75          54.67
18          47.97      71.61                   64.36          47.08
   Ekspresi.Budaya Budaya.Literasi Gender cluster
14           41.11           56.20  64.61       2
17           52.99           62.99  60.33       2
18           31.43           54.22  48.18       2
> c3_3
   Ekonomi.budaya Pendidikan Ketahanan.Sosial.Budaya Warisan.Budaya
19           2.44      59.20                   75.80          39.88
20          12.43      53.02                   76.09          44.66
25          20.71      66.38                   78.31          28.74
26          13.74      64.12                   70.37          34.69
30           7.03      61.22                   71.52          35.84
31          14.95      65.69                   78.75          47.51
32           8.10      63.33                   74.94          42.55
33          18.95      63.71                   74.72          25.07
34          19.38      45.21                   71.36          30.86
   Ekspresi.Budaya Budaya.Literasi Gender cluster
19           30.50           47.32  63.75       3
20           24.25           50.91  55.70       3
25           35.37           48.01  66.13       3
26           28.24           51.09  62.78       3
30           21.88           47.61  53.97       3
31           39.49           47.81  64.85       3
32           29.62           48.26  60.35       3
33           33.52           47.42  56.94       3
34           33.93           27.36  55.53       3
> 
> #simpangan baku tiap cluster
> sr1_3 = sd(as.matrix(c1_3))
> sr2_3 = sd(as.matrix(c2_3))
> sr3_3 = sd(as.matrix(c3_3))
> 
> #Rataan Per Cluster
> #Cluster 1
> avg1_3 = mean(as.matrix(c1_3))
> #Cluster 2
> avg2_3 = mean(as.matrix(c2_3))
> #Cluster 3
> avg3_3 = mean(as.matrix(c3_3))
> 
> #Rata-rata rataan 3 cluster
> miu_3 = sum(avg1_3,avg2_3,avg3_3)/3
> 
> #Rasio Simpangan Baku
> sw3 = sum(sr1_3,sr2_3,sr3_3)/3
> sb3 <- sqrt(((avg1_3-miu_3)^2+(avg2_3-miu_3)^2+(avg3_3-miu_3)^2)/2)
> r3 <- sb3/sw3
> r3
[1] 0.2241806

2.8 Perbandingan Metode

> #Tabel Perbandingan Rasio
> rasio <- rbind(r1,r2,r3)
> rasio
        [,1]
r1 0.2762403
r2 0.3728611
r3 0.2241806
> 
> #Jumlah Anggota Kombinasi Cluster Terbaik
> table(cluster1)
cluster1
 1  2  3 
23  2  9 
> table(cluster2)
cluster2
 1  2  3 
31  2  1 
> table(cluster3)
cluster3
 1  2  3 
22  3  9 
> 
> # Profil cluster
> profil=Data_IPk %>% mutate(idclus3) %>% group_by(idclus3) %>% summarise_all("mean")
> pusatdata = data.frame(rowMeans(c1_1[1,]),rowMeans(c2_1[1,]),
+                        rowMeans(c3_1[1,]))
> names(pusatdata) = c("Cluster 1","Cluster 2","Cluster 3")
> profil
# A tibble: 3 × 8
  idclus3 `Ekonomi budaya` Pendidikan `Ketahanan Sosial Budaya` `Warisan Budaya`
    <dbl>            <dbl>      <dbl>                     <dbl>            <dbl>
1       1             17.3       70.0                      67.6             46.1
2       2             44.7       75.0                      72.5             52.8
3       3             13.1       60.2                      74.7             36.6
# ℹ 3 more variables: `Ekspresi Budaya` <dbl>, `Budaya Literasi` <dbl>,
#   Gender <dbl>
> pusatdata
  Cluster 1 Cluster 2 Cluster 3
1   41.5725   54.3075  40.23625

3 HASIL DAN PEMBAHASAN

3.1 Statistika Deskriptif

> summary(Data1)
 Ekonomi.budaya    Pendidikan    Ketahanan.Sosial.Budaya Warisan.Budaya 
 Min.   : 0.46   Min.   :45.21   Min.   :53.73           Min.   :25.07  
 1st Qu.:11.75   1st Qu.:64.39   1st Qu.:67.38           1st Qu.:38.42  
 Median :18.43   Median :68.53   Median :71.10           Median :45.87  
 Mean   :18.59   Mean   :67.88   Mean   :69.89           Mean   :44.16  
 3rd Qu.:21.77   3rd Qu.:72.58   3rd Qu.:74.42           3rd Qu.:50.04  
 Max.   :56.79   Max.   :80.68   Max.   :78.75           Max.   :56.57  
 Ekspresi.Budaya Budaya.Literasi     Gender     
 Min.   :14.68   Min.   :27.36   Min.   :48.18  
 1st Qu.:22.07   1st Qu.:50.35   1st Qu.:55.69  
 Median :24.41   Median :54.05   Median :58.26  
 Mean   :26.96   Mean   :53.87   Mean   :58.32  
 3rd Qu.:32.50   3rd Qu.:56.59   3rd Qu.:60.34  
 Max.   :52.99   Max.   :67.11   Max.   :66.13

Berdasarkan output tersebut dapat diketahui bahwa :

\1. Rata-rata indeks dimensi Ekonomi Budaya Indonesia sebesar 18,59

\2. Rata-rata indeks dimensi Pendidikan Indonesia sebesar 67,88

\3. Rata-rata indeks dimensi Ketahanan Sosial-Budaya Indonesia sebesar 69,89

\4. Rata-rata indeks dimensi Warisan Budaya Indonesia sebesar 44,16

\5. Rata-rata indeks dimensi Ekspresi Budaya Indonesia sebesar 26,96

\6. Rata-rata indeks dimensi Budaya Literasi Indonesia sebesar 53,87

\7. Rata-rata indeks dimensi Gender Indonesia sebesar 58,32

3.2 Asumsi Multikolinearitas

H0 : VIF Values < 10 Tidak terdapat multikolinearitas VS

H1 : VIF Values > 10 Terdapat multikolinearitas

> library(car)
> vif(model)
         dataIPK$`Ekonomi budaya`                dataIPK$Pendidikan 
                         2.025967                          2.822067 
dataIPK$`Ketahanan Sosial Budaya`          dataIPK$`Warisan Budaya` 
                         1.484292                          1.467377 
        dataIPK$`Ekspresi Budaya`         dataIPK$`Budaya Literasi` 
                         1.499341                          2.517359 
                   dataIPK$Gender 
                         1.420335

Berdasarkan output tersebut diketahui bahwa nilai VIF masing-masing variabel bernilai < 10, sehingga H0 diterima. Maka dapat disimpukan bahwa tidak terdapat mutikolinearitas antarvariabel.

3.3 Metode Ward - Manhattan

> clust1 <- agnes(Data, method = "ward")
> 
> #compute distance matrix
> d1 <- dist(Data, method = "manhattan")
> 
> #perform hierarchical clustering using Ward's method
> final_clust1 <- hclust(d1, method = "ward.D2" )
> 
> #produce dendrogram
> print(plot(final_clust1))

NULL
> 
> #cut the dendrogram into 3 clusters
> cluster1 <- cutree(final_clust1, k=3)
> 
> #find number of observations in each cluster
> table(cluster1)
cluster1
 1  2  3 
23  2  9 
> 
> #simpangan baku tiap cluster
> sr1_1 = sd(as.matrix(c1_1))
> sr2_1 = sd(as.matrix(c2_1))
> sr3_1 = sd(as.matrix(c3_1))
> 
> #Rataan Per Cluster
> #Cluster 1
> avg1_1 = mean(as.matrix(c1_1))
> #Cluster 2
> avg2_1 = mean(as.matrix(c2_1))
> #Cluster 3
> avg3_1 = mean(as.matrix(c3_1))
> 
> #Rata-rata rataan 3 cluster
> miu_1 = (sum(avg1_1,avg2_1,avg3_1))/3
> 
> #Rasio Simpangan Baku
> sw1 = (sr1_1+sr2_1+sr3_1)/3
> sb1 <- sqrt(((avg1_1-miu_1)^2+(avg2_1-miu_1)^2+(avg3_1-miu_1)^2)/2)
> r1 <- sb1/sw1
> r1
[1] 0.2762403

Berdasarkan gambar dendogram, maka akan dibentuk klaster sebanyak 3 klaster. Sehingga didapatkan anggota klaster 1 sebanyak 23 Provinsi, klaster 2 sebanak 2 Provinsi dan klaster 3 sebanyak 9 Provinsi. Ketiga klaster tersebut masing-masing dihitung rata-rata dan simpangan bakunya, kemudian dari hasil tersebut dihitung rasio simpangan baku ketiga klaster. Berdasarkan output diketahui bahwa rasio simpangan baku untuk metode Ward - Manhattan sebesar 0,276.

3.4 Metode Average - Manhattan

> clust2 <- agnes(Data, method = "average")
> 
> #compute distance matrix
> d2 <- dist(Data, method = "manhattan")
> 
> #perform hierarchical clustering using Ward's method
> final_clust2 <- hclust(d2, method = "average" )
> 
> #dendogram
> print(plot(final_clust2))

NULL
> 
> #cut the dendrogram into 3 clusters
> cluster2 <- cutree(final_clust2, k=3)
> 
> #find number of observations in each cluster
> table(cluster2)
cluster2
 1  2  3 
31  2  1 
> 
> #simpangan baku tiap cluster
> sr1_2 = sd(as.matrix(c1_2))
> sr2_2 = sd(as.matrix(c2_2))
> sr3_2 = sd(as.matrix(c3_2))
> 
> #Rataan Per Cluster
> #Cluster 1
> avg1_2 = mean(as.matrix(c1_2))
> #Cluster 2
> avg2_2 = mean(as.matrix(c2_2))
> #Cluster 3
> avg3_2 = mean(as.matrix(c3_2))
> 
> #Rata-rata rataan 3 cluster
> miu_2 = (avg1_2+avg2_2+avg3_2)/3
> 
> #Rasio Simpangan Baku
> sw2 = (sr1_2+sr2_2+sr3_2)/3
> sb2 <- sqrt(((avg1_2-miu_2)^2+(avg2_2-miu_2)^2+(avg3_2-miu_2)^2)/2)
> r2 <- sb2/sw2
> r2
[1] 0.3728611

Berdasarkan gambar dendogram, maka akan dibentuk klaster sebanyak 3 klaster. Sehingga didapatkan anggota klaster 1 sebanyak 31 Provinsi, klaster 2 sebanak 2 Provinsi dan klaster 3 sebanyak 1 Provinsi. Ketiga klaster tersebut masing-masing dihitung rata-rata dan simpangan bakunya, kemudian dari hasil tersebut dihitung rasio simpangan baku ketiga klaster. Berdasarkan output diketahui bahwa rasio simpangan baku untuk metode Ward - Manhattan sebesar 0,37.

3.5 Metode Complete - Manhattan

> clust3 <- agnes(Data, method = "complete")
> 
> #compute distance matrix
> d3 <- dist(Data, method = "manhattan")
> 
> #perform hierarchical clustering using Ward's method
> final_clust3 <- hclust(d3, method = "complete" )
> 
> #produce dendrogram
> plot(final_clust3)

> 
> #cut the dendrogram into 3 clusters
> cluster3 <- cutree(final_clust3, k=3)
> 
> #find number of observations in each cluster
> table(cluster3)
cluster3
 1  2  3 
22  3  9 
> 
> #simpangan baku tiap cluster
> sr1_3 = sd(as.matrix(c1_3))
> sr2_3 = sd(as.matrix(c2_3))
> sr3_3 = sd(as.matrix(c3_3))
> 
> #Rataan Per Cluster
> #Cluster 1
> avg1_3 = mean(as.matrix(c1_3))
> #Cluster 2
> avg2_3 = mean(as.matrix(c2_3))
> #Cluster 3
> avg3_3 = mean(as.matrix(c3_3))
> 
> #Rata-rata rataan 3 cluster
> miu_3 = sum(avg1_3,avg2_3,avg3_3)/3
> 
> #Rasio Simpangan Baku
> sw3 = sum(sr1_3,sr2_3,sr3_3)/3
> sb3 <- sqrt(((avg1_3-miu_3)^2+(avg2_3-miu_3)^2+(avg3_3-miu_3)^2)/2)
> r3 <- sb3/sw3
> r3
[1] 0.2241806

Berdasarkan gambar dendogram, maka akan dibentuk klaster sebanyak 3 klaster. Sehingga didapatkan anggota klaster 1 sebanyak 22 Provinsi, klaster 2 sebanak 3 Provinsi dan klaster 3 sebanyak 9 Provinsi. Ketiga klaster tersebut masing-masing dihitung rata-rata dan simpangan bakunya, kemudian dari hasil tersebut dihitung rasio simpangan baku ketiga klaster. Berdasarkan output diketahui bahwa rasio simpangan baku untuk metode Ward - Manhattan sebesar 0,224.

3.6 Perbandingan Metode

> #Tabel Perbandingan Rasio
> rasio <- rbind(r1,r2,r3)
> rasio
        [,1]
r1 0.2762403
r2 0.3728611
r3 0.2241806
> 
> #Jumlah Anggota Kombinasi Cluster Terbaik
> table(cluster2)
cluster2
 1  2  3 
31  2  1

Kombinasi metode terbaik dipilih berdasarkan rasio simpangan baku terbesar. Dari output di atas diketahui bahwa metode yangg menghasilkan nilai rasio simpangan baku terbesar adalah Average Linkage sebesar 0,37. Pada kombinasi ini, didapatkan hasil anggota klaster 1 sebanyak 31 Provinsi, anggota klaster 2 sebanyak 2 Provinsi, dan anggota klaster 3 sebanyak 1 Provinsi.

3.7 Penentuan Karakteristik

> # Profil cluster
> # Rata-rata variabel pada setiap klaster
> profil=Data_IPk %>% mutate(idclus3) %>% group_by(idclus3) %>% summarise_all("mean")
> 
> # Rata-rata masing-masing variabel
> pusatdata = data.frame(rowMeans(c1_1[1,]),rowMeans(c2_1[1,]),
+                        rowMeans(c3_1[1,]))
> names(pusatdata) = c("Cluster 1","Cluster 2","Cluster 3")
> 
> #Hasil
> profil
# A tibble: 3 × 8
  idclus3 `Ekonomi budaya` Pendidikan `Ketahanan Sosial Budaya` `Warisan Budaya`
    <dbl>            <dbl>      <dbl>                     <dbl>            <dbl>
1       1             17.3       70.0                      67.6             46.1
2       2             44.7       75.0                      72.5             52.8
3       3             13.1       60.2                      74.7             36.6
# ℹ 3 more variables: `Ekspresi Budaya` <dbl>, `Budaya Literasi` <dbl>,
#   Gender <dbl>
> pusatdata
  Cluster 1 Cluster 2 Cluster 3
1   41.5725   54.3075  40.23625

Karakteristik pada masing-masing klaster dapat diketahui dengan menghitung rata-rata setiap variabel di masing-masing klaster. Berdasarkan output di atas dapat diketahui klaster 3 memiliki nilai rata-rata paling kecil dibanding klaster lain dan klaster 2 memiliki nilai rata-rata paling besar dibanding klaster lain. Sehingga dapat disimpulkan bahwa klaster 2 merupakan klaster dengan anggota yang memiliki nilai IPK tinggi, klaster 1 merupakan klaster dengan anggota yang memiliki nilai IPK sedang, dan klaster 3 merupakan klaster dengan anggota yang memiliki nilai IPK rendah.

4 KESIMPULAN

Berdasarkan penerapan menggunakan 3 kombinasi metode pengukuran jarak Manhattan terhadap Metode Linkage (Average Linkage, Complete Linkage, dan Ward Linkage) pada data IPK berdasarkan 34 Provinsi di Indonesia, didapatkan hasil rasio simpangan baku terbesar pada metode Average Linkage sebesar 0,37. Sehingga dapat disimpulkan bahwa metode terbaik terdapat pada kombinasi Jarak Manhattan dengan metode Average Linkage. Pada kombinasi ini, dengan penetapan penelitian menggunakan tiga klaster, didapatkan hasil anggota klaster 1 sebanyak 31 Provinsi, anggota klaster 2 sebanyak 2 Provinsi, dan anggota klaster 3 sebanyak 1 Provinsi. Berdasarkan nilai rata-rata setiap variabel pada masing-masing klaster, dapat diketahui bahwa klaster 3 memiliki nilai rata-rata paling kecil dibanding klaster lain, maka klaster 3 merupakan klaster dengan anggota yang memiliki nilai IPK rendah. Klaster 2 memiliki nilai rata-rata paling besar dibanding klaster lain, maka klaster 2 merupakan klaster dengan anggota yang memiliki nilai IPK tinggi. Sedangkan klaster 1 merupakan klaster dengan anggota yang memiliki nilai IPK sedang.

5 SARAN

Penelitian ini masih memiliki banyak kekurangan sehingga diperlukan pengembangan untuk mencapai kinerja yang lebih baik. Penelitian selanjutnya dapat dikembangkan dengan menggunakan data terbaru dan mengkombinasikan ukuran jarak dan metode linkage lain, atau menggunakan metode non-hierarki untuk membandingkan metode mana yang paling optimal dalam pengelompokkan.

6 DAFTAR PUSTAKA

Fathia, dkk. 2016. ANALISIS KLASTER KECAMATAN DI KABUPATEN SEMARANG BERDASARKAN POTENSI DESA MENGGUNAKAN METODE WARD DAN SINGLE LINKAGE. Jurnal Gaussian. Vol. 5 No. 4

Goreti, M., Nasution, Y.N., & Wahyuningsih, S. (2016). Perbandingan Hasil Analisis Cluster dengan Menggunakan Metode Single Linkage dan Metode C-Means (Studi Kasus: Data Tingkat Kualitas Udara Ambien pada Perusahaan Perkebunan di Kabupaten Kutai Barat Tahun 2014). Jurnal EKSPONENSIAL Volume 7, Nomor 1.

Hair, Joseph F., Black, William C., Babin, Barry J. dan Anderson, Rolph E. 2010. Multivariate Data Analysis. Seventh edition. Boston: Pearson.

Johnson, R. & Wichern, D. 2001. Applied multivariate statistical analysis 6th edition. New Jersey: Pearson Education.

Johson, R. & Winchern, D. 2007. Applied Multivariate Statistical Analysis. New Jersey: Prentice Hall.

Kementerian Pendidikan Kebudayaan Riset dan Teknologi, Badan Pusat Statistik, & Badan Perencanaan Pembangunan Nasional. (2021). INDEKS PEMBANGUNAN KEBUDAYAAN TAHUN 2021. Retrieved from https://ipk.kemdikbud.go.id

Mattjik, A.A., Sumertajaya, I.M. 2011. Sidik Peubah Ganda dengan Menggunakan SAS. Wibawa GNA, Hadi AF, editor. Bogor(ID): IPB Press.

Paramadina, M., Sudarmin, & Aidid, M. K. (2019). Perbandingan Analisis Cluster Metode Average Linkage dan Metode Ward (Kasus: IPM Provinsi Sulawesi Selatan). Journal of Statistics and Its Application on Teaching and Research Vol. 1 No. 2, 22-31.

Wijaya, T., & Budiman, S. (2016). ANALISIS MULTIVARIAT UNTUK PENELITIAN MANAJEMEN. Yogyakarta: Percetakan Pohon Cahaya. Wutsqa, dkk. 2018. Analisis Data Multivariat Dengan Program R. Jurnal Pengabdian Masyarakat MIPA dan Pendidikan MIPA. Vol. 2 No. 2.

Wutsqa, dkk. 2018. Analisis Data Multivariat Dengan Program R. Jurnal Pengabdian Masyarakat MIPA dan Pendidikan MIPA. Vol. 2 No. 2.

Analisis Klaster dengan Jarak Manhattan Pada Data Indeks Pembangunan Kebudayaan

Delita Firnenti

11-09-2024