Penerapan Metode Hierarchical Clustering dalam Pengelompokan Kabupaten/Kota di Jawa Timur Berdasarkan Indikator Tingkat Pengangguran Terbuka

Alvina Az-Zahra Adiputri

09 November 2023

Library:

> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")
> # install.packages("psych")
> # install.packages("GPArotation")
> # install.packages("clValid")
> # install.packages("ggplot2")
> # install.packages("cluster")
> # install.packages("factoextra")
> # install.packages("tidyverse")
> # install.packages("car")
> # install.packages("readxl")

1 PENDAHULUAN

1.1 Latar Belakang

          Pertumbuhan ekonomi dari suatu negara dapat dilihat dari naik turunnya perekonomian pada negara yang bersangkutan, di mana saat perekonomian mengalami peningkatan artinya negara tersebut telah berkembang dengan baik, sebaliknya saat perekonomian menunjukkan adanya penurunan artinya negara tersebut tidak berkembang dengan baik, sehingga berujung pada munculnya permasalahan. Salah satu permasalahan pokok yang seringkali dialami oleh suatu negara, baik itu negara maju maupun negara berkembang adalah permasalahan terkait dengan ketenagakerjaan yang berbentuk pengangguran. Indonesia menjadi salah satu negara berkembang dengan tingkat pengangguran tertinggi kedua setelah Brunei Darussalam di Asia Tenggara pada tahun 2023. Tingkat pengangguran di Indonesia tercatat mencapai 5,45% pada Februari 2023, di mana angka ini lebih kecil dibandingkan negara Brunei Darussalam yang menempati posisi pertama dengan tingkat pengangguran mencapai 7,2% dan angka ini lebih besar dibandingkan denga negara Timor Leste yang memiliki tingkat pengangguran mencapai 4,9%. Badan Pusat Statistik (BPS) mencatat jumlah pengangguran di Indonesia menembus sebanyak 7,86 juta orang per Agustus 2023. Tingkat pengangguran di Indonesia yang terbilang tinggi menunjukkan bahwasannya pertumbuhan ekonomi di Indonesia belum dapat berkembang dengan baik. Umumnya, terjadinya pengangguran disebabkan oleh banyaknya jumlah angkatan kerja yang tidak sebanding dengan ketersediaan lapangan pekerjaan yang memadai.

          Jenis pengangguran yang terjadi di Indonesia salah satunya adalah pengangguran terbuka. Pengangguran terbuka merupakan golongan tenaga kerja produktif yang tidak bekerja sama sekali dan terdiri dari generasi muda yang baru menyelesaikan pendidikan menengah. Pengangguran terbuka adalah salah satu permasalahan yang masih menyebabkan berbagai macam dampak negatif bagi pertumbuhan perekonomian di Indonesia. Apabila pemerintahan tetap tidak melakukan tindakan untuk menanggulangi permasalahan pengangguran, dampak negatif yang akan terjadi adalah penurunan tingkat kesejahteraan masyarakat, produktivitas, dan pendapatan masyarakat. Dampak-dampak negatif tersebut juga akan memicu timbulnya permasalahan lain, yakni tingkat kriminalitas, kemiskinan, dan ketimpangan standar kehidupan yang semakin tinggi. Pengangguran terbuka tiap tahunnya pasti mengalami fluktuasi di Indonesia karena terdapat beberapa faktor yang memengaruhinya. Faktor-faktor tersebut adalah Jumlah Penduduk, Produk Domestik Regional Bruto (PDRB) per Kapita, dan Upah Minimum Kabupaten/Kota.         

          Pemerintah memberikan transparansi terkait data tingkat pengangguran terbuka di Indonesia melalui Badan Pusat Statistik (BPS). BPS menerbitkan data angka Tingkat Pengangguran Terbuka (TPT) masing-masing provinsi di Indonesia setiap bulan Februari dan Agustus. Melalui data TPT tersebut, masyarakat dapat mengetahui adanya perubahan TPT tiap tahunnya pada masing-masing provinsi. Selain itu, masyarakat juga dapat mengetahui bahwa data TPT bersifat sangat dinamis. Data TPT tidak hanya berisi informasi terkait angka tingkat pengangguran per tahunnya saja, tetapi apabila dilakukan pendalaman akan mendapatkan pola pada data TPT. Pola yang didapatkan tersebut digunakan untuk membantu pemerintah dan pihak-pihak yang terkait dalam penyusunan kebijakan dalam mengurangi tingkat pengangguran terbuka.

          Provinsi di Indonesia yang memiliki jumlah penduduk yang cukup banyak salah satunya adalah provinsi Jawa Timur. Data BPS mencatat pada tahun 2023 jumlah penduduk di Jawa Timur sebanyak 41 juta dengan jumlah TPT sebanyak 4,88% yang mana lebih sedikit dibandingkan dengan tahun 2022 yang mencapai 5,49%. Jumlah TPT di Jawa Timur beberapa tahun terakhir mengalami penurunan, hal ini dikarenakan pemerintah terus melakukan upaya pemulihan guna mengurangi peningkatan jumlah pengangguran di Indonesia. Jumlah TPT di provinsi Jawa Timur yang menunjukkan penurunan pada beberapa waktu terakhir tidak dapat dijadikan sebagai patokan bahwa tingkat pengangguran sudah dapat teratasi sepenuhnya, karena jumlah tersebut hanya diambil dari rata-rata seluruh kabupaten/kota yang ada di Jawa Timur. Belum diketahui secara pasti jumlah TPT tiap-tiap daerah di kabupaten/kota tersebut, sehingga pemerintah tetap perlu melakukan tindakan preventif guna mengurangi melonjaknya jumlah pengangguran pada tahun mendatang. Pemerintah perlu mengetahui secara pasti jumlah TPT pada masing-masing daerah di kabupaten/kota agar dapat memberikan tindakan yang tepat sasaran dan permasalahan pengangguran dapat teratasi secara merata.

         Upaya yang dapat dilakukan pemerintah untuk mengatasi pengangguran secara merata tanpa memakan banyak biaya, tepat sasaran, dan efisien secara waktu serta tenaga dapat dilakukan dengan menggunakan analisis cluster. Penggunaan analisis ini ditujukan untuk mengelompokkan kabupaten/kota yang memiliki karakteristik serupa karena pemerintah tidak mengetahui lebih jelas perbedaan TPT dari masing-masing kabupaten/kota yang ada di provinsi Jawa Timur. Analisis ini digunakan untuk menentukan penggolongan dari masing-masing kabupaten/kota di Provinsi Jawa Timur, sehingga pemerintah dapat mengetahui tinggi atau rendahnya TPT. Dengan begitu, pemerintah bisa lebih fokus pada daerah yang membutuhkan penanganan terlebih dahulu. Analisis cluster yang digunakan dalam penelitian ini adalah analisis cluster hierarki, karena metode ini sesuai dengan data yang TPT di Provinsi Jawa Timur, di mana tidak perlu menentukan jumlah cluster terlebih dahulu. Metode cluster hierarki dimulai dengan membentuk kelompok terkecil dan menggabungkannya dengan kelompok lain yang memiliki karakteristik yang serupa. Metode cluster hierarki ini memiliki beberapa bentuk analisis dalam pendekatan aglomeratif, yaitu single linkage, average linkage, complete linkage, ward method, dan centroid method. Dengan menggunakan metode ini, peneliti dapat memberikan beberapa informasi kepada pemerintah provinsi Jawa Timur terkait pengelompokan kabupaten/kota berdasarkan Tingkat Pengangguran Terbuka. Pemerintah provinsi Jawa Timur dapat lebih terarah dalam membuat kebijakan yang dapat menyelesaikan permasalahan pengangguran secara bertahap.

1.2 Data yang Digunakan

Data yang digunakan dalam melakukan analisis cluster untuk mengelompokkan Kabupaten/Kota yang ada di Provinsi Jawa Timur berdasarkan faktor-faktor yang memengaruhi Tingkat Pengangguran Terbuka, yaitu:

X1: Jumlah Penduduk (Jiwa)

X2: Produk Domestik Regional Bruto per Kapita (Milyar Rupiah)

X3: Upah Mimimum Kabupaten/Kota (Rupiah)

1.3 Tinjauan Pustaka Metode

1.3.1 Analisis Cluster

         Analisis cluster adalah analisis yang digunakan untuk mengelompokkan elemen yang mirip sebagai objek dalam penelitian yang kemudian menjadi kelompok (cluster) yang berbeda. Analisis cluster termasuk dalam analisis statistik multivariat dengan metode interdependen. Analisis cluster digunakan untuk meringkas data dengan mengelompokkan objek penelitian berdasarkan kesamaan karakteristik tertentu. Analisis cluster dibagi menjadi 2 metode, yaitu metode hierarki dan metode non-hierarki. Metode cluster hirarki ini merupakan metode pengelompokan yang jumlah clusternya belum diketahui, sedangkan metode cluster non-hirarki merupakan metode pengelompokan yang jumlah clusternya ditentukan terlebih dahulu sesuai dengan keinginan dari peneliti. Proses dari analisis cluster meliputi:

  1. Menentukan ukuran ketidakmiripan di antara kedua objek penelitian dengan mengukur seberapa jauh ada kesamaan antar objek. Jarak yang paling umum digunakan adalah jarak Euclidean dengan rumus perhitungan yaitu \(d_{ih} = \Sigma{(x_{ij}-x_{hj})^2}\), dengan \(d_{ih}\) adalah jarak kuadrat Euclidean antar objek ke-i dengan objek ke-h, \(x_{ij}\) adalah nilai dari objek ke-i pada variabel ke-j, dan \(x_{hj}\) adalah nilai dari objek ke-h pada variabel ke-j.

  2. Membuat cluster dengan dua tahap, yakni metode hierarki dan non-hierarki. Metode hierarki dimulai dengan mengelompokkan data yang memiliki kesamaan paling dekat, demikian seterusnya sampai membentuk semacam “pohon”, di mana ada hierarki yang jelas antar objek. Sedangkan, metode non-hierarki dimulai dengan menentukan jumlah cluster terlebih dahulu, kemudian menghitung jarak tiap objek, dan mengulangi langkah kedua sampai tidak terdapat pemindahan objek antar cluster.

  3. Setelah cluster terbentuk, langkah selanjutnya adalah interpretasi terhadap cluster yang terbentuk.

  4. Melakukan validasi cluster.

1.3.2 Asumsi-Asumsi Analisis Cluster

1.3.2.1 Uji Sampel Representatif

         Uji sampel representatif adalah uji yang dilakukan untuk memastikan bahwa sampel representatif. Sampel representatif adalah keadaan di mana sampel yang diambil dapat mewakili populasi yang ada. Salah satu uji yang dapat digunakan adalah dengan Uji Kaise Mayer Olkin (KMO). Jika nilai dari uji KMO sebesar 0.5 sampai 1, maka sampel yang diambil telah representatif atau mewakili populasi.

1.3.2.2 Uji Non-Multikolinieritas

         Uji non-multikolinieritas digunakan untuk memastikan bahwa tidak terjadi multikolinieritas antar variabel yang diteliti. Multikolinieritas adalah kondisi di mana terdapat korelasi yang tinggi atau sempurna dari beberapa atau bahkan semua variabel yang menjelaskan suatu model regresi. Dalam analisis regresi, jika terjadi multikolinieritas akan menyebabkan hasil yang tidak akurat dan tidak dapat diandalkan. Menurut Gujarati (1995), apabila nilai koefisien korelasi antar variabel independen lebih dari 0.8, maka dikatakan terjadi masalah multikolinieritas.

1.3.3 Metode Analisis Cluster Hierarki

         Pengelompokan hierarki (hierarchical clustering) adalah metode analisis cluster dengan cara membangun sebuah hierarki kelompok. Strategi yang dilalukan untuk mengelompokkan hierarki pada umumnya dibagi menjadi dua jenis, yaitu agglomerative (pemusatan) dan disisive (penyebaran). Berikut algoritma-algoritma pada pengelompokan hierarki dengan metode agglomerative:

  1. Single Linkage

    Pautan tunggal (single linkage) merupakan suatu prosedur pengelompokan agglomerative berdasarkan jarak terkecil antar objek. Algoritma pengelompokan dengan single linkage adalah \(d_{(UV)W} = min(d_{UW},d_{VW})\), dengan dUW adalah jarak tetangga terdekat dari cluster U dan W, sedangkan dVW adalah jarak tetangga terdekat dari cluster V dan W.

  2. Complete Linkage

    Pautan penuh (complete linkage) merupakan suatu prosedur pengelompokan agglomerative berdasarkan jarak terbesar antar objek. Algoritma pengelompokan dengan complete linkage adalah \(d_{(UV)W} = max(d_{UW},d_{VW})\), dengan \(d_{UW}\) adalah jarak tetangga terjauh dari cluster U dan W, sedangkan \(d_{VW}\) adalah jarak tetangga terjauh dari cluster V dan W.

  3. Average Linkage

    Pautan rata-rata (average linkage) merupakan suatu prosedur pengelompokan agglomerative berdasarkan rata-rata antar objek. Algoritma pengelompokan dengan average linkage adalah \(d_{(UV)W} = \frac{d_{(UW)}+d_{(VW)}}{n_{(UV)}n_{W}}\) , dengan \(n_{(UV)}\) adalah banyaknya anggota dalam cluster (UV) dan \(n_{W}\) adalah banyaknya anggota dalam cluster W.

  4. Ward Method

    Ward method digunakan untuk meminimumkan variasi antar objek yang berada pada satu cluster. Algoritma pengelompokan dengan ward adalah \(d_{(UV)W} = \frac{[(n_{W}+n_{U})d_{(UW)}+(n_{W}+n_{V})d_{(VW)}]-n_{W}d_{(UV)}}{n_{W}+n{(UV}}\)

    Langkah pembentukan cluster akan dilakukan secara berulang, sampai semua objek bergabung dalam jumlah cluster yang ditentukan.

  5. Centroid Method

    Centroid method adalah rata-rata semua objek dalam cluster. Jarak antar kedua cluster adalah jarak antar centroid cluster itu sendiri. Centroid cluster adalah nilai tengah dari observasi pada suatu variabel dalam suatu set. Algoritma pengelompokan dengan centroid adalah \(d_{(UV)W} = \frac{n_{U}d{(UW)}+n_{V}d_{(VW}}{n_{(UV)}} - \frac{n_{U}n_{V}d_{(UV)}}{n_{(UV)}^2}\)

    Pada saat objek digabungkan, maka centroid baru dihitung, sehingga setiap kali ada penambahan anggota centroid juga akan berubah.

1.3.4 Koefisien Korelasi Cophenetic

         Koefisien korelasi cophenetic merupakan koefisien korelasi antara elemen-elemen asli dari matriks ketidakmiripan dan elemen-elemen yang dihasilkan oleh dendrogram. Koefisien korelasi cophenetic dapat dihitung dengan rumus:

dengan,

\(r_{coph}\) = koefisien korelasi cophenetic

\(d_{ij}\) = jarak asli antara objek ke-i dan ke-j

\(\overline{d}\) = rata-rata \(d_{ij}\)

\(d_{coph~ij}\) = jarak cophenetic objek ke-i dan ke-j

\(d_{coph}\) = rata-rata dari \(d_{coph~ij}\)

Nilai koefisien korelasi cophenetic berada di antara -1 dan 1, apabila nilai koefisien korelasi cophenetic mendekati 1, berarti proses clustering yang dihasilkan dapat dikatakan cukup baik.

1.3.5 Validitas Cluster

         Validitas cluster merupakan prosedur yang dilakukan untuk mengevaluasi hasil analisis cluster secara kuantitatif dan objektif. Vadiliditas digunakan untuk mengetahui apakah hasil kelompok cluster yang terbentuk mampu menjelaskan dan mewakili populasi secara umum (Hair, 2010). Dalam analisis ini digunakan 3 indeks validitas, yaitu:

  1. Indeks Connectivity

    Semakin kecil nilai indeks connectivity, maka akan diindikasikan bahwa banyak cluster yang terbentuk lebih baik atau optimal (Halim & Widodo, 2017). Rumus perhitungan indeks connectivity adalah sebagai berikut:

    \(Conn(C) =\sum_{i=1}^{N} \sum_{j=1}^{L} X_{i,nni(j)}\)

    dengan,

    \(Conn(C)\) = indeks connectivity

    \(nni(j)\) = pengamatan tetangga terdekat i ke j dan L

    \(N\) = banyaknya pengamatan

    \(L\) = banyaknya cluster

  2. Indeks Silhoutte

    Indeks silhoutte adalah indeks yang mengukur derajat kepercayaan dalam proses clustering pada pengamatan tertentu dengan cluster yang dikatakan terbentuk baik apabila indeks mendekati 1 dan sebaliknya jika nilai indeks mendekati -1. Rumus perhitungan indeks silhoutte adalah sebagai berikut:

    \(S_{(i)}\) = \(\frac{b_{(i)}-a_{(i)}}{max(a_{(i)},b_{(i)})}\)

    dengan,

    \(S_{(i)}\) = indeks silhoutte

    \(a_{(i)}\) = rata-rata kemiripan antara objek ke-i dengan objek lain di dalam clusternya

    \(b_{(i)}\) = nilai minimum dari rata-rata kemiripan objek ke-i dengan objek lain di luar cluster

  3. Indeks Dunn

    Indeks dunn adalah rasio jarak terkecil antara observasi pada cluster yang berbeda dengan jarak terbesar pada masing-masing cluster data. Rumus perhitungan indeks dunn adalah sebagai berikut:

    \(C =\) \(\frac{d_{min}}{d_{max}}\)

    dengan,

    \(d_{min}\) = jarak terkecil di antara observasi pada cluster yang berbeda

    \(d_{max}\) = jarak terbesar pada masing-masing cluster

2 SOURCE CODE

2.1 Library yang Dibutuhkan

> # Library
> library(psych)
> library(GPArotation)
> library(clValid)
> library(ggplot2)
> library(cluster)
> library(factoextra)
> library(tidyverse)
> library(car)
> library(readxl)

Sebelum melakukan analisis cluster, tahap awal yang harus dilakukan adalah mengaktifkan packages yang dibutuhkan agar dapat melakukan proses analisis cluster dengan tepat. Kegunaan tiap packages tersebut, yaitu:

  1. Library psych digunakan untuk analisis faktor, analisis komponen utama, dan analisis reliabilitas.
  2. Library GPArotation digunakan untuk menyediakan alat-alat yang berfungsi dalam analisis faktor.
  3. Library clValid digunakan untuk validasi klaster (clustering) dalam analisis cluster.
  4. Library ggplot2 digunakan untuk visualisasi data dalam R.
  5. Library cluster digunakan untuk dasar analisis cluster.
  6. Library factoextra digunakan sebagai visualisasi dan interpretasi dari hasil analisis faktor dan analisis cluster.
  7. Library tidyverse digunakan untuk pemrosesan data agar mudah dibaca.
  8. Library car digunakan untuk analisis regresi linier, non-linier, dan uji hipotesis.
  9. Library readxl digunakan untuk membaca data dari file Excel.

2.2 Memanggil Data

> library(readxl)
> datapraktikum<-read_excel("D:/Data Praktikum 6.xlsx")
> datapraktikum<-data.frame(datapraktikum)
> datapraktikum
          Kabupaten.Kota      X1       X2      X3
1      Kabupaten Pacitan  592916  17986.5 1961155
2     Kabupaten Ponorogo  964253  23028.3 1954281
3   Kabupaten Trenggalek  739669  20882.3 1944933
4  Kabupaten Tulungagung 1105337  44133.5 2029359
5       Kabupaten Blitar 1240322  41379.3 2015071
6       Kabupaten Kediri 1656020  46665.0 2043423
7       Kabupaten Malang 2685900 117457.0 3068275
8     Kabupaten Lumajang 1137227  36663.7 2000607
9       Kabupaten Jember 2567718  88075.5 2355663
10  Kabupaten Banyuwangi 1731731  93299.0 2328899
11   Kabupaten Bondowoso  781417  22901.9 1958640
12   Kabupaten Situbondo  691260  23128.6 1942751
13 Kabupaten Probolinggo 1159965  38932.8 2553266
14    Kabupaten Pasuruan 1619035 172654.2 4365133
15    Kabupaten Sidoarjo 2103401 245222.5 4368582
16   Kabupaten Mojokerto 1133584  95738.1 4354787
17     Kabupaten Jombang 1335972  45930.4 2654096
18     Kabupaten Nganjuk 1117033  30819.8 1970006
19      Kabupaten Madiun  757665  21879.4 1958410
20     Kabupaten Magetan  678343  21194.7 1957329
21       Kabupaten Ngawi  877432  22455.0 1962586
22  Kabupaten Bojonegoro 1315125 100492.9 2079568
23       Kabupaten Tuban 1209543  75187.7 2539225
24    Kabupaten Lamongan 1371509  45441.1 2501977
25      Kabupaten Gresik 1332664 163907.9 4372031
26   Kabupaten Bangkalan 1086620  27164.2 1956773
27     Kabupaten Sampang  984162  23009.3 1922123
28   Kabupaten Pamekasan  857818  19263.4 1939686
29     Kabupaten Sumenep 1136632  40255.3 1978927
30           Kota Kediri  289418 152791.1 2118117
31           Kota Blitar  151960   7833.9 2039024
32           Kota Malang  846126  84807.4 2994144
33      Kota Probolinggo  243200  12931.4 2376241
34         Kota Pasuruan  211497   9452.8 2838838
35        Kota Mojokerto  134350   7637.0 2510452
36           Kota Madiun  199192  15825.6 1991106
37         Kota Surabaya 2887223 655616.2 4375479
38             Kota Batu  216735  18587.6 2830367

Menggunakan fungsi read_excel untuk membaca data dari file excel yang telah dibuat, melakukan konversi objek ‘datapraktikum’ menjadi data frame, dan menampilkan isi data frame.

2.3 Analisis Cluster

2.3.1 Statistika Deskriptif

> statdes <- summary(datapraktikum)
> statdes
 Kabupaten.Kota           X1                X2               X3         
 Length:38          Min.   : 134350   Min.   :  7637   Min.   :1922123  
 Class :character   1st Qu.: 703362   1st Qu.: 21366   1st Qu.:1961513  
 Mode  :character   Median :1095979   Median : 37798   Median :2061496  
                    Mean   :1082894   Mean   : 71859   Mean   :2502930  
                    3rd Qu.:1328279   3rd Qu.: 87259   3rd Qu.:2628888  
                    Max.   :2887223   Max.   :655616   Max.   :4375479  

Menggunakan fungsi summary untuk menghasilkan dan menampilkan statistik deskriptif dari data.

2.3.2 Uji Asumsi

2.3.2.1 Uji Sampel Representatif

> library(psych)
> library(GPArotation)
> ujikmo<-KMO(datapraktikum[,2:4])
> ujikmo
Kaiser-Meyer-Olkin factor adequacy
Call: KMO(r = datapraktikum[, 2:4])
Overall MSA =  0.65
MSA for each item = 
  X1   X2   X3 
0.70 0.60 0.68 

Memanggil packages berupa psych dan GPArotation dalam menggunakan fungsi KMO untuk menguji sampel representatif atau tidak.

2.3.2.2 Uji Non-Multikolinieritas

> ujikorelasi <- cor(datapraktikum[,2:4], method = 'pearson')
> ujikorelasi
          X1        X2        X3
X1 1.0000000 0.6421785 0.4549197
X2 0.6421785 1.0000000 0.6719079
X3 0.4549197 0.6719079 1.0000000

Menggunakan fungsi cor untuk melakukan uji non-multikolinieritas dengan metode pearson.

2.3.3 Standarisasi

> datastandarisasi<- scale(datapraktikum[,2:4])
> datastandarisasi
                X1          X2           X3
 [1,] -0.725752019 -0.48422521 -0.674132096
 [2,] -0.175730286 -0.43890750 -0.682684748
 [3,] -0.508382515 -0.45819660 -0.694317211
 [4,]  0.033242335 -0.24920555 -0.589265801
 [5,]  0.233181160 -0.27396140 -0.607043763
 [6,]  0.848910091 -0.22645142 -0.571765605
 [7,]  2.374361047  0.40985529  0.703461008
 [8,]  0.080477577 -0.31634709 -0.625041332
 [9,]  2.199310706  0.14576266 -0.183244565
[10,]  0.961052688  0.19271356 -0.216546820
[11,] -0.446545674 -0.44004363 -0.677261082
[12,] -0.580085583 -0.43800596 -0.697032242
[13,]  0.114156941 -0.29595152  0.062633425
[14,]  0.794128171  0.90598973  2.317144666
[15,]  1.511567657  1.55826253  2.321435843
[16,]  0.075081591  0.21463716  2.304271086
[17,]  0.374857262 -0.23305430  0.188096376
[18,]  0.050566367 -0.36887439 -0.663117977
[19,] -0.481726968 -0.44923427 -0.677547035
[20,] -0.599218152 -0.45538863 -0.678891977
[21,] -0.304328936 -0.44406055 -0.672351225
[22,]  0.343978833  0.25737520 -0.526790111
[23,]  0.187591523  0.02992198  0.045162084
[24,]  0.427494414 -0.23745232 -0.001185216
[25,]  0.369957476  0.82737450  2.325727020
[26,]  0.005518847 -0.40173238 -0.679583747
[27,] -0.146241217 -0.43907828 -0.722699469
[28,] -0.333381054 -0.47274792 -0.700845259
[29,]  0.079596267 -0.28406436 -0.652017789
[30,] -1.175291105  0.72745227 -0.478824035
[31,] -1.378892920 -0.57548082 -0.577238658
[32,] -0.350699161  0.11638767  0.611219134
[33,] -1.243748879 -0.52966246 -0.157639653
[34,] -1.290707138 -0.56092951  0.417971041
[35,] -1.404976728 -0.57725064  0.009360361
[36,] -1.308933217 -0.50364824 -0.636863962
[37,]  2.672559248  5.24704469  2.330018222
[38,] -1.282948649 -0.47882228  0.407431113
attr(,"scaled:center")
        X1         X2         X3 
1082894.05   71858.74 2502929.78 
attr(,"scaled:scale")
      X1       X2       X3 
675131.5 111254.5 803663.0 

Menggunakan fungsi scale untuk melakukan standarisasi terhadap data yang diubah ke dalam bentuk Z-score.

2.3.4 Jarak Euclidean

> jarak <- dist(datastandarisasi, method = "euclidean")
> jarak
            1          2          3          4          5          6          7
2  0.55195176                                                                  
3  0.21985092 0.33341399                                                       
4  0.79906755 0.29729360 0.58997503                                            
5  0.98400435 0.44736713 0.76907474 0.20224847                                 
6  1.59890181 1.05229680 1.38237764 0.81617271 0.61856597                      
7  3.50825366 3.02403111 3.31926325 2.75433125 2.60186074 2.08760383           
8  0.82498432 0.28980388 0.60965288 0.08954911 0.15949559 0.77550504 2.74848863
9  3.03213575 2.49641732 2.82091557 2.23890717 2.05461418 1.45364155 0.94161261
10 1.87428400 1.38148661 1.67665990 1.09318068 0.94872037 0.56076343 1.70029570
11 0.28269769 0.27087207 0.06666511 0.52379278 0.70323705 1.31717750 3.25364971
12 0.15452943 0.40461076 0.07454102 0.65071525 0.83451264 1.44999162 3.37772186
13 1.13301257 0.81238550 0.99340481 0.65856280 0.68052764 0.97321867 2.45302789
14 3.63186867 3.42758669 3.55337038 3.21879561 3.20278382 3.10342175 2.31241438
15 4.26037355 3.98251215 4.15223707 3.73156411 3.68338287 3.46337026 2.16358365
16 3.16237705 3.06788728 3.12804530 2.93077742 2.95626084 3.01080666 2.80844958
17 1.42051595 1.05061028 1.26864309 0.84926649 0.80869855 0.89563381 2.16262545
18 0.78491869 0.23769239 0.56690008 0.14168591 0.21330953 0.81607736 2.80606125
19 0.24654463 0.30621399 0.03274264 0.55946264 0.73944907 1.35329852 3.28670912
20 0.12986541 0.42382542 0.09217882 0.67123065 0.85496586 1.47002167 3.39141859
21 0.42333649 0.12911603 0.20571873 0.39852982 0.56755254 1.17789280 3.13008172
22 1.30996371 0.88272890 1.12544578 0.59756543 0.54866689 0.70076142 2.37891150
23 1.27119152 0.93891684 1.12670726 0.71009478 0.72096878 0.94003688 2.31509562
24 1.35784082 0.93215119 1.18533777 0.70810424 0.63730301 0.70941819 2.16929093
25 3.45253933 3.30934837 3.39777006 3.12563351 3.13572846 3.12016156 2.61222185
26 0.73592925 0.18504825 0.51720392 0.17941672 0.27095683 0.86813418 2.86057699
27 0.58329221 0.04970727 0.36375456 0.29337781 0.42965238 1.02874552 3.01795588
28 0.39344669 0.16226134 0.17572668 0.44365964 0.60770679 1.21455172 3.17536326
29 0.83014413 0.30018080 0.61467904 0.08544961 0.16035290 0.77563098 2.75405023
30 1.30705506 1.54954062 1.37730448 1.55775831 1.73293501 2.23963409 3.75482305
31 0.66656505 1.21547171 0.88614409 1.44938821 1.64030032 2.25498509 4.08631793
32 1.46749047 1.41885662 1.43507362 1.31233897 1.40621944 1.71931786 2.74236849
33 0.73290500 1.19355458 0.91317789 1.37683106 1.56482249 2.15468299 3.83600149
34 1.23196879 1.57146617 1.36373422 1.69249522 1.85882801 2.38105357 3.80219048
35 0.96807121 1.41743150 1.14595688 1.59199276 1.77637262 2.35388472 3.96730990
36 0.58469349 1.13597526 0.80389561 1.36690961 1.55941080 2.17654856 4.02462624
37 7.30895979 7.03698691 7.19824795 6.75995412 6.71255591 6.45795674 5.11204576
38 1.21666604 1.55430958 1.34693262 1.66687951 1.83569520 2.35952092 3.77535373
            8          9         10         11         12         13         14
2                                                                              
3                                                                              
4                                                                              
5                                                                              
6                                                                              
7                                                                              
8                                                                              
9  2.21318405                                                                  
10 1.09609445 1.23959524                                                       
11 0.54385774 2.75459204 1.61058140                                            
12 0.67551999 2.88614056 1.73314181 0.13501096                                 
13 0.68880102 2.14556138 1.01684196 0.93946466 1.03886673                      
14 3.26494455 2.96722589 2.63746455 3.50963576 3.57491962 2.64383142           
15 3.77411020 2.95661468 2.93413475 4.10117283 4.17986253 3.23929851 0.96963789
16 2.97705301 3.27182321 2.67206818 3.09681062 3.14054275 2.29938407 0.99757811
17 0.86878652 1.90000704 0.82984303 1.21094628 1.31809472 0.29607713 2.45072561
18 0.07143969 2.26102455 1.15922050 0.50237981 0.63533553 0.73217252 3.32567709
19 0.58007741 2.79039769 1.64506272 0.03636307 0.10089681 0.96251771 3.52599161
20 0.69585826 2.90496351 1.75164054 0.15345036 0.03157976 1.04124163 3.57365367
21 0.40819726 2.61826817 1.48809596 0.14235815 0.27692515 0.85864379 3.45923828
22 0.63893934 1.89016858 0.69369458 1.06487724 1.16894499 0.84048121 2.95149119
23 0.76193719 2.02795531 0.83260724 1.06999668 1.16582036 0.33450175 2.50943943
24 0.71822108 1.82190348 0.71840639 1.12341795 1.24082323 0.32507745 2.61084919
25 3.17788161 3.17900399 2.68613930 3.36020292 3.41186798 2.53946606 0.43147977
26 0.12603307 2.31491385 1.21688705 0.45369095 0.58698618 0.75754746 3.36339456
27 0.27568364 2.47682546 1.37166003 0.30372413 0.43460429 0.83966674 3.45458462
28 0.44887239 2.65800553 1.53393047 0.12013332 0.24916795 0.90246713 3.50434841
29 0.04207946 2.21307228 1.09266535 0.54935608 0.67889945 0.71558515 3.27760740
30 1.63946686 3.43710160 2.21781415 1.39050129 1.32671675 1.73297656 3.42460638
31 1.48296920 3.67137096 2.48908952 0.94742763 0.81935524 1.64826297 3.91078387
32 1.37895348 2.67106454 1.55296975 1.40676353 1.43926791 0.82889148 2.20097318
33 1.42040258 3.50877671 2.32087206 0.95580904 0.86011293 1.39536707 3.51263399
34 1.74006979 3.61124613 2.45784725 1.38807614 1.32790267 1.47313314 3.17887571
35 1.63618784 3.68113200 2.49839431 1.18695613 1.09490867 1.54587655 3.51595403
36 1.40202848 3.59656510 2.41131132 0.86567300 0.73426698 1.59925611 3.89051582
37 6.81194484 5.70644656 5.91274145 7.14951173 7.21543719 6.51239304 4.73005573
38 1.71794313 3.58680001 2.42401544 1.37026672 1.30977928 1.45059684 3.14308102
           15         16         17         18         19         20         21
2                                                                              
3                                                                              
4                                                                              
5                                                                              
6                                                                              
7                                                                              
8                                                                              
9                                                                              
10                                                                             
11                                                                             
12                                                                             
13                                                                             
14                                                                             
15                                                                             
16 1.96700686                                                                  
17 3.00866479 2.18368691                                                       
18 3.84134651 3.02431556 0.92096556                                            
19 4.12276184 3.10515706 1.23685441 0.53851843                                 
20 4.18475504 3.13095458 1.32284703 0.65570836 0.11765995                      
21 4.03355168 3.07215159 1.11632773 0.36288963 0.17754950 0.29517919           
22 3.34185018 2.84412373 0.86748905 0.70488631 1.09718488 1.19196804 0.96617965
23 3.04469373 2.26943862 0.35306542 0.82430279 1.09539327 1.17424449 0.99069194
24 3.12959666 2.37564906 0.19651344 0.77298221 1.15282281 1.24936839 1.01425647
25 1.35554031 0.68033755 2.38620997 3.23515324 3.37264753 3.40771448 3.32561008
26 3.88791482 3.04764500 0.95798328 0.05813818 0.48956007 0.60711309 0.31280926
27 4.00055751 3.10465431 1.06936363 0.21728268 0.33866292 0.45538251 0.16598643
28 4.08203654 3.10967269 1.16158158 0.39953558 0.15199411 0.26730629 0.04978856
29 3.77970064 2.99806062 0.89194893 0.09032547 0.58567620 0.70061633 0.41642621
30 3.96874175 3.09386969 1.94173007 1.65487853 1.38025840 1.33078917 1.47257263
31 4.61626872 3.32286423 1.94387071 1.44686396 0.91154084 0.79539190 1.08674074
32 2.91064976 1.74853285 0.90971132 1.42141773 1.41351148 1.43285607 1.40135837
33 4.25405869 2.89038064 1.68148614 1.39878987 0.92598584 0.83225023 1.07460017
34 3.99586001 2.45458965 1.71302343 1.73339356 1.36641304 1.30092443 1.47492473
35 4.29096035 2.84328580 1.82160004 1.61686532 1.15785149 1.06667170 1.30149754
36 4.57801692 3.32891969 1.89444742 1.36641589 0.82999167 0.71259443 1.00699543
37 3.86718101 5.66327455 6.31654562 6.88275077 7.17234720 7.23020150 7.08976477
38 3.95252452 2.43374896 1.69021598 1.71360036 1.34907717 1.28379686 1.45768132
           22         23         24         25         26         27         28
2                                                                              
3                                                                              
4                                                                              
5                                                                              
6                                                                              
7                                                                              
8                                                                              
9                                                                              
10                                                                             
11                                                                             
12                                                                             
13                                                                             
14                                                                             
15                                                                             
16                                                                             
17                                                                             
18                                                                             
19                                                                             
20                                                                             
21                                                                             
22                                                                             
23 0.63507580                                                                  
24 0.72669776 0.36220227                                                       
25 2.90902528 2.42284219 2.55962638                                            
26 0.75652090 0.86297883 0.81564446 3.26732491                                 
27 0.87392427 0.95969626 0.94361455 3.34114768 0.16212587                      
28 1.01103481 1.03952701 1.06010361 3.36825521 0.34691267 0.19139637           
29 0.61541605 0.77221122 0.73945172 3.19164066 0.14175017 0.28289183 0.45665729
30 1.59105447 1.61819622 1.93082913 3.20363610 1.64610892 1.57455150 1.48276312
31 1.91428349 1.79102450 1.92591174 3.66792727 1.39902072 1.24867719 1.05779379
32 1.34071624 0.78590951 1.05158313 1.99107648 1.43579655 1.45934380 1.43836492
33 1.81013249 1.55016084 1.70379544 3.25771508 1.35994911 1.23774842 1.06164079
34 2.05776443 1.63507154 1.79792826 2.88526045 1.70592264 1.62042562 1.47512682
35 2.01069719 1.70476215 1.86373941 3.23865986 1.57954057 1.46267504 1.28981787
36 1.82301705 1.72900058 1.86818860 3.65612374 1.31908910 1.16764280 0.97813622
37 6.20326061 6.21401654 6.36824411 4.98352064 6.93393762 7.04249358 7.13707490
38 2.01535333 1.59766954 1.77506119 2.84922935 1.68751078 1.60339593 1.45944922
           29         30         31         32         33         34         35
2                                                                              
3                                                                              
4                                                                              
5                                                                              
6                                                                              
7                                                                              
8                                                                              
9                                                                              
10                                                                             
11                                                                             
12                                                                             
13                                                                             
14                                                                             
15                                                                             
16                                                                             
17                                                                             
18                                                                             
19                                                                             
20                                                                             
21                                                                             
22                                                                             
23                                                                             
24                                                                             
25                                                                             
26                                                                             
27                                                                             
28                                                                             
29                                                                             
30 1.62108121                                                                  
31 1.48919649 1.32241211                                                       
32 1.39329951 1.49717932 1.71706038                                            
33 1.43386560 1.29930109 0.44320036 1.34389822                                 
34 1.76047205 1.57400440 0.99921510 1.17461414 0.57836872                      
35 1.65146487 1.41185310 0.58718132 1.39816640 0.23695582 0.42460170           
36 1.40586658 1.24837706 0.11665958 1.69126239 0.48433633 1.05654636 0.65745536
37 6.79773220 6.56675436 7.66604270 6.19822581 7.40920081 7.28669810 7.47891494
38 1.73692005 1.50071204 0.99404363 1.12467487 0.56870583 0.08314373 0.42783094
           36         37
2                       
3                       
4                       
5                       
6                       
7                       
8                       
9                       
10                      
11                      
12                      
13                      
14                      
15                      
16                      
17                      
18                      
19                      
20                      
21                      
22                      
23                      
24                      
25                      
26                      
27                      
28                      
29                      
30                      
31                      
32                      
33                      
34                      
35                      
36                      
37 7.59770632           
38 1.04491326 7.21996790

Menggunakan fungsi dist untuk menghitung jarak euclidean dengan data standarisasi yang telah didapatkan.

2.3.5 Koefisien Korelasi Cophenetic

> #Koefisien Korelasi Cophenetic
> d1 <- dist(datapraktikum[,2:4])
> #Single Linkage
> hiers <- hclust(dist(datapraktikum[,2:4]), method = "single")
> #korelasi cophenetic
> hc1 <- hclust(d1, "single")
> d2 <- cophenetic(hc1)
> cors <- cor(d1,d2)
> cors
[1] 0.9178036
> #Average Linkage
> hierave <- hclust(dist(datapraktikum[,2:4]), method = "ave")
> #korelasi cophenetic
> hc2 <- hclust(d1, "ave")
> d3 <- cophenetic(hc2)
> corave <- cor(d1,d3)
> corave
[1] 0.9366113
> #Complete Linkage
> hiercomp <- hclust(dist(datapraktikum[,2:4]), method = "complete")
> #korelasi cophenetic
> hc3 <- hclust(d1, "complete")
> d4 <- cophenetic(hc3)
> corcomp <- cor(d1,d4)
> corcomp
[1] 0.9175597
> #Centorid Linkage
> hiercen <- hclust(dist(datapraktikum[,2:4]), method = "centroid")
> #korelasi cophenetic
> hc4 <- hclust(d1, "centroid")
> d5 <- cophenetic(hc4)
> corcen <- cor(d1,d5)
> corcen
[1] 0.9317301
> #Ward
> hierward <- hclust(dist(datapraktikum[,2:4]), method = "ward.D")
> #korelasi cophenetic
> hc5 <- hclust(d1,"ward.D")
> d6 <- cophenetic(hc5)
> corward <- cor(d1,d6)
> corward
[1] 0.8911924
> 
> KorCop<-data.frame(cors,corave,corcomp,corcen,corward)
> KorCop
       cors    corave   corcomp    corcen   corward
1 0.9178036 0.9366113 0.9175597 0.9317301 0.8911924

Menentukan metode hierarki yang akan digunakan untuk menganalisis data yang telah dicari dengan membandingkan koefisien korelasi cophenetic dari berbagai metode penggabungan dalam analisis dendrogram. Fungsi yang digunakan dalam perintah tersebut adalah fungsi dist.

2.3.6 Indeks Validitas

> library(clValid)
> library(ggplot2)
> inval <- clValid(datastandarisasi, 2:4, clMethods = "hierarchical", validation = "internal", metric = "euclidean", method = "average")
> summary(inval)

Clustering Methods:
 hierarchical 

Cluster sizes:
 2 3 4 

Validation Measures:
                                 2       3       4
                                                  
hierarchical Connectivity   2.9290 10.2060 11.2528
             Dunn           0.8377  0.3789  0.4962
             Silhouette     0.7146  0.5946  0.5898

Optimal Scores:

             Score  Method       Clusters
Connectivity 2.9290 hierarchical 2       
Dunn         0.8377 hierarchical 2       
Silhouette   0.7146 hierarchical 2       
> optimalScores(inval)
                 Score       Method Clusters
Connectivity 2.9289683 hierarchical        2
Dunn         0.8377287 hierarchical        2
Silhouette   0.7146309 hierarchical        2
> plot(inval)

Memanggil packages berupa clValid dan ggplot2 dalam melakukan validasi cluster dengan fungsi clValid terhadap argumen data standarisasi. kemudian, menampilkan rangkuman terkait ukuran persebaran dan pemusatan data validasi dengan fungsi summary, menghitung skor optimal dengan fungsi optimalScores, dan menampilkan plot menggunakan fungsi plot.

2.3.7 Metode Average Linkage

> library(cluster)
> library(factoextra)
> library(tidyverse)
> library(car)
> dist_matrix <- dist(datapraktikum[,2:4])
> hclust_result <- hclust(dist_matrix, method = "average")
> dendrogram_object <- as.dendrogram(hclust_result)
> plot(dendrogram_object, main = "Cluster Dendrogram", xlab = "Kabupaten/Kota", ylab = "Jarak")

> clusterhier <- eclust(datapraktikum[,2:4], FUNcluster = "hclust", k = 2, hc_method = "average", graph = TRUE)
> fviz_dend(clusterhier, rect = TRUE, cex = 0.5)

> idclus = clusterhier$cluster
> idclus
 [1] 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 1 1 1 1 1 1 1 1 2 1 1 1 1 1 1 1 1 1 1 1 2 1
> aggregate(datapraktikum[,2:4], list(idclus), mean)
  Group.1        X1        X2      X3
1       1  971941.4  42348.28 2220464
2       2 1815181.4 266627.78 4367202

Memanggil packages cluster, factoextra, tidyverse, dan car dalam melakukan hierarchical clustering dengan fungsi hclust dan argumen data standarisasi yang telah didapatkan. Perintah ini digunakan untuk melakukan analisis klaster hierarki, menghasilkan visualisasi dendogram, dan menghitung rata-rata tiap variabel dalam setiap cluster yang dihasilkan.

3 HASIL DAN PEMBAHASAN

3.1 Hasil Analisis Statistika Deskriptif

Berdasarkan data yang telah ditentukan, didapatkan hasil analisis statistika deskriptif sebagai berikut:

Variabel Min Max Mean Median
Jumlah Penduduk (X1) 134350 2887223 1082894 1095979
Produk Domestik Regional Bruto (X2) 7637 655616 71859 37798
Upah Minimum Kabupaten/Kota (X3) 1922123 4375479 2502930 2061496

Berdasarkan hasil yang telah didapatkan, terdapat beberapa informasi yang dapat diambil yakni sebagai berikut.

  1. Rata-rata jumlah penduduk yang ada di Jawa Timur sebanyak 1082894 jiwa, di mana kota yang memiliki jumlah penduduk paling sedikit adalah Kota Mojokerto sebanyak 134350 jiwa. Sedangkan, kota yang memiliki jumlah penduduk yang padat dan paling banyak adalah Kota Surabaya sebanyak 2887223 jiwa.
  2. Rata-rata Produk Domestik Regional Bruto per kapita di Jawa Timur adalah sebesar 71859 milyar rupiah, di mana kota yang memiliki Produk Domestik Regional Bruto per kapita paling rendah adalah Kota Mojokerto sebesar 7637 milyar rupiah. Sedangkan, kota yang memiliki Produk Domestik Regional Bruto per kapita paling tinggi adalah Kota Surabaya sebesar 655616.2 milyar rupiah.
  3. Rata-rata Upah Minimum Kabupaten/Kota di Jawa Timur adalah sebesar 2502930 rupiah, di mana kabupaten yang memiliki Upah Minimum Kabupaten/Kota paling rendah adalah Kabupaten Sampang sebesar 1922122.97 rupiah. Sedangkan, kota yang memiliki Upah Minimum Kabupaten/Kota paling tinggi adalah Kota Surabaya sebesar 4375479.19 rupiah.

3.2 Pengujian Asumsi

3.2.1 Uji Sampel Representatif

Uji asumsi yang dilakukan adalah uji sampel representatif menggunakan uji Kaiser Mayer Olkin (KMO) yang digunakan untuk menguji apakah sampel yang digunakan dalam penelitian telah representatif atau mewakili populasi. Berikut tabel hasil uji KMO.

Jumlah Penduduk(X1) Produk Domestik Regional Bruto (X2) Upah Minimum Kabupaten/Kota (X3)
Uji KMO 0.70 0.60 0.68

Berdasarkan hasil uji KMO yang telah didapatkan, nilai uji KMO pada jumlah penduduk sebesar 0.70, nilai uji KMO pada Produk Domestik Regional Bruto per Kapita sebesar 0.60, dan nilai uji KMO pada Upah Minimum Kabupaten/Kota sebesar 0.68. Nilai uji KMO pada masing-masing variabel yang digunakan bernilai lebih dari 0.5, sehingga dapat disimpulkan bahwa sampel telah representatif atau mewakili populasi.

3.2.2 Uji Non-Multikolinieritas

Uji asumsi kedua yang dilakukan adalah uji non-multikolinieritas dengan melihat korelasi antar variabel. Apabila nilai dari korelasi lebih dari 0.8, maka dapat dikatakan bahwa terjadi multikolinieritas antar variabel. Berikut tabel korelasi antar variabel.

Jumlah Penduduk (X1) Produk Domestik Regional Bruto (X2) Upah Minimum Kabupaten/Kota (X3)
Jumlah Penduduk (X1) 1.0000000 0.6421785 0.4549197
Produk Domestik Regional Bruto (X2) 0.6421785 1.0000000 0.6719079
Upah Minimum Kabupaten/Kota (X3) 0.4549197 0.6719079 1.0000000

Berdasarkan hasil korelasi berikut, dapat diketahui bahwa antar variabel kurang dari 0.8, sehingga dapat disimpulkan bahwa tidak terjadi multikolinieritas antar variabel.

3.3 Hasil Koefisien Korelasi Cophenetic

Koefisien korelasi cophenetic digunakan untuk menentukan metode hierarki mana yang merupakan metode terbaik yang akan dipilih dalam penelitian ini. Berikut tabel koefisien korelasi cophenetic.

Metode Nilai Korelasi
Single Linkage 0.9178036
Average Linkage 0.9366113
Complete Linkage 0.9175597
Centroid Linkage 0.9317301
Ward’s Method 0.8911924

Berdasarkan nilai korelasi yang telah didapatkan, diketahui bahwa nilai korelasi yang paling mendekati 1 adalah metode average linkage. Dapat disimpulkan bahwa metode terbaik yang akan dipilih dalam proses analisis cluster adalah metode average linkage.

3.4 Analisis Cluster Menggunakan Metode Average Linkage

Metode average linkage merupakan metode analisis yang digunakan berdasarkan rata-rata jarak dari semua objek pengamatan dari satu cluster terhadap semua objek pengamatan cluster lain. Ukuran jarak yang digunakan dalam analisis ini adalah jarak Euclidean. Dalam memilih dan menentukan jumlah cluster yang optimal pada analisis ini adalah dengan menggunakan indeks validitas cluster, yaitu indeks connectivity, indeks dunn, dan indeks silhoutte. Berikut tabel yang menyajikan hasil penentuan jumlah cluster optimal dengan metode average linkage.

Indeks Nilai Jumlah Cluster
Connectivity 2.9289683 2
Dunn 0.8377287 2
Silhoutte 0.7146309 2

Berdasarkan tabel tersebut, diketahui bahwa indeks connectivity, indeks dunn, dan indeks silhoutte mendapatkan jumlah cluster optimum sebanyak 2 cluster. Sehingga didapatkan jumlah cluster sebanyak 2 yang digunakan sebagai cluster optimal pada metode pengelompokkan average linkage berdasarkan faktor-faktor yang dapat memengaruhi Tingkat Pengangguran Terbuka di Provinsi Jawa Timur pada tahun 2022.

3.5 Cluster Dendrogram

Hasil analisis cluster membentuk sebuah grafik cluster dendrogram seperti pada gambar berikut ini.

Berdasarkan grafik dendrogram tersebut, didapatkan bahwa hasil pengelompokan metode average linkage kabupaten/kota di Provinsi Jawa Timur berdasarkan faktor-faktor penyebab Tingkat Pengangguran Terbuka (TPT) terbentuk menjadi 2 cluster. Cluster pertama ditandai dengan grafik dendrogram yang berwarna biru dan terdiri dari 33 kabupaten/kota yang ada di Provinsi Jawa Timur, yakni Kabupaten Pacitan, Ponorogo, Trenggalek, Tulungagung, Blitar, Kediri, Malang, Lumajang, Jember, Banyuwangi, Bondowoso, Situbondo, Probolinggo, Jombang, Nganjuk, Madiun, Magetan, Ngawi, Bojonegoro, Tuban, Lamongan, Bangkalan, Sampang, Pamekasan, dan Sumenep, serta Kota Kediri, Blitar, Malang, Probolinggo, Pasuruan, Mojokerto, Madiun, dan Batu. Sedangkan, cluster kedua ditandai dengan grafik dendrogram yang berwarna merah dan terdiri dari 5 kabupaten/kota yang ada di Provinsi Jawa Timur, yakni Kabupaten Pasuruan, Sidoarjo, Mojokerto, Gresik, dan Kota Surabaya.

3.6 Interpretasi Hasil

Anggota cluster sudah terbentuk sesuai dengan jumlah cluster optimal yang telah ditentukan. Selanjutnya, memberikan ciri spesifik untuk menggambarkan isi dari cluster tersebut karena setiap cluster pastinya memiliki karakteristik yang berbeda berdasarkan faktor-faktor yang memengaruhi Tingkat Pengangguran Terbuka pada Kabupaten/Kota di Provinsi Jawa Timur. Karakteristik dari tiap cluster dapat ditentukan melalui nilai rata-rata tiap variabel. Berikut tabel yang disajikan untuk nilai rata-rata tiap variabel pada masing-masing cluster dengan menggunakan metode average linkage.

Cluster Jumlah Penduduk (X1) Produk Domestik Regional Bruto (X2) Upah Minimum Kabupaten/Kota (X3)
1 971941.4 42348.28 2220464
2 1815181.4 266627.78 4367202

Berdasarkan tabel berikut, dapat diketahui bahwa:

  1. Cluster 1 dengan variabel jumlah penduduk, produk domestik regional bruto, dan upah minimum kabupaten/kota memiliki karakteristik yang rendah.
  2. Cluster 2 dengan variabel jumlah penduduk, produk domestik regional bruto, dan upah minimum kabupaten/kota memiliki karakteristik yang lebih tinggi jika dibandingkan dengan cluster 1.
  3. Cluster 1 merupakan kelompok kabupaten/kota dengan faktor Tingkat Pengangguran Terbuka (TPT) yang rendah dan cluster 2 merupakan kelompok kabupaten/kota dengan faktor Tingkat Pengangguran Terbuka (TPT) yang tinggi.

4 PENUTUP

4.1 Kesimpulan

Berdasarkan hasil analisis data dan pembahasan yang telah dilakukan, dapat diambil beberapa kesimpulan yakni sebagai berikut:

  1. Kota Surabaya merupakan kota yang memiliki jumlah penduduk terbanyak dengan rata-rata produk domestik regional bruto per kapita serta upah minimum kabupaten/kota tertinggi di Provinsi Jawa Timur.
  2. Metode Hierarchical Clustering terbaik yang dapat dipilih untuk pengelompokan kabupaten/kota di Provinsi Jawa Timur menggunakan indikator Tingkat Pengangguran Terbuka adalah metode Average Linkage.
  3. Diperoleh bahwa kabupaten/kota di Provinsi Jawa Timur dapat dibagi menjadi 2 cluster, di mana sebanyak 86.84% kabupaten/kota masuk ke dalam cluster 1 dan sisanya sebanyak 13.16% kabupaten/kota masuk ke dalam cluster 2.
  4. Cluster pertama terdiri dari 33 kabupaten/kota yang memiliki Tingkat Pengangguran Terbuka yang relatif rendah dan cluster kedua terdiri dari 5 kabupaten/kota yang memiliki Tingkat Pengangguran Terbuka yang relatif tinggi. Tingkat Pengangguran Terbuka yang tinggi dapat disebabkan oleh jumlah penduduk yang relatif banyak, meningkatnya pertumbuhan produk domestik regional bruto, dan upah minimum kabupaten/kota yang semakin tinggi tiap tahunnya.

4.2 Saran

         Pemerintah Provinsi Jawa Timur dapat menggunakan hasil penelitian ini sebagai informasi untuk membuat kebijakan yang dapat mengatasi adanya peningkatan atau bahkan lonjakan Tingkat Pengangguran Terbuka di Provinsi Jawa Timur. Hal-hal yang perlu diperhatikan dalam pembuatan kebijakan atau upaya preventif adalah dengan memprioritaskan penanganan Kota Surabaya yang memiliki jumlah penduduk terbanyak, rata-rata produk domestik regional bruto terbesar dan upah minimum kabupaten/kota yang tergolong tinggi serta semakin meningkat per tahunnya. Selanjutnya, secara bertahap pemerintah dapat menangani Kabupaten Pasuruan, Kabupaten Gresik, Kabupaten Sidoarjo, dan Kabupaten Mojokerto agar lebih efektif.

4.3 Daftar Pustaka

Badan Pusat Statistik. (2022). PDRB Atas Dasar Harga Berlaku Menurut Kabupaten/Kota (Milyar Rupiah), 2020-2022. Pada https://jatim.bps.go.id/indicator/162/323/1/pdrb-adhb.html (diakses 08 November 2023).

Badan Pusat Statistik. (2023). Jumlah Penduduk Menurut Jenis Kelamin dan Kabupaten/Kota Provinsi Jawa Timur (Jiwa), 2021-2023. Pada https://jatim.bps.go.id/indicator/12/375/1/jumlah-penduduk-provinsi-jawa-timur.html (diakses 08 November 2023).

Badan Pusat Statistik. (2023). Tingkat Pengangguran Terbuka (TPT) dan Rata-rata Upah Buruh. Pada https://www.bps.go.id/pressrelease/2023/11/06/2002/tingkat-pengangguran-terbuka–tpt–sebesar-5-32-persen-dan-rata-rata-upah-buruh-sebesar-3-18-juta-rupiah-per-bulan.html (diakses 08 November 2023).

Badan Pusat Statistik. (2023). Tingkat Pengangguran Terbuka (TPT) Menurut Kabupaten/Kota (Persen) 2021-2023. Pada https://jatim.bps.go.id/indicator/6/54/1/tingkat-pengangguran-terbuka-tpt-provinsi-jawa-timur.html (diakses 08 November 2023).

Badan Pusat Statistik. (2023). Upah Minimum Kabupaten/Kota di Jawa Timur (Rupiah), 2021-2023. Pada https://probolinggokab.bps.go.id/indicator/19/288/1/upah-minimum-kabupaten-kota-di-jawa-timur.html (diakses 08 November 2023).

Dani, A., Wahyuningsih, S., & Rizki, N. (2019). Penerapan Hierarchical Clustering Metode Agglomerative pada Data Runtun Waktu. Jambura Journal of Mathematics, 1(2), 66-71. https://ejurnal.ung.ac.id/index.php/jjom/article/view/2354/1498

Gujarati, D. N. (1995). Ekonometrika Dasar. Jakarta: Erlangga.

Hair, J. F., dkk. (2006). Multivariate Data Analysis Sixth Edition. New Jersey: Pearson Education Inc.

Halim, N. N., & Widodo, E. (2017). Clustering Dampak Fempa Bumi di Indonesia Menggunakan Kohonen Self Organizing Maps (SOM). Prosiding SI MaNIs (Seminar Nasional Integrasi Matematika dan Nilai-Nilai Islami), 1(1): 188-194.

Pradita, H. (2022). Diakses pada 18 Mei 2022 dari https://rpubs.com/helvaaldha/PenerapanAnalisisCluster

Sitepu, R., Irmeilyana, & Gultom, B. (2011). Analisis Cluster terhadap Tingkat Pencemaran Udara pada Sektor Industri di Sumatera Selatan. Jurnal Penelitian Sains, 14(3A), 12-14. https://media.neliti.com/media/publications/168311-ID-analisis-cluster-terhadap-tingkat-pencem.pdf

Wahyuni, I. & Wulandari, S. (2022). Pemetaan Kabupaten/Kota di Jawa Timur Berdasarkan Indikator Kesejahteraan Rakyat Menggunakan Analisis Cluster Hierarki. Jurnal Sains dan Seni ITS, 11(1), 70-71.

Wahyuni, S. & Jatmiko, Y. (2018). Pengelompokan Kabupaten/Kota di Pulau Jawa Berdasarkan Faktor-Faktor Kemiskinan dengan Pendekatan Average Linkage Hierarchical Clustering. Jurnal Aplikasi Statistika & Komputasi Statistik V, 10(1), 2-3.