Library:
> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")
> # install.packages("psych")
> # install.packages("GPArotation")
> # install.packages("clValid")
> # install.packages("ggplot2")
> # install.packages("cluster")
> # install.packages("factoextra")
> # install.packages("tidyverse")
> # install.packages("car")
> # install.packages("readxl")1 PENDAHULUAN
1.1 Latar Belakang
Pertumbuhan ekonomi dari suatu negara dapat dilihat dari naik turunnya perekonomian pada negara yang bersangkutan, di mana saat perekonomian mengalami peningkatan artinya negara tersebut telah berkembang dengan baik, sebaliknya saat perekonomian menunjukkan adanya penurunan artinya negara tersebut tidak berkembang dengan baik, sehingga berujung pada munculnya permasalahan. Salah satu permasalahan pokok yang seringkali dialami oleh suatu negara, baik itu negara maju maupun negara berkembang adalah permasalahan terkait dengan ketenagakerjaan yang berbentuk pengangguran. Indonesia menjadi salah satu negara berkembang dengan tingkat pengangguran tertinggi kedua setelah Brunei Darussalam di Asia Tenggara pada tahun 2023. Tingkat pengangguran di Indonesia tercatat mencapai 5,45% pada Februari 2023, di mana angka ini lebih kecil dibandingkan negara Brunei Darussalam yang menempati posisi pertama dengan tingkat pengangguran mencapai 7,2% dan angka ini lebih besar dibandingkan denga negara Timor Leste yang memiliki tingkat pengangguran mencapai 4,9%. Badan Pusat Statistik (BPS) mencatat jumlah pengangguran di Indonesia menembus sebanyak 7,86 juta orang per Agustus 2023. Tingkat pengangguran di Indonesia yang terbilang tinggi menunjukkan bahwasannya pertumbuhan ekonomi di Indonesia belum dapat berkembang dengan baik. Umumnya, terjadinya pengangguran disebabkan oleh banyaknya jumlah angkatan kerja yang tidak sebanding dengan ketersediaan lapangan pekerjaan yang memadai.
Jenis pengangguran yang terjadi di Indonesia salah satunya adalah pengangguran terbuka. Pengangguran terbuka merupakan golongan tenaga kerja produktif yang tidak bekerja sama sekali dan terdiri dari generasi muda yang baru menyelesaikan pendidikan menengah. Pengangguran terbuka adalah salah satu permasalahan yang masih menyebabkan berbagai macam dampak negatif bagi pertumbuhan perekonomian di Indonesia. Apabila pemerintahan tetap tidak melakukan tindakan untuk menanggulangi permasalahan pengangguran, dampak negatif yang akan terjadi adalah penurunan tingkat kesejahteraan masyarakat, produktivitas, dan pendapatan masyarakat. Dampak-dampak negatif tersebut juga akan memicu timbulnya permasalahan lain, yakni tingkat kriminalitas, kemiskinan, dan ketimpangan standar kehidupan yang semakin tinggi. Pengangguran terbuka tiap tahunnya pasti mengalami fluktuasi di Indonesia karena terdapat beberapa faktor yang memengaruhinya. Faktor-faktor tersebut adalah Jumlah Penduduk, Produk Domestik Regional Bruto (PDRB) per Kapita, dan Upah Minimum Kabupaten/Kota.
Pemerintah memberikan transparansi terkait data tingkat pengangguran terbuka di Indonesia melalui Badan Pusat Statistik (BPS). BPS menerbitkan data angka Tingkat Pengangguran Terbuka (TPT) masing-masing provinsi di Indonesia setiap bulan Februari dan Agustus. Melalui data TPT tersebut, masyarakat dapat mengetahui adanya perubahan TPT tiap tahunnya pada masing-masing provinsi. Selain itu, masyarakat juga dapat mengetahui bahwa data TPT bersifat sangat dinamis. Data TPT tidak hanya berisi informasi terkait angka tingkat pengangguran per tahunnya saja, tetapi apabila dilakukan pendalaman akan mendapatkan pola pada data TPT. Pola yang didapatkan tersebut digunakan untuk membantu pemerintah dan pihak-pihak yang terkait dalam penyusunan kebijakan dalam mengurangi tingkat pengangguran terbuka.
Provinsi di Indonesia yang memiliki jumlah penduduk yang cukup banyak salah satunya adalah provinsi Jawa Timur. Data BPS mencatat pada tahun 2023 jumlah penduduk di Jawa Timur sebanyak 41 juta dengan jumlah TPT sebanyak 4,88% yang mana lebih sedikit dibandingkan dengan tahun 2022 yang mencapai 5,49%. Jumlah TPT di Jawa Timur beberapa tahun terakhir mengalami penurunan, hal ini dikarenakan pemerintah terus melakukan upaya pemulihan guna mengurangi peningkatan jumlah pengangguran di Indonesia. Jumlah TPT di provinsi Jawa Timur yang menunjukkan penurunan pada beberapa waktu terakhir tidak dapat dijadikan sebagai patokan bahwa tingkat pengangguran sudah dapat teratasi sepenuhnya, karena jumlah tersebut hanya diambil dari rata-rata seluruh kabupaten/kota yang ada di Jawa Timur. Belum diketahui secara pasti jumlah TPT tiap-tiap daerah di kabupaten/kota tersebut, sehingga pemerintah tetap perlu melakukan tindakan preventif guna mengurangi melonjaknya jumlah pengangguran pada tahun mendatang. Pemerintah perlu mengetahui secara pasti jumlah TPT pada masing-masing daerah di kabupaten/kota agar dapat memberikan tindakan yang tepat sasaran dan permasalahan pengangguran dapat teratasi secara merata.
Upaya yang dapat dilakukan pemerintah untuk mengatasi pengangguran secara merata tanpa memakan banyak biaya, tepat sasaran, dan efisien secara waktu serta tenaga dapat dilakukan dengan menggunakan analisis cluster. Penggunaan analisis ini ditujukan untuk mengelompokkan kabupaten/kota yang memiliki karakteristik serupa karena pemerintah tidak mengetahui lebih jelas perbedaan TPT dari masing-masing kabupaten/kota yang ada di provinsi Jawa Timur. Analisis ini digunakan untuk menentukan penggolongan dari masing-masing kabupaten/kota di Provinsi Jawa Timur, sehingga pemerintah dapat mengetahui tinggi atau rendahnya TPT. Dengan begitu, pemerintah bisa lebih fokus pada daerah yang membutuhkan penanganan terlebih dahulu. Analisis cluster yang digunakan dalam penelitian ini adalah analisis cluster hierarki, karena metode ini sesuai dengan data yang TPT di Provinsi Jawa Timur, di mana tidak perlu menentukan jumlah cluster terlebih dahulu. Metode cluster hierarki dimulai dengan membentuk kelompok terkecil dan menggabungkannya dengan kelompok lain yang memiliki karakteristik yang serupa. Metode cluster hierarki ini memiliki beberapa bentuk analisis dalam pendekatan aglomeratif, yaitu single linkage, average linkage, complete linkage, ward method, dan centroid method. Dengan menggunakan metode ini, peneliti dapat memberikan beberapa informasi kepada pemerintah provinsi Jawa Timur terkait pengelompokan kabupaten/kota berdasarkan Tingkat Pengangguran Terbuka. Pemerintah provinsi Jawa Timur dapat lebih terarah dalam membuat kebijakan yang dapat menyelesaikan permasalahan pengangguran secara bertahap.
1.2 Data yang Digunakan
Data yang digunakan dalam melakukan analisis cluster untuk mengelompokkan Kabupaten/Kota yang ada di Provinsi Jawa Timur berdasarkan faktor-faktor yang memengaruhi Tingkat Pengangguran Terbuka, yaitu:
X1: Jumlah Penduduk (Jiwa)
X2: Produk Domestik Regional Bruto per Kapita (Milyar Rupiah)
X3: Upah Mimimum Kabupaten/Kota (Rupiah)
1.3 Tinjauan Pustaka Metode
1.3.1 Analisis Cluster
Analisis cluster adalah analisis yang digunakan untuk mengelompokkan elemen yang mirip sebagai objek dalam penelitian yang kemudian menjadi kelompok (cluster) yang berbeda. Analisis cluster termasuk dalam analisis statistik multivariat dengan metode interdependen. Analisis cluster digunakan untuk meringkas data dengan mengelompokkan objek penelitian berdasarkan kesamaan karakteristik tertentu. Analisis cluster dibagi menjadi 2 metode, yaitu metode hierarki dan metode non-hierarki. Metode cluster hirarki ini merupakan metode pengelompokan yang jumlah clusternya belum diketahui, sedangkan metode cluster non-hirarki merupakan metode pengelompokan yang jumlah clusternya ditentukan terlebih dahulu sesuai dengan keinginan dari peneliti. Proses dari analisis cluster meliputi:
Menentukan ukuran ketidakmiripan di antara kedua objek penelitian dengan mengukur seberapa jauh ada kesamaan antar objek. Jarak yang paling umum digunakan adalah jarak Euclidean dengan rumus perhitungan yaitu \(d_{ih} = \Sigma{(x_{ij}-x_{hj})^2}\), dengan \(d_{ih}\) adalah jarak kuadrat Euclidean antar objek ke-i dengan objek ke-h, \(x_{ij}\) adalah nilai dari objek ke-i pada variabel ke-j, dan \(x_{hj}\) adalah nilai dari objek ke-h pada variabel ke-j.
Membuat cluster dengan dua tahap, yakni metode hierarki dan non-hierarki. Metode hierarki dimulai dengan mengelompokkan data yang memiliki kesamaan paling dekat, demikian seterusnya sampai membentuk semacam “pohon”, di mana ada hierarki yang jelas antar objek. Sedangkan, metode non-hierarki dimulai dengan menentukan jumlah cluster terlebih dahulu, kemudian menghitung jarak tiap objek, dan mengulangi langkah kedua sampai tidak terdapat pemindahan objek antar cluster.
Setelah cluster terbentuk, langkah selanjutnya adalah interpretasi terhadap cluster yang terbentuk.
Melakukan validasi cluster.
1.3.2 Asumsi-Asumsi Analisis Cluster
1.3.2.1 Uji Sampel Representatif
Uji sampel representatif adalah uji yang dilakukan untuk memastikan bahwa sampel representatif. Sampel representatif adalah keadaan di mana sampel yang diambil dapat mewakili populasi yang ada. Salah satu uji yang dapat digunakan adalah dengan Uji Kaise Mayer Olkin (KMO). Jika nilai dari uji KMO sebesar 0.5 sampai 1, maka sampel yang diambil telah representatif atau mewakili populasi.
1.3.2.2 Uji Non-Multikolinieritas
Uji non-multikolinieritas digunakan untuk memastikan bahwa tidak terjadi multikolinieritas antar variabel yang diteliti. Multikolinieritas adalah kondisi di mana terdapat korelasi yang tinggi atau sempurna dari beberapa atau bahkan semua variabel yang menjelaskan suatu model regresi. Dalam analisis regresi, jika terjadi multikolinieritas akan menyebabkan hasil yang tidak akurat dan tidak dapat diandalkan. Menurut Gujarati (1995), apabila nilai koefisien korelasi antar variabel independen lebih dari 0.8, maka dikatakan terjadi masalah multikolinieritas.
1.3.3 Metode Analisis Cluster Hierarki
Pengelompokan hierarki (hierarchical clustering) adalah metode analisis cluster dengan cara membangun sebuah hierarki kelompok. Strategi yang dilalukan untuk mengelompokkan hierarki pada umumnya dibagi menjadi dua jenis, yaitu agglomerative (pemusatan) dan disisive (penyebaran). Berikut algoritma-algoritma pada pengelompokan hierarki dengan metode agglomerative:
Single Linkage
Pautan tunggal (single linkage) merupakan suatu prosedur pengelompokan agglomerative berdasarkan jarak terkecil antar objek. Algoritma pengelompokan dengan single linkage adalah \(d_{(UV)W} = min(d_{UW},d_{VW})\), dengan dUW adalah jarak tetangga terdekat dari cluster U dan W, sedangkan dVW adalah jarak tetangga terdekat dari cluster V dan W.
Complete Linkage
Pautan penuh (complete linkage) merupakan suatu prosedur pengelompokan agglomerative berdasarkan jarak terbesar antar objek. Algoritma pengelompokan dengan complete linkage adalah \(d_{(UV)W} = max(d_{UW},d_{VW})\), dengan \(d_{UW}\) adalah jarak tetangga terjauh dari cluster U dan W, sedangkan \(d_{VW}\) adalah jarak tetangga terjauh dari cluster V dan W.
Average Linkage
Pautan rata-rata (average linkage) merupakan suatu prosedur pengelompokan agglomerative berdasarkan rata-rata antar objek. Algoritma pengelompokan dengan average linkage adalah \(d_{(UV)W} = \frac{d_{(UW)}+d_{(VW)}}{n_{(UV)}n_{W}}\) , dengan \(n_{(UV)}\) adalah banyaknya anggota dalam cluster (UV) dan \(n_{W}\) adalah banyaknya anggota dalam cluster W.
Ward Method
Ward method digunakan untuk meminimumkan variasi antar objek yang berada pada satu cluster. Algoritma pengelompokan dengan ward adalah \(d_{(UV)W} = \frac{[(n_{W}+n_{U})d_{(UW)}+(n_{W}+n_{V})d_{(VW)}]-n_{W}d_{(UV)}}{n_{W}+n{(UV}}\)
Langkah pembentukan cluster akan dilakukan secara berulang, sampai semua objek bergabung dalam jumlah cluster yang ditentukan.
Centroid Method
Centroid method adalah rata-rata semua objek dalam cluster. Jarak antar kedua cluster adalah jarak antar centroid cluster itu sendiri. Centroid cluster adalah nilai tengah dari observasi pada suatu variabel dalam suatu set. Algoritma pengelompokan dengan centroid adalah \(d_{(UV)W} = \frac{n_{U}d{(UW)}+n_{V}d_{(VW}}{n_{(UV)}} - \frac{n_{U}n_{V}d_{(UV)}}{n_{(UV)}^2}\)
Pada saat objek digabungkan, maka centroid baru dihitung, sehingga setiap kali ada penambahan anggota centroid juga akan berubah.
1.3.4 Koefisien Korelasi Cophenetic
Koefisien korelasi cophenetic merupakan koefisien korelasi antara elemen-elemen asli dari matriks ketidakmiripan dan elemen-elemen yang dihasilkan oleh dendrogram. Koefisien korelasi cophenetic dapat dihitung dengan rumus:
dengan,
\(r_{coph}\) = koefisien korelasi cophenetic
\(d_{ij}\) = jarak asli antara objek ke-i dan ke-j
\(\overline{d}\) = rata-rata \(d_{ij}\)
\(d_{coph~ij}\) = jarak cophenetic objek ke-i dan ke-j
\(d_{coph}\) = rata-rata dari \(d_{coph~ij}\)
Nilai koefisien korelasi cophenetic berada di antara -1 dan 1, apabila nilai koefisien korelasi cophenetic mendekati 1, berarti proses clustering yang dihasilkan dapat dikatakan cukup baik.
1.3.5 Validitas Cluster
Validitas cluster merupakan prosedur yang dilakukan untuk mengevaluasi hasil analisis cluster secara kuantitatif dan objektif. Vadiliditas digunakan untuk mengetahui apakah hasil kelompok cluster yang terbentuk mampu menjelaskan dan mewakili populasi secara umum (Hair, 2010). Dalam analisis ini digunakan 3 indeks validitas, yaitu:
Indeks Connectivity
Semakin kecil nilai indeks connectivity, maka akan diindikasikan bahwa banyak cluster yang terbentuk lebih baik atau optimal (Halim & Widodo, 2017). Rumus perhitungan indeks connectivity adalah sebagai berikut:
\(Conn(C) =\sum_{i=1}^{N} \sum_{j=1}^{L} X_{i,nni(j)}\)
dengan,
\(Conn(C)\) = indeks connectivity
\(nni(j)\) = pengamatan tetangga terdekat i ke j dan L
\(N\) = banyaknya pengamatan
\(L\) = banyaknya cluster
Indeks Silhoutte
Indeks silhoutte adalah indeks yang mengukur derajat kepercayaan dalam proses clustering pada pengamatan tertentu dengan cluster yang dikatakan terbentuk baik apabila indeks mendekati 1 dan sebaliknya jika nilai indeks mendekati -1. Rumus perhitungan indeks silhoutte adalah sebagai berikut:
\(S_{(i)}\) = \(\frac{b_{(i)}-a_{(i)}}{max(a_{(i)},b_{(i)})}\)
dengan,
\(S_{(i)}\) = indeks silhoutte
\(a_{(i)}\) = rata-rata kemiripan antara objek ke-i dengan objek lain di dalam clusternya
\(b_{(i)}\) = nilai minimum dari rata-rata kemiripan objek ke-i dengan objek lain di luar cluster
Indeks Dunn
Indeks dunn adalah rasio jarak terkecil antara observasi pada cluster yang berbeda dengan jarak terbesar pada masing-masing cluster data. Rumus perhitungan indeks dunn adalah sebagai berikut:
\(C =\) \(\frac{d_{min}}{d_{max}}\)
dengan,
\(d_{min}\) = jarak terkecil di antara observasi pada cluster yang berbeda
\(d_{max}\) = jarak terbesar pada masing-masing cluster
2 SOURCE CODE
2.1 Library yang Dibutuhkan
> # Library
> library(psych)
> library(GPArotation)
> library(clValid)
> library(ggplot2)
> library(cluster)
> library(factoextra)
> library(tidyverse)
> library(car)
> library(readxl)Sebelum melakukan analisis cluster, tahap awal yang harus dilakukan adalah mengaktifkan packages yang dibutuhkan agar dapat melakukan proses analisis cluster dengan tepat. Kegunaan tiap packages tersebut, yaitu:
- Library
psychdigunakan untuk analisis faktor, analisis komponen utama, dan analisis reliabilitas. - Library
GPArotationdigunakan untuk menyediakan alat-alat yang berfungsi dalam analisis faktor. - Library
clValiddigunakan untuk validasi klaster (clustering) dalam analisis cluster. - Library
ggplot2digunakan untuk visualisasi data dalam R. - Library
clusterdigunakan untuk dasar analisis cluster. - Library
factoextradigunakan sebagai visualisasi dan interpretasi dari hasil analisis faktor dan analisis cluster. - Library
tidyversedigunakan untuk pemrosesan data agar mudah dibaca. - Library
cardigunakan untuk analisis regresi linier, non-linier, dan uji hipotesis. - Library
readxldigunakan untuk membaca data dari file Excel.
2.2 Memanggil Data
> library(readxl)
> datapraktikum<-read_excel("D:/Data Praktikum 6.xlsx")
> datapraktikum<-data.frame(datapraktikum)
> datapraktikum
Kabupaten.Kota X1 X2 X3
1 Kabupaten Pacitan 592916 17986.5 1961155
2 Kabupaten Ponorogo 964253 23028.3 1954281
3 Kabupaten Trenggalek 739669 20882.3 1944933
4 Kabupaten Tulungagung 1105337 44133.5 2029359
5 Kabupaten Blitar 1240322 41379.3 2015071
6 Kabupaten Kediri 1656020 46665.0 2043423
7 Kabupaten Malang 2685900 117457.0 3068275
8 Kabupaten Lumajang 1137227 36663.7 2000607
9 Kabupaten Jember 2567718 88075.5 2355663
10 Kabupaten Banyuwangi 1731731 93299.0 2328899
11 Kabupaten Bondowoso 781417 22901.9 1958640
12 Kabupaten Situbondo 691260 23128.6 1942751
13 Kabupaten Probolinggo 1159965 38932.8 2553266
14 Kabupaten Pasuruan 1619035 172654.2 4365133
15 Kabupaten Sidoarjo 2103401 245222.5 4368582
16 Kabupaten Mojokerto 1133584 95738.1 4354787
17 Kabupaten Jombang 1335972 45930.4 2654096
18 Kabupaten Nganjuk 1117033 30819.8 1970006
19 Kabupaten Madiun 757665 21879.4 1958410
20 Kabupaten Magetan 678343 21194.7 1957329
21 Kabupaten Ngawi 877432 22455.0 1962586
22 Kabupaten Bojonegoro 1315125 100492.9 2079568
23 Kabupaten Tuban 1209543 75187.7 2539225
24 Kabupaten Lamongan 1371509 45441.1 2501977
25 Kabupaten Gresik 1332664 163907.9 4372031
26 Kabupaten Bangkalan 1086620 27164.2 1956773
27 Kabupaten Sampang 984162 23009.3 1922123
28 Kabupaten Pamekasan 857818 19263.4 1939686
29 Kabupaten Sumenep 1136632 40255.3 1978927
30 Kota Kediri 289418 152791.1 2118117
31 Kota Blitar 151960 7833.9 2039024
32 Kota Malang 846126 84807.4 2994144
33 Kota Probolinggo 243200 12931.4 2376241
34 Kota Pasuruan 211497 9452.8 2838838
35 Kota Mojokerto 134350 7637.0 2510452
36 Kota Madiun 199192 15825.6 1991106
37 Kota Surabaya 2887223 655616.2 4375479
38 Kota Batu 216735 18587.6 2830367Menggunakan fungsi read_excel untuk membaca data dari
file excel yang telah dibuat, melakukan konversi objek ‘datapraktikum’
menjadi data frame, dan menampilkan isi data frame.
2.3 Analisis Cluster
2.3.1 Statistika Deskriptif
> statdes <- summary(datapraktikum)
> statdes
Kabupaten.Kota X1 X2 X3
Length:38 Min. : 134350 Min. : 7637 Min. :1922123
Class :character 1st Qu.: 703362 1st Qu.: 21366 1st Qu.:1961513
Mode :character Median :1095979 Median : 37798 Median :2061496
Mean :1082894 Mean : 71859 Mean :2502930
3rd Qu.:1328279 3rd Qu.: 87259 3rd Qu.:2628888
Max. :2887223 Max. :655616 Max. :4375479 Menggunakan fungsi summary untuk menghasilkan dan
menampilkan statistik deskriptif dari data.
2.3.2 Uji Asumsi
2.3.2.1 Uji Sampel Representatif
> library(psych)
> library(GPArotation)
> ujikmo<-KMO(datapraktikum[,2:4])
> ujikmo
Kaiser-Meyer-Olkin factor adequacy
Call: KMO(r = datapraktikum[, 2:4])
Overall MSA = 0.65
MSA for each item =
X1 X2 X3
0.70 0.60 0.68 Memanggil packages berupa psych dan
GPArotation dalam menggunakan fungsi KMO untuk
menguji sampel representatif atau tidak.
2.3.2.2 Uji Non-Multikolinieritas
> ujikorelasi <- cor(datapraktikum[,2:4], method = 'pearson')
> ujikorelasi
X1 X2 X3
X1 1.0000000 0.6421785 0.4549197
X2 0.6421785 1.0000000 0.6719079
X3 0.4549197 0.6719079 1.0000000Menggunakan fungsi cor untuk melakukan uji
non-multikolinieritas dengan metode pearson.
2.3.3 Standarisasi
> datastandarisasi<- scale(datapraktikum[,2:4])
> datastandarisasi
X1 X2 X3
[1,] -0.725752019 -0.48422521 -0.674132096
[2,] -0.175730286 -0.43890750 -0.682684748
[3,] -0.508382515 -0.45819660 -0.694317211
[4,] 0.033242335 -0.24920555 -0.589265801
[5,] 0.233181160 -0.27396140 -0.607043763
[6,] 0.848910091 -0.22645142 -0.571765605
[7,] 2.374361047 0.40985529 0.703461008
[8,] 0.080477577 -0.31634709 -0.625041332
[9,] 2.199310706 0.14576266 -0.183244565
[10,] 0.961052688 0.19271356 -0.216546820
[11,] -0.446545674 -0.44004363 -0.677261082
[12,] -0.580085583 -0.43800596 -0.697032242
[13,] 0.114156941 -0.29595152 0.062633425
[14,] 0.794128171 0.90598973 2.317144666
[15,] 1.511567657 1.55826253 2.321435843
[16,] 0.075081591 0.21463716 2.304271086
[17,] 0.374857262 -0.23305430 0.188096376
[18,] 0.050566367 -0.36887439 -0.663117977
[19,] -0.481726968 -0.44923427 -0.677547035
[20,] -0.599218152 -0.45538863 -0.678891977
[21,] -0.304328936 -0.44406055 -0.672351225
[22,] 0.343978833 0.25737520 -0.526790111
[23,] 0.187591523 0.02992198 0.045162084
[24,] 0.427494414 -0.23745232 -0.001185216
[25,] 0.369957476 0.82737450 2.325727020
[26,] 0.005518847 -0.40173238 -0.679583747
[27,] -0.146241217 -0.43907828 -0.722699469
[28,] -0.333381054 -0.47274792 -0.700845259
[29,] 0.079596267 -0.28406436 -0.652017789
[30,] -1.175291105 0.72745227 -0.478824035
[31,] -1.378892920 -0.57548082 -0.577238658
[32,] -0.350699161 0.11638767 0.611219134
[33,] -1.243748879 -0.52966246 -0.157639653
[34,] -1.290707138 -0.56092951 0.417971041
[35,] -1.404976728 -0.57725064 0.009360361
[36,] -1.308933217 -0.50364824 -0.636863962
[37,] 2.672559248 5.24704469 2.330018222
[38,] -1.282948649 -0.47882228 0.407431113
attr(,"scaled:center")
X1 X2 X3
1082894.05 71858.74 2502929.78
attr(,"scaled:scale")
X1 X2 X3
675131.5 111254.5 803663.0 Menggunakan fungsi scale untuk melakukan standarisasi
terhadap data yang diubah ke dalam bentuk Z-score.
2.3.4 Jarak Euclidean
> jarak <- dist(datastandarisasi, method = "euclidean")
> jarak
1 2 3 4 5 6 7
2 0.55195176
3 0.21985092 0.33341399
4 0.79906755 0.29729360 0.58997503
5 0.98400435 0.44736713 0.76907474 0.20224847
6 1.59890181 1.05229680 1.38237764 0.81617271 0.61856597
7 3.50825366 3.02403111 3.31926325 2.75433125 2.60186074 2.08760383
8 0.82498432 0.28980388 0.60965288 0.08954911 0.15949559 0.77550504 2.74848863
9 3.03213575 2.49641732 2.82091557 2.23890717 2.05461418 1.45364155 0.94161261
10 1.87428400 1.38148661 1.67665990 1.09318068 0.94872037 0.56076343 1.70029570
11 0.28269769 0.27087207 0.06666511 0.52379278 0.70323705 1.31717750 3.25364971
12 0.15452943 0.40461076 0.07454102 0.65071525 0.83451264 1.44999162 3.37772186
13 1.13301257 0.81238550 0.99340481 0.65856280 0.68052764 0.97321867 2.45302789
14 3.63186867 3.42758669 3.55337038 3.21879561 3.20278382 3.10342175 2.31241438
15 4.26037355 3.98251215 4.15223707 3.73156411 3.68338287 3.46337026 2.16358365
16 3.16237705 3.06788728 3.12804530 2.93077742 2.95626084 3.01080666 2.80844958
17 1.42051595 1.05061028 1.26864309 0.84926649 0.80869855 0.89563381 2.16262545
18 0.78491869 0.23769239 0.56690008 0.14168591 0.21330953 0.81607736 2.80606125
19 0.24654463 0.30621399 0.03274264 0.55946264 0.73944907 1.35329852 3.28670912
20 0.12986541 0.42382542 0.09217882 0.67123065 0.85496586 1.47002167 3.39141859
21 0.42333649 0.12911603 0.20571873 0.39852982 0.56755254 1.17789280 3.13008172
22 1.30996371 0.88272890 1.12544578 0.59756543 0.54866689 0.70076142 2.37891150
23 1.27119152 0.93891684 1.12670726 0.71009478 0.72096878 0.94003688 2.31509562
24 1.35784082 0.93215119 1.18533777 0.70810424 0.63730301 0.70941819 2.16929093
25 3.45253933 3.30934837 3.39777006 3.12563351 3.13572846 3.12016156 2.61222185
26 0.73592925 0.18504825 0.51720392 0.17941672 0.27095683 0.86813418 2.86057699
27 0.58329221 0.04970727 0.36375456 0.29337781 0.42965238 1.02874552 3.01795588
28 0.39344669 0.16226134 0.17572668 0.44365964 0.60770679 1.21455172 3.17536326
29 0.83014413 0.30018080 0.61467904 0.08544961 0.16035290 0.77563098 2.75405023
30 1.30705506 1.54954062 1.37730448 1.55775831 1.73293501 2.23963409 3.75482305
31 0.66656505 1.21547171 0.88614409 1.44938821 1.64030032 2.25498509 4.08631793
32 1.46749047 1.41885662 1.43507362 1.31233897 1.40621944 1.71931786 2.74236849
33 0.73290500 1.19355458 0.91317789 1.37683106 1.56482249 2.15468299 3.83600149
34 1.23196879 1.57146617 1.36373422 1.69249522 1.85882801 2.38105357 3.80219048
35 0.96807121 1.41743150 1.14595688 1.59199276 1.77637262 2.35388472 3.96730990
36 0.58469349 1.13597526 0.80389561 1.36690961 1.55941080 2.17654856 4.02462624
37 7.30895979 7.03698691 7.19824795 6.75995412 6.71255591 6.45795674 5.11204576
38 1.21666604 1.55430958 1.34693262 1.66687951 1.83569520 2.35952092 3.77535373
8 9 10 11 12 13 14
2
3
4
5
6
7
8
9 2.21318405
10 1.09609445 1.23959524
11 0.54385774 2.75459204 1.61058140
12 0.67551999 2.88614056 1.73314181 0.13501096
13 0.68880102 2.14556138 1.01684196 0.93946466 1.03886673
14 3.26494455 2.96722589 2.63746455 3.50963576 3.57491962 2.64383142
15 3.77411020 2.95661468 2.93413475 4.10117283 4.17986253 3.23929851 0.96963789
16 2.97705301 3.27182321 2.67206818 3.09681062 3.14054275 2.29938407 0.99757811
17 0.86878652 1.90000704 0.82984303 1.21094628 1.31809472 0.29607713 2.45072561
18 0.07143969 2.26102455 1.15922050 0.50237981 0.63533553 0.73217252 3.32567709
19 0.58007741 2.79039769 1.64506272 0.03636307 0.10089681 0.96251771 3.52599161
20 0.69585826 2.90496351 1.75164054 0.15345036 0.03157976 1.04124163 3.57365367
21 0.40819726 2.61826817 1.48809596 0.14235815 0.27692515 0.85864379 3.45923828
22 0.63893934 1.89016858 0.69369458 1.06487724 1.16894499 0.84048121 2.95149119
23 0.76193719 2.02795531 0.83260724 1.06999668 1.16582036 0.33450175 2.50943943
24 0.71822108 1.82190348 0.71840639 1.12341795 1.24082323 0.32507745 2.61084919
25 3.17788161 3.17900399 2.68613930 3.36020292 3.41186798 2.53946606 0.43147977
26 0.12603307 2.31491385 1.21688705 0.45369095 0.58698618 0.75754746 3.36339456
27 0.27568364 2.47682546 1.37166003 0.30372413 0.43460429 0.83966674 3.45458462
28 0.44887239 2.65800553 1.53393047 0.12013332 0.24916795 0.90246713 3.50434841
29 0.04207946 2.21307228 1.09266535 0.54935608 0.67889945 0.71558515 3.27760740
30 1.63946686 3.43710160 2.21781415 1.39050129 1.32671675 1.73297656 3.42460638
31 1.48296920 3.67137096 2.48908952 0.94742763 0.81935524 1.64826297 3.91078387
32 1.37895348 2.67106454 1.55296975 1.40676353 1.43926791 0.82889148 2.20097318
33 1.42040258 3.50877671 2.32087206 0.95580904 0.86011293 1.39536707 3.51263399
34 1.74006979 3.61124613 2.45784725 1.38807614 1.32790267 1.47313314 3.17887571
35 1.63618784 3.68113200 2.49839431 1.18695613 1.09490867 1.54587655 3.51595403
36 1.40202848 3.59656510 2.41131132 0.86567300 0.73426698 1.59925611 3.89051582
37 6.81194484 5.70644656 5.91274145 7.14951173 7.21543719 6.51239304 4.73005573
38 1.71794313 3.58680001 2.42401544 1.37026672 1.30977928 1.45059684 3.14308102
15 16 17 18 19 20 21
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16 1.96700686
17 3.00866479 2.18368691
18 3.84134651 3.02431556 0.92096556
19 4.12276184 3.10515706 1.23685441 0.53851843
20 4.18475504 3.13095458 1.32284703 0.65570836 0.11765995
21 4.03355168 3.07215159 1.11632773 0.36288963 0.17754950 0.29517919
22 3.34185018 2.84412373 0.86748905 0.70488631 1.09718488 1.19196804 0.96617965
23 3.04469373 2.26943862 0.35306542 0.82430279 1.09539327 1.17424449 0.99069194
24 3.12959666 2.37564906 0.19651344 0.77298221 1.15282281 1.24936839 1.01425647
25 1.35554031 0.68033755 2.38620997 3.23515324 3.37264753 3.40771448 3.32561008
26 3.88791482 3.04764500 0.95798328 0.05813818 0.48956007 0.60711309 0.31280926
27 4.00055751 3.10465431 1.06936363 0.21728268 0.33866292 0.45538251 0.16598643
28 4.08203654 3.10967269 1.16158158 0.39953558 0.15199411 0.26730629 0.04978856
29 3.77970064 2.99806062 0.89194893 0.09032547 0.58567620 0.70061633 0.41642621
30 3.96874175 3.09386969 1.94173007 1.65487853 1.38025840 1.33078917 1.47257263
31 4.61626872 3.32286423 1.94387071 1.44686396 0.91154084 0.79539190 1.08674074
32 2.91064976 1.74853285 0.90971132 1.42141773 1.41351148 1.43285607 1.40135837
33 4.25405869 2.89038064 1.68148614 1.39878987 0.92598584 0.83225023 1.07460017
34 3.99586001 2.45458965 1.71302343 1.73339356 1.36641304 1.30092443 1.47492473
35 4.29096035 2.84328580 1.82160004 1.61686532 1.15785149 1.06667170 1.30149754
36 4.57801692 3.32891969 1.89444742 1.36641589 0.82999167 0.71259443 1.00699543
37 3.86718101 5.66327455 6.31654562 6.88275077 7.17234720 7.23020150 7.08976477
38 3.95252452 2.43374896 1.69021598 1.71360036 1.34907717 1.28379686 1.45768132
22 23 24 25 26 27 28
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23 0.63507580
24 0.72669776 0.36220227
25 2.90902528 2.42284219 2.55962638
26 0.75652090 0.86297883 0.81564446 3.26732491
27 0.87392427 0.95969626 0.94361455 3.34114768 0.16212587
28 1.01103481 1.03952701 1.06010361 3.36825521 0.34691267 0.19139637
29 0.61541605 0.77221122 0.73945172 3.19164066 0.14175017 0.28289183 0.45665729
30 1.59105447 1.61819622 1.93082913 3.20363610 1.64610892 1.57455150 1.48276312
31 1.91428349 1.79102450 1.92591174 3.66792727 1.39902072 1.24867719 1.05779379
32 1.34071624 0.78590951 1.05158313 1.99107648 1.43579655 1.45934380 1.43836492
33 1.81013249 1.55016084 1.70379544 3.25771508 1.35994911 1.23774842 1.06164079
34 2.05776443 1.63507154 1.79792826 2.88526045 1.70592264 1.62042562 1.47512682
35 2.01069719 1.70476215 1.86373941 3.23865986 1.57954057 1.46267504 1.28981787
36 1.82301705 1.72900058 1.86818860 3.65612374 1.31908910 1.16764280 0.97813622
37 6.20326061 6.21401654 6.36824411 4.98352064 6.93393762 7.04249358 7.13707490
38 2.01535333 1.59766954 1.77506119 2.84922935 1.68751078 1.60339593 1.45944922
29 30 31 32 33 34 35
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30 1.62108121
31 1.48919649 1.32241211
32 1.39329951 1.49717932 1.71706038
33 1.43386560 1.29930109 0.44320036 1.34389822
34 1.76047205 1.57400440 0.99921510 1.17461414 0.57836872
35 1.65146487 1.41185310 0.58718132 1.39816640 0.23695582 0.42460170
36 1.40586658 1.24837706 0.11665958 1.69126239 0.48433633 1.05654636 0.65745536
37 6.79773220 6.56675436 7.66604270 6.19822581 7.40920081 7.28669810 7.47891494
38 1.73692005 1.50071204 0.99404363 1.12467487 0.56870583 0.08314373 0.42783094
36 37
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37 7.59770632
38 1.04491326 7.21996790Menggunakan fungsi dist untuk menghitung jarak
euclidean dengan data standarisasi yang telah didapatkan.
2.3.5 Koefisien Korelasi Cophenetic
> #Koefisien Korelasi Cophenetic
> d1 <- dist(datapraktikum[,2:4])
> #Single Linkage
> hiers <- hclust(dist(datapraktikum[,2:4]), method = "single")
> #korelasi cophenetic
> hc1 <- hclust(d1, "single")
> d2 <- cophenetic(hc1)
> cors <- cor(d1,d2)
> cors
[1] 0.9178036
> #Average Linkage
> hierave <- hclust(dist(datapraktikum[,2:4]), method = "ave")
> #korelasi cophenetic
> hc2 <- hclust(d1, "ave")
> d3 <- cophenetic(hc2)
> corave <- cor(d1,d3)
> corave
[1] 0.9366113
> #Complete Linkage
> hiercomp <- hclust(dist(datapraktikum[,2:4]), method = "complete")
> #korelasi cophenetic
> hc3 <- hclust(d1, "complete")
> d4 <- cophenetic(hc3)
> corcomp <- cor(d1,d4)
> corcomp
[1] 0.9175597
> #Centorid Linkage
> hiercen <- hclust(dist(datapraktikum[,2:4]), method = "centroid")
> #korelasi cophenetic
> hc4 <- hclust(d1, "centroid")
> d5 <- cophenetic(hc4)
> corcen <- cor(d1,d5)
> corcen
[1] 0.9317301
> #Ward
> hierward <- hclust(dist(datapraktikum[,2:4]), method = "ward.D")
> #korelasi cophenetic
> hc5 <- hclust(d1,"ward.D")
> d6 <- cophenetic(hc5)
> corward <- cor(d1,d6)
> corward
[1] 0.8911924
>
> KorCop<-data.frame(cors,corave,corcomp,corcen,corward)
> KorCop
cors corave corcomp corcen corward
1 0.9178036 0.9366113 0.9175597 0.9317301 0.8911924Menentukan metode hierarki yang akan digunakan untuk menganalisis
data yang telah dicari dengan membandingkan koefisien korelasi
cophenetic dari berbagai metode penggabungan dalam analisis
dendrogram. Fungsi yang digunakan dalam perintah tersebut adalah fungsi
dist.
2.3.6 Indeks Validitas
> library(clValid)
> library(ggplot2)
> inval <- clValid(datastandarisasi, 2:4, clMethods = "hierarchical", validation = "internal", metric = "euclidean", method = "average")
> summary(inval)
Clustering Methods:
hierarchical
Cluster sizes:
2 3 4
Validation Measures:
2 3 4
hierarchical Connectivity 2.9290 10.2060 11.2528
Dunn 0.8377 0.3789 0.4962
Silhouette 0.7146 0.5946 0.5898
Optimal Scores:
Score Method Clusters
Connectivity 2.9290 hierarchical 2
Dunn 0.8377 hierarchical 2
Silhouette 0.7146 hierarchical 2
> optimalScores(inval)
Score Method Clusters
Connectivity 2.9289683 hierarchical 2
Dunn 0.8377287 hierarchical 2
Silhouette 0.7146309 hierarchical 2
> plot(inval)Memanggil packages berupa clValid dan
ggplot2 dalam melakukan validasi cluster dengan
fungsi clValid terhadap argumen data standarisasi.
kemudian, menampilkan rangkuman terkait ukuran persebaran dan pemusatan
data validasi dengan fungsi summary, menghitung skor
optimal dengan fungsi optimalScores, dan menampilkan plot
menggunakan fungsi plot.
2.3.7 Metode Average Linkage
> library(cluster)
> library(factoextra)
> library(tidyverse)
> library(car)
> dist_matrix <- dist(datapraktikum[,2:4])
> hclust_result <- hclust(dist_matrix, method = "average")
> dendrogram_object <- as.dendrogram(hclust_result)
> plot(dendrogram_object, main = "Cluster Dendrogram", xlab = "Kabupaten/Kota", ylab = "Jarak")> clusterhier <- eclust(datapraktikum[,2:4], FUNcluster = "hclust", k = 2, hc_method = "average", graph = TRUE)
> fviz_dend(clusterhier, rect = TRUE, cex = 0.5)> idclus = clusterhier$cluster
> idclus
[1] 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 1 1 1 1 1 1 1 1 2 1 1 1 1 1 1 1 1 1 1 1 2 1
> aggregate(datapraktikum[,2:4], list(idclus), mean)
Group.1 X1 X2 X3
1 1 971941.4 42348.28 2220464
2 2 1815181.4 266627.78 4367202Memanggil packages cluster,
factoextra, tidyverse, dan car
dalam melakukan hierarchical clustering dengan fungsi
hclust dan argumen data standarisasi yang telah didapatkan.
Perintah ini digunakan untuk melakukan analisis klaster hierarki,
menghasilkan visualisasi dendogram, dan menghitung rata-rata tiap
variabel dalam setiap cluster yang dihasilkan.
3 HASIL DAN PEMBAHASAN
3.1 Hasil Analisis Statistika Deskriptif
Berdasarkan data yang telah ditentukan, didapatkan hasil analisis statistika deskriptif sebagai berikut:
| Variabel | Min | Max | Mean | Median |
|---|---|---|---|---|
| Jumlah Penduduk (X1) | 134350 | 2887223 | 1082894 | 1095979 |
| Produk Domestik Regional Bruto (X2) | 7637 | 655616 | 71859 | 37798 |
| Upah Minimum Kabupaten/Kota (X3) | 1922123 | 4375479 | 2502930 | 2061496 |
Berdasarkan hasil yang telah didapatkan, terdapat beberapa informasi yang dapat diambil yakni sebagai berikut.
- Rata-rata jumlah penduduk yang ada di Jawa Timur sebanyak 1082894 jiwa, di mana kota yang memiliki jumlah penduduk paling sedikit adalah Kota Mojokerto sebanyak 134350 jiwa. Sedangkan, kota yang memiliki jumlah penduduk yang padat dan paling banyak adalah Kota Surabaya sebanyak 2887223 jiwa.
- Rata-rata Produk Domestik Regional Bruto per kapita di Jawa Timur adalah sebesar 71859 milyar rupiah, di mana kota yang memiliki Produk Domestik Regional Bruto per kapita paling rendah adalah Kota Mojokerto sebesar 7637 milyar rupiah. Sedangkan, kota yang memiliki Produk Domestik Regional Bruto per kapita paling tinggi adalah Kota Surabaya sebesar 655616.2 milyar rupiah.
- Rata-rata Upah Minimum Kabupaten/Kota di Jawa Timur adalah sebesar 2502930 rupiah, di mana kabupaten yang memiliki Upah Minimum Kabupaten/Kota paling rendah adalah Kabupaten Sampang sebesar 1922122.97 rupiah. Sedangkan, kota yang memiliki Upah Minimum Kabupaten/Kota paling tinggi adalah Kota Surabaya sebesar 4375479.19 rupiah.
3.2 Pengujian Asumsi
3.2.1 Uji Sampel Representatif
Uji asumsi yang dilakukan adalah uji sampel representatif menggunakan uji Kaiser Mayer Olkin (KMO) yang digunakan untuk menguji apakah sampel yang digunakan dalam penelitian telah representatif atau mewakili populasi. Berikut tabel hasil uji KMO.
| Jumlah Penduduk(X1) | Produk Domestik Regional Bruto (X2) | Upah Minimum Kabupaten/Kota (X3) | |
|---|---|---|---|
| Uji KMO | 0.70 | 0.60 | 0.68 |
Berdasarkan hasil uji KMO yang telah didapatkan, nilai uji KMO pada jumlah penduduk sebesar 0.70, nilai uji KMO pada Produk Domestik Regional Bruto per Kapita sebesar 0.60, dan nilai uji KMO pada Upah Minimum Kabupaten/Kota sebesar 0.68. Nilai uji KMO pada masing-masing variabel yang digunakan bernilai lebih dari 0.5, sehingga dapat disimpulkan bahwa sampel telah representatif atau mewakili populasi.
3.2.2 Uji Non-Multikolinieritas
Uji asumsi kedua yang dilakukan adalah uji non-multikolinieritas dengan melihat korelasi antar variabel. Apabila nilai dari korelasi lebih dari 0.8, maka dapat dikatakan bahwa terjadi multikolinieritas antar variabel. Berikut tabel korelasi antar variabel.
| Jumlah Penduduk (X1) | Produk Domestik Regional Bruto (X2) | Upah Minimum Kabupaten/Kota (X3) | |
|---|---|---|---|
| Jumlah Penduduk (X1) | 1.0000000 | 0.6421785 | 0.4549197 |
| Produk Domestik Regional Bruto (X2) | 0.6421785 | 1.0000000 | 0.6719079 |
| Upah Minimum Kabupaten/Kota (X3) | 0.4549197 | 0.6719079 | 1.0000000 |
Berdasarkan hasil korelasi berikut, dapat diketahui bahwa antar variabel kurang dari 0.8, sehingga dapat disimpulkan bahwa tidak terjadi multikolinieritas antar variabel.
3.3 Hasil Koefisien Korelasi Cophenetic
Koefisien korelasi cophenetic digunakan untuk menentukan metode hierarki mana yang merupakan metode terbaik yang akan dipilih dalam penelitian ini. Berikut tabel koefisien korelasi cophenetic.
| Metode | Nilai Korelasi |
|---|---|
| Single Linkage | 0.9178036 |
| Average Linkage | 0.9366113 |
| Complete Linkage | 0.9175597 |
| Centroid Linkage | 0.9317301 |
| Ward’s Method | 0.8911924 |
Berdasarkan nilai korelasi yang telah didapatkan, diketahui bahwa nilai korelasi yang paling mendekati 1 adalah metode average linkage. Dapat disimpulkan bahwa metode terbaik yang akan dipilih dalam proses analisis cluster adalah metode average linkage.
3.4 Analisis Cluster Menggunakan Metode Average Linkage
Metode average linkage merupakan metode analisis yang digunakan berdasarkan rata-rata jarak dari semua objek pengamatan dari satu cluster terhadap semua objek pengamatan cluster lain. Ukuran jarak yang digunakan dalam analisis ini adalah jarak Euclidean. Dalam memilih dan menentukan jumlah cluster yang optimal pada analisis ini adalah dengan menggunakan indeks validitas cluster, yaitu indeks connectivity, indeks dunn, dan indeks silhoutte. Berikut tabel yang menyajikan hasil penentuan jumlah cluster optimal dengan metode average linkage.
| Indeks | Nilai | Jumlah Cluster |
|---|---|---|
| Connectivity | 2.9289683 | 2 |
| Dunn | 0.8377287 | 2 |
| Silhoutte | 0.7146309 | 2 |
Berdasarkan tabel tersebut, diketahui bahwa indeks connectivity, indeks dunn, dan indeks silhoutte mendapatkan jumlah cluster optimum sebanyak 2 cluster. Sehingga didapatkan jumlah cluster sebanyak 2 yang digunakan sebagai cluster optimal pada metode pengelompokkan average linkage berdasarkan faktor-faktor yang dapat memengaruhi Tingkat Pengangguran Terbuka di Provinsi Jawa Timur pada tahun 2022.
3.5 Cluster Dendrogram
Hasil analisis cluster membentuk sebuah grafik cluster dendrogram seperti pada gambar berikut ini.
Berdasarkan grafik dendrogram tersebut, didapatkan bahwa hasil pengelompokan metode average linkage kabupaten/kota di Provinsi Jawa Timur berdasarkan faktor-faktor penyebab Tingkat Pengangguran Terbuka (TPT) terbentuk menjadi 2 cluster. Cluster pertama ditandai dengan grafik dendrogram yang berwarna biru dan terdiri dari 33 kabupaten/kota yang ada di Provinsi Jawa Timur, yakni Kabupaten Pacitan, Ponorogo, Trenggalek, Tulungagung, Blitar, Kediri, Malang, Lumajang, Jember, Banyuwangi, Bondowoso, Situbondo, Probolinggo, Jombang, Nganjuk, Madiun, Magetan, Ngawi, Bojonegoro, Tuban, Lamongan, Bangkalan, Sampang, Pamekasan, dan Sumenep, serta Kota Kediri, Blitar, Malang, Probolinggo, Pasuruan, Mojokerto, Madiun, dan Batu. Sedangkan, cluster kedua ditandai dengan grafik dendrogram yang berwarna merah dan terdiri dari 5 kabupaten/kota yang ada di Provinsi Jawa Timur, yakni Kabupaten Pasuruan, Sidoarjo, Mojokerto, Gresik, dan Kota Surabaya.
3.6 Interpretasi Hasil
Anggota cluster sudah terbentuk sesuai dengan jumlah cluster optimal yang telah ditentukan. Selanjutnya, memberikan ciri spesifik untuk menggambarkan isi dari cluster tersebut karena setiap cluster pastinya memiliki karakteristik yang berbeda berdasarkan faktor-faktor yang memengaruhi Tingkat Pengangguran Terbuka pada Kabupaten/Kota di Provinsi Jawa Timur. Karakteristik dari tiap cluster dapat ditentukan melalui nilai rata-rata tiap variabel. Berikut tabel yang disajikan untuk nilai rata-rata tiap variabel pada masing-masing cluster dengan menggunakan metode average linkage.
| Cluster | Jumlah Penduduk (X1) | Produk Domestik Regional Bruto (X2) | Upah Minimum Kabupaten/Kota (X3) |
|---|---|---|---|
| 1 | 971941.4 | 42348.28 | 2220464 |
| 2 | 1815181.4 | 266627.78 | 4367202 |
Berdasarkan tabel berikut, dapat diketahui bahwa:
- Cluster 1 dengan variabel jumlah penduduk, produk domestik regional bruto, dan upah minimum kabupaten/kota memiliki karakteristik yang rendah.
- Cluster 2 dengan variabel jumlah penduduk, produk domestik regional bruto, dan upah minimum kabupaten/kota memiliki karakteristik yang lebih tinggi jika dibandingkan dengan cluster 1.
- Cluster 1 merupakan kelompok kabupaten/kota dengan faktor Tingkat Pengangguran Terbuka (TPT) yang rendah dan cluster 2 merupakan kelompok kabupaten/kota dengan faktor Tingkat Pengangguran Terbuka (TPT) yang tinggi.
4 PENUTUP
4.1 Kesimpulan
Berdasarkan hasil analisis data dan pembahasan yang telah dilakukan, dapat diambil beberapa kesimpulan yakni sebagai berikut:
- Kota Surabaya merupakan kota yang memiliki jumlah penduduk terbanyak dengan rata-rata produk domestik regional bruto per kapita serta upah minimum kabupaten/kota tertinggi di Provinsi Jawa Timur.
- Metode Hierarchical Clustering terbaik yang dapat dipilih untuk pengelompokan kabupaten/kota di Provinsi Jawa Timur menggunakan indikator Tingkat Pengangguran Terbuka adalah metode Average Linkage.
- Diperoleh bahwa kabupaten/kota di Provinsi Jawa Timur dapat dibagi menjadi 2 cluster, di mana sebanyak 86.84% kabupaten/kota masuk ke dalam cluster 1 dan sisanya sebanyak 13.16% kabupaten/kota masuk ke dalam cluster 2.
- Cluster pertama terdiri dari 33 kabupaten/kota yang memiliki Tingkat Pengangguran Terbuka yang relatif rendah dan cluster kedua terdiri dari 5 kabupaten/kota yang memiliki Tingkat Pengangguran Terbuka yang relatif tinggi. Tingkat Pengangguran Terbuka yang tinggi dapat disebabkan oleh jumlah penduduk yang relatif banyak, meningkatnya pertumbuhan produk domestik regional bruto, dan upah minimum kabupaten/kota yang semakin tinggi tiap tahunnya.
4.2 Saran
Pemerintah Provinsi Jawa Timur dapat menggunakan hasil penelitian ini sebagai informasi untuk membuat kebijakan yang dapat mengatasi adanya peningkatan atau bahkan lonjakan Tingkat Pengangguran Terbuka di Provinsi Jawa Timur. Hal-hal yang perlu diperhatikan dalam pembuatan kebijakan atau upaya preventif adalah dengan memprioritaskan penanganan Kota Surabaya yang memiliki jumlah penduduk terbanyak, rata-rata produk domestik regional bruto terbesar dan upah minimum kabupaten/kota yang tergolong tinggi serta semakin meningkat per tahunnya. Selanjutnya, secara bertahap pemerintah dapat menangani Kabupaten Pasuruan, Kabupaten Gresik, Kabupaten Sidoarjo, dan Kabupaten Mojokerto agar lebih efektif.
4.3 Daftar Pustaka
Badan Pusat Statistik. (2022). PDRB Atas Dasar Harga Berlaku Menurut Kabupaten/Kota (Milyar Rupiah), 2020-2022. Pada https://jatim.bps.go.id/indicator/162/323/1/pdrb-adhb.html (diakses 08 November 2023).
Badan Pusat Statistik. (2023). Jumlah Penduduk Menurut Jenis Kelamin dan Kabupaten/Kota Provinsi Jawa Timur (Jiwa), 2021-2023. Pada https://jatim.bps.go.id/indicator/12/375/1/jumlah-penduduk-provinsi-jawa-timur.html (diakses 08 November 2023).
Badan Pusat Statistik. (2023). Tingkat Pengangguran Terbuka (TPT) dan Rata-rata Upah Buruh. Pada https://www.bps.go.id/pressrelease/2023/11/06/2002/tingkat-pengangguran-terbuka–tpt–sebesar-5-32-persen-dan-rata-rata-upah-buruh-sebesar-3-18-juta-rupiah-per-bulan.html (diakses 08 November 2023).
Badan Pusat Statistik. (2023). Tingkat Pengangguran Terbuka (TPT) Menurut Kabupaten/Kota (Persen) 2021-2023. Pada https://jatim.bps.go.id/indicator/6/54/1/tingkat-pengangguran-terbuka-tpt-provinsi-jawa-timur.html (diakses 08 November 2023).
Badan Pusat Statistik. (2023). Upah Minimum Kabupaten/Kota di Jawa Timur (Rupiah), 2021-2023. Pada https://probolinggokab.bps.go.id/indicator/19/288/1/upah-minimum-kabupaten-kota-di-jawa-timur.html (diakses 08 November 2023).
Dani, A., Wahyuningsih, S., & Rizki, N. (2019). Penerapan Hierarchical Clustering Metode Agglomerative pada Data Runtun Waktu. Jambura Journal of Mathematics, 1(2), 66-71. https://ejurnal.ung.ac.id/index.php/jjom/article/view/2354/1498
Gujarati, D. N. (1995). Ekonometrika Dasar. Jakarta: Erlangga.
Hair, J. F., dkk. (2006). Multivariate Data Analysis Sixth Edition. New Jersey: Pearson Education Inc.
Halim, N. N., & Widodo, E. (2017). Clustering Dampak Fempa Bumi di Indonesia Menggunakan Kohonen Self Organizing Maps (SOM). Prosiding SI MaNIs (Seminar Nasional Integrasi Matematika dan Nilai-Nilai Islami), 1(1): 188-194.
Pradita, H. (2022). Diakses pada 18 Mei 2022 dari https://rpubs.com/helvaaldha/PenerapanAnalisisCluster
Sitepu, R., Irmeilyana, & Gultom, B. (2011). Analisis Cluster terhadap Tingkat Pencemaran Udara pada Sektor Industri di Sumatera Selatan. Jurnal Penelitian Sains, 14(3A), 12-14. https://media.neliti.com/media/publications/168311-ID-analisis-cluster-terhadap-tingkat-pencem.pdf
Wahyuni, I. & Wulandari, S. (2022). Pemetaan Kabupaten/Kota di Jawa Timur Berdasarkan Indikator Kesejahteraan Rakyat Menggunakan Analisis Cluster Hierarki. Jurnal Sains dan Seni ITS, 11(1), 70-71.
Wahyuni, S. & Jatmiko, Y. (2018). Pengelompokan Kabupaten/Kota di Pulau Jawa Berdasarkan Faktor-Faktor Kemiskinan dengan Pendekatan Average Linkage Hierarchical Clustering. Jurnal Aplikasi Statistika & Komputasi Statistik V, 10(1), 2-3.