1 PENDAHULUAN

1.1 Latar Belakang

Sebagai salah satu provinsi terbesar di Indonesia, Provinsi Jawa Timur dikenal dengan keragaman karakteristik sosial-ekonomi di setiap kabupaten/kotanya. Perbedaan ini mencakup aspek pendidikan, ketenagakerjaan, dan tingkat kesejahteraan masyarakat. Berbagai tantangan pembangunan kerap timbul akibat adanya ketimpangan antara satu daerah dengan daerah lainnya. Oleh karena itu, pemahaman yang mendalam tentang profil sosial-ekonomi kabupaten/kota sangat penting untuk mendukung perencanaan yang efektif dan penerapan kebijakan yang tepat sasaran.

Kesejahteraan dapat didefinisikan sebagai suatu keadaan di mana semua anggota masyarakat memiliki akses yang adil terhadap sumber daya ekonomi dan sosial yang penting untuk menjalani kehidupan yang produktif dan bermartabat (Todaro & Smith, 2015). Kesejahteraan merupakan suatu tolak ukur dalam menentukan apakah suatu individu ataupun kelompok masyarakat berada pada kondisi yang sejahtera. Kesejahteraan dapat diindikasikan ketika kondisi kesehatan baik, perekonomian meningkat, tingkat pendidikan yang tinggi serta kualitas hidupnya yang layak.

Indikator pendidikan, seperti rata-rata lama sekolah, menjadi ukuran penting untuk menilai kualitas sumber daya manusia serta akses pendidikan di suatu daerah. Rata-rata Lama Sekolah (RLS) adalah indikator yang menunjukkan rata-rata jumlah tahun yang dihabiskan oleh penduduk suatu wilayah dalam pendidikan formal. RLS menggambarkan tingkat akses pendidikan yang diterima masyarakat, dan sering dijadikan ukuran kualitas sumber daya manusia (Badan Pusat Statistik, 2022). Kesejahteraan rakyat sangat erat dengan RLS, karena RLS menunjukkan tingkat pencapaian pendidikan yang menjadi faktor penentu dalam peningkatan kualitas hidup. Pendidikan yang tinggi membekali masyarakat dengan keterampilan dan pengetahuan yang diperlukan untuk bersaing di pasar kerja yang semakin ketat, yang pada akhirnya berperan dalam meningkatkan pendapatan dan standar hidup mereka. Menurut Todaro dan Smith (2020), masyarakat dengan tingkat pendidikan yang lebih tinggi cenderung memiliki kesempatan kerja yang lebih baik, stabilitas ekonomi yang lebih tinggi, serta kemampuan untuk berpartisipasi secara produktif dalam ekonomi.

Kesejahteraan masyarakat dapat diukur melalui indikator ketenagakerjaan, seperti tingkat partisipasi angkatan kerja dan tingkat pengangguran terbuka. Meningkatnya tingkat partisipasi angkatan kerja akan diikuti oleh pertumbuhan ekonomi yang juga meningkat. Tingkat partisipasi angkatan kerja merupakan persentase dari penduduk usia kerja yang menjadi angkatan kerja (Kependudukan & Nasional, 1994). Kegunaan dari TPAK adalah untuk mengetahui berapa penduduk yang memiliki potensi untuk bekerja. Potensi penduduk untuk bekerja akan tinggi jika jumlah angkatan kerja juga tinggi (Badan Pusat Statistik, 2014). Partisipasi tinggi dalam angkatan kerja mencerminkan adanya kesempatan kerja yang lebih baik, yang tidak hanya mendukung stabilitas finansial tetapi juga meningkatkan akses terhadap kebutuhan dasar, pendidikan, dan kesehatan. Sebaliknya, rendahnya TPAK dapat mengindikasikan keterbatasan lapangan kerja atau hambatan sosial-ekonomi lainnya yang menghalangi penduduk usia kerja untuk berpartisipasi dalam ekonomi, yang pada akhirnya berdampak negatif terhadap kesejahteraan rakyat.

Menurut Todaro (2000), pengangguran terbuka merupakan istilah yang dipergunakan bagi mereka yang tidak bekerja, baik secara sukarela (mampu bekerja secara permanen, tetapi lebih memilih untuk tidak bekerja karena alasan tertentu) maupun karena terpaksa (ingin mendapatkan pekerjaan tetapi belum mendapatkannya). TPT mencerminkan jumlah individu dalam usia produktif yang mampu dan bersedia bekerja, namun tidak memiliki pekerjaan pada saat tertentu (Badan Pusat Statistik, 2022). Kaitannya dengan kesejahteraan rakyat sangat krusial, karena tingginya TPT berdampak langsung pada kemampuan masyarakat untuk memenuhi kebutuhan dasar mereka. Selain itu, Blanchard (2017) menjelaskan bahwa pengangguran yang tinggi dapat menghambat pertumbuhan ekonomi jangka panjang karena masyarakat kehilangan peluang untuk berpartisipasi dalam kegiatan produktif. Oleh karena itu, pengurangan TPT menjadi salah satu prioritas dalam kebijakan pembangunan untuk meningkatkan kesejahteraan rakyat.

1.2 Statistika Deskriptif

Pangestu Subagyo (2003:1) menyatakan bahwa yang dimaksud sebagai statistika deskriptif adalah bagian statistika mengenai pengumpulan data, penyajian, penentuan nilai-nilai statistika, pembuatan diagram atau gambar mengenai sesuatu hal, disini data yang disajikan dalam bentuk yang lebih mudah dipahami atau dibaca. Statistik deskriptif berfungsi untuk mendeskripsikan atau memberi gambaran terhadap objek yang diteliti melalui data sampel atau populasi (Sugiyono, 2007). Data yang disajikan dalam statistik deskriptif biasanya dalam bentuk ukuran pemusatan data (Kuswanto, 2012).

1.3 Analisis Cluster

Analisis cluster merupakan salah satu teknik statistik yang bertujuan mengorganisasikan data menjadi beberapa kelompok sehingga tingkat kesamaan dalam kelompok tinggi dan tingkat kesamaan antar kelompok rendah. Analisis cluster adalah salah satu analisis peubah ganda (multivariate analysis) yang digunakan untuk mengelompokkan objek-objek sedemikian rupa sehingga objek dalam satu kelompok sangat mirip dan objek di berbagai kelompok cukup berbeda (Rizal & Hamin, 2012). Tujuan utama analisis cluster untuk menempatkan sekumpulan objek ke dalam dua atau lebih cluster berdasarkan kesamaan-kesamaan objek atas dasar berbagai karakteristik (Simamora, 2005).

Baskoro (2010) menyatakan bahwa Clustering atau clusterisasi adalah salah satu alat bantu pada data mining yang bertujuan mengelompokkan obyek-obyek ke dalam cluster-cluster. Cluster adalah sekelompok atau sekumpulan obyek-obyek data yang similar satu sama lain dalam cluster yang sama dan dissimilar terhadap obyek-obyek yang berbeda cluster. Obyek akan dikelompokkan ke dalam satu atau lebih cluster sehingga obyek-obyek yang berada dalam satu cluster akan mempunyai kesamaan yang tinggi antara satu dengan lainnya. Obyek-obyek dikelompokkan berdasarkan prinsip memaksimalkan kesamaan obyek pada cluster yang sama dan memaksimalkan ketidaksamaan pada cluster yang berbeda. Kesamaan obyek biasanya diperoleh dari nilai-nilai atribut yang menjelaskan obyek data, sedangkan obyek-obyek data biasanya direpresentasikan sebagai sebuah titik dalam ruang multidimensi.

Prosedur pembentukan cluster terbagi menjadi 2, yaitu hirarki dan nonhirarki. Pembentukan cluster hirarki mempunyai sifat sebagai pengembangan suatu cluster hirarki merupakan metode pengelompokan yang mana jumlah kelompok yang akan dibuat belum diketahui. Teknik ini diproses dengan baik melalui penggabungan berurutan (agglomerative) atau pembagian berurutan (divissive).

1.3.1 Jarak Analisis Cluster

Dalam Sartono dkk (2003), sesuai prinsip cluster yaitu mengelompokkan objek yang mempunyai kemiripan, maka proses pertama pada analisis cluster adalah mengukur seberapa jauh kesamaan antar objek. Dalam Simamora (2005), jarak yang paling umum digunakan adalah jarak Euclidean, yang mengukur jarak sesungguhnya menggunakan mata manusia. Jarak Euclidean adalah besarnya jarak suatu garis lurus yang menghubungkan antar objek.

Jarak euclidean antara dua titik dalam ruang n-dimensi dihitung dengan rumus berikut:

\[ d(p, q) = \sqrt{\sum_{i=1}^{n} (p_i - q_i)^2} \] Keterangan:

\(d(p, q)\) = Jarak Euclidean antara titik \(p\) dan \(q\).

\(p_i\) dan \(q_i\) = Koordinat dari titik \(p\) dan \(q\) dalam dimensi ke-i.

\(n\) = jumlah dimensi.

1.3.2 Standarisasi Variabel

Standarisasi variabel adalah proses mengubah skala atau distribusi variabel sehingga memiliki rata-rata nol dan deviasi standar satu. Standarisasi bertujuan untuk menghilangkan unit dari variabel dan membuat variabel menjadi lebih mudah dibandingkan, terutama ketika variabel memiliki skala atau unit pengukuran yang berbeda. Standarisasi dilakukan terhadap variabel yang relevan ke dalam bentuk z-score dengan rumus sebagai berikut :

\[ Z = \frac{X - \mu}{\sigma} \] Keterangan:

\(Z\) = Nilai standardisasi (z-score).

\(X\) = Nilai asli dari variabel.

\(\mu\) = Rata-rata dari variabel.

\(\sigma\) = Deviasi standar dari variabel.

1.3.3 Analisis cluster hierarki

Analisis cluster hirarki merupakan suatu metode yang tidak membutuhkan suatu asumsi yang dibuat dalam jumlah kelompok atau struktur kelompok. Analisis cluster hirarki sendiri merupakan suatu metode pengelompokan yang jumlah kelompok yang akan dibuat belum diketahui.

1.3.4 Metode Analisis Cluster Hierarki

Metode hierarki bisa aglomeratif (agglomerative) atau difisif (divisive). Pengklasifikasian aglomeratif dimulai dengan setiap objek dalam suatu cluster yang terpisah. Cluster dibentuk dengan mengelompokkan objek yang semakin membesar (semakin banyak elemen atau objek yang menjadi anggotanya). Proses ini dilanjutkan sampai semua objek menjadi anggota dari suatu cluster tunggal. Sedangkan pengklasifikasian difisif, dalam prosesnya, merupakan kebalikan dari metode aglomeratif. Metode ini dimulai dengan menempatkan semua objek sebagai satu cluster. Lalu, secara bertahap, objek-objek dipisahkan ke dalam cluster yang berbeda, dua cluster, tiga cluster, dan seterusnya, sampai semua objek menjadi cluster sendiri-sendiri.

1.3.5 Metode Average Linkage

Metode Average Linkage merupakan metode analisis cluster hirarki agglomerative dimana pada metode ini proses pengelompokan dimulai dengan menghitung rata-rata antara dua objek. Pada metode average linkage, jarak antara dua cluster dianggap sebagai jarak rata-rata antara semua anggota dalam satu cluster dengan semua anggota cluster lain. Langkah yang dilakukan dalam analisis ini dengan mengelompokkan objek berdasarkan jarak rata-rata yang didapat dengan melakukan perhitungan rerata semua jarak objek terlebih dahulu dengan rumus:

\[ d_{(ij)k} = average(d_{ik}, d_{jk}) \] Keterangan:

\(d_{(ij)k}\) : jarak antar kelompok \((i, j)\) dan \(k\)

\(d_{ik}\) : jarak rata-rata antara kelompok \(i\) dengan \(k\)

\(d_{jk}\) : jarak rata-rata antara kelompok \(j\) dengan \(k\)

1.3.6 Koefisien Korelasi Cophenetic

Koefisien korelasi cophenetic merupakan koefisien korelasi antara elemen-elemen asli matriks ketidakmiripan (matriks jarak Euclidian) dan elemen-elemen yang dihasilkan oleh matriks cophenetic (Silva & Dias, 2013). Koefisien korelasi ini dapat digunakan untuk melihat keeratan hubungan antar variabel. Dalam proses pengclusteran, untuk melihat kebaikan hasil analisis cluster dapat menggunakan koefisien korelasi cophenetic. Saracli,dkk. (2013), menuliskan formula untuk menghitung koefisien cophenetic sebagai berikut:

\[r_{Coph} = \frac{\sum_{i < k} (d_{ik} - \overline{d})(d_{Cik} - \overline{d_C})}{\sqrt{\sum_{i < k} (d_{ik} - \overline{d})^2 \sum_{i < k} (d_{Cik} - \overline{d_C})^2}}\] Keterangan:

\(r_{Coph}\) : koefisien korelasi cophenetic

\(d_{ik}\) : jarak asli (jarak Euclidean) antara objek \(i\) dan \(k\)

\(\overline{d}\) : rata-rata \(d_{ik}\)

\(d_{Cik}\) : jarak cophenetic objek \(i\) dan \(k\)

\(\overline{d_C}\) : rata-rata \(d_{Cik}\)

1.3.7 Validasi Cluster

Validasi cluster merupakan suatu tahap kegiatan yang digunakan untuk memberikan penilaian hasil dari analisis suatu cluster dengan berdasarkan jumlah atau kuantitatif dan sesuai dengan keadaan yang sebenarnya atau objektif validasi cluster juga salah satu metode yang digunakan untuk melakukan evaluasi hasil dari sebuah algoritma clustering yang telah dilakukan dengan tujuan untuk memperoleh jumlah cluster terbaik. Validasi hasil clustering dapat menggunakan beberapa indeks diantaranya yaitu Indeks Dunn, Indeks Silhouette dan Indeks Connectivity.

1.3.8 Dendogram

Dendogram adalah representatif visual dari langkah-langkah dalam analisis cluster yang menunjukkan bagaimana cluster terbentuk dan nilai koefisien jarak pada setiap langkah. Hasil dari pengclusteran dengan metode hierarki adalah dengan bentuk dendogram. Hasil pengelompokan biasanya ditampilkan dalam bentuk diagram dendogram. Dendogram digunakan untuk memperjelas pengelompokan dalam metode hierarki (Jhonson and Winchern, 2007)

1.4 Pengujian Asumsi

1.4.1 Sampel Representatif

Sampel Representatif atau Sampel yang mewakili adalah sampel yang diambil dapat dikatakan merepresentasikan atau mewakili populasi yang ada. Pengujian sampel yang mewakili (sampel representatif) dapat dilakukan dengan uji Kaiser-Mayer-Olkin (KMO). Uji Kaiser-Mayer-Olkin (KMO) banyak digunakan untuk melihat syarat kecukupan suatu sampel. Uji KMO ini mengukur kecukupan sampling secara menyeluruh dan mengukur kecukupan sampling untuk setiap indikator. Uji Kaiser-Mayer-Olkin (KMO) memiliki nilai 0 sampai dengan 1. Jika nilai KMO berkisar 0,5 sampai 1 maka sampel dapat dikatakan mewakili populasi atau sampel representatif.

1.4.2 Multikolinearitas

Multikolinearitas adalah adanya hubungan linear yang sempurna atau pasti di antara beberapa atau semua variabel (Gujarati, 1978). Multikolinearitas berkenaan dengan terdapatnya lebih dari satu hubungan linear pasti. Untuk mengetahui adanya multikolinearitas salah satunya adalah dengan menghitung nilai Variance Inflation Factor (VIF) dengan rumus :

\[VIF_{j} = \frac{1}{1 - R_{j}^2}\] Menurut Ghozali (2018), Multikolinearitas terjadi jika nilai variance Inflation Factor (VIF) lebih besar dari 10.

1.5 Data

Data yang digunakan dalam penelitian ini adalah data sekunder. Data yang digunakan bersumber dari Badan Pusat Statistik Provinsi Jawa Timur Tahun 2023. Data yang digunakan adalah data indikator pendidikan dan ketenagakerjaan di Provinsi Jawa Timur. Adapun variabel yang digunakan dalam penelitian ini adalah :

X1 : Rata-rata Lama Sekolah (Tahun)

X2 : Tingkat Partisipasi Angkatan Kerja (Persen)

X3 : Tingkat Pengangguran Terbuka (Persen)

Kabupaten/Kota	Rata-rata Lama Sekolah (Tahun)	Tingkat Partisipasi Angkatan Kerja (Persen)	Tingkat Pengangguran Terbuka
Kabupaten Pacitan	7.88	81.64	1.83
Kabupaten Ponorogo	7.78	75.88	4.66
Kabupaten Trenggalek	7.90	80.72	4.52
Kabupaten Tulungagung	8.66	74.7	5.65
Kabupaten Blitar	7.83	73.5	4.91
Kabupaten Kediri	8.24	68.74	5.79
Kabupaten Malang	7.75	70.66	5.7
Kabupaten Lumajang	7.14	68.49	3.67
Kabupaten Jember	6.52	72.3	3.67
Kabupaten Banyuwangi	7.76	79.04	4.75
Kabupaten Bondowoso	6.36	74.39	4.15
Kabupaten Situbondo	6.9	75.28	3.27
Kabupaten Probolinggo	6.29	69.48	3.24
Kabupaten Pasuruan	7.44	71.21	5.48
Kabupaten Sidoarjo	10.78	69.62	8.05
Kabupaten Mojokerto	9.11	72.51	4.67
Kabupaten Jombang	8.77	71.91	4.66
Kabupaten Nganjuk	8.24	66.89	4.68
Kabupaten Madiun	7.95	72.49	5.14
Kabupaten Magetan	8.67	78.48	4.16
Kabupaten Ngawi	7.78	69.43	2.41
Kabupaten Bojonegoro	7.45	74.29	4.63
Kabupaten Tuban	7.4	74.73	4.4
Kabupaten Lamongan	8.34	75.08	5.46
Kabupaten Gresik	10.01	70.12	6.82
Kabupaten Bangkalan	5.99	71.49	6.18
Kabupaten Sampang	5.07	73.54	2.72
Kabupaten Pamekasan	7.15	77.14	1.74
Kabupaten Sumenep	5.94	78.86	1.71
Kota Kediri	10.69	71.83	4.06
Kota Blitar	10.78	72.26	5.24
Kota Malang	10.94	67.58	6.8
Kota Probolinggo	9.56	70.61	4.53
Kota Pasuruan	9.78	75.65	5.35
Kota Mojokerto	11.05	72.5	4.73
Kota Madiun	11.82	69.29	5.88
Kota Surabaya	10.7	68.73	6.8
Kota Batu	9.85	78.99	4.52
Jawa Timur	8.11	72.56	4.58

1.6 Tujuan

Dengan menggunakan analisis cluster hierarki, penelitian ini bertujuan untuk menemukan pola-pola pengelompokan wilayah yang memiliki kesamaan dalam aspek-aspek pendidikan serta ketenagakerjaan. Pengelompokan ini diharapkan dapat memberikan gambaran yang jelas mengenai distribusi dan perbedaan kondisi pendidikan serta ketenagakerjaan antar kabupaten/kota di Jawa Timur.

2 SOURCE CODE

2.1 Library

> # Library
> library(psych)
> library(GPArotation)
> library(clValid)
> library(ggplot2)
> library(cluster)
> library(factoextra)
> library(tidyverse)
> library(car)
> library(readxl)

Sebelum melakukan analisis perlu mengaktifkan packages yang dibutuhkan terlebih dahulu untuk support proses analisis.

2.2 Impor Data

> library(readxl)
> data <- read_excel("C:/TUGAS SEMESTER 5/data_jatim.xlsx")
> View(data)

Mengimport data dari excel ke R dengan menggunakan fungsi read_excel dari library readxl, yang kemudian disimpan dalam variabel data, serta view digunakan untuk melihat gambaran data secara keseluruhan.

2.3 Analisis Cluster

2.3.1 Statistika Deskriptif

> statdes <- summary(data)
> print(statdes)
 Kabupaten/Kota     Rata-rata Lama Sekolah (Tahun)
 Length:39          Min.   : 5.070                
 Class :character   1st Qu.: 7.420                
 Mode  :character   Median : 7.950                
                    Mean   : 8.369                
                    3rd Qu.: 9.670                
                    Max.   :11.820                
 Tingkat Partisipasi Angkatan Kerja (Persen) Tingkat Pengangguran Terbuka
 Min.   :66.89                               Min.   :1.710               
 1st Qu.:70.36                               1st Qu.:4.105               
 Median :72.50                               Median :4.670               
 Mean   :73.14                               Mean   :4.668               
 3rd Qu.:75.18                               3rd Qu.:5.560               
 Max.   :81.64                               Max.   :8.050

Menghitung statistika deskriptif dengan perintah “summary” dan menyimpannya dalam statdes.

2.3.2 Pengujian Asumsi

2.3.2.1 Uji Sampel Representatif (KMO)

> library(psych)
> library(GPArotation)
> kmo <- KMO(data[, 2:4])
> print(kmo)
Kaiser-Meyer-Olkin factor adequacy
Call: KMO(r = data[, 2:4])
Overall MSA =  0.59
MSA for each item = 
             Rata-rata Lama Sekolah (Tahun) 
                                       0.59 
Tingkat Partisipasi Angkatan Kerja (Persen) 
                                       0.65 
               Tingkat Pengangguran Terbuka 
                                       0.56

Library psych dan GPArotation digunakan untuk menyediakan keperluan uji asumsi KMO. Fungsi KMO(data,[,2:4]) digunakan untuk menghitung nilai KMO untuk kolom ke 2 - 4 dari dataset.

2.3.2.2 Uji Non-Multikolinearitas

> korelasi <- cor(data[, 2:4], method = 'pearson')
> print(korelasi)
                                            Rata-rata Lama Sekolah (Tahun)
Rata-rata Lama Sekolah (Tahun)                                    1.000000
Tingkat Partisipasi Angkatan Kerja (Persen)                      -0.273599
Tingkat Pengangguran Terbuka                                      0.576271
                                            Tingkat Partisipasi Angkatan Kerja (Persen)
Rata-rata Lama Sekolah (Tahun)                                               -0.2735990
Tingkat Partisipasi Angkatan Kerja (Persen)                                   1.0000000
Tingkat Pengangguran Terbuka                                                 -0.4665463
                                            Tingkat Pengangguran Terbuka
Rata-rata Lama Sekolah (Tahun)                                 0.5762710
Tingkat Partisipasi Angkatan Kerja (Persen)                   -0.4665463
Tingkat Pengangguran Terbuka                                   1.0000000

Menghitung matriks korelasi pearson antara kolom ke-2 hingga ke-4 dalam dataset dengan menggunakan fungsi cor().

2.3.3 Standarisasi Data

> datastand <- scale(data[, 2:4])
> print(datastand)
      Rata-rata Lama Sekolah (Tahun)
 [1,]                    -0.29854690
 [2,]                    -0.35963467
 [3,]                    -0.28632935
 [4,]                     0.17793771
 [5,]                    -0.32909079
 [6,]                    -0.07863093
 [7,]                    -0.37796100
 [8,]                    -0.75059640
 [9,]                    -1.12934058
[10,]                    -0.37185222
[11,]                    -1.22708101
[12,]                    -0.89720705
[13,]                    -1.26984245
[14,]                    -0.56733309
[15,]                     1.47299845
[16,]                     0.45283268
[17,]                     0.24513426
[18,]                    -0.07863093
[19,]                    -0.25578546
[20,]                     0.18404649
[21,]                    -0.35963467
[22,]                    -0.56122431
[23,]                    -0.59176820
[24,]                    -0.01754315
[25,]                     1.00262262
[26,]                    -1.45310577
[27,]                    -2.01511326
[28,]                    -0.74448763
[29,]                    -1.48364965
[30,]                     1.41801946
[31,]                     1.47299845
[32,]                     1.57073888
[33,]                     0.72772765
[34,]                     0.86212074
[35,]                     1.63793543
[36,]                     2.10831126
[37,]                     1.42412823
[38,]                     0.90488218
[39,]                    -0.15804503
      Tingkat Partisipasi Angkatan Kerja (Persen) Tingkat Pengangguran Terbuka
 [1,]                                  2.28483990                 -2.012620376
 [2,]                                  0.73582395                 -0.005999681
 [3,]                                  2.03742763                 -0.105267136
 [4,]                                  0.41849082                  0.695963035
 [5,]                                  0.09577916                  0.171263631
 [6,]                                 -1.18431040                  0.795230490
 [7,]                                 -0.66797175                  0.731415698
 [8,]                                 -1.25154200                 -0.707962398
 [9,]                                 -0.22693249                 -0.466884293
[10,]                                  1.58563131                  0.057815111
[11,]                                  0.33512364                 -0.367616838
[12,]                                  0.57446812                 -0.991583698
[13,]                                 -0.98530488                 -1.012855295
[14,]                                 -0.52006225                  0.575423983
[15,]                                 -0.94765519                  2.397690833
[16,]                                 -0.17045795                  0.001090851
[17,]                                 -0.33181378                 -0.005999681
[18,]                                 -1.68182421                  0.008181384
[19,]                                 -0.17583648                  0.334345878
[20,]                                  1.43503254                 -0.360526306
[21,]                                 -0.99875120                 -1.601369492
[22,]                                  0.30823100                 -0.027271279
[23,]                                  0.42655861                 -0.190353526
[24,]                                  0.52068284                  0.561242918
[25,]                                 -0.81319200                  1.525555337
[26,]                                 -0.44476286                  1.071761257
[27,]                                  0.10653622                 -1.381562985
[28,]                                  1.07467119                 -2.076435169
[29,]                                  1.53722456                 -2.097706766
[30,]                                 -0.35332789                 -0.431431631
[31,]                                 -0.23768955                  0.405251203
[32,]                                 -1.49626500                  1.511374272
[33,]                                 -0.68141807                 -0.098176604
[34,]                                  0.67397088                  0.688872503
[35,]                                 -0.17314722                  0.043634046
[36,]                                 -1.03640089                  0.837773685
[37,]                                 -1.18699967                  1.483012142
[38,]                                  1.57218499                 -0.105267136
[39,]                                 -0.15701163                  0.149992033
attr(,"scaled:center")
             Rata-rata Lama Sekolah (Tahun) 
                                   8.368718 
Tingkat Partisipasi Angkatan Kerja (Persen) 
                                  73.143846 
               Tingkat Pengangguran Terbuka 
                                   4.668462 
attr(,"scaled:scale")
             Rata-rata Lama Sekolah (Tahun) 
                                   1.636989 
Tingkat Partisipasi Angkatan Kerja (Persen) 
                                   3.718490 
               Tingkat Pengangguran Terbuka 
                                   1.410331 
> rownames(datastand) <- 1:nrow(datastand)

Melakukan standarisasi data ke dalam bentuk Zscore dengan fungsi scale() dan disimpan dalam datastand.

2.3.4 Menghitung Jarak Euclidean

> jarak <- dist(datastand, method = "euclidean")
> print(jarak)
           1         2         3         4         5         6         7
2  2.5356870                                                            
3  1.9233716 1.3074402                                                  
4  3.3236607 0.9393807 1.8650657                                        
5  3.0922919 0.6648402 1.9617076 0.7978284                              
6  4.4684889 2.0994878 3.3516609 1.6262390 1.4459233                    
7  4.0317660 1.5857994 2.8333055 1.2209346 0.9484061 0.6002303          
8  3.7963770 2.1436479 3.3758120 2.3711162 1.6631235 1.6479219 1.5972541
9  3.0640690 1.3159642 2.4431049 1.8648758 1.0732080 1.9009200 1.4815565
10 2.1865428 0.8522876 0.4878831 1.4393466 1.4947771 2.8813777 2.3521271
11 2.7147018 1.0216608 1.9625697 1.7641513 1.0742739 2.2315536 1.7132068
12 2.0799715 1.1341938 1.8163092 2.0070075 1.3798961 2.6374370 2.1867785
13 3.5548266 2.1919217 3.3057414 2.6432499 1.8590035 2.1743418 1.9845992
14 3.8259242 1.3994435 2.6614015 1.2045082 0.7741871 0.8534461 0.2864829
15 5.7478903 3.4598229 4.2744301 2.5376002 3.0484847 2.2430868 2.5061418
16 3.2631414 1.2171690 2.3307577 0.9514595 0.8433536 1.3932007 1.2128943
17 3.3420042 1.2270272 2.4301466 1.0296718 0.7375584 1.2138963 1.0222677
18 4.4571770 2.4339652 3.7267739 2.2249032 1.8025537 0.9311102 1.2808447
19 3.4007363 0.9786442 2.2567079 0.8198217 0.3251839 1.1228615 0.6440407
20 1.9195009 0.9540288 0.8057857 1.4661392 1.5296111 2.8750184 2.4353268
21 3.3098081 2.3566832 3.3855691 2.7523255 2.0835445 2.4201419 2.3561913
22 2.8138218 0.4732088 1.7526470 1.0399931 0.3720724 1.7711819 1.2498653
23 2.6191305 0.4283893 1.6417770 1.1739120 0.5560409 1.9569325 1.4468479
24 3.1330473 0.6964743 1.6783910 0.2584676 0.6555066 1.7220580 1.2536984
25 4.8795011 2.5692131 3.5280322 1.6986380 2.1056579 1.3565443 1.5992992
26 4.2775165 1.9367583 2.9846328 1.8832775 1.5383404 1.5851123 1.1496058
27 2.8442645 2.2424957 2.8889386 3.0369232 2.2921732 3.1866407 2.7829497
28 1.2912954 2.1329867 2.2410516 2.9946006 2.4865506 3.7138695 3.3249320
29 1.4037938 2.5061706 2.3777289 3.4375905 2.9255765 4.2130649 3.7535812
30 3.5223128 2.1277449 2.9541327 1.8451357 1.9019287 2.1059901 2.1625819
31 3.9176052 2.1155141 2.9209624 1.4806311 1.8475598 1.8589590 1.9281019
32 5.4963189 3.3182807 4.3068800 2.5042125 2.8177746 1.8249927 2.2565098
33 3.6765501 1.7886946 2.9018070 1.4638054 1.3392157 1.3043355 1.3823717
34 3.3526276 1.4068971 1.9515660 0.7303607 1.4216925 2.0855539 1.8276823
35 3.7443086 2.1952172 2.9345541 1.7050402 1.9894227 2.1293070 2.1867175
36 4.9948326 3.1533302 4.0089963 2.4213967 2.7689341 2.1923511 2.5156712
37 5.2192649 3.0159935 3.9806064 2.1794579 2.5377121 1.6526754 2.0203497
38 2.3651881 1.5193277 1.2788415 1.5815904 1.9439477 3.0621007 2.7136741
39 3.2648541 0.9285080 2.2129568 0.8614939 0.3059613 1.2157228 0.8046718
           8         9        10        11        12        13        14
2                                                                       
3                                                                       
4                                                                       
5                                                                       
6                                                                       
7                                                                       
8                                                                       
9  1.1186556                                                            
10 2.9630077 2.0333435                                                  
11 1.6912660 0.5790633 1.5735876                                        
12 1.8537121 0.9856157 1.5490922 0.7452766                              
13 0.6583755 0.9449623 2.9261638 1.4702696 1.6038084                    
14 1.4885324 1.2199115 2.1771718 1.4338536 1.9396718 1.7979436          
15 3.8316841 3.9366738 3.9110143 4.0722079 4.4070302 4.3768046 2.7688346
16 1.7662788 1.6508974 1.9409205 1.7926707 1.8338279 2.1586273 1.2218101
17 1.5264767 1.4534771 2.0152767 1.6561975 1.7600189 1.9328640 1.0166583
18 1.0721671 1.8564450 3.2809614 2.3512211 2.6000870 1.7165780 1.3821305
19 1.5774621 1.1864565 1.7868155 1.3027843 1.6530178 1.8704282 0.5231367
20 2.8656503 2.1209492 0.7118377 1.7891704 1.5191819 2.8978198 2.2941163
21 1.0074376 1.5732794 3.0711685 2.0134127 1.7708308 1.0839778 2.2384619
22 1.7123358 0.8957766 1.2941611 0.7482803 1.0553033 1.7739083 1.0243772
23 1.7632830 0.8902269 1.2055705 0.6658866 0.8701379 1.7690824 1.2178273
24 2.2997891 1.6888066 1.2300771 1.5362925 1.7854893 2.5127749 1.1771238
25 2.8730696 2.9763708 3.1301431 3.1423412 3.4454234 3.4113412 1.8583422
26 2.0764942 1.5873576 2.5139007 1.6526099 2.3675404 2.1613415 1.0181424
27 1.9741117 1.3162187 2.6381506 1.3043519 1.2730901 1.3724033 2.5136609
28 2.6988929 2.1054543 2.2259743 1.9235090 1.2043376 2.3771204 3.0995024
29 3.2009335 2.4284495 2.4258424 2.1222830 1.5793426 2.7542278 3.4953817
30 2.3635043 2.5507403 2.6837596 2.7339704 2.5563352 2.8217105 2.2323045
31 2.6854265 2.7446137 2.6169992 2.8663337 2.8685575 3.1769688 2.0667960
32 3.2208605 3.5798242 3.9223181 3.8356731 4.0796435 3.8342819 2.5298867
33 1.6977403 1.9471017 2.5244647 2.2197369 2.2396069 2.2179429 1.4686578
34 2.8739527 2.4725127 1.6589296 2.3655340 2.4349678 3.1928578 1.8659914
35 2.7263376 2.8144872 2.6707208 2.9386708 2.8385827 3.1985844 2.2948551
36 3.2571366 3.5832612 3.6925058 3.8024844 3.8697013 3.8521891 2.7376095
37 3.0877115 3.3532116 3.5978070 3.5735973 3.8229558 3.6779768 2.2878899
38 3.3282556 2.7396447 1.2871781 2.4787931 2.2424365 3.4776282 2.6473112
39 1.5116877 1.1527534 1.7581281 1.2856726 1.5442209 1.8095240 0.6930475
          15        16        17        18        19        20        21
2                                                                       
3                                                                       
4                                                                       
5                                                                       
6                                                                       
7                                                                       
8                                                                       
9                                                                       
10                                                                      
11                                                                      
12                                                                      
13                                                                      
14                                                                      
15                                                                      
16 2.7181731                                                            
17 2.7685085 0.2631057                                                  
18 2.9421613 1.6021023 1.3883635                                        
19 2.8003197 0.7830884 0.6253676 1.5510532                              
20 3.8660522 1.6675169 1.8030992 3.1495620 1.8086455                    
21 4.3992770 1.9783963 1.8318722 1.7709336 2.1059362 2.7854235          
22 3.4052538 1.1217215 1.0297203 2.0480413 0.6770385 1.3914630 2.0558760
23 3.5846476 1.2183065 1.1443429 2.1789915 0.8666451 1.2836927 2.0189998
24 2.7839310 1.0063296 1.0571254 2.2717055 0.7703122 1.3138996 2.6650701
25 0.9999770 1.7433783 1.7751547 2.0557371 1.8462917 3.0466185 3.4158214
26 3.2516266 2.2032203 2.0145335 2.1332379 1.4316699 2.8749515 2.9407839
27 5.2498574 2.8423959 2.6819851 2.9798635 2.4737243 2.7647282 2.0026444
28 5.3874718 2.7018580 2.6915153 3.5195537 2.7594319 1.9840310 2.1616844
29 5.9266344 3.3273255 3.2950321 4.0952555 3.2182462 2.4102800 2.8179662
30 2.8913979 1.0733604 1.2478441 2.0489325 1.8492002 2.1739250 2.2238210
31 2.1151517 1.0993652 1.2983209 2.1565582 1.7313426 2.2462884 2.8221066
32 1.0469398 2.2996597 2.3271437 2.2392949 2.5426597 3.7442533 3.6963544
33 2.6183325 0.5886438 0.6030059 1.2893171 1.1874285 2.2008589 1.8821918
34 2.4337015 1.1634519 1.3693511 2.6264281 1.4483011 1.4629550 3.0880243
35 2.4836767 1.1858692 1.4026880 2.2855991 1.9159069 2.2053074 2.7162373
36 1.6866653 2.0470722 2.1632903 2.4264193 2.5657287 3.3536101 3.4701000
37 0.9467371 2.0427586 2.0829128 2.1629291 2.2724426 3.4367848 3.5680047
38 3.5968249 1.8034592 2.0175065 3.4012857 2.1438256 0.7768991 3.2321878
39 2.8874851 0.6289069 0.4663076 1.5334504 0.2095087 1.7065346 1.9535688
          22        23        24        25        26        27        28
2                                                                       
3                                                                       
4                                                                       
5                                                                       
6                                                                       
7                                                                       
8                                                                       
9                                                                       
10                                                                      
11                                                                      
12                                                                      
13                                                                      
14                                                                      
15                                                                      
16                                                                      
17                                                                      
18                                                                      
19                                                                      
20                                                                      
21                                                                      
22                                                                      
23 0.2037895                                                            
24 0.8288992 0.9505214                                                  
25 2.4727469 2.6501711 1.9364552                                        
26 1.6032233 1.7589876 1.8037612 2.5243358                              
27 1.9971429 1.8834292 2.8171437 4.2899845 2.5765448                    
28 2.1954700 2.0001693 2.7915403 4.4261447 3.5667857 1.7420167          
29 2.5783710 2.3805520 3.2020054 4.9833760 3.7382796 1.6858780 0.8722205
30 2.1256556 2.1692367 1.9519574 2.0527610 3.2421149 3.5917440 3.0694714
31 2.1501552 2.2492736 1.6796358 1.3444470 3.0081890 3.9342241 3.5774715
32 3.1888718 3.3570173 2.7374200 0.8885640 3.2314939 4.8781547 4.9842114
33 1.6266008 1.7254501 1.5605478 1.6521008 2.4861204 3.1290779 3.0273378
34 1.6347901 1.7169870 0.9019951 1.7121426 2.5997005 3.5898692 3.2231472
35 2.2523446 2.3207705 1.8681350 1.7347537 3.2688463 3.9311797 3.4245706
36 3.1117130 3.2384758 2.6495728 1.3211409 3.6178000 4.8202065 4.5921346
37 2.9083149 3.0769403 2.4174893 0.5649859 2.9997530 4.6591209 4.7421214
38 1.9373000 1.8867066 1.5494389 2.8912209 3.3186717 3.5076247 2.6179084
39 0.6406454 0.8028108 0.8050701 1.9156974 1.6154385 2.4215327 2.6111177
          29        30        31        32        33        34        35
2                                                                       
3                                                                       
4                                                                       
5                                                                       
6                                                                       
7                                                                       
8                                                                       
9                                                                       
10                                                                      
11                                                                      
12                                                                      
13                                                                      
14                                                                      
15                                                                      
16                                                                      
17                                                                      
18                                                                      
19                                                                      
20                                                                      
21                                                                      
22                                                                      
23                                                                      
24                                                                      
25                                                                      
26                                                                      
27                                                                      
28                                                                      
29                                                                      
30 3.8432207                                                            
31 4.2610898 0.8464237                                                  
32 5.6175452 2.2592307 1.6784140                                        
33 3.7162731 0.8337895 1.0028774 1.9913055                              
34 3.7433768 1.6184707 1.1334625 2.4266381 1.5730820                    
35 4.1539145 0.5536384 0.4026623 1.9772247 1.0521063 1.3175091          
36 5.3049766 1.5981157 1.1084394 0.9768300 1.7052938 2.1214462 1.2637714
37 5.3570624 2.0880950 1.4370618 0.3434300 1.8002068 2.0999337 1.7735331
38 3.1106466 2.0192308 1.9644416 3.5316115 2.2605665 1.1996978 1.8988742
39 3.1112399 1.6913228 1.6528669 2.5759765 1.0588593 1.4218517 1.7991993
          36        37        38
2                               
3                               
4                               
5                               
6                               
7                               
8                               
9                               
10                              
11                              
12                              
13                              
14                              
15                              
16                              
17                              
18                              
19                              
20                              
21                              
22                              
23                              
24                              
25                              
26                              
27                              
28                              
29                              
30                              
31                              
32                              
33                              
34                              
35                              
36                              
37 0.9524280                    
38 3.0236216 3.2257321          
39 2.5264085 2.3110799 2.0457499

Menghitung matriks jarak antar observasi dalam dataset datastand menggunakan metode euclidean dan menyimpannya dalam variabel jarak.

2.3.5 Koefisien Korelasi Cophenetic

> d1 <- dist(data[, 2:4])
> # Single Linkage
> hiers <- hclust(dist(data[, 2:4]), method = "single")
> # Korelasi cophenetic
> hc1 <- hclust(d1, "single")
> d2 <- cophenetic(hc1)
> cors <- cor(d1, d2)
> print(cors)
[1] 0.6881161
> 
> # Metode Average Linkage
> hierave <- hclust(dist(data[, 2:4]), method = "average")
> # Korelasi cophenetic
> hc2 <- hclust(d1, "average")
> d3 <- cophenetic(hc2)
> corave <- cor(d1, d3)
> print(corave)
[1] 0.7584513
> 
> # Complete Linkage
> hiercomp <- hclust(dist(data[, 2:4]), method = "complete")
> # Korelasi cophenetic
> hc3 <- hclust(d1, "complete")
> d4 <- cophenetic(hc3)
> corcomp <- cor(d1, d4)
> print(corcomp)
[1] 0.7506693
> 
> # Centroid Linkage
> hiercen <- hclust(dist(data[, 2:4]), method = "centroid")
> # Korelasi cophenetic
> hc4 <- hclust(d1, "centroid")
> d5 <- cophenetic(hc4)
> corcen <- cor(d1, d5)
> print(corcen)
[1] 0.7462713
> 
> # Ward's Method
> hierward <- hclust(dist(data[, 2:4]), method = "ward.D")
> # Korelasi cophenetic
> hc5 <- hclust(d1, "ward.D")
> d6 <- cophenetic(hc5)
> corward <- cor(d1, d6)
> print(corward)
[1] 0.7445397

Untuk menentukan metode terbaik yang digunakan, perbandingan dilakukan dengan melihat nilai korelasi cophenetic dari masing-masing metode. Metode dengan nilai korelasi cophenetic tertinggi dipilih sebagai yang terbaik karena menunjukkan kesesuaian terbaik antara jarak asli dan jarak cophenetic. Fungsi hclust() digunakan untuk melakukan pengelompokan cluster hirarki dengan berbagai metode seperti single linkage, average linkage, complete linkage, centroid linkage, dan Ward’s method. Dalam perhitungan korelasi cophenetic, data yang sudah diubah menjadi jarak (d1) dibandingkan dengan koefisien cophenetic (d2, d3, dst.) yang dihasilkan dari objek cluster hc. Objek hc didefinisikan menggunakan hclust() dengan argumen berupa data yang sudah diukur jaraknya (d1), menggunakan metode clustering yang dipilih (single, average, complete, centroid, atau Ward) dan jarak Euclidean sebagai metrik pengukurannya.

> #Membuat Data Frame dengan Semua Koefisien Cophenetic
> KorCop <- data.frame(cors, corave, corcomp, corcen, corward)
> print(KorCop)
       cors    corave   corcomp    corcen   corward
1 0.6881161 0.7584513 0.7506693 0.7462713 0.7445397

2.3.6 Indeks Validitas

> library(clValid) 
> library(ggplot2)
> inval <- clValid(datastand, 2:5, clMethods = "hierarchical", validation = "internal", metric = "euclidean", method = "average")
> summary(inval)

Clustering Methods:
 hierarchical 

Cluster sizes:
 2 3 4 5 

Validation Measures:
                                 2       3       4       5
                                                          
hierarchical Connectivity   5.0869 10.6944 16.0298 24.4702
             Dunn           0.2294  0.2817  0.2166  0.2037
             Silhouette     0.3585  0.2971  0.2823  0.3218

Optimal Scores:

             Score  Method       Clusters
Connectivity 5.0869 hierarchical 2       
Dunn         0.2817 hierarchical 3       
Silhouette   0.3585 hierarchical 2       
> optimalScores(inval)
                 Score       Method Clusters
Connectivity 5.0869048 hierarchical        2
Dunn         0.2817428 hierarchical        3
Silhouette   0.3585420 hierarchical        2
> plot(inval)

Validitas cluster digunakan untuk memecahkan permasalahan utama dalam menentukan jumlah kelompok optimum. Dalam perhitungan validitas cluster disimpan dalam variabel inval. Memanggil packages clValid dan ggplot2 dengan fungsi library().

2.3.7 Proses Clustering (Metode Average Linkage)

> hirave <- hclust(dist(scale(data[, 2:4])), method = "average")
> plot(hirave, labels = data$'Kabupaten/Kota', hang = -1, col = "darkgreen", main = "Cluster Dendrogram", sub = " ", xlab = "Kabupaten/Kota", ylab = "Jarak")

> #data frame untuk anggota cluster
> anggotaave <- data.frame(id = data$'Kabupaten/Kota', cluster = cutree(hirave, k = 3))
> print(anggotaave)
                      id cluster
1      Kabupaten Pacitan       1
2     Kabupaten Ponorogo       2
3   Kabupaten Trenggalek       2
4  Kabupaten Tulungagung       2
5       Kabupaten Blitar       2
6       Kabupaten Kediri       2
7       Kabupaten Malang       2
8     Kabupaten Lumajang       2
9       Kabupaten Jember       2
10  Kabupaten Banyuwangi       2
11   Kabupaten Bondowoso       2
12   Kabupaten Situbondo       2
13 Kabupaten Probolinggo       2
14    Kabupaten Pasuruan       2
15    Kabupaten Sidoarjo       3
16   Kabupaten Mojokerto       2
17     Kabupaten Jombang       2
18     Kabupaten Nganjuk       2
19      Kabupaten Madiun       2
20     Kabupaten Magetan       2
21       Kabupaten Ngawi       2
22  Kabupaten Bojonegoro       2
23       Kabupaten Tuban       2
24    Kabupaten Lamongan       2
25      Kabupaten Gresik       3
26   Kabupaten Bangkalan       2
27     Kabupaten Sampang       2
28   Kabupaten Pamekasan       1
29     Kabupaten Sumenep       1
30           Kota Kediri       2
31           Kota Blitar       2
32           Kota Malang       3
33      Kota Probolinggo       2
34         Kota Pasuruan       2
35        Kota Mojokerto       2
36           Kota Madiun       3
37         Kota Surabaya       3
38             Kota Batu       2
39            Jawa Timur       2

> #Visualisasi Klaster dengan factoextra
> clus_hier <- eclust(datastand, FUNcluster = "hclust", k = 3, hc_method = "average", graph = TRUE)
> fviz_dend(clus_hier, rect = TRUE, cex = 0.5)

3 HASIL DAN PEMBAHASAN

3.1 Hasil Analisis Statistika Deskriptif

Berdasarkan data, diperoleh hasil analisis statistika deskriptif sebagai berikut:

	RLS	TPAK	TPT
Min	5.070	66.89	1.710
Rata-rata	8.369	73.14	4.668
Maks	11.820	81.64	8.050

Berdasarkan tabel tersebut, Rata-rata lama sekolah di kabupaten/kota bervariasi dari 5,07 tahun di Kabupaten Bangkalan hingga mencapai 11,82 tahun di Kota Mojokerto. Hal ini menunjukkan adanya perbedaan signifikan dalam tingkat pendidikan di berbagai daerah di Jawa Timur. Beberapa kabupaten seperti Kabupaten Sidoarjo dan Kota Malang memiliki rata-rata lama sekolah yang tinggi (10,78 dan 10,94 tahun), menandakan tingkat pendidikan yang lebih baik dibandingkan daerah lain.

Tingkat partisipasi angkatan kerja bervariasi dari 66,89% di Kabupaten Nganjuk hingga 81,64% di Kabupaten Pacitan, menunjukkan perbedaan dalam jumlah penduduk yang aktif secara ekonomi. Nilai mean partisipasi sebesar 73,14% menunjukkan bahwa rata-rata partisipasi angkatan kerja cukup tinggi. Tingkat pengangguran terbuka berkisar dari yang terendah di Kabupaten Sumenep (1,71%) hingga tertinggi di Kabupaten Sidoarjo (8,05%). Nilai mean sebesar 4,668% menunjukkan rata-rata tingkat pengangguran di wilayah tersebut cukup rendah.

3.2 Uji Asumsi

3.2.1 Uji Sampel Representatif

Uji sampel representatif menggunakan uji Kaiser Meyer Olkin (KMO) untuk menguji apakah sampel telah mewakili populasi. Berikut tabel uji KMO :

	RLS	TPAK	TPT
Uji KMO	0.59	0.65	0.56

Berdasarkan hasil uji Kaiser Meyer Olkin (KMO), nilai KMO secara keseluruhan adalah 0.59 ini menunjukkan bahwa data masih dapat digunakan untuk analisis faktor. Nilai MSA per variabel menunjukkan bahwa Tingkat Partisipasi Angkatan Kerja (TPAK) memiliki nilai paling tinggi (0,65), sedangkan Tingkat Pengangguran Terbuka (TPT) memiliki nilai terendah (0,56). Ini menunjukkan bahwa sampel telah representatif atau mewakili populasi.

3.2.2 Uji Non-Multikolinearitas

Uji non-multikolinearitas dilakukan untuk memastikan bahwa tidak ada multikolinearitas tinggi di antara variabel independen dalam analisis regresi. Berikut merupakan hasil uji korelasi antar variabel :

	RLS	TPAK	TPT
RLS	1.000000	-0.273599	0.576271
TPAK		1.000000	-0.466546
TPT			1.000000

Nilai korelasi antar variabel semuanya di bawah 0,8 yang berarti tidak ada indikasi multikolinearitas tinggi di antara variabel-variabel tersebut. Hal ini menunjukkan bahwa ketiga variabel ini dapat digunakan dalam model regresi tanpa resiko multikolinearitas yang signifikan.

3.3 Standarisasi

Setelah memenuhi asumsi yang dilakukan, maka dilanjutkan standarisasi data dengan mengurangi nilai mean dari setiap variabel dan membaginya dengan standar deviasinya. Hasil ini mengubah data asli menjadi data dengan mean 0 dan standar deviasi 1 yang tertera pada hasil analisis di 2.3.3.

3.4 Koefisien Korelasi Cohenetic

Koefisien korelasi cophenetic untuk berbagai metode klasterisasi diperoleh sebagai berikut:

Metode	Nilai Korelasi
Single Linkage	0.6881161
Average Linkage	0.7584513
Complete Linkage	0.7506693
Centroid Linkage	0.7462713
Ward’s Method	0.7445397

Dari hasil ini, dapat disimpulkan bahwa metode Average Linkage (corave) adalah metode terbaik untuk klasterisasi data Anda, karena memiliki koefisien cophenetic tertinggi (0,7584513), yang menunjukkan bahwa metode ini paling baik dalam mempertahankan jarak asli antara data. Single Linkage (cors), di sisi lain, memiliki koefisien terendah (0,6881161), sehingga kurang direkomendasikan untuk data ini.

3.5 Indeks Validitas

> plot(inval)

Berdasarkan grafik, Connectivity meningkat (nilai semakin besar) seiring bertambahnya jumlah klaster, yang berarti konektivitas antara data dalam klaster menurun. Nilai indeks Dunn tertinggi dicapai saat jumlah klaster adalah 3, menunjukkan jarak antar klaster yang paling optimal. Nilai silhouette yang paling tinggi pada jumlah klaster 2, mengindikasikan bahwa pembagian menjadi 2 klaster memiliki struktur yang lebih jelas dan terdefinisi dengan baik.

3.6 Analisis Cluster Metode Average Linkage

> hirave <- hclust(dist(scale(data[, 2:4])), method = "average")
> plot(hirave, labels = data$'Kabupaten/Kota', hang = -1, col = "darkgreen", main = "Cluster Dendrogram", sub = " ", xlab = "Kabupaten/Kota", ylab = "Jarak")

Klaster 1 terdiri dari Kabupaten Pacitan, Kabupaten Pamekasan, dan Kabupaten Sumenep. Ketiga kabupaten ini mungkin menghadapi tantangan tertentu dalam hal pendidikan atau pasar kerja yang memerlukan perhatian khusus untuk meningkatkan kualitas hidup masyarakatnya. Dengan jumlah anggota yang lebih kecil, klaster ini menunjukkan bahwa daerah-daerah tersebut memiliki kesamaan yang signifikan yang memisahkannya dari klaster lainnya.

Klaster 2 adalah yang terbesar, mencakup banyak kabupaten/kota seperti Kabupaten Ponorogo, Kabupaten Trenggalek, Kabupaten Tulungagung, Kabupaten Blitar, Kabupaten Kediri, Kabupaten Malang, Kabupaten Lumajang, Kabupaten Jember, Kabupaten Banyuwangi, Kabupaten Bondowoso, Kabupaten Situbondo, Kabupaten Probolinggo, Kabupaten Pasuruan, Kabupaten Mojokerto, Kabupaten Jombang, Kabupaten Nganjuk, Kabupaten Madiun, Kabupaten Magetan, Kabupaten Ngawi, Kabupaten Bojonegoro, Kabupaten Tuban, Kabupaten Lamongan, Kabupaten Bangkalan, Kabupaten Sampang, Kota Kediri, Kota Blitar, Kota Probolinggo, Kota Pasuruan, Kota Mojokerto, Kota Batu, dan Jawa Timur sebagai keseluruhan. Klaster ini mungkin mencakup daerah dengan pembangunan yang merata, di mana intervensi kebijakan dapat diterapkan secara lebih luas dan kolektif.

Klaster 3 mencakup Kabupaten Sidoarjo, Kabupaten Gresik, Kota Malang, Kota Madiun, dan Kota Surabaya. Daerah-daerah ini cenderung memiliki karakteristik yang lebih maju atau urban dibandingkan klaster lainnya. Klaster ini menunjukkan daerah yang memerlukan pendekatan kebijakan yang lebih spesifik untuk mendukung pertumbuhan ekonomi yang berkelanjutan, peningkatan layanan publik, dan penanganan tantangan urban.

3.7 Karakteristik Tiap Cluster

Cluster	RLS	TPAK	TPT
1	6.990000	760000	79.21333
2	8.101935	597079	73.21387
3	10.85000	856000	69.06800

Klaster 1 terdiri dari 3 kabupaten. Klaster ini bercirikan rata-rata lama sekolah yang paling rendah (6,99 tahun), tingkat partisipasi angkatan kerja yang paling tinggi (79,21%), dan tingkat pengangguran terbuka yang sangat rendah (1,76%). Daerah-daerah dalam klaster ini kemungkinan besar menghadapi tantangan dalam hal kualitas pendidikan, yang tercermin dari rata-rata lama sekolah yang rendah. Namun, partisipasi angkatan kerja yang tinggi menunjukkan bahwa penduduk di daerah ini lebih banyak yang terlibat dalam aktivitas ekonomi, meskipun mungkin di sektor informal atau pekerjaan dengan keterampilan rendah. Beberapa anggota dalam klaster ini cenderung memiliki karakteristik daerah yang masih berkembang dengan kebutuhan akan peningkatan kualitas pendidikan dan lapangan kerja formal.
Klaster 2 mencakup sebagian besar Kabupaten/Kota di Jawa Timur, berisi 31 Kota/Kabupaten. Klaster ini bercirikan rata-rata lama sekolah sebesar 8,10 tahun, tingkat partisipasi angkatan kerja 73,21%, dan tingkat pengangguran terbuka 4,60%. Karakteristik klaster ini menunjukkan bahwa daerah-daerah tersebut memiliki tingkat pendidikan dan partisipasi angkatan kerja yang moderat, dengan tingkat pengangguran yang relatif stabil. Klaster ini mencakup daerah-daerah dengan perkembangan sosial-ekonomi menengah, yang menunjukkan bahwa meskipun ada upaya untuk meningkatkan pendidikan dan perekonomian, masih diperlukan dukungan kebijakan untuk meningkatkan kesejahteraan masyarakat.
Klaster 3 berisi 5 kota/kabupaten. karakteristik klaster ini menunjukkan rata-rata lama sekolah yang tinggi (10,85 tahun), tingkat partisipasi angkatan kerja yang paling rendah di antara semua klaster (69,07%), dan tingkat pengangguran terbuka yang tertinggi (6,86%). Klaster ini mencerminkan daerah perkotaan atau yang lebih maju di Jawa Timur. Kota Surabaya dan Kota Malang, misalnya, dikenal sebagai pusat pendidikan dan ekonomi dengan infrastruktur yang lebih maju dibandingkan daerah lainnya. Tingkat pengangguran yang tinggi di klaster ini mungkin disebabkan oleh persaingan kerja yang ketat di wilayah perkotaan, sementara tingkat partisipasi angkatan kerja yang lebih rendah dapat mengindikasikan bahwa sebagian penduduk memilih melanjutkan pendidikan atau bekerja di sektor yang lebih spesifik. Daerah dalam klaster ini memerlukan kebijakan yang mendukung penciptaan lapangan kerja formal dan peningkatan kualitas hidup di lingkungan perkotaan.

4 PENUTUP

4.1 Kesimpulan

Dari kasus yang melibatkan 39 kabupaten/kota di Jawa Timur pada tahun 2023, analisis klaster berhasil membagi wilayah tersebut menjadi 3 klaster menggunakan metode Average Linkage, yang dipilih berdasarkan nilai koefisien cophenetic tertinggi (0,7584513), menunjukkan hasil yang paling representatif. Klaster 1 terdiri dari 3 kabupaten (Kabupaten Pacitan, Kabupaten Pamekasan, dan Kabupaten Sumenep) dengan ciri khas rata-rata lama sekolah yang rendah namun tingkat partisipasi angkatan kerja tinggi, serta tingkat pengangguran yang sangat rendah. Klaster 2 mencakup 31 kabupaten/kota yang menunjukkan karakteristik menengah dalam hal rata-rata lama sekolah, partisipasi angkatan kerja, dan tingkat pengangguran. Klaster 3 terdiri dari 5 kota/kabupaten (Kabupaten Sidoarjo, Kabupaten Gresik, Kota Malang, Kota Madiun, dan Kota Surabaya) dengan ciri khas rata-rata lama sekolah yang tinggi namun partisipasi angkatan kerja yang rendah dan tingkat pengangguran yang tinggi. Secara keseluruhan, analisis ini menunjukkan bahwa mayoritas kabupaten/kota di Jawa Timur berada dalam tingkat ekonomi menengah, namun tantangan seperti peningkatan kualitas pendidikan, pengelolaan pasar kerja, dan penurunan pengangguran tetap memerlukan perhatian lebih dari pemerintah.

4.2 Saran

Pemerintah diharapkan dapat meningkatkan akses dan kualitas pendidikan di seluruh klaster, dengan memperkuat infrastruktur pendidikan dan program beasiswa untuk mendukung peningkatan rata-rata lama sekolah. Selain itu, perlu dilakukan pengembangan program pelatihan keterampilan dan kerja sama dengan sektor swasta untuk meningkatkan partisipasi angkatan kerja, terutama di daerah dengan tingkat pengangguran yang tinggi. Pengembangan ekonomi lokal juga perlu didorong melalui dukungan pada sektor-sektor unggulan seperti pertanian, pariwisata, dan industri pengolahan untuk menciptakan lapangan kerja baru. Secara umum, kebijakan yang terpadu dan inklusif diperlukan untuk memastikan pertumbuhan ekonomi yang berkelanjutan, pengurangan pengangguran, dan peningkatan kesejahteraan masyarakat di seluruh kabupaten/kota di Jawa Timur.

5 DAFTAR PUSTAKA

Badan Pusat Statistik (BPS). (2022). Keadaan ketenagakerjaan di Indonesia Agustus 2022.

Baskoro, H. (2010). Statistik terapan untuk penelitian. Yogyakarta: Penerbit Andi.

Blanchard, O. (2017). Macroeconomics (7th ed.). Pearson.

Ghozali, I. (2018). Aplikasi analisis multivariate dengan program IBM SPSS 25. Semarang: Badan Penerbit Universitas Diponegoro.

Johnson, R. A., & Wichern, D. W. (2007). Applied multivariate statistical analysis (6th ed.). Pearson Prentice Hall.

Kuswanto, D. (2012). Statistik untuk pemula & orang awam (vi ed.). Jakarta: Laskar Aksara.

Ramadani, R., & Salma, A. (2022). Metode Average Linkage dan Ward dalam pengelompokan kesejahteraan Sumatera Barat tahun 2021. Journal of Mathematics UNP, 7(3), 11–24. P-ISSN: 2355-1658.

Rizal, A. S., & Hakim, R. B. F. Metode K-Means dan Fuzzy C-Means Cluster (Studi kasus: Indeks Pembangunan Manusia di Kawasan Indonesia Timur tahun 2012). Yogyakarta: Universitas Islam Indonesia.

Sartono, B., Affendi, F. M., Syafitri, U. D., Sumertajaya, I. M., & Angraeni, Y. (2003). Analisis peubah ganda. Bogor: IPB.

Simamora, B. (2005). Analisis multivariat pemasaran (Edisi pertama). Jakarta: PT. Gramedia Pustaka Utama.

Subagyo, P. (2003). Statistik deskriptif. Yogyakarta: BPFE-Yogyakarta.

Sugiyono. (2007). Metode penelitian kualitatif kuantitatif dan R&D. Bandung: Alfabeta.

Todaro, M. P., & Smith, S. C. (2015). Economic development. Pearson.

Pengelompokan Kabupaten/Kota di Provinsi Jawa Timur Menggunakan Analisis Cluster Hirarki Berdasarkan Indikator Pendidikan dan Ketenagakerjaan

Natasya Salsabila

2024-11-05