Tingkat pengangguran terbuka di Indonesia telah menjadi tantangan yang terus berlanjut, yang dipengaruhi oleh berbagai faktor. Pertumbuhan penduduk, tingkat melek huruf, dan tingkat partisipasi sekolah menengah atas secara signifikan memengaruhi tingkat pengangguran (Tantri & Ratnasari, 2016). Indeks Pembangunan Manusia (IPM) memiliki pengaruh negatif terhadap tingkat pengangguran dan kemiskinan, yang menunjukkan bahwa peningkatan pembangunan manusia dapat mengurangi pengangguran (Karo Karo et al., 2023). Pandemi COVID-19 memperburuk tingkat pengangguran, dengan tingkat pengangguran mencapai 6,37% pada 2021 (Dinar & Nurfahmiyati, 2022).
Di samping itu kemiskinan masih menjadi masalah serius di Pulau Jawa, yang memiliki persentase penduduk miskin tertinggi di Indonesia (Hutahaean & Sitorus, 2022). Faktor-faktor yang mempengaruhi kemiskinan di Pulau Jawa meliputi tingkat pendidikan, jenis pekerjaan, dan karakteristik rumah tangga (Parwodiwiyono, 2021). Pengelompokan wilayah berdasarkan faktor-faktor kemiskinan menunjukkan perbedaan karakteristik antara kota-kota besar dengan tingkat kemiskinan rendah dan wilayah perdesaan dengan tingkat kemiskinan tinggi (Wahyuni & Jatmiko, 2019).
Beberapa penelitian telah menerapkan teknik pengelompokan untuk menganalisis tingkat pengangguran dan kemiskinan di seluruh provinsi di Indonesia. Agglomerative Hierarchical Clustering digunakan untuk mengkategorikan provinsi ke dalam tiga kelompok: pengangguran rendah, sedang, dan tinggi (Putra et al., 2022). Analisis pengelompokan ini memberikan wawasan yang berharga bagi para pembuat kebijakan untuk mengatasi masalah-masalah terkait pengangguran seperti kemiskinan, kriminalitas, dan ketidaksetaraan. Studi-studi tersebut menunjukkan pentingnya teknik penggalian data dalam mengekstraksi pengetahuan dari data pengangguran untuk mendukung pengambilan keputusan dan perumusan kebijakan pemerintah.
Analisis cluster adalah teknik statistik yang digunakan untuk mengelompokkan objek-objek yang memiliki karakteristik serupa ke dalam kelompok-kelompok atau klaster. Salah satu metode yang paling populer dalam analisis cluster adalah K-Means, yang merupakan algoritma non-hirarki yang mengelompokkan data berdasarkan jarak antara data terhadap titik pusat (centroid) klaster yang ditentukan secara iteratif. Metode-metode jarak yang sering digunakan dalam K-Means termasuk jarak Euclidean, Manhattan, dan Minkowski, sedangkan metode linkage yang dapat digunakan meliputi single linkage, complete linkage, dan average linkage. Untuk mengevaluasi kualitas klaster yang dihasilkan, beberapa indeks validasi seperti Silhouette Index, Davies-Bouldin Index, dan Dunn Index sering digunakan. Indeks-indeks ini membantu dalam menilai seberapa baik data telah dikelompokkan dan seberapa jelas batas antara klaster yang berbeda. (Sumber: “Data Mining: Concepts and Techniques” oleh Jiawei Han, Micheline Kamber, dan Jian Pei, 2011).
Data bersumber dari Badan Pusat Statistik (BPS) tentang Tingkat Pengangguran Terbuka (TPT), Persentase Penduduk Miskin (PPM), dan Indeks Pembangunan Manusia (IPM) di Pulau Jawa pada tahun 2023. Berikut adalah tampilan data 6 Kabupaten/Kota teratas.
> data_tpt <- read.csv("D:/DATA/TUGAS KULIAH/Analisis Multivariat/TPT.csv")
> head(data_tpt)
Kabupaten TPT PPM IPM
1 Kepulauan Seribu 8.114064 13.13 73.39
2 Kota Jakarta Selatan 5.372884 3.10 86.07
3 Kota Jakarta Timur 7.237453 4.20 84.13
4 Kota Jakarta Pusat 6.416485 4.68 82.53
5 Kota Jakarta Barat 6.386381 4.09 83.02
6 Kota Jakarta Utara 7.049135 6.78 81.11
> paged_table((data_tpt))
Error in paged_table((data_tpt)): could not find function "paged_table"Berdasarkan latar belakang yang dirumuskan, tujuan dari penelitian ini adalah untuk mengetahui kabupaten/kota manakah yang termasuk ke dalam tingkat pengangguran rendah, sedang, dan tinggi, serta PPM dan IPM untuk kebijakan Pulau Jawa.
Syntax read.csv digunakan untuk membaca data dari format
.csv
Syntax summary digunakan untuk mencari tahu berapa
minimum, media,rata-rata, dan maksimum dari masing-masing variabel.
Syntax eclust digunakan untuk melakukan clustering
dengan metode hierarki ataupun non-hierarki. Karena metode pada kasus
ini adalah non-hierarki (k-means), maka
FUNcluster = "kmeans".
Kabupaten TPT PPM IPM
Length:119 Min. : 1.517 Min. : 2.380 Min. :64.13
Class :character 1st Qu.: 4.135 1st Qu.: 6.640 1st Qu.:70.48
Mode :character Median : 5.429 Median : 9.270 Median :73.48
Mean : 5.560 Mean : 9.389 Mean :74.36
3rd Qu.: 6.959 3rd Qu.:11.625 3rd Qu.:77.45
Max. :10.517 Max. :21.760 Max. :88.28
Statistika deskriptif tersebut menghasilkan rata-rata TPT, PPM, dan IPM berturut-turut sebesar 5.56, 9.27, dan 74.36. Hal ini mengindikasikan bahwa tingkat pengangguran terbuka di Pulau Jawa sebesar 5.56% yang mana angka tersebut sudah cukup rendah dibandingkan pulau lain di Indonesia. Sementara itu, persentase penduduk miskin di Pulau Jawa sebesar 9.27% yang mana angka tersebut hampir mendekati 10%, yang artinya 1 dari 9 orang di Pulau Jawa termasuk ke dalam kategori miskin. Selain itu, Indeks Pembangunan Manusia di Pulau Jawa dapat dikatakan sudah cukup tinggi, yaitu sebesar 74.36. Hal ini mungkin saja karena ibukota Indonesia berada di Pulau Jawa sehingga penduduk cukup terpusat baik di Pulau Jawa.
K-means clustering with 3 clusters of sizes 28, 37, 54
Cluster means:
TPT PPM IPM
1 6.169975 5.4375 82.21429
2 4.726138 13.1673 69.33514
3 5.815036 8.8500 73.71963
Clustering vector:
[1] 3 1 1 1 1 1 3 3 2 3 2 2 3 2 2 2 3 2 3 3 3 3 2 2 1 3 1 3 1 1 1 3 3 3 3 2 2
[38] 2 3 2 2 3 3 1 2 3 3 2 2 2 3 3 3 3 3 3 3 3 3 2 3 2 1 1 1 1 3 3 2 1 2 1 1 2
[75] 3 3 3 3 3 3 2 2 3 2 2 2 3 1 3 3 3 3 3 2 2 2 3 3 2 2 2 2 1 1 1 3 3 1 1 1 1
[112] 2 2 3 3 1 3 3 1
Within cluster sum of squares by cluster:
[1] 351.1901 736.5803 684.9137
(between_SS / total_SS = 67.6 %)
Available components:
[1] "cluster" "centers" "totss" "withinss" "tot.withinss"
[6] "betweenss" "size" "iter" "ifault" "silinfo"
[11] "nbclust" "data"
Berdasarkan hasil analisis cluster di atas, cluster 1, 2, dan 3 berturut-turut berisi 28, 37, dan 54 kabupaten/kota. Cluster 1 memiliki karakteristik Tingkat Pengangguran Terbuka dan Indeks Pembangunan Manusia tertinggi daripada cluster yang lain. Cluster 2 memiliki karakteristik Persentase Penduduk Miskin tertinggi dan Indeks Pembangunan Manusia Terendah. Sementara itu, karakteristik pada cluster 3 kurang menarik, tetapi berdasarkan banyaknya kabupaten/kota, cluster 3 adalah terbanyak.
Cluster 1 mengindikasikan bahwa lapangan pekerjaan di kabupaten/kota tersebut perlu diperhatikan kembali walaupun penduduk miskin disana sudah sangat kecil. Hal ini mungkin disebabkan karena daerah terebut merupakan daerah industri dengan lapangan pekerjaan yang rendah.
Cluster 2 menunjukkan bahwa kemiskinan di daerah tersebut perlu diperhatikan walaupun tingkat pengangguran terbuka disana sudah cukup kecil. Hal ini mungkin saja terjadi karena di daerah tersebut banyak penduduk yang bekerja tetapi dengan gaji yang sangat kecil, atau bisa juga disebabkan karena gaya hidup penduduk di daerah tersebut cukup tinggi (atau hedonisme) yang mengakibatkan persentase penduduk miskin daerah-daerah tersebut cukup tinggi.
Cluster 3 menjadi kumpulan daerah terbanyak. Hal ini mungkin dikarenakan banyak juga Kabupaten/Kota di Pulau Jawa yang “biasa-biasa saja”, atau dapat dikatakan terkendali.
Plot di atas menunjukkan bahwa daerah ungu sedikit beririsan dengan
daerah merah. Bentuk tersebut kurang baik dalam clustering.
Clustering Methods:
kmeans
Cluster sizes:
3
Validation Measures:
3
kmeans Connectivity 37.5790
Dunn 0.0313
Silhouette 0.3466
Optimal Scores:
Score Method Clusters
Connectivity 37.5790 kmeans 3
Dunn 0.0313 kmeans 3
Silhouette 0.3466 kmeans 3
Berdasarkan hasil ketiga indeks validasi tersebut, menunjukkan bahwa indeks Connectivity cukup tinggi, indeks Dunn dan Silhoutte jauh dari angka 1. Ini menunjukkan bahwa hasil cluster tersebut kurang bagus.
Pengelompokan 3 cluster dari 3 indikator tersebut menghasilkan 2 bentuk cluster (1 dan 2) yang sedikit tumpang tindih. Pengelompokan tersebut menghasilkan karakteristik yang unik pada masing-masing cluster. Pengangguran tertinggi ada pada cluster 1, sedangkan terendah pada cluster 2. Kemiskinan tertinggi ada pada cluster 2, sedangkan terendah pada cluster 1. Indeks pembangunan manusia tertinggi ada pada cluster 1, sedangkan terendah pada cluster 2. Daerah terbanyak ada pada cluster 3, sedangkan tersedikit cluster 1.
Sesuai tujuan, tingkat pengangguran terbuka di cluster 1, 2, dan 3 berturut-turut 28, 37, dan 54 kabupaten/kota yang mana cluster 1, 3, dan 2 adalah cluster dengan kategori tinggi, sedang, dan rendah.
Sebaiknya pemerintah daerah, khususnya pemerintah provinsi dapat memeperhatikan kondisi penduduk daerah tersebut, baik dari segi pengangguran, kemiskinan, dan kualitas (pendidikan, dan lain-lain) penduduk. Hal ini dilakukan demi kesejahteraan penduduk
Dinar, M. I. & Nurfahmiyati. (2022). Faktor yang Mempengaruhi Tingkat Pengangguran Terbuka di Indonesia Pada Tahun 2011-2021. Bandung Conference Series: Economics Studies, 2(1). https://doi.org/10.29313/bcses.v2i1.2481
Han, J., Kamber, M., & Pei, J. (2012). Data mining: Concepts and techniques (3rd ed). Elsevier/Morgan Kaufmann.
Hutahaean, Y. M., & Sitorus, J. R. H. (2022). Faktor-Faktor yang Memengaruhi Kemiskinan Rumah Tangga Bekerja di Pulau Jawa. Seminar Nasional Official Statistics, 2022(1), 1165–1176. https://doi.org/10.34123/semnasoffstat.v2022i1.1388
Parwodiwiyono, S. (2021). ANALISIS DETERMINAN KEMISKINAN DI PULAU JAWA DENGAN MODEL REGRESI SPASIAL. Seminar Nasional Geomatika, 97. https://doi.org/10.24895/SNG.2020.0-0.1124
Putra, R. Y., Kurnia, R., & Syukria, A. (2022). PENGELOMPOKAN PROVINSI DI INDONESIA BERDASARKAN DATA PENGANGGURAN MENGGUNAKAN AGGLOMERATIVE HIERARCHICAL CLUSTERING AVERAGE LINKAGE ALGORITHM. Maqdis: Jurnal Kajian Ekonomi Islam, 7(2), 26. https://doi.org/10.15548/maqdis.v7i2.242
Reynalda Utari Karo Karo, Datuk Sazli Daffa, & Nasrullah Hidayat. (2023). ANALISIS PENGARUH IPM, UMP DAN TINGKAT PARTISIPASI ANGKATAN KERJA TERHADAP PENGANGGURAN TERBUKA DI INDONESIA. Journal of Social and Economics Research, 5(2), 451–463. https://doi.org/10.54783/jser.v5i2.113
Tantri, E., & Ratnasari, V. (2016). Pengaruh Indikator Kependudukan Terhadap Tingkat Pengangguran Terbuka di Indonesia dengan Pendekatan Regresi Panel. https://api.semanticscholar.org/CorpusID:115038239
Wahyuni, S., & Jatmiko, Y. A. (2019). Pengelompokan Kabupaten/Kota di Pulau Jawa Berdasarkan Faktor-Faktor Kemiskinan dengan Pendekatan Average Linkage Hierarchical Clustering. Jurnal Aplikasi Statistika & Komputasi Statistik, 10(1), 1. https://doi.org/10.34123/jurnalasks.v10i1.197