Pengelompokan Kabupaten/Kota Berdasarkan TPT, PPM, dan IPM di Pulau Jawa pada Tahun 2023

Zaki Abiyu Aqilah

20-11-2024

1 PENDAHULUAN

1.1 Latar Belakang

Tingkat pengangguran terbuka di Indonesia telah menjadi tantangan yang terus berlanjut, yang dipengaruhi oleh berbagai faktor. Pertumbuhan penduduk, tingkat melek huruf, dan tingkat partisipasi sekolah menengah atas secara signifikan memengaruhi tingkat pengangguran (Tantri & Ratnasari, 2016). Indeks Pembangunan Manusia (IPM) memiliki pengaruh negatif terhadap tingkat pengangguran dan kemiskinan, yang menunjukkan bahwa peningkatan pembangunan manusia dapat mengurangi pengangguran (Karo Karo et al., 2023). Pandemi COVID-19 memperburuk tingkat pengangguran, dengan tingkat pengangguran mencapai 6,37% pada 2021 (Dinar & Nurfahmiyati, 2022).

Di samping itu kemiskinan masih menjadi masalah serius di Pulau Jawa, yang memiliki persentase penduduk miskin tertinggi di Indonesia (Hutahaean & Sitorus, 2022). Faktor-faktor yang mempengaruhi kemiskinan di Pulau Jawa meliputi tingkat pendidikan, jenis pekerjaan, dan karakteristik rumah tangga (Parwodiwiyono, 2021). Pengelompokan wilayah berdasarkan faktor-faktor kemiskinan menunjukkan perbedaan karakteristik antara kota-kota besar dengan tingkat kemiskinan rendah dan wilayah perdesaan dengan tingkat kemiskinan tinggi (Wahyuni & Jatmiko, 2019).

Beberapa penelitian telah menerapkan teknik pengelompokan untuk menganalisis tingkat pengangguran dan kemiskinan di seluruh provinsi di Indonesia. Agglomerative Hierarchical Clustering digunakan untuk mengkategorikan provinsi ke dalam tiga kelompok: pengangguran rendah, sedang, dan tinggi (Putra et al., 2022). Analisis pengelompokan ini memberikan wawasan yang berharga bagi para pembuat kebijakan untuk mengatasi masalah-masalah terkait pengangguran seperti kemiskinan, kriminalitas, dan ketidaksetaraan. Studi-studi tersebut menunjukkan pentingnya teknik penggalian data dalam mengekstraksi pengetahuan dari data pengangguran untuk mendukung pengambilan keputusan dan perumusan kebijakan pemerintah.

1.2 Analisis Cluster K-Means

Analisis cluster adalah teknik statistik yang digunakan untuk mengelompokkan objek-objek yang memiliki karakteristik serupa ke dalam kelompok-kelompok atau klaster. Salah satu metode yang paling populer dalam analisis cluster adalah K-Means, yang merupakan algoritma non-hirarki yang mengelompokkan data berdasarkan jarak antara data terhadap titik pusat (centroid) klaster yang ditentukan secara iteratif. Metode-metode jarak yang sering digunakan dalam K-Means termasuk jarak Euclidean, Manhattan, dan Minkowski, sedangkan metode linkage yang dapat digunakan meliputi single linkage, complete linkage, dan average linkage. Untuk mengevaluasi kualitas klaster yang dihasilkan, beberapa indeks validasi seperti Silhouette Index, Davies-Bouldin Index, dan Dunn Index sering digunakan. Indeks-indeks ini membantu dalam menilai seberapa baik data telah dikelompokkan dan seberapa jelas batas antara klaster yang berbeda. (Sumber: “Data Mining: Concepts and Techniques” oleh Jiawei Han, Micheline Kamber, dan Jian Pei, 2011).

1.3 Sumber Data

Data bersumber dari Badan Pusat Statistik (BPS) tentang Tingkat Pengangguran Terbuka (TPT), Persentase Penduduk Miskin (PPM), dan Indeks Pembangunan Manusia (IPM) di Pulau Jawa pada tahun 2023. Berikut adalah tampilan data 6 Kabupaten/Kota teratas.

> data_tpt <- read.csv("D:/DATA/TUGAS KULIAH/Analisis Multivariat/TPT.csv")
> head(data_tpt)
             Kabupaten      TPT   PPM   IPM
1     Kepulauan Seribu 8.114064 13.13 73.39
2 Kota Jakarta Selatan 5.372884  3.10 86.07
3   Kota Jakarta Timur 7.237453  4.20 84.13
4   Kota Jakarta Pusat 6.416485  4.68 82.53
5   Kota Jakarta Barat 6.386381  4.09 83.02
6   Kota Jakarta Utara 7.049135  6.78 81.11
> paged_table((data_tpt))
Error in paged_table((data_tpt)): could not find function "paged_table"

1.4 Tujuan

Berdasarkan latar belakang yang dirumuskan, tujuan dari penelitian ini adalah untuk mengetahui kabupaten/kota manakah yang termasuk ke dalam tingkat pengangguran rendah, sedang, dan tinggi, serta PPM dan IPM untuk kebijakan Pulau Jawa.

2 SOURCE CODE & PENJELASAN

2.1 Library yang Dibutuhkan

> # Library
> library(rmarkdown)
> library(factoextra)
> library(tidyverse)
> library(clValid)

2.2 Input Data

Syntax read.csv digunakan untuk membaca data dari format .csv

> data_tpt <- read.csv("D:/DATA/TUGAS KULIAH/Analisis Multivariat/TPT.csv")
>

2.3 Statistika Deskriptif

Syntax summary digunakan untuk mencari tahu berapa minimum, media,rata-rata, dan maksimum dari masing-masing variabel.

> data_tpt %>% summary()
>

2.4 Clustering K-Means

Syntax eclust digunakan untuk melakukan clustering dengan metode hierarki ataupun non-hierarki. Karena metode pada kasus ini adalah non-hierarki (k-means), maka FUNcluster = "kmeans".

> data_tpt %>% select(2:4) %>% eclust("kmeans", 3, graph = F)

2.5 Plot

> data_tpt %>% select(2:4) %>% eclust("kmeans", 3, graph = F) %>% fviz_cluster( , data = data_tpt[,2:4], palette=c("red","darkgreen","magenta"))

2.6 Indeks Validasi

> data_tpt %>% select(2:4) %>% clValid(nClust = 3,clMethods = "kmeans", validation = "internal", metric = "euclidean", method = "ward") %>% summary()

3 HASIL DAN PEMBAHASAN

3.1 Statistika Deskriptif

  Kabupaten              TPT              PPM              IPM       
 Length:119         Min.   : 1.517   Min.   : 2.380   Min.   :64.13  
 Class :character   1st Qu.: 4.135   1st Qu.: 6.640   1st Qu.:70.48  
 Mode  :character   Median : 5.429   Median : 9.270   Median :73.48  
                    Mean   : 5.560   Mean   : 9.389   Mean   :74.36  
                    3rd Qu.: 6.959   3rd Qu.:11.625   3rd Qu.:77.45  
                    Max.   :10.517   Max.   :21.760   Max.   :88.28

Statistika deskriptif tersebut menghasilkan rata-rata TPT, PPM, dan IPM berturut-turut sebesar 5.56, 9.27, dan 74.36. Hal ini mengindikasikan bahwa tingkat pengangguran terbuka di Pulau Jawa sebesar 5.56% yang mana angka tersebut sudah cukup rendah dibandingkan pulau lain di Indonesia. Sementara itu, persentase penduduk miskin di Pulau Jawa sebesar 9.27% yang mana angka tersebut hampir mendekati 10%, yang artinya 1 dari 9 orang di Pulau Jawa termasuk ke dalam kategori miskin. Selain itu, Indeks Pembangunan Manusia di Pulau Jawa dapat dikatakan sudah cukup tinggi, yaitu sebesar 74.36. Hal ini mungkin saja karena ibukota Indonesia berada di Pulau Jawa sehingga penduduk cukup terpusat baik di Pulau Jawa.

3.2 Clustering K-Means

K-means clustering with 3 clusters of sizes 28, 37, 54

Cluster means:
       TPT     PPM      IPM
1 6.169975  5.4375 82.21429
2 4.726138 13.1673 69.33514
3 5.815036  8.8500 73.71963

Clustering vector:
  [1] 3 1 1 1 1 1 3 3 2 3 2 2 3 2 2 2 3 2 3 3 3 3 2 2 1 3 1 3 1 1 1 3 3 3 3 2 2
 [38] 2 3 2 2 3 3 1 2 3 3 2 2 2 3 3 3 3 3 3 3 3 3 2 3 2 1 1 1 1 3 3 2 1 2 1 1 2
 [75] 3 3 3 3 3 3 2 2 3 2 2 2 3 1 3 3 3 3 3 2 2 2 3 3 2 2 2 2 1 1 1 3 3 1 1 1 1
[112] 2 2 3 3 1 3 3 1

Within cluster sum of squares by cluster:
[1] 351.1901 736.5803 684.9137
 (between_SS / total_SS =  67.6 %)

Available components:

 [1] "cluster"      "centers"      "totss"        "withinss"     "tot.withinss"
 [6] "betweenss"    "size"         "iter"         "ifault"       "silinfo"     
[11] "nbclust"      "data"

Berdasarkan hasil analisis cluster di atas, cluster 1, 2, dan 3 berturut-turut berisi 28, 37, dan 54 kabupaten/kota. Cluster 1 memiliki karakteristik Tingkat Pengangguran Terbuka dan Indeks Pembangunan Manusia tertinggi daripada cluster yang lain. Cluster 2 memiliki karakteristik Persentase Penduduk Miskin tertinggi dan Indeks Pembangunan Manusia Terendah. Sementara itu, karakteristik pada cluster 3 kurang menarik, tetapi berdasarkan banyaknya kabupaten/kota, cluster 3 adalah terbanyak.

Cluster 1 mengindikasikan bahwa lapangan pekerjaan di kabupaten/kota tersebut perlu diperhatikan kembali walaupun penduduk miskin disana sudah sangat kecil. Hal ini mungkin disebabkan karena daerah terebut merupakan daerah industri dengan lapangan pekerjaan yang rendah.

Cluster 2 menunjukkan bahwa kemiskinan di daerah tersebut perlu diperhatikan walaupun tingkat pengangguran terbuka disana sudah cukup kecil. Hal ini mungkin saja terjadi karena di daerah tersebut banyak penduduk yang bekerja tetapi dengan gaji yang sangat kecil, atau bisa juga disebabkan karena gaya hidup penduduk di daerah tersebut cukup tinggi (atau hedonisme) yang mengakibatkan persentase penduduk miskin daerah-daerah tersebut cukup tinggi.

Cluster 3 menjadi kumpulan daerah terbanyak. Hal ini mungkin dikarenakan banyak juga Kabupaten/Kota di Pulau Jawa yang “biasa-biasa saja”, atau dapat dikatakan terkendali.

3.3 Cluster Plot

Plot di atas menunjukkan bahwa daerah ungu sedikit beririsan dengan daerah merah. Bentuk tersebut kurang baik dalam clustering.

3.4 Indeks Validasi


Clustering Methods:
 kmeans 

Cluster sizes:
 3 

Validation Measures:
                           3
                            
kmeans Connectivity  37.5790
       Dunn           0.0313
       Silhouette     0.3466

Optimal Scores:

             Score   Method Clusters
Connectivity 37.5790 kmeans 3       
Dunn          0.0313 kmeans 3       
Silhouette    0.3466 kmeans 3

Berdasarkan hasil ketiga indeks validasi tersebut, menunjukkan bahwa indeks Connectivity cukup tinggi, indeks Dunn dan Silhoutte jauh dari angka 1. Ini menunjukkan bahwa hasil cluster tersebut kurang bagus.

4 PENUTUP

4.1 Kesimpulan

Pengelompokan 3 cluster dari 3 indikator tersebut menghasilkan 2 bentuk cluster (1 dan 2) yang sedikit tumpang tindih. Pengelompokan tersebut menghasilkan karakteristik yang unik pada masing-masing cluster. Pengangguran tertinggi ada pada cluster 1, sedangkan terendah pada cluster 2. Kemiskinan tertinggi ada pada cluster 2, sedangkan terendah pada cluster 1. Indeks pembangunan manusia tertinggi ada pada cluster 1, sedangkan terendah pada cluster 2. Daerah terbanyak ada pada cluster 3, sedangkan tersedikit cluster 1.

Sesuai tujuan, tingkat pengangguran terbuka di cluster 1, 2, dan 3 berturut-turut 28, 37, dan 54 kabupaten/kota yang mana cluster 1, 3, dan 2 adalah cluster dengan kategori tinggi, sedang, dan rendah.

4.2 Saran

Sebaiknya pemerintah daerah, khususnya pemerintah provinsi dapat memeperhatikan kondisi penduduk daerah tersebut, baik dari segi pengangguran, kemiskinan, dan kualitas (pendidikan, dan lain-lain) penduduk. Hal ini dilakukan demi kesejahteraan penduduk

5 DAFTAR PUSTAKA

Dinar, M. I. & Nurfahmiyati. (2022). Faktor yang Mempengaruhi Tingkat Pengangguran Terbuka di Indonesia Pada Tahun 2011-2021. Bandung Conference Series: Economics Studies, 2(1). https://doi.org/10.29313/bcses.v2i1.2481

Han, J., Kamber, M., & Pei, J. (2012). Data mining: Concepts and techniques (3rd ed). Elsevier/Morgan Kaufmann.

Hutahaean, Y. M., & Sitorus, J. R. H. (2022). Faktor-Faktor yang Memengaruhi Kemiskinan Rumah Tangga Bekerja di Pulau Jawa. Seminar Nasional Official Statistics, 2022(1), 1165–1176. https://doi.org/10.34123/semnasoffstat.v2022i1.1388

Parwodiwiyono, S. (2021). ANALISIS DETERMINAN KEMISKINAN DI PULAU JAWA DENGAN MODEL REGRESI SPASIAL. Seminar Nasional Geomatika, 97. https://doi.org/10.24895/SNG.2020.0-0.1124

Putra, R. Y., Kurnia, R., & Syukria, A. (2022). PENGELOMPOKAN PROVINSI DI INDONESIA BERDASARKAN DATA PENGANGGURAN MENGGUNAKAN AGGLOMERATIVE HIERARCHICAL CLUSTERING AVERAGE LINKAGE ALGORITHM. Maqdis: Jurnal Kajian Ekonomi Islam, 7(2), 26. https://doi.org/10.15548/maqdis.v7i2.242

Reynalda Utari Karo Karo, Datuk Sazli Daffa, & Nasrullah Hidayat. (2023). ANALISIS PENGARUH IPM, UMP DAN TINGKAT PARTISIPASI ANGKATAN KERJA TERHADAP PENGANGGURAN TERBUKA DI INDONESIA. Journal of Social and Economics Research, 5(2), 451–463. https://doi.org/10.54783/jser.v5i2.113

Tantri, E., & Ratnasari, V. (2016). Pengaruh Indikator Kependudukan Terhadap Tingkat Pengangguran Terbuka di Indonesia dengan Pendekatan Regresi Panel. https://api.semanticscholar.org/CorpusID:115038239

Wahyuni, S., & Jatmiko, Y. A. (2019). Pengelompokan Kabupaten/Kota di Pulau Jawa Berdasarkan Faktor-Faktor Kemiskinan dengan Pendekatan Average Linkage Hierarchical Clustering. Jurnal Aplikasi Statistika & Komputasi Statistik, 10(1), 1. https://doi.org/10.34123/jurnalasks.v10i1.197