Pembangunan daerah di Jawa Timur menunjukkan kondisi yang cukup beragam di setiap kabupaten/kotanya. Indikator seperti Tingkat Pengangguran Terbuka (TPT), jumlah pelaku Usaha Mikro, Kecil, dan Menengah (UMKM), serta Indeks Pembangunan Manusia (IPM) menjadi gambaran penting untuk melihat kondisi sosial ekonomi di masing-masing wilayah. Perbedaan angka pada ketiga indikator tersebut mengindikasikan adanya variasi tingkat kesejahteraan dan potensi ekonomi yang cukup signifikan antardaerah.
Untuk melihat pola keragaman tersebut, diperlukan metode analisis yang dapat mengelompokkan wilayah berdasarkan karakteristik yang dimilikinya. Analisis cluster non-hirarki dengan metode K-Means adalah salah satu metode yang dapat digunakan untuk mengidentifikasi kelompok daerah dengan profil serupa. Dengan metode ini,kota dan kabupaten di Jawa Timur dapat dikelompokkan ke dalam beberapa cluster yang menggambarkan tingkat kemajuan dan potensi ekonominya berdasarkan TPT, UMKM, dan IPM.
Hasil pengelompokan ini diharapkan dapat memberikan gambaran mengenai kondisi pembangunan daerah di Provinsi Jawa Timur dan dapat digunakan sebagai landasan untuk perumusan kebijakan pembangunan daerah. Pemerintah dapat menentukan prioritas tindakan, seperti meningkatkan daya saing UMKM di wilayah yang potensinya tinggi, atau memperbaiki kualitas sumber daya manusia pada daerah yang memiliki IPM lebih rendah. Dengan demikian, analisis cluster non-hirarki tidak hanya memberikan gambaran statistik, tetapi juga membantu mendukung pengambilan keputusan yang lebih tepat sasaran dalam pembangunan daerah
Cluster non-hirarki dengan metode K-Means dipilih karena metode ini dapat mengelompokkan objek berdasarkan kemiripan karakteristik secara lebih efisien dan fleksibel dibandingkan metode hirarki. Metode ini bekerja dengan membagi data ke dalam sejumlah cluster yang telah ditentukan sebelumnya, kemudian meminimalkan jarak antar data dalam cluster yang sama agar setiap kelompok memiliki pola yang lebih homogen. Pendekatan ini sangat sesuai ketika peneliti ingin memahami struktur data secara cepat, menangani dataset berukuran menengah hingga besar, serta membutuhkan hasil pengelompokan yang mudah diinterpretasikan untuk mendukung pengambilan keputusan.
Menurut Wardono dkk (2019) dalam Zaki dkk (2022), K-Means Clustering merupakan salah satu metode dan clustering non hierarki dengan mengelompokan data ke dalam suatu cluster sehingga data yang memiliki karakteristik yang sama dikelompokan ke dalam satu cluster yang sama. Sedangkan menurut Wahyudi dkk (2020), K-Means Clustering adalah metode clustering berbasis jarak yang membagi data ke dalam sejumlah cluster dan algoritma ini hanya bekerja pada atribut numerik. Algoritma K-Means termasuk partitioning clustering yang memisahkan data ke k daerah bagian yang terpisah. Dalam metode ini, setiap data harus masuk ke dalam cluster tertentu dan setiap data memiliki kemungkinan berpindah ke cluster lainnya pada tahapan berikutnya. Langkah-langkah melakukan metode K-Means menurut Dhuhita (2015) adalah sebagai berikut:
Menentukan jumlah cluster.
Mengalokasikan data ke dalam cluster secara acak.
Menghitung centroid (pusat kelompok) dari data yang ada di masing-masing kelompok. Lokasi centroid diambil dari rata-rata semua nilai data pada setiap fiturnya.
Alokasikan masing-masing data ke centroid terdekat dengan mengukur jarak data ke centroid. Jarak yang dapat digunakan antara lain Euclidean, Manhattan, dan Mahalanobis. Pengalokasian kembali data ke dalam masing-masing kelompok didasarkan pada perbandingan jarak antara data dengan centroid setiap kelompok yang ada. Data akan dialokasikan ulang ke dalam kelompok yang memiliki centroid dengan jarak terdekat dari data tersebut.
Kembali ke langkah 3, apabila masih terdapat data yang berpindah cluster atau apabila ada perubahan nilai centroid. Jika sudah tidak ada cluster yang berubah, maka proses pengklasteran selesai.
Tujuan dilakukannya analisis ini adalah sebagai berikut:
Mengelompokkan kabupaten/kota di Jawa Timur berdasarkan angka TPT, jumlah UMKM, dan IPM.
Mengidentifikasi pola karakteristik wilayah yang memiliki kondisi sosial ekonomi serupa.
Memberikan gambaran serta informasi untuk mendukung kebijakan agar lebih tepat sasaran.
Data yang digunakan dalam analisis ini mencakup 38 kabupaten/kota di Provinsi Jawa Timur dengan tiga variabel utama, yaitu Tingkat Pengangguran Terbuka (TPT), jumlah pelaku UMKM, dan Indeks Pembangunan Manusia (IPM). Setiap wilayah memiliki karakteristik yang berbeda pada ketiga indikator tersebut, sehingga data ini dapat memberikan gambaran awal mengenai variasi kondisi sosial ekonomi yang menjadi dasar proses pengelompokan menggunakan analisis cluster non-hirarki.
## # A tibble: 6 × 4
## PROVINSI TPT UMKM IPM
## <chr> <dbl> <dbl> <dbl>
## 1 Pacitan 3.65 46807 70.2
## 2 Ponorogo 5.51 21739 72.6
## 3 Trenggalek 5.37 28358 71.3
## 4 Tulungagung 6.65 26359 74.1
## 5 Blitar 5.45 33932 72.2
## 6 Kediri 6.83 20159 74.2
Berikut ini adalah source code beserta penjelasan singkat yang digunakan dalam penelitian ini.
## package
# digunakan untuk membaca file Excel
library(readxl)
# digunakan untuk menentukan k optimal
library(cluster)
# digunakan untuk melakukan metode k-means
library(factoextra)
## Data
# Impor data
data <- read_excel("C:/Users/Hp/Downloads/DATA_JATIM.xlsx")
data
# Standarisasi Data
datafix <- scale(data[,2:4])
datafix
## Analisis Cluster non-hirarki K-Means
# Menentukan banyaknya cluster optimal dengan metode silhouette
result <- fviz_nbclust(datafix,kmeans,method="silhouette") +
labs(subtitle = "Metode Silhouette untuk Jumlah Cluster Optimal")
result
# Melakukan pengelompokan data ke dalam 2 cluster
final <- kmeans(datafix,centers=2, nstart = 25)
print(final)
# membuat plot hasil pengelompokan K-Means
fviz_cluster(final,data=datafix,
main = "Visualisasi K-Means Clustering")
# menampilkan jumlah anggota tiap cluster
table(final$cluster)
## menampilkan rata-rata tiap variabel pada masing-masing cluster
data$Cluster <- as.factor(final$cluster)
aggregate(data[, 2:4], by = list(Cluster = data$Cluster), mean)
Sebelum menjalankan analisis cluster non-hierarki menggunakan Metode
K-Means, perlu ditentukan berapa banyak jumlah cluster optimal yang
dapat terbentuk. Metode Penentuan banyak K optimal pada laporan ini
adalah menggunakan Metode Silhouette. Metode Silhouette. digunakan
karena nilai silhouette width yang dihasilkan memberikan dapat gambaran
yang jelas mengenai kualitas pemisahan antarcluster, sehingga pemilihan
jumlah cluster tidak hanya didasarkan pada visual tetapi juga pada
ukuran statistik yang objektif. Pengujian dengan Metode Silhouette
dilakukan terhadap data yang telah di standarisasi.
Berdasarkan grafik hasil perhitungan Metode Silhouette, jumlah cluster optimal ditentukan dari titik dengan nilai average silhouette width tertinggi. Pada grafik yang dihasilkan, terlihat bahwa nilai silhouette mengalami kenaikan tajam dari k = 1 menuju k = 2, kemudian mulai menurun pada k = 3 dan seterusnya. Kondisi ini menunjukkan bahwa k = 2 merupakan titik puncak yang memberikan kualitas pemisahan cluster terbaik. Dengan kata lain, pembagian data menjadi dua cluster memberikan struktur pengelompokan yang paling jelas, karena memiliki jarak antar-cluster paling besar.
Setelah jumlah cluster optimal ditetapkan, dapat dilanjutkan dengan
Metode K-Means Clustering dimana jumlah ckuster optimal sebanyak 2.
Berikut ini adalah plot penyebaran cluster hasil Metode K-Means
Clustering:
Berdasarkan Plot K-Means yang dihasilkan, terlihat bahwa titik-titik data membentuk dua kelompok yang terpisah dengan batas yang cukup jelas. Cluster pertama terlihat menyebar pada area dengan nilai TPT lebih rendah, jumlah UMKM lebih tinggi, serta IPM menengah. Sebaliknya, cluster kedua berada pada area dengan TPT lebih tinggi, jumlah UMKM lebih sedikit, namun didominasi oleh nilai IPM lebih tinggi dibanding cluster pertama.
Pemisahan ini menunjukkan bahwa mayoritas kabupaten/kota di Jawa Timur cenderung berada pada karakteristik ekonomi yang serupa, yaitu aktivitas UMKM yang lebih ramai dan tingkat pengangguran yang relatif lebih terkendali. Hal ini sesuai dengan kondisi bahwa sebagian besar daerah di Jawa Timur memiliki basis UMKM yang kuat sebagai penopang ekonomi daerah. Sementara itu, kelompok kedua berisi daerah-daerah dengan pola yang cukup berbeda, yaitu memiliki UMKM lebih sedikit namun IPM justru lebih tinggi. Hal ini dapat mengindikasikan bahwa daerah dalam cluster kedua memiliki kualitas pembangunan manusia yang lebih baik, tetapi tidak ditopang oleh basis UMKM yang besar, sehingga struktur ekonomi lokalnya tidak sama dengan daerah mayoritas lainnya.
Plot K-Means juga menggambarkan perbedaan dalam pola sosial ekonomi di Provinsi Jawa Timur. Cluster pertama menggambarkan daerah dengan ekonomi berbasis UMKM yang kuat namun capaian IPM yang belum cukup tinggi, sedangkan cluster kedua mencerminkan daerah yang secara kualitas SDM lebih maju tetapi memiliki skala ekonomi UMKM yang lebih kecil dan TPT lebih tinggi. Perbedaan pola ini dapat membantu memahami bahwa pembangunan di Jawa Timur tidak homogen, dan tiap cluster berpotensi membutuhkan strategi kebijakan yang berbeda.
Setelah analisis cluster non-hierarki dilakukan, dapat diketahui karakteristik dari masing-masing cluster yang terbentuk.
##
## 1 2
## 25 13
Hasil pengelompokan menunjukkan bahwa Cluster 1 terdiri atas 25 kabupaten/kota, sedangkan Cluster 2 terdiri atas 13 kabupaten/kota. Ketimpangan jumlah anggota ini menunjukkan bahwa mayoritas daerah di Jawa Timur memiliki karakteristik yang serupa dan tergolong dalam kelompok pertama.
Karakteristik masing-masing cluster dapat dipahami melalui nilai rata-rata setiap variabel pada kedua kelompok tersebut. Cluster 1 memiliki rata-rata TPT sebesar 4.616, jumlah UMKM sebesar 30.260,12 unit, dan IPM sebesar 71.34. Kondisi ini menggambarkan bahwa daerah-daerah yang masuk dalam cluster pertama cenderung memiliki tingkat pengangguran yang relatif lebih rendah serta jumlah UMKM yang jauh lebih besar dibandingkan cluster lainnya. Besarnya jumlah UMKM mengindikasikan bahwa sektor usaha mikro dan kecil menjadi penopang utama perekonomian daerah-daerah ini, sehingga dapat membantu menekan angka pengangguran. Namun demikian, meskipun memiliki kekuatan di sektor UMKM, cluster ini justru memiliki rata-rata IPM yang lebih rendah dibandingkan cluster kedua. Hal ini menunjukkan bahwa kualitas pembangunan manusia, yang mencakup pendidikan, kesehatan, dan standar hidup, masih perlu ditingkatkan pada daerah-daerah dalam kelompok ini.
Sementara itu, Cluster 2 memiliki karakteristik yang cukup kontras dengan rata-rata TPT sebesar 6.536, jumlah UMKM sebesar 9.076,46 unit, dan IPM sebesar 79.14. Tingginya IPM pada cluster ini menandakan bahwa daerah yang termasuk dalam kelompok kedua memiliki kualitas pembangunan manusia yang lebih baik, baik dari sisi pendidikan, kesehatan, maupun kesejahteraan. Namun, jumlah UMKM pada cluster ini jauh lebih rendah dibandingkan cluster pertama, sehingga kontribusi sektor usaha mikro terhadap perekonomian daerah masih belum optimal. Rendahnya jumlah UMKM dapat menjadi salah satu alasan mengapa tingkat pengangguran pada cluster ini lebih tinggi dibandingkan cluster pertama, karena UMKM sering kali menjadi penyerap tenaga kerja terbesar di banyak daerah.
Dari hasil analisis di atas, diperoleh disimpulkan bahwa terdapat dua cluster di Jawa Timur yang dikelompokkan berdasarkan angka TPT, IPM dan banyaknya UMKM. Dua cluster ini memiliki karakteristik yang sangat berbeda. Cluster pertama didominasi daerah dengan sektor UMKM yang kuat dan tingkat pengangguran yang rendah, tetapi kualitas pembangunan manusia masih tertinggal. Sebaliknya, cluster kedua menggambarkan daerah dengan kualitas pembangunan manusia yang tinggi namun belum ditopang oleh sektor UMKM yang memadai dan masih memiliki tingkat pengangguran yang lebih tinggi. Pola ini memberikan gambaran penting bahwa pembangunan ekonomi daerah tidak hanya bertumpu pada peningkatan kualitas manusia atau peningkatan aktivitas usaha secara terpisah, melainkan membutuhkan keseimbangan antara keduanya.
Sebagai tindak lanjut dari hasil analisis yang diperoleh, beberapa saran praktis yang dapat diterapkan untuk pengembangan project serupa antara lain:
Menambah variabel dan metode pembanding seperti tingkat kemiskinan, PDRB, atau metode clustering lain (PAM/DBSCAN) untuk memeriksa konsistensi hasil dan mendapatkan gambaran yang lebih komprehensif.
Menggunakan visualisasi spasial (peta tematik) agar perbedaan karakteristik antarwilayah lebih mudah diinterpretasikan dan dapat langsung digunakan dalam perencanaan atau penentuan kebijakan daerah.
Dhuhita, W. M. P. (2015). CLUSTERING MENGGUNAKAN METODE K-MEANS UNTUK MENENTUKAN STATUS GIZI BALITA. Jurnal Informatika, 15(2), 1-8.
Sembe, I. A., Zaki, A., & Irwan. (2022). Penerapan K-Means Clustering dalam Pengelompokan Data (Studi Kasus Profil Mahasiswa Matematika FMIPA UNM). Journal of Mathematics, Computations, and Statistics, 5(2), 163–176.
Wahyudi, M., dkk. (2020). Data Mining: Penerapan Algoritma K-Means Clustering dan K-Medoids Clustering. Yayasan Kita Menulis.
| PROVINSI | TPT | UMKM | IPM |
|---|---|---|---|
| Pacitan | 3.65 | 46807 | 70.19 |
| Ponorogo | 5.51 | 21739 | 72.59 |
| Trenggalek | 5.37 | 28358 | 71.28 |
| Tulungagung | 6.65 | 26359 | 74.14 |
| Blitar | 5.45 | 33932 | 72.25 |
| Kediri | 6.83 | 20159 | 74.20 |
| Malang | 6.57 | 39721 | 72.23 |
| Lumajang | 4.97 | 16981 | 68.48 |
| Jember | 4.06 | 46452 | 69.80 |
| Banyuwangi | 5.26 | 29902 | 73.15 |
| Bondowoso | 4.32 | 36717 | 69.91 |
| Situbondo | 3.38 | 33822 | 69.76 |
| Probolinggo | 3.25 | 27660 | 69.56 |
| Pasuruan | 5.91 | 31350 | 71.29 |
| Sidoarjo | 8.80 | 16151 | 81.37 |
| Mojokerto | 4.83 | 21972 | 75.61 |
| Jombang | 5.47 | 28640 | 74.66 |
| Nganjuk | 4.74 | 12366 | 73.95 |
| Madiun | 5.84 | 8925 | 73.51 |
| Magetan | 4.33 | 20723 | 75.76 |
| Ngawi | 2.48 | 24468 | 72.62 |
| Bojonegoro | 4.69 | 48419 | 71.15 |
| Tuban | 4.54 | 18608 | 70.79 |
| Lamongan | 6.05 | 26474 | 74.83 |
| Gresik | 7.84 | 19351 | 77.62 |
| Bangkalan | 8.05 | 20344 | 66.11 |
| Sampang | 3.11 | 15389 | 65.44 |
| Pamekasan | 1.40 | 67609 | 69.35 |
| Sumenep | 1.36 | 31691 | 68.49 |
| Kota Kediri | 4.38 | 4073 | 80.12 |
| Kota Blitar | 5.39 | 3600 | 80.15 |
| Kota Malang | 7.66 | 10837 | 83.38 |
| Kota Probolinggo | 4.57 | 3224 | 76.08 |
| Kota Pasuruan | 6.18 | 5371 | 77.71 |
| Kota Mojokerto | 5.05 | 2009 | 80.19 |
| Kota Madiun | 6.39 | 3073 | 83.02 |
| Kota Surabaya | 7.62 | 18127 | 83.32 |
| Kota Batu | 8.43 | 3094 | 78.13 |