1 PENDAHULUAN
1.1 Latar Belakang
Indonesia adalah salah satu negara yang sedang berkembang, dimana kemiskinan masih menjadi masalah utama yang cukup serius sampai saat ini, termasuk Provinsi Jawa Tengah. Jawa Tengah menduduki urutan ke-2 provinsi dengan tingkat kemiskinan tertinggi setelah Daerah Istimewa Yogyakarta di pulau jawa. Menurut data dari BPS, angka presentase penduduk miskin di Jawa Tengah telah mencapai 10.47% pada bulan Maret 2024. Dalam hal ini, pemerintah terus berusaha menangani masalah kemiskinan yang masih menjadi tantangan besar untuk dihadapi. Pemerintah diharapkan dapat merumuskan suatu kebijakan yang lebih tepat dalam menangani kemiskinan dengan memahami indikator kemiskinan. Pengelompokan kabupaten berdasarkan garis kemiskinan, jumlah penduduk miskin, dan presentase penduduk miskin sangat penting untuk mengidentifikasi lebih lanjut daerah – daerah yang membutuhkan penanganan lebih lanjut dalam program – program yang dijalankan oleh pemerintah. Dengan melakukan analisis pengelompokan ini diharapkan dapat diperoleh gambaran yang lebih jelas mengenai distribusi kemiskinan di Provinsi Jawa Tengah agar dapat memberikan rekomendasi kebijakan yang lebih efektif dalam menangani masalah kemiskinan.
1.2 Tinjauan Pustaka
1.2.1 Analisis Cluster
Analisis cluster adalah teknik analisis multivariat yang bertujuan mengelompokkan objek – objek ke dalam dua atau lebih kelompok berdasarkan kesamaan karakteristik (Simamora Faradilla, 2022). Dalam hal ini, objek yang berada dalam kelompok yang sama akan lebih mirip daripada objek antar kelompok. Untuk mengukur tingkat kemiripan antar objek digunakan metrik yang berfungsi untuk menyederhanakan struktur kelompok dari data yang kompleks.
1.2.2 Metode hierarchical
Metode ini memulai pengelompokan dengan dua atau lebih objek yang mempunyai kesamaan paling dekat, kemudian proses diteruskan ke objek lain yang mempunyai kedekatan kedua dan seterusnya sehingga cluster akan terbentuk semacam pohon dimana ada tingkatan yang jelas antar objek (Talakua, Leleury, dan Talluta., 2014). Beberapa jenis metode hierarchical meliputi:
- Single Linkage : Jarak dua cluster diukur dari jarak terdekat antar objek dalam satu cluster dengan objek dalam cluster lain
- Complete Linkage : Jarak dua cluster diukur dari dari jarak terjauh antar objek dalam satu cluster dengan objek dalam cluster lain
- Average Linkage : Jarak dua cluster diukur dengan rata – rata jarak antar objek dalam satu cluster dengan objek dalam cluster lain
- Metode Ward : Metode ini bertujuan untuk memperoleh kelompok dengan varian internal sekecil mungkin.
1.3 Sumber Data
Data diperoleh dari Badan Pusat Statistik (BPS) tentang tingkat kemiskinan berdasarkan garis kemiskinan, jumlah penduduk miskin, dan presentase penduduk miskin pada Kabupaten di Jawa Tengah tahun 2024
| Kabupaten | Garis_Kemiskinan | Jumlah_Penduduk_Miskin | Persentase_Penduduk_Miskin |
|---|---|---|---|
| Kabupaten Cilacap | 441093 | 186.08 | 10.68 |
| Kabupaten Banyumas | 500861 | 207.78 | 11.95 |
| Kabupaten Purbalingga | 460870 | 136.72 | 14.18 |
| Kabupaten Banjarnegara | 398344 | 137.68 | 14.71 |
| Kabupaten Kebumen | 471824 | 187.95 | 15.71 |
| Kabupaten Purworejo | 459253 | 78.02 | 10.87 |
| Kabupaten Wonosobo | 456351 | 121.49 | 15.28 |
| Kabupaten Magelang | 431289 | 143.80 | 10.83 |
| Kabupaten Boyolali | 442071 | 95.96 | 9.63 |
| Kabupaten Klaten | 505826 | 141.84 | 12.04 |
| Kabupaten Sukoharjo | 501693 | 68.15 | 7.47 |
| Kabupaten Wonogiri | 443563 | 102.57 | 10.71 |
| Kabupaten Karanganyar | 491551 | 87.37 | 9.59 |
| Kabupaten Sragen | 453663 | 110.65 | 12.41 |
| Kabupaten Grobogan | 489208 | 159.00 | 11.43 |
| Kabupaten Blora | 464959 | 99.14 | 11.42 |
| Kabupaten Rembang | 518607 | 91.45 | 14.02 |
| Kabupaten Pati | 559499 | 116.84 | 9.17 |
| Kabupaten Kudus | 550075 | 65.69 | 7.23 |
| Kabupaten Jepara | 503832 | 80.84 | 6.09 |
| Kabupaten Demak | 535134 | 142.91 | 11.89 |
| Kabupaten Semarang | 520639 | 76.87 | 6.96 |
| Kabupaten Temanggung | 416086 | 68.77 | 8.67 |
| Kabupaten Kendal | 488940 | 92.70 | 9.35 |
| Kabupaten Batang | 412196 | 68.85 | 8.73 |
| Kabupaten Pekalongan | 505520 | 81.72 | 8.95 |
| Kabupaten Pemalang | 493593 | 194.20 | 14.92 |
| Kabupaten Tegal | 497315 | 98.02 | 6.81 |
| Kabupaten Brebes | 542495 | 283.28 | 15.60 |
| Kota Magelang | 626614 | 7.25 | 5.94 |
| Kota Surakarta | 638102 | 43.28 | 8.31 |
| Kota Salatiga | 596659 | 9.33 | 4.57 |
| Kota Semarang | 671936 | 77.79 | 4.03 |
| Kota Pekalongan | 605312 | 21.16 | 6.71 |
| Kota Tegal | 664922 | 19.17 | 7.64 |
1.4 Tujuan
Tujuan dari penelitian ini adalah mengelompokkan kabupaten di Jawa Tengah berdasarkan indikator kemiskinan agar dapat memberikan rekomendasi kebijakan pada Pemerintah.
2 SOURCE CODE dan PENJELASAN
2.1 Library yang Dibutuhkan
2.2 Input Data
datauap <- read_excel("C:/Users/WINDOWS 11/Downloads/Data uap anmul.xlsx")
data.fix <- data.frame(datauap)
View(data.fix)Syntax ini digunakan untuk memindahkan file dari excel dengan format xlsx atau xls ke R studio.
2.3 Uji Asumsi Sampel Representatif
Syntax ini digunakan untuk menilai representativitas data dengan menggunakan uji Kaiser-Meyer-Oklin (KMO).
2.4 Uji Asumsi Non-Multikolinearitas
Syntax ini digunakan untuk mengecek adanya multikolinearitas antar variabel dengan menggunakkan uji pearson.
2.5 Standarisasi
Syntax ini digunakan untuk melakukan standarisasi data dan mengganti nama baris pada data set yang sudah di standarisasi.
2.6 Koefisien Korelasi Cophenetic
d1 <- dist(data.fix[,2:4])
#Single Linkage
hiers <- hclust(dist(data.fix[,2:4]), method = "single")
#korelasi cophenetic
hc1 <- hclust(d1, "single")
d2 <- cophenetic(hc1)
cors <- cor(d1,d2)
cors
#Average Linkage
hierave <- hclust(dist(data.fix[,2:4]), method = "ave")
#korelasi cophenetic
hc2 <- hclust(d1, "ave")
d3 <- cophenetic(hc2)
corave <- cor(d1,d3)
corave
#Complete Linkage
hiercomp <- hclust(dist(data.fix[,2:4]), method = "complete")
#korelasi cophenetic
hc3 <- hclust(d1, "complete")
d4 <- cophenetic(hc3)
corcomp <- cor(d1,d4)
corcomp
#Centorid Linkage
hiercen <- hclust(dist(data.fix[,2:4]), method = "centroid")
#korelasi cophenetic
hc4 <- hclust(d1, "centroid")
d5 <- cophenetic(hc4)
corcen <- cor(d1,d5)
corcen
#Ward
hierward <- hclust(dist(data.fix[,2:4]), method = "ward.D")
#korelasi cophenetic
hc5 <- hclust(d1,"ward.D")
d6 <- cophenetic(hc5)
corward <- cor(d1,d6)
corward
KorCop<-data.frame(cors,corave,corcomp,corcen,corward)
KorCopSyntax ini digunakan sebagai dasar dalam penentuan metode terbaik yang akan digunakan dalam analisis cluster hierarchical.
2.7 Indeks Validitas
inval <- clValid(datastand, 2:4, clMethods = "hierarchical", validation = "internal", metric = "euclidean", method = "average")
summary(inval)
optimalScores(inval)Syntax ini digunakan untuk membantu menentukan jumlah cluster optimal berdasarkan indeks validitas.
2.8 Metode Average Linkage
Syntax ini digunakan untuk melakukan analisis hierarchical clustering dengan metode rata - rata (average linkage).
3 HASIL dan PEMBAHASAN
3.1 Uji Asumsi Sampel Representatif
Berikut adalah hasil perhitungan dari uji KMO
## Kaiser-Meyer-Olkin factor adequacy
## Call: KMO(r = data.fix[, 2:4])
## Overall MSA = 0.62
## MSA for each item =
## X1 X2 X3
## 0.77 0.61 0.58
Dapat dilihat pada output tersebut bahwa uji KMO pada masing - masing variabel bernilai lebih dari 0.5, sehingga dapat disimpulkan bahwa data telah representatif.
3.2 Uji Asumsi Non-Multikolinearitas
## X1 X2 X3
## X1 1.0000000 -0.4145491 -0.5316804
## X2 -0.4145491 1.0000000 0.7567908
## X3 -0.5316804 0.7567908 1.0000000
Dapat dilihat pada output tersebut bahwa nilai korelasi antar variabel kurang dari 0.8, sehingga dapat disimpulkan bahwa tidak ada multikolinieritas antar variabel.
3.3 Standarisasi
## X1 X2 X3
## [1,] -0.93876869 1.35008505 0.1717098
## [2,] -0.09290480 1.71518987 0.5671762
## [3,] -0.65887560 0.51959776 1.2615778
## [4,] -1.54377196 0.53574987 1.4266150
## [5,] -0.50384962 1.38154800 1.7380059
## [6,] -0.68176012 -0.46803602 0.2308741
## [7,] -0.72283054 0.26335138 1.6041078
## [8,] -1.07751935 0.63871952 0.2184184
## [9,] -0.92492759 -0.16619360 -0.1552506
## [10,] -0.02263786 0.60574231 0.5952014
## [11,] -0.08112996 -0.63409983 -0.8278548
## [12,] -0.90381213 -0.05497964 0.1810515
## [13,] -0.22466415 -0.31072127 -0.1677062
## [14,] -0.76087234 0.08096722 0.7104160
## [15,] -0.25782335 0.89446115 0.4052530
## [16,] -0.60100622 -0.11268976 0.4021391
## [17,] 0.15824466 -0.24207483 1.2117553
## [18,] 0.73696682 0.18511464 -0.2984904
## [19,] 0.60359409 -0.67548959 -0.9025887
## [20,] -0.05085786 -0.42058922 -1.2575742
## [21,] 0.39214227 0.62374518 0.5484928
## [22,] 0.18700245 -0.48738489 -0.9866642
## [23,] -1.29267912 -0.62366826 -0.4541858
## [24,] -0.26161621 -0.22104345 -0.2424400
## [25,] -1.34773217 -0.62232225 -0.4355024
## [26,] -0.02696851 -0.40578313 -0.3669964
## [27,] -0.19576484 1.48670492 1.4920071
## [28,] -0.14308940 -0.13153388 -1.0333728
## [29,] 0.49631849 2.98548546 1.7037529
## [30,] 1.68680880 -1.65874885 -1.3042829
## [31,] 1.84939220 -1.05254024 -0.5662865
## [32,] 1.26287203 -1.62375263 -1.7308883
## [33,] 2.32822634 -0.47190580 -1.8990394
## [34,] 1.38533322 -1.42471161 -1.0645119
## [35,] 2.22896102 -1.45819357 -0.7749184
## attr(,"scaled:center")
## X1 X2 X3
## 507425.57143 105.83771 10.12857
## attr(,"scaled:scale")
## X1 X2 X3
## 70659.121881 59.434986 3.211398
Nilai positif pada data yang telah distandarisasi menunjukkan nilai tersebut lebih besar daripada rata - rata, nilai negatif menunjukkan nilai tersebut lebik kecil daripada rata - rata, dan nilai 0 menunjukkan nilai tersebut persis di rata - rata.
3.4 Koefisien Korelasi Cophenetic
## cors corave corcomp corcen corward
## 1 0.8256399 0.8444567 0.8273828 0.8418593 0.8153526
Dari output dapat dilihat bahwa metode dengan nilai korelasi mendekati 1 adalah metode average linkage, sehingga metode average linkage dipilih sebagai metode terbaik.
3.5 Metode Average Linkage
## Score Method Clusters
## Connectivity 3.1289683 hierarchical 2
## Dunn 0.3199090 hierarchical 2
## Silhouette 0.3932052 hierarchical 2
Berdasarkan indeks connectivity, indeks dunn, dan indeks silhouette terpilih jumlah cluster sebanyak dua sebagai cluster yang optimal pada metode pengelompokan average linkage.
3.6 Cluster Dendogram
Berdasarkan output tersebut dapat dilihat:
- Cluster 1 : Pada dendogram berwarna merah yang terdiri dari Kabupaten Magelang, Surakarta, Salatiga, Semarang, Pekalongan, dan Tegal.
- Cluster 2 : Pada dendogram berwarna hijau yang terdiri dari 29 Kabupaten yaitu, Kabupaten Cilacap, Banyumas, Purbalingga, Banjarnegara, Kebumen, Purworejo, Wonosobo, Magelang, Boyolali, Klaten, Sukoharjo, Wonogiri, Karanganyar, Sragen, Grobogan, Blora, Rembang, Pati, Kudus, Jepara, Demak, Semarang, Temanggung, Kendal, Batang, Pekalongan, Pemalang, Tegal, dan Brebes
3.7 Karakteristik Setiap Cluster
## Group.1 X1 X2 X3
## 1 1 481253.4 121.59793 10.94138
## 2 2 633924.2 29.66333 6.20000
Pada output dapat dilihat bahwa, cluster 1 memiliki garis kemiskinan (X1) yang lebih rendah dibandingkan dengan cluste 2. tetapi jumlah penduduk miskin (X2) dan presentase penduduk miskin (X3) memiliki nilai yang lebih tinggi daripada cluster 2.
3.8 Indeks Validitas
##
## Clustering Methods:
## hierarchical
##
## Cluster sizes:
## 2 3 4
##
## Validation Measures:
## 2 3 4
##
## hierarchical Connectivity 3.1290 7.4694 17.4016
## Dunn 0.3199 0.3105 0.3172
## Silhouette 0.3932 0.3873 0.3649
##
## Optimal Scores:
##
## Score Method Clusters
## Connectivity 3.1290 hierarchical 2
## Dunn 0.3199 hierarchical 2
## Silhouette 0.3932 hierarchical 2
Berdasarkan hasil ketiga indeks validasi tersebut, dapat dilihat bahwa indeks connectivity memiliki nilai lebih dari 1 namun pada indeks dunn dan silhouette jauh dari angka 1. Maka disimpulkan, hasil cluster tersebut kurang baik.
4 PENUTUP
4.1 Kesimpulan
Pengelompokan dari ketiga indikator tersebut menghasilkan 2 buah cluster yang dapat menunjukkan daerah kabupaten yang harus lebih diutamakan pemerintah dalam menjalankan program - program yang bertujuan untuk mengurangi tingkat kemiskinan. Kabupaten Magelang, Surakarta, Salatiga, Semarang, Pekalongan, dan Tegal merupakan kabupaten yang lebih mendesak duntuk diperhatikan lebih lagi oleh pemerintah dan dapat menjadi prioritas pemantauan karena angka kemiskinan pada kabupaten - kabupaten ini relatif lebih tinggi baik jumlah penduduk maupun presentase penduduk. Sedangkan kabupaten selain itu tergolong kabupaten - kabupaten yang cenderung dalam kondisi lebih baik sehingga boleh untuk tidak termasuk dalam prioritas untuk pemantauan langsung.
4.2 Saran
Sebaiknya, pemerintah bisa lebih fokus pada daerah kabupaten - kabupaten dengan jumlah penduduk miskin yang besar dengan presentase yang tinggi. Pemerintah juga dapat melaksanakan program - program yang efektif pada kabupaten yang menjadi prioritas utama dalam pemantauan seperti mengalokasikan intervensi bantuan sosial secara langsung, program pengentasan kemiskinan berbasis lapangan kerja, ataupun perbaikan infrastruktur untuk mengurangi biaya hidup sehingga dapat menekan garis kemiskinan. Pemerintah juuga harus terus mempertahankan program keberlanjutan yang ada untuk kabupaten - kabupaten yang tidak termasuk dalam prioritas utama sehingga stabilitas ekonomi terjaga.
4.3 Daftar Pustaka
Faradilla, S. B. (2022). Komparasi Analisis K-Medoids Clustering dan Hierarchical Clustering (Studi Kasus: Data Kriminalitas di Indonesia Tahun 2020) (Doctoral dissertation, Universitas Islam Indonesia).
Talakua, M., W., Leleury, Z., A., & Talluta, A., W. (2014). ANALISIS CLUSTER DENGAN MENGGUNAKAN METODE K-MEANS UNTUK PENGELOMPOKKAN KABUPATEN/KOTA DI PROVINSI MALUKU BERDASARKAN INDIKATOR INDEKS PEMBANGUNAN MANUSIA TAHUN 2014. BAREKENG: Jurnal Ilmu Matematika dan Terapan, 11(2), 121.