1 PENDAHULUAN

1.1 Latar Belakang

Indonesia adalah salah satu negara yang sedang berkembang, dimana kemiskinan masih menjadi masalah utama yang cukup serius sampai saat ini, termasuk Provinsi Jawa Tengah. Jawa Tengah menduduki urutan ke-2 provinsi dengan tingkat kemiskinan tertinggi setelah Daerah Istimewa Yogyakarta di pulau jawa. Menurut data dari BPS, angka presentase penduduk miskin di Jawa Tengah telah mencapai 10.47% pada bulan Maret 2024. Dalam hal ini, pemerintah terus berusaha menangani masalah kemiskinan yang masih menjadi tantangan besar untuk dihadapi. Pemerintah diharapkan dapat merumuskan suatu kebijakan yang lebih tepat dalam menangani kemiskinan dengan memahami indikator kemiskinan. Pengelompokan kabupaten berdasarkan garis kemiskinan, jumlah penduduk miskin, dan presentase penduduk miskin sangat penting untuk mengidentifikasi lebih lanjut daerah – daerah yang membutuhkan penanganan lebih lanjut dalam program – program yang dijalankan oleh pemerintah. Dengan melakukan analisis pengelompokan ini diharapkan dapat diperoleh gambaran yang lebih jelas mengenai distribusi kemiskinan di Provinsi Jawa Tengah agar dapat memberikan rekomendasi kebijakan yang lebih efektif dalam menangani masalah kemiskinan.

1.2 Tinjauan Pustaka

1.2.1 Analisis Cluster

Analisis cluster adalah teknik analisis multivariat yang bertujuan mengelompokkan objek – objek ke dalam dua atau lebih kelompok berdasarkan kesamaan karakteristik (Simamora Faradilla, 2022). Dalam hal ini, objek yang berada dalam kelompok yang sama akan lebih mirip daripada objek antar kelompok. Untuk mengukur tingkat kemiripan antar objek digunakan metrik yang berfungsi untuk menyederhanakan struktur kelompok dari data yang kompleks.

1.2.2 Metode hierarchical

Metode ini memulai pengelompokan dengan dua atau lebih objek yang mempunyai kesamaan paling dekat, kemudian proses diteruskan ke objek lain yang mempunyai kedekatan kedua dan seterusnya sehingga cluster akan terbentuk semacam pohon dimana ada tingkatan yang jelas antar objek (Talakua, Leleury, dan Talluta., 2014). Beberapa jenis metode hierarchical meliputi:

  • Single Linkage : Jarak dua cluster diukur dari jarak terdekat antar objek dalam satu cluster dengan objek dalam cluster lain
  • Complete Linkage : Jarak dua cluster diukur dari dari jarak terjauh antar objek dalam satu cluster dengan objek dalam cluster lain
  • Average Linkage : Jarak dua cluster diukur dengan rata – rata jarak antar objek dalam satu cluster dengan objek dalam cluster lain
  • Metode Ward : Metode ini bertujuan untuk memperoleh kelompok dengan varian internal sekecil mungkin.

1.3 Sumber Data

Data diperoleh dari Badan Pusat Statistik (BPS) tentang tingkat kemiskinan berdasarkan garis kemiskinan, jumlah penduduk miskin, dan presentase penduduk miskin pada Kabupaten di Jawa Tengah tahun 2024

Tabel Tingkat Kemiskinan pada Kabupaten di Jawa Tengah
Kabupaten Garis_Kemiskinan Jumlah_Penduduk_Miskin Persentase_Penduduk_Miskin
Kabupaten Cilacap 441093 186.08 10.68
Kabupaten Banyumas 500861 207.78 11.95
Kabupaten Purbalingga 460870 136.72 14.18
Kabupaten Banjarnegara 398344 137.68 14.71
Kabupaten Kebumen 471824 187.95 15.71
Kabupaten Purworejo 459253 78.02 10.87
Kabupaten Wonosobo 456351 121.49 15.28
Kabupaten Magelang 431289 143.80 10.83
Kabupaten Boyolali 442071 95.96 9.63
Kabupaten Klaten 505826 141.84 12.04
Kabupaten Sukoharjo 501693 68.15 7.47
Kabupaten Wonogiri 443563 102.57 10.71
Kabupaten Karanganyar 491551 87.37 9.59
Kabupaten Sragen 453663 110.65 12.41
Kabupaten Grobogan 489208 159.00 11.43
Kabupaten Blora 464959 99.14 11.42
Kabupaten Rembang 518607 91.45 14.02
Kabupaten Pati 559499 116.84 9.17
Kabupaten Kudus 550075 65.69 7.23
Kabupaten Jepara 503832 80.84 6.09
Kabupaten Demak 535134 142.91 11.89
Kabupaten Semarang 520639 76.87 6.96
Kabupaten Temanggung 416086 68.77 8.67
Kabupaten Kendal 488940 92.70 9.35
Kabupaten Batang 412196 68.85 8.73
Kabupaten Pekalongan 505520 81.72 8.95
Kabupaten Pemalang 493593 194.20 14.92
Kabupaten Tegal 497315 98.02 6.81
Kabupaten Brebes 542495 283.28 15.60
Kota Magelang 626614 7.25 5.94
Kota Surakarta 638102 43.28 8.31
Kota Salatiga 596659 9.33 4.57
Kota Semarang 671936 77.79 4.03
Kota Pekalongan 605312 21.16 6.71
Kota Tegal 664922 19.17 7.64

1.4 Tujuan

Tujuan dari penelitian ini adalah mengelompokkan kabupaten di Jawa Tengah berdasarkan indikator kemiskinan agar dapat memberikan rekomendasi kebijakan pada Pemerintah.

2 SOURCE CODE dan PENJELASAN

2.1 Library yang Dibutuhkan

library(psych)
library(GPArotation)
library(clValid)
library(ggplot2)
library(cluster)
library(factoextra)
library(tidyverse)
library(car)
library(readxl)

2.2 Input Data

datauap <- read_excel("C:/Users/WINDOWS 11/Downloads/Data uap anmul.xlsx")
data.fix <- data.frame(datauap)
View(data.fix)

Syntax ini digunakan untuk memindahkan file dari excel dengan format xlsx atau xls ke R studio.

2.3 Uji Asumsi Sampel Representatif

kmo <- KMO(data.fix[,2:4])
kmo

Syntax ini digunakan untuk menilai representativitas data dengan menggunakan uji Kaiser-Meyer-Oklin (KMO).

2.4 Uji Asumsi Non-Multikolinearitas

korelasi <- cor(data.fix[,2:4], method = 'pearson')
korelasi

Syntax ini digunakan untuk mengecek adanya multikolinearitas antar variabel dengan menggunakkan uji pearson.

2.5 Standarisasi

datastand <- scale(data.fix[,2:4])
datastand
rownames(datastand) <- 1:nrow(datastand)

Syntax ini digunakan untuk melakukan standarisasi data dan mengganti nama baris pada data set yang sudah di standarisasi.

2.6 Koefisien Korelasi Cophenetic

d1 <- dist(data.fix[,2:4])
#Single Linkage
hiers <- hclust(dist(data.fix[,2:4]), method = "single")
#korelasi cophenetic
hc1 <- hclust(d1, "single")
d2 <- cophenetic(hc1)
cors <- cor(d1,d2)
cors
#Average Linkage
hierave <- hclust(dist(data.fix[,2:4]), method = "ave")
#korelasi cophenetic
hc2 <- hclust(d1, "ave")
d3 <- cophenetic(hc2)
corave <- cor(d1,d3)
corave
#Complete Linkage
hiercomp <- hclust(dist(data.fix[,2:4]), method = "complete")
#korelasi cophenetic
hc3 <- hclust(d1, "complete")
d4 <- cophenetic(hc3)
corcomp <- cor(d1,d4)
corcomp
#Centorid Linkage
hiercen <- hclust(dist(data.fix[,2:4]), method = "centroid")
#korelasi cophenetic
hc4 <- hclust(d1, "centroid")
d5 <- cophenetic(hc4)
corcen <- cor(d1,d5)
corcen
#Ward
hierward <- hclust(dist(data.fix[,2:4]), method = "ward.D")
#korelasi cophenetic
hc5 <- hclust(d1,"ward.D")
d6 <- cophenetic(hc5)
corward <- cor(d1,d6)
corward

KorCop<-data.frame(cors,corave,corcomp,corcen,corward)
KorCop

Syntax ini digunakan sebagai dasar dalam penentuan metode terbaik yang akan digunakan dalam analisis cluster hierarchical.

2.7 Indeks Validitas

inval <- clValid(datastand, 2:4, clMethods = "hierarchical", validation = "internal", metric = "euclidean", method = "average")
summary(inval)
optimalScores(inval)

Syntax ini digunakan untuk membantu menentukan jumlah cluster optimal berdasarkan indeks validitas.

2.8 Metode Average Linkage

hirave <- hclust(dist(scale(data.fix[,2:4])), method = "average")
hirave

Syntax ini digunakan untuk melakukan analisis hierarchical clustering dengan metode rata - rata (average linkage).

2.9 Cluster Dendogram

clus_hier <- eclust(data.fix, FUNcluster = "hclust", k = 2, hc_method = "average", graph = TRUE)
fviz_dend(clus_hier, rect = TRUE, cex = 0.5)

Syntax ini digunakan untuk membuat dendogram berdasarkan cluster yang sudah ditentukan sebelumnya.

2.10 Karakteristik Setiap Cluster

data.fix2 <- data.fix[sapply(data.fix, is.numeric)]
idclus = clus_hier$cluster
idclus
aggregate(data.fix2,list(idclus),mean)

Syntax ini digunakan untuk menganalisis rata - rata karakteristik dari setiap cluster yang dihasilkan berdasarkan variabel numerik.

3 HASIL dan PEMBAHASAN

3.1 Uji Asumsi Sampel Representatif

Berikut adalah hasil perhitungan dari uji KMO

## Kaiser-Meyer-Olkin factor adequacy
## Call: KMO(r = data.fix[, 2:4])
## Overall MSA =  0.62
## MSA for each item = 
##   X1   X2   X3 
## 0.77 0.61 0.58

Dapat dilihat pada output tersebut bahwa uji KMO pada masing - masing variabel bernilai lebih dari 0.5, sehingga dapat disimpulkan bahwa data telah representatif.

3.2 Uji Asumsi Non-Multikolinearitas

##            X1         X2         X3
## X1  1.0000000 -0.4145491 -0.5316804
## X2 -0.4145491  1.0000000  0.7567908
## X3 -0.5316804  0.7567908  1.0000000

Dapat dilihat pada output tersebut bahwa nilai korelasi antar variabel kurang dari 0.8, sehingga dapat disimpulkan bahwa tidak ada multikolinieritas antar variabel.

3.3 Standarisasi

##                X1          X2         X3
##  [1,] -0.93876869  1.35008505  0.1717098
##  [2,] -0.09290480  1.71518987  0.5671762
##  [3,] -0.65887560  0.51959776  1.2615778
##  [4,] -1.54377196  0.53574987  1.4266150
##  [5,] -0.50384962  1.38154800  1.7380059
##  [6,] -0.68176012 -0.46803602  0.2308741
##  [7,] -0.72283054  0.26335138  1.6041078
##  [8,] -1.07751935  0.63871952  0.2184184
##  [9,] -0.92492759 -0.16619360 -0.1552506
## [10,] -0.02263786  0.60574231  0.5952014
## [11,] -0.08112996 -0.63409983 -0.8278548
## [12,] -0.90381213 -0.05497964  0.1810515
## [13,] -0.22466415 -0.31072127 -0.1677062
## [14,] -0.76087234  0.08096722  0.7104160
## [15,] -0.25782335  0.89446115  0.4052530
## [16,] -0.60100622 -0.11268976  0.4021391
## [17,]  0.15824466 -0.24207483  1.2117553
## [18,]  0.73696682  0.18511464 -0.2984904
## [19,]  0.60359409 -0.67548959 -0.9025887
## [20,] -0.05085786 -0.42058922 -1.2575742
## [21,]  0.39214227  0.62374518  0.5484928
## [22,]  0.18700245 -0.48738489 -0.9866642
## [23,] -1.29267912 -0.62366826 -0.4541858
## [24,] -0.26161621 -0.22104345 -0.2424400
## [25,] -1.34773217 -0.62232225 -0.4355024
## [26,] -0.02696851 -0.40578313 -0.3669964
## [27,] -0.19576484  1.48670492  1.4920071
## [28,] -0.14308940 -0.13153388 -1.0333728
## [29,]  0.49631849  2.98548546  1.7037529
## [30,]  1.68680880 -1.65874885 -1.3042829
## [31,]  1.84939220 -1.05254024 -0.5662865
## [32,]  1.26287203 -1.62375263 -1.7308883
## [33,]  2.32822634 -0.47190580 -1.8990394
## [34,]  1.38533322 -1.42471161 -1.0645119
## [35,]  2.22896102 -1.45819357 -0.7749184
## attr(,"scaled:center")
##           X1           X2           X3 
## 507425.57143    105.83771     10.12857 
## attr(,"scaled:scale")
##           X1           X2           X3 
## 70659.121881    59.434986     3.211398

Nilai positif pada data yang telah distandarisasi menunjukkan nilai tersebut lebih besar daripada rata - rata, nilai negatif menunjukkan nilai tersebut lebik kecil daripada rata - rata, dan nilai 0 menunjukkan nilai tersebut persis di rata - rata.

3.4 Koefisien Korelasi Cophenetic

##        cors    corave   corcomp    corcen   corward
## 1 0.8256399 0.8444567 0.8273828 0.8418593 0.8153526

Dari output dapat dilihat bahwa metode dengan nilai korelasi mendekati 1 adalah metode average linkage, sehingga metode average linkage dipilih sebagai metode terbaik.

3.5 Metode Average Linkage

##                  Score       Method Clusters
## Connectivity 3.1289683 hierarchical        2
## Dunn         0.3199090 hierarchical        2
## Silhouette   0.3932052 hierarchical        2

Berdasarkan indeks connectivity, indeks dunn, dan indeks silhouette terpilih jumlah cluster sebanyak dua sebagai cluster yang optimal pada metode pengelompokan average linkage.

3.6 Cluster Dendogram

Berdasarkan output tersebut dapat dilihat:

  • Cluster 1 : Pada dendogram berwarna merah yang terdiri dari Kabupaten Magelang, Surakarta, Salatiga, Semarang, Pekalongan, dan Tegal.
  • Cluster 2 : Pada dendogram berwarna hijau yang terdiri dari 29 Kabupaten yaitu, Kabupaten Cilacap, Banyumas, Purbalingga, Banjarnegara, Kebumen, Purworejo, Wonosobo, Magelang, Boyolali, Klaten, Sukoharjo, Wonogiri, Karanganyar, Sragen, Grobogan, Blora, Rembang, Pati, Kudus, Jepara, Demak, Semarang, Temanggung, Kendal, Batang, Pekalongan, Pemalang, Tegal, dan Brebes

3.7 Karakteristik Setiap Cluster

##   Group.1       X1        X2       X3
## 1       1 481253.4 121.59793 10.94138
## 2       2 633924.2  29.66333  6.20000

Pada output dapat dilihat bahwa, cluster 1 memiliki garis kemiskinan (X1) yang lebih rendah dibandingkan dengan cluste 2. tetapi jumlah penduduk miskin (X2) dan presentase penduduk miskin (X3) memiliki nilai yang lebih tinggi daripada cluster 2.

3.8 Indeks Validitas

## 
## Clustering Methods:
##  hierarchical 
## 
## Cluster sizes:
##  2 3 4 
## 
## Validation Measures:
##                                  2       3       4
##                                                   
## hierarchical Connectivity   3.1290  7.4694 17.4016
##              Dunn           0.3199  0.3105  0.3172
##              Silhouette     0.3932  0.3873  0.3649
## 
## Optimal Scores:
## 
##              Score  Method       Clusters
## Connectivity 3.1290 hierarchical 2       
## Dunn         0.3199 hierarchical 2       
## Silhouette   0.3932 hierarchical 2

Berdasarkan hasil ketiga indeks validasi tersebut, dapat dilihat bahwa indeks connectivity memiliki nilai lebih dari 1 namun pada indeks dunn dan silhouette jauh dari angka 1. Maka disimpulkan, hasil cluster tersebut kurang baik.

4 PENUTUP

4.1 Kesimpulan

Pengelompokan dari ketiga indikator tersebut menghasilkan 2 buah cluster yang dapat menunjukkan daerah kabupaten yang harus lebih diutamakan pemerintah dalam menjalankan program - program yang bertujuan untuk mengurangi tingkat kemiskinan. Kabupaten Magelang, Surakarta, Salatiga, Semarang, Pekalongan, dan Tegal merupakan kabupaten yang lebih mendesak duntuk diperhatikan lebih lagi oleh pemerintah dan dapat menjadi prioritas pemantauan karena angka kemiskinan pada kabupaten - kabupaten ini relatif lebih tinggi baik jumlah penduduk maupun presentase penduduk. Sedangkan kabupaten selain itu tergolong kabupaten - kabupaten yang cenderung dalam kondisi lebih baik sehingga boleh untuk tidak termasuk dalam prioritas untuk pemantauan langsung.

4.2 Saran

Sebaiknya, pemerintah bisa lebih fokus pada daerah kabupaten - kabupaten dengan jumlah penduduk miskin yang besar dengan presentase yang tinggi. Pemerintah juga dapat melaksanakan program - program yang efektif pada kabupaten yang menjadi prioritas utama dalam pemantauan seperti mengalokasikan intervensi bantuan sosial secara langsung, program pengentasan kemiskinan berbasis lapangan kerja, ataupun perbaikan infrastruktur untuk mengurangi biaya hidup sehingga dapat menekan garis kemiskinan. Pemerintah juuga harus terus mempertahankan program keberlanjutan yang ada untuk kabupaten - kabupaten yang tidak termasuk dalam prioritas utama sehingga stabilitas ekonomi terjaga.

4.3 Daftar Pustaka

Faradilla, S. B. (2022). Komparasi Analisis K-Medoids Clustering dan Hierarchical Clustering (Studi Kasus: Data Kriminalitas di Indonesia Tahun 2020) (Doctoral dissertation, Universitas Islam Indonesia).

Talakua, M., W., Leleury, Z., A., & Talluta, A., W. (2014). ANALISIS CLUSTER DENGAN MENGGUNAKAN METODE K-MEANS UNTUK PENGELOMPOKKAN KABUPATEN/KOTA DI PROVINSI MALUKU BERDASARKAN INDIKATOR INDEKS PEMBANGUNAN MANUSIA TAHUN 2014. BAREKENG: Jurnal Ilmu Matematika dan Terapan, 11(2), 121.