1 PENDAHULUAN
1.1 Latar Belakang
Kabupaten/Kota di Jawa Tengah, Indonesia, merupakan wilayah yang kaya akan budaya dan geografis yang beragam. Namun, seperti banyak wilayah lainnya, Jawa Tengah juga dihadapkan pada sejumlah tantangan sosial yang signifikan yang berdampak langsung pada kehidupan masyarakatnya. Masalah seperti kasus bunuh diri, keberadaan anak jalanan, peningkatan jumlah gelandangan, dan permasalahan Pekerja Seks Komersial (PSK) telah muncul menjadi sorotan utama. Ketidakstabilan sosial ini telah membawa dampak yang merugikan bagi kesejahteraan dan perkembangan wilayah ini. Dalam konteks yang semakin kompleks ini, pemahaman yang mendalam tentang aspek geografis dan sosial yang terkait dengan permasalahan ini menjadi sangat penting untuk mencari solusi yang efektif.
Dalam upaya mengatasi permasalahan ini, diperlukan analisis pengelompokkan Kabupaten/Kota yang memiliki karakteristik serupa berdasarkan masalah sosial yang ada. Dengan mengelompokkan wilayah-wilayah dengan tantangan sosial serupa, pemangku kepentingan dapat merancang program intervensi yang lebih efektif dan alokasi sumber daya yang lebih tepat guna untuk mengatasi tantangan sosial ini. Hasil pengelompokkan ini akan memberikan pandangan yang lebih mendalam tentang pola distribusi masalah sosial di Jawa Tengah, dan dengan informasi ini, diharapkan tindakan yang diambil akan lebih tepat sasaran dan memberikan dampak positif yang lebih besar bagi masyarakat setempat.
1.2 Data
Studi ini akan menggunakan data sekunder dari website Badan Pusat Statistika, Data Keberadaan Korban Bunuh Diri, Lokasi Berkumpul Anak Jalanan, Gelandangan, dan PSK diberbagai Kabupaten/Kota di Jawa Tengah Tahun 2021. Jumlah data adalah 34 Kabupaten/Kota yang ada di Provinsi Jawa Tengah seperti pada Tabel 1.
| KabupatenKota | Korban Bunuh Diri | Lokasi Anak Jalanan | Lokasi Gelandangan | Lokasi PSK |
|---|---|---|---|---|
| Cilacap | 15 | 2 | 2 | 1 |
| Banyumas | 20 | 8 | 5 | 0 |
| Purbalingga | 17 | 9 | 4 | 0 |
| Banjarnegara | 9 | 2 | 2 | 0 |
| Kebumen | 20 | 6 | 1 | 2 |
| Purworejo | 18 | 1 | 0 | 2 |
| Wonosobo | 22 | 3 | 2 | 1 |
| Magelang | 15 | 3 | 3 | 0 |
| Boyolali | 15 | 2 | 1 | 1 |
| Klaten | 20 | 7 | 6 | 7 |
| Sukoharjo | 7 | 2 | 1 | 3 |
| Wonogiri | 16 | 0 | 0 | 0 |
| Karanganyar | 8 | 6 | 1 | 0 |
| Sragen | 15 | 0 | 2 | 2 |
| Grobogan | 15 | 1 | 0 | 1 |
| Blora | 22 | 5 | 2 | 7 |
| Rembang | 12 | 4 | 5 | 4 |
| Pati | 12 | 4 | 2 | 8 |
| Kudus | 4 | 2 | 2 | 0 |
| Jepara | 10 | 4 | 1 | 1 |
| Demak | 4 | 4 | 2 | 2 |
| Semarang | 15 | 5 | 5 | 7 |
| Temanggung | 8 | 4 | 4 | 0 |
| Kendal | 8 | 7 | 6 | 0 |
| Batang | 10 | 0 | 0 | 4 |
| Pekalongan | 8 | 11 | 2 | 3 |
| Pemalang | 6 | 5 | 2 | 4 |
| Tegal | 11 | 2 | 0 | 3 |
| Brebes | 14 | 3 | 3 | 4 |
| Kota Magelang | 3 | 3 | 2 | 1 |
| Kota Surakarta | 4 | 3 | 3 | 1 |
| Kota Salatiga | 0 | 4 | 1 | 0 |
| Kota Semarang | 11 | 3 | 5 | 2 |
| Kota Pekalongan | 0 | 4 | 3 | 1 |
| Kota Tegal | 1 | 1 | 0 | 0 |
1.3 Metode
Metode yang akan digunakan dalam studi ini adalah metode clustering K-Means. Clustering K-Means adalah teknik statistik yang memungkinkan pengelompokan data menjadi kelompok-kelompok yang serupa berdasarkan kesamaan karakteristik. Dalam konteks ini, metode ini akan digunakan untuk mengelompokkan Kabupaten/Kota berdasarkan masalah sosial yang dihadapi. Dengan metode ini akan lebih mudah memahami bagaimana masalah sosial menyebar di Jawa Tengah, dan hal ini penting dalam menyususun strategi invtervensi yang lebih efektif.
1.4 Tinjauan Pustaka
Clustering K-Means mengklasifikasikan objek dalam beberapa kelompok sehingga objek dalam klaster yang sama memiliki kemiripan, sedangkan objek dari klaster yang berbeda memiliki ketidakmiripan (Kasambara, 2017). Hartigan Wong (1979) mendefinisikan total varian dalam jumlah kuadrat jarak antara item dan pusat massa:
\[ W(C_k) = \sum_{x_i ∈ C_k} (x_{i} - \mu_k)^2 \]
\(x_i\) merancang titik data milik klaster \(C_k\).
\(\mu_k\) adalah nilai rata-rata dari poin yang ditetapkan ke cklaster \(C_k\).
Setiap data (\(x_i\)) ditempatkan dalam kelompok tertentu sehingga jarak kuadrat total antara data dan pusat kelompoknya \(\mu_k\) sekecil mungkin. Jumlah total kuadra jarak:
\[ tot.withinss=\sum_{k=1}^{k} W(C_k) = \sum_{k=1}^{k} \sum_{x_i ∈ C_k} (x_{i} - \mu_k)^2 \]
Jumlah total jarak ini mengukur seberapa baik pengelompokan tersebut, dan kita ingin menjadikannya seminimal mungkin.
Ringkasan algoritma K-Means:
- Tentukan jumlah klaster (K) yang akan dibuat (oleh analis).
- Pilih secara acak k objek dari kumpulan data sebagai pusat atau sarana klaster awal.
- Tetapkan setiap observasi ke pusat massa terdekat, berdasarkan jarak Euclidean antara objek dan pusat massa tersebut.
- Untuk setiap k klaster, perbarui pusat klaster dengan menghitung nilai rata-rata baru dari semua titik data dalam klaster. Centoid dari klaster ke-K adalah vektor dengan panjang \(p\) yang memuat mean semua variabel untuk observasi di klaster ke-k; \(p\) adalah jumlah variabel.
- Minimalkan total dalam jumlah kuadrat secara berulang. Artinya, ulangi langkah 3 dan 4 hingga penetapan klaster berhenti berubah atau jumlah iterasi maksimum tercapai. Secara default, Software R menggunakan 10 sebagai nilai default untuk jumlah iterasi maksimum.
1.5 Tujuan
Studi ini bertujuan untuk memberikan pemahaman lebih mendalam tentang masalah sosial dan geografis yang terkait dengan keberadaan korban bunuh diri, anak jalanan, gelandangan, dan PSK di berbagai Kabupaten/Kota di Jawa Tengah. Hasil pengelompokan ini dapat membantu pemerintah, lembaga non-pemerintah, dan peneliti dalam merancang program intervensi yang lebih efektif dan alokasi sumber daya yang tepat untuk mengatasi masalah sosial tersebut di tingkat Kabupaten/Kota. Dengan demikian, studi ini akan memberikan kontribusi positif dalam upaya peningkatan kualitas hidup masyarakat di Jawa Tengah.
2 SOURCE CODE
2.1 Library
Library:
> library("readxl") # Membaca file Excel
> library("tidyverse") # Kumpulan perpustakaan untuk analisis data
> library("cluster") # Algoritma klastering
> library("factoextra") # Algoritma klastering dan visualisasi
> library("corrplot") # Visualisasi matriks korelasi2.2 Source Code
Data yang akan dianalisis merupakan data statistik Keberadaan Korban Bunuh Diri, Lokasi Berkumpul Anak Jalanan, Gelandangan, dan PSK diberbagai Kabupaten/Kota di Jawa Tengah Tahun 2021.
Data
> # Membaca file Excel "Data.xlsx" dan menyimpannya dalam objek 'data'
> data <- read_excel("C:/ayu/Data.xlsx")
> # Menampilkan struktur dari objek 'data'
> str(data)
tibble [35 × 5] (S3: tbl_df/tbl/data.frame)
$ KabupatenKota : chr [1:35] "Cilacap" "Banyumas" "Purbalingga" "Banjarnegara" ...
$ Korban Bunuh Diri : num [1:35] 15 20 17 9 20 18 22 15 15 20 ...
$ Lokasi Anak Jalanan: num [1:35] 2 8 9 2 6 1 3 3 2 7 ...
$ Lokasi Gelandangan : num [1:35] 2 5 4 2 1 0 2 3 1 6 ...
$ Lokasi PSK : num [1:35] 1 0 0 0 2 2 1 0 1 7 ...Pada kasus data dengan jumlah variabel besar, analisis PCA (Principal Component Analysis) biasanya dilakukan untuk mengurangi dimensi data sebelum penerapan algoritma klastering seperti K-Means. PCA dapat membantu mengidentifikasi variabel yang paling berkontribusi terhadap variasi dalam data, sehingga dapat meningkatkan efisiensi klastering dan memperjelas pola yang ada.
> # Menghitung matriks korelasi antar variabel data, mengabaikan kolom pertama
> korelasi <- cor(data[,-1])
> # Menampilkan matriks korelasi
> corrplot(korelasi, method="number")cor(): Fungsi ini digunakan untuk menghitung matriks korelasi dari data yang telah dipilih.data[,-1]: Mengambil semua kolom kecuali kolom pertama dari data.corrplot(): Fungsi ini dari paket corrplot digunakan untuk membuat visualisasi matriks korelasi.korelasi: Matriks korelasi yang telah dihitung sebelumnya.method="number": Parameter ini digunakan untuk menampilkan angka di dalam sel-sel matriks korelasi. Ini memungkinkan kita melihat nilai korelasi yang lebih tepat antar variabel.
Data pada kasus ini berada dalam ruang 4 dimensi dan memiliki tingkat korelasi rendah, sehingga analisis PCA tidak diperlukan. Algoritma K-Means Clustering dapat langsung dilakukan.
Data Cleaning
Sebelum menerapkan teknik clustering, dilakukan data cleaning untuk menghilangkan data yang tidak diperlukan, menangani missing value, mengurangi noise data, dan menangani data yang tidak konsisten serta tidak relevan.
> # Untuk menghilangkan data missing
> dataclus <- na.omit(data)
> # Menampilkan summary statistik dari dataclus
> summary(dataclus)
KabupatenKota Korban Bunuh Diri Lokasi Anak Jalanan Lokasi Gelandangan
Length:35 Min. : 0.00 Min. : 0.000 Min. :0.000
Class :character 1st Qu.: 7.50 1st Qu.: 2.000 1st Qu.:1.000
Mode :character Median :11.00 Median : 3.000 Median :2.000
Mean :11.29 Mean : 3.714 Mean :2.286
3rd Qu.:15.00 3rd Qu.: 5.000 3rd Qu.:3.000
Max. :22.00 Max. :11.000 Max. :6.000
Lokasi PSK
Min. :0.000
1st Qu.:0.000
Median :1.000
Mean :2.057
3rd Qu.:3.000
Max. :8.000 > # Mengonversi tibble menjadi data.frame
> dataclus <- as.data.frame(dataclus)
> # Menjadikan kolom pertama sebagai row names
> rownames(dataclus) <- dataclus[, 1]
> # Menampilkan summary statistik dari dataclus
> summary(dataclus)
KabupatenKota Korban Bunuh Diri Lokasi Anak Jalanan Lokasi Gelandangan
Length:35 Min. : 0.00 Min. : 0.000 Min. :0.000
Class :character 1st Qu.: 7.50 1st Qu.: 2.000 1st Qu.:1.000
Mode :character Median :11.00 Median : 3.000 Median :2.000
Mean :11.29 Mean : 3.714 Mean :2.286
3rd Qu.:15.00 3rd Qu.: 5.000 3rd Qu.:3.000
Max. :22.00 Max. :11.000 Max. :6.000
Lokasi PSK
Min. :0.000
1st Qu.:0.000
Median :1.000
Mean :2.057
3rd Qu.:3.000
Max. :8.000
> # Menghapus kolom Kabupaten
> dataclus <- dataclus[, -1] > # Standarisasi data
> datafix <- scale(dataclus)
> # Menampilkan 5 baris pertama dari datafix
> head(datafix, n = 5)
Korban Bunuh Diri Lokasi Anak Jalanan Lokasi Gelandangan
Cilacap 0.5927218 -0.6721810 -0.1609496
Banyumas 1.3906165 1.6804524 1.5290209
Purbalingga 0.9118797 2.0725580 0.9656974
Banjarnegara -0.3647519 -0.6721810 -0.1609496
Kebumen 1.3906165 0.8962413 -0.7242730
Lokasi PSK
Cilacap -0.45706066
Banyumas -0.88941534
Purbalingga -0.88941534
Banjarnegara -0.88941534
Kebumen -0.02470598Menentukan jumlah Klaster (K)
Dalam K-Means CLustering, untuk menentukan jumlah optimal k (jumlah kluster), metode yang dapat digunakan adalah:
- Metode Elbow : Membantu menemukan titik di mana penurunan inersia (within-cluster sum of squares) melambat secara signifikan. Pada grafik, ini sering terlihat seperti siku (elbow).
- Metode Silhouette : Mengukur seberapa baik setiap objek sesuai dengan klasternya sendiri dibandingkan dengan klaster tetangganya
- Gap Statistic : Membandingkan inersia data dengan inersia data yang dihasilkan secara acak untuk menentukan apakah jumlah klaster aktual lebih baik dari yang diharapkan secara acak.
Pemilihan metode tergantung pada karakteristik data dan preferensi analisis, dan seringkali dianjurkan untuk menggunakan beberapa metode untuk memperkuat kesimpulan tentang jumlah klaster yang optimal.
Metode Elbow
> # Metode Elbow
> fviz_nbclust(datafix, kmeans, method = "wss")
Dari hasil output metode elbow, terlihat bahwa garis grafik
mengalami patahan atau membentuk siku pada titik k = 4.
Metode Silhouette
> # Metode Silhouette
> fviz_nbclust(datafix, kmeans, method = "silhouette")
Berdasarkan hasil output metode silhouette, terdapat dua
pilihan jumlah klaster optimal, yaitu k = 2 dan k = 4. Hal ini
dikarenakan nilai rata-rata silhouette pada kedua opsi tersebut
adalah yang tertinggi dibandingkan opsi lainnya.
Gap Statistic
> # Mengatur seed untuk hasil yang dapat direproduksi
> set.seed(123)
> # Metode Gap Statistic
> gap_stat <- clusGap(datafix, FUN = kmeans, nstart = 25, K.max = 10, B = 50)
> # Menampilkan visualisasi hasil Gap Statistic
> fviz_gap_stat(gap_stat) Parameter dalam fungsi clusGap:
datafix: Data yang akan digunakan untuk analisis klastering.FUN: Fungsi klastering yang akan digunakan.nstart: Jumlah inisialisasi acak yang akan dilakukan oleh algoritma K-Means.K.max: Jumlah klaster maksimum yang akan diuji oleh Gap Statistic.B: Jumlah bootstrap yang akan digunakan untuk menghasilkan distribusi acak sebagai pembanding.
Berdasarkan output Gap Statistic, ditemukan bahwa jumlah klaster optimal untuk membentuk klaster adalah k = 4.
Dengan mempertimbangkan hasil dari Metode Elbow, Metode Silhouette, dan Gap Statistic, dapat disimpulkan bahwa nilai k yang optimal untuk membentuk klaster adalah 4. Ini merupakan hasil keseluruhan yang konsisten dari berbagai metode evaluasi dan memberikan keyakinan lebih dalam pemilihan jumlah klaster.
Menghitung K-Means Clustering
> final <- kmeans(x=datafix, centers=4, nstart = 25)
> print(final)
K-means clustering with 4 clusters of sizes 14, 6, 4, 11
Cluster means:
Korban Bunuh Diri Lokasi Anak Jalanan Lokasi Gelandangan Lokasi PSK
1 -0.9460752 -0.1400377 -0.1207122 -0.4261782
2 0.7257043 0.3734339 0.8718101 1.7767718
3 0.3134586 1.9745316 1.1065282 -0.5651493
4 0.6942720 -0.7434729 -0.7242730 -0.2212308
Clustering vector:
Cilacap Banyumas Purbalingga Banjarnegara Kebumen
4 3 3 1 4
Purworejo Wonosobo Magelang Boyolali Klaten
4 4 4 4 2
Sukoharjo Wonogiri Karanganyar Sragen Grobogan
1 4 1 4 4
Blora Rembang Pati Kudus Jepara
2 2 2 1 1
Demak Semarang Temanggung Kendal Batang
1 2 1 3 4
Pekalongan Pemalang Tegal Brebes Kota Magelang
3 1 4 2 1
Kota Surakarta Kota Salatiga Kota Semarang Kota Pekalongan Kota Tegal
1 1 1 1 1
Within cluster sum of squares by cluster:
[1] 19.117358 11.177064 8.305891 14.494709
(between_SS / total_SS = 61.0 %)
Available components:
[1] "cluster" "centers" "totss" "withinss" "tot.withinss"
[6] "betweenss" "size" "iter" "ifault" Parameter dalam fungsi kmeans:
x: Data yang akan dianalisis.centers: Jumlah klaster yang diinginkan.iter.max: Jumlah iterasi maksimum yang akan dilakukan oleh algoritma K-Means untuk mencapai konvergensi. Secara default, nilai adalah 10.nstart: Jumlah inisialisasi acak yang akan dilakukan oleh algoritma.
Penjelasan Output kmeans:
Cluster Means: Menunjukkan nilai rata-rata dari setiap variabel untuk setiap kluster.Clustering Vector: Menunjukkan keanggotaan kluster untuk setiap observasi atau kabupaten.Within Cluster Sum of Squares: Menunjukkan jumlah kuadrat kesalahan (variasi) di dalam masing-masing kluster.Between_SS / Total_SS: Merupakan rasio antara variabilitas antar kluster dan total variabilitas.Available Components: Menyajikan komponen-komponen yang dapat diakses dari hasil klastering, termasuk “cluster,” “centers,” “totss,” “withinss,” “tot.withinss,” “betweenss,” “size,” “iter,” dan “ifault.”
Visualisasi K-Means Clustering
> fviz_cluster(final, data = datafix)> # Menambahkan kolom Klaster ke data
> dataclus$Cluster <- final$cluster
> knitr::kable(head(dataclus), caption = "Tabel 2. Klaster Kasus Sosial di Jawa Tengah Tahun 2021")| Korban Bunuh Diri | Lokasi Anak Jalanan | Lokasi Gelandangan | Lokasi PSK | Cluster | |
|---|---|---|---|---|---|
| Cilacap | 15 | 2 | 2 | 1 | 4 |
| Banyumas | 20 | 8 | 5 | 0 | 3 |
| Purbalingga | 17 | 9 | 4 | 0 | 3 |
| Banjarnegara | 9 | 2 | 2 | 0 | 1 |
| Kebumen | 20 | 6 | 1 | 2 | 4 |
| Purworejo | 18 | 1 | 0 | 2 | 4 |
> # Menampilkan data untuk Klaster 1
> cluster_1 <- dataclus[dataclus$Cluster == 1, ]
> knitr::kable((cluster_1 %>% select(-Cluster)), caption = "Tabel 3. Klaster 1")| Korban Bunuh Diri | Lokasi Anak Jalanan | Lokasi Gelandangan | Lokasi PSK | |
|---|---|---|---|---|
| Banjarnegara | 9 | 2 | 2 | 0 |
| Sukoharjo | 7 | 2 | 1 | 3 |
| Karanganyar | 8 | 6 | 1 | 0 |
| Kudus | 4 | 2 | 2 | 0 |
| Jepara | 10 | 4 | 1 | 1 |
| Demak | 4 | 4 | 2 | 2 |
| Temanggung | 8 | 4 | 4 | 0 |
| Pemalang | 6 | 5 | 2 | 4 |
| Kota Magelang | 3 | 3 | 2 | 1 |
| Kota Surakarta | 4 | 3 | 3 | 1 |
| Kota Salatiga | 0 | 4 | 1 | 0 |
| Kota Semarang | 11 | 3 | 5 | 2 |
| Kota Pekalongan | 0 | 4 | 3 | 1 |
| Kota Tegal | 1 | 1 | 0 | 0 |
> # Menampilkan data untuk Klaster 2
> cluster_2 <- dataclus[dataclus$Cluster == 2, ]
> knitr::kable((cluster_2 %>% select(-Cluster)), caption = "Tabel 4. Klaster 2")| Korban Bunuh Diri | Lokasi Anak Jalanan | Lokasi Gelandangan | Lokasi PSK | |
|---|---|---|---|---|
| Klaten | 20 | 7 | 6 | 7 |
| Blora | 22 | 5 | 2 | 7 |
| Rembang | 12 | 4 | 5 | 4 |
| Pati | 12 | 4 | 2 | 8 |
| Semarang | 15 | 5 | 5 | 7 |
| Brebes | 14 | 3 | 3 | 4 |
> # Menampilkan data untuk Klaster 3
> cluster_3 <- dataclus[dataclus$Cluster == 3, ]
> knitr::kable((cluster_3 %>% select(-Cluster)), caption = "Tabel 5. Klaster 3")| Korban Bunuh Diri | Lokasi Anak Jalanan | Lokasi Gelandangan | Lokasi PSK | |
|---|---|---|---|---|
| Banyumas | 20 | 8 | 5 | 0 |
| Purbalingga | 17 | 9 | 4 | 0 |
| Kendal | 8 | 7 | 6 | 0 |
| Pekalongan | 8 | 11 | 2 | 3 |
> # Menampilkan data untuk Klaster 3
> cluster_4 <- dataclus[dataclus$Cluster == 4, ]
> knitr::kable((cluster_4 %>% select(-Cluster)), caption = "Tabel 6. Klaster 4")| Korban Bunuh Diri | Lokasi Anak Jalanan | Lokasi Gelandangan | Lokasi PSK | |
|---|---|---|---|---|
| Cilacap | 15 | 2 | 2 | 1 |
| Kebumen | 20 | 6 | 1 | 2 |
| Purworejo | 18 | 1 | 0 | 2 |
| Wonosobo | 22 | 3 | 2 | 1 |
| Magelang | 15 | 3 | 3 | 0 |
| Boyolali | 15 | 2 | 1 | 1 |
| Wonogiri | 16 | 0 | 0 | 0 |
| Sragen | 15 | 0 | 2 | 2 |
| Grobogan | 15 | 1 | 0 | 1 |
| Batang | 10 | 0 | 0 | 4 |
| Tegal | 11 | 2 | 0 | 3 |
Statistik Rat-rata per Cluster
> # Menampilkan statistik rata-rata per Klaster
> result <- dataclus %>% group_by(Cluster) %>% summarise(across(everything(), mean))
> knitr::kable(result, caption = "Tabel 7. Statistik Rata-rata per Cluster")| Cluster | Korban Bunuh Diri | Lokasi Anak Jalanan | Lokasi Gelandangan | Lokasi PSK |
|---|---|---|---|---|
| 1 | 5.357143 | 3.357143 | 2.071429 | 1.071429 |
| 2 | 15.833333 | 4.666667 | 3.833333 | 6.166667 |
| 3 | 13.250000 | 8.750000 | 4.250000 | 0.750000 |
| 4 | 15.636364 | 1.818182 | 1.000000 | 1.545454 |
3 HASIL DAN PEMBAHASAN
Dalam hasil analisis klastering, berhasil mengelompokkan Kabupaten/Kota di Jawa Tengah menjadi empat klaster berdasarkan karakteristik sosial yang signifikan, termasuk kasus korban bunuh diri, lokasi berkumpulnya anak jalanan, keberadaan gelandangan, dan lokasi Pekerja Seks Komersial (PSK). Klaster-klaster ini memberikan pemahaman lebih mendalam tentang pola distribusi masalah sosial di wilayah ini. Berikut adalah kesimpulan hasil klastering bersama dengan tampilan tabel dan grafik untuk memberikan gambaran yang lebih jelas.
| Cluster | KabupatenKota |
|---|---|
| 1 | Banjarnegara, Sukoharjo, Karanganyar, Kudus, Jepara, Demak, Temanggung, Pemalang, Kota Magelang, Kota Surakarta, Kota Salatiga, Kota Semarang, Kota Pekalongan, Kota Tegal |
| 2 | Klaten, Blora, Rembang, Pati, Semarang, Brebes |
| 3 | Banyumas, Purbalingga, Kendal, Pekalongan |
| 4 | Cilacap, Kebumen, Purworejo, Wonosobo, Magelang, Boyolali, Wonogiri, Sragen, Grobogan, Batang, Tegal |
Irisan pada cluster plot, seperti masuknya Kabupaten Magelang ke dalam
klaster 1 dan klaster 4, serta tumpang tindih antara Kabupaten Brebes
dan Kabupaten Kebumen, mungkin disebabkan oleh pelanggaran asumsi-asumsi
dalam analisis klastering. Faktor-faktor seperti ketidaknormalan
distribusi data dan ketidakhomogenan varians antar kelompok dapat
menyebabkan ketidakpastian dalam penempatan data ke klaster yang sesuai.
Solusi potensial melibatkan transformasi data, analisis ulang variabel,
penyesuaian parameter klastering, dan pertimbangan metode klastering
alternatif.
Meskipun demikian, hasil statistika rata-rata memberikan wawasan tambahan:
| Cluster | Korban Bunuh Diri | Lokasi Anak Jalanan | Lokasi Gelandangan | Lokasi PSK |
|---|---|---|---|---|
| 1 | 5.357143 | 3.357143 | 2.071429 | 1.071429 |
| 2 | 15.833333 | 4.666667 | 3.833333 | 6.166667 |
| 3 | 13.250000 | 8.750000 | 4.250000 | 0.750000 |
| 4 | 15.636364 | 1.818182 | 1.000000 | 1.545454 |
- Klaster 1 memiliki tingkat keamanan dan kesejahteraan relatif baik karena kasus korban bunuh diri, berkumpulnya anak jalanan, keberadaan gelandangan, dan lokasi PSK relatif paling rendah dibandingkan dengan klaster lain.
- Klaster 2 menjadi daerah yang tertinggi dalam hal kasus korban bunuh diri dan lokasi PSK.
- Klaster 3 merupakan daerah yang memiliki tingkat tertinggi dalam hal lokasi berkumpulnya anak jalanan dan lokasi gelandangan.
- Klaster 4 merupakan daerah yang tinggi dalam kasus korban bunuh diri, tetapi rendah dalam berkumpulnya anak jalanan, keberadaan gelandangan, dan lokasi PSK.
Analisis statistika rata-rata ini memberikan gambaran lebih rinci tentang karakteristik setiap klaster, yang dapat menjadi dasar untuk merancang intervensi yang lebih terarah dan efektif.
4 PENUTUP
4.1 Kesimpulan
Analisis klastering Kabupaten/Kota di Jawa Tengah, irisan dan tumpang tindih pada cluster plot mungkin disebabkan oleh pelanggaran asumsi-asumsi dasar. Kesadaran terhadap hal ini penting untuk menginterpretasikan hasil klastering, dan perlu dilakukan koreksi atau penyesuaian sesuai dengan karakteristik data. Hasil pengelompokan menunjukkan perbedaan signifikan antar klaster, menjadi dasar untuk merancang strategi intervensi yang tepat. Klaster 1 menunjukkan tingkat keamanan dan kesejahteraan baik, Klaster 2 perlu program pencegahan bunuh diri dan rehabilitasi PSK, Klaster 3 fokus pada anak jalanan dan gelandangan, Klaster 4 tinggi bunuh diri, rendah anak jalanan, gelandangan, dan PSK. Pemahaman ini mendukung perancangan program intervensi yang efektif, dengan kolaborasi pemerintah, lembaga non-pemerintah, dan masyarakat.
4.2 Saran
Studi lebih lanjut dapat dilakukan untuk meningkatkan keakuratan dan ketepatan clustering guna mendalami penyebab perbedaan masalah sosial di Jawa Tengah. Dengan pemahaman yang lebih mendalam terkait dinamika setiap wilayah dalam klaster, akan memungkinkan pengambilan keputusan yang lebih tepat dalam perumusan dan pelaksanaan program intervensi. Kolaborasi yang erat antara pemerintah daerah, lembaga non-pemerintah, dan masyarakat juga menjadi kunci dalam menjaga keberlanjutan dan keberhasilan implementasi program di masa depan.
Daftar Pustaka
Asroni, & Adrian, R. (2015). Penerapan Metode K-Means Untuk Clustering Mahasiswa Berdasarkan Nilai Akademik Dengan Weka Interface Studi Kasus Pada Jurusan Teknik Informatika UMM Magelang.
Aulia, S. (2021). Klasterisasi Pola Penjualan Pestisida Menggunakan Metode K-Means Clustering (Studi Kasus Di TokoJuanda Tani Kecamatan Hutabayu Raja). Djtechno: Jurnal Teknologi Informasi, 1(1), 1–5. https://doi.org/10.46576/djtechn o.v1i1.964
Aziz, C. (2017). Analisis Multivariat Clustering K-Means Untuk APBD Kecamatan-Kecamatan di Kota Semarang Tahun 2015. Semarang: Universitas Negeri Semarang. http://lib.unnes.ac.id/36913/1/4112315026.pdf
Chintia Devi, A., Zulfia Zahro’, H. dan Vendyansyah, N. (2020). Penerapan Metode K-Means Clustering Untuk Pengelompokan Data Barang Penjualan Berbasis Web Pada Koperasi PT. X. Jurnal Mahasiswa Teknik Informatika, 4(1), pp. 319-324. https://doi.org/10.36040/jati.v4i1.2337
Gustientiedina, Adiya, M. H., & Desnelita, Y. (2019). Penerapan Algoritma KMeans Untuk Clustering Data Obat-Obatan Pada RSUD Pekanbaru. Jurnal Nasional Teknologi dan Sistem Informasi VOL.05 NO.01 ISSN (Print) 2460-3465 | ISSN (Online) 2476-8812 | , 17-24. https://teknosi.fti.unand.ac.id/index.php/teknosi/article/view/773/178
Hidayat, R., Wasono, R., & Darsyah, Moh. Y. (2017). Pengelompokan Kabupaten/Kota Di Jawa Tengah Menggunakan Metode K-Means Dan Fuzzy C-Means. Seminar Nasional Pendidikan, Sains dan Teknologi Fakultas Matematika dan Ilmu Pengetahuan Universitas Muhammadiyah Semarang, 240–250. https://jurnal.unimus.ac.id/index.php/psn12012010/article/view/3017/2932
Kassambara, A. (2017). Practical Guide to Cluster Analysis in R. Retrieved from Sthd.com
Muningsih, E., & Kiswati, S. (2018). Sistem Aplikasi Berbasis Optimasi Metode Elbow Untuk Penentuan Clustering Pelanggan. Joutica, 3(1), 117. https://doi.org/10.30736/jti.v3i1.196
Saputra, E. A., & Nataliani, Y. (2021). Analisis Pengelompokan Data Nilai Siswa untuk Menentukan Siswa Berprestasi Menggunakan Metode Clustering K-Means. Journal of Information Systems and Informatics, 3(3), 424-439. https://doi.org/10.51519/journalisi.v3i3.164
Statistik, B. P. (2022). Banyaknya Desa/Kelurahan Menurut Keberadaan Korban Bunuh Diri, Lokasi Berkumpul Anak Jalanan, Gelandangan, Dan Pekerja Seks Komersial (PSK), 2021. Jawa Tengah: Badan Pusat Statistik.