1 PENDAHULUAN
1.1 LATAR BELAKANG
Kesenjangan ekonomi dan kemiskinan adalah isu yang menarik untuk dipelajari. Jawa Timur adalah salah satu provinsi di Indonesia yang memiliki keadaan ekonomi cukup baik dibandingkan provinsi lainnya. Meskipun, Jawa Timur adalah provinsi yang memiliki ekonomi cukup baik, kota/kabupaten di dalamnya tidak memiliki keadaan yang sama. Keadaan ekonomi ini berdasarkan kestabilan ekonomi dan beban sosial yang ditanggung daerah itu. Kota/kabupaten dapat dikelompokkan berdasarkan keadaan ekonomi daerah dengan analisis statistik cluster K-Means.
Statistika adalah ilmu yang berkaitan dengan pengumpulan, pengolahan, penyajian, analisis data, penarikan kesimpulan, dan pengujian kesimpulan (Nalim, Y., Turmudi, S., 2012). Statistika bermanfaat untuk melakukan pengambilan keputusan mengenai permasalahan. Statistika menjadi alat untuk mengelompokkan kota.kabupaten berdasarkan faktor kemiskinan di Jawa TImur, khususnya dengan analisis cluster.
Analisis cluster bertujuan untuk mengelompokkan objek berdasarkan kemiripan atau kedekatan antara karakteristik yang dimiliki. Analisis cluster adalah salah satu jenis analisis multivariat. Analisis cluster terbagi menjadi 2 metode yaitu, metode hierarki dan metode non hierarki. Pada metode non hirarki harus menentukan jumlah kelompok yang akan digunakan untuk analisis cluster.
1.2 RUMUSAN MASALAH
Berapa kelompok yang dapat membagi kota/kabupaten di Jawa Timur berdasarkan faktor kemiskinan?
Bagaimana karakteristik kelompok kota/kabupaten di Jawa Timur ?
1.3 TUJUAN PENELITIAN
Membagi kota/kabupaten di Jawa Timur berdasarkan jumlah kelompok Optimal
Mengetahui karakteristik kota/kabupaten di Jawa Timur berdasarkan kelompok
2 TINJAUAN UMUM
2.1 ANALISIS CLUSTER
Analisis cluster adalah metode untuk mengelompokkan objek ke dalam kelompok berdasarkan karakteristik yang serupa anatara objek. TUjuan utama analisis cluster adalah menciptakan kelompok yang memiliki kemiripan maksimal dan kemiripan minimal antar kelompok. Analisis cluster terbagi menjadi 2 metode yaitu non hirarki dan hirarki.
2.2 ALGORITMA K-MEANS
K-Means adalah teknik pengelompokkan non-hirarki yang digunakan dalam analisis data atau sebagai metode data mining berbasis unsupervised learning. ## SILHOUETTE INDEX Silhouette index adalah teknik yang digunakan untuk mengevaluasi kualitas pengelompokkan (clustering) berdasarkan kriteria internal. Semakin besar nilai silhouette untuk sebuah objek , semakin tepat penempatan objek tersebut dalam clusternya.
3 Source Code
3.2 Menyiapkan Data
kemiskinan = read.csv('D:/kuliah/S5/ANMUL/praktikum/Jumlah Penduduk Miskin (Ribu Jiwa) Menurut Kabupaten_Kota , 2022-2024 - Sheet5.csv')
head(kemiskinan)
summary(kemiskinan)
dataclus = kemiskinan[2:5]
kem = scale(dataclus[-1])
head(kem)
par(mfrow = c(2,2))
hist(kemiskinan$JPM)
hist(kemiskinan$PPM)
hist(kemiskinan$IKK)
hist(kemiskinan$IKedK)3.4 Algoritma K-means
3.4.1 Menentukan anggota kelompok
set.seed(123)
km <- kmeans(kem, 2, nstart = 25)
library(knitr)
kemiskinan$cluster <- as.factor(km$cluster)
kable(kemiskinan, caption = 'Tabel Kota/Kabupaten di Jawa TImur')
c1 = kemiskinan$Kota[kemiskinan$cluster == 1]
c2 = kemiskinan$Kota[kemiskinan$cluster == 2]
c1 = paste(c1, collapse = ',')
c2 = paste(c2, collapse = ',')
kelompok = data.frame(
c = c('cluster1','cluster2'),
anggota = c(c1,c2)
)
kable(kelompok, caption = 'anggota kelompok hasil clustering')4 HASIL DAN PEMBAHASAN
4.1 Menyiapkan Data
## Kota JPM PPM IKK IKedK
## 1 Pacitan 73.03 13.08 0.25 1.49
## 2 Ponorogo 80.05 9.11 0.17 1.02
## 3 Trenggalek 73.75 10.50 0.28 1.43
## 4 Tulungagung 66.42 6.28 0.10 0.60
## 5 Blitar 95.91 8.16 0.12 0.80
## 6 Kediri 159.27 9.95 0.24 1.22
## Kota JPM PPM IKK
## Length:38 Min. : 6.59 Min. : 3.060 Min. :0.0600
## Class :character 1st Qu.: 68.07 1st Qu.: 6.518 1st Qu.:0.1600
## Mode :character Median :107.49 Median : 9.215 Median :0.2050
## Mean :104.81 Mean : 9.782 Mean :0.2766
## 3rd Qu.:146.44 3rd Qu.:12.043 3rd Qu.:0.2800
## Max. :240.14 Max. :20.830 Max. :1.5300
## IKedK
## Min. :0.420
## 1st Qu.:0.825
## Median :1.055
## Mean :1.291
## 3rd Qu.:1.505
## Max. :4.190
| Nama | Penjelasan |
|---|---|
| JPM | Jumlah Penduduk Miskin |
| PPM | Persentase Penduduk Miskin |
| IKK | Indek keparahan kemiskinan |
| IKedK | Indeks Kedalaman Kemiskinan |
Untuk mengelompokkan kota/kabupaten digunakan 4 variabel yang
menunjukkan karakteristik. 4 variabel itu yaitu, jumlah penduduk miskin,
persentase penduduk miskin, indeks keparahan kemiskinan, dan indeks
kedalaman kemiskinan.
Dapat dilihat pada histogram bahwa banyak kota/kabupaten yang memiliki penduduk miskin diangka 100-150 orang dan banyak juga yang memiliki persentase cukup tinggi sebesar 10%. Namun, kota/kabupaten di Jawa Timur juga banyak yang memiliki indek keparahan kemiskinan dan indeks kedalama kemiskinan yang rendah.
## PPM IKK IKedK
## [1,] 0.7826446 -0.10524812 0.26172291
## [2,] -0.1595768 -0.42203455 -0.35658015
## [3,] 0.1703193 0.01354679 0.18279060
## [4,] -0.8312359 -0.69922268 -0.90910628
## [5,] -0.3850454 -0.62002607 -0.64599860
## [6,] 0.0397849 -0.14484643 -0.09347247
Data yang digunakan memerlukan pengskalaan untuk menghilangkan perbedaan satuan antar variabel agar analisi menjadi tidak bias.
4.2 Menentukan K-optimal
Metode silhouette digunakan untuk menentukan jumlah kelompok optimal
yang akan digunakan untuk melakukan clustering. Dengan metode
silhouette didapatkan membagi kota/kabupaten menjadi 2 kelompok adalah
yang paling optimal.
4.3 Algoritma K-means
4.3.1 Menentukan anggota kelompok
## [1] 2 2 2 2 2 2 2 2 2 2 2 2 1 2 2 2 2 2 2 2 1 1 1 1 2 1 1 2 1 2 2 2 2 2 2 2 2 2
dapat dilihat hasil dari algoritma K-means kota/kabupaten sudah terbagi menjadi 2 kelompok.
| Kota | JPM | PPM | IKK | IKedK | cluster |
|---|---|---|---|---|---|
| Pacitan | 73.03 | 13.08 | 0.25 | 1.49 | 2 |
| Ponorogo | 80.05 | 9.11 | 0.17 | 1.02 | 2 |
| Trenggalek | 73.75 | 10.50 | 0.28 | 1.43 | 2 |
| Tulungagung | 66.42 | 6.28 | 0.10 | 0.60 | 2 |
| Blitar | 95.91 | 8.16 | 0.12 | 0.80 | 2 |
| Kediri | 159.27 | 9.95 | 0.24 | 1.22 | 2 |
| Malang | 240.14 | 8.98 | 0.16 | 0.98 | 2 |
| Lumajang | 91.05 | 8.65 | 0.26 | 1.23 | 2 |
| Jember | 224.77 | 9.01 | 0.18 | 1.01 | 2 |
| Banyuwangi | 106.61 | 6.54 | 0.06 | 0.44 | 2 |
| Bondowoso | 99.62 | 12.60 | 0.28 | 1.51 | 2 |
| Situbondo | 80.17 | 11.51 | 0.18 | 1.19 | 2 |
| Probolinggo | 197.11 | 16.45 | 0.60 | 2.63 | 1 |
| Pasuruan | 144.84 | 8.63 | 0.21 | 1.09 | 2 |
| Sidoarjo | 109.39 | 4.53 | 0.18 | 0.64 | 2 |
| Mojokerto | 108.72 | 9.37 | 0.19 | 1.01 | 2 |
| Jombang | 110.57 | 8.60 | 0.17 | 0.90 | 2 |
| Nganjuk | 108.37 | 10.17 | 0.18 | 1.04 | 2 |
| Madiun | 73.15 | 10.63 | 0.25 | 1.40 | 2 |
| Magetan | 59.51 | 9.32 | 0.20 | 1.09 | 2 |
| Ngawi | 116.47 | 13.81 | 0.61 | 2.22 | 1 |
| Bojonegoro | 147.33 | 11.69 | 0.48 | 1.99 | 1 |
| Tuban | 171.24 | 14.36 | 0.39 | 1.95 | 1 |
| Lamongan | 146.98 | 12.16 | 0.44 | 1.88 | 1 |
| Gresik | 142.39 | 10.32 | 0.33 | 1.58 | 2 |
| Bangkalan | 190.94 | 18.66 | 0.39 | 2.03 | 1 |
| Sampang | 214.32 | 20.83 | 0.57 | 2.86 | 1 |
| Pamekasan | 123.46 | 13.41 | 0.14 | 1.05 | 2 |
| Sumenep | 196.42 | 17.78 | 1.53 | 4.19 | 1 |
| Kota Kediri | 19.24 | 6.51 | 0.25 | 1.02 | 2 |
| Kota Blitar | 9.86 | 6.75 | 0.24 | 1.06 | 2 |
| Kota Malang | 34.84 | 3.91 | 0.08 | 0.42 | 2 |
| Kota Probolinggo | 15.24 | 6.18 | 0.21 | 0.98 | 2 |
| Kota Pasuruan | 13.07 | 6.32 | 0.12 | 0.70 | 2 |
| Kota Mojokerto | 7.43 | 5.57 | 0.13 | 0.74 | 2 |
| Kota Madiun | 7.84 | 4.38 | 0.09 | 0.56 | 2 |
| Kota Surabaya | 116.62 | 3.96 | 0.16 | 0.65 | 2 |
| Kota Batu | 6.59 | 3.06 | 0.09 | 0.46 | 2 |
| cluster | anggota |
|---|---|
| cluster1 | Probolinggo,Ngawi,Bojonegoro,Tuban,Lamongan,Bangkalan,Sampang,Sumenep |
| cluster2 | Pacitan,Ponorogo,Trenggalek,Tulungagung,Blitar,Kediri,Malang,Lumajang,Jember,Banyuwangi,Bondowoso,Situbondo,Pasuruan,Sidoarjo,Mojokerto,Jombang,Nganjuk,Madiun,Magetan,Gresik,Pamekasan,Kota Kediri,Kota Blitar,Kota Malang,Kota Probolinggo,Kota Pasuruan,Kota Mojokerto,Kota Madiun,Kota Surabaya,Kota Batu |
4.3.2 Visualisasi
## # A tibble: 2 × 5
## Cluster JPM PPM IKK IKedK
## <int> <dbl> <dbl> <dbl> <dbl>
## 1 1 173. 15.7 0.626 2.47
## 2 2 86.7 8.20 0.183 0.977
Dapat dilihat pada plot bahwa kelompok 2 memiliki kemiripan yang lebih kuat daripada kelompok 2. Kelompok 1 berisi kota/kabupaten yang memiliki kasus kemiskinan paling tinggi dilihat dari, sedangkan kelompok 2 berisi kota/kabupaten yang memiliki ekonomi lebih stabil.