1 PENDAHULUAN

1.1 LATAR BELAKANG

Kesenjangan ekonomi dan kemiskinan adalah isu yang menarik untuk dipelajari. Jawa Timur adalah salah satu provinsi di Indonesia yang memiliki keadaan ekonomi cukup baik dibandingkan provinsi lainnya. Meskipun, Jawa Timur adalah provinsi yang memiliki ekonomi cukup baik, kota/kabupaten di dalamnya tidak memiliki keadaan yang sama. Keadaan ekonomi ini berdasarkan kestabilan ekonomi dan beban sosial yang ditanggung daerah itu. Kota/kabupaten dapat dikelompokkan berdasarkan keadaan ekonomi daerah dengan analisis statistik cluster K-Means.

Statistika adalah ilmu yang berkaitan dengan pengumpulan, pengolahan, penyajian, analisis data, penarikan kesimpulan, dan pengujian kesimpulan (Nalim, Y., Turmudi, S., 2012). Statistika bermanfaat untuk melakukan pengambilan keputusan mengenai permasalahan. Statistika menjadi alat untuk mengelompokkan kota.kabupaten berdasarkan faktor kemiskinan di Jawa TImur, khususnya dengan analisis cluster.

Analisis cluster bertujuan untuk mengelompokkan objek berdasarkan kemiripan atau kedekatan antara karakteristik yang dimiliki. Analisis cluster adalah salah satu jenis analisis multivariat. Analisis cluster terbagi menjadi 2 metode yaitu, metode hierarki dan metode non hierarki. Pada metode non hirarki harus menentukan jumlah kelompok yang akan digunakan untuk analisis cluster.

1.2 RUMUSAN MASALAH

Berapa kelompok yang dapat membagi kota/kabupaten di Jawa Timur berdasarkan faktor kemiskinan?

Bagaimana karakteristik kelompok kota/kabupaten di Jawa Timur ?

1.3 TUJUAN PENELITIAN

Membagi kota/kabupaten di Jawa Timur berdasarkan jumlah kelompok Optimal

Mengetahui karakteristik kota/kabupaten di Jawa Timur berdasarkan kelompok

2 TINJAUAN UMUM

2.1 ANALISIS CLUSTER

Analisis cluster adalah metode untuk mengelompokkan objek ke dalam kelompok berdasarkan karakteristik yang serupa anatara objek. TUjuan utama analisis cluster adalah menciptakan kelompok yang memiliki kemiripan maksimal dan kemiripan minimal antar kelompok. Analisis cluster terbagi menjadi 2 metode yaitu non hirarki dan hirarki.

2.2 ALGORITMA K-MEANS

K-Means adalah teknik pengelompokkan non-hirarki yang digunakan dalam analisis data atau sebagai metode data mining berbasis unsupervised learning. ## SILHOUETTE INDEX Silhouette index adalah teknik yang digunakan untuk mengevaluasi kualitas pengelompokkan (clustering) berdasarkan kriteria internal. Semakin besar nilai silhouette untuk sebuah objek , semakin tepat penempatan objek tersebut dalam clusternya.

3 Source Code

3.1 Memuat Package

library(tidyverse)
library(cluster)
library(factoextra)
library(readxl)

3.2 Menyiapkan Data

kemiskinan = read.csv('D:/kuliah/S5/ANMUL/praktikum/Jumlah Penduduk Miskin (Ribu Jiwa) Menurut Kabupaten_Kota , 2022-2024 - Sheet5.csv')
head(kemiskinan)
summary(kemiskinan)

dataclus = kemiskinan[2:5]
kem = scale(dataclus[-1])
head(kem)

par(mfrow = c(2,2))
hist(kemiskinan$JPM)
hist(kemiskinan$PPM)
hist(kemiskinan$IKK)
hist(kemiskinan$IKedK)

3.3 Menentukan K-optimal

fviz_nbclust(kem, kmeans, method = "silhouette")

3.4 Algoritma K-means

3.4.1 Menentukan anggota kelompok

set.seed(123)
km <- kmeans(kem, 2, nstart = 25)

library(knitr)
kemiskinan$cluster <- as.factor(km$cluster)
kable(kemiskinan, caption = 'Tabel Kota/Kabupaten di Jawa TImur')
c1 = kemiskinan$Kota[kemiskinan$cluster == 1]
c2 = kemiskinan$Kota[kemiskinan$cluster == 2]
c1 = paste(c1, collapse = ',')
c2 = paste(c2, collapse = ',')

kelompok = data.frame(
  c = c('cluster1','cluster2'),
  anggota = c(c1,c2)
)
kable(kelompok, caption = 'anggota kelompok hasil clustering')

3.4.2 Visualisasi

fviz_cluster(km, data = kem)

dataclus %>%
  mutate(Cluster = km$cluster) %>%
  group_by(Cluster) %>%
  summarise_all("mean")

4 HASIL DAN PEMBAHASAN

4.1 Menyiapkan Data

##          Kota    JPM   PPM  IKK IKedK
## 1     Pacitan  73.03 13.08 0.25  1.49
## 2    Ponorogo  80.05  9.11 0.17  1.02
## 3  Trenggalek  73.75 10.50 0.28  1.43
## 4 Tulungagung  66.42  6.28 0.10  0.60
## 5      Blitar  95.91  8.16 0.12  0.80
## 6      Kediri 159.27  9.95 0.24  1.22
##      Kota                JPM              PPM              IKK        
##  Length:38          Min.   :  6.59   Min.   : 3.060   Min.   :0.0600  
##  Class :character   1st Qu.: 68.07   1st Qu.: 6.518   1st Qu.:0.1600  
##  Mode  :character   Median :107.49   Median : 9.215   Median :0.2050  
##                     Mean   :104.81   Mean   : 9.782   Mean   :0.2766  
##                     3rd Qu.:146.44   3rd Qu.:12.043   3rd Qu.:0.2800  
##                     Max.   :240.14   Max.   :20.830   Max.   :1.5300  
##      IKedK      
##  Min.   :0.420  
##  1st Qu.:0.825  
##  Median :1.055  
##  Mean   :1.291  
##  3rd Qu.:1.505  
##  Max.   :4.190
Deskripsi variabel
Nama Penjelasan
JPM Jumlah Penduduk Miskin
PPM Persentase Penduduk Miskin
IKK Indek keparahan kemiskinan
IKedK Indeks Kedalaman Kemiskinan

Untuk mengelompokkan kota/kabupaten digunakan 4 variabel yang menunjukkan karakteristik. 4 variabel itu yaitu, jumlah penduduk miskin, persentase penduduk miskin, indeks keparahan kemiskinan, dan indeks kedalaman kemiskinan.

Dapat dilihat pada histogram bahwa banyak kota/kabupaten yang memiliki penduduk miskin diangka 100-150 orang dan banyak juga yang memiliki persentase cukup tinggi sebesar 10%. Namun, kota/kabupaten di Jawa Timur juga banyak yang memiliki indek keparahan kemiskinan dan indeks kedalama kemiskinan yang rendah.

##             PPM         IKK       IKedK
## [1,]  0.7826446 -0.10524812  0.26172291
## [2,] -0.1595768 -0.42203455 -0.35658015
## [3,]  0.1703193  0.01354679  0.18279060
## [4,] -0.8312359 -0.69922268 -0.90910628
## [5,] -0.3850454 -0.62002607 -0.64599860
## [6,]  0.0397849 -0.14484643 -0.09347247

Data yang digunakan memerlukan pengskalaan untuk menghilangkan perbedaan satuan antar variabel agar analisi menjadi tidak bias.

4.2 Menentukan K-optimal

Metode silhouette digunakan untuk menentukan jumlah kelompok optimal yang akan digunakan untuk melakukan clustering. Dengan metode silhouette didapatkan membagi kota/kabupaten menjadi 2 kelompok adalah yang paling optimal.

4.3 Algoritma K-means

4.3.1 Menentukan anggota kelompok

##  [1] 2 2 2 2 2 2 2 2 2 2 2 2 1 2 2 2 2 2 2 2 1 1 1 1 2 1 1 2 1 2 2 2 2 2 2 2 2 2

dapat dilihat hasil dari algoritma K-means kota/kabupaten sudah terbagi menjadi 2 kelompok.

Tabel Kota/Kabupaten di Jawa TImur
Kota JPM PPM IKK IKedK cluster
Pacitan 73.03 13.08 0.25 1.49 2
Ponorogo 80.05 9.11 0.17 1.02 2
Trenggalek 73.75 10.50 0.28 1.43 2
Tulungagung 66.42 6.28 0.10 0.60 2
Blitar 95.91 8.16 0.12 0.80 2
Kediri 159.27 9.95 0.24 1.22 2
Malang 240.14 8.98 0.16 0.98 2
Lumajang 91.05 8.65 0.26 1.23 2
Jember 224.77 9.01 0.18 1.01 2
Banyuwangi 106.61 6.54 0.06 0.44 2
Bondowoso 99.62 12.60 0.28 1.51 2
Situbondo 80.17 11.51 0.18 1.19 2
Probolinggo 197.11 16.45 0.60 2.63 1
Pasuruan 144.84 8.63 0.21 1.09 2
Sidoarjo 109.39 4.53 0.18 0.64 2
Mojokerto 108.72 9.37 0.19 1.01 2
Jombang 110.57 8.60 0.17 0.90 2
Nganjuk 108.37 10.17 0.18 1.04 2
Madiun 73.15 10.63 0.25 1.40 2
Magetan 59.51 9.32 0.20 1.09 2
Ngawi 116.47 13.81 0.61 2.22 1
Bojonegoro 147.33 11.69 0.48 1.99 1
Tuban 171.24 14.36 0.39 1.95 1
Lamongan 146.98 12.16 0.44 1.88 1
Gresik 142.39 10.32 0.33 1.58 2
Bangkalan 190.94 18.66 0.39 2.03 1
Sampang 214.32 20.83 0.57 2.86 1
Pamekasan 123.46 13.41 0.14 1.05 2
Sumenep 196.42 17.78 1.53 4.19 1
Kota Kediri 19.24 6.51 0.25 1.02 2
Kota Blitar 9.86 6.75 0.24 1.06 2
Kota Malang 34.84 3.91 0.08 0.42 2
Kota Probolinggo 15.24 6.18 0.21 0.98 2
Kota Pasuruan 13.07 6.32 0.12 0.70 2
Kota Mojokerto 7.43 5.57 0.13 0.74 2
Kota Madiun 7.84 4.38 0.09 0.56 2
Kota Surabaya 116.62 3.96 0.16 0.65 2
Kota Batu 6.59 3.06 0.09 0.46 2
anggota kelompok hasil clustering
cluster anggota
cluster1 Probolinggo,Ngawi,Bojonegoro,Tuban,Lamongan,Bangkalan,Sampang,Sumenep
cluster2 Pacitan,Ponorogo,Trenggalek,Tulungagung,Blitar,Kediri,Malang,Lumajang,Jember,Banyuwangi,Bondowoso,Situbondo,Pasuruan,Sidoarjo,Mojokerto,Jombang,Nganjuk,Madiun,Magetan,Gresik,Pamekasan,Kota Kediri,Kota Blitar,Kota Malang,Kota Probolinggo,Kota Pasuruan,Kota Mojokerto,Kota Madiun,Kota Surabaya,Kota Batu

4.3.2 Visualisasi

## # A tibble: 2 × 5
##   Cluster   JPM   PPM   IKK IKedK
##     <int> <dbl> <dbl> <dbl> <dbl>
## 1       1 173.  15.7  0.626 2.47 
## 2       2  86.7  8.20 0.183 0.977

Dapat dilihat pada plot bahwa kelompok 2 memiliki kemiripan yang lebih kuat daripada kelompok 2. Kelompok 1 berisi kota/kabupaten yang memiliki kasus kemiskinan paling tinggi dilihat dari, sedangkan kelompok 2 berisi kota/kabupaten yang memiliki ekonomi lebih stabil.