Keterangan:
Kabupaten/Kota = Kabupaten/Kota di Provinsi Papua
UHS = Umur Harapan Hidup
HLS = Harapan Lama Sekolah
RLS = Rata-rata Lama Sekolah
Pengeluaran = Pengeluaran per Kapita Riil per Tahun yang Disesuaikan
Terdapat dua asumsi dalam analisis klaster menurut Hair, dkk (2009)
Sampel yang mewakili atau representatif adalah sampel yang diambil dapat dikatakan merepresentasikan atau mewakili populasi yang ada. Pengujian sampel yang mewakili (sampel representatif) dapat dilakukan dengan uji Kaiser-Mayer-Olkin (KMO). Hasil uji Kaiser-Mayer-Olkin (KMO) memiliki nilai berkisar antara 0 sampai dengan 1. Jika nilai KMO berkisar 0,5 sampai 1 maka sampel dapat dikatakan mewakili populasi atau sampel representatif.
Multikolinieritas. Indikasi adanya multikolinieritas salah satunya dengan menggunakan nilai VIF
Nilai VIF >10 artinya terjadi multikolinieritas. Sehingga perlu dilakukan analisis lanjutan untuk menangani multikolinieritas.
Prasetyo dalam Ningrat, dkk (2016) menerangkan langkah-langkah algoritma K-Means sebagai berikut
Jika nilai indeks Silhouette mendekati 1 artinya proses klastering berhasil, dan jika mendekati 0 artinya proses klastering tidak berhasil. Pengelompokkan nilai Silhouette Coefficient menurut Nugroho dan Adhinata (2022) Range Interpretasi
0,71-1,00 : Struktur yang dihasilkan kuat
0,51-0,70 : Struktur yang dihasilkan baik
0,26-0,50 : Struktur yang dihasilkan lemah
≤0,25 : Tidak terstrukturlibrary(readxl)
IPM_Papua <- read_excel("C:/Users/U S E R/Downloads/IPM Papua.xlsx",
col_types = c("text", "numeric", "numeric",
"numeric", "numeric", "numeric"))
View(IPM_Papua)
\(H_0 :\) Tidak terjadi multikolinieritas
\(H_1 :\) Terjadi multikolinieritas
library(car)
modelIPM<-lm(IPM_Papua$IPM~IPM_Papua$UHH+IPM_Papua$HLS+IPM_Papua$RLS+
IPM_Papua$Pengeluaran)
summary(modelIPM)
vif(modelIPM)
\(H_0 :\) Sampel representatif
\(H_1 :\) Sampel tidak representatif
library(psych)
dataIPM<-IPM_Papua[ ,-c(1,6)]
KMO(dataIPM)
library (cluster) digunakan karena analisis yang dipakai adalah analisis klaster sehingga packages ini diaktifkan.
library (factoextra) digunakan untuk visualisasi hasil analisis multivariat, dalam hal ini untuk visualisasi data hasil analisis clustering menggunakan metode K-Means.
library (ggplot2) digunakan karena dalam visualisasi data nantinya akan memanfaatkan plot/grafik. Sehingga untuk menghasilkan visualisasi grafik yang baik, digunakan library (ggplot2).#aktifkan library yang dibutuhkan
library(cluster)
library(factoextra)
library(tidyverse)
library(ggplot2)
summary(dataIPM)
#normalisasi data IPM
dataIPM<-distinct(dataIPM)
#Silhouette Coefficient
fviz_nbclust(dataIPM, kmeans, method = "silhouette")
#k-means
kluster=kmeans(dataIPM,centers=2,nstart=25)
datakluster=data.frame(IPM_Papua,kluster$cluster)
view(datakluster)
fviz_cluster(kluster,data=dataIPM)
\(H_0 :\) Tidak terjadi multikolinieritas
\(H_1 :\) Terjadi multikolinieritas
##
## Call:
## lm(formula = IPM_Papua$IPM ~ IPM_Papua$UHH + IPM_Papua$HLS +
## IPM_Papua$RLS + IPM_Papua$Pengeluaran)
##
## Residuals:
## Min 1Q Median 3Q Max
## -2.01252 -0.27852 0.05766 0.68485 0.97981
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -6.6338292 10.7071887 -0.620 0.54138
## IPM_Papua$UHH 0.5306919 0.1717952 3.089 0.00502 **
## IPM_Papua$HLS 1.3940762 0.1463271 9.527 1.26e-09 ***
## IPM_Papua$RLS 1.3692506 0.1435276 9.540 1.22e-09 ***
## IPM_Papua$Pengeluaran 0.0009301 0.0001215 7.656 6.80e-08 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.8604 on 24 degrees of freedom
## Multiple R-squared: 0.9947, Adjusted R-squared: 0.9938
## F-statistic: 1129 on 4 and 24 DF, p-value: < 2.2e-16
## IPM_Papua$UHH IPM_Papua$HLS IPM_Papua$RLS
## 4.887765 6.240541 7.401433
## IPM_Papua$Pengeluaran
## 3.695876
Berdasarkan hasil uji, nilai VIF yang diperoleh oleh seluruh variabel berturut-turut yaitu, VIF(UHH) 4.88, VIF(HLS) 6.24, VIF(RLS) 7.40, VIF(Pengeluaran) 3.69
Keputusan: Nilai VIF < 10, maka \(H_0\) diterima
Kesimpulan: Tidak terjadi multikolinieritas antar variabel dalam model\(H_0 :\) Sampel representatif
\(H_1 :\) Sampel tidak representatif
## Kaiser-Meyer-Olkin factor adequacy
## Call: KMO(r = dataIPM)
## Overall MSA = 0.82
## MSA for each item =
## UHH HLS RLS Pengeluaran
## 0.87 0.79 0.79 0.85
Berdasarkan hasil uji, nilai MSA yang diperoleh oleh seluruh variabel berturut-turut yaitu, MSA(UHH) 0.87, MSA(HLS) 0.79, MSA(RLS) 0.79, MSA(Pengeluaran) 0.85
Keputusan: Nilai MSA > 5%, maka \(H_0\) diterima
Kesimpulan: Sampel yang digunakan representatif## UHH HLS RLS Pengeluaran
## Min. :63.88 Min. : 4.33 Min. : 1.710 Min. : 4352
## 1st Qu.:66.68 1st Qu.: 9.27 1st Qu.: 3.680 1st Qu.: 5397
## Median :68.90 Median :11.04 Median : 5.980 Median : 6259
## Mean :68.49 Mean :10.80 Mean : 6.536 Mean : 7346
## 3rd Qu.:69.79 3rd Qu.:12.84 3rd Qu.: 9.360 3rd Qu.: 8396
## Max. :72.83 Max. :15.26 Max. :11.840 Max. :15272
Berdasarkan grafik Silhouette Coefficient yang diperoleh, jumlah klaster yang optimal ditunjukkan pada nilai k=2. Sehingga pada analisis K-Means, jumlah klaster yang akan digunakan yaitu dua klaster.
Untuk menampilkan visualisasi pemetaan klaster yang terbentuk menggunakan syntax sebagai berikut.fviz_cluster(kluster,data=dataIPM)
Dapat dilihat pada tabel tersebut bahwa pada kolom klaster menunjukkan nomor klaster dari Kabupaten/Kota. Dengan demikian dapat diinterpretasikan sebagai berikut:
Klaster 1: Jayawijaya, Kepulauan Yapen, Paniai, Puncak Jaya, Boven Digoel, Mappi, Asmat, Yahukimo, Pegunungan Bintang, Tolikara, Sarmi, Waropen, Supiori, Mamberamo Raya, Nduga, Lanny Jaya, Mamberamo Tengah, Yalimo. Puncak, Dogiyak, Intan Jaya, dan Deiyai memiliki karakteristik yang sama pada indikator IPM yaitu nilai UHH, HLS, RLS, dan pengeluaran yang rendah.
Klaster 2: Merauke, Jayapura, Nabire, Biak Numfor, Mimika, Keerom, dan Kota Jayapura memiliki karakteristik yang sama pada indikator IPM yaitu nilai UHH, HLS, RLS, dan pengeluaran yang tinggi.
Berdasarkan hasil penelitian yang dilakukan dengan K-Means Cluster pada data indikator penyusun IPM Kabupaten/Kota di Provinsi Papua 2023, diperoleh kesimpulan pengelompokan Kabupaten/Kota berdasarkan indikator Umur Harapan Hidup saat Lahir (UHH), Rata-Rata Lama Sekolah (RLS), Harapan Lama Sekolah (HLS) dan Pengeluaran Riil per Kapita per Tahun yang Disesuaikan diperoleh 2 klaster berdasarkan metode Silhouette coefficient sebagai berikut:
Klaster 1 yaitu Kabupaten/Kota dengan indikator IPM rendah, yaitu, Jayawijaya, Kepulauan Yapen, Paniai, Puncak Jaya, Boven Digoel, Mappi, Asmat, Yahukimo, Pegunungan Bintang, Tolikara, Sarmi, Waropen, Supiori, Mamberamo Raya, Nduga, Lanny Jaya, Mamberamo Tengah, Yalimo. Puncak, Dogiyak, Intan Jaya, dan Deiyai, hal ini dikarenakan karakteristik Kabupaten/ Kota di kluster 1 memiliki kesamaan karakteristik yaitu nilai semua indikator IPM rendah jika dibandingkan dengan nilai indikator pada kluster lain.
Klaster 2 yaitu Kabupaten/Kota dengan indikator IPM tinggi, yaitu Merauke, Jayapura, Nabire, Biak Numfor, Mimika, Keerom, dan Kota Jayapura, hal ini dikarenakan karakteristik Kabupaten/ Kota di kluster 2 memiliki kesamaan karakteristik yaitu nilai semua indikator IPM tinggi jika dibandingkan dengan indikator pada kluster lain.
Badan Pusat Statistik. 2021. Indeks Pembangunan Manusia 2020. Direktorat Analisis dan Pengembangan Statistik. Jakarta.
Badan Pusat Statistik. 2024. Indeks Pembangunan Manusia 2023. Volume 18. Direktorat Analisis dan Pengembangan Statistik. Jakarta.
Hair Jr, J. F., W. C. Black, B. J. Babin, dan R. E. Anderson. 2009. Multivariate Data Analysis. 7th ed. Pearson.
Irianto, M. R., A. Maududie, dan F. N. Arifin. 2022. Implementasi Metode K-Means Clustering Untuk Analisis Trend Topik Skripsi (Studi Kasus: Fakultas Ilmu Komputer Universitas Jember). Berkala Sainstek 10(4):210-226.
Ningrat, D. R., D. A. I. Maruddani, dan T. Wuryandari. 2016. Analisis Cluster Dengan Algoritma K-Means dan Fuzzy C-Means Clustering Untuk Pengelompokan Data Obligasi Korporasi. Jurnal Gaussian 5(4):641-650.
Nugroho, N., dan F. D. Adhinata. 2022. Penggunaan Metode K-Means dan K-Means++ Sebagai Clustering Data Covid-19 di Pulau Jawa. TEKNIKA 11(3):170-179.
Rencher A. C. 2002. Methods of Multivariate Analysis. 2nd ed. John Wiley & Sons, Inc. Kanada.