> install.packages("knitr")
> install.packages("rmarkdown")
Error in contrib.url(repos, "source"): trying to use CRAN without setting a mirror
> install.packages("prettydoc")
Error in contrib.url(repos, "source"): trying to use CRAN without setting a mirror
> install.packages("equatiomatic")
Error in contrib.url(repos, "source"): trying to use CRAN without setting a mirror
> install.packages("readxl")
Error in contrib.url(repos, "source"): trying to use CRAN without setting a mirror
> install.packages("EFAtools")
Error in contrib.url(repos, "source"): trying to use CRAN without setting a mirror
> install.packages("corrplot")
Error in contrib.url(repos, "source"): trying to use CRAN without setting a mirror
> install.packages("factoextra")
Error in contrib.url(repos, "source"): trying to use CRAN without setting a mirror
> install.packages("clValid")
Error in contrib.url(repos, "source"): trying to use CRAN without setting a mirror
> install.packages("dendextend")
Error in contrib.url(repos, "source"): trying to use CRAN without setting a mirror
> install.packages("FactoMineR")
Error in contrib.url(repos, "source"): trying to use CRAN without setting a mirror
> install.packages("dplyr")
Error in contrib.url(repos, "source"): trying to use CRAN without setting a mirror
Statistika merupakan ilmu yang mempelajari bagaimana merencanakan, mengumpulkan, menganalisis, menginterpretasi, dan mempresentasikan data (Irianto,2004). Statistika tersebut tentunya dapat diimplementasikan di berbagai aspek, tentunya dalam menganalisis Indeks Pembangunan Manusia (IPM). Menurut BPS (2015), IPM memiliki tiga dimensi, yaitu kesehatan, pendidikan, dan kehidupan yang layak. IPM merupakan indikator penting sebagai tolak ukur maju atau tidaknya suatu wilayah atau daerah, karena IPM juga indikator keberhasilan program pembangunan daerah.
Data yang digunakan merupakan data sekunder yang diperoleh dari website resmi Badan Pusat Statistik (BPS) pada tahun 2023. Pengambilan data disesuaikan dengan banyak variabel yang dibutuhkan, yaitu Angka Harapan Hidup, Harapan Lama Sekolah, Rata-Rata Lama Sekolah, dan Pengeluaran per kapita yang disesuaikan pada tahun 2023 di Provinsi Jawa Timur. Website tersebut diakses pada 24 November 2024.
Metode yang digunakan adalah analisis klaster hirarki. Hal tersebut dikarenakan data tersebut memiliki variabel-variabel yang tidak dibedakan antara variabel independen dan variabel dependen. Selain itu, disesuaikan dengan tujuan yang ingin diraih, analisis klaster hirarki merupakan metode yang cocok untuk meraih tujuan tersebut.
Statistika Deskriptif merupakan metode yang berkaitan dengan pengumpulan, penyajian suatu data sehingga memberikan informasi yang berguna dan memudahkan dalam pemahamannya. Hasil dari statistika deskriptif dapat berupa ringkasan lima angka dan grafik. Salah satu grafik yang dapat digunakan yaitu boxplot.
KMO berguna untuk mengecek apakah sampel yang digunakan sudah merepresentasikan populasi. KMO diukur per variabel yang diambil, sehingga setiap variabel memiliki nilai KMO. Sampel dikatakan representatif jika nilai KMO>0.6.
Pengecekan asumsi multikolinearitas digunakan untuk mengetahui apakah terdapat korelasi antar variabel independen. Model regresi yang baik seharusnya tidak terjadi korelasi antar variabel independen. Dalam ujinya, digunakan VIF. Jika nilai VIF>10, maka dapat dipastikan bahwa terdapat korelasi antar variabel independen
Matriks jarak merupakan matriks yang berisi jarak antar individu pengamatan. Pada kasus ini, matriks jarak berisi jarak antar kabupaten kota, sehingga secara tidak langsung berdimensi 38x38.
Koefisien Korelasi Cophenetic digunakan untuk mengetahui metode linkage yang paling sesuai dengan kasus yang digunakan. Koefisien Korelasi Cophenetic menggunakan koefisien korelasi antara elemen-elemen asli matriks ketidakmiripan.Setiap metode linkage memiliki nilai masing-masing. Metode linkage terbaik ditunjukkan dengan nilai yang mendekati 1.
Indeks Validitas Ukuran Klaster digunakan untuk mengetahui ukuran klaster yang tepat pada kasus dan data yang digunakan. Terdapat banyak indeks validitas yang digunakan, diantaranya Connectivity, Dunn, dan Silhouette. Pada indeks Connectivity, nilai indeks terkecil menunjukkan ukuran klaster terbaik. Pada indeks Dunn dan Silhouette, nilai indeks terbesar menunjukkan ukuran klaster terbaik.
Dendogram merupakan grafik hasil analisis klaster yang telah mengelompokkan individu-individu menjadi beberapa klaster sesuai kemiripan dalam klaster dan ketidakmiripan antar klaster. Dendogram menggambarkan secara grafis pembagian antar klaster.
Berikut merupakan library yang dibutuhkan dalam analisis klaster hirarki
Tahap deklarasi data berisi proses impor data dari internal penyimpanan, pengecekan tipe data, dan deklarasi variabel sesuai tipe data yang dibutuhkan. Deklarasi variabel-variabel baru diikuti dengan pembentukan struktur data baru yang telah disesuaikan dengan kebutuhan.
> #Deklarasi Data
> dataipm<-read_xlsx("D:/Bismillah UB/Sems 5/Anmul I/UAP/data_mentah.xlsx")
> head(dataipm)
# A tibble: 6 × 5
`Kabupaten/Kota Se Jawa Timur` Angka Harapan Hidup (T…¹ Harapan Lama Sekolah…²
<chr> <dbl> <chr>
1 Kabupaten Pacitan 72.9 12.68
2 Kabupaten Ponorogo 73.6 13.77
3 Kabupaten Trenggalek 74.6 12.62
4 Kabupaten Tulungagung 74.9 13.34
5 Kabupaten Blitar 74.3 12.65
6 Kabupaten Kediri 73.3 13.62
# ℹ abbreviated names: ¹`Angka Harapan Hidup (Tahun)`,
# ²`Harapan Lama Sekolah (Tahun)`
# ℹ 2 more variables: `Rata-rata Lama Sekolah (Tahun)` <dbl>,
# `Pengeluaran Per Kapita Riil Disesuaikan (Ribu Rupiah)` <dbl>
> str(dataipm)
tibble [38 × 5] (S3: tbl_df/tbl/data.frame)
$ Kabupaten/Kota Se Jawa Timur : chr [1:38] "Kabupaten Pacitan" "Kabupaten Ponorogo" "Kabupaten Trenggalek" "Kabupaten Tulungagung" ...
$ Angka Harapan Hidup (Tahun) : num [1:38] 72.9 73.5 74.6 74.9 74.3 ...
$ Harapan Lama Sekolah (Tahun) : chr [1:38] "12.68" "13.77" "12.62" "13.34" ...
$ Rata-rata Lama Sekolah (Tahun) : num [1:38] 7.88 7.78 7.9 8.66 7.83 8.24 7.75 7.14 6.52 7.76 ...
$ Pengeluaran Per Kapita Riil Disesuaikan (Ribu Rupiah): num [1:38] 9681 10658 10465 11565 11499 ...
>
> #Deklarasi variabel
> kabkot<-dataipm$`Kabupaten/Kota Se Jawa Timur`
> hls<-as.numeric(dataipm$`Harapan Lama Sekolah (Tahun)`)
> ahm<-dataipm$`Angka Harapan Hidup (Tahun)`
> rls<-dataipm$`Rata-rata Lama Sekolah (Tahun)`
> ppkr<-dataipm$`Pengeluaran Per Kapita Riil Disesuaikan (Ribu Rupiah)`
>
> #Pembentukan struktur baru
> datafix<-data.frame(kabkot,hls,ahm,rls,ppkr)
> datafix
kabkot hls ahm rls ppkr
1 Kabupaten Pacitan 12.68 72.86 7.88 9681
2 Kabupaten Ponorogo 13.77 73.55 7.78 10658
3 Kabupaten Trenggalek 12.62 74.64 7.90 10465
4 Kabupaten Tulungagung 13.34 74.91 8.66 11565
5 Kabupaten Blitar 12.65 74.34 7.83 11499
6 Kabupaten Kediri 13.62 73.27 8.24 11952
7 Kabupaten Malang 13.48 73.26 7.75 10791
8 Kabupaten Lumajang 12.16 70.96 7.14 9720
9 Kabupaten Jember 13.49 70.03 6.52 10277
10 Kabupaten Banyuwangi 13.12 71.38 7.76 12820
11 Kabupaten Bondowoso 13.32 67.60 6.36 11255
12 Kabupaten Situbondo 13.19 69.94 6.90 10702
13 Kabupaten Probolinggo 12.63 68.12 6.29 11756
14 Kabupaten Pasuruan 12.77 70.81 7.44 11239
15 Kabupaten Sidoarjo 14.97 74.69 10.78 15311
16 Kabupaten Mojokerto 12.97 73.25 9.11 13467
17 Kabupaten Jombang 13.59 73.22 8.77 11999
18 Kabupaten Nganjuk 13.17 72.28 8.24 12821
19 Kabupaten Madiun 13.23 72.28 7.95 12259
20 Kabupaten Magetan 14.07 73.29 8.67 12495
21 Kabupaten Ngawi 12.85 73.20 7.78 11897
22 Kabupaten Bojonegoro 12.92 72.57 7.45 10776
23 Kabupaten Tuban 12.27 72.36 7.40 11174
24 Kabupaten Lamongan 14.02 73.22 8.34 12019
25 Kabupaten Gresik 13.97 73.30 10.01 13870
26 Kabupaten Bangkalan 11.97 70.79 5.99 9438
27 Kabupaten Sampang 12.54 68.64 5.07 9363
28 Kabupaten Pamekasan 13.68 68.31 7.15 9420
29 Kabupaten Sumenep 13.58 72.47 5.94 9807
30 Kota Kediri 15.45 74.67 10.69 13276
31 Kota Blitar 14.57 74.66 10.78 14548
32 Kota Malang 15.77 74.13 10.94 17222
33 Kota Probolinggo 13.73 70.99 9.56 12999
34 Kota Pasuruan 13.66 72.31 9.78 14250
35 Kota Mojokerto 14.04 74.10 11.05 14422
36 Kota Madiun 14.44 73.44 11.82 17115
37 Kota Surabaya 14.85 74.75 10.70 18977
38 Kota Batu 14.56 73.29 9.85 13603
Tahap di bawah ini merupakan proses statistika deskriptif dari data yang digunakan.
> statdes <- summary(datafix)
> statdes
kabkot hls ahm rls
Length:38 Min. :11.97 Min. :67.60 Min. : 5.070
Class :character 1st Qu.:12.87 1st Qu.:71.09 1st Qu.: 7.410
Mode :character Median :13.48 Median :73.21 Median : 7.925
Mean :13.52 Mean :72.42 Mean : 8.376
3rd Qu.:14.01 3rd Qu.:73.52 3rd Qu.: 9.725
Max. :15.77 Max. :74.91 Max. :11.820
ppkr
Min. : 9363
1st Qu.:10720
Median :11924
Mean :12287
3rd Qu.:13419
Max. :18977
> par(mfrow = c(1, 4))
> boxplot(datafix$hls)
> boxplot(datafix$ahm)
> boxplot(datafix$rls)
> boxplot(datafix$ppkr)
> datastand<-scale(datafix[,2:5])
> datastand
hls ahm rls ppkr
[1,] -0.94816471 0.22303559 -0.29879726 -1.15146131
[2,] 0.28412215 0.57113042 -0.35909622 -0.71978250
[3,] -1.01599702 1.12101935 -0.28673746 -0.80505784
[4,] -0.20200936 1.25723037 0.17153470 -0.31903257
[5,] -0.98208087 0.96967378 -0.32894674 -0.34819409
[6,] 0.11454139 0.42987455 -0.08172097 -0.14804004
[7,] -0.04373399 0.42482969 -0.37718591 -0.66101762
[8,] -1.53604469 -0.73548641 -0.74500962 -1.13422950
[9,] -0.03242860 -1.20465770 -1.11886322 -0.88812398
[10,] -0.45072781 -0.52360260 -0.37115602 0.23547808
[11,] -0.22462013 -2.43055688 -1.21534157 -0.45600333
[12,] -0.37159013 -1.25006137 -0.88972715 -0.70034149
[13,] -1.00469164 -2.16822455 -1.25755085 -0.23464091
[14,] -0.84641626 -0.81115920 -0.56411272 -0.46307279
[15,] 1.64076825 1.14624362 1.44987282 1.33610440
[16,] -0.62030858 0.41978484 0.44288005 0.52134931
[17,] 0.08062524 0.40465028 0.23786356 -0.12727351
[18,] -0.39420089 -0.06956586 -0.08172097 0.23591992
[19,] -0.32636859 -0.06956586 -0.25658798 -0.01239481
[20,] 0.62328368 0.43996425 0.17756459 0.09187971
[21,] -0.75597318 0.39456058 -0.35909622 -0.17234131
[22,] -0.67683550 0.07673486 -0.55808282 -0.66764524
[23,] -1.41168546 -0.02920704 -0.58823230 -0.49179246
[24,] 0.56675676 0.40465028 -0.02142200 -0.11843668
[25,] 0.51022984 0.44500910 0.98557077 0.69941129
[26,] -1.75084699 -0.82124890 -1.43844776 -1.25882871
[27,] -1.10644009 -1.90589221 -1.99319826 -1.29196679
[28,] 0.18237370 -2.07237235 -0.73897972 -1.26678185
[29,] 0.06931986 0.02628634 -1.46859724 -1.09578932
[30,] 2.18342668 1.13615391 1.39560375 0.43695765
[31,] 1.18855288 1.13110906 1.44987282 0.99897960
[32,] 2.54519898 0.86373187 1.54635117 2.18046285
[33,] 0.23890062 -0.72035185 0.71422541 0.31456765
[34,] 0.15976293 -0.05443130 0.84688314 0.86731093
[35,] 0.58936752 0.84859731 1.61268004 0.94330761
[36,] 1.04158289 0.51563704 2.07698209 2.13318584
[37,] 1.50510364 1.17651273 1.40163365 2.95589407
[38,] 1.17724750 0.43996425 0.88909242 0.58143971
attr(,"scaled:center")
hls ahm rls ppkr
13.518684 72.417895 8.375526 12287.052632
attr(,"scaled:scale")
hls ahm rls ppkr
0.8845343 1.9822185 1.6584032 2263.2568013
> rownames(datastand) <- 1:nrow(datastand)
Proses standarisasi dilakukan untuk menyamakan satuan tiap variabel. Dalam analisis klaster, setiap variabel diharuskan untuk memiliki satuan yang sama, sehingga memiliki bobot yang sama.
Tahap tersebut digunakan untuk membuat matriks jarak dengan metode euclidian. matriks tersebut dibuat melalui jarak antar individu yang diamati. Pada kasus tersebut, akan dibuat matriks dengan ukuran 38x38.
> #Koefisien Korelasi Cophenetic
> d1 <- dist(datafix[,2:5])
> #Single Linkage
> hiers <- hclust(dist(datafix[,2:5]), method = "single")
> #korelasi cophenetic
> hc1 <- hclust(d1, "single")
> d2 <- cophenetic(hc1)
> cors <- cor(d1,d2)
> cors
[1] 0.7854983
> #Average Linkage
> hierave <- hclust(dist(datafix[,2:5]), method = "ave")
> #korelasi cophenetic
> hc2 <- hclust(d1, "ave")
> d3 <- cophenetic(hc2)
> corave <- cor(d1,d3)
> corave
[1] 0.8435722
> #Complete Linkage
> hiercomp <- hclust(dist(datafix[,2:5]), method = "complete")
> #korelasi cophenetic
> hc3 <- hclust(d1, "complete")
> d4 <- cophenetic(hc3)
> corcomp <- cor(d1,d4)
> corcomp
[1] 0.8108426
> #Centorid Linkage
> hiercen <- hclust(dist(datafix[,2:5]), method = "centroid")
> #korelasi cophenetic
> hc4 <- hclust(d1, "centroid")
> d5 <- cophenetic(hc4)
> corcen <- cor(d1,d5)
> corcen
[1] 0.8390617
> #Ward
> hierward <- hclust(dist(datafix[,2:5]), method = "ward.D")
> #korelasi cophenetic
> hc5 <- hclust(d1,"ward.D")
> d6 <- cophenetic(hc5)
> corward <- cor(d1,d6)
> corward
[1] 0.6286043
>
> KorCop<-data.frame(cors,corave,corcomp,corcen,corward)
> KorCop
cors corave corcomp corcen corward
1 0.7854983 0.8435722 0.8108426 0.8390617 0.6286043
> inval <- clValid(datastand, 2:5, clMethods = "hierarchical", validation = "internal", metric = "euclidean", method = "average")
> summary(inval)
Clustering Methods:
hierarchical
Cluster sizes:
2 3 4 5
Validation Measures:
2 3 4 5
hierarchical Connectivity 6.2766 13.9075 20.3222 22.6750
Dunn 0.2508 0.2458 0.3149 0.3149
Silhouette 0.4395 0.3890 0.3452 0.2579
Optimal Scores:
Score Method Clusters
Connectivity 6.2766 hierarchical 2
Dunn 0.3149 hierarchical 4
Silhouette 0.4395 hierarchical 2
>
> # Menentukan Klaster dari dendrogram
> Cluster <- cutree(ave.e, k = 2)
> Cluster
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 1 1 1 1 1 1 1 1 1 2 1
27 28 29 30 31 32 33 34 35 36 37 38
1 1 1 2 2 2 2 2 2 2 2 2
> datafix$clusters <- as.factor(Cluster)
> datafix
kabkot hls ahm rls ppkr clusters
1 Kabupaten Pacitan 12.68 72.86 7.88 9681 1
2 Kabupaten Ponorogo 13.77 73.55 7.78 10658 1
3 Kabupaten Trenggalek 12.62 74.64 7.90 10465 1
4 Kabupaten Tulungagung 13.34 74.91 8.66 11565 1
5 Kabupaten Blitar 12.65 74.34 7.83 11499 1
6 Kabupaten Kediri 13.62 73.27 8.24 11952 1
7 Kabupaten Malang 13.48 73.26 7.75 10791 1
8 Kabupaten Lumajang 12.16 70.96 7.14 9720 1
9 Kabupaten Jember 13.49 70.03 6.52 10277 1
10 Kabupaten Banyuwangi 13.12 71.38 7.76 12820 1
11 Kabupaten Bondowoso 13.32 67.60 6.36 11255 1
12 Kabupaten Situbondo 13.19 69.94 6.90 10702 1
13 Kabupaten Probolinggo 12.63 68.12 6.29 11756 1
14 Kabupaten Pasuruan 12.77 70.81 7.44 11239 1
15 Kabupaten Sidoarjo 14.97 74.69 10.78 15311 2
16 Kabupaten Mojokerto 12.97 73.25 9.11 13467 1
17 Kabupaten Jombang 13.59 73.22 8.77 11999 1
18 Kabupaten Nganjuk 13.17 72.28 8.24 12821 1
19 Kabupaten Madiun 13.23 72.28 7.95 12259 1
20 Kabupaten Magetan 14.07 73.29 8.67 12495 1
21 Kabupaten Ngawi 12.85 73.20 7.78 11897 1
22 Kabupaten Bojonegoro 12.92 72.57 7.45 10776 1
23 Kabupaten Tuban 12.27 72.36 7.40 11174 1
24 Kabupaten Lamongan 14.02 73.22 8.34 12019 1
25 Kabupaten Gresik 13.97 73.30 10.01 13870 2
26 Kabupaten Bangkalan 11.97 70.79 5.99 9438 1
27 Kabupaten Sampang 12.54 68.64 5.07 9363 1
28 Kabupaten Pamekasan 13.68 68.31 7.15 9420 1
29 Kabupaten Sumenep 13.58 72.47 5.94 9807 1
30 Kota Kediri 15.45 74.67 10.69 13276 2
31 Kota Blitar 14.57 74.66 10.78 14548 2
32 Kota Malang 15.77 74.13 10.94 17222 2
33 Kota Probolinggo 13.73 70.99 9.56 12999 2
34 Kota Pasuruan 13.66 72.31 9.78 14250 2
35 Kota Mojokerto 14.04 74.10 11.05 14422 2
36 Kota Madiun 14.44 73.44 11.82 17115 2
37 Kota Surabaya 14.85 74.75 10.70 18977 2
38 Kota Batu 14.56 73.29 9.85 13603 2
>
> #karakteristik cluster
> cluster_summary <- datafix %>%
+ group_by(clusters) %>%
+ summarise(
+ Nama = paste(kabkot, collapse = ", "),
+ across(c(hls,ahm, rls,ppkr), mean, na.rm = TRUE)
+ )
> print(cluster_summary)
# A tibble: 2 × 6
clusters Nama hls ahm rls ppkr
<fct> <chr> <dbl> <dbl> <dbl> <dbl>
1 1 Kabupaten Pacitan, Kabupaten Ponorogo, Kabu… 13.1 71.9 7.49 11160.
2 2 Kabupaten Sidoarjo, Kabupaten Gresik, Kota … 14.5 73.7 10.5 15054.
Berikut merupakan ringkasan dari data IPM.
> statdes
kabkot hls ahm rls
Length:38 Min. :11.97 Min. :67.60 Min. : 5.070
Class :character 1st Qu.:12.87 1st Qu.:71.09 1st Qu.: 7.410
Mode :character Median :13.48 Median :73.21 Median : 7.925
Mean :13.52 Mean :72.42 Mean : 8.376
3rd Qu.:14.01 3rd Qu.:73.52 3rd Qu.: 9.725
Max. :15.77 Max. :74.91 Max. :11.820
ppkr
Min. : 9363
1st Qu.:10720
Median :11924
Mean :12287
3rd Qu.:13419
Max. :18977
> par(mfrow = c(1, 4))
> boxplot(datafix$hls)
> boxplot(datafix$ahm)
> boxplot(datafix$rls)
> boxplot(datafix$ppkr)
Dari hasil ringkasan tersebut, tidak terdapat kemenjuluran pada variabel
Harapan Lama Sekolah, Angka Harapan Hidup, dan Rata-Rata Lama Sekolah.
Pada variabel Pengeluaran Per Kapita terjadi kemenjuluran ke kanan yang
mengindikasikan adanya pencilan.
> KorCop<-data.frame(cors,corave,corcomp,corcen,corward)
> KorCop
cors corave corcomp corcen corward
1 0.7854983 0.8435722 0.8108426 0.8390617 0.6286043
Hasil koefesien korelasi cophenetic menunjukkan bahwa metode average linkage adalah metode yang terbaik untuk analisis klaster hirarki dengan kasus tersebut. Output tersebut menunjukkan nilai korelasi sebesar 0.8435722 pada metode average linkage. Nilai tersebut merupakan nilai terbesar yang mendekati 1.
> summary(inval)
Clustering Methods:
hierarchical
Cluster sizes:
2 3 4 5
Validation Measures:
2 3 4 5
hierarchical Connectivity 6.2766 13.9075 20.3222 22.6750
Dunn 0.2508 0.2458 0.3149 0.3149
Silhouette 0.4395 0.3890 0.3452 0.2579
Optimal Scores:
Score Method Clusters
Connectivity 6.2766 hierarchical 2
Dunn 0.3149 hierarchical 4
Silhouette 0.4395 hierarchical 2
Hasil tersebut menghasilkan tiga indeks validitas untuk ukuran klaster yang optimal. Dari ketiga indeks tersebut, indeks Connectivity dan Silhouette menunjukkan jumlah klaster optimal yang sama yaitu 2 klaster.
> fviz_nbclust(datastand, FUN = hcut, method = "silhouette",
+ diss=ipm.dist.e, k.max=5,hcluster="average")
Hasil dari plot tersebut menunjukkan bahwa banyak klaster yang optimal
sebanyak 2 buah klaster. Hal tersebut mendukung indeks validitas
sebelumnya.
> ave.e<-hclust(dist(datastand),method="average")
> dend<- as.dendrogram(ave.e)
> labels(dend)<-datafix$kabkot
>
> fviz_dend(dend,k=2,k_colors="jco", rect=T, main="Average Linkage Cluster")
Hasil dari dendogram tersebut menunjukkan bahwa terdapat dua klaster
optimal yang ditunjukkan dengan dua warna yang berbeda, yaitu biru dan
kuning. Kedua warna tersebut menunjukkan dua pengelompokkan dengan
karakteristik yang paling mirip di dalamnya.
> print(cluster_summary)
# A tibble: 2 × 6
clusters Nama hls ahm rls ppkr
<fct> <chr> <dbl> <dbl> <dbl> <dbl>
1 1 Kabupaten Pacitan, Kabupaten Ponorogo, Kabu… 13.1 71.9 7.49 11160.
2 2 Kabupaten Sidoarjo, Kabupaten Gresik, Kota … 14.5 73.7 10.5 15054.
Melalui hasil tersebut, didapatkan dua pengelompokan klaster yaitu klaster 1 dan klaster 2. klaster 1 terdiri atas 11 kabupaten/kota dan klaster 2 terdiri atas 27 kabupaten/kota. klaster 1 terdiri atas Kabupaten Pacitan, Kabupaten Ponorogo, Kabupaten Trenggalek, Kabupaten Tulungagung, Kabupaten Kediri, Kabupaten Malang, Kabupaten Lumajang, Kabupaten Jember, Banyuwangi dan Bondowoso. klaster 2 terdiri atas selain anggota klaster 1. Karakteristik pada klaster 1 adalah harapan lama sekolah rendah relatif lebih rendah, angka harapan hidup sedikit lebih rendah, rata-rata lama sekolah lebih rendah, dan pengeluaran per kapita jauh lebih rendah. Cluster 1 digolongkan sebagai wilayah-wilayah dengan tingkat pendidikan, kesehatan, dan ekonomi yang rendah. Karakteristik pada klaster 2 adalah lebih tinggi pada angka harapan lama sekolah, angka harapan hidup, rata-rata lama sekolah, dan pengeluaran per kapita. klaster 2 digolongkan sebagai wilayah-wilayah dengan tingkat pendidikan, kesehatan, dan ekonomi yang tinggi.
Berdasarkan Indikator Indeks Pembangunan Manusia (IPM), kabupaten/kota di Jawa Timur dikelompokkan menjadi dua klaster. Kluster pertama terdiri atas Kabupaten Pacitan, Kabupaten Ponorogo, Kabupaten Trenggalek, Kabupaten Tulungagung, Kabupaten Kediri, Kabupaten Malang, Kabupaten Lumajang, Kabupaten Jember, Banyuwangi dan Bondowoso. Kluster kedua terdiri atas anggota kabupaten/kota selain cluster 1. Cluster 2 digolongkan sebagai wilayah-wilayah lebih maju daripada cluster 1.
Diharapkan kepada para peneliti lain dapat menggunakan analisis cluster lain seperti Fuzzy C-Means dan K-Means.
Badan Pusat Statistik. 2015. Indeks Pembangunan Manusia 2015. Surabaya: Badan Pusat Statistik
Badan Pusat Statistik Kabupaten Pasuruan. 2023. Tabel [Metode Baru] Harapan Lama Sekolah (Tahun) Kabupaten Kota di Jawa Timur, 2022-2023. Diakses pada 27 November 2024 dari https://pasuruankab.bps.go.id/id/statistics-table/1/NTI0IzE=/tabel--metode-baru--harapan-lama-sekolah--tahun--kabupatenkota-di-jawa-timur--2022-2023.html
Badan Pusat Statistik Provinsi Jawa Timur. 2023. Angka Harapan Hidup (Tahun), 2023. Diakses pada 27 November 2024 dari https://jatim.bps.go.id/id/statistics-table/2/MjkjMg==/angka-harapan-hidup.html
Badan Pusat Statistik Provinsi Jawa Timur. 2023. Pengeluaran Per Kapita Rill Disesuaikan (Ribu Rupiah) 2023. Diakses pada 27 November 2024 dari https://jatim.bps.go.id/id/statistics-table/2/MzQjMg==/pengeluaran-per-kapita-riil-disesuaikan.html
Badan Pusat Statistik Provinsi Jawa Timur. 2023. Rata-rata Lama Sekolah (Tahun), 2023. Diakses pada 27 November 2024 dari https://jatim.bps.go.id/id/statistics-table/2/MzIjMg==/rata-rata-lama-sekolah.html
Irianto, A. 2004. Statistik Konsep Dasar & Aplikasinya. Jakarta: Prenada Media Group.