1 PENDAHULUAN
1.1 Latar Belakang
Kesehatan bayi dan balita adalah salah satu indikator utama yang menentukan kualitas kehidupan anak dan perkembangan masyarakat secara keseluruhan. Menurut World Health Organization (WHO), pemberian ASI eksklusif selama 6 bulan pertama kehidupan dan imunisasi dasar merupakan upaya preventif utama untuk menurunkan angka kematian bayi dan mencegah penyakit pada anak-anak (WHO, 2023). Namun, di Indonesia, kondisi kesehatan bayi antar provinsi masih sangat bervariasi. Beberapa provinsi menunjukkan tingkat kemajuan yang pesat dalam program kesehatan bayi, sementara yang lain menghadapi tantangan besar terkait akses terhadap perawatan kesehatan, pendidikan gizi, dan fasilitas kesehatan yang memadai. Data yang menunjukkan tingkat ASI eksklusif, tingkat imunisasi dasar, angka kematian bayi, dan penanganan stunting mencerminkan ketimpangan ini dan sangat penting untuk dianalisis lebih lanjut. Pada konteks ini, analisis klaster dapat digunakan untuk mengelompokkan provinsi-provinsi berdasarkan kesamaan karakteristik kesehatan bayi. Melalui penggunaan teknik hierarchical clustering, analisis ini memungkinkan untuk mengidentifikasi kelompok provinsi yang memiliki kesamaan dalam hal indikator kesehatan bayi. Klaster yang dihasilkan dapat memberikan informasi yang berharga bagi pembuatan kebijakan yang lebih terarah dan efisien, yang sesuai dengan kondisi spesifik di setiap provinsi. Penggunaan analisis klaster untuk mengelompokkan provinsi berdasarkan indikator kesehatan dapat membantu pemangku kebijakan untuk merancang program-program yang lebih sesuai dengan kondisi lokal, meningkatkan efektivitas program kesehatan, dan mengurangi ketimpangan antar wilayah (Saputro & Sucihermayanti, 2021). Penelitian ini bertujuan untuk mengelompokkan provinsi-provinsi di Indonesia berdasarkan kondisi kesehatan bayi yang dipengaruhi oleh berbagai indikator kesehatan, seperti persentase bayi yang mendapatkan ASI eksklusif, persentase anak yang menerima imunisasi dasar lengkap, angka kematian bayi, dan indeks penanganan stunting. Dengan demikian, diharapkan dapat ditemukan pola atau kesamaan karakteristik antar provinsi yang dapat dijadikan dasar untuk perencanaan kebijakan kesehatan yang lebih fokus.
1.2 Rumusan Masalah
Bagaimana mengelompokkan provinsi di Indonesia berdasarkan kondisi kesehatan bayi menggunakan analisis klaster hierarki dengan empat indikator: ASI eksklusif, imunisasi dasar lengkap, kematian bayi, dan penanganan stunting?
Apa karakteristik klaster yang terbentuk, dan bagaimana mengkategorikan provinsi ke dalam klaster dengan tingkat kesehatan bayi tinggi dan rendah?
Bagaimana hasil klasterisasi ini dapat digunakan untuk merancang kebijakan guna meningkatkan kesehatan bayi di provinsi dengan kondisi kesehatan bayi rendah?
1.3 Tujuan
- Menerapkan analisis klaster hierarki untuk mengelompokkan provinsi berdasarkan kondisi kesehatan bayi (ASI eksklusif, imunisasi, kematian bayi, dan penanganan stunting).
- Mengidentifikasi provinsi dalam klaster dengan tingkat kesehatan bayi tinggi dan rendah.
- Memberikan rekomendasi kebijakan untuk meningkatkan kesehatan bayi di provinsi dengan klaster rendah, berdasarkan karakteristik klaster yang terbentuk.
2 TINJAUAN PUSTAKA
2.1 Analisis Cluster
Analisis klaster adalah teknik statistik yang digunakan untuk mengelompokkan objek atau unit ke dalam grup yang lebih kecil (klaster) berdasarkan kesamaan karakteristik. Dalam konteks ini, analisis klaster digunakan untuk mengelompokkan provinsi di Indonesia berdasarkan kondisi kesehatan bayi, seperti persentase bayi yang mendapatkan ASI eksklusif, imunisasi dasar lengkap, angka kematian bayi, dan indeks penanganan stunting. Salah satu metode yang paling umum digunakan dalam analisis klaster adalah hierarchical clustering, yang membentuk hierarki klaster dengan mengelompokkan unit-unit data secara bertahap dari yang paling mirip ke yang paling berbeda (Ward, 1963).
2.2 Uji Asumsi
2.2.1 Uji Sampel Representatif
Uji Kaiser-Meyer-Olkin (KMO) digunakan untuk mengukur kecocokan data untuk analisis faktor, yang menunjukkan seberapa baik variabel-variabel dalam dataset berhubungan satu sama lain. Nilai KMO berkisar antara 0 hingga 1, dengan nilai yang lebih tinggi menunjukkan bahwa data lebih cocok untuk analisis faktor. Nilai KMO di atas 0.6 dianggap cukup baik untuk analisis faktor. Nilai KMO yang rendah menunjukkan bahwa data kurang cocok untuk analisis faktor dan mungkin perlu dilakukan pengolahan data lebih lanjut.
\[ KMO=\frac{∑_{i}∑_{i≠j}r^{2}_{ij}}{∑_{i}∑_{i≠j}r^{2}_{ij}+∑_{i}∑_{i≠j}a^{2}_{ij}} \]
\[a_{ij} \] : koefisien korelasi parsial antar variabel
2.2.2 Uji Non-Multikolinieritas
Uji multikolinearitas bertujuan untuk mengidentifikasi adanya korelasi yang sangat tinggi antara variabel independen dalam model regresi. Jika terdapat korelasi yang tinggi antar variabel, hal ini bisa mengganggu estimasi model regresi. Salah satu cara untuk mendeteksi multikolinearitas adalah dengan melihat matriks korelasi antar variabel. Nilai korelasi yang sangat tinggi (misalnya di atas 0.8 atau 0.9) menunjukkan adanya potensi multikolinearitas.
2.3 Standarisasi Data
Standarisasi data adalah langkah penting dalam analisis klaster untuk memastikan bahwa setiap variabel memiliki skala yang sama. Hal ini penting karena variabel dengan skala yang lebih besar bisa mendominasi hasil analisis klaster. Proses standarisasi dilakukan dengan mengubah nilai variabel agar memiliki mean 0 dan standar deviasi 1. \[ Z = \frac{X - \mu}{\sigma} \]
2.4 Jarak Euclidean
Jarak Euclidean digunakan untuk mengukur kedekatan antara dua objek dalam ruang multidimensi. Dalam analisis klaster, jarak ini digunakan untuk mengukur seberapa mirip atau berbeda antara dua unit data. \[ d(x,y)=\sqrt{∑_{i}^{n} (x_i−y_i)^2} \]
2.5 Metode Analisis Hierarki
Metode analisis klaster hierarki menggunakan dua pendekatan utama: Agglomerative (penggabungan) dan Divisive (pemecahan). Dalam metode agglomerative, setiap objek dimulai sebagai klaster individu dan secara bertahap digabungkan berdasarkan kedekatannya.
2.5.1 Agglomerative Methods:
2.5.1.1 Single Linkage
Jarak antar dua klaster dihitung berdasarkan jarak terkecil antara objek dalam kedua klaster. \[ d_{ij}=min(d_{pj};d_{qj}) \] #### Complete Linkage Jarak antar dua klaster dihitung berdasarkan jarak terbesar antara objek dalam kedua klaster. \[ d_{ij}=max(d_{pj};d_{qj}) \] #### Average Linkage Jarak antar dua klaster dihitung sebagai rata-rata jarak antar semua pasangan objek dalam kedua klaster. \[ d_{ij}=average(d_{pj};d_{qj}) \] #### Ward’s Method Menghitung jarak berdasarkan peningkatan total varians dalam klaster setelah penggabungan. \[ ESS= ∑_{k=1}^{K} \left\{{∑_{i}^{nk}∑_{j=1}^{p}X^{2}_{ijk}}− \frac{1}{nk}(∑_{j=1}^{p}(∑_{i}^{nk}X_{ijk})^2\right\} \]
2.5.1.2 Centroid Method
Jarak antara dua klaster dihitung berdasarkan perbedaan antara pusat masing-masing klaster. \[ C_i= \frac{1}{M}∑_{j=1}^{M}x_j \]
2.5.2 Divisive Method
Metode ini dimulai dengan seluruh data sebagai satu klaster dan membaginya menjadi klaster-klaster yang lebih kecil berdasarkan perbedaan antar data.
2.6 Koefisien Korelasi Cophenetic
Koefisien korelasi cophenetic mengukur sejauh mana struktur klaster yang dihasilkan oleh analisis klaster hierarki mencerminkan jarak asli antar objek. Nilai koefisien yang tinggi menunjukkan bahwa struktur klaster mencerminkan jarak antar objek dengan baik. \[ r=\frac{∑_{k=1}d_{ij}-{d_{ij}}}^2{∑_{ij}d^2_{ij} \] ## Indeks Validasi Cluster ### Indeks Connectivity Mengukur kekompakan klaster dengan menghitung berapa banyak objek dalam satu klaster yang terhubung langsung ke objek dari klaster lain.
2.6.1 Indeks Silhoutte
Mengukur kualitas klaster dengan membandingkan kedekatan objek dengan objek dalam klaster yang sama dan klaster lainnya. Nilai berkisar antara -1 hingga 1, dengan nilai yang lebih tinggi menunjukkan klaster yang lebih baik.
2.6.2 Indeks Dunn
Mengukur sejauh mana klaster terpisah satu sama lain, dengan mempertimbangkan jarak antar klaster dan ukuran klaster.
2.7 Data
Data yang digunakan dalam penelitian ini mencakup empat variabel utama terkait kesehatan bayi di 34 provinsi Indonesia: persentase bayi yang mendapat ASI eksklusif, persentase anak yang menerima imunisasi dasar lengkap, angka kematian bayi , dan indeks penanganan stunting. Sumber data berasal dari Badan Pusat Statistik (BPS) pada tahun 2019 dan 2020
datatable(data,caption = “Kondisi Kesehatan Bayi”)
3 SOURCE CODE
3.1 Library
> library(psych)
> library(GPArotation)
> library(clValid)
> library(ggplot2)
> library(cluster)
> library(factoextra)
> library(tidyverse)
> library(car)
> library(readxl)
> library(DT) Mengimpor paket-paket yang dibutuhkan untuk analisis statistik, validasi kluster, visualisasi data, dan manipulasi data. Library-library ini mempersiapkan lingkungan R untuk melakukan analisis klaster dengan metode hierarkis.
3.2 Impor Data
Mengimpor data dari file Excel yang berada di path yang diberikan, kemudian mengonversinya menjadi data frame, dan menampilkan data tersebut.
> data <- read_excel("C:/Users/USER/Documents/Tugas Kuliah/SEM 5/Anmul 1/bayi.xlsx")
> data <- data.frame(data)
> data
PROVINSI ASI.EKSKLUSIF.... IMUNISASI.DASAR.... KEMATIAN.BAYI....
1 ACEH 65.43 17.32 19.41
2 SUMATERA UTARA 53.39 35.31 18.28
3 SUMATERA BARAT 70.36 43.15 16.35
4 RIAU 65.17 31.22 15.69
5 JAMBI 65.22 50.37 16.99
6 SUMATERA SELATAN 68.06 39.31 16.78
7 BENGKULU 62.30 54.22 19.73
8 LAMPUNG 72.36 62.40 15.69
9 KEP. BANGKA BELITUNG 55.47 55.57 16.75
10 KEP. RIAU 59.49 65.46 13.31
11 DKI JAKARTA 70.86 52.01 10.38
12 JAWA BARAT 76.11 50.11 13.56
13 JAWA TENGAH 76.30 74.48 12.77
14 DI YOGYAKARTA 78.93 79.37 10.90
15 JAWA TIMUR 66.90 61.33 13.49
16 BANTEN 68.84 31.29 13.83
17 BALI 64.92 76.95 13.26
18 NUSA TENGGARA BARAT 73.78 70.65 24.64
19 NUSA TENGGARA TIMUR 76.41 48.44 25.67
20 KALIMANTAN BARAT 66.42 50.43 17.47
21 KALIMANTAN TENGAH 52.98 39.08 17.95
22 KALIMANTAN SELATAN 63.55 58.20 17.22
23 KALIMANTAN TIMUR 71.13 53.10 15.51
24 KALIMANTAN UTARA 76.98 45.33 16.65
25 SULAWESI UTARA 58.60 61.32 17.23
26 SULAWESI TENGAH 61.97 49.56 27.72
27 SULAWESI SELATAN 76.21 53.94 18.20
28 SULAWESI TENGGARA 60.48 56.68 23.29
29 GORONTALO 56.22 64.33 29.47
30 SULAWESI BARAT 71.54 52.65 29.21
31 MALUKU 57.19 44.97 29.82
32 MALUKU UTARA 62.41 36.69 28.61
33 PAPUA BARAT 59.96 42.62 37.06
34 PAPUA 74.56 21.26 38.17
PENANGANAN.STUNTING....
1 61.95
2 58.56
3 63.97
4 60.04
5 61.03
6 60.22
7 60.41
8 64.27
9 60.68
10 62.76
11 70.56
12 66.22
13 71.17
14 79.94
15 70.69
16 64.32
17 69.71
18 72.97
19 64.81
20 56.46
21 58.16
22 66.77
23 64.94
24 64.04
25 64.78
26 63.83
27 66.21
28 61.66
29 69.48
30 66.03
31 50.91
32 53.42
33 56.45
34 41.703.3 Statistik Deskriptif
Menghitung dan menampilkan statistik deskriptif untuk data yang diimpor menggunakan fungsi summary().
> statdes <- summary(data)
> statdes
PROVINSI ASI.EKSKLUSIF.... IMUNISASI.DASAR.... KEMATIAN.BAYI....
Length:34 Min. :52.98 Min. :17.32 Min. :10.38
Class :character 1st Qu.:60.85 1st Qu.:42.75 1st Qu.:15.55
Mode :character Median :65.92 Median :51.22 Median :17.23
Mean :66.49 Mean :50.86 Mean :19.74
3rd Qu.:72.16 3rd Qu.:60.54 3rd Qu.:24.30
Max. :78.93 Max. :79.37 Max. :38.17
PENANGANAN.STUNTING....
Min. :41.70
1st Qu.:60.27
Median :64.00
Mean :63.21
3rd Qu.:66.22
Max. :79.94 3.4 Uji Asumsi
3.4.1 Uji Sampel Representatif
Menguji kelayakan data dengan KMO() yang menghasilkan nilai KMO untuk memastikan data cukup representatif untuk analisis klaster.
3.4.2 Uji Non-Multikolinearitas
Menghitung matriks korelasi antar variabel untuk memeriksa multikolinearitas.
> korelasi <- cor(data[,2:5], method = 'pearson')
> korelasi
ASI.EKSKLUSIF.... IMUNISASI.DASAR.... KEMATIAN.BAYI....
ASI.EKSKLUSIF.... 1.0000000 0.1528724 -0.1979208
IMUNISASI.DASAR.... 0.1528724 1.0000000 -0.3426307
KEMATIAN.BAYI.... -0.1979208 -0.3426307 1.0000000
PENANGANAN.STUNTING.... 0.3665575 0.7151266 -0.5741382
PENANGANAN.STUNTING....
ASI.EKSKLUSIF.... 0.3665575
IMUNISASI.DASAR.... 0.7151266
KEMATIAN.BAYI.... -0.5741382
PENANGANAN.STUNTING.... 1.00000003.5 Standarisasi Data
Melakukan standarisasi pada data (skala z) untuk mempersiapkan analisis lebih lanjut.
> datastand <- scale(data[,2:5])
> datastand
ASI.EKSKLUSIF.... IMUNISASI.DASAR.... KEMATIAN.BAYI....
[1,] -0.142248138 -2.30003677 -0.0459447987
[2,] -1.765177281 -1.06622591 -0.2046857311
[3,] 0.522290125 -0.52853402 -0.4758096244
[4,] -0.177294780 -1.34673099 -0.5685255671
[5,] -0.170555041 -0.03336368 -0.3859032556
[6,] 0.212262132 -0.79189332 -0.4154037829
[7,] -0.564155797 0.23068144 -0.0009916144
[8,] 0.791879683 0.79169160 -0.5685255671
[9,] -1.484804140 0.32326869 -0.4196181439
[10,] -0.942929127 1.00155604 -0.9028648760
[11,] 0.589687514 0.07911268 -1.3144674704
[12,] 1.297360106 -0.05119530 -0.8677452007
[13,] 1.322971114 1.62017604 -0.9787233746
[14,] 1.677481384 1.95554764 -1.2414185458
[15,] 0.055900188 0.71830763 -0.8775787098
[16,] 0.317402060 -1.34193017 -0.8298159514
[17,] -0.210993475 1.78957642 -0.9098888110
[18,] 0.983288270 1.35750258 0.6887588085
[19,] 1.337798540 -0.16572916 0.8334518707
[20,] -0.008801306 -0.02924870 -0.3184734790
[21,] -1.820443141 -0.80766744 -0.2510437025
[22,] -0.395662323 0.50364237 -0.3535931543
[23,] 0.626082105 0.15386831 -0.5938117334
[24,] 1.414631564 -0.37902276 -0.4336660140
[25,] -1.062896481 0.71762180 -0.3521883673
[26,] -0.608638074 -0.08891604 1.1214332081
[27,] 1.310839584 0.21147816 -0.2159240272
[28,] -0.809482296 0.39939599 0.4991125619
[29,] -1.383708056 0.92405708 1.3672709352
[30,] 0.681347964 0.12300590 1.3307464729
[31,] -1.252957120 -0.40371269 1.4164384806
[32,] -0.549328371 -0.97158117 1.2464592522
[33,] -0.879575581 -0.56488309 2.4335042772
[34,] 1.088428198 -2.02981916 2.5894356355
PENANGANAN.STUNTING....
[1,] -0.18252329
[2,] -0.67382724
[3,] 0.11023009
[4,] -0.45933466
[5,] -0.31585652
[6,] -0.43324772
[7,] -0.40571152
[8,] 0.15370831
[9,] -0.36658111
[10,] -0.06513209
[11,] 1.06530177
[12,] 0.43631678
[13,] 1.15370749
[14,] 2.42472094
[15,] 1.08414233
[16,] 0.16095468
[17,] 0.94211346
[18,] 1.41457684
[19,] 0.23196912
[20,] -0.97817481
[21,] -0.73179820
[22,] 0.51602686
[23,] 0.25080968
[24,] 0.12037501
[25,] 0.22762130
[26,] 0.08994025
[27,] 0.43486750
[28,] -0.22455224
[29,] 0.90878016
[30,] 0.40878057
[31,] -1.78252198
[32,] -1.41875416
[33,] -0.97962409
[34,] -3.11730349
attr(,"scaled:center")
ASI.EKSKLUSIF.... IMUNISASI.DASAR.... KEMATIAN.BAYI....
66.48529 50.85647 19.73706
PENANGANAN.STUNTING....
63.20941
attr(,"scaled:scale")
ASI.EKSKLUSIF.... IMUNISASI.DASAR.... KEMATIAN.BAYI....
7.418685 14.580841 7.118517
PENANGANAN.STUNTING....
6.900006 3.6 Jarak Euclidien
Menghitung jarak Euclidean antar sampel setelah data distandarisasi.
> jarak <- dist(datastand, method = "euclidean")
> jarak
1 2 3 4 5 6 7
2 2.1030374
3 1.9622236 2.4919618
4 1.1223793 1.6668655 1.2214195
5 2.2960744 1.9418052 0.9564837 1.3337601
6 1.6123079 2.0218322 0.6815368 0.6955043 0.8582349
7 2.5757280 1.7993884 1.4994735 1.7212965 0.6171485 1.3494368
8 3.2890001 3.2874903 1.3513552 2.4265144 1.3641257 1.7921109 1.6699132
9 2.9761884 1.4662539 2.2325998 2.1282050 1.3631387 2.0317683 1.0163391
10 3.5056665 2.4103481 2.1682184 2.5234552 1.4134117 2.2190212 1.2911571
11 3.0597874 3.3336727 1.4104204 2.3456849 1.8331529 1.9887351 2.2898529
12 2.8614819 3.4758438 1.0433273 2.1782432 1.7184380 1.6391542 2.2371789
13 4.4911607 4.5488936 2.5690100 3.7179971 2.7342034 3.1444409 2.9798809
14 5.4450247 5.6266180 3.6671724 4.8078894 3.9514147 4.3064585 4.1892848
15 3.3831527 3.1692468 1.6976623 2.6070289 1.6786999 2.1957309 1.9000837
16 1.3644331 2.3453781 0.9118585 0.8353320 1.5410567 0.9156467 2.0635678
17 4.3290725 3.6986038 2.6061074 3.4522667 2.2763557 2.9965422 2.2798253
18 4.2112878 4.3114032 2.6128899 3.7083879 2.7230794 3.1381547 2.7301125
19 2.7732561 3.5124849 1.5892348 2.4766338 2.0197997 1.9133917 2.2085072
20 2.4252051 2.0653700 1.3193649 1.4477123 0.6851230 0.9679033 0.8969344
21 2.3210500 0.2746206 2.5151235 1.7792013 1.8742656 2.0611371 1.6808584
22 2.9167542 2.4037437 1.4448642 2.1140227 1.0159344 1.7184085 1.0377028
23 2.6645670 2.8658548 0.7142358 1.8444937 1.0168693 1.2511898 1.4849317
24 2.5211593 3.3565789 0.9058178 1.9557452 1.6807367 1.3867177 2.1797506
25 3.1962259 2.1236001 2.0235572 2.3589305 1.2871508 2.0845646 1.0051382
26 2.5580427 2.1528237 2.0059559 2.2194186 1.6222629 1.9502943 1.2687117
27 2.9714029 3.5105182 1.1586019 2.3593399 1.6872928 1.7340827 2.0660943
28 2.8339006 1.9387059 1.9228168 2.1549001 1.1777514 1.8283943 0.6095675
29 3.8889749 3.0137085 3.1268959 3.4972786 2.6385127 3.2358267 2.1800152
30 2.9655295 3.3059567 1.9500208 2.6941144 2.0547933 2.1943415 1.9999493
31 3.0867912 2.1350740 3.2140623 2.7815895 2.5900378 2.7338140 2.1866912
32 2.2647480 2.0366600 2.5784995 2.1198590 2.2146584 2.0845430 2.0069988
33 3.2151901 2.8441507 3.4085830 3.2229441 3.0290047 3.1078043 2.6435882
34 4.1407423 4.7800906 4.7314977 4.3710618 4.7192817 4.3050369 4.6801647
8 9 10 11 12 13 14
2
3
4
5
6
7
8
9 2.3865422
10 1.7925620 1.0383165
11 1.3914318 2.6859210 2.1557163
12 1.0655368 2.9540014 2.5258396 1.0549709
13 1.4617473 3.4913388 2.6473230 1.7415857 1.8223896
14 2.7837267 4.5968584 3.7537498 2.5607929 2.8748726 1.3865914
15 1.2281174 2.2009434 1.5489870 0.9405987 1.5978524 1.5600977 2.4677558
16 2.2013169 2.5431065 2.6714816 1.7737624 1.6442558 3.2852662 4.2446708
17 1.6551859 2.3928432 1.4735328 1.9353644 2.4333470 1.5592479 2.4293869
18 1.8781195 3.4003151 2.9257163 2.4339497 2.3372566 1.7415313 2.3633742
19 1.7850343 3.1834968 3.1092344 2.4346701 1.7177260 2.7061519 3.7051920
20 1.6305577 1.6392468 1.7636081 2.3532385 2.0022550 3.0781605 4.3834339
21 3.2042310 1.2463831 2.2164465 3.3099165 3.4695476 4.4564702 5.5511520
22 1.2925552 1.4149631 1.0894329 1.5414675 1.8560377 2.2355699 3.2920056
23 0.6666149 2.2127024 1.8373088 1.0907131 0.7759624 1.8971278 3.0816836
24 1.3333005 3.0227908 2.7782460 1.5997245 0.6398964 2.3173392 3.3884780
25 1.8702796 0.8313505 0.6956723 2.1832126 2.5438639 2.7851661 3.8288521
26 2.3657867 1.8763833 2.3286713 2.8894913 2.7768794 3.4920436 4.5211108
27 0.8996362 2.9175216 2.5348735 1.4634979 0.7028883 1.7558960 2.8613564
28 2.0002970 1.1515612 1.5399222 2.6482170 2.6356907 3.1813928 4.3191079
29 3.0113360 2.2783077 2.5104410 3.4386685 3.6548273 3.6570989 4.4202026
30 2.0326470 2.8978064 2.9366204 2.7273623 2.2899653 2.9226299 3.8769240
31 3.6468368 2.4409522 3.2248246 4.3813704 4.0950124 5.0089695 6.2384835
32 3.2672279 2.5366579 3.2403825 3.8897550 3.4883402 4.6681589 5.8726997
33 3.8640242 3.1098624 3.7980785 4.5609734 4.2315554 5.0813479 6.1632568
34 5.3592071 5.3646459 5.9014881 6.1180865 5.3421832 6.6596373 7.8498160
15 16 17 18 19 20 21
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16 2.2732179
17 1.1135821 3.2714150
18 1.9573500 3.4070485 2.0956843
19 2.4654836 2.2795089 3.1249829 1.9660645
20 2.2646804 1.8408228 2.7177722 3.1059778 2.1501950
21 3.0886001 2.4469989 3.5457102 4.2472374 3.5343392 1.9882731
22 0.9204922 2.0657839 1.4760568 2.1270806 2.2232205 1.6332502 2.3058876
23 1.1910777 1.5480531 1.9884774 2.1390823 1.6266896 1.4222598 2.8271974
24 2.0435731 1.5131704 2.8718498 2.4771704 1.2920675 1.8353703 3.3777203
25 1.5037851 2.5257773 1.6420579 2.6624714 2.8194693 1.7674878 1.9573197
26 2.4653007 2.4980014 2.9222121 2.5628550 1.9742394 1.8914453 2.1316712
27 1.6404553 1.9626225 2.3548366 1.7885590 1.1337415 1.9510527 3.4936988
28 2.1115283 2.4933415 2.3742755 2.6181490 2.2913699 1.4356950 1.8163361
29 2.6804676 3.6626367 2.7038770 2.5508343 3.0556944 3.0333964 2.9154840
30 2.4654376 2.6472518 2.9797015 1.7432511 0.8904266 2.2678314 3.3057664
31 4.0561455 3.4884152 4.3280067 4.3420768 3.3416611 2.3119344 2.0903916
32 3.7413973 2.7739464 4.2381593 4.0140178 2.6657284 1.9553221 2.0873486
33 4.2123741 3.7398846 4.5674757 3.9927639 3.0173163 2.9357343 2.8657271
34 6.1879440 4.8482915 6.7082350 5.9695490 4.2235202 4.2705973 4.8697172
22 23 24 25 26 27 28
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23 1.1376945
24 2.0540725 0.9738804
25 0.7577390 1.7970493 2.7127320
26 1.6594387 2.1334063 2.5684707 1.7456720
27 1.7386916 0.8055359 0.7111830 2.4397384 2.3837220
28 1.2073437 1.8819090 2.5576686 1.0462603 0.8746288 2.3403397
29 2.0660618 2.9851663 3.6597375 1.8883997 1.5355074 3.2402863 1.6257754
30 2.0379738 1.9320678 1.9965137 2.5022080 1.3617805 1.6724106 1.8416546
31 3.1582568 3.4665874 3.7630496 2.9089914 2.0266689 3.8122089 2.0274146
32 2.9160664 2.9702301 3.0659425 2.8954076 1.7533983 3.2302217 1.9829028
33 3.3735445 3.6690896 3.8377850 3.3009014 1.7791712 3.7974876 2.2905790
34 5.5211828 5.1438803 4.7384853 5.6584718 4.3690482 5.0557731 4.7159952
29 30 31 32 33
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30 2.2710070
31 3.0042625 2.9712150
32 3.1179553 2.4616402 0.9893371
33 2.6784355 2.4603690 1.3581081 1.3698094
34 5.7043736 4.3379646 3.3591474 2.9138925 3.25776983.7 Koefisien Korelasi Cophenetic
Perhitungan koefisien korelasi cophenetic digunakan untuk berbagai metode linkage (Single Linkage, Average Linkage, Complete Linkage, Centroid Linkage, dan Ward). Metode-metode ini digunakan untuk mengelompokkan data berdasarkan jarak antar sampel, dan koefisien korelasi cophenetic mengukur sejauh mana hierarki kluster yang terbentuk sesuai dengan jarak yang sebenarnya antar sampel.
> #Koefisien Korelasi Cophenetic
> d1 <- dist(data[,2:5])
> #Single Linkage
> hiers <- hclust(dist(data[,2:5]), method = "single")
> #korelasi cophenetic
> hc1 <- hclust(d1, "single")
> d2 <- cophenetic(hc1)
> cors <- cor(d1,d2)
> cors
[1] 0.7014684> #Average Linkage
> hierave <- hclust(dist(data[,2:5]), method = "ave")
> #korelasi cophenetic
> hc2 <- hclust(d1, "ave")
> d3 <- cophenetic(hc2)
> corave <- cor(d1,d3)
> corave
[1] 0.7516365> #Complete Linkage
> hiercomp <- hclust(dist(data[,2:5]), method = "complete")
> #korelasi cophenetic
> hc3 <- hclust(d1, "complete")
> d4 <- cophenetic(hc3)
> corcomp <- cor(d1,d4)
> corcomp
[1] 0.6424352> #Centorid Linkage
> hiercen <- hclust(dist(data[,2:5]), method = "centroid")
> #korelasi cophenetic
> hc4 <- hclust(d1, "centroid")
> d5 <- cophenetic(hc4)
> corcen <- cor(d1,d5)
> corcen
[1] 0.72474283.8 Indeks Validitas
Validasi internal hasil klustering menggunakan clValid, yang mengukur kualitas kluster dengan berbagai metrik. Ini membantu dalam memilih jumlah kluster yang optimal. Metode Average Linkage kemudian diterapkan untuk membentuk kluster, dan dendrogram dari hasil klustering tersebut divisualisasikan menggunakan plot() untuk memberikan gambaran hierarki kluster yang terbentuk.
> inval <- clValid(datastand, 2:5, clMethods = "hierarchical", validation = "internal", metric = "euclidean", method = "average")
> summary(inval)
Clustering Methods:
hierarchical
Cluster sizes:
2 3 4 5
Validation Measures:
2 3 4 5
hierarchical Connectivity 2.9290 8.3730 17.8456 19.2246
Dunn 0.4671 0.3200 0.2020 0.2020
Silhouette 0.4815 0.2705 0.1957 0.1558
Optimal Scores:
Score Method Clusters
Connectivity 2.9290 hierarchical 2
Dunn 0.4671 hierarchical 2
Silhouette 0.4815 hierarchical 2 > optimalScores(inval)
Score Method Clusters
Connectivity 2.9289683 hierarchical 2
Dunn 0.4670835 hierarchical 2
Silhouette 0.4814574 hierarchical 23.9 Metode Average Linkage
Kluster yang terbentuk kemudian dianalisis lebih lanjut dengan menggunakan cutree() untuk memisahkan data ke dalam dua kluster, dan hasilnya ditampilkan. Terakhir, rata-rata dari variabel-variabel dalam setiap kluster dihitung untuk memberikan pemahaman lebih lanjut mengenai karakteristik kluster yang terbentuk. Semua langkah ini bertujuan untuk mengelompokkan data berdasarkan kesamaan indikator dan memastikan bahwa kluster yang terbentuk valid dan bermakna.
> hirave <- hclust(dist(scale(data[,2:5])), method = "average")
> hirave
Call:
hclust(d = dist(scale(data[, 2:5])), method = "average")
Cluster method : average
Distance : euclidean
Number of objects: 34 > plot(hirave, labels(data$PROVINSI), hang = 1, col = "blue", main = "Cluster Dendogram", sub = " ", xlab = "PROVINSI", ylab = "Jarak")>
> anggotaave <- data.frame(id = data$PROVINSI, cutree(hirave, k = 2))
> anggotaave
id cutree.hirave..k...2.
1 ACEH 1
2 SUMATERA UTARA 1
3 SUMATERA BARAT 1
4 RIAU 1
5 JAMBI 1
6 SUMATERA SELATAN 1
7 BENGKULU 1
8 LAMPUNG 1
9 KEP. BANGKA BELITUNG 1
10 KEP. RIAU 1
11 DKI JAKARTA 1
12 JAWA BARAT 1
13 JAWA TENGAH 1
14 DI YOGYAKARTA 1
15 JAWA TIMUR 1
16 BANTEN 1
17 BALI 1
18 NUSA TENGGARA BARAT 1
19 NUSA TENGGARA TIMUR 1
20 KALIMANTAN BARAT 1
21 KALIMANTAN TENGAH 1
22 KALIMANTAN SELATAN 1
23 KALIMANTAN TIMUR 1
24 KALIMANTAN UTARA 1
25 SULAWESI UTARA 1
26 SULAWESI TENGAH 1
27 SULAWESI SELATAN 1
28 SULAWESI TENGGARA 1
29 GORONTALO 1
30 SULAWESI BARAT 1
31 MALUKU 1
32 MALUKU UTARA 1
33 PAPUA BARAT 1
34 PAPUA 2>
> clus_hier <- eclust(datastand, FUNcluster = "hclust", k = 2, hc_method = "average", graph = TRUE)
> fviz_dend(clus_hier, rect = TRUE, cex = 0.5)4 HASIL DAN PEMBAHASAN
4.1 Statistika Deskriptif
> library(readxl)
> statdes <- read_excel("C:/Users/USER/Downloads/statdes.xlsx")
> statdes <- data.frame(statdes)
> datatable(statdes)Interpretasi: - Cakupan ASI eksklusif berkisar antara 52,98% (minimum) hingga 78,93% (maksimum), dengan rata-rata 66,57%. Sebagian besar provinsi memiliki cakupan ASI eksklusif di rentang 61,23% hingga 71,95%. Hal ini menunjukkan bahwa ada beberapa provinsi yang memiliki cakupan ASI eksklusif rendah, sementara sebagian besar provinsi menunjukkan angka yang cukup tinggi.
Cakupan imunisasi dasar berkisar antara 17,32% hingga 79,37%, dengan rata-rata 50,92%. Cakupan ini cukup bervariasi, dengan sebagian provinsi memiliki cakupan yang sangat rendah, sementara yang lain sudah mendekati target yang lebih tinggi. Cakupan imunisasi dasar yang rendah dapat menunjukkan adanya kesenjangan dalam akses atau kualitas pelayanan kesehatan di beberapa provinsi.
Tingkat kematian bayi berkisar antara 10,38% hingga 38,17%, dengan rata-rata 19,65%. Ada perbedaan yang signifikan antara provinsi dengan tingkat kematian bayi yang rendah dan yang tinggi, yang mungkin mencerminkan perbedaan dalam kualitas pelayanan kesehatan ibu dan anak antarprovinsi.
Penanganan stunting berkisar antara 41,70% hingga 79,94%, dengan rata-rata 63,29%. Sebagian besar provinsi menunjukkan tingkat penanganan stunting yang cukup baik, namun masih ada beberapa provinsi dengan penanganan stunting yang rendah.
4.2 Uji Asumsi
4.2.1 Uji Sampel Representatif (KM0)
> library(readxl)
> nilaikmo <- read_excel("C:/Users/USER/Downloads/nilai kmo.xlsx")
> nilaikmo <- data.frame(nilaikmo)
> datatable(nilaikmo)Nilai KMO untuk masing-masing variabel tidak ada yang di bawah 0.5 sehingga sampel dapat digunakan untuk analisis cluster.
4.2.2 Uji Non-Multikolinieritas
> korelasi
ASI.EKSKLUSIF.... IMUNISASI.DASAR.... KEMATIAN.BAYI....
ASI.EKSKLUSIF.... 1.0000000 0.1528724 -0.1979208
IMUNISASI.DASAR.... 0.1528724 1.0000000 -0.3426307
KEMATIAN.BAYI.... -0.1979208 -0.3426307 1.0000000
PENANGANAN.STUNTING.... 0.3665575 0.7151266 -0.5741382
PENANGANAN.STUNTING....
ASI.EKSKLUSIF.... 0.3665575
IMUNISASI.DASAR.... 0.7151266
KEMATIAN.BAYI.... -0.5741382
PENANGANAN.STUNTING.... 1.0000000Nilai korelasi antar variabel berada di bawah 0.8, menunjukkan bahwa tidak terjadi multikolinieritas antar variabel.
4.2.3 Koefisien Korelasi Cophenetic
Nilai korelasi yang paling mendekati 1 adalah dengan metode average linkage, sehingga analisis akan dilanjutkan dengan metode average linkage.
4.2.4 Indeks Validitas Cluster
> optimalScores(inval)
Score Method Clusters
Connectivity 2.9289683 hierarchical 2
Dunn 0.4670835 hierarchical 2
Silhouette 0.4814574 hierarchical 2Berdasarkan ketiga indeks, maka jumlah cluster yang optimal yaitu 2 cluster untuk mengelompokkan faktor kesehatan bayi dengan metode average linkage.
4.2.5 Cluster Dendogram
> clus_hier <- eclust(datastand, FUNcluster = "hclust", k = 2, hc_method = "average", graph = TRUE)
> fviz_dend(clus_hier, rect = TRUE, cex = 0.5)
Faktor kesehatan bayi dikelompokkan menjadi 2 cluster. Cluster pertama
berwarna oranye berisi provinsi Papua, sementara cluster kedua berisi 32
provinsi lainnya.
4.2.6 Karakteristik Cluster
> aggregate(data,list(idclus),mean)
Group.1 PROVINSI ASI.EKSKLUSIF.... IMUNISASI.DASAR.... KEMATIAN.BAYI....
1 1 NA 66.24061 51.75333 19.17848
2 2 NA 74.56000 21.26000 38.17000
PENANGANAN.STUNTING....
1 63.86121
2 41.70000Interpretasi: - Cluster 1: Tinggi dalam ASI Eksklusif dan Penanganan Stunting, dengan kondisi sedang untuk Imunisasi Dasar dan Kematian Bayi. (Kondisi Kesehatan Tinggi) - Cluster 2: Meskipun ASI Eksklusif tinggi, masalah besar pada Imunisasi Dasar, Kematian Bayi, dan Penanganan Stunting menunjukkan kondisi kesehatan yang lebih buruk secara keseluruhan. (Kondisi Kesehatan Buruk)
5 KESIMPULAN
Berdasarkan analisis klaster, dapat disimpulkan bahwa sebagian besar provinsi di Indonesia menunjukkan kondisi kesehatan bayi yang baik, dengan indikator-indikator seperti ASI eksklusif, imunisasi dasar lengkap, angka kematian bayi yang rendah, dan penanganan stunting yang efektif. Namun, Provinsi Papua menjadi pengecualian, dengan kondisi kesehatan bayi yang lebih rendah dibandingkan provinsi lainnya. Hal ini menunjukkan adanya kesenjangan dalam pencapaian indikator kesehatan bayi antara Papua dan provinsi lainnya. Demi memperbaiki kondisi kesehatan bayi di Papua, disarankan agar pemerintah pusat dan daerah lebih fokus pada penguatan program-program kesehatan khususnya di bidang ASI eksklusif, imunisasi dasar, dan penanganan stunting. Pendekatan yang lebih intensif dan kontekstual perlu diterapkan di Papua, mengingat tantangan geografis dan sosial yang ada. Selain itu, peningkatan fasilitas kesehatan dan sumber daya manusia di daerah terpencil dapat membantu mengatasi kendala-kendala yang ada.
6 DAFTAR PUSTAKA
Bengkulu Utara. Jurnal Buana Informatika, 12(2), 146-155. Program Studi Teknik Informatika, Fakultas Teknik dan Informatika, Universitas AKI Semarang. https://ojs.uajy.ac.id/index.php/jbi/article/view/4861 Saputro, D. T., & Sucihermayanti, W. (2021). Penerapan klasterisasi menggunakan K-Means untuk menentukan tingkat kesehatan bayi dan balita di Kabupaten World Health Organization (WHO). (2023). Infant and Young Child Feeding. https://www.who.int/news-room/fact-sheets/detail/infant-and-young-child-feeding