Analisis Cluster Hierarki pada Pengelompokan Kesehatan Bayi Berdasarkan Provinsi di Indonesia

Nikita Rindiani Setyoningrum

2024-05-20

1 PENDAHULUAN

1.1 Latar Belakang

Kesehatan bayi dan balita adalah salah satu indikator utama yang menentukan kualitas kehidupan anak dan perkembangan masyarakat secara keseluruhan. Menurut World Health Organization (WHO), pemberian ASI eksklusif selama 6 bulan pertama kehidupan dan imunisasi dasar merupakan upaya preventif utama untuk menurunkan angka kematian bayi dan mencegah penyakit pada anak-anak (WHO, 2023). Namun, di Indonesia, kondisi kesehatan bayi antar provinsi masih sangat bervariasi. Beberapa provinsi menunjukkan tingkat kemajuan yang pesat dalam program kesehatan bayi, sementara yang lain menghadapi tantangan besar terkait akses terhadap perawatan kesehatan, pendidikan gizi, dan fasilitas kesehatan yang memadai. Data yang menunjukkan tingkat ASI eksklusif, tingkat imunisasi dasar, angka kematian bayi, dan penanganan stunting mencerminkan ketimpangan ini dan sangat penting untuk dianalisis lebih lanjut. Pada konteks ini, analisis klaster dapat digunakan untuk mengelompokkan provinsi-provinsi berdasarkan kesamaan karakteristik kesehatan bayi. Melalui penggunaan teknik hierarchical clustering, analisis ini memungkinkan untuk mengidentifikasi kelompok provinsi yang memiliki kesamaan dalam hal indikator kesehatan bayi. Klaster yang dihasilkan dapat memberikan informasi yang berharga bagi pembuatan kebijakan yang lebih terarah dan efisien, yang sesuai dengan kondisi spesifik di setiap provinsi. Penggunaan analisis klaster untuk mengelompokkan provinsi berdasarkan indikator kesehatan dapat membantu pemangku kebijakan untuk merancang program-program yang lebih sesuai dengan kondisi lokal, meningkatkan efektivitas program kesehatan, dan mengurangi ketimpangan antar wilayah (Saputro & Sucihermayanti, 2021). Penelitian ini bertujuan untuk mengelompokkan provinsi-provinsi di Indonesia berdasarkan kondisi kesehatan bayi yang dipengaruhi oleh berbagai indikator kesehatan, seperti persentase bayi yang mendapatkan ASI eksklusif, persentase anak yang menerima imunisasi dasar lengkap, angka kematian bayi, dan indeks penanganan stunting. Dengan demikian, diharapkan dapat ditemukan pola atau kesamaan karakteristik antar provinsi yang dapat dijadikan dasar untuk perencanaan kebijakan kesehatan yang lebih fokus.

1.2 Rumusan Masalah

  1. Bagaimana mengelompokkan provinsi di Indonesia berdasarkan kondisi kesehatan bayi menggunakan analisis klaster hierarki dengan empat indikator: ASI eksklusif, imunisasi dasar lengkap, kematian bayi, dan penanganan stunting?

  2. Apa karakteristik klaster yang terbentuk, dan bagaimana mengkategorikan provinsi ke dalam klaster dengan tingkat kesehatan bayi tinggi dan rendah?

  3. Bagaimana hasil klasterisasi ini dapat digunakan untuk merancang kebijakan guna meningkatkan kesehatan bayi di provinsi dengan kondisi kesehatan bayi rendah?

1.3 Tujuan

  1. Menerapkan analisis klaster hierarki untuk mengelompokkan provinsi berdasarkan kondisi kesehatan bayi (ASI eksklusif, imunisasi, kematian bayi, dan penanganan stunting).
  2. Mengidentifikasi provinsi dalam klaster dengan tingkat kesehatan bayi tinggi dan rendah.
  3. Memberikan rekomendasi kebijakan untuk meningkatkan kesehatan bayi di provinsi dengan klaster rendah, berdasarkan karakteristik klaster yang terbentuk.

2 TINJAUAN PUSTAKA

2.1 Analisis Cluster

Analisis klaster adalah teknik statistik yang digunakan untuk mengelompokkan objek atau unit ke dalam grup yang lebih kecil (klaster) berdasarkan kesamaan karakteristik. Dalam konteks ini, analisis klaster digunakan untuk mengelompokkan provinsi di Indonesia berdasarkan kondisi kesehatan bayi, seperti persentase bayi yang mendapatkan ASI eksklusif, imunisasi dasar lengkap, angka kematian bayi, dan indeks penanganan stunting. Salah satu metode yang paling umum digunakan dalam analisis klaster adalah hierarchical clustering, yang membentuk hierarki klaster dengan mengelompokkan unit-unit data secara bertahap dari yang paling mirip ke yang paling berbeda (Ward, 1963).

2.2 Uji Asumsi

2.2.1 Uji Sampel Representatif

Uji Kaiser-Meyer-Olkin (KMO) digunakan untuk mengukur kecocokan data untuk analisis faktor, yang menunjukkan seberapa baik variabel-variabel dalam dataset berhubungan satu sama lain. Nilai KMO berkisar antara 0 hingga 1, dengan nilai yang lebih tinggi menunjukkan bahwa data lebih cocok untuk analisis faktor. Nilai KMO di atas 0.6 dianggap cukup baik untuk analisis faktor. Nilai KMO yang rendah menunjukkan bahwa data kurang cocok untuk analisis faktor dan mungkin perlu dilakukan pengolahan data lebih lanjut.

\[ KMO=\frac{∑_{i}∑_{i≠j}r^{2}_{ij}}{∑_{i}∑_{i≠j}r^{2}_{ij}+∑_{i}∑_{i≠j}a^{2}_{ij}} \]

\[a_{ij} \] : koefisien korelasi parsial antar variabel

2.2.2 Uji Non-Multikolinieritas

Uji multikolinearitas bertujuan untuk mengidentifikasi adanya korelasi yang sangat tinggi antara variabel independen dalam model regresi. Jika terdapat korelasi yang tinggi antar variabel, hal ini bisa mengganggu estimasi model regresi. Salah satu cara untuk mendeteksi multikolinearitas adalah dengan melihat matriks korelasi antar variabel. Nilai korelasi yang sangat tinggi (misalnya di atas 0.8 atau 0.9) menunjukkan adanya potensi multikolinearitas.

2.3 Standarisasi Data

Standarisasi data adalah langkah penting dalam analisis klaster untuk memastikan bahwa setiap variabel memiliki skala yang sama. Hal ini penting karena variabel dengan skala yang lebih besar bisa mendominasi hasil analisis klaster. Proses standarisasi dilakukan dengan mengubah nilai variabel agar memiliki mean 0 dan standar deviasi 1. \[ Z = \frac{X - \mu}{\sigma} \]

2.4 Jarak Euclidean

Jarak Euclidean digunakan untuk mengukur kedekatan antara dua objek dalam ruang multidimensi. Dalam analisis klaster, jarak ini digunakan untuk mengukur seberapa mirip atau berbeda antara dua unit data. \[ d(x,y)=\sqrt{∑_{i}^{n} (x_i−y_i)^2} \]

2.5 Metode Analisis Hierarki

Metode analisis klaster hierarki menggunakan dua pendekatan utama: Agglomerative (penggabungan) dan Divisive (pemecahan). Dalam metode agglomerative, setiap objek dimulai sebagai klaster individu dan secara bertahap digabungkan berdasarkan kedekatannya.

2.5.1 Agglomerative Methods:

2.5.1.1 Single Linkage

Jarak antar dua klaster dihitung berdasarkan jarak terkecil antara objek dalam kedua klaster. \[ d_{ij}=min(d_{pj};d_{qj}) \] #### Complete Linkage Jarak antar dua klaster dihitung berdasarkan jarak terbesar antara objek dalam kedua klaster. \[ d_{ij}=max(d_{pj};d_{qj}) \] #### Average Linkage Jarak antar dua klaster dihitung sebagai rata-rata jarak antar semua pasangan objek dalam kedua klaster. \[ d_{ij}=average(d_{pj};d_{qj}) \] #### Ward’s Method Menghitung jarak berdasarkan peningkatan total varians dalam klaster setelah penggabungan. \[ ESS= ∑_{k=1}^{K} \left\{{∑_{i}^{nk}∑_{j=1}^{p}X^{2}_{ijk}}− \frac{1}{nk}(∑_{j=1}^{p}(∑_{i}^{nk}X_{ijk})^2\right\} \]

2.5.1.2 Centroid Method

Jarak antara dua klaster dihitung berdasarkan perbedaan antara pusat masing-masing klaster. \[ C_i= \frac{1}{M}∑_{j=1}^{M}x_j \]

2.5.2 Divisive Method

Metode ini dimulai dengan seluruh data sebagai satu klaster dan membaginya menjadi klaster-klaster yang lebih kecil berdasarkan perbedaan antar data.

2.6 Koefisien Korelasi Cophenetic

Koefisien korelasi cophenetic mengukur sejauh mana struktur klaster yang dihasilkan oleh analisis klaster hierarki mencerminkan jarak asli antar objek. Nilai koefisien yang tinggi menunjukkan bahwa struktur klaster mencerminkan jarak antar objek dengan baik. \[ r=\frac{∑_{k=1}d_{ij}-{d_{ij}}}^2{∑_{ij}d^2_{ij} \] ## Indeks Validasi Cluster ### Indeks Connectivity Mengukur kekompakan klaster dengan menghitung berapa banyak objek dalam satu klaster yang terhubung langsung ke objek dari klaster lain.

2.6.1 Indeks Silhoutte

Mengukur kualitas klaster dengan membandingkan kedekatan objek dengan objek dalam klaster yang sama dan klaster lainnya. Nilai berkisar antara -1 hingga 1, dengan nilai yang lebih tinggi menunjukkan klaster yang lebih baik.

2.6.2 Indeks Dunn

Mengukur sejauh mana klaster terpisah satu sama lain, dengan mempertimbangkan jarak antar klaster dan ukuran klaster.

2.7 Data

Data yang digunakan dalam penelitian ini mencakup empat variabel utama terkait kesehatan bayi di 34 provinsi Indonesia: persentase bayi yang mendapat ASI eksklusif, persentase anak yang menerima imunisasi dasar lengkap, angka kematian bayi , dan indeks penanganan stunting. Sumber data berasal dari Badan Pusat Statistik (BPS) pada tahun 2019 dan 2020

datatable(data,caption = “Kondisi Kesehatan Bayi”)

3 SOURCE CODE

3.1 Library

> library(psych)
> library(GPArotation)
> library(clValid)
> library(ggplot2)
> library(cluster)
> library(factoextra)
> library(tidyverse)
> library(car)
> library(readxl)
> library(DT) 

Mengimpor paket-paket yang dibutuhkan untuk analisis statistik, validasi kluster, visualisasi data, dan manipulasi data. Library-library ini mempersiapkan lingkungan R untuk melakukan analisis klaster dengan metode hierarkis.

3.2 Impor Data

Mengimpor data dari file Excel yang berada di path yang diberikan, kemudian mengonversinya menjadi data frame, dan menampilkan data tersebut.

> data <- read_excel("C:/Users/USER/Documents/Tugas Kuliah/SEM 5/Anmul 1/bayi.xlsx")
> data <- data.frame(data)
> data
               PROVINSI ASI.EKSKLUSIF.... IMUNISASI.DASAR.... KEMATIAN.BAYI....
1                  ACEH             65.43               17.32             19.41
2        SUMATERA UTARA             53.39               35.31             18.28
3        SUMATERA BARAT             70.36               43.15             16.35
4                  RIAU             65.17               31.22             15.69
5                 JAMBI             65.22               50.37             16.99
6      SUMATERA SELATAN             68.06               39.31             16.78
7              BENGKULU             62.30               54.22             19.73
8               LAMPUNG             72.36               62.40             15.69
9  KEP. BANGKA BELITUNG             55.47               55.57             16.75
10            KEP. RIAU             59.49               65.46             13.31
11          DKI JAKARTA             70.86               52.01             10.38
12           JAWA BARAT             76.11               50.11             13.56
13          JAWA TENGAH             76.30               74.48             12.77
14        DI YOGYAKARTA             78.93               79.37             10.90
15           JAWA TIMUR             66.90               61.33             13.49
16               BANTEN             68.84               31.29             13.83
17                 BALI             64.92               76.95             13.26
18  NUSA TENGGARA BARAT             73.78               70.65             24.64
19  NUSA TENGGARA TIMUR             76.41               48.44             25.67
20     KALIMANTAN BARAT             66.42               50.43             17.47
21    KALIMANTAN TENGAH             52.98               39.08             17.95
22   KALIMANTAN SELATAN             63.55               58.20             17.22
23     KALIMANTAN TIMUR             71.13               53.10             15.51
24     KALIMANTAN UTARA             76.98               45.33             16.65
25       SULAWESI UTARA             58.60               61.32             17.23
26      SULAWESI TENGAH             61.97               49.56             27.72
27     SULAWESI SELATAN             76.21               53.94             18.20
28    SULAWESI TENGGARA             60.48               56.68             23.29
29            GORONTALO             56.22               64.33             29.47
30       SULAWESI BARAT             71.54               52.65             29.21
31               MALUKU             57.19               44.97             29.82
32         MALUKU UTARA             62.41               36.69             28.61
33          PAPUA BARAT             59.96               42.62             37.06
34                PAPUA             74.56               21.26             38.17
   PENANGANAN.STUNTING....
1                    61.95
2                    58.56
3                    63.97
4                    60.04
5                    61.03
6                    60.22
7                    60.41
8                    64.27
9                    60.68
10                   62.76
11                   70.56
12                   66.22
13                   71.17
14                   79.94
15                   70.69
16                   64.32
17                   69.71
18                   72.97
19                   64.81
20                   56.46
21                   58.16
22                   66.77
23                   64.94
24                   64.04
25                   64.78
26                   63.83
27                   66.21
28                   61.66
29                   69.48
30                   66.03
31                   50.91
32                   53.42
33                   56.45
34                   41.70
> View(data)

3.3 Statistik Deskriptif

Menghitung dan menampilkan statistik deskriptif untuk data yang diimpor menggunakan fungsi summary().

> statdes <- summary(data)
> statdes
   PROVINSI         ASI.EKSKLUSIF.... IMUNISASI.DASAR.... KEMATIAN.BAYI....
 Length:34          Min.   :52.98     Min.   :17.32       Min.   :10.38    
 Class :character   1st Qu.:60.85     1st Qu.:42.75       1st Qu.:15.55    
 Mode  :character   Median :65.92     Median :51.22       Median :17.23    
                    Mean   :66.49     Mean   :50.86       Mean   :19.74    
                    3rd Qu.:72.16     3rd Qu.:60.54       3rd Qu.:24.30    
                    Max.   :78.93     Max.   :79.37       Max.   :38.17    
 PENANGANAN.STUNTING....
 Min.   :41.70          
 1st Qu.:60.27          
 Median :64.00          
 Mean   :63.21          
 3rd Qu.:66.22          
 Max.   :79.94          

3.4 Uji Asumsi

3.4.1 Uji Sampel Representatif

Menguji kelayakan data dengan KMO() yang menghasilkan nilai KMO untuk memastikan data cukup representatif untuk analisis klaster.

> kmo <- KMO(data[,2:5])
> kmo
Kaiser-Meyer-Olkin factor adequacy
Call: KMO(r = data[, 2:5])
Overall MSA =  0.57
MSA for each item = 
      ASI.EKSKLUSIF....     IMUNISASI.DASAR....       KEMATIAN.BAYI.... 
                   0.57                    0.56                    0.66 
PENANGANAN.STUNTING.... 
                   0.54 

3.4.2 Uji Non-Multikolinearitas

Menghitung matriks korelasi antar variabel untuk memeriksa multikolinearitas.

> korelasi <- cor(data[,2:5], method = 'pearson')
> korelasi
                        ASI.EKSKLUSIF.... IMUNISASI.DASAR.... KEMATIAN.BAYI....
ASI.EKSKLUSIF....               1.0000000           0.1528724        -0.1979208
IMUNISASI.DASAR....             0.1528724           1.0000000        -0.3426307
KEMATIAN.BAYI....              -0.1979208          -0.3426307         1.0000000
PENANGANAN.STUNTING....         0.3665575           0.7151266        -0.5741382
                        PENANGANAN.STUNTING....
ASI.EKSKLUSIF....                     0.3665575
IMUNISASI.DASAR....                   0.7151266
KEMATIAN.BAYI....                    -0.5741382
PENANGANAN.STUNTING....               1.0000000

3.5 Standarisasi Data

Melakukan standarisasi pada data (skala z) untuk mempersiapkan analisis lebih lanjut.

> datastand <- scale(data[,2:5])
> datastand
      ASI.EKSKLUSIF.... IMUNISASI.DASAR.... KEMATIAN.BAYI....
 [1,]      -0.142248138         -2.30003677     -0.0459447987
 [2,]      -1.765177281         -1.06622591     -0.2046857311
 [3,]       0.522290125         -0.52853402     -0.4758096244
 [4,]      -0.177294780         -1.34673099     -0.5685255671
 [5,]      -0.170555041         -0.03336368     -0.3859032556
 [6,]       0.212262132         -0.79189332     -0.4154037829
 [7,]      -0.564155797          0.23068144     -0.0009916144
 [8,]       0.791879683          0.79169160     -0.5685255671
 [9,]      -1.484804140          0.32326869     -0.4196181439
[10,]      -0.942929127          1.00155604     -0.9028648760
[11,]       0.589687514          0.07911268     -1.3144674704
[12,]       1.297360106         -0.05119530     -0.8677452007
[13,]       1.322971114          1.62017604     -0.9787233746
[14,]       1.677481384          1.95554764     -1.2414185458
[15,]       0.055900188          0.71830763     -0.8775787098
[16,]       0.317402060         -1.34193017     -0.8298159514
[17,]      -0.210993475          1.78957642     -0.9098888110
[18,]       0.983288270          1.35750258      0.6887588085
[19,]       1.337798540         -0.16572916      0.8334518707
[20,]      -0.008801306         -0.02924870     -0.3184734790
[21,]      -1.820443141         -0.80766744     -0.2510437025
[22,]      -0.395662323          0.50364237     -0.3535931543
[23,]       0.626082105          0.15386831     -0.5938117334
[24,]       1.414631564         -0.37902276     -0.4336660140
[25,]      -1.062896481          0.71762180     -0.3521883673
[26,]      -0.608638074         -0.08891604      1.1214332081
[27,]       1.310839584          0.21147816     -0.2159240272
[28,]      -0.809482296          0.39939599      0.4991125619
[29,]      -1.383708056          0.92405708      1.3672709352
[30,]       0.681347964          0.12300590      1.3307464729
[31,]      -1.252957120         -0.40371269      1.4164384806
[32,]      -0.549328371         -0.97158117      1.2464592522
[33,]      -0.879575581         -0.56488309      2.4335042772
[34,]       1.088428198         -2.02981916      2.5894356355
      PENANGANAN.STUNTING....
 [1,]             -0.18252329
 [2,]             -0.67382724
 [3,]              0.11023009
 [4,]             -0.45933466
 [5,]             -0.31585652
 [6,]             -0.43324772
 [7,]             -0.40571152
 [8,]              0.15370831
 [9,]             -0.36658111
[10,]             -0.06513209
[11,]              1.06530177
[12,]              0.43631678
[13,]              1.15370749
[14,]              2.42472094
[15,]              1.08414233
[16,]              0.16095468
[17,]              0.94211346
[18,]              1.41457684
[19,]              0.23196912
[20,]             -0.97817481
[21,]             -0.73179820
[22,]              0.51602686
[23,]              0.25080968
[24,]              0.12037501
[25,]              0.22762130
[26,]              0.08994025
[27,]              0.43486750
[28,]             -0.22455224
[29,]              0.90878016
[30,]              0.40878057
[31,]             -1.78252198
[32,]             -1.41875416
[33,]             -0.97962409
[34,]             -3.11730349
attr(,"scaled:center")
      ASI.EKSKLUSIF....     IMUNISASI.DASAR....       KEMATIAN.BAYI.... 
               66.48529                50.85647                19.73706 
PENANGANAN.STUNTING.... 
               63.20941 
attr(,"scaled:scale")
      ASI.EKSKLUSIF....     IMUNISASI.DASAR....       KEMATIAN.BAYI.... 
               7.418685               14.580841                7.118517 
PENANGANAN.STUNTING.... 
               6.900006 
> rownames(datastand) <- 1:nrow(datastand)

3.6 Jarak Euclidien

Menghitung jarak Euclidean antar sampel setelah data distandarisasi.

> jarak <- dist(datastand, method = "euclidean")
> jarak
           1         2         3         4         5         6         7
2  2.1030374                                                            
3  1.9622236 2.4919618                                                  
4  1.1223793 1.6668655 1.2214195                                        
5  2.2960744 1.9418052 0.9564837 1.3337601                              
6  1.6123079 2.0218322 0.6815368 0.6955043 0.8582349                    
7  2.5757280 1.7993884 1.4994735 1.7212965 0.6171485 1.3494368          
8  3.2890001 3.2874903 1.3513552 2.4265144 1.3641257 1.7921109 1.6699132
9  2.9761884 1.4662539 2.2325998 2.1282050 1.3631387 2.0317683 1.0163391
10 3.5056665 2.4103481 2.1682184 2.5234552 1.4134117 2.2190212 1.2911571
11 3.0597874 3.3336727 1.4104204 2.3456849 1.8331529 1.9887351 2.2898529
12 2.8614819 3.4758438 1.0433273 2.1782432 1.7184380 1.6391542 2.2371789
13 4.4911607 4.5488936 2.5690100 3.7179971 2.7342034 3.1444409 2.9798809
14 5.4450247 5.6266180 3.6671724 4.8078894 3.9514147 4.3064585 4.1892848
15 3.3831527 3.1692468 1.6976623 2.6070289 1.6786999 2.1957309 1.9000837
16 1.3644331 2.3453781 0.9118585 0.8353320 1.5410567 0.9156467 2.0635678
17 4.3290725 3.6986038 2.6061074 3.4522667 2.2763557 2.9965422 2.2798253
18 4.2112878 4.3114032 2.6128899 3.7083879 2.7230794 3.1381547 2.7301125
19 2.7732561 3.5124849 1.5892348 2.4766338 2.0197997 1.9133917 2.2085072
20 2.4252051 2.0653700 1.3193649 1.4477123 0.6851230 0.9679033 0.8969344
21 2.3210500 0.2746206 2.5151235 1.7792013 1.8742656 2.0611371 1.6808584
22 2.9167542 2.4037437 1.4448642 2.1140227 1.0159344 1.7184085 1.0377028
23 2.6645670 2.8658548 0.7142358 1.8444937 1.0168693 1.2511898 1.4849317
24 2.5211593 3.3565789 0.9058178 1.9557452 1.6807367 1.3867177 2.1797506
25 3.1962259 2.1236001 2.0235572 2.3589305 1.2871508 2.0845646 1.0051382
26 2.5580427 2.1528237 2.0059559 2.2194186 1.6222629 1.9502943 1.2687117
27 2.9714029 3.5105182 1.1586019 2.3593399 1.6872928 1.7340827 2.0660943
28 2.8339006 1.9387059 1.9228168 2.1549001 1.1777514 1.8283943 0.6095675
29 3.8889749 3.0137085 3.1268959 3.4972786 2.6385127 3.2358267 2.1800152
30 2.9655295 3.3059567 1.9500208 2.6941144 2.0547933 2.1943415 1.9999493
31 3.0867912 2.1350740 3.2140623 2.7815895 2.5900378 2.7338140 2.1866912
32 2.2647480 2.0366600 2.5784995 2.1198590 2.2146584 2.0845430 2.0069988
33 3.2151901 2.8441507 3.4085830 3.2229441 3.0290047 3.1078043 2.6435882
34 4.1407423 4.7800906 4.7314977 4.3710618 4.7192817 4.3050369 4.6801647
           8         9        10        11        12        13        14
2                                                                       
3                                                                       
4                                                                       
5                                                                       
6                                                                       
7                                                                       
8                                                                       
9  2.3865422                                                            
10 1.7925620 1.0383165                                                  
11 1.3914318 2.6859210 2.1557163                                        
12 1.0655368 2.9540014 2.5258396 1.0549709                              
13 1.4617473 3.4913388 2.6473230 1.7415857 1.8223896                    
14 2.7837267 4.5968584 3.7537498 2.5607929 2.8748726 1.3865914          
15 1.2281174 2.2009434 1.5489870 0.9405987 1.5978524 1.5600977 2.4677558
16 2.2013169 2.5431065 2.6714816 1.7737624 1.6442558 3.2852662 4.2446708
17 1.6551859 2.3928432 1.4735328 1.9353644 2.4333470 1.5592479 2.4293869
18 1.8781195 3.4003151 2.9257163 2.4339497 2.3372566 1.7415313 2.3633742
19 1.7850343 3.1834968 3.1092344 2.4346701 1.7177260 2.7061519 3.7051920
20 1.6305577 1.6392468 1.7636081 2.3532385 2.0022550 3.0781605 4.3834339
21 3.2042310 1.2463831 2.2164465 3.3099165 3.4695476 4.4564702 5.5511520
22 1.2925552 1.4149631 1.0894329 1.5414675 1.8560377 2.2355699 3.2920056
23 0.6666149 2.2127024 1.8373088 1.0907131 0.7759624 1.8971278 3.0816836
24 1.3333005 3.0227908 2.7782460 1.5997245 0.6398964 2.3173392 3.3884780
25 1.8702796 0.8313505 0.6956723 2.1832126 2.5438639 2.7851661 3.8288521
26 2.3657867 1.8763833 2.3286713 2.8894913 2.7768794 3.4920436 4.5211108
27 0.8996362 2.9175216 2.5348735 1.4634979 0.7028883 1.7558960 2.8613564
28 2.0002970 1.1515612 1.5399222 2.6482170 2.6356907 3.1813928 4.3191079
29 3.0113360 2.2783077 2.5104410 3.4386685 3.6548273 3.6570989 4.4202026
30 2.0326470 2.8978064 2.9366204 2.7273623 2.2899653 2.9226299 3.8769240
31 3.6468368 2.4409522 3.2248246 4.3813704 4.0950124 5.0089695 6.2384835
32 3.2672279 2.5366579 3.2403825 3.8897550 3.4883402 4.6681589 5.8726997
33 3.8640242 3.1098624 3.7980785 4.5609734 4.2315554 5.0813479 6.1632568
34 5.3592071 5.3646459 5.9014881 6.1180865 5.3421832 6.6596373 7.8498160
          15        16        17        18        19        20        21
2                                                                       
3                                                                       
4                                                                       
5                                                                       
6                                                                       
7                                                                       
8                                                                       
9                                                                       
10                                                                      
11                                                                      
12                                                                      
13                                                                      
14                                                                      
15                                                                      
16 2.2732179                                                            
17 1.1135821 3.2714150                                                  
18 1.9573500 3.4070485 2.0956843                                        
19 2.4654836 2.2795089 3.1249829 1.9660645                              
20 2.2646804 1.8408228 2.7177722 3.1059778 2.1501950                    
21 3.0886001 2.4469989 3.5457102 4.2472374 3.5343392 1.9882731          
22 0.9204922 2.0657839 1.4760568 2.1270806 2.2232205 1.6332502 2.3058876
23 1.1910777 1.5480531 1.9884774 2.1390823 1.6266896 1.4222598 2.8271974
24 2.0435731 1.5131704 2.8718498 2.4771704 1.2920675 1.8353703 3.3777203
25 1.5037851 2.5257773 1.6420579 2.6624714 2.8194693 1.7674878 1.9573197
26 2.4653007 2.4980014 2.9222121 2.5628550 1.9742394 1.8914453 2.1316712
27 1.6404553 1.9626225 2.3548366 1.7885590 1.1337415 1.9510527 3.4936988
28 2.1115283 2.4933415 2.3742755 2.6181490 2.2913699 1.4356950 1.8163361
29 2.6804676 3.6626367 2.7038770 2.5508343 3.0556944 3.0333964 2.9154840
30 2.4654376 2.6472518 2.9797015 1.7432511 0.8904266 2.2678314 3.3057664
31 4.0561455 3.4884152 4.3280067 4.3420768 3.3416611 2.3119344 2.0903916
32 3.7413973 2.7739464 4.2381593 4.0140178 2.6657284 1.9553221 2.0873486
33 4.2123741 3.7398846 4.5674757 3.9927639 3.0173163 2.9357343 2.8657271
34 6.1879440 4.8482915 6.7082350 5.9695490 4.2235202 4.2705973 4.8697172
          22        23        24        25        26        27        28
2                                                                       
3                                                                       
4                                                                       
5                                                                       
6                                                                       
7                                                                       
8                                                                       
9                                                                       
10                                                                      
11                                                                      
12                                                                      
13                                                                      
14                                                                      
15                                                                      
16                                                                      
17                                                                      
18                                                                      
19                                                                      
20                                                                      
21                                                                      
22                                                                      
23 1.1376945                                                            
24 2.0540725 0.9738804                                                  
25 0.7577390 1.7970493 2.7127320                                        
26 1.6594387 2.1334063 2.5684707 1.7456720                              
27 1.7386916 0.8055359 0.7111830 2.4397384 2.3837220                    
28 1.2073437 1.8819090 2.5576686 1.0462603 0.8746288 2.3403397          
29 2.0660618 2.9851663 3.6597375 1.8883997 1.5355074 3.2402863 1.6257754
30 2.0379738 1.9320678 1.9965137 2.5022080 1.3617805 1.6724106 1.8416546
31 3.1582568 3.4665874 3.7630496 2.9089914 2.0266689 3.8122089 2.0274146
32 2.9160664 2.9702301 3.0659425 2.8954076 1.7533983 3.2302217 1.9829028
33 3.3735445 3.6690896 3.8377850 3.3009014 1.7791712 3.7974876 2.2905790
34 5.5211828 5.1438803 4.7384853 5.6584718 4.3690482 5.0557731 4.7159952
          29        30        31        32        33
2                                                   
3                                                   
4                                                   
5                                                   
6                                                   
7                                                   
8                                                   
9                                                   
10                                                  
11                                                  
12                                                  
13                                                  
14                                                  
15                                                  
16                                                  
17                                                  
18                                                  
19                                                  
20                                                  
21                                                  
22                                                  
23                                                  
24                                                  
25                                                  
26                                                  
27                                                  
28                                                  
29                                                  
30 2.2710070                                        
31 3.0042625 2.9712150                              
32 3.1179553 2.4616402 0.9893371                    
33 2.6784355 2.4603690 1.3581081 1.3698094          
34 5.7043736 4.3379646 3.3591474 2.9138925 3.2577698

3.7 Koefisien Korelasi Cophenetic

Perhitungan koefisien korelasi cophenetic digunakan untuk berbagai metode linkage (Single Linkage, Average Linkage, Complete Linkage, Centroid Linkage, dan Ward). Metode-metode ini digunakan untuk mengelompokkan data berdasarkan jarak antar sampel, dan koefisien korelasi cophenetic mengukur sejauh mana hierarki kluster yang terbentuk sesuai dengan jarak yang sebenarnya antar sampel.

> #Koefisien Korelasi Cophenetic
> d1 <- dist(data[,2:5])
> #Single Linkage
> hiers <- hclust(dist(data[,2:5]), method = "single")
> #korelasi cophenetic
> hc1 <- hclust(d1, "single")
> d2 <- cophenetic(hc1)
> cors <- cor(d1,d2)
> cors
[1] 0.7014684
> #Average Linkage
> hierave <- hclust(dist(data[,2:5]), method = "ave")
> #korelasi cophenetic
> hc2 <- hclust(d1, "ave")
> d3 <- cophenetic(hc2)
> corave <- cor(d1,d3)
> corave
[1] 0.7516365
> #Complete Linkage
> hiercomp <- hclust(dist(data[,2:5]), method = "complete")
> #korelasi cophenetic
> hc3 <- hclust(d1, "complete")
> d4 <- cophenetic(hc3)
> corcomp <- cor(d1,d4)
> corcomp
[1] 0.6424352
> #Centorid Linkage
> hiercen <- hclust(dist(data[,2:5]), method = "centroid")
> #korelasi cophenetic
> hc4 <- hclust(d1, "centroid")
> d5 <- cophenetic(hc4)
> corcen <- cor(d1,d5)
> corcen
[1] 0.7247428
> #Ward
> hierward <- hclust(dist(data[,2:5]), method = "ward.D")
> #korelasi cophenetic
> hc5 <- hclust(d1,"ward.D")
> d6 <- cophenetic(hc5)
> corward <- cor(d1,d6)
> corward
[1] 0.5777283
> 
> KorCop<-data.frame(cors,corave,corcomp,corcen,corward)
> KorCop
       cors    corave   corcomp    corcen   corward
1 0.7014684 0.7516365 0.6424352 0.7247428 0.5777283

3.8 Indeks Validitas

Validasi internal hasil klustering menggunakan clValid, yang mengukur kualitas kluster dengan berbagai metrik. Ini membantu dalam memilih jumlah kluster yang optimal. Metode Average Linkage kemudian diterapkan untuk membentuk kluster, dan dendrogram dari hasil klustering tersebut divisualisasikan menggunakan plot() untuk memberikan gambaran hierarki kluster yang terbentuk.

> inval <- clValid(datastand, 2:5, clMethods = "hierarchical", validation = "internal", metric = "euclidean", method = "average")
> summary(inval)

Clustering Methods:
 hierarchical 

Cluster sizes:
 2 3 4 5 

Validation Measures:
                                 2       3       4       5
                                                          
hierarchical Connectivity   2.9290  8.3730 17.8456 19.2246
             Dunn           0.4671  0.3200  0.2020  0.2020
             Silhouette     0.4815  0.2705  0.1957  0.1558

Optimal Scores:

             Score  Method       Clusters
Connectivity 2.9290 hierarchical 2       
Dunn         0.4671 hierarchical 2       
Silhouette   0.4815 hierarchical 2       
> optimalScores(inval)
                 Score       Method Clusters
Connectivity 2.9289683 hierarchical        2
Dunn         0.4670835 hierarchical        2
Silhouette   0.4814574 hierarchical        2
> plot(inval)

3.9 Metode Average Linkage

Kluster yang terbentuk kemudian dianalisis lebih lanjut dengan menggunakan cutree() untuk memisahkan data ke dalam dua kluster, dan hasilnya ditampilkan. Terakhir, rata-rata dari variabel-variabel dalam setiap kluster dihitung untuk memberikan pemahaman lebih lanjut mengenai karakteristik kluster yang terbentuk. Semua langkah ini bertujuan untuk mengelompokkan data berdasarkan kesamaan indikator dan memastikan bahwa kluster yang terbentuk valid dan bermakna.

> hirave <- hclust(dist(scale(data[,2:5])), method = "average")
> hirave

Call:
hclust(d = dist(scale(data[, 2:5])), method = "average")

Cluster method   : average 
Distance         : euclidean 
Number of objects: 34 
> plot(hirave, labels(data$PROVINSI), hang = 1, col = "blue", main = "Cluster Dendogram", sub = " ", xlab = "PROVINSI", ylab = "Jarak")

> 
> anggotaave <- data.frame(id = data$PROVINSI, cutree(hirave, k = 2))
> anggotaave
                     id cutree.hirave..k...2.
1                  ACEH                     1
2        SUMATERA UTARA                     1
3        SUMATERA BARAT                     1
4                  RIAU                     1
5                 JAMBI                     1
6      SUMATERA SELATAN                     1
7              BENGKULU                     1
8               LAMPUNG                     1
9  KEP. BANGKA BELITUNG                     1
10            KEP. RIAU                     1
11          DKI JAKARTA                     1
12           JAWA BARAT                     1
13          JAWA TENGAH                     1
14        DI YOGYAKARTA                     1
15           JAWA TIMUR                     1
16               BANTEN                     1
17                 BALI                     1
18  NUSA TENGGARA BARAT                     1
19  NUSA TENGGARA TIMUR                     1
20     KALIMANTAN BARAT                     1
21    KALIMANTAN TENGAH                     1
22   KALIMANTAN SELATAN                     1
23     KALIMANTAN TIMUR                     1
24     KALIMANTAN UTARA                     1
25       SULAWESI UTARA                     1
26      SULAWESI TENGAH                     1
27     SULAWESI SELATAN                     1
28    SULAWESI TENGGARA                     1
29            GORONTALO                     1
30       SULAWESI BARAT                     1
31               MALUKU                     1
32         MALUKU UTARA                     1
33          PAPUA BARAT                     1
34                PAPUA                     2
> 
> clus_hier <- eclust(datastand, FUNcluster = "hclust", k = 2, hc_method = "average", graph = TRUE)
> fviz_dend(clus_hier, rect = TRUE, cex = 0.5)

> 
> idclus = clus_hier$cluster
> idclus
 1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 
 1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1 
27 28 29 30 31 32 33 34 
 1  1  1  1  1  1  1  2 
> aggregate(data,list(idclus),mean)
  Group.1 PROVINSI ASI.EKSKLUSIF.... IMUNISASI.DASAR.... KEMATIAN.BAYI....
1       1       NA          66.24061            51.75333          19.17848
2       2       NA          74.56000            21.26000          38.17000
  PENANGANAN.STUNTING....
1                63.86121
2                41.70000

4 HASIL DAN PEMBAHASAN

4.1 Statistika Deskriptif

> library(readxl)
> statdes <- read_excel("C:/Users/USER/Downloads/statdes.xlsx")
> statdes <- data.frame(statdes)
> datatable(statdes)

Interpretasi: - Cakupan ASI eksklusif berkisar antara 52,98% (minimum) hingga 78,93% (maksimum), dengan rata-rata 66,57%. Sebagian besar provinsi memiliki cakupan ASI eksklusif di rentang 61,23% hingga 71,95%. Hal ini menunjukkan bahwa ada beberapa provinsi yang memiliki cakupan ASI eksklusif rendah, sementara sebagian besar provinsi menunjukkan angka yang cukup tinggi.

  • Cakupan imunisasi dasar berkisar antara 17,32% hingga 79,37%, dengan rata-rata 50,92%. Cakupan ini cukup bervariasi, dengan sebagian provinsi memiliki cakupan yang sangat rendah, sementara yang lain sudah mendekati target yang lebih tinggi. Cakupan imunisasi dasar yang rendah dapat menunjukkan adanya kesenjangan dalam akses atau kualitas pelayanan kesehatan di beberapa provinsi.

  • Tingkat kematian bayi berkisar antara 10,38% hingga 38,17%, dengan rata-rata 19,65%. Ada perbedaan yang signifikan antara provinsi dengan tingkat kematian bayi yang rendah dan yang tinggi, yang mungkin mencerminkan perbedaan dalam kualitas pelayanan kesehatan ibu dan anak antarprovinsi.

  • Penanganan stunting berkisar antara 41,70% hingga 79,94%, dengan rata-rata 63,29%. Sebagian besar provinsi menunjukkan tingkat penanganan stunting yang cukup baik, namun masih ada beberapa provinsi dengan penanganan stunting yang rendah.

4.2 Uji Asumsi

4.2.1 Uji Sampel Representatif (KM0)

> library(readxl)
> nilaikmo <- read_excel("C:/Users/USER/Downloads/nilai kmo.xlsx")
> nilaikmo <- data.frame(nilaikmo)
> datatable(nilaikmo)

Nilai KMO untuk masing-masing variabel tidak ada yang di bawah 0.5 sehingga sampel dapat digunakan untuk analisis cluster.

4.2.2 Uji Non-Multikolinieritas

> korelasi
                        ASI.EKSKLUSIF.... IMUNISASI.DASAR.... KEMATIAN.BAYI....
ASI.EKSKLUSIF....               1.0000000           0.1528724        -0.1979208
IMUNISASI.DASAR....             0.1528724           1.0000000        -0.3426307
KEMATIAN.BAYI....              -0.1979208          -0.3426307         1.0000000
PENANGANAN.STUNTING....         0.3665575           0.7151266        -0.5741382
                        PENANGANAN.STUNTING....
ASI.EKSKLUSIF....                     0.3665575
IMUNISASI.DASAR....                   0.7151266
KEMATIAN.BAYI....                    -0.5741382
PENANGANAN.STUNTING....               1.0000000

Nilai korelasi antar variabel berada di bawah 0.8, menunjukkan bahwa tidak terjadi multikolinieritas antar variabel.

4.2.3 Koefisien Korelasi Cophenetic

> KorCop
       cors    corave   corcomp    corcen   corward
1 0.7014684 0.7516365 0.6424352 0.7247428 0.5777283

Nilai korelasi yang paling mendekati 1 adalah dengan metode average linkage, sehingga analisis akan dilanjutkan dengan metode average linkage.

4.2.4 Indeks Validitas Cluster

> optimalScores(inval)
                 Score       Method Clusters
Connectivity 2.9289683 hierarchical        2
Dunn         0.4670835 hierarchical        2
Silhouette   0.4814574 hierarchical        2

Berdasarkan ketiga indeks, maka jumlah cluster yang optimal yaitu 2 cluster untuk mengelompokkan faktor kesehatan bayi dengan metode average linkage.

4.2.5 Cluster Dendogram

> clus_hier <- eclust(datastand, FUNcluster = "hclust", k = 2, hc_method = "average", graph = TRUE)
> fviz_dend(clus_hier, rect = TRUE, cex = 0.5)

Faktor kesehatan bayi dikelompokkan menjadi 2 cluster. Cluster pertama berwarna oranye berisi provinsi Papua, sementara cluster kedua berisi 32 provinsi lainnya.

4.2.6 Karakteristik Cluster

> aggregate(data,list(idclus),mean)
  Group.1 PROVINSI ASI.EKSKLUSIF.... IMUNISASI.DASAR.... KEMATIAN.BAYI....
1       1       NA          66.24061            51.75333          19.17848
2       2       NA          74.56000            21.26000          38.17000
  PENANGANAN.STUNTING....
1                63.86121
2                41.70000

Interpretasi: - Cluster 1: Tinggi dalam ASI Eksklusif dan Penanganan Stunting, dengan kondisi sedang untuk Imunisasi Dasar dan Kematian Bayi. (Kondisi Kesehatan Tinggi) - Cluster 2: Meskipun ASI Eksklusif tinggi, masalah besar pada Imunisasi Dasar, Kematian Bayi, dan Penanganan Stunting menunjukkan kondisi kesehatan yang lebih buruk secara keseluruhan. (Kondisi Kesehatan Buruk)

> library(readxl)
> cluster <- read_excel("C:/Users/USER/Downloads/cluster.xlsx")
> cluster <- data.frame(cluster)
> datatable(cluster)

5 KESIMPULAN

Berdasarkan analisis klaster, dapat disimpulkan bahwa sebagian besar provinsi di Indonesia menunjukkan kondisi kesehatan bayi yang baik, dengan indikator-indikator seperti ASI eksklusif, imunisasi dasar lengkap, angka kematian bayi yang rendah, dan penanganan stunting yang efektif. Namun, Provinsi Papua menjadi pengecualian, dengan kondisi kesehatan bayi yang lebih rendah dibandingkan provinsi lainnya. Hal ini menunjukkan adanya kesenjangan dalam pencapaian indikator kesehatan bayi antara Papua dan provinsi lainnya. Demi memperbaiki kondisi kesehatan bayi di Papua, disarankan agar pemerintah pusat dan daerah lebih fokus pada penguatan program-program kesehatan khususnya di bidang ASI eksklusif, imunisasi dasar, dan penanganan stunting. Pendekatan yang lebih intensif dan kontekstual perlu diterapkan di Papua, mengingat tantangan geografis dan sosial yang ada. Selain itu, peningkatan fasilitas kesehatan dan sumber daya manusia di daerah terpencil dapat membantu mengatasi kendala-kendala yang ada.

6 DAFTAR PUSTAKA

Bengkulu Utara. Jurnal Buana Informatika, 12(2), 146-155. Program Studi Teknik Informatika, Fakultas Teknik dan Informatika, Universitas AKI Semarang. https://ojs.uajy.ac.id/index.php/jbi/article/view/4861 Saputro, D. T., & Sucihermayanti, W. (2021). Penerapan klasterisasi menggunakan K-Means untuk menentukan tingkat kesehatan bayi dan balita di Kabupaten World Health Organization (WHO). (2023). Infant and Young Child Feeding. https://www.who.int/news-room/fact-sheets/detail/infant-and-young-child-feeding