Library:
> # install.packages("knitr")
> # install.packages("psych")
> # install.packages("GPArotation")
> # install.packages("ggplot2")
> # install.packages("cluster")
> # install.packages("factoextra")
> # install.packages("tidyverse")
> # install.packages("car")
> # install.packages("readxl")
> # install.packages("MVN")
> # install.packages("dendextend")
> # install.packages("DT")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")1 PENDAHULUAN
1.1 Latar Belakang
Masalah kesehatan balita merupakan salah satu masalah utama dalam bidang kesehatan yang saat ini terjadi di negara Indonesia. Derajat kesehatan balita mencerminkan derajat kesehatan bangsa, hal ini disebabkan karena balita sebagai generasi penerus bangsa yang memiliki kemampuan yang dapat dikembangkan dalam meneruskan pembangunan bangsa. Masa balita adalah masa pembentukan dan perkembangan manusia, usia ini merupakan usia yang rawan karena balita sangat peka terhadap gangguan pertumbuhan serta bahaya yang menyertainya. Masa balita disebut juga sebagai masa keemasan, dimana terbentuk dasar-dasar kemampuan keindraan, berfikir, berbicara serta pertumbuhan mental intelektual yang intensif dan awal pertumbuhan moral (Lely, 2017). Balita adalah anak dengan usia dibawah 5 tahun dengan karakteristik pertumbuhan yakni pertumbuhan cepat pada usia 0-1 tahun, dimana umur 5 tahun berat badan naik 2 kali lipat berat badan lahir dan 3 kali berat badan lahir pada umur 1 tahun dan menjadi 4 kali berat badan lahir pada umur 2 tahun (Sari, 2017)
Balita merupakan kelompok yang rentan terhadap kesehatan dan gizi. Status gizi (Nutriens) adalah ikatan kimia yang diperlukan tubuh untuk melakukan fungsinya yaitu menghasilkan energi, membangun dan memelihara jaringan serta mengatur proses-proses kehidupan (Gusruanti dkk., 2019). Sedangkan status gizi anak balita menurut Santoso dan Ranti (2004) menggambarkan keadaan tubuh anak tersebut yang erat hubungannya dengan konsumsi, penyerapan dan pemanfaatan zat gizi yang terkandung didalam makanan serta keadaan kesehatannya. Status gizi anak balita dapat digunakan sebagai indikator keadaan gizi masyarakat dan dapat diketahui melalui prevalensi gizi anak umur 1-5 tahun, karena golongan umur tersebut paling rentan terhadap gangguan gizi dan sangat tergantung terhadap makanan yang diberikan kepada mereka. Penilaian status gizi merupakan upaya untuk mencari kasus malnutrisi dalam masyarakat atau komunitas. Status gizi akan termasuk dalam kategori baik atau normal apabila setiap komponennya terpenuhi, seperti pemenuhan nutrisi seimbang, pola makan yang teratur, memilih jenis makanan yang tepat dan hasilnya adalah pertumbuhan dan perkembangan balita yang optimal. Yang termasuk dalam penilaian status gizi meliputi pertambahan berat badan sesuai usia, penambahan tinggi badan, lingkar lengan atas, aktivitas dan perkembangan organ-organ tubuh sesuai usianya (Sari, 2017). Status gizi balita dapat diketahui menurut tiga indikator, yaitu berat badan menurut usia (BB/U), tinggi badan menurut usia (TB/U), dan berat badan menurut tinggi badan (BB/ TB).
Gizi kurang atau malnutrisi pada balita membawa dampak negatif terhadap pertumbuhan fisik maupun mental, yang selanjutnya akan menghambat beberapa proses belajar yang dilakukan oleh balita seperti belajar berbicara, berjalan, makan dan lain-lain. Kecerdasan Intelektual (IQ) balita penderita malnutrisi cenderung lebih rendah dibandingkan balita yang sehat. Hal ini disebabkan karena kurang terpenuhinya gizi pada anak akan menghambat sintesis protein DNA sehingga menyebabkan terhambatnya pembentukan sel otak yang selanjutnya akan menghambat perkembangan otak (Dhuhita, 2015). Akibat lain yang disebabkan oleh malnutrisi adalah penurunan daya tahan tubuh. Kekurangan gizi juga dapat menyebabkan stunting pada balita. Stunting (tubuh pendek) merupakan suatu kondisi terlambatnya pertumbuhan anak yang ditandai dengan tinggi badan anak lebih pendek dibandingkan dengan tinggi badan anak-anak lain di usia yang sama (Welasasih dan Wirjatmadi, 2012). Saat ini Indonesia masih mengalami permasalahan kekurangan gizi yaitu gizi kurang buruk, pendek (stunting), dan kurus (wasting) yang masih tergolong tinggi bila dibandingkan dengan angka ambang batas menurut World Health Organization (WHO). Oleh karena itu, dibutuhkan berbagai informasi mengenai daerah-daerah yang masih terdapat balita dengan status gizi yang buruk, agar pemerintah dapat segera menindaklanjuti dan menyelediki penyebab kurangnya gizi balita yang terjadi di berbagai daerah di Indonesia. Selain itu, dapat meningkatkan mutu pelayanan kesehatan bagi balita sehingga mampu menekan angka kematian dan kesakitan balita, serta dapat meningkatkan status gizi balita.
1.2 Rumusan Masalah
Berdasarkan latar belakang masalah yang telah diuraikan, maka dapat dirumuskan permasalahan penelitian, yaitu:
Bagaimana mengelompokkan Kelurahan di Kabupaten Demak berdasarkan indikator status gizi balita?
Bagaimana mengetahui cluster mana yang memiliki status gizi balita yang lebih baik?
1.3 Tujuan Penelitian
Dalam melakukan penelitian ini, tujuan penelitian yang ingin dicapai yaitu:
Untuk mengetahui pengelompokan Kelurahan di Kabupaten Demak berdasarkan indikator status gizi balita.
Untuk mengetahui cluster mana yang memiliki status gizi balita yang lebih baik.
1.4 Batasan Masalah
Untuk menghindari kesalahpahaman dan meluasnya pokok bahasan, maka peneliti memberikan batasan masalah sebagai berikut.
Penelitian hanya difokuskan untuk menentukan status gizi pada anak usia kurang dari 5 tahun atau 0-59 bulan.
Data yang digunakan adalah dataset balita di setiap kelurahan pada Kabupaten Demak tahun 2019 yang didapatkan dari Satu Data Indonesia.
Indikator yang digunakan adalah berat badan menurut usia (BB/U), tinggi badan menurut usia (TB/U), dan berat badan menurut tinggi badan (BB/TB).
Analisis yang digunakan untuk mengelompokkan kelurahan di Kabupaten Demak pada tahun 2019 berdasarkan status gizi balita adalah analisis cluster hierarki dengan menggunakan metode Centroid Linkage
1.5 Data
Data pada kasus ini menggunakan data sekunder yang diperoleh dari Satu Data Indonesia mengenai banyaknya balita yang ditimbang dan status gizi anak balita di Kabupaten Demak pada tahun 2019. Data tersebut berisi jumlah balita yang dibagi berdasarkan tiga indikator, yaitu berat badan menurut usia (BB/U), tinggi badan menurut usia (TB/U), dan berat badan menurut tinggi badan (BB/TB). Adapun data tersebut tersaji dalam tabel berikut:
Indikator status gizi balita terdiri dari 3, yaitu:
\(X_{1}\) = balita kurang gizi (BB/U)
\(X_{2}\) = balita pendek (TB/U)
\(X_{3}\) = balita kurus (BB/TB)
1.6 Latar Belakang Metode
Berdasarkan kasus mengenai kekurangan gizi pada balita di Indonesia, khususnya di Kabupaten Demak, maka digunakanlah analisis cluster untuk mengelompokkan setiap kelurahan yang ada di Kabupaten Demak menjadi beberapa kelompok yang ditinjau berdasarkan status gizi balita. Metode analisis cluster yang digunakan dalam kasus ini adalah analisis cluster hierarki dengan menggunakan beberapa metode, yaitu terdiri dari Single Linkage, Complete Linkage, Average Linkage, Ward’s Method, dan Centroid Linkage. Dengan adanya metode ini, dapat mengetahui cluster mana yang masih terdapat balita dengan status gizi yang buruk dan dapat dijadikan sebagai acuan penting bagi Pemerintah, khususnya Pemerintah Daerah (Pemda) agar lebih terpacu untuk memperbaiki dan meningkatkan status gizi balita, khususnya di Kabupaten Demak.
2 TINJAUAN PUSTAKA
2.1 Statistika Deskriptif
Statistika deskriptif yaitu salah satu metode statistika yang berkaitan untuk pengumpulan dan penyajian sehingga dapat memberikan informasi yang berguna (Martias, 2021). Adapun pengertian statistika deskriptif menurut (Solikhah, 2016) yaitu statistika deskriptif yang lazim dikenal pula dengan istilah statistik deduktif, statistik sederhana, dan statistik deskriptif, adalah statistik yang tingkat pekerjaannya mencakup cara-cara menghimpun, menyusun, atau mengatur, mengolah, menyajikan, dan menganalisis data angka, agar dapat memberikan gambaran yang teratur, ringkas, dan jelas mengenai suatu gejala, peristiwa, atau keadaan sehingga dapat ditarik pengertian atau makna tertentu.
2.2 Analisis Cluster
Analisis cluster adalah suatu teknik statistik yang bertujuan untuk mengelompokkan obyek ke dalam suatu kelompok sedemikian sehingga obyek yang berada dalam satu kelompok akan memiliki kesamaan yang tinggi dibandingkan dengan obyek yang berada di kelompok lain (Silvi, 2018). Dengan kata lain tujuan dari analisis cluster adalah pengklasifikasian obyek-obyek berdasarkan similaritas diantaranya dan menghimpun data menjadi beberapa kelompok.
Secara umum analisis cluster terbagi menjadi 2 metode yaitu metode hierarki dan metode non-hierarki. Metode cluster hierarki merupakan metode pengelompokan yang jumlah clusternya belum diketahui. Teknik ini diproses dengan baik melalui penggabungan berurutan (agglomerative) atau pembagian berurutan (divisive). Pada metode non-hierarki, jumlah cluster ditentukan terlebih dahulu sesuai keinginan peneliti.
Tahap-tahap dalam analisis cluster yaitu sebagai berikut (Hamelia & Bagus, 2019):
- Melakukan Proses Standarisasi Data
Hal pertama yang harus dilakukan dalam analisis clustering adalah melakukan standarisasi data yaitu menggunakan z-score, dimana tujuan dilakukan standarisasi data adalah untuk mempersempit perbedaan satuan lebar serta dapat digunakan untuk menyamakan peubah yang memiliki satuan yang berbeda-beda.
- Menentukan Ukuran Kemiripan
Pada analisis cluster terdapat beberapa ukuran kemiripan diantaranya adalah ukuran asosiasi, ukuran korelasi dan ukuran jarak. Ukuran kemiripan dengan menghitung jarak antar dua objek. Dalam mengukur kedekatan antara dua objek dapat digunakan metode pengukuran Euclidean Distance.
- Memilih Prosedur Pengclusteran
Pembentukan cluster dapat dilakukan dengan dua cara, yaitu dengan metode Hierarki dan Non Hierarki.
- Menentukan Banyaknya Cluster
Masalah utama dalam analisis cluster adalah menetukan berapa banyaknya cluster. Namun demikian ada beberapa petunjuk yang bisa dipergunakan, yaitu:
Pertimbangan teoretis, konseptual, praktis, mungkin bisa diusulkan/disarankan untuk menetukan berapa banyaknya cluster yang sebenarnya
Besarnya relatif cluster seharusnya berguna/bermanfaat
- Menginterpretasikan Hasil Cluster
Tahap terakhir adalah interpretasi masing-masing cluster yang terbentuk. Saat memulai interpretasi digunakan rata-rata pada peubah.
2.2.1 Uji Asumsi Analisis Cluster
a. Uji Sampel Representatif
Sampel representatif adalah keadaan ketika sampel yang diambil dapat merepresentasikan atau mewakili populasi yang ada. Asumsi sampel representatif ini dapat dilakukan menggunakan uji Kaiser Meyer Olkin (KMO). Jika nilai uji KMO menunjukkan sebesar 0.5 sampai 1, maka sampel dikatakan telah representatif atau mewakili populasi.
b. Uji Non-Multikolinearitas
Menurut Gujarati (1995), apabila nilai mutlak koefisien korelasi antar variabel independent menunjukkan nilai lebih dari 0.8 maka dikatakan telah terjadi masalah multikolinearitas. Sebaliknya apabila koefisien korelasi menunjukkan nilai kurang dari 0.8 maka model tidak mengalami masalah multikolinearitas atau telah memenuhi asumsi non-multikolinearitas.
2.2.2 Standarisasi Variabel
Standarisasi variabel dilakukan apabila terdapat perbedaan satuan yang signifikan diantara variabel-variabel yang diteliti. Proses standarisasi dilakukan dengan mengenolkan rata-rata dan varian menjadi 1 (satu) atau dengan kata lain mengubah data Z-Score yaitu transformasi data dalam bentuk normal baku N(0,1), yang dapat dicari dengan: \[Z=\frac{X_i-\bar{x}}{\sigma}\]
Dengan:
\(X_i\) : data ke-\(i\)
\(\bar{x}\) : rata-rata data
\(\sigma\) : simpangan baku
2.2.3 Jarak Analisis Cluster
Konsep dasar pengukuran analisis cluster adalah pengukuran jarak (distance) dan kesamaan (similarity). Jarak merupakan ukuran jarak pisah antar objek sedangkan kesamaan merupakan ukuran kedekatan. Konsep ini penting karena pengelompokkan pada analisis cluster didasarkan pada kedekatan. Pengukuran jarak (distance type measure) digunakan untuk data bersifat kuantitatif, sedangkan pengukuran kesesuaian (matchingtype measure) digunakan untuk data yang bersifat kualitatif. Perhitungan jarak biasanya menggunakan jarak Euclidean yang digunakan pada 2 dimensi observasi.
a. Jarak Euclidean
Jarak Euclidean yaitu besarnya jarak suatu garis lurus yang menghubungkan antar objek. Jarak Euclidean (Euclidean distance) merupakan jarak yang paling umum dan paling sering digunakan dalam analisis cluster. Jarak Euclidean merupakan perhitungan jarak dari dua buah titik dalam euclidean space untuk mempelajari hubungan antara sudut dan jarak. Adapun rumus jarak euclidean yaitu: \[ d_{euc}(x,y) = \sqrt{\sum_{i=1}^{n} (x_i - y_i)^2} \]
Dengan :
\(d_{euc}(x,y)\) : kuadrat jarak euclidean antar obyek-\(y\) dan obyek-\(x\)
\(x_i\) : nilai dari obyek-\(x\) pada variabel ke-\(i\)
\(y_i\) : nilai dari obyek-\(y\) pada variabel ke-\(i\)
b. Jarak Mahalanobis
Jarak Mahalanobis digunakan jika data terjadi korelasi. Jarak Mahalanobis antara dua sampel X dan Y dari suatu variabel acak didefinisikan sebagai berikut: \[d_{Mahalanobis}(x,y)=\sqrt{(x-y)^T+S^{-1}(x-y)}\]
Dengan:
- \(S^{-1}\) : suatu matriks varians kovarians
2.2.4 Analisis Cluster Hierarki
Metode cluster hierarki merupakan metode pengelompokan yang mana jumlah kelompok yang akan dibuat belum diketahui. Teknik ini diproses dengan baik melalui penggabungan berurutan (agglomerative) atau pembagian berurutan (divissive).
a. Metode Agglomerative
Metode agglomerative dimulai dengan objek individual. Awalnya ada banyak cluster sebagai objek. Objek yang paling mirip dikelompokkan kemudian kelompok-kelompok awal ini digabungkan sesuai dengan kesamaannya. Ketika kesamaan menurun, semua sub kelompok digabungkan menjadi satu kelompok. Metode ini dibagi lagi menjadi beberapa macam yakni sebagai berikut.
- Single Linkage
Untuk menentukan jarak antar cluster dengan menggunakan single linkage¸ maka dipilih jarak yang paling dekat atau aturan tetangga dekat (nearest neighbour rule). Langkah-langkah menggunakan metode single linkage yaitu (Johnson & Wichern, 2007) :
Menentukan jarak minimum dalam \(D=d_{ij}\)
Menghitung jarak antara cluster yang telah dibentuk pada langkah a dengan objek lainnya
Dari algoritma diatas jarak-jarak antara \((ij)\) dan cluster K yang lainnya dapat dihitungan dengan rumus :
\[d_{{(ij)}k}=min(d_{ik},d_{jk})\]
- Complete Linkage
Metode complete linkage jarak antar cluster ditentukan oleh jarak terjauh atau maximum (farthest-neighbour) antara dua objek dalam cluster yang berbeda (Johnson & Wichern,2007). Adapun rumusnya yaitu:
\[d_{{(ij)}k}=max(d_{ik},d_{jk})\]
- Average Linkage
Metode average linkage akan mengelompokkan objek berdasarkan jarak antara dua cluster yang dianggap sebagai jarak rata-rata antara semua anggota dalam satu cluster dengan semua anggota cluster lain (Johnson & Wichern, 2007).Pada metode ini digunakan jarak rata-rata dari sampel pada suatu kelompok terhadap sampel pada kelompok yang lain. Perhitungan jarak antar kelompok adalah dengan menggunakan persamaan:
\[ d_{{(ij)}k}=\frac{1}{n_i\times n_j}\sum_{i=1}^{n_i}\sum_{j=1}^{n_j}\sqrt{\sum_{k=1}^p(x_{ik}-y_{jk})^2}\]
- Ward’s Method
Pada Ward’s Method jarak antara dua cluster yang terbentuk adalah sum of squares (Jumlah Kuadrat) di antara dua cluster tersebut. Diukur dengan menggunakan jumlah total dari deviasi kuadrat pada mean cluster untuk setiap pengamatan. Fungsi obyektif yang digunakan yaitu Error sum of squares (SSE). Dua obyek akan digabungkan jika mempunyai fungsi obyektif terkecil diantara kemungkinan yang ada (Fathia, Rahmawati, dan Tarno, 2016). \[ESS=\sum_{j=1}^{k}(\sum_{i=1}^{n_j}x_{ij}^2-\frac{1}{n_j}(\sum_{i=1}^{n_j}x_{ij}^2)) \]
Dengan:
\(x_{ij}\) : nilai untuk objek ke-\(i\) dengan \(i\)=1, 2, .., n pada kelompok ke-\(j\)
\(K\) : jumlah kelompok setiap stage
\(n_j\) : jumlah kelompok ke-\(i\) pada kelompok ke-\(j\)
- Centroid Linkage
Jarak yang digunakan dalam metode ini adalah jarak kuadrat Euclidean antara titik pusat dua kelompok. Dimana titik pusat kelompok ini adalah nilai tengah objek setiap peubah dalam satu kelompok. Dalam metode ini setiap kali terbentuk kelompok baru, maka titik pusatnya berubah. Kelebihan dari metode ini adalah kecilnya pengaruh pencilan dalam pembentukan kelompok. Jarak antara dua klaster didefinisikan sebagai berikut:
\[d_{ij} =d(\frac{1}{n_i}\sum_{k=1}^{n_i}x_{ik}, \frac{1}{n_j}\sum_{l=1}^{n_j} x_{jl})\]
atau
\[d_{(ij)}k=d(\bar{x_{ik}},\bar{x_{jk}})\]
b. Metode Divissive
Metode devisive bekerja dari arah yang berlawanan. Satu kelompok objek awal dibagi menjadi dua kelompok sehingga objek dalam satu subkelompok jauh dari objek yang lain. Sub kelompok ini kemudian dibagi lagi menjadi subkelompok yang berbeda. Proses tersebut terus berlanjut sampai ada banyak sub kelompok sebagai objek, yakni sampai masing-masing objek membentuk suatu kelompok.
2.2.5 Koefisien Korelasi Cophenetic
Setelah mendapatkan hasil dari proses cluster maka dilakukan uji validitas cluster yang diperlukan untuk melihat kebaikan hasil analisis cluster. Ukuran yang digunakan untuk menguji validitas hasil clustering pada penelitian ini adalah koefisien korelasi cophenetic. Koefisien korelasi cophenetic merupakan koefisien korelasi antara elemen-elemen asli matriks ketidakmiripan (matriks jarak squared euclidean) dan elemen-elemen yang dihasilkan oleh dendogram (matriks cophenetic) (Widodo dkk., 2018).
2.2.6 Dendogram
Dendogram merupakan representasi visual dari proses terbentuknya cluster berdasarkan nilai koefisien jarak pada setiap langkah hingga terbentuk cluster akhir yaitu satu objek satu cluster (Dzikrullah, 2022). Dendogram adalah representasi matematis dan visual dari prosedur pengklasteran yang dilakukan dengan menggunakan analisis cluster hierarki. Bentuk dendogram identik dengan diagram pohon. Titik-titik pada dendogram mewakili cluster, sedangkan panjang batangnya mempresentasikan jarak dimana objek-objek digabung dalam cluster. Dendogram sebagai representasi proses pengelompokan analisis cluster hierarki akan membentuk struktur yang berbeda tergantung pada jarak maupun lingkage yang akan digunakan pada proses pengklusteran. Dendogram dipotong untuk mengetahui banyaknya cluster yang terbentuk dari selisih terpanjang. Pemotongan dendogram dilakukan pada selisih jarak penggabungan terbesar ataupun pada gerombol yang dihasilkan lebih bermakna. Pemotongan dendogram dapat dilakukan pada selisih jarak penggabungan terbesar.
3 SOURCE CODE
3.1 Library yang Dibutuhkan
> library("knitr")
> library("psych")
> library("GPArotation")
> library("ggplot2")
> library("cluster")
> library("factoextra")
> library("tidyverse")
> library("car")
> library("readxl")
> library("MVN")
> library("dendextend")
> library("DT")
> library("rmarkdown")
> library("prettydoc")Sebelum melakukan analisis perlu mengaktifkan packages yang dibutuhkan terlebih dahulu untuk support proses analisis. Berikut adalah library yang akan digunakan untuk membantu dalam pemrograman ini agar lebih cepat dan efisien.
library(“knitr”) digunakan untuk membuat laporan dinamis menggunakan R Markdown.
library(“psych”) digunakan untuk analisis psikometri, statistik dan menyediakan banyak fungsi yang berguna untuk melakukan berbagai jenis analisis dan pemrosesan data terkait psikometri, seperti analisis faktor, analisis reliabilitas, uji validitas, dan berbagai jenis transformasi data.
library (“GPArotation”) digunakan untuk melakukan rotasi faktor dalam analisis faktor dengan berbagai metode rotasi yang tersedia.
library(“ggplot2”) digunakan untuk membuat visualisasi data yang berbasis grafik dengan tampilan yang menarik, fleksibel, informatif dan estetis dengan cara yang lebih sistematis dan deklaratif.
library(“cluster”) digunakan untuk melakukan berbagai jenis analisis klastering (pengelompokan) data.
library(“factoextra”) digunakan untuk visualisasi dan analisis hasil dari berbagai teknik analisis data multivariat, terutama dalam analisis faktor, analisis komponen utama, analisis klastering, dan analisis diskriminan serta dan menentukan jumlah cluster optimum.
library(“tidyverse”) digunakan untuk analisis data, pemrosesan data, visualisasi data, dan manipulasi data.
library(“car”) digunakan untuk menyediakan berbagai fungsi dan metode statistik yang berguna untuk analisis regresi dan analisis data lainnya. Library ini sangat berguna dalam konteks analisis regresi linear dan non-linear, analisis regresi logistik, analisis regresi Poisson, dan banyak metode statistik lainnya.
library(“readxl”) digunakan untuk membuka dan membaca file data yang bertype microsoft excel xlsx dari dalam R
library(“MVN”) digunakan untuk melakukan analisis multivariat normalitas dan uji asumsi MVN dalam analisis statistik, seperti analisis faktor, analisis komponen utama, regresi multivariat, dan sebagainya.
library(“dendextend”) digunakan untuk memperluas (extending) kemampuan pemrograman dalam manipulasi dan visualisasi dendrogram, memberikan beragam fungsi untuk mengubah, memodifikasi, dan meningkatkan visualisasi dendrogram.
library(“DT”) digunakan untuk membuat dan mengelola tabel interaktif menggunakan pustaka JavaScript DataTables.
library(“rmarkdown”) digunakan untuk membuat dokumen dinamis yang menggabungkan kode R, teks naratif, dan elemen-elemen lainnya dalam satu dokumen.
library(“prettydoc”) digunakan untuk menciptakan laporan yang lebih cantik dan responsif, serta menyediakan tema yang menarik untuk HTML output dari dokumen R Markdown.
3.2 Mengimport Data
> #Mengimport Data
> data <- read_excel("C:/Users/bayuj/OneDrive/Documents/SEMESTER 5/ANALISIS MULTIVARIAT/PRAKTIKUM/Data Laprak Anmul 1.xlsx")
> datatable(data,caption = "Status Gizi Balita")Untuk mengimport file data dari excel ke R dapat menggunakan fungsi read_excel dari library(readxl) yang kemudian disimpan dalam variabel Data, serta menggunakan fungsi datatable() untuk melihat gambaran data secara keseluruhan dalam bentuk tabel.
3.3 Statistika Deskriptif
> #Statistika Deskriptif
> statdesk <- summary(data)
> statdesk
Kelurahan Balita Gizi Kurang Balita Pendek Balita Kurus
Length:30 Min. : 4.0 Min. : 51.0 Min. : 20.0
Class :character 1st Qu.: 83.5 1st Qu.: 87.0 1st Qu.:138.8
Mode :character Median :157.5 Median :167.5 Median :180.0
Mean :224.5 Mean :234.9 Mean :205.8
3rd Qu.:242.0 3rd Qu.:304.8 3rd Qu.:207.5
Max. :741.0 Max. :932.0 Max. :480.0 Menghitung statistika deskriptif dengan fungsi summary() yang disimpan dalam variabel statdesk. Hasil dari perintah tersebut menunjukkan rangkuman ukuran pemusatan dan persebaran data pada masing-masing variabel.
3.4 Analisis Cluster
3.4.1 Uji Asumsi Analisis Cluster
a. Uji Sampel Representatif
> #Uji Asumsi
> ##Uji Sampel Representatif
> kmo <- KMO(data[,2:4])
> kmo
Kaiser-Meyer-Olkin factor adequacy
Call: KMO(r = data[, 2:4])
Overall MSA = 0.7
MSA for each item =
Balita Gizi Kurang Balita Pendek Balita Kurus
0.64 0.75 0.74 Melakukan uji sampel representatif dengan menggunakan fungsi KMO() dengan argumen didalamnya adalah data[,2:5] yang disimpan dalam variabel kmo. Argumen dalam data [,2:5] menunjukkan data yang dianalisis yaitu data pada kolom kedua sampai kelima.
b. Uji Non-Multikolinearitas
> ##Uji Non-Multikolinearitas
> korelasi <- cor(data[,2:4], method = 'pearson')
> korelasi
Balita Gizi Kurang Balita Pendek Balita Kurus
Balita Gizi Kurang 1.0000000 0.7694514 0.7752013
Balita Pendek 0.7694514 1.0000000 0.6299094
Balita Kurus 0.7752013 0.6299094 1.0000000Melakukan uji asumsi non-multikolinearitas menggunakan korelasi antar variabel dengan fungsi cor() dengan argumen didalamnya yaitu data dan metode yang digunakan adalah pearson yang disimpan dalam variabel korelasi.
3.4.2 Standarisasi
> #Standarisasi
> datastand <- scale(data[,2:4])
> datastand
Balita Gizi Kurang Balita Pendek Balita Kurus
[1,] -1.05694807 -0.78128741 -1.62035753
[2,] -0.05976695 -0.33063311 -0.05058167
[3,] -0.67821101 0.33615132 0.03662810
[4,] -0.15085561 -0.38121675 -0.74825983
[5,] -0.24673841 -0.23406433 -0.31221098
[6,] 1.91062460 1.95482801 -0.05930264
[7,] -0.64944617 0.54308442 -0.48663052
[8,] 1.25862156 2.35489867 1.25756488
[9,] 1.33532780 1.03972386 2.39129189
[10,] 2.39003860 -0.03172974 2.33024505
[11,] 2.47633312 3.20562364 2.17326747
[12,] 0.52991228 0.60286510 1.69361373
[13,] -0.34741535 -0.40880783 0.64709649
[14,] -0.32344465 -0.74909782 -0.61744517
[15,] -0.95147699 -0.73990079 -0.48663052
[16,] 0.13199865 -0.12829852 -0.13779144
[17,] -0.28988567 -0.27085243 0.12383787
[18,] 1.42641646 0.64885023 -0.05058167
[19,] -0.45768057 -0.84566660 -0.22500121
[20,] -0.16523803 -0.28924649 -0.31221098
[21,] -0.76450553 -0.75369633 -0.13779144
[22,] -0.12209077 -0.60194539 -0.74825983
[23,] -0.31865051 -0.79048444 -0.41686270
[24,] -0.54397509 -0.80427998 -0.92267937
[25,] -0.87477075 -0.25245838 -0.45174661
[26,] -0.41932745 -0.68012012 -0.18139632
[27,] -0.66862273 0.27637065 -0.74825983
[28,] -0.81244693 -0.58355134 -0.92267937
[29,] -0.71176999 -0.62493796 -0.79186471
[30,] -0.84600591 -0.68012012 -0.22500121
attr(,"scaled:center")
Balita Gizi Kurang Balita Pendek Balita Kurus
224.4667 234.9000 205.8000
attr(,"scaled:scale")
Balita Gizi Kurang Balita Pendek Balita Kurus
208.5880 217.4616 114.6661
> rownames(datastand) <- 1:nrow(datastand)
> hasildata<-mvn(data[,2:4], multivariateOutlierMethod = "adj", showNewData = TRUE)Melakukan standarisasi menggunakan fungsi scale() dengan argument yang berisi data awal dari kolom 2 hingga kolom 5 yang disimpan dalam variabel datastand. Kemudian mengatur nama baris (rownames) dari suatu data frame (datastand). Lalu melakukan analisis multivariat normal (Multivariate Normality Test) pada subset data yang disimpan pada variabel hasildata.
3.4.3 Menghitung Jarak
> #Menghitung Jarak Euclidean
> jarak <- dist(datastand, method = "euclidean")
> jarak
1 2 3 4 5 6 7
2 1.9135453
3 2.0341368 0.9136083
4 1.3197024 0.7054152 1.1869161
5 1.6331381 0.3357585 0.7956150 0.4700914
6 4.3277832 3.0175903 3.0547319 3.1908412 3.0837360
7 1.7903507 1.1407202 0.5634255 1.0823008 0.8924998 2.9545882
8 4.8456128 3.2651917 3.0524331 3.6737292 3.3812770 1.5229263 3.1568356
9 5.0132222 3.1284044 3.1770732 3.7529453 3.3814786 2.6783942 3.5310644
10 5.2963020 3.4291728 3.8483985 4.0069286 3.7384631 3.1442309 4.1837384
11 6.5399638 4.8869643 4.7697220 5.3200438 5.0422391 2.6208558 4.8923071
12 3.9263736 2.0643057 2.0679215 2.7193029 2.3080229 2.6090010 2.4795010
13 2.4048961 0.7586881 1.0183622 1.4094028 0.9802765 3.3443263 1.5108469
14 1.2429387 0.7523117 1.3158407 0.4268910 0.6035820 3.5515917 1.3390760
15 1.1393744 1.0736785 1.2273394 0.9154773 0.8848442 3.9542127 1.3180568
16 2.0094753 0.2920939 0.9500398 0.7187808 0.4301748 2.7402713 1.0877039
17 1.9725988 0.2948738 0.7258482 0.8899798 0.4397200 3.1351937 1.0790962
18 3.2675051 1.7799238 2.1295171 2.0088753 1.9098260 1.3928789 2.1238010
19 1.5199623 0.6738078 1.2303565 0.7639730 0.6528089 3.6713888 1.4261323
20 1.6578596 0.2851086 0.8808816 0.4458744 0.0984245 3.0674156 0.9785982
21 1.5113855 0.8265861 1.1070848 0.9423263 0.7540042 3.8077009 1.3478011
22 1.2909981 0.7511654 1.3436310 0.2225950 0.5839624 3.3382157 1.2874964
23 1.4119376 0.6423751 1.2665883 0.5527017 0.5707247 3.5544700 1.3757541
24 0.8662706 1.1042433 1.4962866 0.6032807 0.8866607 3.7925131 1.4200893
25 1.2955694 0.9117433 0.7896879 0.7928127 0.6436095 3.5755493 0.8275726
26 1.5771507 0.5182059 1.0711503 0.6948054 0.4958480 3.5194510 1.2815428
27 1.4247777 1.1072099 0.7872196 0.8369612 0.7928864 3.1534739 0.3741041
28 0.7652680 1.1794275 1.3357182 0.7134876 0.9026843 3.8215059 1.2190226
29 0.9110397 1.0301572 1.2693381 0.6131283 0.7740183 3.7508390 1.2088542
30 1.4148324 0.8779152 1.0627383 0.9199874 0.7521256 3.8169909 1.2662207
8 9 10 11 12 13 14
2
3
4
5
6
7
8
9 1.7380752
10 2.8507442 1.5047107
11 1.7450116 2.4577530 3.2423056
12 1.9469919 1.1516486 2.0659332 3.2852662
13 3.2542434 2.8234883 3.2355573 4.8339288 1.6995247
14 3.9564366 3.8734878 4.0701948 5.5916594 2.8101628 1.3097471
15 4.1838424 4.0839904 4.4274169 5.8644780 2.9582088 1.3265934 0.6415775
16 3.0630976 3.0345576 3.3465316 4.6852891 2.0117108 0.9615468 0.9071318
17 3.2523500 3.0822519 3.4795699 4.8926490 1.9747524 0.5441883 0.8828054
18 2.1563867 2.4746365 2.6570835 3.5475231 1.9616452 2.1798795 2.3103261
19 3.9226666 3.6897921 3.9116852 5.5473491 2.5989742 0.9816101 0.4258604
20 3.3886688 3.3655293 3.6848782 5.0368262 2.3027005 0.9837450 0.5741607
21 3.9627548 3.7445852 4.0698389 5.6142892 2.6210344 0.9533946 0.6516315
22 3.8304864 3.8309179 4.0141166 5.4575370 2.7998969 1.4265667 0.2816198
23 3.8967845 3.7377853 3.9318324 5.5217377 2.6675068 1.1307138 0.2048638
24 4.2406638 4.2325566 4.4482342 5.8980061 3.1588417 1.6307146 0.3805873
25 3.7777532 3.8258513 4.2950179 5.4844259 2.7031988 1.2288226 0.7603073
26 3.7546586 3.5574433 3.8237795 5.3877914 2.4622692 0.8747468 0.4517632
27 3.4724461 3.8020140 4.3505778 5.1967867 2.7396772 1.5873446 1.0898835
28 4.2044355 4.2697031 4.5980363 5.8956601 3.1708834 1.6465072 0.5997473
29 4.1184986 4.1345126 4.4407974 5.7990700 3.0375777 1.5000253 0.4434348
30 3.9797987 3.8158970 4.1739283 5.6470022 2.6870588 1.0405562 0.6571457
15 16 17 18 19 20 21
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16 1.2921554
17 1.0150769 0.5164861
18 2.7880361 1.5123105 1.9549855
19 0.5687453 0.9327079 0.6930044 2.4111873
20 0.9228668 0.3803631 0.4538876 1.8659687 0.6346113
21 0.3960270 1.0930884 0.7258458 2.6028603 0.3319723 0.7779829
22 0.8805470 0.8133723 0.9478038 2.1092935 0.6676976 0.5383130 0.8991089
23 0.6386671 0.8482073 0.7504678 2.2915289 0.2432802 0.5345342 0.5272768
24 0.6002842 1.2369076 1.2017923 2.5989584 0.7042119 0.8839530 0.8168485
25 0.4946725 1.0618701 0.8208084 2.5037478 0.7597853 0.7240582 0.6016359
26 0.6163804 0.7812611 0.5267097 2.2781671 0.1754366 0.4842067 0.3556160
27 1.0868597 1.0850914 1.0970184 2.2393492 1.2558916 0.8737606 1.2012090
28 0.4836456 1.3096876 1.2108052 2.7003476 0.8254201 0.9371053 0.8045475
29 0.4047763 1.1774583 1.0685851 2.5968978 0.6592547 0.8009080 0.6687089
30 0.2883536 1.1263239 0.7736010 2.6382736 0.4221400 0.7898308 0.1402188
22 23 24 25 26 27 28
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23 0.4289601
24 0.4993474 0.5539061
25 0.8812425 0.7745700 0.7973146
26 0.6448218 0.2788558 0.7618748 0.6807440
27 1.0344739 1.1706769 1.1017100 0.6403727 1.1394547
28 0.7122866 0.7365505 0.3475604 0.5790375 0.8446117 0.8891419
29 0.5917361 0.5679569 0.2782646 0.5300855 0.6791461 0.9033938 0.1701798
30 0.8966404 0.5719221 0.7703201 0.4849077 0.4289008 1.1045990 0.7051287
29
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30 0.5851483Menghitung jarak euclidean dengan fungsi dist() dengan argumen didalamnya yaitu datastand yang merupakan data hasil standarisasi dan metode euclidean yang disimpan dalam variabel jarak.
3.4.4 Koefisien Korelasi Cophenetic
> #Koefisien Korelasi Cophenetic
> ##Single Linkage
> hiers <- hclust(dist(data[,2:4]), method = "single")
> #korelasi cophenetic#
> d1 <- dist(data[,2:4])
> hc1 <- hclust(d1, "single")
> d2 <- cophenetic(hc1)
> cor.sing <- cor(d1,d2)
> cor.sing
[1] 0.8938216
> ##Average Linkage
> hierave <- hclust(dist(data[,2:4]), method = "ave")
> #korelasi cophenetic#
> d1 <- dist(data[,2:4])
> hc2 <- hclust(d1, "ave")
> d3 <- cophenetic(hc2)
> cor.ave <- cor(d1,d3)
> cor.ave
[1] 0.8820935
> ##Complete Linkage
> hiercomp <- hclust(dist(data[,2:4]), method = "complete")
> #korelasi cophenetic#
> d1 <- dist(data[,2:4])
> hc3 <- hclust(d1, "complete")
> d4 <- cophenetic(hc3)
> cor.comp <- cor(d1,d4)
> cor.comp
[1] 0.8745339
> ##Centorid Linkage
> hiercen <- hclust(dist(data[,2:4]), method = "centroid")
> #korelasi cophenetic#
> d1 <- dist(data[,2:4])
> hc4 <- hclust(d1, "centroid")
> d5 <- cophenetic(hc4)
> cor.centr <- cor(d1,d5)
> cor.centr
[1] 0.9063672
> ##Ward
> hierward <- hclust(dist(data[,2:4]), method = "ward.D")
> #korelasi cophenetic#
> d1 <- dist(data[,2:4])
> hc5 <- hclust(d1,"ward.D")
> d6 <- cophenetic(hc5)
> cor.ward <- cor(d1,d6)
> cor.ward
[1] 0.8567485
> #Menampilkan Hasil Koefisien Korelasi Cophenetic Dari Beberapa Metode
> KorCop<-data.frame(cor.sing,cor.ave,cor.comp,cor.centr,cor.ward)
> KorCop
cor.sing cor.ave cor.comp cor.centr cor.ward
1 0.8938216 0.8820935 0.8745339 0.9063672 0.8567485Menganalisis data dengan metode hierarki clustering dengan fungsi hclust() dengan argumen data pada fungsi dist() dan argumen single/average/complete/centroid/ward.D pada parameter method. Kemudian menghitung jarak antar observasi dengan fungsi dist() dengan argumen data yang disimpan dalam variabel d1.
Pada metode single Linkage, menjalankan fungsi hclust() dengan argumen “d1” dan “single” yang disimpan dalam variabel hc1. Pada metode Average Linkage, menjalankan fungsi hclust() dengan argumen “d1” dan “ave” yang disimpan dalam variabel hc2. Pada metode Complete Linkage, menjalankan fungsi hclust() dengan argumen “d1” dan “complete” yang disimpan dalam variabel hc3. Pada metode Centroid Linkage, menjalankan fungsi hclust() dengan argumen “d1” dan “centroid” yang disimpan dalam variabel hc4. Dan pada metode Ward’s Method, menjalankan fungsi hclust() dengan argumen “d1” dan “ward” yang disimpan dalam variabel hc5.
Menjalankan fungsi cophenetic() dengan argumen hc1/hc2/hc3/hc4/hc5 yang disimpan dalam variabel d2, lalu menghitung korelasi cophenetic dengan menggunakan fungsi cor() dengan argumen d1 dan d2 yang disimpan dalam variabel cor.sing untuk metode single Linkage, variabel cor.ave untuk metode Average Linkage, variabel cor.comp untuk metode Complete Linkage, variabel cor.centr untuk metode Centroid Linkage, dan variabel cor.ward untuk metode Ward’s Method. Kemudian menampilkan hasil korelasi cophenetic dengan membuat data.frame yang disimpan dalam variabel KorCop.
3.4.5 Analisis Cluster Metode Centroid Linkage
a. Membuat Dendogram
> ## Membuat Dendogram
> hc <- hclust(jarak,method="centroid")
> plot(hc, hang = -1, main = "Cluster Dendogram With Centroid Linkage Method", sub = " ", xlab = "Kelurahan", ylab = "Jarak")Melakukan clustering hierarki dengan fungsi hclust() dan argumen data jarak dan argumen centroid pada paramter method yang disimpan dalam variabel hc. Kemudian membuat dendogram menggunakan fungsi plot() dengan argumen didalamnya mengenai argumen hc, hang, judul, sub, xlab dan ylab.
b. Penentuan Jumlah Cluster
> ## Penentuan Jumlah Cluster
> plot(hc, hang = -1, main = "Cluster Dendogram With Centroid Linkage Method", sub = " ", xlab = "Kelurahan", ylab = "Jarak")
> cut_level<-2 #Menentukan jumlah cluster yaitu sebanyak 2
> clusters<-cutree(hc,k=cut_level) #Menggabungkan menjadi 2 Cluster
> print(clusters)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
1 1 1 1 1 2 1 2 2 2 2 2 1 1 1 1 1 2 1 1 1 1 1 1 1 1
27 28 29 30
1 1 1 1
> anggotaave <- data.frame(id = data$Kelurahan, cutree(hc, k = cut_level))
> anggotaave
id cutree.hc..k...cut_level.
1 Mranggen 1
2 Sumberejo 1
3 Tamansari 1
4 Karangawen 1
5 Wonosekar 1
6 Bumirejo 2
7 Guntur 1
8 Pamongan 2
9 Sukorejo 2
10 Sayung 2
11 Surodadi 2
12 Banjarsari 2
13 Karangsari 1
14 Krajanbogo 1
15 Gebangarum 1
16 Mulyorejo 1
17 Singorejo 1
18 Kadilangu 2
19 Wonosalam 1
20 Mojodemak 1
21 Kerangkulon 1
22 Dempet 1
23 Kebonagung 1
24 Gajah 1
25 Banjarsari 1
26 Karanganyar 1
27 Ngaluran 1
28 Mijen 1
29 Geneng 1
30 Wedung 1
> rect.hclust(hc,k=cut_level,border="red")Menentukan jumkah cluster yaitu sebanyak 2 yang disimpan dalam variabel cut_level. Memotong dendrogram yang telah dibuat sebelumnya menggunakan analisis hierarki aglomerasi dengan fungsi cutree() dengan argumen hc dan jumlah cluster yang diinginkan (k) yaitu sebanyak 2 yang telah disimpan pada variabel cut_level dan hasil dari fungsi cutree() disimpan dalam variabel clusters. Kemudian untuk menampilkan hasil clusters dengan fungsi print(). Menampilkan anggota pengelompokan dengan fungsi data.frame() yang disimpan dalam variabel anggotaave. Lalu menggambar persegi panjang (rectangles) berwarna merah di sekitar cluster pada dendrogram yang dihasilkan dari analisis clustering hierarki dengan mengggunakan fungsi rect.hclust().
3.4.6 Karakteristik Setiap Cluster
> ## Karakteristik Setiap Cluster
> library(cluster)
> clusters<-cutree(hc,k=cut_level)
> clusters
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
1 1 1 1 1 2 1 2 2 2 2 2 1 1 1 1 1 2 1 1 1 1 1 1 1 1
27 28 29 30
1 1 1 1
> result<-aggregate(datastand, list(clusters), mean)
> result
Group.1 Balita Gizi Kurang Balita Pendek Balita Kurus
1 1 -0.4924902 -0.4250026 -0.4233086
2 2 1.6181821 1.3964371 1.3908712Mengekstrak informasi tentang cluster yang dihasilkan dari analisis clustering hierarki yang telah dilakukan sebelumnya yang tersimpan pada variabel clusters. Kemudian menampilkan data rata-rata pada masing-masing cluster dengan menggunakan fungsi aggregate() yang disimpan pada variabel result.
4 HASIL DAN PEMBAHASAN
4.1 Statistika Deskriptif
> #Statistika Deskriptif
> statdesk <- summary(data)
> statdesk
Kelurahan Balita Gizi Kurang Balita Pendek Balita Kurus
Length:30 Min. : 4.0 Min. : 51.0 Min. : 20.0
Class :character 1st Qu.: 83.5 1st Qu.: 87.0 1st Qu.:138.8
Mode :character Median :157.5 Median :167.5 Median :180.0
Mean :224.5 Mean :234.9 Mean :205.8
3rd Qu.:242.0 3rd Qu.:304.8 3rd Qu.:207.5
Max. :741.0 Max. :932.0 Max. :480.0 Statistik deskriptif pada penelitian ini digunakan untuk memberikan gambaran umum dan menyajikan data Indikator status gizi balita pada 30 Kelurahan di Kabupaten Demak dengan indikator balita kurang gizi (\(X_1\)), balita pendek (\(X_2\)), dan balita kurus (\(X_3\)). Adapun informasi penting yang didapatkan, yaitu:
Kelurahan yang memiliki balita dengan gizi kurang dengan jumlah terendah adalah Mranggen yaitu sebanyak 4 balita. Sedangkan kelurahan yang memiliki balita dengan gizi kurang dengan jumlah tertinggi adalah Surodadi yaitu sebanyak 741 balita.
Kelurahan yang memiliki balita pendek dengan jumlah terendah adalah Wonosalam yaitu sebanyak 51 balita. Sedangkan kelurahan yang memiliki balita pendek dengan jumlah tertinggi adalah Surodadi yaitu sebanyak 932 balita.
Kelurahan yang memiliki balita kurus dengan jumlah terendah adalah Mranggen yaitu sebanyak 20 balita. Sedangkan kelurahan yang memiliki balita kurus dengan jumlah tertinggi adalah Sukorejo yaitu sebanyak 480 balita.
Rata-rata balita kurang gizi yang berada di 30 kelurahan di Kabupaten Demak adalah 224.5 atau 225 balita. Rata-rata balita kurang pendek yang berada di 30 kelurahan di Kabupaten Demak adalah 234.9 atau 235 balita. Rata-rata balita kurang kurus yang berada di 30 kelurahan di Kabupaten Demak adalah 205.8 atau 206 balita.
4.2 Analisis Cluster
4.2.1 Uji Asumsi Analisis Cluster
a. Uji Sampel Representatif
| Balita Gizi Kurang \((X_1)\) | Balita Pendek \((X_2)\) | Balita Kurus \((X_3)\) | |
|---|---|---|---|
| Nilai Uji KMO | 0.64 | 0.75 | 0.74 |
Berdasarkan output, dapat diketahui bahwa nilai uji KMO pada balita gizi kurang sebesar 0.64, nilai uji KMO pada balita pendek sebesar 0.75, dan nilai uji KMO pada balita kurus sebesar 0.74. Uji KMO pada masing masing variabel tersebut bernilai lebih dari 0.5 sehingga dapat disimpulkan bahwa sampel telah representatif atau mewakili populasi.
b. Uji Non-Multikolinearitas
| Nilai Korelasi | Balita Gizi Kurang \((X_1)\) | Balita Kurus \((X_2)\) | Balita Pendek \((X_3)\) |
|---|---|---|---|
| Balita Gizi Kurang | 1.0000000 | 0.7694514 | 0.7752013 |
| Balita Kurus | 0.7694514 | 1.0000000 | 0.6299094 |
| Balita Pendek | 0.7752013 | 0.6299094 | 1.0000000 |
Berdasarkan output, dapat diketahui bahwa nilai korelasi antar variabel kurang dari 0.8, sehingga dapat disimpulkan bahwa tidak terjadi multikolinearitas antar variabel.
4.2.2 Standarisasi
Tabel 4.3. Data Standarisasi
Setelah dilakukan uji asumsi dan mendapatkan hasil yang telah memenuhi asumsi maka dilanjutkan dengan standarisasi variabel ke bentuk Z-score. Hasil standarisasi digunakan dalam pengelompokan Kelurahan di Kabupaten Demak berdasarkan status gizi balita.
4.2.3 Menghitung Jarak
Setelah dilakukan standarisasi data, langkah selanjutnya yaitu menghitung jarak nilai tengah objek setiap peubah dalam satu kelompok dengan menggunakan jarak Euclidean. Adapun hasil dari perhitungan jarak Euclidean dapat dilihat pada subab 3.4.3.
4.2.4 Koefisien Korelasi Cophenetic
Koefisien korelasi cophenetic digunakan sebagai dasar dalam menentukan metode terbaik yang akan digunakan dalam analisis cluster. Metode dengan nilai korelasi mendekati 1 yang akan dipilih sebagai metode terbaik dalam penelitian ini. Berikut hasil koefisien korelasi cophenetic:
| Metode | Koefisien Korelasi |
|---|---|
| Single Linkage | 0.8938216 |
| Average Linkage | 0.8820935 |
| Complete Linkage | 0.8745339 |
| Centroid Linkage | 0.9063672 |
| Ward’s Method | 0.8567485 |
Dari hasil koefisein korelasi cophenetic terlihat bahwa metode Centroid Linkage memiliki nilai koefisien korelasi yang paling mendekati 1 dan tertinggi dibandingkan metode lain, yaitu sebesar 0.9063672. Oleh karena itu metode cluster yang terbaik yang akan digunakan adalah metode Centroid Linkage.
4.2.5 Analisis Cluster Metode Centroid Linkage
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
1 1 1 1 1 2 1 2 2 2 2 2 1 1 1 1 1 2 1 1 1 1 1 1 1 1
27 28 29 30
1 1 1 1
id cutree.hc..k...cut_level.
1 Mranggen 1
2 Sumberejo 1
3 Tamansari 1
4 Karangawen 1
5 Wonosekar 1
6 Bumirejo 2
7 Guntur 1
8 Pamongan 2
9 Sukorejo 2
10 Sayung 2
11 Surodadi 2
12 Banjarsari 2
13 Karangsari 1
14 Krajanbogo 1
15 Gebangarum 1
16 Mulyorejo 1
17 Singorejo 1
18 Kadilangu 2
19 Wonosalam 1
20 Mojodemak 1
21 Kerangkulon 1
22 Dempet 1
23 Kebonagung 1
24 Gajah 1
25 Banjarsari 1
26 Karanganyar 1
27 Ngaluran 1
28 Mijen 1
29 Geneng 1
30 Wedung 1
Dalam penentuan jumlah cluster dengan menggunakan analisis cluster metode Centroid Linkage yaitu dengan melihat pada dendogram yang telah terbentuk. Dapat dilihat struktur dan pola pada dendogram menunjukkan bahwa objek-objek dalam dataset berkelompok menjadi dua bagian. Selain itu, dengan melihat selisih terpanjang dari gambar dendogram diatas terlihat bahwa pemotongan yang tepat akan menghasilkan 2 cluster, dimana pada cluster 1 sebanyak 25 anggota dan cluster 2 sebanyak 2 anggota. Oleh karena itu jumlah cluster untuk mengelompokkan kelurahan pada Kabupaten Demak yaitu sebanyak dua.
Berdasarkan gambar dendogram tersebut, dapat diketahui bahwa hasil pengelompokan metode Centroid Linkage terhadap 30 Kelurahan pada Kabupaten Demak berdasarkan status gizi balita terbentuk 2 cluster. Garis horizontal menunjukkan Kelurahan yang dikelompokkan dan garis vertical menunjukkan jarak Euclidean antar Kelurahan. Cluster pertama pada dendogram berada pada kotak berwarna merah di sebelah kiri yang terdiri dari 23 Kelurahan, sedangkan cluster kedua pada dendogram berada pada kotak berwarna merah di sebelah kanan yang terdiri dari 7 Kelurahan.
Berdasarkan hasil analisis cluster penggunakan metode Centroid Linkage, diperoleh anggota tiap cluster sebagai berikut:
| Cluster | Kelurahan |
|---|---|
| 1 | Mranggen, Sumberejo, Tamansari, Karangawen, Wonosekar, Guntur, Karangsari, Krajanbogo, Gebangarum, Mulyorejo, Singorejo, Wonosalam, Mojodemak, Kerangkulon, Dempet, Kebonagung, Gajah, Banjarsari, Karanganyar, Ngaluran, Mijen, Geneng, dan Wedung. |
| 2 | Bumirejo, Pamongan, Sukorejo, Sayung, Surodadi, Banjarsari, dan Kadilangu. |
4.2.6 Karakteristik Setiap Cluster
Setelah menentukan jumlah cluster beserta anggota yang terbentuk, maka selanjutnya ialah memberikan ciri spesifik untuk menggambarkan isi cluster tersebut. Setiap cluster memiliki karakteristik yang berbeda berdasarkan status gizi balita pada masing-masing Kelurahan di Kabupaten Demak. Karakteristik status gizi balita dari setiap cluster dapat dilihat melalui nilai rata-rata masing masing variabel. Tinggi rendahnya nilai rata-rata setiap variabel pada masing-masing cluster dengan metode Centroid Linkage disajikan pada tabel berikut:
| Cluster | Balita Gizi Kurang \((X_1)\) | Balita Pendek \((X_2)\) | Balita Kurus \((X_3)\) |
|---|---|---|---|
| 1 | -0.4924902 | -0.4250026 | -0.4233086 |
| 2 | 1.6181821 | 1.3964371 | 1.3908712 |
Berdasarkan tabel dapat dilihat bahwa 23 Kelurahan di Kabupaten Demak yang berada pada cluster 1, dapat diketahui bahwa variabel balita gizi kurang, balita pendek, dan balita kurus memiliki karakteristik yang lebih rendah dibandingkan dengan cluster 1. Berdasarkan karakteristik tersebut, dapat diketahui bahwa cluster 1 merupakan kelompok Kelurahan dengan status gizi balita yang buruk.
Pada 7 Kelurahan di Kabupaten Demak yang berada pada cluster 2, dapat diketahui bahwa variabel balita gizi kurang, balita pendek, dan balita kurus memiliki karakteristik yang lebih tinggi dibandingkan dengan cluster 1. Berdasarkan karakteristik tersebut, dapat diketahui bahwa cluster 2 merupakan kelompok Kelurahan dengan status gizi balita yang baik.
5 Penutup
5.1 Kesimpulan
Berdasarkan kasus status gizi balita yang diambil dari 30 Kelurahan pada Kabupaten Demak, digunakan metode analisis cluster hierarki untuk mengelompokkan setiap kelurahan yang ada di Kabupaten Demak menjadi beberapa kelompok yang ditinjau berdasarkan status gizi balita dengan tiga indikator, yaitu berat badan menurut usia (BB/U), tinggi badan menurut usia (TB/U), dan berat badan menurut tinggi badan (BB/TB). Metode analisis cluster yang digunakan pada kasus ini yaitu Centroid Linkage, karena memiliki nilai koefisien cophenetic yang paling mendekati 1 dan tertinggi daripada metode lainnya. Hasil yang didapatkan dengan menggunakan analisis cluster metode Centroid Linkage yaitu terbentuk 2 cluster, dimana cluster 1 terdiri dari 23 Kelurahan dan cluster 2 terdiri dari 7 Kelurahan. Berdasarkan karakteristik setiap cluster, dapat ditentukan bahwa cluster 1 merupakan kelompok Kelurahan dengan status gizi balita yang buruk, sedangkan cluster 2 merupakan kelompok Kelurahan dengan status gizi balita yang baik. Sehingga dapat disimpulkan bahwa cluster yang memiliki status gizi balita yang lebih baik yaitu cluster 2 yang terdiri dari 7 Kelurahan.
5.2 Saran
Berdasarkan hasil penelitian yang dilakukan, peneliti mengajukan beberapa saran yang sekiranya dapat memberikan manfaat kepada pihak-pihak yang terkait atas hasil penelitian. Adapun saran-saran yang dapat diberikan adalah sebagai berikut :
- Bagi Peneliti Selanjutnya
Peneliti selanjutnya dapat mengembangkan penelitian ini dengan meneliti variabel lain terkait status gizi balita. Pada penelitian ini, peneliti hanya mengkaji metode cluster hierarki, yaitu metode Centroid Linkage dan diaplikasikan untuk data status gizi balita. Oleh karena itu, bagi peneliti selanjutnya yang juga ingin melakukan analisis cluster dapat menggunakan metode yang lainnya pada metode hierarki maupun non-hierarki mengingat metode untuk analisis cluster sangatlah beragam.
- Bagi Pemerintah
Masih terdapat beberapa daerah di Indonesia salah satunya di Kelurahan pada Kabupaten Demak yang memiliki status gizi balita yang buruk. Oleh karena itu, Pemerintah diharapkan dapat segera mengambil tindakan dengan meneliti dan mengeksplorasi lebih dalam untuk menemukan faktor-faktor yang menyebabkan status gizi balita yang buruk tersebut agar segera menemukan solusi yang tepat untuk menekan status gizi balita yang buruk sehingga balita-balita yang ada Indonesia dapat memiliki status gizi yang baik dan dapat menjadi generasi muda yang dapat membangun Indonesia menjadi lebih baik lagi.
6 DAFTAR PUSTAKA
Dzikrullah, A. A. (2022). Pengelompokan Provinsi Berdasarkan Kualitas Jaringan Internet Dengan Metode Centroid Linkage. Journal of Mathematics, Computations, and Statistics, 5(1), 48-57.
Fathia, A. N., Rahmawati, R., & Tarno. (2016). Analisis Klaster Kecamatan di Kabupaten Semarang Berdasarkan Potensi Desa Menggunakan Metode Ward dan Single Linkage. Jurnal Gaussian, 5(4), 801-810.
Gujarati, D. N. 1995. Ekonometrika Dasar. Jakarta: Erlangga.
Gusrianti, Azkha, N., & Bachtiar, H. (2019). Analisis Faktor yang Berhubungan dengan Status Gizi Balita di Kelurahan Limau Manis Selatan Wilayah Kerja Puskesmas Pauh Kota Padang. Jurnal Kesehatan Andalas, 8(4), 109-114.
Hair, J. F., dkk. (2006). Multivariate Data Analysis Sixth Edition. New Jersey: Pearson Education Inc.
Hemelia, & Sumargo, B. (2019). Pengklasifikasian Pengguna Internet Lingkungan Pedesaan Menurut Jenjang Pendidikan di Indonesia Menggunakan Metode Cluster Average Linkage. Jurnal Statistika dan Aplikasinya (JSA), 3(1), 22-29.
Martias, L. D.(2021).Statistika Deskriptif Sebagai Kumpulan Informasi. FIHRIS: Jurnal Ilmu Perpustakaan dan Informasi, 16(1), 40-59.
Nafisah, Q., & Chandra, N. E. (2017). Analisis Cluster Average Linkage Berdasarkan Faktor-Faktor Kemiskinan di Provinsi Jawa Timur. Zeta-Math Journal, 3(2), 31-36.
Nicolaus, Sulistianingsih, E., & Perdana, H. (2016). Penentuan jumlah cluster optimal pada median linkage dengan indeks validitas silhouette menggunakan himpunan variabel yang ditentukan untuk mengelompokkan objek. Buletin Ilmiah Math. Stat. Dan Terapannya (Bimaster), 05(2), 97–102.
Rosidah, L. K., & Harsiwi, S. (2017). Hubungan Status Gizi Dengan Perkembangan Balita Usia 1-3 Tahun (Di Posyandu Jaan Desa Jaan Kecamatan Gondang Kabupaten Nganjuk). Jurnal Kebidanan Dharma Husada Kediri, 6(2), 24-37.
Santoso S, Ranti AL. (2004). Kesehatan dan gizi. Jakarta: Rineka Cipta, hlm.22-4.
Sari, E. (2017). Status Gizi Balita di Posyandu Mawar Kelurahan Darmokali Surabaya. Jurnal Keperawatan, 6(1).
Satu Data Indonesia. (2019). Banyaknya Balita yang Ditimbang dan Status Gizi Anak Balita di Kabupaten Demak. Diakses pada 5 November 2023 di https://katalog.data.go.id/dataset/banyaknya-balita-yang-ditimbang-dan-status-gizi-anak-balita-di-kabupaten-demak
Sholikhah, A., (2016). Statistik deskriptif dalam penelitian kualitatif. KOMUNIKA: Jurnal Dakwah Dan Komunikasi, 10(2), 342-362.
Silvi, R. (2018). Analisis Cluster dengan Data Outlier Menggunakan Centroid Linkage dan K-Means Clustering untuk Pengelompokan Indikator HIV/AIDS di Indonesia. Jurnal Matematika “MANTIK”, 4(1), 22-31.
Supranto & Johanes. (2004). Analisis Multivariat Arti & Interpretasi. Jakarta: PT. Rineka Cipta.
Widodo, E., Sari, N. N., Hidayati, I., Yubinas, F., Yuniarti, M., & Novyantika, R. D. (2018). Analisis Cluster Penderita Disabilitas Mental di Provinsi Daerah Istimewa Yogyakarta Tahun 2016. Program Studi Pendidikan Matematika FKIP UMS, 577-586.
Welasasih, B.D., Wirjatmadi, R.B. (2012). Beberapa Faktor Yang Berhubungan Dengan Status Gizi Balita Stunting. The Indonesian Journal of Public Health, 8(3), 99-104.