> install.packages("knitr")
> install.packages("rmarkdown")
Error in contrib.url(repos, "source"): trying to use CRAN without setting a mirror
> install.packages("prettydoc")
Error in contrib.url(repos, "source"): trying to use CRAN without setting a mirror
> install.packages("equatiomatic")
Error in contrib.url(repos, "source"): trying to use CRAN without setting a mirror
1. Pendahuluan
1.1 Latar Belakang Kasus
Energi dan pangan adalah dua kebutuhan mendasar manusia yang saling terkait. Setiap aktivitas manusia, mulai dari makan hingga bekerja, membutuhkan energi sebagai penggeraknya. Indonesia dikenal sebagai negara agraris dengan sektor pertanian yang menjadi tulang punggung perekonomian nasional. Sektor pertanian tidak hanya memberikan kontribusi besar terhadap PDB (Produk Domestik Bruto) tetapi juga menjadi sumber utama mata pencaharian bagi jutaan penduduk, terutama di daerah pedesaan.
Padi sudah menjadi bahan makanan pokok sehari-hari yang kemudian diolah menjadi nasi, sedangkan jagung, kacang tanah, ubi kayu, ubi jalar, dan kedelai menjadi bahan pelengkap bagi tiap rumah tangga, maupun dapat menjadi bahan makanan utama pengganti nasi bagi beberapa wilayah. Namun, tantangan yang dihadapi adalah adanya perbedaan signifikan dalam tingkat produksi antarprovinsi, yang dipengaruhi oleh berbagai faktor seperti kondisi geografis, iklim, ketersediaan sumber daya alam, dan praktik pengelolaan pertanian yang beragam.
1.2 Latar Belakang Metode
Berdasarkan pada uraian latar belakang kasus, situasi tersebut membutuhkan pendekatan strategis untuk mengidentifikasi pola produksi dan potensi wilayah yang dapat menjadi dasar bagi perencanaan pembangunan pertanian yang lebih efektif.
Metode yang dapat digunakan untuk memahami variasi ini adalah analisis klaster, yang memungkinkan untuk mengelompokkan provinsi berdasarkan kesamaan karakteristik produksi bahan pangannya. Pengelompokkan ini membantu mengidentifikasi pola produksi yang serupa sehingga pemerintah dapat merancang program pengembangan pertanian sesuai dengan kebutuhan lokal.
1.3 Rumusan Masalah
Berdasarkan uraian dari latar belakang, dirumuskan masalah sebagai berikut :
1. Bagaimana pengelompokkan Provinsi di Indonesia berdasarkan produksi bahan pangan (padi, jagung, ubi jalar, ubi kayu, kedelai, dan kacang tanah)?
2. Provinsi manakah yang termasuk dalam tingkat produksi bahan pangan tinggi dan rendah?
1.4 Tujuan
Tujuan yang ingin diraih dalam penelitian ini yaitu :
1. Untuk mengetahui pengelompokkan Provinsi di Indonesia berdasarkan produksi bahan pangan (padi, jagung, ubi jalar, ubi kayu, kedelai, dan kacang tanah).
2. Untuk mengetahui provinsi mana yang termasuk dalam tingkat produksi bahan pangan tinggi dan rendah.
1.5 Sumber Data
Sumber data yang digunakan dalam analisis ini berasal dari Kementerian Pertanian Republik Indonesia, yang menyediakan data produksi bahan pangan untuk tahun 2022. Data tersebut mencakup enam komoditas utama, yaitu padi (X1), jagung (X2), kedelai (X3), kacang tanah (X4), ubi kayu (X5), dan ubi jalar (X6). Masing-masing variabel ini mencerminkan total produksi dalam satuan ton di 34 provinsi di Indonesia.
2. Tinjauan Pustaka
2.1 Statistik Deskriptif
Statistik deskriptif merupakan bagian dari ilmu statistika yang berfokus pada pengolahan, penyajian, dan penjelasan data untuk memberikan gambaran secara jelas mengenai karakteristik suatu fenomena tanpa melakukan generalisasi atau penarikan kesimpulan. Penyajian data dalam statistik deskriptif dapat berupa tabel, diagram, atau penghitungan nilai-nilai statistik seperti rata-rata (mean), median, modus, rentang, dan simpangan baku (Fitri et al., 2023).
2.2 Analisis Cluster Hierarki
Analisi cluster hierarki merupakan metode analisis cluster yang membentuk tingkatan tertentu seperti struktur pohon karena proses pengklasterannya dilakukan secara bertahap. Hasil dari analisis cluster hierarki dapat divisualisasikan dalam bentuk dendogram. Dendogram merupakan representasi visual dari langkah-langkah dalam analisis cluster yang menunjukkan bagaimana terbentuknya cluster dan nilai koefisien jarak pada tiap langkah (Simamora, 2005).
2.3 Metode Analisis Cluster Hierarki
Metode cluster hierarki merupakan metode pengelompokkan dimana jumlah k (cluster) masih belum diketahui di awal. Metode dalam analisis cluster hierarki adalah metode agglomerative dan metode divisive.
Metode Agglomerative
Metode ini menganggap bahwa pada awal, setiap objek merupakan suatu cluster. Kemudian objek yang paling mirip, akan digabungkan menjadi 1 cluster. Hal ini terus dilakukan hingga seluruh objek berada pada cluster yang sama. Agglomerative dibagi kembali menjadi beberapa metode :
Single Linkage
Pada single linkage, untuk menggabungkan 2 objek dipilih jarak yang paling dekat atau menggunakan nearest neighbour rule.
\[d_{(ij),k} = min(d_{ik} , d_{jk})\]
Average Linkage
Pada average linkage, pengelompokkan objek berdasarkan jaran antara dua cluster yang dianggap sebagai jarak rata-rata antara semua anggota dalam satu cluster dengan semua anggota cluster lain.
\[d_{(ij)k} = \frac{1}{n_i \times n_j} \sum_{i=1}^{n_i} \sum_{j=1}^{n_j} \sqrt{\sum_{k=1}^{p} (x_{ik} - y_{jk})^2}\]
Complete Linkage Pada complete linkage, untuk menggabungkan 2 objek dipilih jarak yang paling jauh atau disebut farthest-neighbour. \[d_{(ij)k} = \max(d_{ik}, d_{jk})\]
Centroid Linkage Pada centroid linkage, digunakan jarak kuadrat euclidean antara titik pusat 2 kelompok yang merupakan nilai tengah objek tiap peubah dalam 1 kelompok. Setiap terbentuk cluster baru, maka titik pusatnya akan berubah. \[ d_{ij} = d\left( \frac{1}{n_i} \sum_{k=1}^{n_i} x_{ik}, \frac{1}{n_j} \sum_{l=1}^{n_j} x_{jl} \right) \]
Ward’s Method Pada Ward’s Method, dilakukan dengan meminimalkan peningkatan jumlah kuadrat error agar varians internal cluster optimal. Dua objek akan digabung apabila memiliki jk error terkecil diantara kemungkinan yang ada. \[ \text{ESS} = \sum_{j=1}^{k} \sum_{i=1}^{n_j} x_{ij}^2 - \left( \frac{1}{n_j} \sum_{i=1}^{n_j} x_{ij} \right)^2 \]
2.4 Analisis Cluster Non Hierarki
Menurut Baroroh (2012), analisis cluster non hierarki merupakan metode yang menentukan jumlah cluster secara manual. Analisis cluster non hierarki (k-means) dimulai dengan memilih jumlah cluster (k) awal sesuai dengan jumlah yang diinginkan kemudian objek baru mulai digabungkan ke dalam cluster-cluster tersebut.
Langkah-langkah analisis cluster non hierarki sebagai berikut (Muhima dkk, 2022)
- Menentukan jumlah k cluster.
- Memilih acak k titik awal sebagai centroid untuk cluster awal.
- Menghitung jarak tiap titik data ke centroid.
- Menetaptkan setiap titik ke cluster dengan jarak terdekat ke centroid.
- Menghitung rata-rata tiap cluster untuk mendapat centroid baru.
- Lakukan langkah 3-5 hingga tidak terdapat perubahan yang signifikan pada anggota cluster.
2.5 Jarak Euclidean
Jarak euclidean merupakan jarak suatu garis lurus yang menghubungkan antar objek. Pengukuran jarak euclidean dilakukan dengan cara menghitung akar kuadrat dari penjumlahan kuadrat selisih dari dnilai masing-masing variabel. \[ d_{(x, y)} = \sqrt{\sum_{i=1}^n (x_i - y_i)^2} \] Keterangan:
\(d_{(x, y)}\) : kuadrat dari jarak euclidean antar objek \(y\) dan objek \(x\)
\(x_i\) : nilai dari objek \(x\) pada variabel ke-\(i\)
\(y_i\) : nilai dari objek \(y\) pada variabel ke-\(i\)
2.6 Indeks Validitas Cluster
Indeks Connectivity : Digunakan untuk mengujur kepadatan dan homogenitas cluster. cluster yang lebih padat ditunjukkan dengan indeks connectivity yang lebih rendah. Jumlah cluster optimal ditunjukkan pada indeks Connectivity terkecil
Indeks Dunn : Digunakan untuk menilai kejelasan pemisahan antar cluster. Jumlah cluster optimal ditunjukkan pada indeks Dunn paling besar, menandakan cluster terpisah dengan baik.
Koefisien Silhouette : Digunakan untuk mengukur kualitas cluster dengan melakukan evaluasi kemiripan objek dalam satu cluster dibandingkan dengan cluster lainnya. Jumlah cluster optimal ditunjukkan pada koefisien silhouette paling besar
3. Source Code
3.1 Library
> library(knitr)
> library(readxl)
> library(psych)
> library(GPArotation)
> library(clValid)
> library(ggplot2)
> library(cluster)
> library(factoextra)
> library(tidyverse)
> library(car)
Berikut merupakan library yang digunakan sebelum melakukan analisis :
library(knitr) digunakan untuk membuat laporan menggunakan R Markdown.
library(readxl) digunakan untuk membaca file Excel, pada analisis ini yaitu file data bahan pangan.
library(psych) digunakan untuk analisis statistik, seperti menghitung korelasi atau validasi data.
library(GPArotation) digunakan untuk rotasi faktor dalam analisis faktor.
library(clValid) digunakan untuk mengevaluasi dan melakukan validasi hasil clustering menggunakan metrik internal atau eksternal.
library(ggplot2) digunakan untuk visualisasi data yang lebih interaktif dan estetis.
library(cluster) digunakan untuk memfasilitasi algoritma clustering seperti k-means, hierarki, dan silhouette.
library(factoextra) digunakan untuk membantu visualisasi hasil analisis multivariat dan clustering.
library(tidyverse) digunakan untuk mengelola data secara efisien melalui fungsi yang terintegrasi.
library(car) digunakan untuk menyediakan berbagai fungsi untuk regresi dan analisis multivariat.
> datab<- read_excel("C:/Users/EDDRIN/Downloads/Data Bahan Pangan.xlsx")
> datab
# A tibble: 34 × 7
provinsi `padi (ton)` `jagung (ton)` `kedelai (ton)` `kacang tanah (ton)`
<chr> <dbl> <dbl> <dbl> <dbl>
1 Aceh 1509456. 296703. 1502. 2044.
2 Sumatera Ut… 2088584. 1768649 8026. 5875.
3 Sumatera Ba… 1373532. 770306 17.2 3078.
4 Riau 213557. 1018 495. 698.
5 Jambi 277744. 14173 4631. 3182.
6 Sumatera Se… 2775069. 1012791. 0 0
7 Bengkulu 281610. 97066 3.21 1433.
8 Lampung 2688160. 1952103 2110. 2383.
9 Kepulauan B… 61425. 2201. 4.53 245.
10 Kepulauan R… 507. 176. 0.32 38.0
# ℹ 24 more rows
# ℹ 2 more variables: `ubi kayu (ton)` <dbl>, `ubi jalar (ton)` <dbl>
> datab<-data.frame(datab)
> View(datab)
> rownames(datab) <- make.unique(as.character(datab$provinsi))
Melakukan import data file Excel yang ke R berisi data produksi bahan pangan dari 34 provinsi di Indonensia menggunakan fungsi read_excel yang disimpan dalam variabel datab.
Baris
rownames(datab)
digunakan untuk menetapkan nama provinsi sebagai nama baris (identifier) yang unik.Mengonversi data ke dalam format
data.frame
untuk mempermudah analisis dan menampilkan data menggunakanview(datab)
.
3.3 Statistika Deskriptif
> statdes <- summary(datab)
> statdes
provinsi padi..ton. jagung..ton. kedelai..ton.
Length:34 Min. : 507 Min. : 0 Min. : 0.00
Class :character 1st Qu.: 220024 1st Qu.: 23249 1st Qu.: 7.11
Mode :character Median : 416236 Median : 117932 Median : 1257.78
Mean :1598189 Mean : 706542 Mean : 7144.78
3rd Qu.:1495329 3rd Qu.: 895083 3rd Qu.: 5779.17
Max. :9526516 Max. :6699479 Max. :70759.07
kacang.tanah..ton. ubi.kayu..ton. ubi.jalar..ton.
Min. : 0.0 Min. : 0 Min. : 0
1st Qu.: 256.7 1st Qu.: 27661 1st Qu.: 2350
Median : 1924.5 Median : 53349 Median : 13695
Mean : 11083.8 Mean : 517184 Mean : 56741
3rd Qu.: 5139.0 3rd Qu.: 221865 3rd Qu.: 30501
Max. :119092.5 Max. :7372786 Max. :590206
summary()
: Digunakan untuk memberikan
ringkasan deskriptif (mean, median, min, max, dll.) untuk setiap kolom
data yang disimpan dalam variabel statdes.
3.4 Analisis Cluster Hierarki
3.4.1 Menghitung jarak Euclidean
> jarakk <- dist(datab[,2:7],method = "euclidean")
> jarakk
Aceh Sumatera Utara Sumatera Barat
Sumatera Utara 1842895.72
Sumatera Barat 519396.41 1485686.63
Riau 1330337.62 2726625.99 1398591.87
Jambi 1264239.34 2683333.14 1337461.45
Sumatera Selatan 1454204.85 1398001.92 1433261.70
Bengkulu 1244225.46 2629122.81 1290443.41
Lampung 7639459.11 6451895.30 7468589.19
Kepulauan Bangka Belitung 1479770.65 2825454.94 1526222.95
Kepulauan Riau 1537842.85 2893227.32 1582978.98
Daerah Khusus Ibukota Jakarta 1536096.84 2896958.43 1582617.85
Jawa Barat 8169577.59 7480577.61 8249886.84
Jawa Tengah 8985383.84 7734206.00 8904121.32
Daerah Istimewa Yogyakarta 1319341.40 2124353.92 1247696.10
Jawa Timur 10401280.68 8958334.09 10204168.49
Banten 385027.43 1962344.37 848757.15
Bali 876804.70 2335063.54 993203.43
Nusa Tenggara Barat 1628181.67 1125775.23 1165357.13
Nusa Tenggara Timur 1024518.44 1750960.21 776873.35
Kalimantan Barat 819308.78 2292033.81 938260.80
Kalimantan Tengah 1192493.41 2610389.71 1264946.37
Kalimantan Selatan 1169367.37 2516764.86 1183844.60
Kalimantan Timur 1290211.66 2665149.43 1337753.17
Kalimantan Utara 1507793.17 2865588.51 1554510.03
Sulawesi Utara 1263675.59 2605593.18 1282711.90
Sulawesi Tengah 783571.75 2309145.29 908553.83
Sulawesi Selatan 4066219.06 3334215.31 4071412.84
Sulawesi Tenggara 1054785.70 2457665.17 1120722.07
Gorontalo 1421562.57 2239421.94 1158683.58
Sulawesi Barat 1156072.40 2474772.79 1143423.88
Maluku 1438863.36 2803963.29 1481918.45
Maluku Utara 1512861.18 2858468.09 1554327.19
Papua Barat 1513191.76 2876050.46 1559618.53
Papua 1398510.98 2688687.88 1416586.54
Riau Jambi Sumatera Selatan
Sumatera Utara
Sumatera Barat
Riau
Jambi 77186.80
Sumatera Selatan 2754829.72 2690036.27
Bengkulu 123434.48 84205.68 2656552.19
Lampung 7959761.53 7963364.33 7432925.57
Kepulauan Bangka Belitung 154007.98 225316.42 2897020.82
Kepulauan Riau 218523.89 280329.28 2953610.45
Daerah Khusus Ibukota Jakarta 220618.02 280127.85 2951912.30
Jawa Barat 9457141.16 9395563.68 6907334.41
Jawa Tengah 10225548.97 10170706.56 7625951.47
Daerah Istimewa Yogyakarta 976112.35 977633.30 2504548.74
Jawa Timur 11590541.04 11534613.30 8992976.13
Banten 1575596.90 1511690.08 1387556.03
Bali 487976.66 434525.36 2303586.60
Nusa Tenggara Barat 2287605.72 2242242.00 1606096.96
Nusa Tenggara Timur 1020919.32 993802.48 2122955.42
Kalimantan Barat 537125.07 480177.73 2246070.13
Kalimantan Tengah 139173.24 81207.55 2615926.81
Kalimantan Selatan 244777.16 204864.34 2561795.90
Kalimantan Timur 78223.02 76876.00 2704446.15
Kalimantan Utara 186707.30 249847.94 2924277.27
Sulawesi Utara 166983.38 150049.93 2661911.69
Sulawesi Tengah 547157.86 481232.90 2214591.14
Sulawesi Selatan 5384567.57 5320950.24 2664786.19
Sulawesi Tenggara 292648.27 240629.52 2472118.83
Gorontalo 937999.94 924442.10 2536079.54
Sulawesi Barat 322647.99 285184.04 2528655.62
Maluku 144013.08 194250.23 2851265.24
Maluku Utara 190011.31 254591.39 2927972.45
Papua Barat 200158.15 258564.71 2928591.04
Papua 357610.42 357669.82 2794504.73
Bengkulu Lampung Kepulauan Bangka Belitung
Sumatera Utara
Sumatera Barat
Riau
Jambi
Sumatera Selatan
Bengkulu
Lampung 7946781.87
Kepulauan Bangka Belitung 247271.02 7986555.63
Kepulauan Riau 298433.09 8072798.19 94287.14
Daerah Khusus Ibukota Jakarta 297981.23 8085967.39 105207.95
Jawa Barat 9385099.92 9048410.76 9602993.46
Jawa Tengah 10138879.57 8303250.23 10355340.26
Daerah Istimewa Yogyakarta 960187.54 6989657.72 1020373.57
Jawa Timur 11484725.75 10092640.59 11709348.10
Banten 1508727.94 7597844.08 1727691.86
Bali 429066.80 7695753.50 630943.20
Nusa Tenggara Barat 2169933.02 7437857.75 2372897.40
Nusa Tenggara Timur 939638.13 7178317.37 1097996.67
Kalimantan Barat 470472.87 7692494.28 681676.80
Kalimantan Tengah 83371.71 7917874.46 288332.75
Kalimantan Selatan 126651.34 7899989.08 352453.85
Kalimantan Timur 54436.13 7943467.67 195088.98
Kalimantan Utara 268687.84 8051161.67 67565.84
Sulawesi Utara 70722.37 7932272.32 254175.38
Sulawesi Tengah 464176.10 7804699.27 696892.16
Sulawesi Selatan 5294073.21 7528451.82 5528693.08
Sulawesi Tenggara 220620.36 7796742.26 432357.35
Gorontalo 841336.52 7831901.50 955114.37
Sulawesi Barat 204308.48 7911348.92 415541.36
Maluku 199193.67 8045338.91 102422.95
Maluku Utara 272125.77 8031399.54 54903.86
Papua Barat 274874.95 8076695.92 94968.44
Papua 379571.39 7811054.70 374208.73
Kepulauan Riau Daerah Khusus Ibukota Jakarta
Sumatera Utara
Sumatera Barat
Riau
Jambi
Sumatera Selatan
Bengkulu
Lampung
Kepulauan Bangka Belitung
Kepulauan Riau
Daerah Khusus Ibukota Jakarta 15220.12
Jawa Barat 9673932.69 9674567.06
Jawa Tengah 10429414.28 10431809.15
Daerah Istimewa Yogyakarta 1110257.45 1121763.71
Jawa Timur 11769773.05 11770563.21
Banten 1789596.89 1788348.66
Bali 704892.30 706964.78
Nusa Tenggara Barat 2410367.76 2409602.01
Nusa Tenggara Timur 1171363.42 1177598.89
Kalimantan Barat 753201.09 754699.82
Kalimantan Tengah 349011.51 349246.41
Kalimantan Selatan 400835.57 400354.11
Kalimantan Timur 253185.38 254291.35
Kalimantan Utara 32482.13 39187.82
Sulawesi Utara 301087.93 301280.81
Sulawesi Tengah 755710.88 754549.96
Sulawesi Selatan 5591464.43 5590676.04
Sulawesi Tenggara 502904.23 504813.05
Gorontalo 966747.69 966394.84
Sulawesi Barat 453626.11 452061.06
Maluku 104107.45 101451.85
Maluku Utara 44639.40 56493.84
Papua Barat 29194.32 23335.61
Papua 432319.40 440189.10
Jawa Barat Jawa Tengah
Sumatera Utara
Sumatera Barat
Riau
Jambi
Sumatera Selatan
Bengkulu
Lampung
Kepulauan Bangka Belitung
Kepulauan Riau
Daerah Khusus Ibukota Jakarta
Jawa Barat
Jawa Tengah 3028930.66
Daerah Istimewa Yogyakarta 8992215.59 9609286.42
Jawa Timur 5724302.60 3190862.14
Banten 7910672.78 8825544.25
Bali 8972724.23 9750691.71
Nusa Tenggara Barat 8244318.77 8544807.97
Nusa Tenggara Timur 8804889.02 9368287.80
Kalimantan Barat 8922474.66 9700759.86
Kalimantan Tengah 9325803.18 10094449.20
Kalimantan Selatan 9314656.30 10043861.91
Kalimantan Timur 9425634.11 10178776.74
Kalimantan Utara 9642284.29 10398105.25
Sulawesi Utara 9405822.55 10139156.85
Sulawesi Tengah 8927444.68 9712655.05
Sulawesi Selatan 4364398.39 5136030.05
Sulawesi Tenggara 9176018.33 9933398.83
Gorontalo 9389732.65 9917004.40
Sulawesi Barat 9304769.59 10017321.50
Maluku 9581432.85 10334452.74
Maluku Utara 9643404.93 10395232.32
Papua Barat 9652472.75 10409303.77
Papua 9435922.93 10194487.03
Daerah Istimewa Yogyakarta Jawa Timur
Sumatera Utara
Sumatera Barat
Riau
Jambi
Sumatera Selatan
Bengkulu
Lampung
Kepulauan Bangka Belitung
Kepulauan Riau
Daerah Khusus Ibukota Jakarta
Jawa Barat
Jawa Tengah
Daerah Istimewa Yogyakarta
Jawa Timur 11048907.81
Banten 1515196.99 10340144.10
Bali 783239.58 11159247.37
Nusa Tenggara Barat 2057395.85 9529259.97
Nusa Tenggara Timur 571962.19 10689515.27
Kalimantan Barat 802370.53 11106336.47
Kalimantan Tengah 933143.31 11459702.69
Kalimantan Selatan 923397.16 11372010.52
Kalimantan Timur 956808.29 11528970.41
Kalimantan Utara 1084593.61 11741778.30
Sulawesi Utara 949089.38 11469675.90
Sulawesi Tengah 923093.21 11095023.66
Sulawesi Selatan 4996014.79 6758492.76
Sulawesi Tenggara 825849.85 11307831.06
Gorontalo 1169683.99 11062970.49
Sulawesi Barat 949693.20 11324617.79
Maluku 1067869.54 11671183.30
Maluku Utara 1067591.77 11739393.26
Papua Barat 1108843.07 11748076.08
Papua 890315.87 11569211.80
Banten Bali Nusa Tenggara Barat
Sumatera Utara
Sumatera Barat
Riau
Jambi
Sumatera Selatan
Bengkulu
Lampung
Kepulauan Bangka Belitung
Kepulauan Riau
Daerah Khusus Ibukota Jakarta
Jawa Barat
Jawa Tengah
Daerah Istimewa Yogyakarta
Jawa Timur
Banten
Bali 1113957.80
Nusa Tenggara Barat 1913577.45 2011606.63
Nusa Tenggara Timur 1322520.75 741327.36 1508552.80
Kalimantan Barat 1063048.00 60000.62 1968391.22
Kalimantan Tengah 1444878.94 362454.51 2178508.64
Kalimantan Selatan 1454821.85 393001.47 2044589.03
Kalimantan Timur 1549689.58 460548.72 2212340.41
Kalimantan Utara 1759156.27 672705.12 2389447.45
Sulawesi Utara 1540277.78 460221.06 2132049.62
Sulawesi Tengah 1048772.21 171941.97 1928379.51
Sulawesi Selatan 3890415.10 4912631.61 3936339.71
Sulawesi Tenggara 1312357.87 212737.83 2064269.07
Gorontalo 1790836.50 987512.45 1564165.42
Sulawesi Barat 1457800.16 432206.55 1973984.75
Maluku 1697736.61 617235.99 2318713.75
Maluku Utara 1764539.73 672972.03 2387657.30
Papua Barat 1766571.30 685379.68 2389614.68
Papua 1630872.20 579343.62 2313604.35
Nusa Tenggara Timur Kalimantan Barat
Sumatera Utara
Sumatera Barat
Riau
Jambi
Sumatera Selatan
Bengkulu
Lampung
Kepulauan Bangka Belitung
Kepulauan Riau
Daerah Khusus Ibukota Jakarta
Jawa Barat
Jawa Tengah
Daerah Istimewa Yogyakarta
Jawa Timur
Banten
Bali
Nusa Tenggara Barat
Nusa Tenggara Timur
Kalimantan Barat 725869.39
Kalimantan Tengah 929461.32 407146.92
Kalimantan Selatan 839984.62 424745.12
Kalimantan Timur 963646.52 505723.01
Kalimantan Utara 1144348.70 721217.38
Sulawesi Utara 909996.25 499141.10
Sulawesi Tengah 782320.03 136775.98
Sulawesi Selatan 4689406.60 4857412.95
Sulawesi Tenggara 792641.53 256164.65
Gorontalo 806902.05 986948.08
Sulawesi Barat 815058.63 454712.08
Maluku 1093759.40 662792.96
Maluku Utara 1133383.95 722023.78
Papua Barat 1158639.19 732727.29
Papua 985888.20 622128.71
Kalimantan Tengah Kalimantan Selatan
Sumatera Utara
Sumatera Barat
Riau
Jambi
Sumatera Selatan
Bengkulu
Lampung
Kepulauan Bangka Belitung
Kepulauan Riau
Daerah Khusus Ibukota Jakarta
Jawa Barat
Jawa Tengah
Daerah Istimewa Yogyakarta
Jawa Timur
Banten
Bali
Nusa Tenggara Barat
Nusa Tenggara Timur
Kalimantan Barat
Kalimantan Tengah
Kalimantan Selatan 158757.29
Kalimantan Timur 107553.25 169785.31
Kalimantan Utara 317783.22 373094.23
Sulawesi Utara 145157.73 101684.74
Sulawesi Tengah 409232.64 407796.90
Sulawesi Selatan 5246748.21 5204837.61
Sulawesi Tenggara 164591.56 192716.33
Gorontalo 895571.38 738716.85
Sulawesi Barat 242379.46 86554.78
Maluku 257096.28 299730.44
Maluku Utara 321772.26 374947.66
Papua Barat 326942.09 377417.03
Papua 390256.51 443022.14
Kalimantan Timur Kalimantan Utara Sulawesi Utara
Sumatera Utara
Sumatera Barat
Riau
Jambi
Sumatera Selatan
Bengkulu
Lampung
Kepulauan Bangka Belitung
Kepulauan Riau
Daerah Khusus Ibukota Jakarta
Jawa Barat
Jawa Tengah
Daerah Istimewa Yogyakarta
Jawa Timur
Banten
Bali
Nusa Tenggara Barat
Nusa Tenggara Timur
Kalimantan Barat
Kalimantan Tengah
Kalimantan Selatan
Kalimantan Timur
Kalimantan Utara 222207.40
Sulawesi Utara 89505.40 273502.80
Sulawesi Tengah 508492.81 725283.05 491970.09
Sulawesi Selatan 5339645.55 5561000.37 5303345.86
Sulawesi Tenggara 252916.41 470980.09 248504.66
Gorontalo 864337.88 956497.09 776793.29
Sulawesi Barat 245843.85 428911.52 164578.35
Maluku 159097.62 79950.64 202022.59
Maluku Utara 224159.63 26983.76 274250.91
Papua Barat 231643.15 28199.53 278620.77
Papua 363538.90 413499.54 392653.92
Sulawesi Tengah Sulawesi Selatan
Sumatera Utara
Sumatera Barat
Riau
Jambi
Sumatera Selatan
Bengkulu
Lampung
Kepulauan Bangka Belitung
Kepulauan Riau
Daerah Khusus Ibukota Jakarta
Jawa Barat
Jawa Tengah
Daerah Istimewa Yogyakarta
Jawa Timur
Banten
Bali
Nusa Tenggara Barat
Nusa Tenggara Timur
Kalimantan Barat
Kalimantan Tengah
Kalimantan Selatan
Kalimantan Timur
Kalimantan Utara
Sulawesi Utara
Sulawesi Tengah
Sulawesi Selatan 4841582.47
Sulawesi Tenggara 281448.45 5097520.17
Gorontalo 951991.18 5169125.52
Sulawesi Barat 422401.13 5177806.60
Maluku 658498.85 5491299.11
Maluku Utara 729981.39 5563649.71
Papua Barat 731786.99 5567507.46
Papua 668056.06 5399857.31
Sulawesi Tenggara Gorontalo Sulawesi Barat
Sumatera Utara
Sumatera Barat
Riau
Jambi
Sumatera Selatan
Bengkulu
Lampung
Kepulauan Bangka Belitung
Kepulauan Riau
Daerah Khusus Ibukota Jakarta
Jawa Barat
Jawa Tengah
Daerah Istimewa Yogyakarta
Jawa Timur
Banten
Bali
Nusa Tenggara Barat
Nusa Tenggara Timur
Kalimantan Barat
Kalimantan Tengah
Kalimantan Selatan
Kalimantan Timur
Kalimantan Utara
Sulawesi Utara
Sulawesi Tengah
Sulawesi Selatan
Sulawesi Tenggara
Gorontalo 873610.57
Sulawesi Barat 253462.86 661801.78
Maluku 411451.29 902507.55 353393.41
Maluku Utara 471015.40 952220.09 431341.02
Papua Barat 482609.49 952761.58 429794.45
Papua 440155.60 1000845.09 503489.69
Maluku Maluku Utara Papua Barat
Sumatera Utara
Sumatera Barat
Riau
Jambi
Sumatera Selatan
Bengkulu
Lampung
Kepulauan Bangka Belitung
Kepulauan Riau
Daerah Khusus Ibukota Jakarta
Jawa Barat
Jawa Tengah
Daerah Istimewa Yogyakarta
Jawa Timur
Banten
Bali
Nusa Tenggara Barat
Nusa Tenggara Timur
Kalimantan Barat
Kalimantan Tengah
Kalimantan Selatan
Kalimantan Timur
Kalimantan Utara
Sulawesi Utara
Sulawesi Tengah
Sulawesi Selatan
Sulawesi Tenggara
Gorontalo
Sulawesi Barat
Maluku
Maluku Utara 92300.02
Papua Barat 78235.92 50943.21
Papua 409675.49 395446.13 430945.61
dist()
: Digunakan untuk menghitung
matriks jarak antar provinsi berdasarkan produksi (dalam ton) enam
variabel bahan pangan menggunakan metode Euclidean yang disimpan dalam
variabel jarakk.
3.4.2 Koefisien Korelasi Cophenetic
> #Single Linkage
> hiers <- hclust(jarakk, method = "single")
> #korelasi cophenetic
> hc1 <- cor(jarakk, cophenetic(hiers))
> hc1
[1] 0.9242814
> #Average Linkage
> hierave <- hclust(jarakk, method = "ave")
> #korelasi cophenetic
> hc2 <- cor(jarakk, cophenetic(hierave))
> hc2
[1] 0.9844563
> #Complete Linkage
> hiercomp <- hclust(jarakk, method = "complete")
> #korelasi cophenetic
> hc3 <- cor(jarakk, cophenetic(hiercomp))
> hc3
[1] 0.9390626
> #Centorid Linkage
> hiercen <- hclust(jarakk, method = "centroid")
> #korelasi cophenetic
> hc4 <- cor(jarakk, cophenetic(hiercen))
> hc4
[1] 0.9466738
> #Ward
> hierward <- hclust(jarakk, method = "ward.D")
> #korelasi cophenetic
> hc5 <- cor(jarakk, cophenetic(hierward))
> hc5
[1] 0.9193628
Metode analisis cluster hierarki dilakukan menggunakan fungsi hclust() dengan metode linkage tertentu (single, average, complete, centroid, ward) yang disimpan dalam variabel jarakk.
Single linkage: Mengelompokkan objek berdasarkan jarak antar dua titik terdekat dari kelompok yang berbeda dan disimpan dalam variabel hiers.
Average linkage: Mengelompokkan objek berdasarkan rata-rata jarak antara setiap pasangan objek dan disimpan dalam variabel hierave.
Complete linkage: Mengelompokkan objek berdasarkan jarak terjauh antar anggota kelompok dan disimpan dalam variabel hiercomp.
Centroid linkage: Mengelompokkan objek berdasarkan pusat massa kelompok sebagai patokan dan disimpan dalam variabel hiercen.
Ward’s Method: Mengelompokkan objek dengan meminimalkan total varian dalam klaster dan disimpan dalam variabel hierward.
Cophenetic() : Digunakan untuk menghasilkan matriks jarak cophenetic dari hasil clustering. Jarak cophenetic adalah jarak di mana dua objek digabungkan dalam dendrogram.
Cor() : Mengukur kesesuaian antara matriks jarak awal dan matriks cophenetic (semakin tinggi korelasinya, semakin baik clustering-nya).
Korelasi cophenetic disimpan dalam variabel hc1, hc2, hc3, dan hc5.
3.4.3 Perbandingan Koefisien Korelasi Cophenetic
> perbandingan<-data.frame(hc1, hc2, hc3, hc4, hc5)
> perbandingan
hc1 hc2 hc3 hc4 hc5
1 0.9242814 0.9844563 0.9390626 0.9466738 0.9193628
Korelasi dari berbagai metode linkage dibandingkan untuk menentukan metode terbaik. Metode dengan nilai korelasi tertinggi dipilih karena memberikan representasi paling baik dari struktur data.
3.4.4 Indeks Validitas
> inval <- clValid(as.matrix(jarakk)[,2:7], 2:7, clMethods = "hierarchical", validation = "internal", metric = "euclidean", method = "average")
> summary(inval)
Clustering Methods:
hierarchical
Cluster sizes:
2 3 4 5 6 7
Validation Measures:
2 3 4 5 6 7
hierarchical Connectivity 4.5825 7.3115 10.3115 15.2929 17.6262 22.0865
Dunn 0.8404 0.8404 0.5923 0.3540 0.4753 0.4276
Silhouette 0.8600 0.7390 0.6994 0.6172 0.6108 0.5525
Optimal Scores:
Score Method Clusters
Connectivity 4.5825 hierarchical 2
Dunn 0.8404 hierarchical 2
Silhouette 0.8600 hierarchical 2
clValid()
: Mengukur indeks validitas cluster untuk menilai seberapa baik klaster yang dihasilkan.
as.matrix(jarakk)[,2:7]
: Memastikan data dalam format matriks dan hanya menggunakan kolom 2 sampai 7 (variabel bahan pangan).2:7
: Jumlah klaster yang akan dievaluasi (dari 2 hingga 7 klaster).clMethods = "hierarchical"
: Menggunakan metode hierarchical clustering.validation = "internal"
: Menilai validitas berdasarkan indeks internal, seperti Silhouette, Dunn Index, atau Connectivity.metric = "euclidean"
: Jarak Euclidean digunakan sebagai metrik jarak.method = "average"
: Average linkage digunakan untuk membangun dendrogram.summary(inval)
: Menampilkan ringkasan hasil validasi, termasuk nilai indeks validitas untuk setiap metode clustering.
3.4.5 Analisis Cluster Hierarki menggunakan Average Linkage
> hirave <- hclust(jarakk, method = "average")
> hirave
Call:
hclust(d = jarakk, method = "average")
Cluster method : average
Distance : euclidean
Number of objects: 34
Melakukan analisis cluster hierarki menggunakan metode average linkage yang kemudian disimpan dalam variabel hirave.
3.4.6 Cluster Dendogram untuk k=2
> plot(hirave, labels=datab[,1], hang = 1, col = "blue", main = "Cluster Dendogram", sub = " ", xlab = "Provinsi", ylab = "Jarak")
> rect.hclust(hirave, k = 2, border = "red")
> clus_hier <- eclust(datab, FUNcluster = "hclust", k = 2, hc_method = "average", graph = TRUE)
> fviz_dend(clus_hier, rect = TRUE, cex = 0.5, main = "Cluster Dendogram", label_cols = "black", show_labels = TRUE, xlab = "Provinsi", ylab = "Jarak")
plot()
: Membuat dendrogram dari hasil
clustering average linkage.
labels = datab[,1]
: Memberi label setiap objek dengan nama provinsi.hang = 1
: Menyesuaikan panjang cabang yang menggantung.col = "blue"
: Warna garis dendrogram biru.rect.hclust()
: Menambahkan batas klaster pada dendrogram untuk membedakan klaster.k = 2
: Menentukan jumlah klaster yang ingin ditampilkan.
eclust()
: Fungsi untuk clustering
sekaligus visualisasi.
FUNcluster = "hclust"
: Menggunakan hierarchical clustering.k = 2
: Membagi data menjadi 2 klaster.hc_method = "average"
: Average linkage digunakan untuk mengelompokkan data.graph = TRUE
: Secara otomatis menghasilkan plot dendrogram.
fviz_dend()
: Membuat dendrogram yang
lebih estetis.
rect = TRUE
: Menambahkan kotak klaster pada dendrogram.cex = 0.5
: Mengatur ukuran teks label.label_cols = "black"
: Warna label hitam.main
,xlab
,ylab
: Memberi judul dan label pada dendrogram.
3.4.7 Anggota Cluster
> anggotaave <- data.frame(id = datab$provinsi, cutree(hirave, k = 2))
> anggotaave
id
Aceh Aceh
Sumatera Utara Sumatera Utara
Sumatera Barat Sumatera Barat
Riau Riau
Jambi Jambi
Sumatera Selatan Sumatera Selatan
Bengkulu Bengkulu
Lampung Lampung
Kepulauan Bangka Belitung Kepulauan Bangka Belitung
Kepulauan Riau Kepulauan Riau
Daerah Khusus Ibukota Jakarta Daerah Khusus Ibukota Jakarta
Jawa Barat Jawa Barat
Jawa Tengah Jawa Tengah
Daerah Istimewa Yogyakarta Daerah Istimewa Yogyakarta
Jawa Timur Jawa Timur
Banten Banten
Bali Bali
Nusa Tenggara Barat Nusa Tenggara Barat
Nusa Tenggara Timur Nusa Tenggara Timur
Kalimantan Barat Kalimantan Barat
Kalimantan Tengah Kalimantan Tengah
Kalimantan Selatan Kalimantan Selatan
Kalimantan Timur Kalimantan Timur
Kalimantan Utara Kalimantan Utara
Sulawesi Utara Sulawesi Utara
Sulawesi Tengah Sulawesi Tengah
Sulawesi Selatan Sulawesi Selatan
Sulawesi Tenggara Sulawesi Tenggara
Gorontalo Gorontalo
Sulawesi Barat Sulawesi Barat
Maluku Maluku
Maluku Utara Maluku Utara
Papua Barat Papua Barat
Papua Papua
cutree.hirave..k...2.
Aceh 1
Sumatera Utara 1
Sumatera Barat 1
Riau 1
Jambi 1
Sumatera Selatan 1
Bengkulu 1
Lampung 1
Kepulauan Bangka Belitung 1
Kepulauan Riau 1
Daerah Khusus Ibukota Jakarta 1
Jawa Barat 2
Jawa Tengah 2
Daerah Istimewa Yogyakarta 1
Jawa Timur 2
Banten 1
Bali 1
Nusa Tenggara Barat 1
Nusa Tenggara Timur 1
Kalimantan Barat 1
Kalimantan Tengah 1
Kalimantan Selatan 1
Kalimantan Timur 1
Kalimantan Utara 1
Sulawesi Utara 1
Sulawesi Tengah 1
Sulawesi Selatan 1
Sulawesi Tenggara 1
Gorontalo 1
Sulawesi Barat 1
Maluku 1
Maluku Utara 1
Papua Barat 1
Papua 1
cutree(hirave, k = 2)
: Mengelompokkan data menjadi 2 klaster berdasarkan dendrogram.data.frame()
: Menyimpan hasil pengelompokan (anggota klaster) dalam format tabel yang disimpan dalam variabel anggotaave
3.4.8 Karakteristik Cluster
> idclus = clus_hier$cluster
> idclus
Aceh Sumatera Utara
1 1
Sumatera Barat Riau
1 1
Jambi Sumatera Selatan
1 1
Bengkulu Lampung
1 1
Kepulauan Bangka Belitung Kepulauan Riau
1 1
Daerah Khusus Ibukota Jakarta Jawa Barat
1 2
Jawa Tengah Daerah Istimewa Yogyakarta
2 1
Jawa Timur Banten
2 1
Bali Nusa Tenggara Barat
1 1
Nusa Tenggara Timur Kalimantan Barat
1 1
Kalimantan Tengah Kalimantan Selatan
1 1
Kalimantan Timur Kalimantan Utara
1 1
Sulawesi Utara Sulawesi Tengah
1 1
Sulawesi Selatan Sulawesi Tenggara
1 1
Gorontalo Sulawesi Barat
1 1
Maluku Maluku Utara
1 1
Papua Barat Papua
1 1
> aggregate(datab,list(idclus),mean)
Group.1 provinsi padi..ton. jagung..ton. kedelai..ton. kacang.tanah..ton.
1 1 NA 837629.5 407503.7 2390.972 4992.538
2 2 NA 9457298.4 3796599.8 56267.417 74026.520
ubi.kayu..ton. ubi.jalar..ton.
1 375706.2 27632.75
2 1979118.8 357525.08
idclus = clus_hier$cluster
: Menyimpan informasi klaster setiap objek masuk ke cluster mana yang disimpan dalam variabel idclus.aggregate()
: Menghitung rata-rata nilai setiap variabel untuk masing-masing klaster.- Output ini menunjukkan karakteristik unik dari setiap klaster berdasarkan nilai rata-rata variabel.
3.5 Analisis Cluster Non Hierarki
3.5.1 Menentukan Jumlah C;uster Optimal
fviz_nbclust()
: Memvisualisasikan jumlah klaster optimal.kmeans
: Melakukan analisis cluster non hierarki menggunakan metode k-means clustering.method = "silhouette"
: Menggunakan indeks Silhouette untuk menentukan jumlah klaster optimal.
labs(title = "Silhouette Method")
: Menambahkan judul ke plot.
3.5.2 K-Means Clustering
> km2 <- kmeans(datab[,2:7], centers = 3, nstart = 50)
> km2
K-means clustering with 3 clusters of sizes 1, 4, 29
Cluster means:
padi..ton. jagung..ton. kedelai..ton. kacang.tanah..ton. ubi.kayu..ton.
1 2688159.7 1952103 2109.760 2382.73 7372785.9
2 8433016.1 3237054 43196.412 58746.20 1570713.9
3 617868.5 314555 2345.757 4809.68 135469.3
ubi.jalar..ton.
1 23264.11
2 276372.16
3 27601.30
Clustering vector:
Aceh Sumatera Utara
3 3
Sumatera Barat Riau
3 3
Jambi Sumatera Selatan
3 3
Bengkulu Lampung
3 1
Kepulauan Bangka Belitung Kepulauan Riau
3 3
Daerah Khusus Ibukota Jakarta Jawa Barat
3 2
Jawa Tengah Daerah Istimewa Yogyakarta
2 3
Jawa Timur Banten
2 3
Bali Nusa Tenggara Barat
3 3
Nusa Tenggara Timur Kalimantan Barat
3 3
Kalimantan Tengah Kalimantan Selatan
3 3
Kalimantan Timur Kalimantan Utara
3 3
Sulawesi Utara Sulawesi Tengah
3 3
Sulawesi Selatan Sulawesi Tenggara
2 3
Gorontalo Sulawesi Barat
3 3
Maluku Maluku Utara
3 3
Papua Barat Papua
3 3
Within cluster sum of squares by cluster:
[1] 0.000000e+00 3.580692e+13 2.311399e+13
(between_SS / total_SS = 83.7 %)
Available components:
[1] "cluster" "centers" "totss" "withinss" "tot.withinss"
[6] "betweenss" "size" "iter" "ifault"
kmeans()
: Melakukan analisis clusternon
hierarki menggunakan metode k-means clustering yang kemudian hasilnya
disimpan dalam variabel km2.
centers = 3
: Menentukan 3 klaster, hasil dari jumlah cluster optimal dari indeks Silhouette.nstart = 50
: Algoritma dijalankan 50 kali untuk menghindari hasil suboptimal.
3.5.3 Visualisasi K-Means Clustering untuk k=3
> p2 <- fviz_cluster(km2, data = datab[,2:7],
+ palette = c("#5B99C2", "#FF0000", "#FFFF00"),
+ main = "KMeans Clustering - 2 Cluster",
+ geom = "point") + # Menggunakan geom = "point" untuk titik
+ geom_text(aes(label = datab[, 1]), size = 5, vjust = -0.5) # Menambahkan label nama
> print(p2)
fviz_cluster()
: Memvisualisasikan hasil
clustering yang kemudian disimpan dalam variabel p2.
palette = c("#5B99C2", "#FF0000", "#FFFF00")
: Warna klaster.geom = "point"
: Menggunakan titik untuk mewakili objek.geom_text()
: Menambahkan label teks pada titik, sesuai nama provinsi.
print(p2)
digunakan untuk mencetak
visualisasi hasil clustering.
3.5.4 Indeks Validitas (Global Indeks Silhouette)
> silhouette_result2 <- silhouette(km2$cluster, jarakk)
> silhouette_result2
cluster neighbor sil_width
[1,] 3 1 0.83653876
[2,] 3 1 0.62943614
[3,] 3 1 0.83218092
[4,] 3 1 0.91161973
[5,] 3 1 0.91334550
[6,] 3 2 0.62864967
[7,] 3 1 0.91546546
[8,] 1 3 0.00000000
[9,] 3 1 0.90443688
[10,] 3 1 0.90072488
[11,] 3 1 0.90066844
[12,] 2 3 0.51614424
[13,] 2 1 0.54412138
[14,] 3 1 0.83678740
[15,] 2 1 0.48234038
[16,] 3 1 0.80430563
[17,] 3 1 0.90105202
[18,] 3 1 0.72738451
[19,] 3 1 0.85420932
[20,] 3 1 0.89913659
[21,] 3 1 0.91444860
[22,] 3 1 0.91425634
[23,] 3 1 0.91458615
[24,] 3 1 0.90336351
[25,] 3 1 0.91450742
[26,] 3 1 0.89981400
[27,] 2 3 -0.08956166
[28,] 3 1 0.91156220
[29,] 3 1 0.85963322
[30,] 3 1 0.91087080
[31,] 3 1 0.90773931
[32,] 3 1 0.90297046
[33,] 3 1 0.90271737
[34,] 3 1 0.89248938
attr(,"Ordered")
[1] FALSE
attr(,"call")
silhouette.default(x = km2$cluster, dist = jarakk)
attr(,"class")
[1] "silhouette"
> mean(silhouette_result2[, 3])
[1] 0.7822925
silhouette()
: Menghitung nilai Silhouette untuk mengevaluasi kualitas klaster. Nilai berkisar antara -1 (klaster buruk) hingga 1 (klaster baik).km2$cluster
: Informasi klaster hasil k-means yang telah dilakukan sebelumnya.jarakk
: Matriks jarak Euclidean yang telah dilakukan sebelumnya.
mean(silhouette_result2[, 3])
: Menghitung rata-rata nilai Silhouette untuk semua objek, yang menunjukkan kualitas klaster secara keseluruhan.
4. Hasil dan Pembahasan
4.1 Input Data
> datab<- read_excel("C:/Users/EDDRIN/Downloads/Data Bahan Pangan.xlsx")
> datab
# A tibble: 34 × 7
provinsi `padi (ton)` `jagung (ton)` `kedelai (ton)` `kacang tanah (ton)`
<chr> <dbl> <dbl> <dbl> <dbl>
1 Aceh 1509456. 296703. 1502. 2044.
2 Sumatera Ut… 2088584. 1768649 8026. 5875.
3 Sumatera Ba… 1373532. 770306 17.2 3078.
4 Riau 213557. 1018 495. 698.
5 Jambi 277744. 14173 4631. 3182.
6 Sumatera Se… 2775069. 1012791. 0 0
7 Bengkulu 281610. 97066 3.21 1433.
8 Lampung 2688160. 1952103 2110. 2383.
9 Kepulauan B… 61425. 2201. 4.53 245.
10 Kepulauan R… 507. 176. 0.32 38.0
# ℹ 24 more rows
# ℹ 2 more variables: `ubi kayu (ton)` <dbl>, `ubi jalar (ton)` <dbl>
4.2 Statistika Deskriptif
> statdes <- summary(datab)
> statdes
provinsi padi..ton. jagung..ton. kedelai..ton.
Length:34 Min. : 507 Min. : 0 Min. : 0.00
Class :character 1st Qu.: 220024 1st Qu.: 23249 1st Qu.: 7.11
Mode :character Median : 416236 Median : 117932 Median : 1257.78
Mean :1598189 Mean : 706542 Mean : 7144.78
3rd Qu.:1495329 3rd Qu.: 895083 3rd Qu.: 5779.17
Max. :9526516 Max. :6699479 Max. :70759.07
kacang.tanah..ton. ubi.kayu..ton. ubi.jalar..ton.
Min. : 0.0 Min. : 0 Min. : 0
1st Qu.: 256.7 1st Qu.: 27661 1st Qu.: 2350
Median : 1924.5 Median : 53349 Median : 13695
Mean : 11083.8 Mean : 517184 Mean : 56741
3rd Qu.: 5139.0 3rd Qu.: 221865 3rd Qu.: 30501
Max. :119092.5 Max. :7372786 Max. :590206
Sebagian besar total produksi kedelai di 34 provinsi di Indonesia adalah 7144.78 ton, dengan total produksi terendah yaitu 0 ton dan total produksi tertinggi yaitu 70759.07 ton
Sebagian besar total produksi padi di 34 provinsi di Indonesia adalah 1598189 ton, dengan total produksi terendah yaitu 507 ton dan total produksi tertinggi yaitu 9526516 ton
Sebagian besar total produksi jagung di 34 provinsi di Indonesia adalah 117932 ton, dengan total produksi terendah yaitu 0 ton dan total produksi tertinggi yaitu 6699479 ton
Sebagian besar total produksi kacang tanah di 34 provinsi di Indonesia adalah 11083.8 ton, dengan total produksi terendah yaitu 0 ton dan total produksi tertinggi yaitu 119092.5 ton
Sebagian besar total produksi ubi kayu di 34 provinsi di Indonesia adalah 517184 ton, dengan total produksi terendah yaitu 0 ton dan total produksi tertinggi yaitu 7372786 ton
Sebagian besar total produksi ubi jalar di 34 provinsi di Indonesia adalah 56741 ton dengan total produksi terendah yaitu 0 ton dan total produksi tertinggi yaitu 590206 ton
4.3 Analisis Cluster Hierarki
4.3.1 Menghitung jarak Euclidean
> jarakk <- dist(datab[,2:7],method = "euclidean")
> jarakk
Aceh Sumatera Utara Sumatera Barat
Sumatera Utara 1842895.72
Sumatera Barat 519396.41 1485686.63
Riau 1330337.62 2726625.99 1398591.87
Jambi 1264239.34 2683333.14 1337461.45
Sumatera Selatan 1454204.85 1398001.92 1433261.70
Bengkulu 1244225.46 2629122.81 1290443.41
Lampung 7639459.11 6451895.30 7468589.19
Kepulauan Bangka Belitung 1479770.65 2825454.94 1526222.95
Kepulauan Riau 1537842.85 2893227.32 1582978.98
Daerah Khusus Ibukota Jakarta 1536096.84 2896958.43 1582617.85
Jawa Barat 8169577.59 7480577.61 8249886.84
Jawa Tengah 8985383.84 7734206.00 8904121.32
Daerah Istimewa Yogyakarta 1319341.40 2124353.92 1247696.10
Jawa Timur 10401280.68 8958334.09 10204168.49
Banten 385027.43 1962344.37 848757.15
Bali 876804.70 2335063.54 993203.43
Nusa Tenggara Barat 1628181.67 1125775.23 1165357.13
Nusa Tenggara Timur 1024518.44 1750960.21 776873.35
Kalimantan Barat 819308.78 2292033.81 938260.80
Kalimantan Tengah 1192493.41 2610389.71 1264946.37
Kalimantan Selatan 1169367.37 2516764.86 1183844.60
Kalimantan Timur 1290211.66 2665149.43 1337753.17
Kalimantan Utara 1507793.17 2865588.51 1554510.03
Sulawesi Utara 1263675.59 2605593.18 1282711.90
Sulawesi Tengah 783571.75 2309145.29 908553.83
Sulawesi Selatan 4066219.06 3334215.31 4071412.84
Sulawesi Tenggara 1054785.70 2457665.17 1120722.07
Gorontalo 1421562.57 2239421.94 1158683.58
Sulawesi Barat 1156072.40 2474772.79 1143423.88
Maluku 1438863.36 2803963.29 1481918.45
Maluku Utara 1512861.18 2858468.09 1554327.19
Papua Barat 1513191.76 2876050.46 1559618.53
Papua 1398510.98 2688687.88 1416586.54
Riau Jambi Sumatera Selatan
Sumatera Utara
Sumatera Barat
Riau
Jambi 77186.80
Sumatera Selatan 2754829.72 2690036.27
Bengkulu 123434.48 84205.68 2656552.19
Lampung 7959761.53 7963364.33 7432925.57
Kepulauan Bangka Belitung 154007.98 225316.42 2897020.82
Kepulauan Riau 218523.89 280329.28 2953610.45
Daerah Khusus Ibukota Jakarta 220618.02 280127.85 2951912.30
Jawa Barat 9457141.16 9395563.68 6907334.41
Jawa Tengah 10225548.97 10170706.56 7625951.47
Daerah Istimewa Yogyakarta 976112.35 977633.30 2504548.74
Jawa Timur 11590541.04 11534613.30 8992976.13
Banten 1575596.90 1511690.08 1387556.03
Bali 487976.66 434525.36 2303586.60
Nusa Tenggara Barat 2287605.72 2242242.00 1606096.96
Nusa Tenggara Timur 1020919.32 993802.48 2122955.42
Kalimantan Barat 537125.07 480177.73 2246070.13
Kalimantan Tengah 139173.24 81207.55 2615926.81
Kalimantan Selatan 244777.16 204864.34 2561795.90
Kalimantan Timur 78223.02 76876.00 2704446.15
Kalimantan Utara 186707.30 249847.94 2924277.27
Sulawesi Utara 166983.38 150049.93 2661911.69
Sulawesi Tengah 547157.86 481232.90 2214591.14
Sulawesi Selatan 5384567.57 5320950.24 2664786.19
Sulawesi Tenggara 292648.27 240629.52 2472118.83
Gorontalo 937999.94 924442.10 2536079.54
Sulawesi Barat 322647.99 285184.04 2528655.62
Maluku 144013.08 194250.23 2851265.24
Maluku Utara 190011.31 254591.39 2927972.45
Papua Barat 200158.15 258564.71 2928591.04
Papua 357610.42 357669.82 2794504.73
Bengkulu Lampung Kepulauan Bangka Belitung
Sumatera Utara
Sumatera Barat
Riau
Jambi
Sumatera Selatan
Bengkulu
Lampung 7946781.87
Kepulauan Bangka Belitung 247271.02 7986555.63
Kepulauan Riau 298433.09 8072798.19 94287.14
Daerah Khusus Ibukota Jakarta 297981.23 8085967.39 105207.95
Jawa Barat 9385099.92 9048410.76 9602993.46
Jawa Tengah 10138879.57 8303250.23 10355340.26
Daerah Istimewa Yogyakarta 960187.54 6989657.72 1020373.57
Jawa Timur 11484725.75 10092640.59 11709348.10
Banten 1508727.94 7597844.08 1727691.86
Bali 429066.80 7695753.50 630943.20
Nusa Tenggara Barat 2169933.02 7437857.75 2372897.40
Nusa Tenggara Timur 939638.13 7178317.37 1097996.67
Kalimantan Barat 470472.87 7692494.28 681676.80
Kalimantan Tengah 83371.71 7917874.46 288332.75
Kalimantan Selatan 126651.34 7899989.08 352453.85
Kalimantan Timur 54436.13 7943467.67 195088.98
Kalimantan Utara 268687.84 8051161.67 67565.84
Sulawesi Utara 70722.37 7932272.32 254175.38
Sulawesi Tengah 464176.10 7804699.27 696892.16
Sulawesi Selatan 5294073.21 7528451.82 5528693.08
Sulawesi Tenggara 220620.36 7796742.26 432357.35
Gorontalo 841336.52 7831901.50 955114.37
Sulawesi Barat 204308.48 7911348.92 415541.36
Maluku 199193.67 8045338.91 102422.95
Maluku Utara 272125.77 8031399.54 54903.86
Papua Barat 274874.95 8076695.92 94968.44
Papua 379571.39 7811054.70 374208.73
Kepulauan Riau Daerah Khusus Ibukota Jakarta
Sumatera Utara
Sumatera Barat
Riau
Jambi
Sumatera Selatan
Bengkulu
Lampung
Kepulauan Bangka Belitung
Kepulauan Riau
Daerah Khusus Ibukota Jakarta 15220.12
Jawa Barat 9673932.69 9674567.06
Jawa Tengah 10429414.28 10431809.15
Daerah Istimewa Yogyakarta 1110257.45 1121763.71
Jawa Timur 11769773.05 11770563.21
Banten 1789596.89 1788348.66
Bali 704892.30 706964.78
Nusa Tenggara Barat 2410367.76 2409602.01
Nusa Tenggara Timur 1171363.42 1177598.89
Kalimantan Barat 753201.09 754699.82
Kalimantan Tengah 349011.51 349246.41
Kalimantan Selatan 400835.57 400354.11
Kalimantan Timur 253185.38 254291.35
Kalimantan Utara 32482.13 39187.82
Sulawesi Utara 301087.93 301280.81
Sulawesi Tengah 755710.88 754549.96
Sulawesi Selatan 5591464.43 5590676.04
Sulawesi Tenggara 502904.23 504813.05
Gorontalo 966747.69 966394.84
Sulawesi Barat 453626.11 452061.06
Maluku 104107.45 101451.85
Maluku Utara 44639.40 56493.84
Papua Barat 29194.32 23335.61
Papua 432319.40 440189.10
Jawa Barat Jawa Tengah
Sumatera Utara
Sumatera Barat
Riau
Jambi
Sumatera Selatan
Bengkulu
Lampung
Kepulauan Bangka Belitung
Kepulauan Riau
Daerah Khusus Ibukota Jakarta
Jawa Barat
Jawa Tengah 3028930.66
Daerah Istimewa Yogyakarta 8992215.59 9609286.42
Jawa Timur 5724302.60 3190862.14
Banten 7910672.78 8825544.25
Bali 8972724.23 9750691.71
Nusa Tenggara Barat 8244318.77 8544807.97
Nusa Tenggara Timur 8804889.02 9368287.80
Kalimantan Barat 8922474.66 9700759.86
Kalimantan Tengah 9325803.18 10094449.20
Kalimantan Selatan 9314656.30 10043861.91
Kalimantan Timur 9425634.11 10178776.74
Kalimantan Utara 9642284.29 10398105.25
Sulawesi Utara 9405822.55 10139156.85
Sulawesi Tengah 8927444.68 9712655.05
Sulawesi Selatan 4364398.39 5136030.05
Sulawesi Tenggara 9176018.33 9933398.83
Gorontalo 9389732.65 9917004.40
Sulawesi Barat 9304769.59 10017321.50
Maluku 9581432.85 10334452.74
Maluku Utara 9643404.93 10395232.32
Papua Barat 9652472.75 10409303.77
Papua 9435922.93 10194487.03
Daerah Istimewa Yogyakarta Jawa Timur
Sumatera Utara
Sumatera Barat
Riau
Jambi
Sumatera Selatan
Bengkulu
Lampung
Kepulauan Bangka Belitung
Kepulauan Riau
Daerah Khusus Ibukota Jakarta
Jawa Barat
Jawa Tengah
Daerah Istimewa Yogyakarta
Jawa Timur 11048907.81
Banten 1515196.99 10340144.10
Bali 783239.58 11159247.37
Nusa Tenggara Barat 2057395.85 9529259.97
Nusa Tenggara Timur 571962.19 10689515.27
Kalimantan Barat 802370.53 11106336.47
Kalimantan Tengah 933143.31 11459702.69
Kalimantan Selatan 923397.16 11372010.52
Kalimantan Timur 956808.29 11528970.41
Kalimantan Utara 1084593.61 11741778.30
Sulawesi Utara 949089.38 11469675.90
Sulawesi Tengah 923093.21 11095023.66
Sulawesi Selatan 4996014.79 6758492.76
Sulawesi Tenggara 825849.85 11307831.06
Gorontalo 1169683.99 11062970.49
Sulawesi Barat 949693.20 11324617.79
Maluku 1067869.54 11671183.30
Maluku Utara 1067591.77 11739393.26
Papua Barat 1108843.07 11748076.08
Papua 890315.87 11569211.80
Banten Bali Nusa Tenggara Barat
Sumatera Utara
Sumatera Barat
Riau
Jambi
Sumatera Selatan
Bengkulu
Lampung
Kepulauan Bangka Belitung
Kepulauan Riau
Daerah Khusus Ibukota Jakarta
Jawa Barat
Jawa Tengah
Daerah Istimewa Yogyakarta
Jawa Timur
Banten
Bali 1113957.80
Nusa Tenggara Barat 1913577.45 2011606.63
Nusa Tenggara Timur 1322520.75 741327.36 1508552.80
Kalimantan Barat 1063048.00 60000.62 1968391.22
Kalimantan Tengah 1444878.94 362454.51 2178508.64
Kalimantan Selatan 1454821.85 393001.47 2044589.03
Kalimantan Timur 1549689.58 460548.72 2212340.41
Kalimantan Utara 1759156.27 672705.12 2389447.45
Sulawesi Utara 1540277.78 460221.06 2132049.62
Sulawesi Tengah 1048772.21 171941.97 1928379.51
Sulawesi Selatan 3890415.10 4912631.61 3936339.71
Sulawesi Tenggara 1312357.87 212737.83 2064269.07
Gorontalo 1790836.50 987512.45 1564165.42
Sulawesi Barat 1457800.16 432206.55 1973984.75
Maluku 1697736.61 617235.99 2318713.75
Maluku Utara 1764539.73 672972.03 2387657.30
Papua Barat 1766571.30 685379.68 2389614.68
Papua 1630872.20 579343.62 2313604.35
Nusa Tenggara Timur Kalimantan Barat
Sumatera Utara
Sumatera Barat
Riau
Jambi
Sumatera Selatan
Bengkulu
Lampung
Kepulauan Bangka Belitung
Kepulauan Riau
Daerah Khusus Ibukota Jakarta
Jawa Barat
Jawa Tengah
Daerah Istimewa Yogyakarta
Jawa Timur
Banten
Bali
Nusa Tenggara Barat
Nusa Tenggara Timur
Kalimantan Barat 725869.39
Kalimantan Tengah 929461.32 407146.92
Kalimantan Selatan 839984.62 424745.12
Kalimantan Timur 963646.52 505723.01
Kalimantan Utara 1144348.70 721217.38
Sulawesi Utara 909996.25 499141.10
Sulawesi Tengah 782320.03 136775.98
Sulawesi Selatan 4689406.60 4857412.95
Sulawesi Tenggara 792641.53 256164.65
Gorontalo 806902.05 986948.08
Sulawesi Barat 815058.63 454712.08
Maluku 1093759.40 662792.96
Maluku Utara 1133383.95 722023.78
Papua Barat 1158639.19 732727.29
Papua 985888.20 622128.71
Kalimantan Tengah Kalimantan Selatan
Sumatera Utara
Sumatera Barat
Riau
Jambi
Sumatera Selatan
Bengkulu
Lampung
Kepulauan Bangka Belitung
Kepulauan Riau
Daerah Khusus Ibukota Jakarta
Jawa Barat
Jawa Tengah
Daerah Istimewa Yogyakarta
Jawa Timur
Banten
Bali
Nusa Tenggara Barat
Nusa Tenggara Timur
Kalimantan Barat
Kalimantan Tengah
Kalimantan Selatan 158757.29
Kalimantan Timur 107553.25 169785.31
Kalimantan Utara 317783.22 373094.23
Sulawesi Utara 145157.73 101684.74
Sulawesi Tengah 409232.64 407796.90
Sulawesi Selatan 5246748.21 5204837.61
Sulawesi Tenggara 164591.56 192716.33
Gorontalo 895571.38 738716.85
Sulawesi Barat 242379.46 86554.78
Maluku 257096.28 299730.44
Maluku Utara 321772.26 374947.66
Papua Barat 326942.09 377417.03
Papua 390256.51 443022.14
Kalimantan Timur Kalimantan Utara Sulawesi Utara
Sumatera Utara
Sumatera Barat
Riau
Jambi
Sumatera Selatan
Bengkulu
Lampung
Kepulauan Bangka Belitung
Kepulauan Riau
Daerah Khusus Ibukota Jakarta
Jawa Barat
Jawa Tengah
Daerah Istimewa Yogyakarta
Jawa Timur
Banten
Bali
Nusa Tenggara Barat
Nusa Tenggara Timur
Kalimantan Barat
Kalimantan Tengah
Kalimantan Selatan
Kalimantan Timur
Kalimantan Utara 222207.40
Sulawesi Utara 89505.40 273502.80
Sulawesi Tengah 508492.81 725283.05 491970.09
Sulawesi Selatan 5339645.55 5561000.37 5303345.86
Sulawesi Tenggara 252916.41 470980.09 248504.66
Gorontalo 864337.88 956497.09 776793.29
Sulawesi Barat 245843.85 428911.52 164578.35
Maluku 159097.62 79950.64 202022.59
Maluku Utara 224159.63 26983.76 274250.91
Papua Barat 231643.15 28199.53 278620.77
Papua 363538.90 413499.54 392653.92
Sulawesi Tengah Sulawesi Selatan
Sumatera Utara
Sumatera Barat
Riau
Jambi
Sumatera Selatan
Bengkulu
Lampung
Kepulauan Bangka Belitung
Kepulauan Riau
Daerah Khusus Ibukota Jakarta
Jawa Barat
Jawa Tengah
Daerah Istimewa Yogyakarta
Jawa Timur
Banten
Bali
Nusa Tenggara Barat
Nusa Tenggara Timur
Kalimantan Barat
Kalimantan Tengah
Kalimantan Selatan
Kalimantan Timur
Kalimantan Utara
Sulawesi Utara
Sulawesi Tengah
Sulawesi Selatan 4841582.47
Sulawesi Tenggara 281448.45 5097520.17
Gorontalo 951991.18 5169125.52
Sulawesi Barat 422401.13 5177806.60
Maluku 658498.85 5491299.11
Maluku Utara 729981.39 5563649.71
Papua Barat 731786.99 5567507.46
Papua 668056.06 5399857.31
Sulawesi Tenggara Gorontalo Sulawesi Barat
Sumatera Utara
Sumatera Barat
Riau
Jambi
Sumatera Selatan
Bengkulu
Lampung
Kepulauan Bangka Belitung
Kepulauan Riau
Daerah Khusus Ibukota Jakarta
Jawa Barat
Jawa Tengah
Daerah Istimewa Yogyakarta
Jawa Timur
Banten
Bali
Nusa Tenggara Barat
Nusa Tenggara Timur
Kalimantan Barat
Kalimantan Tengah
Kalimantan Selatan
Kalimantan Timur
Kalimantan Utara
Sulawesi Utara
Sulawesi Tengah
Sulawesi Selatan
Sulawesi Tenggara
Gorontalo 873610.57
Sulawesi Barat 253462.86 661801.78
Maluku 411451.29 902507.55 353393.41
Maluku Utara 471015.40 952220.09 431341.02
Papua Barat 482609.49 952761.58 429794.45
Papua 440155.60 1000845.09 503489.69
Maluku Maluku Utara Papua Barat
Sumatera Utara
Sumatera Barat
Riau
Jambi
Sumatera Selatan
Bengkulu
Lampung
Kepulauan Bangka Belitung
Kepulauan Riau
Daerah Khusus Ibukota Jakarta
Jawa Barat
Jawa Tengah
Daerah Istimewa Yogyakarta
Jawa Timur
Banten
Bali
Nusa Tenggara Barat
Nusa Tenggara Timur
Kalimantan Barat
Kalimantan Tengah
Kalimantan Selatan
Kalimantan Timur
Kalimantan Utara
Sulawesi Utara
Sulawesi Tengah
Sulawesi Selatan
Sulawesi Tenggara
Gorontalo
Sulawesi Barat
Maluku
Maluku Utara 92300.02
Papua Barat 78235.92 50943.21
Papua 409675.49 395446.13 430945.61
4.3.2 Koefisien Korelasi Cophenetic
> #Single Linkage
> hiers <- hclust(jarakk, method = "single")
> #korelasi cophenetic
> hc1 <- cor(jarakk, cophenetic(hiers))
> hc1
[1] 0.9242814
> #Average Linkage
> hierave <- hclust(jarakk, method = "ave")
> #korelasi cophenetic
> hc2 <- cor(jarakk, cophenetic(hierave))
> hc2
[1] 0.9844563
> #Complete Linkage
> hiercomp <- hclust(jarakk, method = "complete")
> #korelasi cophenetic
> hc3 <- cor(jarakk, cophenetic(hiercomp))
> hc3
[1] 0.9390626
> #Centorid Linkage
> hiercen <- hclust(jarakk, method = "centroid")
> #korelasi cophenetic
> hc4 <- cor(jarakk, cophenetic(hiercen))
> hc4
[1] 0.9466738
> #Ward
> hierward <- hclust(jarakk, method = "ward.D")
> #korelasi cophenetic
> hc5 <- cor(jarakk, cophenetic(hierward))
> hc5
[1] 0.9193628
Single Linkage: 0.9242814
Metode Single Linkage menghasilkan dendrogram yang cukup baik, dengan korelasi cophenetic sebesar 92.4%.
Average Linkage: 0.9844563
Metode Average Linkage menghasilkan korelasi cophenetic tertinggi 98.4%, menunjukkan bahwa dendrogramnya sangat baik dalam merepresentasikan struktur jarak asli.
Complete Linkage: 0.9390626
Complete Linkage menghasilkan korelasi sebesar 93.9%, menunjukkan dendrogram yang cukup baik.
Centroid Linkage: 0.9466738
Dengan korelasi sebesar 94.7%, Centroid Linkage juga merepresentasikan jarak dengan baik.
Ward’s Method: 0.9193628
Metode Ward’s menghasilkan korelasi sebesar 91.9%, menunjukkan bahwa dendrogramnya juga cukup baik.
4.3.3 Perbandingan Koefisien Korelasi Cophenetic
> perbandingan<-data.frame(hc1, hc2, hc3, hc4, hc5)
> perbandingan
hc1 hc2 hc3 hc4 hc5
1 0.9242814 0.9844563 0.9390626 0.9466738 0.9193628
Metode Average Linkage (0.9844563) adalah yang paling baik dalam merepresentasikan jarak asli berdasarkan korelasi cophenetic tertinggi. Ini menunjukkan bahwa dendrogram yang dihasilkan paling konsisten dengan matriks jarak Euclidean.
4.3.4 Indeks Validitas
> inval <- clValid(as.matrix(jarakk)[,2:7], 2:7, clMethods = "hierarchical", validation = "internal", metric = "euclidean", method = "single")
> summary(inval)
Clustering Methods:
hierarchical
Cluster sizes:
2 3 4 5 6 7
Validation Measures:
2 3 4 5 6 7
hierarchical Connectivity 4.5825 7.3115 10.3115 12.6448 16.4071 18.4071
Dunn 0.8404 0.8404 0.5923 0.5246 0.3369 0.3048
Silhouette 0.8600 0.7390 0.6994 0.6929 0.5174 0.4906
Optimal Scores:
Score Method Clusters
Connectivity 4.5825 hierarchical 2
Dunn 0.8404 hierarchical 2
Silhouette 0.8600 hierarchical 2
Berdasarkan hasil dari masing-masing indeks validitas, didapatkan jumlah cluster optimal sebagai berikut :
Connectivity : jumlah cluster optimal ditunjukkan pada indeks Connectivity terkecil, didapatkan nilai terendah pada saat digunakan 2 cluster, menunjukkan bahwa 2 cluster memberikan hasil clustering yang paling kompak.
Indeks Dunn : jumlah cluster optimal ditunjukkan pada indeks Dunn paling besar, didapatkan nilai terbesar pada saat digunakan 2 cluster, menunjukkan bahwa 2 cluster memberikan hasil pemisahan yang paling baik antara 2 cluster.
Koefisien Silhouette : jumlah cluster optimal ditunjukkan pada koefisien silhouette paling besar, didapatkan nilai terbesar pada saat digunakan 2 cluster, menunjukkan bahwa secara keseluruhan akan lebih baik jika digunakan 2 cluster.
Dari hasil indeks validitas, secara keseluruhan jumlah cluster optimal adalah 2 cluster.
4.3.5 Analisis Cluster Hierarki menggunakan Average Linkage
4.3.6 Cluster Dendogram untuk k=2
Visualisasi dendogram yang dihasilkan dengan 2 cluster menggunakan metode average linkage dan jarak euclidean.
> plot(hirave, labels=datab[,1], hang = 1, col = "blue", main = "Cluster Dendogram", sub = " ", xlab = "Provinsi", ylab = "Jarak")
> rect.hclust(hirave, k = 2, border = "red")
> clus_hier <- eclust(datab, FUNcluster = "hclust", k = 2, hc_method = "average", graph = TRUE)
> fviz_dend(clus_hier, rect = TRUE, cex = 0.5, main = "Cluster Dendogram", label_cols = "black", show_labels = TRUE, xlab = "Provinsi", ylab = "Jarak")
4.3.7 Anggota Cluster
> anggotaave <- data.frame(id = datab$provinsi, cutree(hirave, k = 2))
> anggotaave
id
Aceh Aceh
Sumatera Utara Sumatera Utara
Sumatera Barat Sumatera Barat
Riau Riau
Jambi Jambi
Sumatera Selatan Sumatera Selatan
Bengkulu Bengkulu
Lampung Lampung
Kepulauan Bangka Belitung Kepulauan Bangka Belitung
Kepulauan Riau Kepulauan Riau
Daerah Khusus Ibukota Jakarta Daerah Khusus Ibukota Jakarta
Jawa Barat Jawa Barat
Jawa Tengah Jawa Tengah
Daerah Istimewa Yogyakarta Daerah Istimewa Yogyakarta
Jawa Timur Jawa Timur
Banten Banten
Bali Bali
Nusa Tenggara Barat Nusa Tenggara Barat
Nusa Tenggara Timur Nusa Tenggara Timur
Kalimantan Barat Kalimantan Barat
Kalimantan Tengah Kalimantan Tengah
Kalimantan Selatan Kalimantan Selatan
Kalimantan Timur Kalimantan Timur
Kalimantan Utara Kalimantan Utara
Sulawesi Utara Sulawesi Utara
Sulawesi Tengah Sulawesi Tengah
Sulawesi Selatan Sulawesi Selatan
Sulawesi Tenggara Sulawesi Tenggara
Gorontalo Gorontalo
Sulawesi Barat Sulawesi Barat
Maluku Maluku
Maluku Utara Maluku Utara
Papua Barat Papua Barat
Papua Papua
cutree.hirave..k...2.
Aceh 1
Sumatera Utara 1
Sumatera Barat 1
Riau 1
Jambi 1
Sumatera Selatan 1
Bengkulu 1
Lampung 1
Kepulauan Bangka Belitung 1
Kepulauan Riau 1
Daerah Khusus Ibukota Jakarta 1
Jawa Barat 2
Jawa Tengah 2
Daerah Istimewa Yogyakarta 1
Jawa Timur 2
Banten 1
Bali 1
Nusa Tenggara Barat 1
Nusa Tenggara Timur 1
Kalimantan Barat 1
Kalimantan Tengah 1
Kalimantan Selatan 1
Kalimantan Timur 1
Kalimantan Utara 1
Sulawesi Utara 1
Sulawesi Tengah 1
Sulawesi Selatan 1
Sulawesi Tenggara 1
Gorontalo 1
Sulawesi Barat 1
Maluku 1
Maluku Utara 1
Papua Barat 1
Papua 1
Berdasarkan hasil output di atas, didapatkan anggota (provinsi) untuk setiap cluster adalah sebagai berikut :
Cluster 1 : Aceh, Sumatera Utara, Sumatera Barat, Riau, Jambi, Sumatera Selatan, Bengkulu, Lampung, Kepulauan Bangka Belitung, Kepulauan Riau, Daerah Khusus Ibukota Jakarta, Daerah Istimewa Yogyakarta, Banten, Bali, Nusa Tenggara Barat, Nusa Tenggara Timur, Kalimantan Barat, Kalimantan Tengah, Kalimantan Selatan, Kalimantan Timur, Kalimantan Utara, Sulawesi Utara, Sulawesi Tengah, Sulawesi Selatan, Sulawesi Tenggara, Gorontalo, Sulawesi Barat, Maluku, Maluku Utara, Papua Barat, dan Papua.
Cluster 2 : Jawa Barat, Jawa Tengah, dan Jawa Timur.
4.3.8 Karakteristik Cluster
> idclus = clus_hier$cluster
> idclus
Aceh Sumatera Utara
1 1
Sumatera Barat Riau
1 1
Jambi Sumatera Selatan
1 1
Bengkulu Lampung
1 1
Kepulauan Bangka Belitung Kepulauan Riau
1 1
Daerah Khusus Ibukota Jakarta Jawa Barat
1 2
Jawa Tengah Daerah Istimewa Yogyakarta
2 1
Jawa Timur Banten
2 1
Bali Nusa Tenggara Barat
1 1
Nusa Tenggara Timur Kalimantan Barat
1 1
Kalimantan Tengah Kalimantan Selatan
1 1
Kalimantan Timur Kalimantan Utara
1 1
Sulawesi Utara Sulawesi Tengah
1 1
Sulawesi Selatan Sulawesi Tenggara
1 1
Gorontalo Sulawesi Barat
1 1
Maluku Maluku Utara
1 1
Papua Barat Papua
1 1
> aggregate(datab,list(idclus),mean)
Group.1 provinsi padi..ton. jagung..ton. kedelai..ton. kacang.tanah..ton.
1 1 NA 837629.5 407503.7 2390.972 4992.538
2 2 NA 9457298.4 3796599.8 56267.417 74026.520
ubi.kayu..ton. ubi.jalar..ton.
1 375706.2 27632.75
2 1979118.8 357525.08
Karakteristik dari tiap cluster yang dihasilkan yaitu :
Cluster 1 : Cluster 1 memiliki rata-rata produksi (dalam ton) padi, jagung, kedelai, kacang tanah, ubi jalar, dan ubi kayu yang lebih rendah dibandingkan dengan cluster 2.
Cluster 2 : Cluster 2 memiliki rata-rata produksi (dalam ton) padi, jagung, kedelai, kacang tanah, ubi jalar, dan ubi kayu yang lebih tinggi dibandingkan dengan cluster 1.
Hasil menunjukkan bahwa cluster 2 berisi provinsi yang memiliki tingkat produksi bahan pangan dengan 6 komoditas (padi, jagung, kedelai, kacang tanah, ubi jalar, dan ubi kayu) yang lebih tinggi dibandingkan dengan provinsi yang berada pada cluster 1.
4.4 Analisis Cluster Non Hierarki
4.4.1 Menentukan Jumlah Cluster Optimal
Berdasarkan output di atas, grafik Silhouette menunjukkan bahwa nilai tertinggi tercapai ketika jumlah cluster = 3, yang menunjukkan bahwa jumlah cluster =3 optimal dan memberikan hasil pengelompokkan paling baik.
4.4.2 K-Means Clustering
>
> km2 <- kmeans(datab[,2:7], centers = 3, nstart = 50)
> km2
K-means clustering with 3 clusters of sizes 1, 4, 29
Cluster means:
padi..ton. jagung..ton. kedelai..ton. kacang.tanah..ton. ubi.kayu..ton.
1 2688159.7 1952103 2109.760 2382.73 7372785.9
2 8433016.1 3237054 43196.412 58746.20 1570713.9
3 617868.5 314555 2345.757 4809.68 135469.3
ubi.jalar..ton.
1 23264.11
2 276372.16
3 27601.30
Clustering vector:
Aceh Sumatera Utara
3 3
Sumatera Barat Riau
3 3
Jambi Sumatera Selatan
3 3
Bengkulu Lampung
3 1
Kepulauan Bangka Belitung Kepulauan Riau
3 3
Daerah Khusus Ibukota Jakarta Jawa Barat
3 2
Jawa Tengah Daerah Istimewa Yogyakarta
2 3
Jawa Timur Banten
2 3
Bali Nusa Tenggara Barat
3 3
Nusa Tenggara Timur Kalimantan Barat
3 3
Kalimantan Tengah Kalimantan Selatan
3 3
Kalimantan Timur Kalimantan Utara
3 3
Sulawesi Utara Sulawesi Tengah
3 3
Sulawesi Selatan Sulawesi Tenggara
2 3
Gorontalo Sulawesi Barat
3 3
Maluku Maluku Utara
3 3
Papua Barat Papua
3 3
Within cluster sum of squares by cluster:
[1] 0.000000e+00 3.580692e+13 2.311399e+13
(between_SS / total_SS = 83.7 %)
Available components:
[1] "cluster" "centers" "totss" "withinss" "tot.withinss"
[6] "betweenss" "size" "iter" "ifault"
K-means clustering menghasilkan 3 kluster dengan jumlah anggota masing-masing:
Cluster 1: 4 anggota.
Cluster 2: 29 anggota.
Cluster 3: 1 anggota.
Cluster means menunjukkan nilai rata-rata produksi untuk setiap variabel di setiap kluster. Variabel yang dianalisis adalah produksi padi, jagung, kedelai, kacang tanah, ubi kayu, dan ubi jalar.
Cluster 1 : Jawa Barat, Jawa Tengah, Jawa Timur, Sulawesi Selatan.
Karakteristik:
- Provinsi dalam kluster ini memiliki rata-rata produksi tertinggi di hampir semua variabel. Mereka adalah wilayah dengan kapasitas produksi yang besar, terutama untuk padi dan jagung.
Cluster 2 : Sebagian besar provinsi termasuk dalam kluster ini, seperti Aceh, Sumatera Utara, Bali, Kalimantan Barat, dan lain-lain (total 29 anggota).
Karakteristik:
- Cluster ini merepresentasikan mayoritas provinsi dengan produksi sedang. Mereka tidak memiliki angka yang sangat ekstrem, melainkan mendekati rata-rata nasional.
Cluster 3 :Lampung.
Karakteristik:
- Cluster ini unik karena hanya memiliki satu anggota (Lampung). Produksi ubi kayu yang sangat tinggi menjadi penanda utama kluster ini, meskipun produksi komoditas lainnya relatif sedang.
Between_SS/Total_SS : Dengan nilai 83,7%, model ini memiliki performa yang sangat baik dalam menjelaskan pola pengelompokan data berdasarkan variabel produksi pangan.
4.4.3 Visualisasi K-Means Clustering untuk k=3
> p2 <- fviz_cluster(km2, data = datab[,2:7],
+ palette = c("#5B99C2", "#FF0000", "#FFFF00"),
+ main = "KMeans Clustering - 2 Cluster",
+ geom = "point") + # Menggunakan geom = "point" untuk titik
+ geom_text(aes(label = datab[, 1]), size = 5, vjust = -0.5) # Menambahkan label nama
> print(p2)
4.4.4 Indeks Validitas (Global Indeks Silhouette)
> silhouette_result2 <- silhouette(km2$cluster, jarakk)
> silhouette_result2
cluster neighbor sil_width
[1,] 3 1 0.83653876
[2,] 3 1 0.62943614
[3,] 3 1 0.83218092
[4,] 3 1 0.91161973
[5,] 3 1 0.91334550
[6,] 3 2 0.62864967
[7,] 3 1 0.91546546
[8,] 1 3 0.00000000
[9,] 3 1 0.90443688
[10,] 3 1 0.90072488
[11,] 3 1 0.90066844
[12,] 2 3 0.51614424
[13,] 2 1 0.54412138
[14,] 3 1 0.83678740
[15,] 2 1 0.48234038
[16,] 3 1 0.80430563
[17,] 3 1 0.90105202
[18,] 3 1 0.72738451
[19,] 3 1 0.85420932
[20,] 3 1 0.89913659
[21,] 3 1 0.91444860
[22,] 3 1 0.91425634
[23,] 3 1 0.91458615
[24,] 3 1 0.90336351
[25,] 3 1 0.91450742
[26,] 3 1 0.89981400
[27,] 2 3 -0.08956166
[28,] 3 1 0.91156220
[29,] 3 1 0.85963322
[30,] 3 1 0.91087080
[31,] 3 1 0.90773931
[32,] 3 1 0.90297046
[33,] 3 1 0.90271737
[34,] 3 1 0.89248938
attr(,"Ordered")
[1] FALSE
attr(,"call")
silhouette.default(x = km2$cluster, dist = jarakk)
attr(,"class")
[1] "silhouette"
> mean(silhouette_result2[, 3])
[1] 0.7822925
Mean Silhouette Width: 0.7822925
- Interpretasi: Rata-rata ini menunjukkan bahwa hasil clustering memiliki kualitas yang baik. Nilai di atas 0.7 sering dianggap menunjukkan hasil klustering yang kuat, di mana anggota kluster sesuai dengan grupnya. Namun untuk data dengan silhouette width negatif (baris ke-27) harus diperiksa lebih lanjut untuk memastikan apakah data tersebut lebih cocok berada di kluster lain atau memang merupakan outlier.
5. Kesimpulan
Berdasarkan data produksi bahan pangan yang mencakup enam komoditas utama, yaitu padi (X1), jagung (X2), kedelai (X3), kacang tanah (X4), ubi kayu (X5), dan ubi jalar (X6) pada 34 provinsi di Indonesia, analisis cluster hierarki dan nonhierarki dilakukan berdasarkan variabel tersebut dan diperoleh bahwa metode terbaik untuk analisis cluster hierarki adalah metode average linkage karena memiliki koefisien korelasi cophenen=tic yang paling tinggi diantara semua metode.
- Analisis cluster hierarki menghasilkan jumlah cluster optimal adalah 2 cluster dengan anggota sebagai berikut :
Cluster 1 : Aceh, Sumatera Utara, Sumatera Barat, Riau, Jambi, Sumatera Selatan, Bengkulu, Lampung, Kepulauan Bangka Belitung, Kepulauan Riau, Daerah Khusus Ibukota Jakarta, Daerah Istimewa Yogyakarta, Banten, Bali, Nusa Tenggara Barat, Nusa Tenggara Timur, Kalimantan Barat, Kalimantan Tengah, Kalimantan Selatan, Kalimantan Timur, Kalimantan Utara, Sulawesi Utara, Sulawesi Tengah, Sulawesi Selatan, Sulawesi Tenggara, Gorontalo, Sulawesi Barat, Maluku, Maluku Utara, Papua Barat, dan Papua.
Cluster 2 : Jawa Barat, Jawa Tengah, dan Jawa Timur.
- Analisis cluster non hierarki menghasilkan jumlah cluster optimal adalah 3 cluster dengan anggota sebagai berikut :
Cluster 1 : Jawa Barat, Jawa Tengah, Jawa Timur, dan Sulawesi Selatan.
Cluster 2 : Aceh, Sumatera Utara, Sumatera Barat, Riau, Jambi, Sumatera Selatan, Bengkulu, Kepulauan Bangka Belitung, Kepulauan Riau, Daerah Khusus Ibukota Jakarta, Daerah Istimewa Yogyakarta, Banten, Bali, Nusa Tenggara Barat, Nusa Tenggara Timur, Kalimantan Barat, Kalimantan Tengah, Kalimantan Selatan, Kalimantan Timur, Kalimantan Utara, Sulawesi Utara, Sulawesi Tengah, Sulawesi Tenggara, Gorontalo, Sulawesi Barat, Maluku, Maluku Utara, Papua Barat, dan Papua.
Cluster 3 : Lampung.
Ketika digunakan jumlah cluster = 2, pengelompokkan antar cluster jelas antara cluster yang memiliki rata-rata total produksi bahan pangan tinggi dengan cluster yang memiliki rata-rata total produksi bahan pangan rendah. Pengelompokkan ini membantu mengidentifikasi pola produksi yang serupa dan potensi wilayah sehingga pemerintah dapat merancang program pengembangan pertanian sesuai dengan kebutuhan lokal yang lebih efektif.
Daftar Pustaka
Baroroh, A. 2012. Analisis Multivariat dan Time Series dengan SPSS 21. Tangerang Selatan: PT. ELEK MEDIA KOMPUTINDO.
Fitri, A., dkk. 2023. Dasar-dasar Statistika untuk Penelitian. Yayasan Kita Menulis.
Kementerian Pertanian Republik Indonesia. 2022. Produksi padi, jagung, kacang tanah, kedelai, ubi jalar, dan ubi kayu pada 34 provinsi di Indonesia tahun 2022. Diakses melalui https://bdsp2.pertanian.go.id/bdsp/id/home.
Muhima, R. R., Kurniawan, M., Kom, S., Kom, M., Anton Yudhana, S. T., & Sunardi, S. T. 2022. Kupas Tuntas Algoritma Clustering: Konsep, Perhitungan Manual, dan Program. Yogyakarta: Penerbit Andi.
Simamora, B. 2005. Analisis Multivariat Pemasaran. PT. Gramedia Ppustaka Utama: Jakarta.
Tendean, T., & Purba, W. (2020). Analisis Cluster Provinsi Indonesia Berdasarkan Produksi Bahan Pangan Menggunakan Algoritma K-Means. SAINTEK (Jurnal Sains dan Teknologi), 1(2), 5–11. https://ejournal.sisfokomtek.org/index.php/saintek/article/view/31