1 PENDAHULUAN
2 TINJAUAN PUSTAKA
3 SOURCE CODE
4 HASIL DAN PEMBAHASAN
- 4.1 Statistika Deskriptif
- 4.2 Analisis Cluster
5 KESIMPULAN DAN SARAN
- 5.1 Kesimpulan
- 5.2 Saran
6 DAFTAR PUSTAKA

Notes Theme, silakan gunakan salah satu theme berikut: - cayman (package prettydoc) - architect (package prettydoc) - united (default di RMarkdown)

1 PENDAHULUAN

1.1 Latar Belakang

Indonesia dikenal sebagai negara agraris dengan sektor pertanian yang menjadi salah satu pilar utama perekonomian. Tanaman pangan, seperti padi, jagung, kedelai, ubi kayu, dan ubi jalar, menjadi komoditas strategis yang tidak hanya memenuhi kebutuhan pangan domestik, tetapi juga mendukung ketahanan pangan nasional. Namun, produksi tanaman pangan di setiap provinsi menunjukkan perbedaan yang signifikan, dipengaruhi oleh faktor geografis, iklim, potensi lahan, hingga tingkat adopsi teknologi pertanian. Perbedaan ini menciptakan tantangan sekaligus peluang dalam pengelolaan sektor pertanian di tingkat daerah. Dengan memahami pola produksi tanaman pangan di setiap provinsi, pemerintah dapat merancang kebijakan yang lebih terarah, seperti penentuan daerah unggulan tanaman tertentu, alokasi sumber daya, atau perencanaan distribusi hasil produksi.

Analisis cluster merupakan salah satu metode statistik yang dapat digunakan untuk mengelompokkan provinsi berdasarkan kesamaan karakteristik produksi tanaman pangan. Dengan metode ini, provinsi-provinsi yang memiliki pola produksi serupa akan dikelompokkan ke dalam satu kelompok, sehingga memudahkan pengambilan keputusan dalam perencanaan pembangunan sektor pertanian di Indonesia.

1.2 Rumusan Masalah

Berdasarkan latar belakang yang telah diuraikan, maka dapat dirumuskan permasalahan penelitian, yaitu:

Bagaimana pola pengelompokan provinsi di Indonesia berdasarkan karakteristik produksi tanaman pangan pada tahun 2012?
Apakah metode centroid linkage merupakan teknik klasterisasi yang efektif untuk menganalisis data produksi tanaman pangan?
Apa saja karakteristik utama yang membedakan setiap cluster yang dihasilkan dari analisis klasterisasi tersebut?

1.3 Tujuan

Dalam melakukan penelitian ini, tujuan penelitian yang ingin dicapai yaitu:

Untuk memberikan wawasan mengenai pengelompokan provinsi di Indonesia berdasarkan produksi tanaman pangan.
Untuk membantu dalam pemetaan potensi daerah dan identifikasi prioritas pengembangan di setiap provinsi.

1.4 Data

Penelitian ini menggunakan data produksi tanaman pangan dari seluruh provinsi di Indonesia pada tahun 2012 . Data terdiri dari informasi tentang jumlah produksi berbagai komoditas tanaman pangan, seperti padi, jagung, kedelai, ubi kayu, dan ubi jalar dalam satuan ton. Selain itu, data juga mencakup identitas wilayah (provinsi) yang digunakan sebagai unit analisis. Adapun data tersebut tersaji dalam sumber berikut:

Sumber: https://www.bps.go.id/id/statistics-table/2/MjMjMg%253D%253D/produksi-tanaman-pangan.html

2 TINJAUAN PUSTAKA

2.1 Analisis Cluster

Analisis cluster adalah metode analisis multivariat yang digunakan untuk mengelompokkan objek analisis yang memiliki kesamaan dalam karakteristik tertentu. Teknik ini bertujuan untuk memisahkan data menjadi beberapa kelompok (cluster) yang anggotanya memiliki kemiripan yang tinggi di dalam kelompok dan perbedaan yang jelas antar kelompok.

2.2 Uji Asumsi

Uji Sampel Respresentatif

Uji sampe representativitas dilakukan untuk memastikan bahwa sampel yang digunakan dalam penelitian benar-benar mencerminkan karakteristik populasi. Sampel yang representatif penting agar hasil penelitian dapat digeneralisasi ke populasi yang lebih luas. Menurut Sugiyono (2016), representativitas dapat diuji dengan membandingkan distribusi variabel antara sampel dan populasi, menggunakan metode seperti uji Chi-Square atau uji Kolmogorov-Smirnov. Jika tidak ada perbedaan signifikan, maka sampel dianggap representatif. Representativitas juga dapat dievaluasi melalui deskripsi data, seperti melihat kesamaan demografi atau nilai rata-rata antara sampel dan populasi. Sampel yang tidak representatif dapat menyebabkan bias dalam hasil penelitian, sehingga memengaruhi validitas dan reliabilitas temuan.
Uji Non-Multikolinearitas

Uji non-multikolinearitas dilakukan untuk memastikan bahwa tidak ada hubungan linear yang terlalu kuat antara variabel independen dalam model regresi. Ketika multikolinearitas terjadi, estimasi parameter regresi dapat menjadi tidak stabil dan sulit diinterpretasikan, yang dapat mempengaruhi hasil analisis secara keseluruhan. Salah satu cara untuk mendeteksi multikolinearitas adalah dengan menggunakan Variance Inflation Factor (VIF), di mana nilai VIF lebih dari 10 menandakan adanya multikolinearitas yang serius. Selain itu, Tolerance Value yang rendah (kurang dari 0,1) dan korelasi yang sangat tinggi antar variabel independen juga dapat menjadi indikator adanya multikolinearitas. Jika ditemukan multikolinearitas, beberapa langkah perbaikan yang dapat dilakukan antara lain menghapus variabel yang menyebabkan masalah, melakukan transformasi data, atau menggunakan metode alternatif seperti regresi ridge atau analisis komponen utama (PCA). Uji ini sangat penting untuk memastikan hasil model regresi yang valid, sehingga dapat digunakan untuk pengambilan keputusan yang tepat dan akurat dalam penelitian.

2.3 Standarisasi

Standarisasi dalam konteks analisis data merujuk pada proses mengubah variabel-variabel dalam dataset agar memiliki skala yang seragam, biasanya dengan cara mengubahnya menjadi variabel yang terdistribusi normal dengan rata-rata 0 dan deviasi standar 1. Proses ini sangat berguna dalam analisis statistik dan pembelajaran mesin, terutama ketika variabel memiliki satuan atau skala yang berbeda, yang bisa memengaruhi hasil analisis. Proses standarisasi umumnya dilakukan dengan rumus berikut:

\[ Z= \frac {X-\mu}{\sigma} \]

Dimana:

$Z$ adalah nilai standar

$X$ adalah nilai asli

$\mu$ adalah rata-rata data

$\sigma$ adalah deviasi standar data

2.4 Jarak Euclidean

Jarak Euclidean merupakan ukuran jarak yang paling umum digunakan untuk menghitung sejauh mana dua titik dalam ruang berdimensi dua atau lebih terpisah. Jarak Euclidean antara dua titik $A(X1,Y1)$dan $B(X2,Y2)$ di ruang dua dimensi dihitung dengan rumus berikut:

\[ d(A,B) = \sqrt(X_1 - X_2)^2 + (Y_1 - Y_2)^2 \]

2.5 Indeks Silhoutte

Indeks Silhouette merupakan salah satu metode yang digunakan untuk mengevaluasi kualitas hasil klasterisasi. Indeks ini mengukur seberapa baik sebuah titik data berada dalam klasternya dibandingkan dengan klaster lainnya. Indeks Silhouette dapat dihitung dengan rumus:

\[ S(i)= \frac {b(i)-a(i)}{max[a(i),b(i)]} \]

Dimana:

$a(i)$ adalah Jarak rata-rata antara titik data(i) dan semua titik lain dalam klaster yang sama.

$b(i)$ adalah Jarak rata-rata antara titik data(i) dan titik data dalam klaster terdekat yang berbeda.

2.6 Centroid Linkage

Centroid Linkage merupakan salah satu metode dalam klasterisasi hierarkis yang digunakan untuk mengukur jarak antara dua klaster. Metode ini menghitung jarak antara dua klaster berdasarkan posisi centroid (titik pusat) masing-masing klaster.

3 SOURCE CODE

3.1 Library

> library(psych)
> library(GPArotation)
> library(clValid)
> library(ggplot2)
> library(cluster)
> library(factoextra)
> library(tidyverse)
> library(car)
> library(readxl)

Library yang akan digunakan untuk analisis cluster, sebagai berikut:

library(psych) digunakan untuk analisis statistik deskriptif dan psikometrik, seperti analisis faktor eksploratori dan uji reliabilitas.
library(GPArotation) digunakan untuk melakukan rotasi pada hasil analisis faktor, dengan berbagai metode rotasi seperti Varimax dan Promax.
library(clValid) digunakan untuk mengevaluasi hasil klastering, dengan mengukur kualitas klaster berdasarkan stabilitas dan compactness.
library(ggplot2) digunakan untuk membuat visualisasi data, seperti grafik scatter, bar chart, dan boxplot dengan cara yang mudah dipahami.
library(cluster) digunakan untuk analisis klaster, seperti k-means dan PAM, serta evaluasi koherensi antar klaster.
library(factoextra) digunakan untuk visualisasi hasil analisis multivariat, seperti PCA dan klastering, agar lebih mudah dipahami.
library(tidyverse) digunakan untuk manipulasi dan analisis data dengan pustaka seperti dplyr (untuk transformasi data), tidyr (untuk merapikan data), dan ggplot2 (untuk visualisasi).
library(car) digunakan untuk analisis regresi, dengan alat untuk memeriksa asumsi regresi, seperti multikolinearitas dan outlier.
library(readxl) digunakan untuk membaca file Excel (.xls, .xlsx) ke dalam R, memudahkan pengolahan data dari Excel.

3.2 Impor Data

> data <- read_excel("C:/Users/Marsella/Downloads/dataanmul.xlsx")
> data<-data.frame(data)
> View(data)

Function read_excel() digunakan untuk membaca file Excel dari lokasi tertentu pada komputer dan memuatnya ke dalam R sebagai objek data. Argument yang diisikan dalam function adalah "C:/Users/Marsella/Downloads/dataanmul.xlsx". Argument tersebut adalah lokasi file yang ingin dibaca.
Function data.frame digunakan untuk mengonversi objek data ke dalam format data frame. Argument yang diisikan dalam function adalah data. Argument tersebut digunakan untuk menentukan data yang akan digunakan.
Function View digunakan untuk menampilkan data dalam bentuk tabel di jendela RStudio. Argument yang diisikan dalam function adalah data. Argument tersebut digunakan untuk menentukan data yang akan digunakan.

3.3 Statistika Deskriptif

> #Statistik Deskriptif
> statdes <- summary(data)
> statdes
   Provinsi              Padi             Kedelai          Ubi.Kayu      
 Length:32          Min.   :    1323   Min.   :     1   Min.   :   3776  
 Class :character   1st Qu.:  487198   1st Qu.:  1616   1st Qu.:  47856  
 Mode  :character   Median :  810530   Median :  3785   Median :  91842  
                    Mean   : 2157659   Mean   : 26349   Mean   : 755541  
                    3rd Qu.: 2177771   3rd Qu.:  9198   3rd Qu.: 330984  
                    Max.   :12198707   Max.   :361986   Max.   :8387351  
   Ubi.Jalar     
 Min.   :  1916  
 1st Qu.: 13325  
 Median : 28172  
 Mean   : 77608  
 3rd Qu.: 83661  
 Max.   :436577

Function summary digunakan untuk menghasilkan ringkasan statistik deskriptif dari data. Argument yang diisikan dalam function adalah data. Argument tersebut digunakan untuk menentukan data yang akan digunakan Variabel statdes digunakan untuk menyimpan dan menampilkan hasil statistik deskriptif.

3.4 Analisis Cluster

3.4.1 Uji Asumsi Analisis Cluster

3.4.1.1 Uji Sampel Respresentatif

> # Uji Sampel Representatif
> kmo <- KMO(data[,2:5])
> kmo
Kaiser-Meyer-Olkin factor adequacy
Call: KMO(r = data[, 2:5])
Overall MSA =  0.73
MSA for each item = 
     Padi   Kedelai  Ubi.Kayu Ubi.Jalar 
     0.65      0.77      0.82      0.76

Function KMO() digunakan untuk menghitung nilai Kaiser-Meyer-Olkin (KMO) Measure of Sampling Adequacy. Argument yang diisikan dalam function adalah data[, 2:5]. Argument tersebut digunakan untuk memilih kolom ke 2 hingga ke 5 dari data frame data.
Variabel kmo digunakan untuk menyimpan dan menampilkan hasil perhitungan KMO.

3.4.1.2 Uji Non-Multikolinearitas

> #Uji Non-Multikolinearitas
> korelasi <- cor(data[,2:5], method = 'pearson')
> korelasi
               Padi   Kedelai  Ubi.Kayu Ubi.Jalar
Padi      1.0000000 0.7726127 0.5831813 0.7363104
Kedelai   0.7726127 1.0000000 0.4706719 0.5673858
Ubi.Kayu  0.5831813 0.4706719 1.0000000 0.3765309
Ubi.Jalar 0.7363104 0.5673858 0.3765309 1.0000000

Function cor digunakan untuk menghitung matriks korelasi antara semua pasangan variabel.
- Argument yang diisikan dalam function adalah data[, 2:5]. Argument tersebut digunakan untuk memilih kolom ke 2 hingga ke 5 dari data frame data.
- Argument yang diisikan dalam function adalah method= 'pearson'. Argument tersebut digunakan untuk menetukan metode yang akan digunakan yaitu korelasi Pearson untuk hubungan linear.
Variabel korelasi digunakan untuk menyimpan dan menampilkan hasil matriks korelasi.

3.4.2 Standarisasi

> #Standarisasi
> datastand <- scale(data[,2:5])
> datastand
             Padi     Kedelai    Ubi.Kayu   Ubi.Jalar
 [1,] -0.11488249  0.36664086 -0.41394920 -0.55268736
 [2,]  0.48511843 -0.30583810  0.24006378  0.93738589
 [3,]  0.06562201 -0.36886291 -0.31273056  0.40663434
 [4,] -0.51241328 -0.32391407 -0.38490922 -0.58650984
 [5,] -0.47722117 -0.33364617 -0.41353311  0.02106486
 [6,]  0.35424666 -0.20730430 -0.35317531 -0.51807350
 [7,] -0.49069053 -0.35118147 -0.40277585 -0.34697403
 [8,]  0.29389954 -0.26822487  4.40436380 -0.25977705
 [9,] -0.66492434 -0.38501000 -0.42825451 -0.63916179
[10,] -0.67148619 -0.38480542 -0.43160345 -0.65109256
[11,]  2.83817616  0.30799987  0.79385652  3.08779762
[12,]  2.51465275  1.84219295  1.78494331  0.76874656
[13,] -0.37724261  0.14151676  0.06395235 -0.62416016
[14,]  3.12679739  4.90458787  2.01438107  2.87601999
[15,] -0.09085631 -0.30056289 -0.38824547 -0.38581140
[16,] -0.40236368 -0.26505390 -0.35107695 -0.13123095
[17,] -0.01352349  0.69859879 -0.39016377 -0.55375399
[18,] -0.45436368 -0.34438654  0.07883477  0.63873815
[19,] -0.26704509 -0.36545814 -0.34740483 -0.53709220
[20,] -0.43663217 -0.36018293 -0.40911709 -0.58564106
[21,] -0.02224584 -0.32861938 -0.38406318 -0.49890857
[22,] -0.49690330 -0.36509282 -0.38825124 -0.52678718
[23,] -0.48036695 -0.34158089 -0.39956195 -0.31294510
[24,] -0.35292464 -0.26517080 -0.38198618 -0.43590860
[25,]  0.88604692  0.05245202 -0.04186697  0.14507778
[26,] -0.51112439 -0.33081129 -0.33461904 -0.41458460
[27,] -0.59536005 -0.33459600 -0.43384839 -0.65035280
[28,] -0.54349551 -0.33794232 -0.40817352 -0.52487757
[29,] -0.64565606 -0.37993937 -0.36703740 -0.50060314
[30,] -0.65144346 -0.36598419 -0.36878603 -0.36942487
[31,] -0.66247984 -0.37552632 -0.43040249 -0.57598978
[32,] -0.62891480 -0.32429401 -0.41485987  2.30088287
attr(,"scaled:center")
      Padi    Kedelai   Ubi.Kayu  Ubi.Jalar 
2157658.81   26348.53  755541.41   77608.12 
attr(,"scaled:scale")
      Padi    Kedelai   Ubi.Kayu  Ubi.Jalar 
3211288.40   68433.37 1732783.65  116254.02

> rownames(datastand) <- 1:nrow(datastand)

Function scale digunakan untuk melakukan standarisasi data dengan mengubah nilai dalam setiap kolom menjadi skala standar. Argument yang diisikan dalam function adalah data[, 2:5]. Argument tersebut digunakan untuk memilih kolom ke 2 hingga ke 5 dari data frame data. Variabel datastand digunakan untuk menyimpan dan menampilkan hasil data yang sudah di standarkan.
Function nrow digunakan untuk menghitung jumlah baris pada data. Argument yang diisikan dalam function adalah 1:nrow(datastand). Argument tersebut digunakan untuk membuat urutan angka dari 1 hingga jumlah baris pada datastand.
Function rownames digunakan untuk mengganti nama baris pada data dengan nilai yang ditentukan. Argument yang diisikan dalam function adalah datastand. Argument tersebut digunakan untuk menentukan data yang akan digunakan.

3.4.3 Menghitung Jarak Euclidean

> #Menghitung Jarak Euclidien
> jarak <- dist(datastand, method = "euclidean")
> jarak
            1          2          3          4          5          6          7
2  1.86018287                                                                  
3  1.22641387 0.87591562                                                       
4  0.79805020 1.92568059 1.15225445                                            
5  0.97513231 1.48111577 0.67434702 0.60934354                                 
6  0.74457154 1.58023131 0.98291695 0.87771742 1.00080681                      
7  0.83602835 1.73697506 0.94118543 0.24271796 0.36885940 0.87541690           
8  4.88590768 4.33734633 4.77046350 4.86797001 4.88773055 4.76531726 4.87223340
9  0.93552526 2.06422346 1.28101289 0.17788585 0.68846690 1.04431226 0.34281866
10 0.94046501 2.07806900 1.29479713 0.18805113 0.70176799 1.05236855 0.35656240
11 4.84106597 3.29311930 4.06919787 5.14934839 4.71870837 4.55559357 4.97448077
12 3.95891720 3.33888288 3.92656090 4.51665012 4.36782691 3.88526068 4.45801830
13 0.59414808 1.84749404 1.28881488 0.66165794 0.93812751 0.91760697 0.74181490
14 6.98242605 6.40574043 6.97806505 7.63719802 7.38062204 7.13748365 7.54583782
15 0.68865548 1.57397533 0.81413949 0.46748963 0.56263671 0.47490736 0.40515320
16 0.81440906 1.51019110 0.72149596 0.47328525 0.19339940 0.85173105 0.25384532
17 0.34790316 1.96932022 1.44016670 1.13821094 1.26945187 0.97905900 1.17159891
18 1.51100570 0.99964888 0.69150545 1.31151821 0.79030641 1.48239270 1.09769900
19 0.75086201 1.75741558 1.00124975 0.25647639 0.60091450 0.64141335 0.29905179
20 0.79555324 1.89568574 1.11634915 0.08743559 0.60865692 0.81028147 0.24496019
21 0.70409778 1.64633343 0.91347501 0.49795678 0.69156971 0.39722199 0.49333938
22 0.82625981 1.87255450 1.09244132 0.07425776 0.54968837 0.86640621 0.18104103
23 0.83237028 1.70466661 0.90784498 0.27639004 0.33441098 0.87111392 0.03697357
24 0.68593655 1.72535618 0.94900384 0.22710499 0.47953984 0.71485727 0.18632993
25 1.31373349 0.99817461 0.99618383 1.65838500 1.47006347 0.94178945 1.55906902
26 0.81780975 1.77516421 1.00447199 0.17926691 0.44404431 0.88044041 0.10024483
27 0.85587752 2.03551776 1.25298158 0.11603980 0.68203525 0.97054729 0.32285440
28 0.82519895 1.90197354 1.11749900 0.07417993 0.54999328 0.90888854 0.18612480
29 0.91870349 1.92886657 1.15415261 0.16909121 0.55209847 1.01494122 0.22298087
30 0.92750309 1.83680237 1.05811213 0.26169663 0.43114230 1.02904423 0.16649316
31 0.92276145 2.01535833 1.22864703 0.16542100 0.62676434 1.03506026 0.28864456
32 2.98068517 1.87868562 2.02063744 2.88989732 2.28487863 2.98841314 2.65162613
            8          9         10         11         12         13         14
2                                                                              
3                                                                              
4                                                                              
5                                                                              
6                                                                              
7                                                                              
8                                                                              
9  4.94278408                                                                  
10 4.94825906 0.01402350                                                       
11 5.57201916 5.30431500 5.31777782                                            
12 4.15990777 4.68514609 4.69468058 2.96962399                                 
13 4.42608931 0.77619833 0.78095790 4.96769818 4.01962153                      
14 7.09426123 7.78973496 7.79923091 4.76932420 3.77441740 7.14286889           
15 4.80978909 0.63440725 0.64535406 4.73422693 4.17562374 0.73399219 7.33887240
16 4.80786163 0.58930270 0.60291622 4.74368071 4.28042243 0.76233805 7.33615184
17 4.90949835 1.26778409 1.27195584 4.79036122 3.76557846 0.80858548 6.71544077
18 4.48143163 1.39145745 1.40463031 4.21610900 4.06495965 1.35542735 7.00915234
19 4.79377951 0.41910027 0.42898999 4.95360964 4.34323493 0.66780431 7.51790657
20 4.88036049 0.23656798 0.24607360 5.11000344 4.49542089 0.69318693 7.63362839
21 4.80518598 0.66169433 0.67088743 4.77904324 4.17849486 0.75063745 7.37872679
22 4.86571741 0.20701709 0.21954274 5.10278462 4.51029517 0.69637744 7.63233122
23 4.86676475 0.37840204 0.39212917 4.94206255 4.43634210 0.74546515 7.51867944
24 4.83306935 0.39390083 0.40565985 4.93059434 4.33713725 0.63268157 7.45294017
25 4.51512433 1.83336082 1.84469108 3.63787673 3.09543665 1.48551597 6.34431921
26 4.80977176 0.29290688 0.30655059 5.01657575 4.44635715 0.66618255 7.54915620
27 4.93518332 0.08681758 0.09122370 5.26147587 4.62033217 0.72301467 7.72868916
28 4.89253357 0.17442608 0.18723502 5.13315136 4.53745362 0.70020062 7.64133808
29 4.87026811 0.15278420 0.16585149 5.18021641 4.60083617 0.73822814 7.69612701
30 4.86808096 0.27719708 0.28989423 5.09272272 4.56444912 0.76478487 7.63324515
31 4.93975007 0.06396274 0.07621736 5.25775130 4.66138639 0.77162227 7.75445459
32 5.53503624 2.94092250 2.95294993 3.80798444 4.66500358 3.01088964 6.90496734
           15         16         17         18         19         20         21
2                                                                              
3                                                                              
4                                                                              
5                                                                              
6                                                                              
7                                                                              
8                                                                              
9                                                                              
10                                                                             
11                                                                             
12                                                                             
13                                                                             
14                                                                             
15                                                                             
16 0.40557420                                                                  
17 1.01612639 1.12244230                                                       
18 1.18402865 0.88694654 1.71001626                                            
19 0.24455616 0.43946441 1.09480423 1.26482784                                 
20 0.40433032 0.46912798 1.14079609 1.31824330 0.18695721                      
21 0.13528867 0.53367131 1.02873636 1.30210944 0.25315132 0.42527933           
22 0.43464059 0.42046662 1.16868591 1.25652576 0.23368687 0.08692456 0.47689074
23 0.39854558 0.21751257 1.16532993 1.06548039 0.31470402 0.27697139 0.49483894
24 0.26922355 0.31020651 1.02859097 1.17634458 0.16990243 0.19796502 0.34256022
25 1.21687339 1.39024070 1.35514171 1.48743097 1.43630754 1.60890343 1.22557245
26 0.42572751 0.31098727 1.15314575 1.13306616 0.27558427 0.20303215 0.49856022
27 0.57248935 0.56428921 1.19048937 1.39448031 0.35922644 0.17506707 0.59490296
28 0.47541139 0.42830899 1.16466563 1.26458080 0.28464712 0.12493002 0.52253596
29 0.57247735 0.45725310 1.25147753 1.23885323 0.38114677 0.23039847 0.62575298
30 0.56496467 0.35955196 1.25487572 1.12074259 0.41991888 0.30749566 0.64364989
31 0.60853759 0.53288604 1.25578768 1.33385477 0.40604389 0.22757154 0.64821962
32 2.74027454 2.44419327 3.09428145 1.74279411 2.86204418 2.89314950 2.86493395
           22         23         24         25         26         27         28
2                                                                              
3                                                                              
4                                                                              
5                                                                              
6                                                                              
7                                                                              
8                                                                              
9                                                                              
10                                                                             
11                                                                             
12                                                                             
13                                                                             
14                                                                             
15                                                                             
16                                                                             
17                                                                             
18                                                                             
19                                                                             
20                                                                             
21                                                                             
22                                                                             
23 0.21606163                                                                  
24 0.19751565 0.19367233                                                       
25 1.63042313 1.53625501 1.44539304                                            
26 0.12978171 0.12494068 0.17898098 1.58047594                                 
27 0.16724638 0.35817833 0.33506833 1.76938747 0.26933822                      
28 0.05751979 0.22133229 0.22408526 1.66703927 0.13665116 0.13821853           
29 0.15324306 0.25507890 0.32136017 1.74806064 0.17018366 0.17741021 0.12034101
30 0.22141645 0.18439038 0.32229048 1.70603475 0.15534915 0.29543896 0.19533566
31 0.17810691 0.32320433 0.36051302 1.80332994 0.24522236 0.10826861 0.13666168
32 2.83116893 2.61814744 2.75150402 2.68768783 2.71921299 2.95150548 2.82709206
           29         30         31
2                                  
3                                  
4                                  
5                                  
6                                  
7                                  
8                                  
9                                  
10                                 
11                                 
12                                 
13                                 
14                                 
15                                 
16                                 
17                                 
18                                 
19                                 
20                                 
21                                 
22                                 
23                                 
24                                 
25                                 
26                                 
27                                 
28                                 
29                                 
30 0.13205694                      
31 0.10000398 0.21605208           
32 2.80249666 2.67112558 2.87756654

Function dist digunakan untuk menghitung matriks jarak antara baris-baris pada data berdasarkan metode tertentu.
- Argument yang diisikan dalam function adalah datastand. Argument tersebut digunakan untuk menentukan data yang akan digunakan.
- Argument yang diisikan dalam function adalah method = "euclidean". Argument tersebut digunakan untuk menentukan metode yang akan digunakan yaitu jarak euclidean.
Variabel jarak digunakan untuk menyimpan dan menampilkan hasil matriks jarak dari data.

3.4.4 Koefisien Korelasi Cophenetic

> #Koefisien Korelasi Cophenetic
> d1 <- dist(data[,2:5])

> #Single Linkage
> hiers <- hclust(dist(data[,2:5]), method = "single")
> #korelasi cophenetic
> hc1 <- hclust(d1, "single")
> d2 <- cophenetic(hc1)
> cors <- cor(d1,d2)
> cors
[1] 0.9514758

> #Average Linkage
> hierave <- hclust(dist(data[,2:5]), method = "ave")
> #korelasi cophenetic
> hc2 <- hclust(d1, "ave")
> d3 <- cophenetic(hc2)
> corave <- cor(d1,d3)
> corave
[1] 0.9805651

> #Complete Linkage
> hiercomp <- hclust(dist(data[,2:5]), method = "complete")
> #korelasi cophenetic
> hc3 <- hclust(d1, "complete")
> d4 <- cophenetic(hc3)
> corcomp <- cor(d1,d4)
> corcomp
[1] 0.9744458

> #Centorid Linkage
> hiercen <- hclust(dist(data[,2:5]), method = "centroid")
> #korelasi cophenetic
> hc4 <- hclust(d1, "centroid")
> d5 <- cophenetic(hc4)
> corcen <- cor(d1,d5)
> corcen
[1] 0.9787049

> #Ward
> hierward <- hclust(dist(data[,2:5]), method = "ward.D")
> #korelasi cophenetic
> hc5 <- hclust(d1,"ward.D")
> d6 <- cophenetic(hc5)
> corward <- cor(d1,d6)
> corward
[1] 0.9439246

> KorCop<-data.frame(cors,corave,corcomp,corcen,corward)
> KorCop
       cors    corave   corcomp    corcen   corward
1 0.9514758 0.9805651 0.9744458 0.9787049 0.9439246

Function dist digunakan untuk menghitung matriks jarak antara baris-baris pada data berdasarkan metode tertentu. Argument yang diisikan dalam function adalah data[,2:5]. Argument tersebut digunakan untuk memilih kolom ke 2 hingga ke 5 dari data frame pada data. Variabel d1 digunakan untuk menyimpan dan menampilkan hasil matriks jarak dari data.
Function hclust digunakan untuk melakukan analisis cluster hierarki dengan metode tertentu.
Function cophenetic digunakan untuk menghasilkan jarak cophenetic berdasarkan hasil clustering.

3.4.5 Indeks Validitas

> #Indeks Validitas
> inval <- clValid(datastand, 2:5, clMethods = "hierarchical", validation = "internal", metric = "euclidean", method = "average")
> summary(inval)

Clustering Methods:
 hierarchical 

Cluster sizes:
 2 3 4 5 

Validation Measures:
                                 2       3       4       5
                                                          
hierarchical Connectivity   6.0869  8.0159  9.7159 11.7159
             Dunn           0.5592  0.6490  1.0004  0.9597
             Silhouette     0.7345  0.7357  0.7123  0.6815

Optimal Scores:

             Score  Method       Clusters
Connectivity 6.0869 hierarchical 2       
Dunn         1.0004 hierarchical 4       
Silhouette   0.7357 hierarchical 3

> optimalScores(inval)
                 Score       Method Clusters
Connectivity 6.0869048 hierarchical        2
Dunn         1.0003733 hierarchical        4
Silhouette   0.7357179 hierarchical        3

> plot(inval)

Function clValid digunakan untuk mengevaluasi validitas clustering dengan mengukur indeks validitas internal.
- Argument yang diisikan dalam function adalah datastand. Argument tersebut digunakan untuk menentukan data yang akan digunakan.
- Argument yang diisikan dalam function adalah clMethods = "hierarchical". Argument tersebut digunakan untuk menentukan metode clustering yang akan digunakan yaitu hierarchical clustering.
- Argument yang diisikan dalam function adalah validation = "internal". Argument tersebut digunakan untuk mengukur performa clustering berdasarkan struktur data dengan menghitung validitas internal. Argument yang diisikan dalam function adalah metric = "euclidean". Argument tersebut digunakan untuk mengukur kesamaan antar data.
- Argument yang diisikan dalam function adalah method = "average". Argument tersebut digunakan untuk menentukan metode yang akan digunakan yaitu metode average linkage.
Function summary digunakan untuk menampilkan ringkasan dari hasil evaluasi clustering.
Function optimalScores digunakan untuk menampilkan skor optimal untuk setiap indeks validitas.
Function plot digunakan untuk menampilkan visualisasi indeks validitas untuk berbagai jumlah cluster dalam bentuk grafik.

3.4.6 Analasis Cluster Metode Centroid Linkage

3.4.6.1 Dendogram

> #Membuat Dendogram
> hirave <- hclust(dist(scale(data[,2:5])), method = "average")
> hirave

Call:
hclust(d = dist(scale(data[, 2:5])), method = "average")

Cluster method   : average 
Distance         : euclidean 
Number of objects: 32

> plot(hirave, labels(data$Provinsi), hang = 1, col = "blue", main = "Cluster Dendogram", sub = " ", xlab = "provinsi", ylab = "Jarak")

Function plot digunakan untuk membuat dendogram dari hasil clustering.
- Argument yang diisikan dalam function adalah hirave. Argument tersebut digunakan untuk menentukan data yang akan digunakan.
- Argument yang diisikan dalam function adalah labels(data$Provinsi). Argument tersebut digunakan untuk menampilkan nama provinsi pada sumbu x sebagai label.
- Argument yang diisikan dalam function adalah hang = 1. Argument tersebut digunakan untuk mengatur posisi ujung dendrogram sehingga label berada pada posisi yang sama.

3.4.6.2 Menentukan Jumlah Cluster

> #Menentukan Jumlah Cluster
> anggotaave <- data.frame(id = data$Provinsi, cutree(hirave, k = 3))
> anggotaave
                     id cutree.hirave..k...3.
1                  ACEH                     1
2        SUMATERA UTARA                     1
3        SUMATERA BARAT                     1
4                  RIAU                     1
5                 JAMBI                     1
6      SUMATERA SELATAN                     1
7              BENGKULU                     1
8               LAMPUNG                     2
9  KEP. BANGKA BELITUNG                     1
10            KEP. RIAU                     1
11           JAWA BARAT                     3
12          JAWA TENGAH                     3
13        DI YOGYAKARTA                     1
14           JAWA TIMUR                     3
15               BANTEN                     1
16                 BALI                     1
17  NUSA TENGGARA BARAT                     1
18  NUSA TENGGARA TIMUR                     1
19     KALIMANTAN BARAT                     1
20    KALIMANTAN TENGAH                     1
21   KALIMANTAN SELATAN                     1
22     KALIMANTAN TIMUR                     1
23       SULAWESI UTARA                     1
24      SULAWESI TENGAH                     1
25     SULAWESI SELATAN                     1
26    SULAWESI TENGGARA                     1
27            GORONTALO                     1
28       SULAWESI BARAT                     1
29               MALUKU                     1
30         MALUKU UTARA                     1
31          PAPUA BARAT                     1
32                PAPUA                     1

> clus_hier <- eclust(datastand, FUNcluster = "hclust", k = 3, hc_method = "average", graph = TRUE)
> fviz_dend(clus_hier, rect = TRUE, cex = 0.5)

Function cutree digunakan untuk memotong dendogram berdasarkan jumlah cluster yang diinginkan.
Function eclust digunakan untuk melakukan hirarchical clustering dan menghasilkan data clustering yang dapat divisualisasikan.
- Argument yang diisikan dalam function adalah datastand. Argument tersebut digunakan untuk menentukan data yang akan digunakan.
- Argument yang diisikan dalam function adalah FUNcluster = "hclust". Argument tersebut digunakan untuk menentukan metode analisis yang digunakan yaitu metode hirarchical clustering.
- Argument yang diisikan dalam function adalah k = 2. Argument tersebut digunakan untuk memotong dendogram menjadi 2 cluster.
- Argument yang diisikan dalam function adalah hc_method = "average". Argument tersebut digunakan untuk menentukan metode clustering yang digunakan yaitu metode average linkage.
- Argument yang diisikan dalam function adalah graph = TRUE. Argument tersebut digunakan untuk membuat visualisasi dendogram secara otomatis.
Function fivz_dend digunakan untuk memvisualisasikan dendogram.
- Argument yang diisikan dalam function adalah clus_hier. Argument tersebut digunakan untuk menentukan data yang akan digunakan.
- Argument yang diisikan dalam function adalah rect = TRUE. Argument tersebut digunakan untuk menambahkan kotak berwana disekitar cluster yang terbentuk sehingga viasualisasi dapat terlihat dengan jelas.
- Argument yang diisikan dalam function adalah cex = 0.5. Argument tersebut digunakan untuk mengatur ukuran teks label pada dendogram.

3.4.7 Karakteristik Setiap Cluster

> idclus = clus_hier$cluster
> idclus
 1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 
 1  1  1  1  1  1  1  2  1  1  3  3  1  3  1  1  1  1  1  1  1  1  1  1  1  1 
27 28 29 30 31 32 
 1  1  1  1  1  1

> aggregate(data,list(idclus),mean)
  Group.1 Provinsi     Padi    Kedelai  Ubi.Kayu Ubi.Jalar
1       1       NA  1151433   9761.857  198727.2  50733.57
2       2       NA  3101455   7993.000 8387351.0  47408.00
3       3       NA 11234501 187276.000 3408537.7 338504.00

Variabel idclus digunakan untuk menyimpan hasil ID cluster untuk setiap baris dalam data. clus_hier$cluster
Function aggregate digunakan untuk menghitung statistik agrerat yaitu mean pada setiap cluster.

4 HASIL DAN PEMBAHASAN

4.1 Statistika Deskriptif

> statdes
   Provinsi              Padi             Kedelai          Ubi.Kayu      
 Length:32          Min.   :    1323   Min.   :     1   Min.   :   3776  
 Class :character   1st Qu.:  487198   1st Qu.:  1616   1st Qu.:  47856  
 Mode  :character   Median :  810530   Median :  3785   Median :  91842  
                    Mean   : 2157659   Mean   : 26349   Mean   : 755541  
                    3rd Qu.: 2177771   3rd Qu.:  9198   3rd Qu.: 330984  
                    Max.   :12198707   Max.   :361986   Max.   :8387351  
   Ubi.Jalar     
 Min.   :  1916  
 1st Qu.: 13325  
 Median : 28172  
 Mean   : 77608  
 3rd Qu.: 83661  
 Max.   :436577

Berdasarkan output statistik deskriptif, dapat disimpulkan bahwa distribusi produksi tanaman pangan di berbagai provinsi memiliki ketidakseimbangan yang cukup signifikan. Untuk komoditas padi, rata-rata (mean) produksi adalah 2.157.659, yang lebih tinggi dari nilai median sebesar 810.530, mengindikasikan adanya beberapa provinsi dengan produksi padi yang sangat besar. Nilai maksimum sebesar 12.198.707 dan nilai minimum 1.323 menunjukkan adanya variasi yang sangat besar dalam produksi padi antar provinsi. Pada komoditas kedelai, nilai rata-rata 26.349 lebih tinggi dari median 3.785, meskipun distribusinya cenderung lebih merata dibandingkan padi, dengan nilai maksimum 361.986. Sementara itu, untuk ubi kayu dan ubi jalar, meskipun rata-rata produksinya lebih tinggi dari median, distribusinya tetap menunjukkan adanya beberapa provinsi dengan hasil produksi yang sangat besar, dengan nilai maksimum mencapai 8.387.351 untuk ubi kayu dan 436.577 untuk ubi jalar. Secara keseluruhan, distribusi produksi pada setiap komoditas menunjukkan ketimpangan antar provinsi, dengan beberapa provinsi memiliki produksi yang jauh lebih tinggi dari provinsi lainnya, yang terlihat dari perbedaan besar antara nilai minimum dan maksimum pada masing-masing hasil tanaman pangan.

4.2 Analisis Cluster

4.2.1 Uji Asumsi

4.2.1.1 Uji Sampel Respresentatif

> kmo
Kaiser-Meyer-Olkin factor adequacy
Call: KMO(r = data[, 2:5])
Overall MSA =  0.73
MSA for each item = 
     Padi   Kedelai  Ubi.Kayu Ubi.Jalar 
     0.65      0.77      0.82      0.76

Berdasarkan output dapat diketahui bahwa nilai uji KMO pada masing-masing variabel tersebut bernilai lebih dari 0,5 sehingga dapat disimpulkan bahwa sampel telah representatif atau sudah mewakili populasi.

4.2.1.2 Uji Non-Multikolinearitas

> korelasi
               Padi   Kedelai  Ubi.Kayu Ubi.Jalar
Padi      1.0000000 0.7726127 0.5831813 0.7363104
Kedelai   0.7726127 1.0000000 0.4706719 0.5673858
Ubi.Kayu  0.5831813 0.4706719 1.0000000 0.3765309
Ubi.Jalar 0.7363104 0.5673858 0.3765309 1.0000000

Berdasarkan output dapat diketahui bahwa nilai antar variabel kurang dari 0.8, sehingga dapat disimpulkan bahwa tidak terjaadi multikolinearitas antar variabel.

4.2.2 Standarisasi

> datastand <- scale(data[,2:5])
> datastand
             Padi     Kedelai    Ubi.Kayu   Ubi.Jalar
 [1,] -0.11488249  0.36664086 -0.41394920 -0.55268736
 [2,]  0.48511843 -0.30583810  0.24006378  0.93738589
 [3,]  0.06562201 -0.36886291 -0.31273056  0.40663434
 [4,] -0.51241328 -0.32391407 -0.38490922 -0.58650984
 [5,] -0.47722117 -0.33364617 -0.41353311  0.02106486
 [6,]  0.35424666 -0.20730430 -0.35317531 -0.51807350
 [7,] -0.49069053 -0.35118147 -0.40277585 -0.34697403
 [8,]  0.29389954 -0.26822487  4.40436380 -0.25977705
 [9,] -0.66492434 -0.38501000 -0.42825451 -0.63916179
[10,] -0.67148619 -0.38480542 -0.43160345 -0.65109256
[11,]  2.83817616  0.30799987  0.79385652  3.08779762
[12,]  2.51465275  1.84219295  1.78494331  0.76874656
[13,] -0.37724261  0.14151676  0.06395235 -0.62416016
[14,]  3.12679739  4.90458787  2.01438107  2.87601999
[15,] -0.09085631 -0.30056289 -0.38824547 -0.38581140
[16,] -0.40236368 -0.26505390 -0.35107695 -0.13123095
[17,] -0.01352349  0.69859879 -0.39016377 -0.55375399
[18,] -0.45436368 -0.34438654  0.07883477  0.63873815
[19,] -0.26704509 -0.36545814 -0.34740483 -0.53709220
[20,] -0.43663217 -0.36018293 -0.40911709 -0.58564106
[21,] -0.02224584 -0.32861938 -0.38406318 -0.49890857
[22,] -0.49690330 -0.36509282 -0.38825124 -0.52678718
[23,] -0.48036695 -0.34158089 -0.39956195 -0.31294510
[24,] -0.35292464 -0.26517080 -0.38198618 -0.43590860
[25,]  0.88604692  0.05245202 -0.04186697  0.14507778
[26,] -0.51112439 -0.33081129 -0.33461904 -0.41458460
[27,] -0.59536005 -0.33459600 -0.43384839 -0.65035280
[28,] -0.54349551 -0.33794232 -0.40817352 -0.52487757
[29,] -0.64565606 -0.37993937 -0.36703740 -0.50060314
[30,] -0.65144346 -0.36598419 -0.36878603 -0.36942487
[31,] -0.66247984 -0.37552632 -0.43040249 -0.57598978
[32,] -0.62891480 -0.32429401 -0.41485987  2.30088287
attr(,"scaled:center")
      Padi    Kedelai   Ubi.Kayu  Ubi.Jalar 
2157658.81   26348.53  755541.41   77608.12 
attr(,"scaled:scale")
      Padi    Kedelai   Ubi.Kayu  Ubi.Jalar 
3211288.40   68433.37 1732783.65  116254.02

> rownames(datastand) <- 1:nrow(datastand)

Setelah dilakukan uji asumsi dan telah memenuhi asumsi maka dapat dilanjutkan dengan standarisasi variabel ke dalam bentuk Z-score. Hasil stadarisasi digunakan dalam pengelompokan provinsi di Indonesia berdasarkan hasil tanaman pangan.

4.2.3 Menghitung Jarak Euclidean

> jarak
            1          2          3          4          5          6          7
2  1.86018287                                                                  
3  1.22641387 0.87591562                                                       
4  0.79805020 1.92568059 1.15225445                                            
5  0.97513231 1.48111577 0.67434702 0.60934354                                 
6  0.74457154 1.58023131 0.98291695 0.87771742 1.00080681                      
7  0.83602835 1.73697506 0.94118543 0.24271796 0.36885940 0.87541690           
8  4.88590768 4.33734633 4.77046350 4.86797001 4.88773055 4.76531726 4.87223340
9  0.93552526 2.06422346 1.28101289 0.17788585 0.68846690 1.04431226 0.34281866
10 0.94046501 2.07806900 1.29479713 0.18805113 0.70176799 1.05236855 0.35656240
11 4.84106597 3.29311930 4.06919787 5.14934839 4.71870837 4.55559357 4.97448077
12 3.95891720 3.33888288 3.92656090 4.51665012 4.36782691 3.88526068 4.45801830
13 0.59414808 1.84749404 1.28881488 0.66165794 0.93812751 0.91760697 0.74181490
14 6.98242605 6.40574043 6.97806505 7.63719802 7.38062204 7.13748365 7.54583782
15 0.68865548 1.57397533 0.81413949 0.46748963 0.56263671 0.47490736 0.40515320
16 0.81440906 1.51019110 0.72149596 0.47328525 0.19339940 0.85173105 0.25384532
17 0.34790316 1.96932022 1.44016670 1.13821094 1.26945187 0.97905900 1.17159891
18 1.51100570 0.99964888 0.69150545 1.31151821 0.79030641 1.48239270 1.09769900
19 0.75086201 1.75741558 1.00124975 0.25647639 0.60091450 0.64141335 0.29905179
20 0.79555324 1.89568574 1.11634915 0.08743559 0.60865692 0.81028147 0.24496019
21 0.70409778 1.64633343 0.91347501 0.49795678 0.69156971 0.39722199 0.49333938
22 0.82625981 1.87255450 1.09244132 0.07425776 0.54968837 0.86640621 0.18104103
23 0.83237028 1.70466661 0.90784498 0.27639004 0.33441098 0.87111392 0.03697357
24 0.68593655 1.72535618 0.94900384 0.22710499 0.47953984 0.71485727 0.18632993
25 1.31373349 0.99817461 0.99618383 1.65838500 1.47006347 0.94178945 1.55906902
26 0.81780975 1.77516421 1.00447199 0.17926691 0.44404431 0.88044041 0.10024483
27 0.85587752 2.03551776 1.25298158 0.11603980 0.68203525 0.97054729 0.32285440
28 0.82519895 1.90197354 1.11749900 0.07417993 0.54999328 0.90888854 0.18612480
29 0.91870349 1.92886657 1.15415261 0.16909121 0.55209847 1.01494122 0.22298087
30 0.92750309 1.83680237 1.05811213 0.26169663 0.43114230 1.02904423 0.16649316
31 0.92276145 2.01535833 1.22864703 0.16542100 0.62676434 1.03506026 0.28864456
32 2.98068517 1.87868562 2.02063744 2.88989732 2.28487863 2.98841314 2.65162613
            8          9         10         11         12         13         14
2                                                                              
3                                                                              
4                                                                              
5                                                                              
6                                                                              
7                                                                              
8                                                                              
9  4.94278408                                                                  
10 4.94825906 0.01402350                                                       
11 5.57201916 5.30431500 5.31777782                                            
12 4.15990777 4.68514609 4.69468058 2.96962399                                 
13 4.42608931 0.77619833 0.78095790 4.96769818 4.01962153                      
14 7.09426123 7.78973496 7.79923091 4.76932420 3.77441740 7.14286889           
15 4.80978909 0.63440725 0.64535406 4.73422693 4.17562374 0.73399219 7.33887240
16 4.80786163 0.58930270 0.60291622 4.74368071 4.28042243 0.76233805 7.33615184
17 4.90949835 1.26778409 1.27195584 4.79036122 3.76557846 0.80858548 6.71544077
18 4.48143163 1.39145745 1.40463031 4.21610900 4.06495965 1.35542735 7.00915234
19 4.79377951 0.41910027 0.42898999 4.95360964 4.34323493 0.66780431 7.51790657
20 4.88036049 0.23656798 0.24607360 5.11000344 4.49542089 0.69318693 7.63362839
21 4.80518598 0.66169433 0.67088743 4.77904324 4.17849486 0.75063745 7.37872679
22 4.86571741 0.20701709 0.21954274 5.10278462 4.51029517 0.69637744 7.63233122
23 4.86676475 0.37840204 0.39212917 4.94206255 4.43634210 0.74546515 7.51867944
24 4.83306935 0.39390083 0.40565985 4.93059434 4.33713725 0.63268157 7.45294017
25 4.51512433 1.83336082 1.84469108 3.63787673 3.09543665 1.48551597 6.34431921
26 4.80977176 0.29290688 0.30655059 5.01657575 4.44635715 0.66618255 7.54915620
27 4.93518332 0.08681758 0.09122370 5.26147587 4.62033217 0.72301467 7.72868916
28 4.89253357 0.17442608 0.18723502 5.13315136 4.53745362 0.70020062 7.64133808
29 4.87026811 0.15278420 0.16585149 5.18021641 4.60083617 0.73822814 7.69612701
30 4.86808096 0.27719708 0.28989423 5.09272272 4.56444912 0.76478487 7.63324515
31 4.93975007 0.06396274 0.07621736 5.25775130 4.66138639 0.77162227 7.75445459
32 5.53503624 2.94092250 2.95294993 3.80798444 4.66500358 3.01088964 6.90496734
           15         16         17         18         19         20         21
2                                                                              
3                                                                              
4                                                                              
5                                                                              
6                                                                              
7                                                                              
8                                                                              
9                                                                              
10                                                                             
11                                                                             
12                                                                             
13                                                                             
14                                                                             
15                                                                             
16 0.40557420                                                                  
17 1.01612639 1.12244230                                                       
18 1.18402865 0.88694654 1.71001626                                            
19 0.24455616 0.43946441 1.09480423 1.26482784                                 
20 0.40433032 0.46912798 1.14079609 1.31824330 0.18695721                      
21 0.13528867 0.53367131 1.02873636 1.30210944 0.25315132 0.42527933           
22 0.43464059 0.42046662 1.16868591 1.25652576 0.23368687 0.08692456 0.47689074
23 0.39854558 0.21751257 1.16532993 1.06548039 0.31470402 0.27697139 0.49483894
24 0.26922355 0.31020651 1.02859097 1.17634458 0.16990243 0.19796502 0.34256022
25 1.21687339 1.39024070 1.35514171 1.48743097 1.43630754 1.60890343 1.22557245
26 0.42572751 0.31098727 1.15314575 1.13306616 0.27558427 0.20303215 0.49856022
27 0.57248935 0.56428921 1.19048937 1.39448031 0.35922644 0.17506707 0.59490296
28 0.47541139 0.42830899 1.16466563 1.26458080 0.28464712 0.12493002 0.52253596
29 0.57247735 0.45725310 1.25147753 1.23885323 0.38114677 0.23039847 0.62575298
30 0.56496467 0.35955196 1.25487572 1.12074259 0.41991888 0.30749566 0.64364989
31 0.60853759 0.53288604 1.25578768 1.33385477 0.40604389 0.22757154 0.64821962
32 2.74027454 2.44419327 3.09428145 1.74279411 2.86204418 2.89314950 2.86493395
           22         23         24         25         26         27         28
2                                                                              
3                                                                              
4                                                                              
5                                                                              
6                                                                              
7                                                                              
8                                                                              
9                                                                              
10                                                                             
11                                                                             
12                                                                             
13                                                                             
14                                                                             
15                                                                             
16                                                                             
17                                                                             
18                                                                             
19                                                                             
20                                                                             
21                                                                             
22                                                                             
23 0.21606163                                                                  
24 0.19751565 0.19367233                                                       
25 1.63042313 1.53625501 1.44539304                                            
26 0.12978171 0.12494068 0.17898098 1.58047594                                 
27 0.16724638 0.35817833 0.33506833 1.76938747 0.26933822                      
28 0.05751979 0.22133229 0.22408526 1.66703927 0.13665116 0.13821853           
29 0.15324306 0.25507890 0.32136017 1.74806064 0.17018366 0.17741021 0.12034101
30 0.22141645 0.18439038 0.32229048 1.70603475 0.15534915 0.29543896 0.19533566
31 0.17810691 0.32320433 0.36051302 1.80332994 0.24522236 0.10826861 0.13666168
32 2.83116893 2.61814744 2.75150402 2.68768783 2.71921299 2.95150548 2.82709206
           29         30         31
2                                  
3                                  
4                                  
5                                  
6                                  
7                                  
8                                  
9                                  
10                                 
11                                 
12                                 
13                                 
14                                 
15                                 
16                                 
17                                 
18                                 
19                                 
20                                 
21                                 
22                                 
23                                 
24                                 
25                                 
26                                 
27                                 
28                                 
29                                 
30 0.13205694                      
31 0.10000398 0.21605208           
32 2.80249666 2.67112558 2.87756654

Setelah dilakukan standarisasi data, langkah berikutnya yaitu menghitung jarak antar data berdasarkan nilai tengah peubah dalam satu kelompok menggunakan metode Euclidean.

4.2.4 Koefisien Korelasi Cophenetic

> KorCop
       cors    corave   corcomp    corcen   corward
1 0.9514758 0.9805651 0.9744458 0.9787049 0.9439246

Berdasarkan output dapat disimpulkan bahwa metode Centroid Linkage memiliki nilai koefisien yang paling mendekati 1 dan tertinggi dibandingkan metode lainnya, yaitu 0,98056. Sehingga metode cluster yang terbaik dan akan digunakan dalah metode Centroid Linkage.

4.2.5 Indeks Validitas

> #Indeks Validitas 
> inval <- clValid(datastand, 2:5, clMethods = "hierarchical", validation = "internal", metric = "euclidean", method = "average") 
> summary(inval)

Clustering Methods:
 hierarchical 

Cluster sizes:
 2 3 4 5 

Validation Measures:
                                 2       3       4       5
                                                          
hierarchical Connectivity   6.0869  8.0159  9.7159 11.7159
             Dunn           0.5592  0.6490  1.0004  0.9597
             Silhouette     0.7345  0.7357  0.7123  0.6815

Optimal Scores:

             Score  Method       Clusters
Connectivity 6.0869 hierarchical 2       
Dunn         1.0004 hierarchical 4       
Silhouette   0.7357 hierarchical 3

> optimalScores(inval)
                 Score       Method Clusters
Connectivity 6.0869048 hierarchical        2
Dunn         1.0003733 hierarchical        4
Silhouette   0.7357179 hierarchical        3

> plot(inval)

Berdasarkan output, jumlah cluster yang optimal untuk setiap indeks bagi setiap indeks dapat dilihat dari skor optimalnya. Dalam penelitian ini, menggunakan indeks Silhouette sebagai acuan dan hasilnya menunjukkan bahwa jumlah cluster yang optimal adalah 3 cluster.

4.2.6 Analasis Cluster Metode Centroid Linkage

> anggotaave
                     id cutree.hirave..k...3.
1                  ACEH                     1
2        SUMATERA UTARA                     1
3        SUMATERA BARAT                     1
4                  RIAU                     1
5                 JAMBI                     1
6      SUMATERA SELATAN                     1
7              BENGKULU                     1
8               LAMPUNG                     2
9  KEP. BANGKA BELITUNG                     1
10            KEP. RIAU                     1
11           JAWA BARAT                     3
12          JAWA TENGAH                     3
13        DI YOGYAKARTA                     1
14           JAWA TIMUR                     3
15               BANTEN                     1
16                 BALI                     1
17  NUSA TENGGARA BARAT                     1
18  NUSA TENGGARA TIMUR                     1
19     KALIMANTAN BARAT                     1
20    KALIMANTAN TENGAH                     1
21   KALIMANTAN SELATAN                     1
22     KALIMANTAN TIMUR                     1
23       SULAWESI UTARA                     1
24      SULAWESI TENGAH                     1
25     SULAWESI SELATAN                     1
26    SULAWESI TENGGARA                     1
27            GORONTALO                     1
28       SULAWESI BARAT                     1
29               MALUKU                     1
30         MALUKU UTARA                     1
31          PAPUA BARAT                     1
32                PAPUA                     1

Berdasarkan dendrogram hasil analisis klaster hierarkis, provinsi-provinsi di Indonesia dikelompokkan menjadi tiga kelompok berdasarkan kesamaan karakteristik produksinya. Kelompok pertama (warna merah) terdiri dari provinsi 11, 12, dan 14, yang memiliki pola produksi yang mirip satu sama lain. Kelompok kedua (warna hijau) hanya terdiri dari satu provinsi, yaitu provinsi 8. Hal ini menunjukkan bahwa provinsi 8 memiliki karakteristik produksi yang sangat berbeda dibandingkan provinsi lain, sehingga membentuk klaster tersendiri. Kelompok ketiga (warna biru) adalah kelompok terbesar, yang mencakup sebagian besar provinsi lain dengan pola produksi yang cukup mirip.

Pemotongan dendrogram dilakukan pada ketinggian sekitar 4 untuk menghasilkan tiga kelompok ini. Semakin rendah garis horizontal yang menghubungkan anggota klaster, semakin mirip karakteristik antar anggotanya. Sebaliknya, garis yang lebih tinggi menunjukkan bahwa klaster tersebut memiliki perbedaan yang cukup besar. Hasil pengelompokan ini membantu kita memahami pola produksi antarprovinsi dan bisa digunakan untuk analisis lebih lanjut, misalnya untuk menyusun kebijakan pertanian yang sesuai dengan karakteristik setiap kelompok provinsi.

Berdasarkan hasil analisis cluster menggunakan metode Centroid Linkage diperoleh anggota tiap cluster sebagai berikut:

Cluster	Provinsi
1	Aceh, Sumatra Utara, Sumatra Barat,Riau,Jambi,Sumatra Selatan,Bengkulu, Kep.Bangka Belitung, Kep. Riau, DI Yogyakarta,Banten, Bali, Nusa Tenggara Barat, Nusa Tenggara Timur, Kalimantan Barat, Kalimantan Tengah, Kalimantan Selatan, Kalimantan Timur, Sulawesi Utara, Sulawesi Tengah, Sulawesi Selatan, Sulawesi Tenggara, Gorontalo, Sulawesi Barat, Maluku, Maluku Utara, Papua Barat, dan Papua.
2	Lampung
3	Jawa Barat, Jawa Tengah, Jawa Timur

4.2.7 Karakteristik Setiap Cluster

> idclus = clus_hier$cluster
> idclus
 1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 
 1  1  1  1  1  1  1  2  1  1  3  3  1  3  1  1  1  1  1  1  1  1  1  1  1  1 
27 28 29 30 31 32 
 1  1  1  1  1  1

> aggregate(data,list(idclus),mean)
  Group.1 Provinsi     Padi    Kedelai  Ubi.Kayu Ubi.Jalar
1       1       NA  1151433   9761.857  198727.2  50733.57
2       2       NA  3101455   7993.000 8387351.0  47408.00
3       3       NA 11234501 187276.000 3408537.7 338504.00

Setelah dilakukannya penentuan jumlah cluster beserta anggota yang terbentuk. Maka berikutnya menentukan karakteristik untuk menjelaskan isi cluster tersebut. Berdasarkan output dapat disimpulkan bahwa pada cluster 1 terdapat 29 provinsi yang termasuk provinsi dengan produksi tanaman pangan yang cukup besar dalam berbagai jenis tanaman pangan. Pada cluster 2 yang hanya mencakup provinsi lampung merupakan kelompok provinsi dengan produksi ubi kayu yang dominan dibandingkan komoditas lainnya. Sedangkan pada cluster 3 terdapat 3 provinsi yang merupakan kelompok provinsi dengan produksi tanaman pangan yang tinggi terutama padi dan kedelai dibandingkan cluster lainnya.

5 KESIMPULAN DAN SARAN

5.1 Kesimpulan

Penelitian ini menganalisis data produksi tanaman pangan dari seluruh provinsi di Indonesia pada tahun 2012 dengan menggunakan metode centroid linkage sebagai teknik klasterisasi terbaik. Hasil analisis menghasilkan tiga cluster dengan karakteristik yang berbeda. Cluster 1 mencakup 29 provinsi dengan produksi tanaman pangan yang cukup besar dan beragam pada berbagai komoditas. Cluster 2, yang hanya terdiri dari Provinsi Lampung, memiliki ciri khas sebagai daerah dengan produksi ubi kayu yang dominan. Sementara itu, Cluster 3 terdiri dari 3 provinsi dengan produksi tanaman pangan yang tinggi, khususnya pada padi dan kedelai. Hasil klasterisasi ini menunjukkan adanya variasi fokus dan potensi produksi antar wilayah yang signifikan. Pola ini memberikan wawasan penting untuk memahami distribusi komoditas pangan di Indonesia, sekaligus mengidentifikasi kebutuhan dan potensi masing-masing wilayah. Dengan demikian, hasil penelitian ini dapat menjadi dasar yang kuat untuk pengambilan kebijakan di sektor pertanian, seperti pengembangan komoditas unggulan di setiap cluster, peningkatan infrastruktur pertanian, dan dukungan teknologi yang disesuaikan dengan karakteristik tiap wilayah. Upaya tersebut diharapkan mampu mendorong ketahanan pangan nasional dan meningkatkan kesejahteraan petani di seluruh Indonesia.

5.2 Saran

Berdasarkan hasil penelitian, disarankan agar setiap cluster memfokuskan pengembangan pada komoditas unggulan sesuai dengan karakteristik masing-masing. Cluster 1, yang memiliki beragam dan tinggi produksi pangan, dapat diarahkan untuk memperluas diversifikasi serta memperkuat integrasi pasar antar wilayah. Untuk Cluster 2, yang menonjol dalam produksi ubi kayu di Provinsi Lampung, diperlukan peningkatan kapasitas produksi, pengolahan hasil, serta akses pasar yang lebih luas. Sementara itu, Cluster 3 yang unggul dalam produksi padi dan kedelai memerlukan prioritas dalam pengembangan infrastruktur, seperti irigasi dan fasilitas penyimpanan hasil panen. Di samping itu, setiap wilayah membutuhkan dukungan teknologi pertanian yang sesuai dengan kebutuhan spesifiknya, serta pelatihan bagi petani untuk meningkatkan kemampuan mereka dalam mengadopsi teknologi modern. Pemerintah juga perlu merumuskan kebijakan yang mendukung pertanian berkelanjutan, termasuk akses yang lebih baik terhadap sumber daya alam, peningkatan konektivitas wilayah produksi, dan penciptaan iklim investasi yang kondusif. Melalui langkah-langkah ini, diharapkan ketahanan pangan nasional dapat diperkuat, sekaligus meningkatkan kesejahteraan petani di berbagai wilayah Indonesia.

6 DAFTAR PUSTAKA

Data BPS Produksi Tanaman Pangan (Ton) 2012. 2016. (Online), (https://www.bps.go.id/id/statistics-table/2/MjMjMg%253D%253D/produksi-tanaman-pangan.html)

Gudono. 2012. Analisis Data Multivariat edisi 2. Yogyakarta. BPFE

Santoso,Singgih. 2015. Menguasai Statistik Multivariat Konsep Dasar dan Aplikasi dengan SPSS. Jakarta. Elex Media Komputindo.

Silvi, R. 2018. Analisis Cluster dengan Data Pencilan Menggunakan Centroid Linkage dan KMeans Clustering untuk Pengelompokan Indikator HIV/AIDS di Indonesia. Jurnal Matematika “MANTIK”, 22-3

Analisis Cluster untuk Mengelompokkan Provinsi-Provinsi di Indonesia berdasarkan Hasil Produksi Tanaman Pangan pada Tahun 2012

Marsella Nur Fidi Arief Putri

2024-05-20