Notes Theme, silakan gunakan salah satu theme berikut: - cayman (package prettydoc) - architect (package prettydoc) - united (default di RMarkdown)
Indonesia dikenal sebagai negara agraris dengan sektor pertanian yang menjadi salah satu pilar utama perekonomian. Tanaman pangan, seperti padi, jagung, kedelai, ubi kayu, dan ubi jalar, menjadi komoditas strategis yang tidak hanya memenuhi kebutuhan pangan domestik, tetapi juga mendukung ketahanan pangan nasional. Namun, produksi tanaman pangan di setiap provinsi menunjukkan perbedaan yang signifikan, dipengaruhi oleh faktor geografis, iklim, potensi lahan, hingga tingkat adopsi teknologi pertanian. Perbedaan ini menciptakan tantangan sekaligus peluang dalam pengelolaan sektor pertanian di tingkat daerah. Dengan memahami pola produksi tanaman pangan di setiap provinsi, pemerintah dapat merancang kebijakan yang lebih terarah, seperti penentuan daerah unggulan tanaman tertentu, alokasi sumber daya, atau perencanaan distribusi hasil produksi.
Analisis cluster merupakan salah satu metode statistik yang dapat digunakan untuk mengelompokkan provinsi berdasarkan kesamaan karakteristik produksi tanaman pangan. Dengan metode ini, provinsi-provinsi yang memiliki pola produksi serupa akan dikelompokkan ke dalam satu kelompok, sehingga memudahkan pengambilan keputusan dalam perencanaan pembangunan sektor pertanian di Indonesia.
Berdasarkan latar belakang yang telah diuraikan, maka dapat dirumuskan permasalahan penelitian, yaitu:
Dalam melakukan penelitian ini, tujuan penelitian yang ingin dicapai yaitu:
Penelitian ini menggunakan data produksi tanaman pangan dari seluruh provinsi di Indonesia pada tahun 2012 . Data terdiri dari informasi tentang jumlah produksi berbagai komoditas tanaman pangan, seperti padi, jagung, kedelai, ubi kayu, dan ubi jalar dalam satuan ton. Selain itu, data juga mencakup identitas wilayah (provinsi) yang digunakan sebagai unit analisis. Adapun data tersebut tersaji dalam sumber berikut:
Sumber: https://www.bps.go.id/id/statistics-table/2/MjMjMg%253D%253D/produksi-tanaman-pangan.html
Analisis cluster adalah metode analisis multivariat yang digunakan untuk mengelompokkan objek analisis yang memiliki kesamaan dalam karakteristik tertentu. Teknik ini bertujuan untuk memisahkan data menjadi beberapa kelompok (cluster) yang anggotanya memiliki kemiripan yang tinggi di dalam kelompok dan perbedaan yang jelas antar kelompok.
Uji Sampel Respresentatif
Uji sampe representativitas dilakukan untuk memastikan bahwa sampel yang digunakan dalam penelitian benar-benar mencerminkan karakteristik populasi. Sampel yang representatif penting agar hasil penelitian dapat digeneralisasi ke populasi yang lebih luas. Menurut Sugiyono (2016), representativitas dapat diuji dengan membandingkan distribusi variabel antara sampel dan populasi, menggunakan metode seperti uji Chi-Square atau uji Kolmogorov-Smirnov. Jika tidak ada perbedaan signifikan, maka sampel dianggap representatif. Representativitas juga dapat dievaluasi melalui deskripsi data, seperti melihat kesamaan demografi atau nilai rata-rata antara sampel dan populasi. Sampel yang tidak representatif dapat menyebabkan bias dalam hasil penelitian, sehingga memengaruhi validitas dan reliabilitas temuan.
Uji Non-Multikolinearitas
Uji non-multikolinearitas dilakukan untuk memastikan bahwa tidak ada hubungan linear yang terlalu kuat antara variabel independen dalam model regresi. Ketika multikolinearitas terjadi, estimasi parameter regresi dapat menjadi tidak stabil dan sulit diinterpretasikan, yang dapat mempengaruhi hasil analisis secara keseluruhan. Salah satu cara untuk mendeteksi multikolinearitas adalah dengan menggunakan Variance Inflation Factor (VIF), di mana nilai VIF lebih dari 10 menandakan adanya multikolinearitas yang serius. Selain itu, Tolerance Value yang rendah (kurang dari 0,1) dan korelasi yang sangat tinggi antar variabel independen juga dapat menjadi indikator adanya multikolinearitas. Jika ditemukan multikolinearitas, beberapa langkah perbaikan yang dapat dilakukan antara lain menghapus variabel yang menyebabkan masalah, melakukan transformasi data, atau menggunakan metode alternatif seperti regresi ridge atau analisis komponen utama (PCA). Uji ini sangat penting untuk memastikan hasil model regresi yang valid, sehingga dapat digunakan untuk pengambilan keputusan yang tepat dan akurat dalam penelitian.
Standarisasi dalam konteks analisis data merujuk pada proses mengubah variabel-variabel dalam dataset agar memiliki skala yang seragam, biasanya dengan cara mengubahnya menjadi variabel yang terdistribusi normal dengan rata-rata 0 dan deviasi standar 1. Proses ini sangat berguna dalam analisis statistik dan pembelajaran mesin, terutama ketika variabel memiliki satuan atau skala yang berbeda, yang bisa memengaruhi hasil analisis. Proses standarisasi umumnya dilakukan dengan rumus berikut:
\[ Z= \frac {X-\mu}{\sigma} \]
Dimana:
\(Z\) adalah nilai standar
\(X\) adalah nilai asli
\(\mu\) adalah rata-rata data
\(\sigma\) adalah deviasi standar data
Jarak Euclidean merupakan ukuran jarak yang paling umum digunakan untuk menghitung sejauh mana dua titik dalam ruang berdimensi dua atau lebih terpisah. Jarak Euclidean antara dua titik \(A(X1,Y1)\)dan $B(X2,Y2)$ di ruang dua dimensi dihitung dengan rumus berikut:
\[ d(A,B) = \sqrt(X_1 - X_2)^2 + (Y_1 - Y_2)^2 \]
Indeks Silhouette merupakan salah satu metode yang digunakan untuk mengevaluasi kualitas hasil klasterisasi. Indeks ini mengukur seberapa baik sebuah titik data berada dalam klasternya dibandingkan dengan klaster lainnya. Indeks Silhouette dapat dihitung dengan rumus:
\[ S(i)= \frac {b(i)-a(i)}{max[a(i),b(i)]} \]
Dimana:
\(a(i)\) adalah Jarak rata-rata antara titik data(i) dan semua titik lain dalam klaster yang sama.
\(b(i)\) adalah Jarak rata-rata antara titik data(i) dan titik data dalam klaster terdekat yang berbeda.
Centroid Linkage merupakan salah satu metode dalam klasterisasi hierarkis yang digunakan untuk mengukur jarak antara dua klaster. Metode ini menghitung jarak antara dua klaster berdasarkan posisi centroid (titik pusat) masing-masing klaster.
> library(psych)
> library(GPArotation)
> library(clValid)
> library(ggplot2)
> library(cluster)
> library(factoextra)
> library(tidyverse)
> library(car)
> library(readxl)
Library yang akan digunakan untuk analisis cluster, sebagai berikut:
library(psych) digunakan untuk analisis statistik
deskriptif dan psikometrik, seperti analisis faktor eksploratori dan uji
reliabilitas.
library(GPArotation) digunakan untuk melakukan
rotasi pada hasil analisis faktor, dengan berbagai metode rotasi seperti
Varimax dan Promax.
library(clValid) digunakan untuk mengevaluasi hasil
klastering, dengan mengukur kualitas klaster berdasarkan stabilitas dan
compactness.
library(ggplot2) digunakan untuk membuat visualisasi
data, seperti grafik scatter, bar chart, dan boxplot dengan cara yang
mudah dipahami.
library(cluster) digunakan untuk analisis klaster,
seperti k-means dan PAM, serta evaluasi koherensi antar
klaster.
library(factoextra) digunakan untuk visualisasi
hasil analisis multivariat, seperti PCA dan klastering, agar lebih mudah
dipahami.
library(tidyverse) digunakan untuk manipulasi dan
analisis data dengan pustaka seperti dplyr (untuk transformasi data),
tidyr (untuk merapikan data), dan ggplot2 (untuk visualisasi).
library(car) digunakan untuk analisis regresi,
dengan alat untuk memeriksa asumsi regresi, seperti multikolinearitas
dan outlier.
library(readxl) digunakan untuk membaca file Excel
(.xls, .xlsx) ke dalam R, memudahkan pengolahan data dari
Excel.
> data <- read_excel("C:/Users/Marsella/Downloads/dataanmul.xlsx")
> data<-data.frame(data)
> View(data)
Function read_excel() digunakan untuk membaca file
Excel dari lokasi tertentu pada komputer dan memuatnya ke dalam R
sebagai objek data. Argument yang diisikan dalam function adalah
"C:/Users/Marsella/Downloads/dataanmul.xlsx". Argument
tersebut adalah lokasi file yang ingin dibaca.
Function data.frame digunakan untuk mengonversi
objek data ke dalam format data frame. Argument yang diisikan dalam
function adalah data. Argument tersebut digunakan untuk
menentukan data yang akan digunakan.
Function View digunakan untuk menampilkan data dalam
bentuk tabel di jendela RStudio. Argument yang diisikan dalam function
adalah data. Argument tersebut digunakan untuk menentukan
data yang akan digunakan.
> #Statistik Deskriptif
> statdes <- summary(data)
> statdes
Provinsi Padi Kedelai Ubi.Kayu
Length:32 Min. : 1323 Min. : 1 Min. : 3776
Class :character 1st Qu.: 487198 1st Qu.: 1616 1st Qu.: 47856
Mode :character Median : 810530 Median : 3785 Median : 91842
Mean : 2157659 Mean : 26349 Mean : 755541
3rd Qu.: 2177771 3rd Qu.: 9198 3rd Qu.: 330984
Max. :12198707 Max. :361986 Max. :8387351
Ubi.Jalar
Min. : 1916
1st Qu.: 13325
Median : 28172
Mean : 77608
3rd Qu.: 83661
Max. :436577
Function summary digunakan untuk menghasilkan ringkasan
statistik deskriptif dari data. Argument yang diisikan dalam function
adalah data. Argument tersebut digunakan untuk menentukan
data yang akan digunakan Variabel statdes digunakan untuk
menyimpan dan menampilkan hasil statistik deskriptif.
> # Uji Sampel Representatif
> kmo <- KMO(data[,2:5])
> kmo
Kaiser-Meyer-Olkin factor adequacy
Call: KMO(r = data[, 2:5])
Overall MSA = 0.73
MSA for each item =
Padi Kedelai Ubi.Kayu Ubi.Jalar
0.65 0.77 0.82 0.76
KMO() digunakan untuk menghitung nilai
Kaiser-Meyer-Olkin (KMO) Measure of Sampling Adequacy. Argument yang
diisikan dalam function adalah data[, 2:5]. Argument
tersebut digunakan untuk memilih kolom ke 2 hingga ke 5 dari data frame
data.kmo digunakan untuk menyimpan dan menampilkan
hasil perhitungan KMO.> #Uji Non-Multikolinearitas
> korelasi <- cor(data[,2:5], method = 'pearson')
> korelasi
Padi Kedelai Ubi.Kayu Ubi.Jalar
Padi 1.0000000 0.7726127 0.5831813 0.7363104
Kedelai 0.7726127 1.0000000 0.4706719 0.5673858
Ubi.Kayu 0.5831813 0.4706719 1.0000000 0.3765309
Ubi.Jalar 0.7363104 0.5673858 0.3765309 1.0000000
cor digunakan untuk menghitung matriks
korelasi antara semua pasangan variabel.
Argument yang diisikan dalam function adalah
data[, 2:5]. Argument tersebut digunakan untuk memilih
kolom ke 2 hingga ke 5 dari data frame data.
Argument yang diisikan dalam function adalah
method= 'pearson'. Argument tersebut digunakan untuk
menetukan metode yang akan digunakan yaitu korelasi Pearson untuk
hubungan linear.
korelasi digunakan untuk menyimpan dan
menampilkan hasil matriks korelasi.> #Standarisasi
> datastand <- scale(data[,2:5])
> datastand
Padi Kedelai Ubi.Kayu Ubi.Jalar
[1,] -0.11488249 0.36664086 -0.41394920 -0.55268736
[2,] 0.48511843 -0.30583810 0.24006378 0.93738589
[3,] 0.06562201 -0.36886291 -0.31273056 0.40663434
[4,] -0.51241328 -0.32391407 -0.38490922 -0.58650984
[5,] -0.47722117 -0.33364617 -0.41353311 0.02106486
[6,] 0.35424666 -0.20730430 -0.35317531 -0.51807350
[7,] -0.49069053 -0.35118147 -0.40277585 -0.34697403
[8,] 0.29389954 -0.26822487 4.40436380 -0.25977705
[9,] -0.66492434 -0.38501000 -0.42825451 -0.63916179
[10,] -0.67148619 -0.38480542 -0.43160345 -0.65109256
[11,] 2.83817616 0.30799987 0.79385652 3.08779762
[12,] 2.51465275 1.84219295 1.78494331 0.76874656
[13,] -0.37724261 0.14151676 0.06395235 -0.62416016
[14,] 3.12679739 4.90458787 2.01438107 2.87601999
[15,] -0.09085631 -0.30056289 -0.38824547 -0.38581140
[16,] -0.40236368 -0.26505390 -0.35107695 -0.13123095
[17,] -0.01352349 0.69859879 -0.39016377 -0.55375399
[18,] -0.45436368 -0.34438654 0.07883477 0.63873815
[19,] -0.26704509 -0.36545814 -0.34740483 -0.53709220
[20,] -0.43663217 -0.36018293 -0.40911709 -0.58564106
[21,] -0.02224584 -0.32861938 -0.38406318 -0.49890857
[22,] -0.49690330 -0.36509282 -0.38825124 -0.52678718
[23,] -0.48036695 -0.34158089 -0.39956195 -0.31294510
[24,] -0.35292464 -0.26517080 -0.38198618 -0.43590860
[25,] 0.88604692 0.05245202 -0.04186697 0.14507778
[26,] -0.51112439 -0.33081129 -0.33461904 -0.41458460
[27,] -0.59536005 -0.33459600 -0.43384839 -0.65035280
[28,] -0.54349551 -0.33794232 -0.40817352 -0.52487757
[29,] -0.64565606 -0.37993937 -0.36703740 -0.50060314
[30,] -0.65144346 -0.36598419 -0.36878603 -0.36942487
[31,] -0.66247984 -0.37552632 -0.43040249 -0.57598978
[32,] -0.62891480 -0.32429401 -0.41485987 2.30088287
attr(,"scaled:center")
Padi Kedelai Ubi.Kayu Ubi.Jalar
2157658.81 26348.53 755541.41 77608.12
attr(,"scaled:scale")
Padi Kedelai Ubi.Kayu Ubi.Jalar
3211288.40 68433.37 1732783.65 116254.02
> rownames(datastand) <- 1:nrow(datastand)
Function scale digunakan untuk melakukan
standarisasi data dengan mengubah nilai dalam setiap kolom menjadi skala
standar. Argument yang diisikan dalam function adalah
data[, 2:5]. Argument tersebut digunakan untuk memilih
kolom ke 2 hingga ke 5 dari data frame data. Variabel
datastand digunakan untuk menyimpan dan menampilkan hasil
data yang sudah di standarkan.
Function nrow digunakan untuk menghitung jumlah
baris pada data. Argument yang diisikan dalam function adalah
1:nrow(datastand). Argument tersebut digunakan untuk
membuat urutan angka dari 1 hingga jumlah baris pada datastand.
Function rownames digunakan untuk mengganti nama
baris pada data dengan nilai yang ditentukan. Argument yang diisikan
dalam function adalah datastand. Argument tersebut
digunakan untuk menentukan data yang akan digunakan.
> #Menghitung Jarak Euclidien
> jarak <- dist(datastand, method = "euclidean")
> jarak
1 2 3 4 5 6 7
2 1.86018287
3 1.22641387 0.87591562
4 0.79805020 1.92568059 1.15225445
5 0.97513231 1.48111577 0.67434702 0.60934354
6 0.74457154 1.58023131 0.98291695 0.87771742 1.00080681
7 0.83602835 1.73697506 0.94118543 0.24271796 0.36885940 0.87541690
8 4.88590768 4.33734633 4.77046350 4.86797001 4.88773055 4.76531726 4.87223340
9 0.93552526 2.06422346 1.28101289 0.17788585 0.68846690 1.04431226 0.34281866
10 0.94046501 2.07806900 1.29479713 0.18805113 0.70176799 1.05236855 0.35656240
11 4.84106597 3.29311930 4.06919787 5.14934839 4.71870837 4.55559357 4.97448077
12 3.95891720 3.33888288 3.92656090 4.51665012 4.36782691 3.88526068 4.45801830
13 0.59414808 1.84749404 1.28881488 0.66165794 0.93812751 0.91760697 0.74181490
14 6.98242605 6.40574043 6.97806505 7.63719802 7.38062204 7.13748365 7.54583782
15 0.68865548 1.57397533 0.81413949 0.46748963 0.56263671 0.47490736 0.40515320
16 0.81440906 1.51019110 0.72149596 0.47328525 0.19339940 0.85173105 0.25384532
17 0.34790316 1.96932022 1.44016670 1.13821094 1.26945187 0.97905900 1.17159891
18 1.51100570 0.99964888 0.69150545 1.31151821 0.79030641 1.48239270 1.09769900
19 0.75086201 1.75741558 1.00124975 0.25647639 0.60091450 0.64141335 0.29905179
20 0.79555324 1.89568574 1.11634915 0.08743559 0.60865692 0.81028147 0.24496019
21 0.70409778 1.64633343 0.91347501 0.49795678 0.69156971 0.39722199 0.49333938
22 0.82625981 1.87255450 1.09244132 0.07425776 0.54968837 0.86640621 0.18104103
23 0.83237028 1.70466661 0.90784498 0.27639004 0.33441098 0.87111392 0.03697357
24 0.68593655 1.72535618 0.94900384 0.22710499 0.47953984 0.71485727 0.18632993
25 1.31373349 0.99817461 0.99618383 1.65838500 1.47006347 0.94178945 1.55906902
26 0.81780975 1.77516421 1.00447199 0.17926691 0.44404431 0.88044041 0.10024483
27 0.85587752 2.03551776 1.25298158 0.11603980 0.68203525 0.97054729 0.32285440
28 0.82519895 1.90197354 1.11749900 0.07417993 0.54999328 0.90888854 0.18612480
29 0.91870349 1.92886657 1.15415261 0.16909121 0.55209847 1.01494122 0.22298087
30 0.92750309 1.83680237 1.05811213 0.26169663 0.43114230 1.02904423 0.16649316
31 0.92276145 2.01535833 1.22864703 0.16542100 0.62676434 1.03506026 0.28864456
32 2.98068517 1.87868562 2.02063744 2.88989732 2.28487863 2.98841314 2.65162613
8 9 10 11 12 13 14
2
3
4
5
6
7
8
9 4.94278408
10 4.94825906 0.01402350
11 5.57201916 5.30431500 5.31777782
12 4.15990777 4.68514609 4.69468058 2.96962399
13 4.42608931 0.77619833 0.78095790 4.96769818 4.01962153
14 7.09426123 7.78973496 7.79923091 4.76932420 3.77441740 7.14286889
15 4.80978909 0.63440725 0.64535406 4.73422693 4.17562374 0.73399219 7.33887240
16 4.80786163 0.58930270 0.60291622 4.74368071 4.28042243 0.76233805 7.33615184
17 4.90949835 1.26778409 1.27195584 4.79036122 3.76557846 0.80858548 6.71544077
18 4.48143163 1.39145745 1.40463031 4.21610900 4.06495965 1.35542735 7.00915234
19 4.79377951 0.41910027 0.42898999 4.95360964 4.34323493 0.66780431 7.51790657
20 4.88036049 0.23656798 0.24607360 5.11000344 4.49542089 0.69318693 7.63362839
21 4.80518598 0.66169433 0.67088743 4.77904324 4.17849486 0.75063745 7.37872679
22 4.86571741 0.20701709 0.21954274 5.10278462 4.51029517 0.69637744 7.63233122
23 4.86676475 0.37840204 0.39212917 4.94206255 4.43634210 0.74546515 7.51867944
24 4.83306935 0.39390083 0.40565985 4.93059434 4.33713725 0.63268157 7.45294017
25 4.51512433 1.83336082 1.84469108 3.63787673 3.09543665 1.48551597 6.34431921
26 4.80977176 0.29290688 0.30655059 5.01657575 4.44635715 0.66618255 7.54915620
27 4.93518332 0.08681758 0.09122370 5.26147587 4.62033217 0.72301467 7.72868916
28 4.89253357 0.17442608 0.18723502 5.13315136 4.53745362 0.70020062 7.64133808
29 4.87026811 0.15278420 0.16585149 5.18021641 4.60083617 0.73822814 7.69612701
30 4.86808096 0.27719708 0.28989423 5.09272272 4.56444912 0.76478487 7.63324515
31 4.93975007 0.06396274 0.07621736 5.25775130 4.66138639 0.77162227 7.75445459
32 5.53503624 2.94092250 2.95294993 3.80798444 4.66500358 3.01088964 6.90496734
15 16 17 18 19 20 21
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16 0.40557420
17 1.01612639 1.12244230
18 1.18402865 0.88694654 1.71001626
19 0.24455616 0.43946441 1.09480423 1.26482784
20 0.40433032 0.46912798 1.14079609 1.31824330 0.18695721
21 0.13528867 0.53367131 1.02873636 1.30210944 0.25315132 0.42527933
22 0.43464059 0.42046662 1.16868591 1.25652576 0.23368687 0.08692456 0.47689074
23 0.39854558 0.21751257 1.16532993 1.06548039 0.31470402 0.27697139 0.49483894
24 0.26922355 0.31020651 1.02859097 1.17634458 0.16990243 0.19796502 0.34256022
25 1.21687339 1.39024070 1.35514171 1.48743097 1.43630754 1.60890343 1.22557245
26 0.42572751 0.31098727 1.15314575 1.13306616 0.27558427 0.20303215 0.49856022
27 0.57248935 0.56428921 1.19048937 1.39448031 0.35922644 0.17506707 0.59490296
28 0.47541139 0.42830899 1.16466563 1.26458080 0.28464712 0.12493002 0.52253596
29 0.57247735 0.45725310 1.25147753 1.23885323 0.38114677 0.23039847 0.62575298
30 0.56496467 0.35955196 1.25487572 1.12074259 0.41991888 0.30749566 0.64364989
31 0.60853759 0.53288604 1.25578768 1.33385477 0.40604389 0.22757154 0.64821962
32 2.74027454 2.44419327 3.09428145 1.74279411 2.86204418 2.89314950 2.86493395
22 23 24 25 26 27 28
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23 0.21606163
24 0.19751565 0.19367233
25 1.63042313 1.53625501 1.44539304
26 0.12978171 0.12494068 0.17898098 1.58047594
27 0.16724638 0.35817833 0.33506833 1.76938747 0.26933822
28 0.05751979 0.22133229 0.22408526 1.66703927 0.13665116 0.13821853
29 0.15324306 0.25507890 0.32136017 1.74806064 0.17018366 0.17741021 0.12034101
30 0.22141645 0.18439038 0.32229048 1.70603475 0.15534915 0.29543896 0.19533566
31 0.17810691 0.32320433 0.36051302 1.80332994 0.24522236 0.10826861 0.13666168
32 2.83116893 2.61814744 2.75150402 2.68768783 2.71921299 2.95150548 2.82709206
29 30 31
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30 0.13205694
31 0.10000398 0.21605208
32 2.80249666 2.67112558 2.87756654
dist digunakan untuk menghitung matriks jarak
antara baris-baris pada data berdasarkan metode tertentu.
Argument yang diisikan dalam function adalah
datastand. Argument tersebut digunakan untuk menentukan
data yang akan digunakan.
Argument yang diisikan dalam function adalah
method = "euclidean". Argument tersebut digunakan untuk
menentukan metode yang akan digunakan yaitu jarak euclidean.
jarak digunakan untuk menyimpan dan
menampilkan hasil matriks jarak dari data.> #Koefisien Korelasi Cophenetic
> d1 <- dist(data[,2:5])
> #Single Linkage
> hiers <- hclust(dist(data[,2:5]), method = "single")
> #korelasi cophenetic
> hc1 <- hclust(d1, "single")
> d2 <- cophenetic(hc1)
> cors <- cor(d1,d2)
> cors
[1] 0.9514758
> #Average Linkage
> hierave <- hclust(dist(data[,2:5]), method = "ave")
> #korelasi cophenetic
> hc2 <- hclust(d1, "ave")
> d3 <- cophenetic(hc2)
> corave <- cor(d1,d3)
> corave
[1] 0.9805651
> #Complete Linkage
> hiercomp <- hclust(dist(data[,2:5]), method = "complete")
> #korelasi cophenetic
> hc3 <- hclust(d1, "complete")
> d4 <- cophenetic(hc3)
> corcomp <- cor(d1,d4)
> corcomp
[1] 0.9744458
> #Centorid Linkage
> hiercen <- hclust(dist(data[,2:5]), method = "centroid")
> #korelasi cophenetic
> hc4 <- hclust(d1, "centroid")
> d5 <- cophenetic(hc4)
> corcen <- cor(d1,d5)
> corcen
[1] 0.9787049
> #Ward
> hierward <- hclust(dist(data[,2:5]), method = "ward.D")
> #korelasi cophenetic
> hc5 <- hclust(d1,"ward.D")
> d6 <- cophenetic(hc5)
> corward <- cor(d1,d6)
> corward
[1] 0.9439246
> KorCop<-data.frame(cors,corave,corcomp,corcen,corward)
> KorCop
cors corave corcomp corcen corward
1 0.9514758 0.9805651 0.9744458 0.9787049 0.9439246
Function dist digunakan untuk menghitung matriks
jarak antara baris-baris pada data berdasarkan metode tertentu. Argument
yang diisikan dalam function adalah data[,2:5]. Argument
tersebut digunakan untuk memilih kolom ke 2 hingga ke 5 dari data frame
pada data. Variabel d1 digunakan untuk menyimpan dan
menampilkan hasil matriks jarak dari data.
Function hclust digunakan untuk melakukan analisis
cluster hierarki dengan metode tertentu.
Function cophenetic digunakan untuk menghasilkan
jarak cophenetic berdasarkan hasil clustering.
> #Indeks Validitas
> inval <- clValid(datastand, 2:5, clMethods = "hierarchical", validation = "internal", metric = "euclidean", method = "average")
> summary(inval)
Clustering Methods:
hierarchical
Cluster sizes:
2 3 4 5
Validation Measures:
2 3 4 5
hierarchical Connectivity 6.0869 8.0159 9.7159 11.7159
Dunn 0.5592 0.6490 1.0004 0.9597
Silhouette 0.7345 0.7357 0.7123 0.6815
Optimal Scores:
Score Method Clusters
Connectivity 6.0869 hierarchical 2
Dunn 1.0004 hierarchical 4
Silhouette 0.7357 hierarchical 3
> optimalScores(inval)
Score Method Clusters
Connectivity 6.0869048 hierarchical 2
Dunn 1.0003733 hierarchical 4
Silhouette 0.7357179 hierarchical 3
> plot(inval)
Function clValid digunakan untuk mengevaluasi
validitas clustering dengan mengukur indeks validitas internal.
Argument yang diisikan dalam function adalah
datastand. Argument tersebut digunakan untuk menentukan
data yang akan digunakan.
Argument yang diisikan dalam function adalah
clMethods = "hierarchical". Argument tersebut digunakan
untuk menentukan metode clustering yang akan digunakan yaitu
hierarchical clustering.
Argument yang diisikan dalam function adalah
validation = "internal". Argument tersebut digunakan untuk
mengukur performa clustering berdasarkan struktur data dengan menghitung
validitas internal. Argument yang diisikan dalam function adalah
metric = "euclidean". Argument tersebut digunakan untuk
mengukur kesamaan antar data.
Argument yang diisikan dalam function adalah
method = "average". Argument tersebut digunakan untuk
menentukan metode yang akan digunakan yaitu metode average
linkage.
Function summary digunakan untuk menampilkan
ringkasan dari hasil evaluasi clustering.
Function optimalScores digunakan untuk menampilkan
skor optimal untuk setiap indeks validitas.
Function plot digunakan untuk menampilkan
visualisasi indeks validitas untuk berbagai jumlah cluster dalam bentuk
grafik.
> #Membuat Dendogram
> hirave <- hclust(dist(scale(data[,2:5])), method = "average")
> hirave
Call:
hclust(d = dist(scale(data[, 2:5])), method = "average")
Cluster method : average
Distance : euclidean
Number of objects: 32
> plot(hirave, labels(data$Provinsi), hang = 1, col = "blue", main = "Cluster Dendogram", sub = " ", xlab = "provinsi", ylab = "Jarak")
plot digunakan untuk membuat dendogram dari
hasil clustering.
Argument yang diisikan dalam function adalah hirave.
Argument tersebut digunakan untuk menentukan data yang akan
digunakan.
Argument yang diisikan dalam function adalah
labels(data$Provinsi). Argument tersebut digunakan untuk
menampilkan nama provinsi pada sumbu x sebagai label.
Argument yang diisikan dalam function adalah
hang = 1. Argument tersebut digunakan untuk mengatur posisi
ujung dendrogram sehingga label berada pada posisi yang sama.
> #Menentukan Jumlah Cluster
> anggotaave <- data.frame(id = data$Provinsi, cutree(hirave, k = 3))
> anggotaave
id cutree.hirave..k...3.
1 ACEH 1
2 SUMATERA UTARA 1
3 SUMATERA BARAT 1
4 RIAU 1
5 JAMBI 1
6 SUMATERA SELATAN 1
7 BENGKULU 1
8 LAMPUNG 2
9 KEP. BANGKA BELITUNG 1
10 KEP. RIAU 1
11 JAWA BARAT 3
12 JAWA TENGAH 3
13 DI YOGYAKARTA 1
14 JAWA TIMUR 3
15 BANTEN 1
16 BALI 1
17 NUSA TENGGARA BARAT 1
18 NUSA TENGGARA TIMUR 1
19 KALIMANTAN BARAT 1
20 KALIMANTAN TENGAH 1
21 KALIMANTAN SELATAN 1
22 KALIMANTAN TIMUR 1
23 SULAWESI UTARA 1
24 SULAWESI TENGAH 1
25 SULAWESI SELATAN 1
26 SULAWESI TENGGARA 1
27 GORONTALO 1
28 SULAWESI BARAT 1
29 MALUKU 1
30 MALUKU UTARA 1
31 PAPUA BARAT 1
32 PAPUA 1
> clus_hier <- eclust(datastand, FUNcluster = "hclust", k = 3, hc_method = "average", graph = TRUE)
> fviz_dend(clus_hier, rect = TRUE, cex = 0.5)
cutree digunakan untuk memotong dendogram
berdasarkan jumlah cluster yang diinginkan.eclust digunakan untuk melakukan hirarchical
clustering dan menghasilkan data clustering yang dapat divisualisasikan.
Argument yang diisikan dalam function adalah
datastand. Argument tersebut digunakan untuk menentukan
data yang akan digunakan.
Argument yang diisikan dalam function adalah
FUNcluster = "hclust". Argument tersebut digunakan untuk
menentukan metode analisis yang digunakan yaitu metode hirarchical
clustering.
Argument yang diisikan dalam function adalah k = 2.
Argument tersebut digunakan untuk memotong dendogram menjadi 2
cluster.
Argument yang diisikan dalam function adalah
hc_method = "average". Argument tersebut digunakan untuk
menentukan metode clustering yang digunakan yaitu metode average
linkage.
Argument yang diisikan dalam function adalah
graph = TRUE. Argument tersebut digunakan untuk membuat
visualisasi dendogram secara otomatis.
fivz_dend digunakan untuk memvisualisasikan
dendogram.
Argument yang diisikan dalam function adalah
clus_hier. Argument tersebut digunakan untuk menentukan
data yang akan digunakan.
Argument yang diisikan dalam function adalah
rect = TRUE. Argument tersebut digunakan untuk menambahkan
kotak berwana disekitar cluster yang terbentuk sehingga viasualisasi
dapat terlihat dengan jelas.
Argument yang diisikan dalam function adalah
cex = 0.5. Argument tersebut digunakan untuk mengatur
ukuran teks label pada dendogram.
> idclus = clus_hier$cluster
> idclus
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
1 1 1 1 1 1 1 2 1 1 3 3 1 3 1 1 1 1 1 1 1 1 1 1 1 1
27 28 29 30 31 32
1 1 1 1 1 1
> aggregate(data,list(idclus),mean)
Group.1 Provinsi Padi Kedelai Ubi.Kayu Ubi.Jalar
1 1 NA 1151433 9761.857 198727.2 50733.57
2 2 NA 3101455 7993.000 8387351.0 47408.00
3 3 NA 11234501 187276.000 3408537.7 338504.00
idclus digunakan untuk menyimpan hasil ID
cluster untuk setiap baris dalam data. clus_hier$clusteraggregate digunakan untuk menghitung statistik
agrerat yaitu mean pada setiap cluster.> statdes
Provinsi Padi Kedelai Ubi.Kayu
Length:32 Min. : 1323 Min. : 1 Min. : 3776
Class :character 1st Qu.: 487198 1st Qu.: 1616 1st Qu.: 47856
Mode :character Median : 810530 Median : 3785 Median : 91842
Mean : 2157659 Mean : 26349 Mean : 755541
3rd Qu.: 2177771 3rd Qu.: 9198 3rd Qu.: 330984
Max. :12198707 Max. :361986 Max. :8387351
Ubi.Jalar
Min. : 1916
1st Qu.: 13325
Median : 28172
Mean : 77608
3rd Qu.: 83661
Max. :436577
Berdasarkan output statistik deskriptif, dapat disimpulkan bahwa distribusi produksi tanaman pangan di berbagai provinsi memiliki ketidakseimbangan yang cukup signifikan. Untuk komoditas padi, rata-rata (mean) produksi adalah 2.157.659, yang lebih tinggi dari nilai median sebesar 810.530, mengindikasikan adanya beberapa provinsi dengan produksi padi yang sangat besar. Nilai maksimum sebesar 12.198.707 dan nilai minimum 1.323 menunjukkan adanya variasi yang sangat besar dalam produksi padi antar provinsi. Pada komoditas kedelai, nilai rata-rata 26.349 lebih tinggi dari median 3.785, meskipun distribusinya cenderung lebih merata dibandingkan padi, dengan nilai maksimum 361.986. Sementara itu, untuk ubi kayu dan ubi jalar, meskipun rata-rata produksinya lebih tinggi dari median, distribusinya tetap menunjukkan adanya beberapa provinsi dengan hasil produksi yang sangat besar, dengan nilai maksimum mencapai 8.387.351 untuk ubi kayu dan 436.577 untuk ubi jalar. Secara keseluruhan, distribusi produksi pada setiap komoditas menunjukkan ketimpangan antar provinsi, dengan beberapa provinsi memiliki produksi yang jauh lebih tinggi dari provinsi lainnya, yang terlihat dari perbedaan besar antara nilai minimum dan maksimum pada masing-masing hasil tanaman pangan.
> kmo
Kaiser-Meyer-Olkin factor adequacy
Call: KMO(r = data[, 2:5])
Overall MSA = 0.73
MSA for each item =
Padi Kedelai Ubi.Kayu Ubi.Jalar
0.65 0.77 0.82 0.76
Berdasarkan output dapat diketahui bahwa nilai uji KMO pada masing-masing variabel tersebut bernilai lebih dari 0,5 sehingga dapat disimpulkan bahwa sampel telah representatif atau sudah mewakili populasi.
> korelasi
Padi Kedelai Ubi.Kayu Ubi.Jalar
Padi 1.0000000 0.7726127 0.5831813 0.7363104
Kedelai 0.7726127 1.0000000 0.4706719 0.5673858
Ubi.Kayu 0.5831813 0.4706719 1.0000000 0.3765309
Ubi.Jalar 0.7363104 0.5673858 0.3765309 1.0000000
Berdasarkan output dapat diketahui bahwa nilai antar variabel kurang dari 0.8, sehingga dapat disimpulkan bahwa tidak terjaadi multikolinearitas antar variabel.
> datastand <- scale(data[,2:5])
> datastand
Padi Kedelai Ubi.Kayu Ubi.Jalar
[1,] -0.11488249 0.36664086 -0.41394920 -0.55268736
[2,] 0.48511843 -0.30583810 0.24006378 0.93738589
[3,] 0.06562201 -0.36886291 -0.31273056 0.40663434
[4,] -0.51241328 -0.32391407 -0.38490922 -0.58650984
[5,] -0.47722117 -0.33364617 -0.41353311 0.02106486
[6,] 0.35424666 -0.20730430 -0.35317531 -0.51807350
[7,] -0.49069053 -0.35118147 -0.40277585 -0.34697403
[8,] 0.29389954 -0.26822487 4.40436380 -0.25977705
[9,] -0.66492434 -0.38501000 -0.42825451 -0.63916179
[10,] -0.67148619 -0.38480542 -0.43160345 -0.65109256
[11,] 2.83817616 0.30799987 0.79385652 3.08779762
[12,] 2.51465275 1.84219295 1.78494331 0.76874656
[13,] -0.37724261 0.14151676 0.06395235 -0.62416016
[14,] 3.12679739 4.90458787 2.01438107 2.87601999
[15,] -0.09085631 -0.30056289 -0.38824547 -0.38581140
[16,] -0.40236368 -0.26505390 -0.35107695 -0.13123095
[17,] -0.01352349 0.69859879 -0.39016377 -0.55375399
[18,] -0.45436368 -0.34438654 0.07883477 0.63873815
[19,] -0.26704509 -0.36545814 -0.34740483 -0.53709220
[20,] -0.43663217 -0.36018293 -0.40911709 -0.58564106
[21,] -0.02224584 -0.32861938 -0.38406318 -0.49890857
[22,] -0.49690330 -0.36509282 -0.38825124 -0.52678718
[23,] -0.48036695 -0.34158089 -0.39956195 -0.31294510
[24,] -0.35292464 -0.26517080 -0.38198618 -0.43590860
[25,] 0.88604692 0.05245202 -0.04186697 0.14507778
[26,] -0.51112439 -0.33081129 -0.33461904 -0.41458460
[27,] -0.59536005 -0.33459600 -0.43384839 -0.65035280
[28,] -0.54349551 -0.33794232 -0.40817352 -0.52487757
[29,] -0.64565606 -0.37993937 -0.36703740 -0.50060314
[30,] -0.65144346 -0.36598419 -0.36878603 -0.36942487
[31,] -0.66247984 -0.37552632 -0.43040249 -0.57598978
[32,] -0.62891480 -0.32429401 -0.41485987 2.30088287
attr(,"scaled:center")
Padi Kedelai Ubi.Kayu Ubi.Jalar
2157658.81 26348.53 755541.41 77608.12
attr(,"scaled:scale")
Padi Kedelai Ubi.Kayu Ubi.Jalar
3211288.40 68433.37 1732783.65 116254.02
> rownames(datastand) <- 1:nrow(datastand)
Setelah dilakukan uji asumsi dan telah memenuhi asumsi maka dapat dilanjutkan dengan standarisasi variabel ke dalam bentuk Z-score. Hasil stadarisasi digunakan dalam pengelompokan provinsi di Indonesia berdasarkan hasil tanaman pangan.
> jarak
1 2 3 4 5 6 7
2 1.86018287
3 1.22641387 0.87591562
4 0.79805020 1.92568059 1.15225445
5 0.97513231 1.48111577 0.67434702 0.60934354
6 0.74457154 1.58023131 0.98291695 0.87771742 1.00080681
7 0.83602835 1.73697506 0.94118543 0.24271796 0.36885940 0.87541690
8 4.88590768 4.33734633 4.77046350 4.86797001 4.88773055 4.76531726 4.87223340
9 0.93552526 2.06422346 1.28101289 0.17788585 0.68846690 1.04431226 0.34281866
10 0.94046501 2.07806900 1.29479713 0.18805113 0.70176799 1.05236855 0.35656240
11 4.84106597 3.29311930 4.06919787 5.14934839 4.71870837 4.55559357 4.97448077
12 3.95891720 3.33888288 3.92656090 4.51665012 4.36782691 3.88526068 4.45801830
13 0.59414808 1.84749404 1.28881488 0.66165794 0.93812751 0.91760697 0.74181490
14 6.98242605 6.40574043 6.97806505 7.63719802 7.38062204 7.13748365 7.54583782
15 0.68865548 1.57397533 0.81413949 0.46748963 0.56263671 0.47490736 0.40515320
16 0.81440906 1.51019110 0.72149596 0.47328525 0.19339940 0.85173105 0.25384532
17 0.34790316 1.96932022 1.44016670 1.13821094 1.26945187 0.97905900 1.17159891
18 1.51100570 0.99964888 0.69150545 1.31151821 0.79030641 1.48239270 1.09769900
19 0.75086201 1.75741558 1.00124975 0.25647639 0.60091450 0.64141335 0.29905179
20 0.79555324 1.89568574 1.11634915 0.08743559 0.60865692 0.81028147 0.24496019
21 0.70409778 1.64633343 0.91347501 0.49795678 0.69156971 0.39722199 0.49333938
22 0.82625981 1.87255450 1.09244132 0.07425776 0.54968837 0.86640621 0.18104103
23 0.83237028 1.70466661 0.90784498 0.27639004 0.33441098 0.87111392 0.03697357
24 0.68593655 1.72535618 0.94900384 0.22710499 0.47953984 0.71485727 0.18632993
25 1.31373349 0.99817461 0.99618383 1.65838500 1.47006347 0.94178945 1.55906902
26 0.81780975 1.77516421 1.00447199 0.17926691 0.44404431 0.88044041 0.10024483
27 0.85587752 2.03551776 1.25298158 0.11603980 0.68203525 0.97054729 0.32285440
28 0.82519895 1.90197354 1.11749900 0.07417993 0.54999328 0.90888854 0.18612480
29 0.91870349 1.92886657 1.15415261 0.16909121 0.55209847 1.01494122 0.22298087
30 0.92750309 1.83680237 1.05811213 0.26169663 0.43114230 1.02904423 0.16649316
31 0.92276145 2.01535833 1.22864703 0.16542100 0.62676434 1.03506026 0.28864456
32 2.98068517 1.87868562 2.02063744 2.88989732 2.28487863 2.98841314 2.65162613
8 9 10 11 12 13 14
2
3
4
5
6
7
8
9 4.94278408
10 4.94825906 0.01402350
11 5.57201916 5.30431500 5.31777782
12 4.15990777 4.68514609 4.69468058 2.96962399
13 4.42608931 0.77619833 0.78095790 4.96769818 4.01962153
14 7.09426123 7.78973496 7.79923091 4.76932420 3.77441740 7.14286889
15 4.80978909 0.63440725 0.64535406 4.73422693 4.17562374 0.73399219 7.33887240
16 4.80786163 0.58930270 0.60291622 4.74368071 4.28042243 0.76233805 7.33615184
17 4.90949835 1.26778409 1.27195584 4.79036122 3.76557846 0.80858548 6.71544077
18 4.48143163 1.39145745 1.40463031 4.21610900 4.06495965 1.35542735 7.00915234
19 4.79377951 0.41910027 0.42898999 4.95360964 4.34323493 0.66780431 7.51790657
20 4.88036049 0.23656798 0.24607360 5.11000344 4.49542089 0.69318693 7.63362839
21 4.80518598 0.66169433 0.67088743 4.77904324 4.17849486 0.75063745 7.37872679
22 4.86571741 0.20701709 0.21954274 5.10278462 4.51029517 0.69637744 7.63233122
23 4.86676475 0.37840204 0.39212917 4.94206255 4.43634210 0.74546515 7.51867944
24 4.83306935 0.39390083 0.40565985 4.93059434 4.33713725 0.63268157 7.45294017
25 4.51512433 1.83336082 1.84469108 3.63787673 3.09543665 1.48551597 6.34431921
26 4.80977176 0.29290688 0.30655059 5.01657575 4.44635715 0.66618255 7.54915620
27 4.93518332 0.08681758 0.09122370 5.26147587 4.62033217 0.72301467 7.72868916
28 4.89253357 0.17442608 0.18723502 5.13315136 4.53745362 0.70020062 7.64133808
29 4.87026811 0.15278420 0.16585149 5.18021641 4.60083617 0.73822814 7.69612701
30 4.86808096 0.27719708 0.28989423 5.09272272 4.56444912 0.76478487 7.63324515
31 4.93975007 0.06396274 0.07621736 5.25775130 4.66138639 0.77162227 7.75445459
32 5.53503624 2.94092250 2.95294993 3.80798444 4.66500358 3.01088964 6.90496734
15 16 17 18 19 20 21
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16 0.40557420
17 1.01612639 1.12244230
18 1.18402865 0.88694654 1.71001626
19 0.24455616 0.43946441 1.09480423 1.26482784
20 0.40433032 0.46912798 1.14079609 1.31824330 0.18695721
21 0.13528867 0.53367131 1.02873636 1.30210944 0.25315132 0.42527933
22 0.43464059 0.42046662 1.16868591 1.25652576 0.23368687 0.08692456 0.47689074
23 0.39854558 0.21751257 1.16532993 1.06548039 0.31470402 0.27697139 0.49483894
24 0.26922355 0.31020651 1.02859097 1.17634458 0.16990243 0.19796502 0.34256022
25 1.21687339 1.39024070 1.35514171 1.48743097 1.43630754 1.60890343 1.22557245
26 0.42572751 0.31098727 1.15314575 1.13306616 0.27558427 0.20303215 0.49856022
27 0.57248935 0.56428921 1.19048937 1.39448031 0.35922644 0.17506707 0.59490296
28 0.47541139 0.42830899 1.16466563 1.26458080 0.28464712 0.12493002 0.52253596
29 0.57247735 0.45725310 1.25147753 1.23885323 0.38114677 0.23039847 0.62575298
30 0.56496467 0.35955196 1.25487572 1.12074259 0.41991888 0.30749566 0.64364989
31 0.60853759 0.53288604 1.25578768 1.33385477 0.40604389 0.22757154 0.64821962
32 2.74027454 2.44419327 3.09428145 1.74279411 2.86204418 2.89314950 2.86493395
22 23 24 25 26 27 28
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23 0.21606163
24 0.19751565 0.19367233
25 1.63042313 1.53625501 1.44539304
26 0.12978171 0.12494068 0.17898098 1.58047594
27 0.16724638 0.35817833 0.33506833 1.76938747 0.26933822
28 0.05751979 0.22133229 0.22408526 1.66703927 0.13665116 0.13821853
29 0.15324306 0.25507890 0.32136017 1.74806064 0.17018366 0.17741021 0.12034101
30 0.22141645 0.18439038 0.32229048 1.70603475 0.15534915 0.29543896 0.19533566
31 0.17810691 0.32320433 0.36051302 1.80332994 0.24522236 0.10826861 0.13666168
32 2.83116893 2.61814744 2.75150402 2.68768783 2.71921299 2.95150548 2.82709206
29 30 31
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30 0.13205694
31 0.10000398 0.21605208
32 2.80249666 2.67112558 2.87756654
Setelah dilakukan standarisasi data, langkah berikutnya yaitu menghitung jarak antar data berdasarkan nilai tengah peubah dalam satu kelompok menggunakan metode Euclidean.
> KorCop
cors corave corcomp corcen corward
1 0.9514758 0.9805651 0.9744458 0.9787049 0.9439246
Berdasarkan output dapat disimpulkan bahwa metode Centroid Linkage memiliki nilai koefisien yang paling mendekati 1 dan tertinggi dibandingkan metode lainnya, yaitu 0,98056. Sehingga metode cluster yang terbaik dan akan digunakan dalah metode Centroid Linkage.
> #Indeks Validitas
> inval <- clValid(datastand, 2:5, clMethods = "hierarchical", validation = "internal", metric = "euclidean", method = "average")
> summary(inval)
Clustering Methods:
hierarchical
Cluster sizes:
2 3 4 5
Validation Measures:
2 3 4 5
hierarchical Connectivity 6.0869 8.0159 9.7159 11.7159
Dunn 0.5592 0.6490 1.0004 0.9597
Silhouette 0.7345 0.7357 0.7123 0.6815
Optimal Scores:
Score Method Clusters
Connectivity 6.0869 hierarchical 2
Dunn 1.0004 hierarchical 4
Silhouette 0.7357 hierarchical 3
> optimalScores(inval)
Score Method Clusters
Connectivity 6.0869048 hierarchical 2
Dunn 1.0003733 hierarchical 4
Silhouette 0.7357179 hierarchical 3
> plot(inval)
Berdasarkan output, jumlah cluster yang optimal untuk setiap indeks bagi setiap indeks dapat dilihat dari skor optimalnya. Dalam penelitian ini, menggunakan indeks Silhouette sebagai acuan dan hasilnya menunjukkan bahwa jumlah cluster yang optimal adalah 3 cluster.
> anggotaave
id cutree.hirave..k...3.
1 ACEH 1
2 SUMATERA UTARA 1
3 SUMATERA BARAT 1
4 RIAU 1
5 JAMBI 1
6 SUMATERA SELATAN 1
7 BENGKULU 1
8 LAMPUNG 2
9 KEP. BANGKA BELITUNG 1
10 KEP. RIAU 1
11 JAWA BARAT 3
12 JAWA TENGAH 3
13 DI YOGYAKARTA 1
14 JAWA TIMUR 3
15 BANTEN 1
16 BALI 1
17 NUSA TENGGARA BARAT 1
18 NUSA TENGGARA TIMUR 1
19 KALIMANTAN BARAT 1
20 KALIMANTAN TENGAH 1
21 KALIMANTAN SELATAN 1
22 KALIMANTAN TIMUR 1
23 SULAWESI UTARA 1
24 SULAWESI TENGAH 1
25 SULAWESI SELATAN 1
26 SULAWESI TENGGARA 1
27 GORONTALO 1
28 SULAWESI BARAT 1
29 MALUKU 1
30 MALUKU UTARA 1
31 PAPUA BARAT 1
32 PAPUA 1
Berdasarkan dendrogram hasil analisis klaster hierarkis, provinsi-provinsi di Indonesia dikelompokkan menjadi tiga kelompok berdasarkan kesamaan karakteristik produksinya. Kelompok pertama (warna merah) terdiri dari provinsi 11, 12, dan 14, yang memiliki pola produksi yang mirip satu sama lain. Kelompok kedua (warna hijau) hanya terdiri dari satu provinsi, yaitu provinsi 8. Hal ini menunjukkan bahwa provinsi 8 memiliki karakteristik produksi yang sangat berbeda dibandingkan provinsi lain, sehingga membentuk klaster tersendiri. Kelompok ketiga (warna biru) adalah kelompok terbesar, yang mencakup sebagian besar provinsi lain dengan pola produksi yang cukup mirip.
Pemotongan dendrogram dilakukan pada ketinggian sekitar 4 untuk menghasilkan tiga kelompok ini. Semakin rendah garis horizontal yang menghubungkan anggota klaster, semakin mirip karakteristik antar anggotanya. Sebaliknya, garis yang lebih tinggi menunjukkan bahwa klaster tersebut memiliki perbedaan yang cukup besar. Hasil pengelompokan ini membantu kita memahami pola produksi antarprovinsi dan bisa digunakan untuk analisis lebih lanjut, misalnya untuk menyusun kebijakan pertanian yang sesuai dengan karakteristik setiap kelompok provinsi.
Berdasarkan hasil analisis cluster menggunakan metode Centroid Linkage diperoleh anggota tiap cluster sebagai berikut:
| Cluster | Provinsi |
|---|---|
| 1 | Aceh, Sumatra Utara, Sumatra Barat,Riau,Jambi,Sumatra Selatan,Bengkulu, Kep.Bangka Belitung, Kep. Riau, DI Yogyakarta,Banten, Bali, Nusa Tenggara Barat, Nusa Tenggara Timur, Kalimantan Barat, Kalimantan Tengah, Kalimantan Selatan, Kalimantan Timur, Sulawesi Utara, Sulawesi Tengah, Sulawesi Selatan, Sulawesi Tenggara, Gorontalo, Sulawesi Barat, Maluku, Maluku Utara, Papua Barat, dan Papua. |
| 2 | Lampung |
| 3 | Jawa Barat, Jawa Tengah, Jawa Timur |
> idclus = clus_hier$cluster
> idclus
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
1 1 1 1 1 1 1 2 1 1 3 3 1 3 1 1 1 1 1 1 1 1 1 1 1 1
27 28 29 30 31 32
1 1 1 1 1 1
> aggregate(data,list(idclus),mean)
Group.1 Provinsi Padi Kedelai Ubi.Kayu Ubi.Jalar
1 1 NA 1151433 9761.857 198727.2 50733.57
2 2 NA 3101455 7993.000 8387351.0 47408.00
3 3 NA 11234501 187276.000 3408537.7 338504.00
Setelah dilakukannya penentuan jumlah cluster beserta anggota yang terbentuk. Maka berikutnya menentukan karakteristik untuk menjelaskan isi cluster tersebut. Berdasarkan output dapat disimpulkan bahwa pada cluster 1 terdapat 29 provinsi yang termasuk provinsi dengan produksi tanaman pangan yang cukup besar dalam berbagai jenis tanaman pangan. Pada cluster 2 yang hanya mencakup provinsi lampung merupakan kelompok provinsi dengan produksi ubi kayu yang dominan dibandingkan komoditas lainnya. Sedangkan pada cluster 3 terdapat 3 provinsi yang merupakan kelompok provinsi dengan produksi tanaman pangan yang tinggi terutama padi dan kedelai dibandingkan cluster lainnya.
Penelitian ini menganalisis data produksi tanaman pangan dari seluruh provinsi di Indonesia pada tahun 2012 dengan menggunakan metode centroid linkage sebagai teknik klasterisasi terbaik. Hasil analisis menghasilkan tiga cluster dengan karakteristik yang berbeda. Cluster 1 mencakup 29 provinsi dengan produksi tanaman pangan yang cukup besar dan beragam pada berbagai komoditas. Cluster 2, yang hanya terdiri dari Provinsi Lampung, memiliki ciri khas sebagai daerah dengan produksi ubi kayu yang dominan. Sementara itu, Cluster 3 terdiri dari 3 provinsi dengan produksi tanaman pangan yang tinggi, khususnya pada padi dan kedelai. Hasil klasterisasi ini menunjukkan adanya variasi fokus dan potensi produksi antar wilayah yang signifikan. Pola ini memberikan wawasan penting untuk memahami distribusi komoditas pangan di Indonesia, sekaligus mengidentifikasi kebutuhan dan potensi masing-masing wilayah. Dengan demikian, hasil penelitian ini dapat menjadi dasar yang kuat untuk pengambilan kebijakan di sektor pertanian, seperti pengembangan komoditas unggulan di setiap cluster, peningkatan infrastruktur pertanian, dan dukungan teknologi yang disesuaikan dengan karakteristik tiap wilayah. Upaya tersebut diharapkan mampu mendorong ketahanan pangan nasional dan meningkatkan kesejahteraan petani di seluruh Indonesia.
Berdasarkan hasil penelitian, disarankan agar setiap cluster memfokuskan pengembangan pada komoditas unggulan sesuai dengan karakteristik masing-masing. Cluster 1, yang memiliki beragam dan tinggi produksi pangan, dapat diarahkan untuk memperluas diversifikasi serta memperkuat integrasi pasar antar wilayah. Untuk Cluster 2, yang menonjol dalam produksi ubi kayu di Provinsi Lampung, diperlukan peningkatan kapasitas produksi, pengolahan hasil, serta akses pasar yang lebih luas. Sementara itu, Cluster 3 yang unggul dalam produksi padi dan kedelai memerlukan prioritas dalam pengembangan infrastruktur, seperti irigasi dan fasilitas penyimpanan hasil panen. Di samping itu, setiap wilayah membutuhkan dukungan teknologi pertanian yang sesuai dengan kebutuhan spesifiknya, serta pelatihan bagi petani untuk meningkatkan kemampuan mereka dalam mengadopsi teknologi modern. Pemerintah juga perlu merumuskan kebijakan yang mendukung pertanian berkelanjutan, termasuk akses yang lebih baik terhadap sumber daya alam, peningkatan konektivitas wilayah produksi, dan penciptaan iklim investasi yang kondusif. Melalui langkah-langkah ini, diharapkan ketahanan pangan nasional dapat diperkuat, sekaligus meningkatkan kesejahteraan petani di berbagai wilayah Indonesia.
Data BPS Produksi Tanaman Pangan (Ton) 2012. 2016. (Online), (https://www.bps.go.id/id/statistics-table/2/MjMjMg%253D%253D/produksi-tanaman-pangan.html)
Gudono. 2012. Analisis Data Multivariat edisi 2. Yogyakarta. BPFE
Santoso,Singgih. 2015. Menguasai Statistik Multivariat Konsep Dasar dan Aplikasi dengan SPSS. Jakarta. Elex Media Komputindo.
Silvi, R. 2018. Analisis Cluster dengan Data Pencilan Menggunakan Centroid Linkage dan KMeans Clustering untuk Pengelompokan Indikator HIV/AIDS di Indonesia. Jurnal Matematika “MANTIK”, 22-3