Produksi hasil perkebunan merupakan salah satu indikator penting dalam pembangunan sektor pertanian daerah karena berkontribusi terhadap pendapatan masyarakat, penyerapan tenaga kerja, serta pertumbuhan ekonomi wilayah. Di Kabupaten Pacitan, produksi komoditas perkebunan seperti kelapa, kopi, dan kakao menunjukkan variasi yang cukup besar antar kecamatan. Perbedaan ini dapat dipengaruhi oleh kondisi agroklimat, luas lahan, tingkat produktivitas, serta akses terhadap teknologi dan infrastruktur. Variasi tersebut menunjukkan bahwa karakteristik produksi tiap wilayah tidak seragam sehingga diperlukan pendekatan analisis yang mampu mengidentifikasi pola kesamaan antar kecamatan secara lebih sistematis.
Sebagai lembaga statistik resmi pemerintah, Badan Pusat Statistik memiliki peran dalam menyediakan data yang akurat dan berkelanjutan, termasuk data produksi perkebunan daerah. Data yang dihimpun melalui survei dan kompilasi administrasi menjadi dasar dalam perencanaan pembangunan nasional maupun daerah sebagaimana diatur dalam Undang-Undang Nomor 16 Tahun 1997 tentang Statistik. Namun, dalam praktiknya data produksi perkebunan umumnya masih disajikan dalam bentuk tabel agregat sehingga pemanfaatannya untuk mengidentifikasi kesamaan karakteristik wilayah belum optimal. Padahal, analisis data multivariat dapat membantu mereduksi kompleksitas data dan menghasilkan segmentasi wilayah yang lebih informatif.
Salah satu metode yang dapat digunakan untuk tujuan tersebut adalah K-Means Clustering, yaitu teknik pengelompokan yang membagi objek ke dalam beberapa kelompok berdasarkan kemiripan karakteristiknya. Metode ini sesuai digunakan pada data produksi perkebunan yang bersifat kuantitatif dan memungkinkan interpretasi yang jelas terhadap hasil pengelompokan, misalnya kelompok kecamatan dengan produksi tinggi, sedang, dan rendah. Oleh karena itu, penelitian ini bertujuan menerapkan K-Means untuk mengelompokkan kecamatan di Kabupaten Pacitan berdasarkan produksi hasil perkebunan tahun 2025 sehingga dapat memberikan gambaran segmentasi wilayah yang mendukung perumusan kebijakan pembangunan perkebunan yang lebih terarah dan berbasis data.
Metode K-Means Clustering merupakan salah satu teknik analisis data dalam bidang data mining yang digunakan untuk mengelompokkan objek ke dalam beberapa kelompok (cluster) berdasarkan tingkat kemiripan karakteristiknya. Tujuan utama metode ini adalah meminimalkan variasi di dalam cluster (within-cluster variance) dan memaksimalkan perbedaan antar cluster (between-cluster variance). Menurut J. MacQueen, yang pertama kali memperkenalkan algoritma K-Means pada tahun 1967, metode ini bekerja dengan membagi sejumlah objek ke dalam k kelompok yang telah ditentukan sebelumnya sehingga setiap objek berada pada cluster dengan pusat (centroid) terdekat.
Secara umum, proses dalam metode K-Means diawali dengan menentukan jumlah cluster k, kemudian memilih centroid awal secara acak. Selanjutnya setiap objek data dihitung jaraknya terhadap masing-masing centroid, biasanya menggunakan Euclidean Distance, lalu objek tersebut dimasukkan ke dalam cluster dengan jarak terdekat. Setelah seluruh objek terkelompok, centroid baru dihitung berdasarkan rata-rata dari seluruh objek dalam cluster tersebut. Proses iterasi ini dilakukan secara berulang hingga tidak terjadi perubahan keanggotaan cluster atau hingga mencapai kondisi konvergen. Dengan mekanisme tersebut, K-Means mampu mengelompokkan data multivariat menjadi beberapa kelompok yang relatif homogen.
Metode K-Means banyak digunakan dalam berbagai bidang penelitian karena memiliki keunggulan dari segi efisiensi komputasi dan kemudahan interpretasi hasil. Namun demikian, metode ini juga memiliki beberapa keterbatasan, antara lain sensitif terhadap pemilihan centroid awal serta memerlukan penentuan jumlah cluster sejak awal analisis. Oleh karena itu, dalam praktiknya penentuan jumlah cluster optimal sering dilakukan menggunakan metode evaluasi seperti Elbow Method atau Silhouette Method agar hasil pengelompokan yang diperoleh lebih representatif terhadap struktur data yang dianalisis.
Dalam konteks analisis wilayah atau sektor ekonomi, metode K-Means sering dimanfaatkan untuk mengelompokkan daerah berdasarkan kesamaan karakteristik tertentu, seperti tingkat produksi pertanian, indikator pembangunan, atau kondisi sosial ekonomi. Dengan adanya pengelompokan tersebut, peneliti maupun pengambil kebijakan dapat lebih mudah mengidentifikasi pola distribusi data serta menentukan prioritas intervensi pembangunan secara lebih terarah dan berbasis data.
Data yang digunakan dalam penelitian ini merupakan data sekunder yang diperoleh dari Badan Pusat Statistik Kabupaten Pacitan. Data tersebut berupa data produksi hasil perkebunan menurut kecamatan di Kabupaten Pacitan tahun 2025.
| Kecamatan | Kelapa | Kopi | Kakao | Tembakau |
|---|---|---|---|---|
| Donorojo | 1974 | 5.0 | 0.0 | 0.0 |
| Punung | 2082 | 14.0 | 97.5 | 76.5 |
| Pringkuku | 2423 | 13.0 | 36.0 | 60.0 |
| Pacitan | 2129 | 13.0 | 38.0 | 45.5 |
| Kebonagung | 2838 | 258.0 | 1174.0 | 67.0 |
| Arjosari | 1727 | 68.0 | 161.0 | 13.0 |
| Nawangan | 570 | 709.0 | 236.0 | 48.0 |
| Bandar | 457 | 541.5 | 0.0 | 34.0 |
Sebelum proses pengelompokan dilakukan, data terlebih dahulu distandardisasi menggunakan metode Z-score untuk memastikan seluruh variabel berada pada skala yang sebanding. Tahap ini diperlukan karena variabel yang dianalisis (hasil produksi kelapa, kopi, kakao, dan tembakau) memiliki satuan serta rentang nilai yang berbeda. Tanpa standardisasi, perhitungan jarak berpotensi didominasi oleh variabel dengan nilai absolut paling besar sehingga dapat memengaruhi hasil pengelompokan. Proses standardisasi menghasilkan transformasi data dengan nilai rata-rata mendekati nol dan simpangan baku satu. Hasil perhitungan Z-score selanjutnya disajikan pada tabel berikut.
| Kelapa | Kopi | Kakao | Tembakau |
|---|---|---|---|
| 0.006 | -0.769 | -0.820 | -1.140 |
| 0.137 | -0.728 | -0.650 | 0.953 |
| 0.552 | -0.733 | -0.757 | 0.502 |
| 0.194 | -0.733 | -0.754 | 0.105 |
| 1.057 | 0.357 | 1.221 | 0.693 |
| -0.295 | -0.488 | -0.540 | -0.785 |
| -1.702 | 2.363 | -0.410 | 0.173 |
| -1.839 | 1.618 | -0.820 | -0.210 |
| -0.703 | -0.141 | -0.510 | 2.253 |
| 1.372 | -0.226 | 1.868 | -0.593 |
| 0.743 | -0.128 | 0.962 | -1.086 |
| 0.479 | -0.390 | 1.209 | -0.867 |
Pada tahap pendeteksian pencilan digunakan metode jarak kuadrat Mahalanobis. Suatu pengamatan ke-i diidentifikasi sebagai pencilan apabila memenuhi kriteria \(d^2_MD (i)>X_(p,1-α)^2\) (Johnsn & Wichern, 2014). Pada penelitian ini banyaknya variabel yang digunakan sebanyak p=4 dengan taraf signifikansi α=5%. Oleh karena itu, nilai batas (cutoff) yang digunakan adalah \(X_(p=4,(1-0,05))^2=9,4877\).
| Kecamatan | Mahalanobis | Batas_ChiSquare | Outlier |
|---|---|---|---|
| Donorojo | 3.249 | 11.143 | FALSE |
| Punung | 1.712 | 11.143 | FALSE |
| Pringkuku | 3.676 | 11.143 | FALSE |
| Pacitan | 1.430 | 11.143 | FALSE |
| Kebonagung | 4.825 | 11.143 | FALSE |
| Arjosari | 1.989 | 11.143 | FALSE |
| Nawangan | 5.905 | 11.143 | FALSE |
| Bandar | 3.909 | 11.143 | FALSE |
| Tegalombo | 7.738 | 11.143 | FALSE |
| Tulakan | 3.532 | 11.143 | FALSE |
| Ngadirojo | 1.691 | 11.143 | FALSE |
| Sudimoro | 4.345 | 11.143 | FALSE |
Observasi yang berada di atas garis batas chi-square diidentifikasi
sebagai outlier multivariat. kemudian ditangani dengan cara dihapus.
Berdasarkan hasil perhitungan jarak kuadrat Mahalanobis pada data yang telah distandardisasi menggunakan Z-score, kemudian dibandingkan dengan nilai batas (cutoff) yang ditetapkan, diperoleh bahwa seluruh kecamatan tidak menunjukkan indikasi sebagai outlier multivariat.
Pengujian multikolinearitas dilakukan untuk mengidentifikasi adanya hubungan yang terlalu kuat antarvariabel produksi padi dan ternak yang dapat memengaruhi stabilitas analisis. Pemeriksaan ini menggunakan pendekatan Variance Inflation Factor (VIF), yang dihitung berdasarkan nilai koefisien determinasi (\(𝑅²\)) dari masing-masing variabel terhadap variabel lainnya. Secara umum, nilai VIF lebih dari 10 mengindikasikan adanya multikolinearitas yang serius, sedangkan nilai VIF lebih dari 5 menunjukkan indikasi multikolinearitas yang cukup kuat.
| Variabel | VIF | R_squared | Keterangan |
|---|---|---|---|
| Kelapa | 8.637267 | 0.8842226 | Multikolinearitas sedang |
| Kopi | 4.946521 | 0.7978377 | Tidak ada multikolinearitas |
| Kakao | 4.679400 | 0.7862974 | Tidak ada multikolinearitas |
| Tembakau | 1.101137 | 0.0918480 | Tidak ada multikolinearitas |
Berdasarkan hasil perhitungan, seluruh variabel menunjukkan nilai VIF kurang dari 10. Hal ini mengindikasikan bahwa tidak terdapat gejala multikolinearitas yang kuat pada variabel-variabel yang dianalisis. Dengan demikian, seluruh variabel dapat dipertahankan dan digunakan dalam tahap analisis selanjutnya.
Penentuan jumlah klaster dilakukan menggunakan metode Silhouette dengan menghitung nilai average silhouette width untuk beberapa kemungkinan jumlah klaster. Metode ini mengukur seberapa baik setiap observasi berada dalam klaster yang sama dibandingkan dengan klaster lainnya.
Berdasarkan grafik evaluasi silhouette yang dihasilkan, nilai average silhouette width tertinggi diperoleh pada k = 3. Hal ini menunjukkan bahwa pembagian data menjadi dua klaster memberikan struktur pengelompokan yang paling optimal dibandingkan dengan jumlah klaster lainnya.
Dengan demikian, jumlah klaster yang digunakan dalam penelitian ini adalah tiga klaster.
| Jumlah_Klaster | Average_Silhouette |
|---|---|
| 2 | 0.383 |
| 3 | 0.479 |
| 4 | 0.459 |
Berdasarkan Output diatas dapat dilihat bahwa nilai silhouette pada k=3 lebih besar daripada k lainnya. Apabila nilai silhouette semakin mendekati nilai 1, maka cluster semakin baik. Dapat disimpulkan bahwa jumlah k optimal adalah 3.
Setelah jumlah klaster optimal diperoleh, analisis dilanjutkan dengan menerapkan algoritma K-Means dengan jumlah klaster sebanyak tiga. Algoritma ini mengelompokkan kecamatan berdasarkan kesamaan karakteristik produksi komoditas perkebunan yang meliputi kelapa, kopi, kakao, dan tembakau.
Hasil analisis menunjukkan bahwa setiap kecamatan berhasil dikelompokkan ke dalam salah satu dari tiga klaster yang terbentuk. Klaster tersebut merepresentasikan kelompok kecamatan dengan karakteristik produksi perkebunan yang relatif mirip.
| Klaster | Jumlah_Kecamatan |
|---|---|
| 1 | 6 |
| 2 | 4 |
| 3 | 2 |
| Kecamatan | Klaster |
|---|---|
| Donorojo | 1 |
| Punung | 1 |
| Pringkuku | 1 |
| Pacitan | 1 |
| Arjosari | 1 |
| Tegalombo | 1 |
| Kebonagung | 2 |
| Tulakan | 2 |
| Ngadirojo | 2 |
| Sudimoro | 2 |
| Nawangan | 3 |
| Bandar | 3 |
| Cluster | Kelapa | Kopi | Kakao | Tembakau |
|---|---|---|---|---|
| 1 | 1954.33 | 43.17 | 85.08 | 53.17 |
| 2 | 2719.50 | 156.00 | 1228.00 | 24.75 |
| 3 | 513.50 | 625.25 | 118.00 | 41.00 |
Karakteristik setiap klaster dapat dilihat dari nilai rata-rata produksi masing-masing komoditas pada setiap klaster.
Secara umum, hasil analisis menunjukkan bahwa:
Klaster 1: Klaster ini ditandai dengan produksi tembakau sebagai komoditas unggulan dengan rata-rata produksi tertinggi dibandingkan klaster lainnya, yaitu sebesar 53,17. Selain itu, wilayah dalam klaster ini juga memiliki produksi kelapa yang relatif cukup tinggi dengan rata-rata sebesar 1954,33. Namun, produksi kopi dan kakao pada klaster ini merupakan yang terendah dibandingkan klaster lainnya. Karakteristik tersebut menunjukkan bahwa wilayah dalam klaster ini cenderung lebih berfokus pada komoditas tembakau dengan dukungan produksi kelapa yang cukup baik, tetapi kurang berkembang pada komoditas perkebunan lainnya. Secara geografis, klaster ini mendominasi wilayah bagian barat hingga tengah Kabupaten Pacitan yang meliputi Kecamatan Donorojo, Punung, Pringkuku, Pacitan, Arjosari, dan Tegalombo.
Klaster 2: Klaster ini merupakan wilayah dengan tingkat produksi kelapa dan kakao paling tinggi dibandingkan klaster lainnya. Rata-rata produksi kelapa pada klaster ini mencapai 2719,50, sedangkan rata-rata produksi kakao sebesar 1228,00, sehingga menjadikan wilayah ini sebagai pusat utama produksi kedua komoditas tersebut. Meskipun demikian, produksi tembakau pada klaster ini justru merupakan yang paling rendah dengan rata-rata sebesar 24,75. Karakteristik tersebut menunjukkan bahwa wilayah dalam klaster ini lebih berorientasi pada pengembangan komoditas kelapa dan kakao sebagai komoditas perkebunan utama. Secara spasial, klaster ini terkonsentrasi di wilayah bagian tenggara Kabupaten Pacitan yang meliputi Kecamatan Kebonagung, Tulakan, Ngadirojo, dan Sudimoro.
Klaster 3: Klaster ini memiliki karakteristik khusus sebagai wilayah dengan produksi kopi paling tinggi dibandingkan klaster lainnya. Rata-rata produksi kopi pada klaster ini mencapai 625,25, yaitu hampir empat kali lipat lebih tinggi dibandingkan rata-rata produksi kopi pada klaster lainnya. Di sisi lain, produksi kelapa pada klaster ini merupakan yang paling rendah dengan rata-rata sebesar 513,50. Kondisi ini menunjukkan bahwa wilayah dalam klaster ini memiliki spesialisasi pada komoditas kopi yang umumnya berkembang baik pada wilayah dengan karakteristik geografis tertentu, seperti daerah dataran tinggi. Klaster ini berada di bagian utara Kabupaten Pacitan yang meliputi Kecamatan Nawangan dan Bandar.
Pengelompokan ini menunjukkan adanya perbedaan karakteristik produksi perkebunan antar kecamatan di Kabupaten Pacitan.
Visualisasi klaster dilakukan untuk melihat pola pemisahan antar klaster secara grafis. Grafik tersebut menampilkan posisi masing-masing kecamatan dalam ruang dua dimensi hasil reduksi dimensi data.
| Klaster | Kelapa | Kopi | Kakao | Tembakau |
|---|---|---|---|---|
| 1 | -0.018 | -0.599 | -0.672 | 0.315 |
| 2 | 0.912 | -0.097 | 1.315 | -0.463 |
| 3 | -1.770 | 1.990 | -0.615 | -0.018 |
Berdasarkan visualisasi yang dihasilkan, terlihat bahwa data kecamatan membentuk tiga kelompok utama yang relatif terpisah. Titik-titik yang berada dalam satu klaster memiliki jarak yang lebih dekat satu sama lain dibandingkan dengan titik pada klaster yang berbeda. Hal ini menunjukkan bahwa metode K-Means mampu mengidentifikasi pola pengelompokan yang cukup jelas pada data produksi perkebunan.
Berdasarkan hasil penerapan metode K-Means Clustering terhadap data produksi hasil perkebunan di Kabupaten Pacitan tahun 2025, diperoleh tiga kelompok kecamatan yang memiliki karakteristik produksi yang berbeda. Klaster pertama merupakan kelompok wilayah dengan produksi tembakau tertinggi dan produksi kelapa yang relatif cukup tinggi, namun memiliki produksi kopi dan kakao yang lebih rendah dibandingkan klaster lainnya. Klaster kedua menunjukkan wilayah dengan produksi kelapa dan kakao paling tinggi sehingga dapat dikategorikan sebagai pusat produksi utama kedua komoditas tersebut. Sementara itu, klaster ketiga memiliki karakteristik khusus dengan produksi kopi yang paling tinggi, meskipun produksi kelapa di wilayah ini relatif rendah.
Hasil pengelompokan tersebut menunjukkan adanya perbedaan pola produksi perkebunan antar kecamatan di Kabupaten Pacitan. Perbedaan tersebut mencerminkan adanya variasi kondisi wilayah, baik dari segi geografis, potensi lahan, maupun faktor pendukung produksi lainnya. Dengan adanya pengelompokan ini, struktur data produksi perkebunan yang semula kompleks dapat disederhanakan menjadi beberapa kelompok wilayah yang memiliki karakteristik serupa sehingga lebih mudah untuk dianalisis dan diinterpretasikan.
Secara umum, hasil analisis ini memberikan gambaran bahwa setiap wilayah di Kabupaten Pacitan memiliki potensi komoditas unggulan yang berbeda. Oleh karena itu, pendekatan pembangunan sektor perkebunan sebaiknya tidak dilakukan secara seragam, melainkan disesuaikan dengan karakteristik produksi masing-masing kelompok wilayah agar kebijakan yang diterapkan dapat lebih efektif dan tepat sasaran.
Berdasarkan hasil penelitian yang telah dilakukan, disarankan kepada pemerintah daerah dan pihak terkait untuk memanfaatkan hasil pengelompokan wilayah ini sebagai salah satu dasar dalam perencanaan pengembangan sektor perkebunan. Wilayah yang tergolong dalam klaster dengan produksi tinggi pada komoditas tertentu dapat diprioritaskan sebagai sentra pengembangan komoditas tersebut, sementara wilayah dengan produksi relatif rendah dapat diberikan dukungan berupa peningkatan teknologi budidaya, penyuluhan pertanian, maupun penguatan akses terhadap sarana produksi.
Selain itu, penelitian selanjutnya disarankan untuk menggunakan variabel tambahan yang lebih beragam, seperti luas lahan perkebunan, produktivitas tanaman, maupun faktor sosial ekonomi petani, sehingga hasil pengelompokan dapat memberikan gambaran yang lebih komprehensif mengenai kondisi sektor perkebunan di suatu wilayah. Penggunaan metode evaluasi klaster tambahan atau metode pengelompokan lain juga dapat dipertimbangkan untuk membandingkan dan meningkatkan kualitas hasil analisis.