Produktivitas pertanian di Indonesia dipengaruhi oleh berbagai faktor lingkungan seperti kualitas air, luas lahan, tutupan lahan, dan kualitas udara. Penelitian ini bertujuan untuk membangun model prediksi produksi pertanian yang lebih stabil dan akurat dengan menggunakan metode Robust Regression, sebagai alternatif dari regresi OLS yang sensitif terhadap outlier. Data sekunder tahun 2023 dari seluruh provinsi di Indonesia dianalisis dengan menggunakan pendekatan Robust Regression fungsi Tukey Bisquare dan Huber. Hasil menunjukkan bahwa model Robust Regression mampu menurunkan pengaruh outlier, meningkatkan kestabilan estimasi, serta menghasilkan nilai AIC, BIC, dan R² yang lebih baik dibanding OLS. Model dengan fungsi Tukey Bisquare menampilkan kinerja terbaik dalam mengikuti pola data aktual. Temuan ini menegaskan bahwa Robust Regression merupakan pendekatan yang efektif untuk memprediksi produksi pertanian dengan mempertimbangkan variabilitas lingkungan antar wilayah.
Kata kunci: Regresi OLS, Robust Regression, Tukey Bisquare, outlier, produktivitas padi.
Pertanian masih menjadi salah satu sektor utama yang menopang kehidupan masyarakat Indonesia. Selain berperan penting dalam penyediaan bahan pangan, sektor ini juga memberikan kontribusi besar terhadap perekonomian nasional. Namun demikian, produktivitas pertanian di berbagai wilayah Indonesia tidak selalu stabil dari waktu ke waktu. Perbedaan kondisi lingkungan, perubahan iklim, serta variasi karakteristik wilayah menjadi faktor yang memengaruhi besarnya hasil produksi di setiap provinsi. Faktor lingkungan seperti kualitas air, kondisi lahan, tutupan lahan, dan kualitas udara sangat menentukan keberhasilan proses pertanian (Kondolele, 2023). Air yang cukup dan berkualitas baik menjadi syarat penting dalam proses budidaya tanaman. Demikian pula, lahan yang subur serta kondisi udara yang mendukung sangat berpengaruh terhadap pertumbuhan tanaman. Di sisi lain, tekanan lingkungan akibat alih fungsi lahan atau polusi udara dapat menurunkan produktivitas secara signifikan.
Untuk memahami hubungan antara faktor-faktor tersebut dengan produksi pertanian, diperlukan pendekatan kuantitatif yang mampu memberikan hasil estimasi secara akurat. Metode Ordinary Least Squares (OLS) selama ini menjadi salah satu pendekatan yang sering digunakan dalam analisis regresi. Akan tetapi, OLS memiliki kelemahan mendasar, yaitu sangat sensitif terhadap data ekstrem atau outlier (Astuti, Bekti, & Sebo, 2023). Dalam konteks data pertanian di Indonesia, outlier sering muncul akibat kondisi wilayah yang sangat bervariasi, perbedaan curah hujan ekstrem, atau faktor pencatatan data lapangan.
Sebagai solusi, metode Robust Regression menjadi alternatif yang lebih sesuai karena dapat mengurangi pengaruh observasi ekstrem. Teknik ini memberi bobot lebih kecil pada data yang menyimpang, sehingga estimasi koefisien yang diperoleh lebih stabil dan lebih merepresentasikan pola mayoritas data (Rasantaka, Ashshidiqi, Yulianti, Zeinawaqi, & Widodo, 2022). Dengan menerapkan metode Robust Regression, diharapkan dapat diperoleh model yang lebih akurat dalam memprediksi produksi pertanian berdasarkan kondisi lingkungan di Indonesia.
Berdasarkan latar belakang, dapat diidentifikasi beberapa permasalahan utama dalam penelitian ini, yaitu:
Penelitian ini bertujuan untuk:
Dalam pelaksanaannya, penelitian ini memiliki beberapa keterbatasan, di antaranya:
Metode OLS digunakan untuk memodelkan hubungan antara satu variabel terikat dan beberapa variabel bebas dengan cara meminimalkan jumlah kuadrat selisih antara nilai aktual dan prediksi. Kelebihannya terletak pada kemudahan perhitungan dan interpretasi koefisien. Secara matematis, estimasi parameter OLS diperoleh melalui rumus:
\[ \hat{\beta}_{OLS} = \arg\min_{\beta} \|y - X\beta\|^2 = (X^{\top}X)^{-1}X^{\top}y \]
Keterangan:
\(\hat{\beta}̂\) = Vektor estimasi koefisien regresi
\(X\) = Matriks variabel bebas (independent)
\(Y\) = Vektor variabel terikat (dependen)
Namun, metode ini sangat sensitif terhadap outlier. Beberapa data ekstrem dapat menggeser estimasi koefisien dan membuat hasil prediksi menjadi kurang stabil. Dalam data pertanian yang bersifat heterogen antar wilayah, kondisi ini cukup sering terjadi sehingga OLS tidak selalu memberikan hasil yang optimal (Astuti, Bekti, & Sebo, 2023).
Robust Regression dikembangkan untuk mengatasi kelemahan OLS terhadap outlier. Pada penelitian ini, deteksi outlier akan dilakukan dengan menggunakan Cook’s Distance denggan rumus berikut:
\[ D_i = \frac{r_i^2}{p} \cdot \frac{h_{ii}}{1 - h_{ii}} \]
Keterangan:
\(D_i\) = Cook’s Distance observasi ke-i
\(r_i\) = Residual studentized observasi ke-i
\(p\) = Jumlah parameter model
\(h_{ii}\) = Nilai leverage untuk observasi ke-i
Jika terdapat titik yang memiliki nilai \(D_i\) lebih dari 1 maka titik tersebut merupakan titik outlier. Metode Robust Regression memberi bobot lebih kecil pada data ekstrem sehingga estimasi koefisien lebih stabil (Huber, 1981). Fungsi pembobot seperti Huber atau Tukey Bisquare digunakan untuk mengendalikan pengaruh observasi menyimpang (Rasantaka, Ashshidiqi, Yulianti, Zeinawaqi, & Widodo, 2022).
Pada penelitian ini, estimasi akan digunakan ialah estimasi IRLS (Iterative Reweighted least Squares) sebagai berikut:
\[ w_i = \frac{\psi(e_i)}{e_i} \]
Keterangan:
\(w_i\) = Bobot observasi ke-i
\(ψ(e_i)\) = Fungsi pengaruhh (influence function)
\(e_i\) = Residual (kesalahan) observasi ke-i
\[ \psi(e_i) = \begin{cases} e_i & \text{jika } |e_i| \leq c \\ c \cdot \text{sign}(e_i) & \text{jika } |e_i| > c \end{cases} \]
\[ \psi(e_i) = \begin{cases} e_i \left[ 1 - \left( \frac{e_i}{c} \right)^2 \right]^2 & \text{jika } |e_i| \leq c \\ 0 & \text{jika } |e_i| > c \end{cases} \]
Pendekatan ini tidak menghapus data ekstrem, tetapi menyeimbangkan kontribusinya. Dalam konteks pertanian, cara ini lebih sesuai karena variasi antar wilayah sering memunculkan data ekstrem yang tetap mengandung informasi penting (Kamaluddin, 2023). Model akhir pada penelitian ini ialah:
\[ \hat{Y} = \beta_0 + \beta_1X_1 + \beta_2X_2 + \beta_3X_3 + \beta_4X_4 \] Keterangan:
\(\hat{Y}\) = Produksi Padi
\(\beta_0\) = Intercept
\(\beta_1\), \(\beta_2\), \(\beta_3\), \(\beta_4\) = Koefien Regresi
\(X_1\) = Kualitas Air
\(X_2\) = Kualitas Lahan
\(X_3\) = Kualitas Tutupan Lahan
\(X_4\) = Kualitas Udara
Beberapa pendekatan lain dapat digunakan untuk menangani outlier:
Dibandingkan pendekatan tersebut, Robust Regression lebih seimbang karena hasilnya stabil, interpretasi sederhana, dan cocok untuk data dengan heterogenitas tinggi (Astuti, Bekti, & Sebo, 2023).
Penelitian ini menggunakan data sekunder yang bersumber dari Badan Pusat Statistik (BPS) dan Kementerian Lingkungan Hidup dan Kehutanan (KLHK). Variabel yang digunakan meliputi:
Data diambil dari semua provinsi di Indonesia pada periode 2023.
Gambar 1. Alur Penelitian
| Asumsi | p.value | Keterangan |
|---|---|---|
| Multikolinieritas | Tidak terdapat multikolinieritas | |
| Normalitas | 0,002323 | Data tidak berdistribusi normal |
| Terdapat outlier pada observasi ke-11 dan 16 | ||
| Linearitas | 5,101 × 10⁻⁷ | Data tidak linear |
Karena data tidak memenuhi asumsi normalitas dan linearitas, dilakukan transformasi terhadap variabel dependen dengan log. Setelah dilakukan transformasi, hasil pengujian ulang asumsi adalah sebagai berikut:
| Asumsi | p.value | Keterangan |
|---|---|---|
| Multikolinieritas | Tidak terdapat multikolinieritas | |
| Normalitas | 0,06226 | Data berdistribusi normal |
| Terdapat outlier pada observasi ke-11 dan 38 | ||
| Linearitas | 0,4797 | Data linear |
Transformasi data berhasil memperbaiki asumsi normalitas dan linearitas, namun outlier masih tetap ada. Karena keberadaan outlier dapat menyebabkan hasil estimasi pada OLS menjadi tidak stabil, maka dilakukan analisis lanjutan menggunakan metode Robust Regression untuk meredam pengaruh outlier terhadap model.
Model robust regression dengan fungsi Tukey Bisquare memberikan hasil estimasi sebagai berikut: \[ \hat{Y} = 18,415 + 0,078X_1 +0,041X_2 -0,113X_3 - 0,054X_4 \] Sedangkan, model robust regression dengan fungsi Huber memberikan hasil estimasi sebagai berikut: \[ \hat{Y} = 11,954 + 0,102X_1 +0,064X_2 -0,138X_3 +0,002X_4 \]
Perbandingan nilai estimasi, standard error, dan p-value antara model OLS dan Robust Regression dapat dilihat pada grafik berikut:
Gambar 2. Perbandingan Estimasi pada OLS vs Robust Regression
| Metrik | Tukey | Huber | OLS | Keterangan |
|---|---|---|---|---|
| AIC | 194,0589 | 189,6028 | 1.231,5487 | Model Robust lebih baik |
| BIC | 203,8844 | 199,4283 | 1.241,3742 | Model Robust lebih baik |
| R² | 0,2840 | 0,3632 | 0,1994 | Model Robust lebih baik |
Nilai AIC dan BIC yang lebih kecil serta R² yang lebih tinggi pada Robust Regression menunjukkan bahwa model robust memiliki kinerja prediktif yang lebih baik dibandingkan model OLS.
Gambar 3. Perbandingan Prediksi: Aktual vs OLS vs Robust Regression
Hasil perbandingan kurva prediksi menunjukkan bahwa model robust regression (terutama Robust Regression pada fungsi Tukey Bisquare) cenderung lebih mengikuti pola aktual dibandingkan model OLS. Hal ini semakin memperkuat bahwa Robust Regression mampu mengatasi pengaruh outlier dan memberikan hasil prediksi yang lebih akurat. Dengan demikian, dapat disimpulkan bahwa Robust Regression pada fungsi Tukey Bisquare merupakan model terbaik dalam meramalkan pengaruh kualitas air, lahan, tutupan lahan, dan udara terhadap produksi pertanian berdasarkan provinsi di Indonesia tahun 2023. Implikasinya, model yang dihasilkan menjadi lebih stabil, efisien, dan lebih akurat dalam prediksi.
Untuk mempermudah visualisasi hasil analisis dan memberikan pengalaman interaktif kepada pengguna, penelitian ini juga menghasilkan dua dashboard berbasis Shiny Apps. Dashboard pertama menampilkan hasil penerapan metode regresi robust dalam memprediksi produksi pertanian padi berdasarkan faktor lingkungan.
Melalui kedua dashboard tersebut, pengguna dapat mengeksplorasi perbandingan antara model OLS dan Robust Regression, serta memahami perbedaan hasil prediksi berdasarkan faktor lingkungan yang digunakan.
Berdasarkan hasil analisis, metode OLS pada awalnya menunjukkan keterbatasan dalam menghadapi data produksi pertanian yang heterogen di Indonesia. Model OLS menghasilkan koefisien yang tidak signifikan untuk seluruh variabel independen, serta tidak memenuhi asumsi klasik, khususnya normalitas dan linearitas. Meskipun transformasi logaritma pada variabel dependen berhasil memperbaiki normalitas dan linearitas, keberadaan outlier tetap mengganggu stabilitas estimasi, sehingga mempengaruhi interpretasi koefisien dan kemampuan prediksi model.
Dalam konteks ini, Robust Regression memberikan solusi yang lebih tepat. Metode ini secara efektif menurunkan pengaruh observasi ekstrem dengan menggunakan fungsi pembobot, baik Tukey Bisquare maupun Huber. Hasil estimasi menunjukkan penurunan nilai koefisien, standard error, dan p-value untuk hampir semua variabel, terutama pada fungsi Tukey Bisquare. Hal ini menandakan bahwa model Robust Regression mampu menghasilkan koefisien yang lebih representatif terhadap tren mayoritas data, sekaligus meminimalkan distorsi akibat outlier.
Analisis goodness-of-fit memperkuat temuan ini. Nilai AIC dan BIC yang lebih rendah, serta peningkatan R² pada model Robust Regression dibanding OLS, menunjukkan bahwa model robust memiliki kemampuan prediksi yang lebih baik. Secara visual, kurva prediksi model robust lebih mengikuti pola data aktual, terutama fungsi Tukey Bisquare, sehingga hasil prediksi menjadi lebih akurat dan stabil. Selain itu, pengaruh faktor lingkungan terhadap produksi pertanian dapat diinterpretasikan lebih jelas melalui model robust. Kualitas air dan tutupan lahan, misalnya, terbukti memberikan kontribusi signifikan, meskipun efeknya bervariasi antar provinsi. Dengan demikian, Robust Regression tidak hanya memberikan estimasi yang stabil, tetapi juga memungkinkan analisis yang lebih realistis terhadap kondisi nyata produksi pertanian di Indonesia.
Keseluruhan temuan ini menegaskan bahwa dalam kondisi data yang heterogen dan rentan terhadap outlier, metode Robust Regression, khususnya dengan fungsi Tukey Bisquare, merupakan pendekatan yang lebih sesuai dibanding OLS untuk membangun model prediksi produksi pertanian. Hasil ini memiliki implikasi penting bagi perencanaan sektor pertanian, baik untuk evaluasi potensi produksi maupun pengelolaan sumber daya lingkungan yang mendukung produktivitas.
Berdasarkan hasil analisis dan pembahasan pada Bab 4, dapat disimpulkan sebagai berikut:
Berdasarkan kesimpulan penelitian, beberapa saran yang dapat diberikan untuk penelitian selanjutnya dan pemanfaatan hasil penelitian ini antara lain:
Azzahro, I. A., & Sofro, A. Y. (2023). Regresi Robust terhadap Deforestasi di Indonesia. Jurnal Ilmiah Matematika Volume, 11(3), 2301-9115.
Astuti, F., Bekti, R. D., & Sebo, T. I. (2023). Analisis Produksi Padi di Indonesia Menggunakan Model Regresi Robust Estimasi M, Estimasi S dan Estimasi MM. Jurnal Technoscientia, 16(1), 14–22. doi.org/10.34151/technoscientia.v16i1.4513
BPS. (2025). Luas Panen, Produktivitas, dan Produksi Padi Menurut Provinsi, 2023. Badan Pusat Statistik. Diambil dari https://www.bps.go.id/id/statistics-table/3/WmpaNk1YbGFjR0pOUjBKYWFIQlBSU3MwVHpOVWR6MDkjMw==/luas-panen--produktivitas--dan-produksi-padi-menurut-provinsi--2023.html?year=2023
BPS. (2025). Komponen Penyusun Indeks Kualitas Lingkungan Hidup Menurut Provinsi, 2023. Badan Pusat Statistik. Diambil dari https://www.bps.go.id/id/statistics-table/3/WmpaNk1YbGFjR0pOUjBKYWFIQlBSU3MwVHpOVWR6MDkjMw==/luas-panen--produktivitas--dan-produksi-padi-menurut-provinsi--2023.html?year=2023
Huber, P. J. (1981). Robust Statistics. Wiley.
Kamaluddin, Bhamakerti Hafiz. (2023). Perbandingan model regresi robust estimasi MM(Method of Moment) dan estimasi LTS(Least Primmed Square) pada produksi padi di Jawa Tengah Tahun 2020. Skripsi. Universitas Islam Negeri Walisongo Semarang.
Kondolele, Yusliaty Bubun. (2023). Analisis Determinan Kualitas Lingkunan Hidup di Pulau Jawa. Skripsi. Universitas Hasanuddin.
Maziyah, Ais Maulidia. (1995). Penggunaan Regresi Robust Dengan Estimasi-S Dan Estimasi-Mm Dalam Pengembangan Sistem Pendukung Keputusan Guna Memprediksi Tingkat Produksi Padi. Skripsi. Institut Teknologi Sepuluh Nopember.
Rasantaka, M. P. R., Ashshidiqi, M. F., Yulianti, R., Zeinawaqi, Z., & Widodo, E. (2022). Implementasi Regresi Robust untuk Mengetahui Faktor-Faktor yang Mempengaruhi Produksi Padi di Indonesia. Jurnal Statistika dan Aplikasinya, 6(2), 115–126.
Setyowati, E., Akbarita, R., dan Robby, R. R. (2021). Perbandingan Regresi Robust Metode Least Trimmed Square (LTS) dan Metode Estimasi-S pada Produksi Padi Kabupaten Blitar. Jurnal Matematika UNAND, 10(3), 329–341.
Susanti, Y., Pratiwi, H., & Sulistijowati, S. (2013). Optimasi model regresi robust untuk memprediksi produksi kedelai di Indonesia. Makalah seminar. Seminar Nasional Matematika dan Pendidikan Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Negeri Yogyakarta, Yogyakarta, Indonesia.