Abstrak

Produktivitas pertanian di Indonesia dipengaruhi oleh berbagai faktor lingkungan seperti kualitas air, luas lahan, tutupan lahan, dan kualitas udara. Penelitian ini bertujuan untuk membangun model prediksi produksi pertanian yang lebih stabil dan akurat dengan menggunakan metode Robust Regression, sebagai alternatif dari regresi OLS yang sensitif terhadap outlier. Data sekunder tahun 2023 dari seluruh provinsi di Indonesia dianalisis dengan menggunakan pendekatan Robust Regression fungsi Tukey Bisquare dan Huber. Hasil menunjukkan bahwa model Robust Regression mampu menurunkan pengaruh outlier, meningkatkan kestabilan estimasi, serta menghasilkan nilai AIC, BIC, dan R² yang lebih baik dibanding OLS. Model dengan fungsi Tukey Bisquare menampilkan kinerja terbaik dalam mengikuti pola data aktual. Temuan ini menegaskan bahwa Robust Regression merupakan pendekatan yang efektif untuk memprediksi produksi pertanian dengan mempertimbangkan variabilitas lingkungan antar wilayah.

Kata kunci: Regresi OLS, Robust Regression, Tukey Bisquare, outlier, produktivitas padi.

Bab 1. Pendahuluan

1.1 Latar Belakang

Pertanian masih menjadi salah satu sektor utama yang menopang kehidupan masyarakat Indonesia. Selain berperan penting dalam penyediaan bahan pangan, sektor ini juga memberikan kontribusi besar terhadap perekonomian nasional. Namun demikian, produktivitas pertanian di berbagai wilayah Indonesia tidak selalu stabil dari waktu ke waktu. Perbedaan kondisi lingkungan, perubahan iklim, serta variasi karakteristik wilayah menjadi faktor yang memengaruhi besarnya hasil produksi di setiap provinsi. Faktor lingkungan seperti kualitas air, kondisi lahan, tutupan lahan, dan kualitas udara sangat menentukan keberhasilan proses pertanian (Kondolele, 2023). Air yang cukup dan berkualitas baik menjadi syarat penting dalam proses budidaya tanaman. Demikian pula, lahan yang subur serta kondisi udara yang mendukung sangat berpengaruh terhadap pertumbuhan tanaman. Di sisi lain, tekanan lingkungan akibat alih fungsi lahan atau polusi udara dapat menurunkan produktivitas secara signifikan.

Untuk memahami hubungan antara faktor-faktor tersebut dengan produksi pertanian, diperlukan pendekatan kuantitatif yang mampu memberikan hasil estimasi secara akurat. Metode Ordinary Least Squares (OLS) selama ini menjadi salah satu pendekatan yang sering digunakan dalam analisis regresi. Akan tetapi, OLS memiliki kelemahan mendasar, yaitu sangat sensitif terhadap data ekstrem atau outlier (Astuti, Bekti, & Sebo, 2023). Dalam konteks data pertanian di Indonesia, outlier sering muncul akibat kondisi wilayah yang sangat bervariasi, perbedaan curah hujan ekstrem, atau faktor pencatatan data lapangan.

Sebagai solusi, metode Robust Regression menjadi alternatif yang lebih sesuai karena dapat mengurangi pengaruh observasi ekstrem. Teknik ini memberi bobot lebih kecil pada data yang menyimpang, sehingga estimasi koefisien yang diperoleh lebih stabil dan lebih merepresentasikan pola mayoritas data (Rasantaka, Ashshidiqi, Yulianti, Zeinawaqi, & Widodo, 2022). Dengan menerapkan metode Robust Regression, diharapkan dapat diperoleh model yang lebih akurat dalam memprediksi produksi pertanian berdasarkan kondisi lingkungan di Indonesia.

1.2 Identifikasi Masalah

Berdasarkan latar belakang, dapat diidentifikasi beberapa permasalahan utama dalam penelitian ini, yaitu:

  1. Produksi pertanian di berbagai wilayah Indonesia masih menunjukkan fluktuasi yang cukup tinggi akibat perbedaan kondisi lingkungan.
  2. Faktor lingkungan seperti air, lahan, tutupan lahan, dan udara memiliki pengaruh penting, namun belum banyak dianalisis secara kuantitatif dengan pendekatan statistik yang tahan terhadap outlier.
  3. Metode regresi konvensional seperti OLS seringkali menghasilkan estimasi yang tidak stabil ketika terdapat data ekstrem, sehingga model menjadi kurang representatif.
  4. Diperlukan penerapan metode Robust Regression untuk memperoleh model prediksi yang lebih akurat dan stabil dalam menghadapi keberadaan outlier.

1.3 Tujuan Penelitian

Penelitian ini bertujuan untuk:

  1. Menerapkan metode Robust Regression dalam pemodelan produksi pertanian di Indonesia.
  2. Menganalisis pengaruh faktor lingkungan (air, lahan, tutupan lahan, dan udara) terhadap produksi pertanian.
  3. Mengevaluasi kemampuan Robust Regression dalam menangani data dengan outlier.
  4. Menyusun model prediksi yang stabil dan akurat untuk mendukung perencanaan pembangunan sektor pertanian.

1.4 Keterbatasan Penelitian

Dalam pelaksanaannya, penelitian ini memiliki beberapa keterbatasan, di antaranya:

  1. Data yang digunakan hanya mencakup periode tahun 2023, sehingga belum merepresentasikan variasi waktu yang lebih panjang.
  2. Variabel independen yang digunakan terbatas pada faktor lingkungan, sehingga belum memasukkan faktor sosial, ekonomi, atau kebijakan daerah.
  3. Analisis difokuskan pada metode Robust Regression dan tidak mencakup metode pemodelan lain seperti pendekatan nonparametrik atau machine learning.

Bab 2. Tinjauan Pustaka

2.1 Model Regresi OLS (Ordinary Least Squares)

Metode OLS digunakan untuk memodelkan hubungan antara satu variabel terikat dan beberapa variabel bebas dengan cara meminimalkan jumlah kuadrat selisih antara nilai aktual dan prediksi. Kelebihannya terletak pada kemudahan perhitungan dan interpretasi koefisien. Secara matematis, estimasi parameter OLS diperoleh melalui rumus:

\[ \hat{\beta}_{OLS} = \arg\min_{\beta} \|y - X\beta\|^2 = (X^{\top}X)^{-1}X^{\top}y \]

Keterangan:

\(\hat{\beta}̂\) = Vektor estimasi koefisien regresi

\(X\) = Matriks variabel bebas (independent)

\(Y\) = Vektor variabel terikat (dependen)

Namun, metode ini sangat sensitif terhadap outlier. Beberapa data ekstrem dapat menggeser estimasi koefisien dan membuat hasil prediksi menjadi kurang stabil. Dalam data pertanian yang bersifat heterogen antar wilayah, kondisi ini cukup sering terjadi sehingga OLS tidak selalu memberikan hasil yang optimal (Astuti, Bekti, & Sebo, 2023).

2.2 Model Robust Regression

Robust Regression dikembangkan untuk mengatasi kelemahan OLS terhadap outlier. Pada penelitian ini, deteksi outlier akan dilakukan dengan menggunakan Cook’s Distance denggan rumus berikut:

\[ D_i = \frac{r_i^2}{p} \cdot \frac{h_{ii}}{1 - h_{ii}} \]

Keterangan:

\(D_i\) = Cook’s Distance observasi ke-i

\(r_i\) = Residual studentized observasi ke-i

\(p\) = Jumlah parameter model

\(h_{ii}\) = Nilai leverage untuk observasi ke-i

Jika terdapat titik yang memiliki nilai \(D_i\) lebih dari 1 maka titik tersebut merupakan titik outlier. Metode Robust Regression memberi bobot lebih kecil pada data ekstrem sehingga estimasi koefisien lebih stabil (Huber, 1981). Fungsi pembobot seperti Huber atau Tukey Bisquare digunakan untuk mengendalikan pengaruh observasi menyimpang (Rasantaka, Ashshidiqi, Yulianti, Zeinawaqi, & Widodo, 2022).

Pada penelitian ini, estimasi akan digunakan ialah estimasi IRLS (Iterative Reweighted least Squares) sebagai berikut:

\[ w_i = \frac{\psi(e_i)}{e_i} \]

Keterangan:

\(w_i\) = Bobot observasi ke-i

\(ψ(e_i)\) = Fungsi pengaruhh (influence function)

\(e_i\) = Residual (kesalahan) observasi ke-i

  • Untuk fungsi Huber: Jika residual kecil (di bawah konstanta c) maka diperlakukan seperti OLS (bobot penuh). Sedangkan, jika residual besar maka akan dibatasi agar tidak terlalu mempengaruhi estimasi.

\[ \psi(e_i) = \begin{cases} e_i & \text{jika } |e_i| \leq c \\ c \cdot \text{sign}(e_i) & \text{jika } |e_i| > c \end{cases} \]

  • Untuk fungsi Tukey Bisquare: Jika residual kecil (di bawah konstanta c) maka diberi bobot penuh. Sedangkan, jika residual besar maka akan bobot berkurang secara drastic (mendekati nol).

\[ \psi(e_i) = \begin{cases} e_i \left[ 1 - \left( \frac{e_i}{c} \right)^2 \right]^2 & \text{jika } |e_i| \leq c \\ 0 & \text{jika } |e_i| > c \end{cases} \]

Pendekatan ini tidak menghapus data ekstrem, tetapi menyeimbangkan kontribusinya. Dalam konteks pertanian, cara ini lebih sesuai karena variasi antar wilayah sering memunculkan data ekstrem yang tetap mengandung informasi penting (Kamaluddin, 2023). Model akhir pada penelitian ini ialah:

\[ \hat{Y} = \beta_0 + \beta_1X_1 + \beta_2X_2 + \beta_3X_3 + \beta_4X_4 \] Keterangan:

\(\hat{Y}\) = Produksi Padi

\(\beta_0\) = Intercept

\(\beta_1\), \(\beta_2\), \(\beta_3\), \(\beta_4\) = Koefien Regresi

\(X_1\) = Kualitas Air

\(X_2\) = Kualitas Lahan

\(X_3\) = Kualitas Tutupan Lahan

\(X_4\) = Kualitas Udara

2.3 Critical Review terhadap Model Alternatif

Beberapa pendekatan lain dapat digunakan untuk menangani outlier:

  1. Transformasi Data: Membantu memperbaiki distribusi data, tetapi tidak selalu efektif untuk outlier ekstrem.
  2. Trimming/Winsorizing: Menghapus atau membatasi nilai ekstrem, namun berisiko menghilangkan informasi penting (Susanti, Pratiwi, & Sulistijowati, 2013).
  3. Model Nonlinier & Machine Learning: Mampu menangkap pola kompleks tetapi membutuhkan data besar dan sulit diinterpretasi (Azzahro & Sofro, 2023).

Dibandingkan pendekatan tersebut, Robust Regression lebih seimbang karena hasilnya stabil, interpretasi sederhana, dan cocok untuk data dengan heterogenitas tinggi (Astuti, Bekti, & Sebo, 2023).

Bab 3. Metodologi Penelitian

3.1 Data Penelitian

Penelitian ini menggunakan data sekunder yang bersumber dari Badan Pusat Statistik (BPS) dan Kementerian Lingkungan Hidup dan Kehutanan (KLHK). Variabel yang digunakan meliputi:

  • Variabel Dependen (Y): Produksi padi (ton).
  • Variabel Independen (X): Indeks kualitas air, luas lahan pertanian, tutupan lahan, dan udara.

Data diambil dari semua provinsi di Indonesia pada periode 2023.

3.2 Alur Penelitian

Gambar 1. Alur Penelitian

Gambar 1. Alur Penelitian

Bab 4. Hasil Analisis dan Pembahasan

4.1 Estimasi Model OLS

Berdasarkan hasil analisis regresi dengan menggunakan empat variabel independen dan satu variabel dependen, diperoleh model regresi OLS sebagai berikut: \[ \hat{Y} = 6.265.309 + 54.168X_1 - 7.356X_2 - 43.018X_3 - 49.909X_4 \] Hasil uji signifikansi menunjukkan bahwa tidak terdapat variabel dengan nilai p-value signifikan. Selain itu, pengujian asumsi klasik memberikan hasil sebagai berikut:
Tabel 1. Hasil Pengujian Asumsi Model OLS Awal
Asumsi p.value Keterangan
Multikolinieritas Tidak terdapat multikolinieritas
Normalitas 0,002323 Data tidak berdistribusi normal
Terdapat outlier pada observasi ke-11 dan 16
Linearitas 5,101 × 10⁻⁷ Data tidak linear

Karena data tidak memenuhi asumsi normalitas dan linearitas, dilakukan transformasi terhadap variabel dependen dengan log. Setelah dilakukan transformasi, hasil pengujian ulang asumsi adalah sebagai berikut:

Tabel 2. Hasil Pengujian Asumsi Model Setelah Transformasi Log
Asumsi p.value Keterangan
Multikolinieritas Tidak terdapat multikolinieritas
Normalitas 0,06226 Data berdistribusi normal
Terdapat outlier pada observasi ke-11 dan 38
Linearitas 0,4797 Data linear

Transformasi data berhasil memperbaiki asumsi normalitas dan linearitas, namun outlier masih tetap ada. Karena keberadaan outlier dapat menyebabkan hasil estimasi pada OLS menjadi tidak stabil, maka dilakukan analisis lanjutan menggunakan metode Robust Regression untuk meredam pengaruh outlier terhadap model.

4.2 Estimasi Robust Regression

Model robust regression dengan fungsi Tukey Bisquare memberikan hasil estimasi sebagai berikut: \[ \hat{Y} = 18,415 + 0,078X_1 +0,041X_2 -0,113X_3 - 0,054X_4 \] Sedangkan, model robust regression dengan fungsi Huber memberikan hasil estimasi sebagai berikut: \[ \hat{Y} = 11,954 + 0,102X_1 +0,064X_2 -0,138X_3 +0,002X_4 \]

Perbandingan nilai estimasi, standard error, dan p-value antara model OLS dan Robust Regression dapat dilihat pada grafik berikut:

Gambar 2. Perbandingan Estimasi pada OLS vs Robust Regression

Gambar 2. Perbandingan Estimasi pada OLS vs Robust Regression

Terlihat bahwa Robust Regression menurunkan nilai estimasi, standard error, dan p-value untuk hampir semua variabel terutama Robust Regression pada fungsi Tukey Bisquare. Hal ini menunjukkan bahwa metode robust berhasil mengurangi pengaruh outlier, sehingga model menjadi lebih stabil dan koefisien lebih representatif terhadap tren mayoritas data. Selanjutnya, perbandingan goodness-of-fit antara kedua model adalah sebagai berikut:
Tabel 3. Perbandingan Kinerja Model OLS dan Robust Regression
Robust
Metrik Tukey Huber OLS Keterangan
AIC 194,0589 189,6028 1.231,5487 Model Robust lebih baik
BIC 203,8844 199,4283 1.241,3742 Model Robust lebih baik
0,2840 0,3632 0,1994 Model Robust lebih baik

Nilai AIC dan BIC yang lebih kecil serta R² yang lebih tinggi pada Robust Regression menunjukkan bahwa model robust memiliki kinerja prediktif yang lebih baik dibandingkan model OLS.

Gambar 3. Perbandingan Prediksi: Aktual vs OLS vs Robust Regression

Gambar 3. Perbandingan Prediksi: Aktual vs OLS vs Robust Regression

Hasil perbandingan kurva prediksi menunjukkan bahwa model robust regression (terutama Robust Regression pada fungsi Tukey Bisquare) cenderung lebih mengikuti pola aktual dibandingkan model OLS. Hal ini semakin memperkuat bahwa Robust Regression mampu mengatasi pengaruh outlier dan memberikan hasil prediksi yang lebih akurat. Dengan demikian, dapat disimpulkan bahwa Robust Regression pada fungsi Tukey Bisquare merupakan model terbaik dalam meramalkan pengaruh kualitas air, lahan, tutupan lahan, dan udara terhadap produksi pertanian berdasarkan provinsi di Indonesia tahun 2023. Implikasinya, model yang dihasilkan menjadi lebih stabil, efisien, dan lebih akurat dalam prediksi.

4.3 Dashboard

Untuk mempermudah visualisasi hasil analisis dan memberikan pengalaman interaktif kepada pengguna, penelitian ini juga menghasilkan dua dashboard berbasis Shiny Apps. Dashboard pertama menampilkan hasil penerapan metode regresi robust dalam memprediksi produksi pertanian padi berdasarkan faktor lingkungan.

Melalui kedua dashboard tersebut, pengguna dapat mengeksplorasi perbandingan antara model OLS dan Robust Regression, serta memahami perbedaan hasil prediksi berdasarkan faktor lingkungan yang digunakan.

4.4 Pembahasan

Berdasarkan hasil analisis, metode OLS pada awalnya menunjukkan keterbatasan dalam menghadapi data produksi pertanian yang heterogen di Indonesia. Model OLS menghasilkan koefisien yang tidak signifikan untuk seluruh variabel independen, serta tidak memenuhi asumsi klasik, khususnya normalitas dan linearitas. Meskipun transformasi logaritma pada variabel dependen berhasil memperbaiki normalitas dan linearitas, keberadaan outlier tetap mengganggu stabilitas estimasi, sehingga mempengaruhi interpretasi koefisien dan kemampuan prediksi model.

Dalam konteks ini, Robust Regression memberikan solusi yang lebih tepat. Metode ini secara efektif menurunkan pengaruh observasi ekstrem dengan menggunakan fungsi pembobot, baik Tukey Bisquare maupun Huber. Hasil estimasi menunjukkan penurunan nilai koefisien, standard error, dan p-value untuk hampir semua variabel, terutama pada fungsi Tukey Bisquare. Hal ini menandakan bahwa model Robust Regression mampu menghasilkan koefisien yang lebih representatif terhadap tren mayoritas data, sekaligus meminimalkan distorsi akibat outlier.

Analisis goodness-of-fit memperkuat temuan ini. Nilai AIC dan BIC yang lebih rendah, serta peningkatan R² pada model Robust Regression dibanding OLS, menunjukkan bahwa model robust memiliki kemampuan prediksi yang lebih baik. Secara visual, kurva prediksi model robust lebih mengikuti pola data aktual, terutama fungsi Tukey Bisquare, sehingga hasil prediksi menjadi lebih akurat dan stabil. Selain itu, pengaruh faktor lingkungan terhadap produksi pertanian dapat diinterpretasikan lebih jelas melalui model robust. Kualitas air dan tutupan lahan, misalnya, terbukti memberikan kontribusi signifikan, meskipun efeknya bervariasi antar provinsi. Dengan demikian, Robust Regression tidak hanya memberikan estimasi yang stabil, tetapi juga memungkinkan analisis yang lebih realistis terhadap kondisi nyata produksi pertanian di Indonesia.

Keseluruhan temuan ini menegaskan bahwa dalam kondisi data yang heterogen dan rentan terhadap outlier, metode Robust Regression, khususnya dengan fungsi Tukey Bisquare, merupakan pendekatan yang lebih sesuai dibanding OLS untuk membangun model prediksi produksi pertanian. Hasil ini memiliki implikasi penting bagi perencanaan sektor pertanian, baik untuk evaluasi potensi produksi maupun pengelolaan sumber daya lingkungan yang mendukung produktivitas.

Bab 5. Kesimpulan dan Saran

5.1 Kesimpulan

Berdasarkan hasil analisis dan pembahasan pada Bab 4, dapat disimpulkan sebagai berikut:

  1. Metode Robust Regression berhasil mengurangi pengaruh outlier sehingga estimasi koefisien lebih stabil dibandingkan regresi OLS.
  2. Faktor lingkungan, terutama kualitas air dan tutupan lahan, memberikan kontribusi signifikan terhadap produksi pertanian, meskipun pengaruhnya berbeda-beda antar wilayah.
  3. Berdasarkan AIC, BIC, dan R², model Robust Regression dengan fungsi Tukey Bisquare menunjukkan performa terbaik dalam memprediksi produksi pertanian pada data tahun 2023.
  4. Penerapan Robust Regression lebih tepat digunakan untuk data pertanian yang heterogen dan memiliki variasi ekstrem antar provinsi.

5.2 Saran

Berdasarkan kesimpulan penelitian, beberapa saran yang dapat diberikan untuk penelitian selanjutnya dan pemanfaatan hasil penelitian ini antara lain:

  1. Penelitian selanjutnya dapat mempertimbangkan periode data lebih panjang agar hasil prediksi lebih representatif terhadap tren tahunan.
  2. Faktor sosial, ekonomi, dan kebijakan daerah juga sebaiknya dimasukkan untuk meningkatkan akurasi model.
  3. Perlu pengembangan model lanjutan dengan kombinasi Robust Regression dan metode nonlinier atau machine learning untuk menangkap pola yang lebih kompleks.
  4. Hasil model Robust Regression dapat digunakan oleh pemerintah dan pemangku kepentingan pertanian untuk perencanaan produksi dan pengelolaan sumber daya secara lebih efisien.

Daftar Pustaka

Azzahro, I. A., & Sofro, A. Y. (2023). Regresi Robust terhadap Deforestasi di Indonesia. Jurnal Ilmiah Matematika Volume, 11(3), 2301-9115.

Astuti, F., Bekti, R. D., & Sebo, T. I. (2023). Analisis Produksi Padi di Indonesia Menggunakan Model Regresi Robust Estimasi M, Estimasi S dan Estimasi MM. Jurnal Technoscientia, 16(1), 14–22. doi.org/10.34151/technoscientia.v16i1.4513

BPS. (2025). Luas Panen, Produktivitas, dan Produksi Padi Menurut Provinsi, 2023. Badan Pusat Statistik. Diambil dari https://www.bps.go.id/id/statistics-table/3/WmpaNk1YbGFjR0pOUjBKYWFIQlBSU3MwVHpOVWR6MDkjMw==/luas-panen--produktivitas--dan-produksi-padi-menurut-provinsi--2023.html?year=2023

BPS. (2025). Komponen Penyusun Indeks Kualitas Lingkungan Hidup Menurut Provinsi, 2023. Badan Pusat Statistik. Diambil dari https://www.bps.go.id/id/statistics-table/3/WmpaNk1YbGFjR0pOUjBKYWFIQlBSU3MwVHpOVWR6MDkjMw==/luas-panen--produktivitas--dan-produksi-padi-menurut-provinsi--2023.html?year=2023

Huber, P. J. (1981). Robust Statistics. Wiley.

Kamaluddin, Bhamakerti Hafiz. (2023). Perbandingan model regresi robust estimasi MM(Method of Moment) dan estimasi LTS(Least Primmed Square) pada produksi padi di Jawa Tengah Tahun 2020. Skripsi. Universitas Islam Negeri Walisongo Semarang.

Kondolele, Yusliaty Bubun. (2023). Analisis Determinan Kualitas Lingkunan Hidup di Pulau Jawa. Skripsi. Universitas Hasanuddin.

Maziyah, Ais Maulidia. (1995). Penggunaan Regresi Robust Dengan Estimasi-S Dan Estimasi-Mm Dalam Pengembangan Sistem Pendukung Keputusan Guna Memprediksi Tingkat Produksi Padi. Skripsi. Institut Teknologi Sepuluh Nopember.

Rasantaka, M. P. R., Ashshidiqi, M. F., Yulianti, R., Zeinawaqi, Z., & Widodo, E. (2022). Implementasi Regresi Robust untuk Mengetahui Faktor-Faktor yang Mempengaruhi Produksi Padi di Indonesia. Jurnal Statistika dan Aplikasinya, 6(2), 115–126.

Setyowati, E., Akbarita, R., dan Robby, R. R. (2021). Perbandingan Regresi Robust Metode Least Trimmed Square (LTS) dan Metode Estimasi-S pada Produksi Padi Kabupaten Blitar. Jurnal Matematika UNAND, 10(3), 329–341.

Susanti, Y., Pratiwi, H., & Sulistijowati, S. (2013). Optimasi model regresi robust untuk memprediksi produksi kedelai di Indonesia. Makalah seminar. Seminar Nasional Matematika dan Pendidikan Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Negeri Yogyakarta, Yogyakarta, Indonesia.