Library:
> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")Sektor perkebunan merupakan sektor yang menopang kehidupan sebagian besar masyarakat. Sektor perkebunan perlu dikembangkan seiring dengan bertambahnya jumlah penduduk dan berkembangnya teknologi yang dapat meningkatkan hasil produksi pertanian. Sektor perkebunan merupakan salah satu solusi dari masalah pengangguran dan kemiskinan. Dengan mengoptimalkan lahan dan usaha tani yang tepat diharapkan petani dapat meningkatkan kesejahteraan hidup petani (Julimansyah, 2018). Komoditi pala merupakan salah satu komoditi perkebunan yang memberikan kontribusi terhadap perekonomian nasional. Indonesia pemasok sekitar 75% dari total kebutuhan pasar dunia setiap tahunnya. Peran komoditas pala dalam peningkatan perekonomian nasional semakin terasa oleh masyarakat. Terbukti dengan tingginya permintaan pala di pasar dunia yang mendorong minat masyarakat untuk terus membudidayakan pala diberbagai daerah. Kondisi ini menjadi tantangan Indonesia untuk terus mengembangkan pala ke depan dengan jaminan ketersediaan benih varietas unggul bermutu, ketersediaan lahan dan juga tenaga tani yang kompeten. Soekartawi (1993) menyatakan bahwa faktor-faktor yang mempengaruhi produksi dibedakan atas dua kelompok yaitu: (1) Faktor biologi, seperti lahan pertanian dengan bermacam tingkat kesuburannya, bibit, varietas, pupuk, obat-obatan dan lain-lain. (2) Faktor sosial ekonomi seperti biaya produksi, harga, tenaga kerja, tingkat pendidikan, pendapatan dan lain-lain. Dari penjelasan di atas, ingin diketahui apakah luas aeral lahan dan jumlah petani berpengaruh terhadap jumlah produksi tanaman pala.
Statistik deskriptif adalah salah satu bagian dari ilmu statistika yang berhubungan dengan aktivitas penghimpunan, penataan, peringkasan dan penyajian data dengan harapan agar data lebih bermakna, mudah dibaca dan mudah dipahami oleh pengguna data. Statistik deskriptif hanya sebatas memberikan deskripsi atau gambaran umum tentang karakteristik objek yang diteliti tanpa maksud untuk melakukan generalisasi sampel terhadap populasi.
Regresi linier berganda merupakan model persamaan yang menjelaskan hubungan satu variabel tak bebas atau response (Y) dengan dua atau lebih variabel bebas atau predictor (X1, X2,…, Xn). Tujuan dari uji regresi linier berganda adalah untuk memprediksi nilai variable tak bebas atau response (Y) apabila nilai-nilai variabel bebasnya atau predictor (X1, X2,…, Xn) diketahui. Selain itu juga dapat mengetahui bagaimanakah arah hubungan variabel tak bebas dengan variabel - variabel bebasnya.
Persamaan regresi linier berganda secara matematik
\[ Y_1 = \beta_0 + \beta_1X_{1i} + \beta_2X_{2i} + ...+ \beta_pX_{pi} + error_i \tag{1} \]
Menurut Gujarati (2003) asumsi-asumsi pada model regresi linier berganda adalah sebagai berikut:
Estimasi parameter ini bertujuan untuk mendapatkan model regresi linier berganda yang akan digunakan dalam analisis. Metode OLS ini bertujuan meminimumkan jumlah kuadrat error. Berdasarkan persamaan:
\[ \beta=X\beta+error \tag{2} \] dapat diperoleh penaksir (estimator) OLS untuk $beta adalah sebagai berikut (Kutner, et.al., 2004)
\[ \beta=(X^TX)^{-1}X^TY \tag{3} \] Penaksir OLS pada persamaan di atas merupakan penaksir yang tidak bias, linier dan terbaik (best linear unbiased estimator/BLUE) (Sembiring, 2003; Gujarati, 2003; Greene, 2003 dan Widarjono, 2007).
Pengujian parameter ini bertujuan untuk mengetahui ada atau tidaknya pengaruh variabel bebas terhadap variabel tidak bebas, baik secara serentak maupun secara parsial.
Membuat hipotesis
\[ \begin{aligned} {H}_0 &:\beta_1=\beta_2=...=\beta_{p-1}=0 \\ {H}_1 &:\beta_k\neq0 \end{aligned} \]
Menentukan tingkat signifikansi Tingkat signifikansi \(\alpha\) yang seringkali digunakan dalam penelitian adalah 5%
Menentukan statistik uji Statistik uji yang digunakan adalah:
\[ F =\frac {KTR}{KTG} \] dengan: KTR adalah Kuadrat Tengah Regresi KTG adalah Kuadrat Tengah Galat
Menentukan daerah kritis Daerah kritis yang digunakan adalah \(H_0\) ditolak jika \(F > F_{(\alpha;p-1,n-p)}\) dengan \(F_{(\alpha;p-1,n-p)}\) disebut \(F_{tabel}\)
Menarik kesimpulan
Membuat hipotesis
\[ \begin{aligned} {H}_0 &:\beta_k=0 \\ {H}_1 &:\beta_k\neq0 \end{aligned} \]
Menentukan tingkat signifikansi Tingkat signifikansi \(\alpha\) yang seringkali digunakan dalam penelitian adalah 5%
Menentukan statistik uji Statistik uji yang digunakan adalah:
\[ t =\frac {b_k}{s_{(bk)}} \] dengan: \(b_k\) adalah nilai taksiran parameter \(\beta_k\) \(s_{(bk)}\) adalah standar deviasi nilai taksiran parameter \(\beta_k\)
Menentukan daerah kritis Daerah kritis yang digunakan adalah: \(H_0\) ditolak jika \(t > t_{(\alpha/2,n-p)}\) dengan \(t_{(\alpha/2,n-p)}\) disebut dengan \(t_{tabel}\)
Menarik kesimpulan
Dalam analisis regresi linier berganda terdapat beberapa pelanggaran-pelanggaran yang seringkali dilakukan terhadap asumsi-asumsinya, diantaranya diuraikan berikut ini.
Multikolinieritas adalah terjadinya hubungan linier antara variabel bebas dalam suatu model regresi linier berganda (Gujarati, 2003). Hubungan linier antara variabel bebas dapat terjadi dalam bentuk hubungan linier yang sempurna (perfect) dan hubungan linier yang kurang sempurna (imperfect).Selanjutnya untuk mendeteksi adanya multikolinieritas dalam model regresi linier berganda dapat digunakan nilai variance inflation factor (VIF) dan tolerance (TOL) dengan ketentuan jika nilai VIF melebihi angka 10, maka terjadi multikolinieritas dalam model regresi. Kemudian jika nilai TOL sama dengan 1, maka tidak terjadi multikolinieritas dalam model regresi.
Heteroskedastisitas adalah variansi dari error model regresi tidak konstan atau variansi antar error yang satu dengan error yang lain berbeda (Widarjono, 2007). Dampak adanya heteroskedastisitas dalam model regresi adalah walaupun estimator OLS masih linier dan tidak bias, tetapi tidak lagi mempunyai variansi yang minimum dan menyebabkan perhitungan standard error metode OLS tidak bisa dipercaya kebenarannya. Selain itu interval estimasi maupun pengujian hipotesis yang didasarkan pada distribusi t maupun F tidak bisa lagi dipercaya untuk evaluasi hasil regresi. Selanjutnya dilakukan deteksi masalah heteroskedastisitas dalam model regresi. Salah satu cara yang dapat digunakan untuk mendeteksi adanya heteroskedastisitas dalam model regresi adalah dengan Metode Glejser. Glejser merupakan seorang ahli ekonometrika dan mengatakan bahwa nilai variansi variabel error model regresi tergantung dari variabel bebas. Selanjutnya untuk mengetahui apakah pola variabel error mengandung heteroskedastisitas Glejser menyarankan untuk melakukan regresi nilai mutlak residual dengan variabel bebas. Jika hasil uji F dari model regresi yang diperoleh tidak signifikan, maka tidak ada heteroskedastisitas dalam model regresi (Widarjono, 2007).
Autokorelasi adalah terjadinya korelasi antara satu variabel error dengan variabel error yang lain. Autokorelasi seringkali terjadi pada data time series dan dapat juga terjadi pada data cross section tetapi jarang (Widarjono, 2007). Adapun dampak dari adanya autokorelasi dalam model regresi adalah sama dengan dampak dari heteroskedastisitas yang telah diuraikan di atas, yaitu walaupun estimator OLS masih linier dan tidak bias, tetapi tidak lagi mempunyai variansi yang minimum dan menyebabkan perhitungan standard error metode OLS tidak bisa dipercaya kebenarannya. Selain itu interval estimasi maupun pengujian hipotesis yang didasarkan pada distribusi t maupun F tidak bisa lagi dipercaya untuk evaluasi hasil regresi. Akibat dari dampak adanya autokorelasi dalam model regresi menyebabkan estimator OLS tidak menghasilkan estimator yang BLUE dan hanya menghasilkan estimator OLS yang LUE (Widarjono, 2007). Selanjutnya untuk mendeteksi adanya autokorelasi dalam model regresi linier berganda dapat digunakan metode Durbin-Watson.
Jenis data yang digunakan adalah data sekunder. Data luas areal dan produksi tanaman perkebunan Rakyat Tanaman Pala diambil dari laporan hasil penelitian. Variabel terikat penelitian ini adalah jumlah produksi tanaman perkebunan (Y). Sedangkan variabel bebas pada penelitian ini ada duavariabel yaitu luas areal (X1) dan jumlah petani (X2).
> library(readxl)
> Dataproduksi <- read_excel("C:/Users/WINDOWS 10/Downloads/Data Produksi.xlsx")
> Dataproduksi
# A tibble: 12 x 4
`Kabupaten/Kota` X1 X2 Y
<chr> <dbl> <dbl> <dbl>
1 Maluku Tenggara Barat 13 50 1.9
2 Maluku Tenggara 2769. 1536 458.
3 Maluku Tengah 11155. 14521 2134.
4 Buru 942. 557 111.
5 Kepulauan Aru 23 26 4
6 Seram Bagian Barat 229950 826 251.
7 Seram Bagian Timur 8831 6695 1287.
8 Maluku Barat Daya 1510. 1260 84.4
9 Buru Selatan 2219. 1600 413.
10 Ambon 1763 989 746.
11 Tual 98.4 300 20.8
12 Maluku 31624. 28360 5512. > #library(readxl)
> #library(olsrr)
> #library(lmtest)> regmodel <- lm(Y ~ X1+X2, data = Dataproduksi)
> regmodel
Call:
lm(formula = Y ~ X1 + X2, data = Dataproduksi)
Coefficients:
(Intercept) X1 X2
4.753e+01 2.931e-04 1.828e-01
> summary(regmodel)
Call:
lm(formula = Y ~ X1 + X2, data = Dataproduksi)
Residuals:
Min 1Q Median 3Q Max
-571.18 -61.48 -26.62 86.74 517.26
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 4.753e+01 1.010e+02 0.470 0.649
X1 2.931e-04 1.323e-03 0.222 0.830
X2 1.828e-01 1.014e-02 18.029 2.26e-08 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 286.9 on 9 degrees of freedom
Multiple R-squared: 0.9731, Adjusted R-squared: 0.9671
F-statistic: 162.5 on 2 and 9 DF, p-value: 8.65e-08> summary(Dataproduksi)
Kabupaten/Kota X1 X2 Y
Length:12 Min. : 13.0 Min. : 26.0 Min. : 1.9
Class :character 1st Qu.: 731.3 1st Qu.: 492.8 1st Qu.: 68.5
Mode :character Median : 1990.9 Median : 1124.5 Median : 332.2
Mean : 24241.6 Mean : 4726.7 Mean : 918.7
3rd Qu.: 9412.1 3rd Qu.: 2873.8 3rd Qu.: 881.4
Max. :229950.0 Max. :28360.0 Max. :5512.1 > ks.test(regmodel$residuals,ecdf(regmodel$residuals))
One-sample Kolmogorov-Smirnov test
data: regmodel$residuals
D = 0.083333, p-value = 0.9999
alternative hypothesis: two-sided> library(olsrr)
> ols_vif_tol(regmodel)
Variables Tolerance VIF
1 X1 0.9999195 1.000081
2 X2 0.9999195 1.000081> library(lmtest)
> dwtest(regmodel)
Durbin-Watson test
data: regmodel
DW = 2.1659, p-value = 0.589
alternative hypothesis: true autocorrelation is greater than 0> bptest(regmodel)
studentized Breusch-Pagan test
data: regmodel
BP = 1.6731, df = 2, p-value = 0.4332Berdasarkan hasil analisis regresi linier berganda dapat diketahui konstanta dan koefisien regresi masing - masing variabel yang diteliti, sehingga dapat diperoleh persamaan analisis regresi linier berganda sebagai berikut:
\[ Y = 47.53 +0.0002931X1+0.1828X2 \]
Persamaan hasil regresi linier berganda tersebut menyatakan bahwa nilai konstanta sebesar 47.53 . Hal ini berarti jika luas areal dan jumlah petani bernilai konstan maka jumlah produksi tanaman sebesar 47.53%. Nilai koefisien luas areal sebesar 0.0002931. Hal ini berarti setiap kenaikan nilai luas areal sebesar 1%, maka variabel jumlah produksi tanaman akan naik sebesar 0.0002931%. Nilai koefisien jumlah petani sebesar 0.1828. Hal ini berarti setiap kenaikan jumlah petani sebesar 1%, maka variabel jumlah produksi tanaman akan naik sebesar 0.1828%.
Dengan menggunakan uji F diperoleh nilai probabilitas F (\(p-value\)) sebesar 0.0000000865. Nilai tersebut lebih kecil dari \(\alpha\) 0.05, sehingga diputuskan untuk menolak \(H_0\). Oleh karena itu, dapat disimpulkan bahwa luas areal dan jumlah petani berpengaruh terhadap jumlah produksi tanaman pala.
Dengan menggunakan uji t diperoleh nilai signifikansi sebesar 0.83 pada variabel luas areal. Nilai tersebut lebih besar dari \(\alpha\) 0.05, sehingga diputuskan untuk terima \(H_0\). Oleh karena itu, dapat disimpulkan bahwa luas areal tidak berpengaruh terhadap jumlah produksi tanaman pala. Sedangkan nilai signifikansi pada variabel jumlah petani sebesar 0.0000000226. Nilai tersebut kurang dari \(\alpha\) 0.05, sehingga diputuskan untuk tolak \(H_0\). Oleh karena itu, dapat disimpulkan bahwa jumlah petani berpengaruh terhadap jumlah produksi tanaman pala.
Berdasarkan hasil \(Multiple\) \(R^2\), nilai \(Multiple\) \(R^2\) sebesar 0.9731 atau 97.31%. Hal ini menunjukkan bahwa 97.31% jumlah produksi dapat dijelaskan oleh luas areal dan jumlah petani. Sisanya 2.69% dijelaskan oleh variabel-variabel lain di luar persamaan.
Berdasarkan Uji Normalitas didapatkan hasil \(p-value\) statistik Kolmogorov Smirnov sebesar 0.9999. Nilai tersebut lebih besar dari \(\alpha\) 0.05, sehingga diputuskan untuk terima \(H_0\). Dengan demikian dapat disimpulkan bahwa asumsi normalitas terpenuhi.
Multikolinieritas dapat dilihat dari nilai VIF. Ketentuan tidak terjadi multikolinieritas apabila nilai VIF kurang dari 10. Berdasarkan Uji Multikolinieritas didapatkan hasil nilai VIF kurang dari 10 yaitu sebesar 1.000081. Berdasarkan kriteria di atas maka dapat disimpulkan bahwa semua variabel bebas tidak terjadi multikolinieritas.
Uji autokorelasi dilakukan dengan menggunakan Uji Durbin Watson. Hasil uji autokorelasi diperoleh nilai Durbin Watson sebesar 2.1659. Pengambilan keputusan tidak ada autokorelasi jika \(du<d<4-du\). Berdasarkan tabel Durbin Watson dengan \(\alpha\) 0.05, jumlah sampel (n) 10, dan variabel bebas (k) 2. Maka diperoleh nilai \(dL=0.6972\) dan \(dU=1.6413\), sehingga dari nilai Durbin Watson sebesar 2.1659 terletak diantara \(du<d<4-du\) yaitu 1.6413 < 2.1659 < 2.3587. Hal ini menunjukkan bahwa pada model ini tidak terjadi autokorelasi
Berdasarkan hasil uji Breusch Pagan diperoleh nilai probabilitas Chi Square sebesar 0.4332. Nilai tersebut lebih besar dari \(\alpha\) 0.05, sehingga diputuskan untuk tolak \(H_0\). Dengan demikian dapat disimpulkan bahwa tidak terjadi heteroskedastisitas.
Berdasarkan hasil penelitian dapat disimpulkan:
Berdasarkan kesimpulan di atas, maka saran yang dapat diberikan pada penelitian ini adalah untuk meningkatkan jumlah produksi tanaman perkebunan maka dapat dengan menambah jumlah petani dan juga menambah luas areal lahan untuk dijadikan perkebunan tanaman pala.