Analisis Regresi Linier Berganda

Pengaruh Luas Areal & Jumlah Petani terhadap Produksi Tanaman Perkebunan Rakyat Tanaman Pala

Farah Annisa Suryanto

22-05-2022


Library:

> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")

1 PENDAHULUAN

1.1 Latar Belakang

Sektor perkebunan merupakan sektor yang menopang kehidupan sebagian besar masyarakat. Sektor perkebunan perlu dikembangkan seiring dengan bertambahnya jumlah penduduk dan berkembangnya teknologi yang dapat meningkatkan hasil produksi pertanian. Sektor perkebunan merupakan salah satu solusi dari masalah pengangguran dan kemiskinan. Dengan mengoptimalkan lahan dan usaha tani yang tepat diharapkan petani dapat meningkatkan kesejahteraan hidup petani (Julimansyah, 2018). Komoditi pala merupakan salah satu komoditi perkebunan yang memberikan kontribusi terhadap perekonomian nasional. Indonesia pemasok sekitar 75% dari total kebutuhan pasar dunia setiap tahunnya. Peran komoditas pala dalam peningkatan perekonomian nasional semakin terasa oleh masyarakat. Terbukti dengan tingginya permintaan pala di pasar dunia yang mendorong minat masyarakat untuk terus membudidayakan pala diberbagai daerah. Kondisi ini menjadi tantangan Indonesia untuk terus mengembangkan pala ke depan dengan jaminan ketersediaan benih varietas unggul bermutu, ketersediaan lahan dan juga tenaga tani yang kompeten. Soekartawi (1993) menyatakan bahwa faktor-faktor yang mempengaruhi produksi dibedakan atas dua kelompok yaitu: (1) Faktor biologi, seperti lahan pertanian dengan bermacam tingkat kesuburannya, bibit, varietas, pupuk, obat-obatan dan lain-lain. (2) Faktor sosial ekonomi seperti biaya produksi, harga, tenaga kerja, tingkat pendidikan, pendapatan dan lain-lain. Dari penjelasan di atas, ingin diketahui apakah luas aeral lahan dan jumlah petani berpengaruh terhadap jumlah produksi tanaman pala.

2 Tinjauan Pustaka

2.1 Statistika Deskriptif

Statistik deskriptif adalah salah satu bagian dari ilmu statistika yang berhubungan dengan aktivitas penghimpunan, penataan, peringkasan dan penyajian data dengan harapan agar data lebih bermakna, mudah dibaca dan mudah dipahami oleh pengguna data. Statistik deskriptif hanya sebatas memberikan deskripsi atau gambaran umum tentang karakteristik objek yang diteliti tanpa maksud untuk melakukan generalisasi sampel terhadap populasi.

2.2 Regresi Linier Berganda

Regresi linier berganda merupakan model persamaan yang menjelaskan hubungan satu variabel tak bebas atau response (Y) dengan dua atau lebih variabel bebas atau predictor (X1, X2,…, Xn). Tujuan dari uji regresi linier berganda adalah untuk memprediksi nilai variable tak bebas atau response (Y) apabila nilai-nilai variabel bebasnya atau predictor (X1, X2,…, Xn) diketahui. Selain itu juga dapat mengetahui bagaimanakah arah hubungan variabel tak bebas dengan variabel - variabel bebasnya.

Persamaan regresi linier berganda secara matematik

\[ Y_1 = \beta_0 + \beta_1X_{1i} + \beta_2X_{2i} + ...+ \beta_pX_{pi} + error_i \tag{1} \]

2.3 Asumsi - Asumsi Model Regresi Linier Berganda

Menurut Gujarati (2003) asumsi-asumsi pada model regresi linier berganda adalah sebagai berikut:

  • Model regresinya adalah linier dalam parameter.
  • Nilai rata-rata dari error adalah nol.
  • Variansi dari error adalah konstan (homoskedastik).
  • Tidak terjadi autokorelasi pada error.
  • Tidak terjadi multikolinieritas pada variabel bebas.
  • Error berdistribusi normal.

2.4 Estimasi Parameter Model Regresi Linier Berganda

Estimasi parameter ini bertujuan untuk mendapatkan model regresi linier berganda yang akan digunakan dalam analisis. Metode OLS ini bertujuan meminimumkan jumlah kuadrat error. Berdasarkan persamaan:

\[ \beta=X\beta+error \tag{2} \] dapat diperoleh penaksir (estimator) OLS untuk $beta adalah sebagai berikut (Kutner, et.al., 2004)

\[ \beta=(X^TX)^{-1}X^TY \tag{3} \] Penaksir OLS pada persamaan di atas merupakan penaksir yang tidak bias, linier dan terbaik (best linear unbiased estimator/BLUE) (Sembiring, 2003; Gujarati, 2003; Greene, 2003 dan Widarjono, 2007).

2.5 Pengujian Parameter Model Regresi Linier Berganda

Pengujian parameter ini bertujuan untuk mengetahui ada atau tidaknya pengaruh variabel bebas terhadap variabel tidak bebas, baik secara serentak maupun secara parsial.

2.5.1 Pengujian parameter secara simultan

  • Membuat hipotesis

    \[ \begin{aligned} {H}_0 &:\beta_1=\beta_2=...=\beta_{p-1}=0 \\ {H}_1 &:\beta_k\neq0 \end{aligned} \]

  • Menentukan tingkat signifikansi Tingkat signifikansi \(\alpha\) yang seringkali digunakan dalam penelitian adalah 5%

  • Menentukan statistik uji Statistik uji yang digunakan adalah:

    \[ F =\frac {KTR}{KTG} \] dengan: KTR adalah Kuadrat Tengah Regresi KTG adalah Kuadrat Tengah Galat

  • Menentukan daerah kritis Daerah kritis yang digunakan adalah \(H_0\) ditolak jika \(F > F_{(\alpha;p-1,n-p)}\) dengan \(F_{(\alpha;p-1,n-p)}\) disebut \(F_{tabel}\)

  • Menarik kesimpulan

2.5.2 Pengujian parameter secara parsial

  • Membuat hipotesis

    \[ \begin{aligned} {H}_0 &:\beta_k=0 \\ {H}_1 &:\beta_k\neq0 \end{aligned} \]

  • Menentukan tingkat signifikansi Tingkat signifikansi \(\alpha\) yang seringkali digunakan dalam penelitian adalah 5%

  • Menentukan statistik uji Statistik uji yang digunakan adalah:

    \[ t =\frac {b_k}{s_{(bk)}} \] dengan: \(b_k\) adalah nilai taksiran parameter \(\beta_k\) \(s_{(bk)}\) adalah standar deviasi nilai taksiran parameter \(\beta_k\)

  • Menentukan daerah kritis Daerah kritis yang digunakan adalah: \(H_0\) ditolak jika \(t > t_{(\alpha/2,n-p)}\) dengan \(t_{(\alpha/2,n-p)}\) disebut dengan \(t_{tabel}\)

  • Menarik kesimpulan

2.6 Pelanggaran - Pelanggaran terhadap Asumsi Regresi Linier Berganda

Dalam analisis regresi linier berganda terdapat beberapa pelanggaran-pelanggaran yang seringkali dilakukan terhadap asumsi-asumsinya, diantaranya diuraikan berikut ini.

2.6.1 Multikolinieritas

Multikolinieritas adalah terjadinya hubungan linier antara variabel bebas dalam suatu model regresi linier berganda (Gujarati, 2003). Hubungan linier antara variabel bebas dapat terjadi dalam bentuk hubungan linier yang sempurna (perfect) dan hubungan linier yang kurang sempurna (imperfect).Selanjutnya untuk mendeteksi adanya multikolinieritas dalam model regresi linier berganda dapat digunakan nilai variance inflation factor (VIF) dan tolerance (TOL) dengan ketentuan jika nilai VIF melebihi angka 10, maka terjadi multikolinieritas dalam model regresi. Kemudian jika nilai TOL sama dengan 1, maka tidak terjadi multikolinieritas dalam model regresi.

2.6.2 Heteroskedastisitas

Heteroskedastisitas adalah variansi dari error model regresi tidak konstan atau variansi antar error yang satu dengan error yang lain berbeda (Widarjono, 2007). Dampak adanya heteroskedastisitas dalam model regresi adalah walaupun estimator OLS masih linier dan tidak bias, tetapi tidak lagi mempunyai variansi yang minimum dan menyebabkan perhitungan standard error metode OLS tidak bisa dipercaya kebenarannya. Selain itu interval estimasi maupun pengujian hipotesis yang didasarkan pada distribusi t maupun F tidak bisa lagi dipercaya untuk evaluasi hasil regresi. Selanjutnya dilakukan deteksi masalah heteroskedastisitas dalam model regresi. Salah satu cara yang dapat digunakan untuk mendeteksi adanya heteroskedastisitas dalam model regresi adalah dengan Metode Glejser. Glejser merupakan seorang ahli ekonometrika dan mengatakan bahwa nilai variansi variabel error model regresi tergantung dari variabel bebas. Selanjutnya untuk mengetahui apakah pola variabel error mengandung heteroskedastisitas Glejser menyarankan untuk melakukan regresi nilai mutlak residual dengan variabel bebas. Jika hasil uji F dari model regresi yang diperoleh tidak signifikan, maka tidak ada heteroskedastisitas dalam model regresi (Widarjono, 2007).

2.6.3 Autokorelasi

Autokorelasi adalah terjadinya korelasi antara satu variabel error dengan variabel error yang lain. Autokorelasi seringkali terjadi pada data time series dan dapat juga terjadi pada data cross section tetapi jarang (Widarjono, 2007). Adapun dampak dari adanya autokorelasi dalam model regresi adalah sama dengan dampak dari heteroskedastisitas yang telah diuraikan di atas, yaitu walaupun estimator OLS masih linier dan tidak bias, tetapi tidak lagi mempunyai variansi yang minimum dan menyebabkan perhitungan standard error metode OLS tidak bisa dipercaya kebenarannya. Selain itu interval estimasi maupun pengujian hipotesis yang didasarkan pada distribusi t maupun F tidak bisa lagi dipercaya untuk evaluasi hasil regresi. Akibat dari dampak adanya autokorelasi dalam model regresi menyebabkan estimator OLS tidak menghasilkan estimator yang BLUE dan hanya menghasilkan estimator OLS yang LUE (Widarjono, 2007). Selanjutnya untuk mendeteksi adanya autokorelasi dalam model regresi linier berganda dapat digunakan metode Durbin-Watson.

3 Data dan Analisis Data

3.1 Data

Jenis data yang digunakan adalah data sekunder. Data luas areal dan produksi tanaman perkebunan Rakyat Tanaman Pala diambil dari laporan hasil penelitian. Variabel terikat penelitian ini adalah jumlah produksi tanaman perkebunan (Y). Sedangkan variabel bebas pada penelitian ini ada duavariabel yaitu luas areal (X1) dan jumlah petani (X2).

> library(readxl)
> Dataproduksi <- read_excel("C:/Users/WINDOWS 10/Downloads/Data Produksi.xlsx")
> Dataproduksi
# A tibble: 12 x 4
   `Kabupaten/Kota`            X1    X2      Y
   <chr>                    <dbl> <dbl>  <dbl>
 1 Maluku Tenggara Barat     13      50    1.9
 2 Maluku Tenggara         2769.   1536  458. 
 3 Maluku Tengah          11155.  14521 2134. 
 4 Buru                     942.    557  111. 
 5 Kepulauan Aru             23      26    4  
 6 Seram Bagian Barat    229950     826  251. 
 7 Seram Bagian Timur      8831    6695 1287. 
 8 Maluku Barat Daya       1510.   1260   84.4
 9 Buru Selatan            2219.   1600  413. 
10 Ambon                   1763     989  746. 
11 Tual                      98.4   300   20.8
12 Maluku                 31624.  28360 5512. 

3.2 Source Code

3.2.1 Library yang Dibutuhkan

> #library(readxl)
> #library(olsrr)
> #library(lmtest)

3.2.2 Model Regresi Linier Berganda

> regmodel <- lm(Y ~ X1+X2, data = Dataproduksi)
> regmodel

Call:
lm(formula = Y ~ X1 + X2, data = Dataproduksi)

Coefficients:
(Intercept)           X1           X2  
  4.753e+01    2.931e-04    1.828e-01  
> summary(regmodel)

Call:
lm(formula = Y ~ X1 + X2, data = Dataproduksi)

Residuals:
    Min      1Q  Median      3Q     Max 
-571.18  -61.48  -26.62   86.74  517.26 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 4.753e+01  1.010e+02   0.470    0.649    
X1          2.931e-04  1.323e-03   0.222    0.830    
X2          1.828e-01  1.014e-02  18.029 2.26e-08 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 286.9 on 9 degrees of freedom
Multiple R-squared:  0.9731,    Adjusted R-squared:  0.9671 
F-statistic: 162.5 on 2 and 9 DF,  p-value: 8.65e-08

3.2.3 Statistika Deskriptif

> summary(Dataproduksi)
 Kabupaten/Kota           X1                 X2                Y         
 Length:12          Min.   :    13.0   Min.   :   26.0   Min.   :   1.9  
 Class :character   1st Qu.:   731.3   1st Qu.:  492.8   1st Qu.:  68.5  
 Mode  :character   Median :  1990.9   Median : 1124.5   Median : 332.2  
                    Mean   : 24241.6   Mean   : 4726.7   Mean   : 918.7  
                    3rd Qu.:  9412.1   3rd Qu.: 2873.8   3rd Qu.: 881.4  
                    Max.   :229950.0   Max.   :28360.0   Max.   :5512.1  

3.2.4 Uji Asumsi Klasik

3.2.4.1 Normalitas

> ks.test(regmodel$residuals,ecdf(regmodel$residuals))

    One-sample Kolmogorov-Smirnov test

data:  regmodel$residuals
D = 0.083333, p-value = 0.9999
alternative hypothesis: two-sided

3.2.4.2 Multikolinieritas

> library(olsrr)
> ols_vif_tol(regmodel)
  Variables Tolerance      VIF
1        X1 0.9999195 1.000081
2        X2 0.9999195 1.000081

3.2.4.3 Autokorelasi

> library(lmtest)
> dwtest(regmodel)

    Durbin-Watson test

data:  regmodel
DW = 2.1659, p-value = 0.589
alternative hypothesis: true autocorrelation is greater than 0

3.2.4.4 Homoskedastisitas

> bptest(regmodel)

    studentized Breusch-Pagan test

data:  regmodel
BP = 1.6731, df = 2, p-value = 0.4332

4 Hasil dan Pembahasan

4.1 Model Regresi Linier Berganda

Berdasarkan hasil analisis regresi linier berganda dapat diketahui konstanta dan koefisien regresi masing - masing variabel yang diteliti, sehingga dapat diperoleh persamaan analisis regresi linier berganda sebagai berikut:

\[ Y = 47.53 +0.0002931X1+0.1828X2 \]

Persamaan hasil regresi linier berganda tersebut menyatakan bahwa nilai konstanta sebesar 47.53 . Hal ini berarti jika luas areal dan jumlah petani bernilai konstan maka jumlah produksi tanaman sebesar 47.53%. Nilai koefisien luas areal sebesar 0.0002931. Hal ini berarti setiap kenaikan nilai luas areal sebesar 1%, maka variabel jumlah produksi tanaman akan naik sebesar 0.0002931%. Nilai koefisien jumlah petani sebesar 0.1828. Hal ini berarti setiap kenaikan jumlah petani sebesar 1%, maka variabel jumlah produksi tanaman akan naik sebesar 0.1828%.

4.2 Pengujian Parameter secara Simultan

Dengan menggunakan uji F diperoleh nilai probabilitas F (\(p-value\)) sebesar 0.0000000865. Nilai tersebut lebih kecil dari \(\alpha\) 0.05, sehingga diputuskan untuk menolak \(H_0\). Oleh karena itu, dapat disimpulkan bahwa luas areal dan jumlah petani berpengaruh terhadap jumlah produksi tanaman pala.

4.3 Pengujian Parameter secara Parsial

Dengan menggunakan uji t diperoleh nilai signifikansi sebesar 0.83 pada variabel luas areal. Nilai tersebut lebih besar dari \(\alpha\) 0.05, sehingga diputuskan untuk terima \(H_0\). Oleh karena itu, dapat disimpulkan bahwa luas areal tidak berpengaruh terhadap jumlah produksi tanaman pala. Sedangkan nilai signifikansi pada variabel jumlah petani sebesar 0.0000000226. Nilai tersebut kurang dari \(\alpha\) 0.05, sehingga diputuskan untuk tolak \(H_0\). Oleh karena itu, dapat disimpulkan bahwa jumlah petani berpengaruh terhadap jumlah produksi tanaman pala.

4.4 Koefisien Determinasi

Berdasarkan hasil \(Multiple\) \(R^2\), nilai \(Multiple\) \(R^2\) sebesar 0.9731 atau 97.31%. Hal ini menunjukkan bahwa 97.31% jumlah produksi dapat dijelaskan oleh luas areal dan jumlah petani. Sisanya 2.69% dijelaskan oleh variabel-variabel lain di luar persamaan.

4.5 Uji Asumsi Klasik

4.5.1 Normalitas

Berdasarkan Uji Normalitas didapatkan hasil \(p-value\) statistik Kolmogorov Smirnov sebesar 0.9999. Nilai tersebut lebih besar dari \(\alpha\) 0.05, sehingga diputuskan untuk terima \(H_0\). Dengan demikian dapat disimpulkan bahwa asumsi normalitas terpenuhi.

4.5.2 Multikolinieritas

Multikolinieritas dapat dilihat dari nilai VIF. Ketentuan tidak terjadi multikolinieritas apabila nilai VIF kurang dari 10. Berdasarkan Uji Multikolinieritas didapatkan hasil nilai VIF kurang dari 10 yaitu sebesar 1.000081. Berdasarkan kriteria di atas maka dapat disimpulkan bahwa semua variabel bebas tidak terjadi multikolinieritas.

4.5.3 Autokorelasi

Uji autokorelasi dilakukan dengan menggunakan Uji Durbin Watson. Hasil uji autokorelasi diperoleh nilai Durbin Watson sebesar 2.1659. Pengambilan keputusan tidak ada autokorelasi jika \(du<d<4-du\). Berdasarkan tabel Durbin Watson dengan \(\alpha\) 0.05, jumlah sampel (n) 10, dan variabel bebas (k) 2. Maka diperoleh nilai \(dL=0.6972\) dan \(dU=1.6413\), sehingga dari nilai Durbin Watson sebesar 2.1659 terletak diantara \(du<d<4-du\) yaitu 1.6413 < 2.1659 < 2.3587. Hal ini menunjukkan bahwa pada model ini tidak terjadi autokorelasi

4.5.4 Heteroskedastisitas

Berdasarkan hasil uji Breusch Pagan diperoleh nilai probabilitas Chi Square sebesar 0.4332. Nilai tersebut lebih besar dari \(\alpha\) 0.05, sehingga diputuskan untuk tolak \(H_0\). Dengan demikian dapat disimpulkan bahwa tidak terjadi heteroskedastisitas.

5 Kesimpulan dan Saran

Berdasarkan hasil penelitian dapat disimpulkan:

  • Dengan hipotesis uji F diperoleh hasil bahwa luas areal dan jumlah petani secara bersama-sama berpengaruh terhadap jumlah produksi tanaman pala.
  • Dengan hipotesis uji t diperoleh hasil bahwa luas areal tidak berpengaruh terhadap jumlah produksi tanaman pala, sedangkan jumlah petani berpengaruh terhadap jumlah produksi tanaman pala.
  • 97.31% jumlah produksi dapat dijelaskan oleh luas areal dan jumlah petani. Sisanya 2.69% dijelaskan oleh variabel-variabel lain di luar persamaan.

Berdasarkan kesimpulan di atas, maka saran yang dapat diberikan pada penelitian ini adalah untuk meningkatkan jumlah produksi tanaman perkebunan maka dapat dengan menambah jumlah petani dan juga menambah luas areal lahan untuk dijadikan perkebunan tanaman pala.

6 Daftar Pustaka

  1. Draper, N. dan Smith, H. 1992. Analisis Regresi Terapan. Edisi Kedua. Terjemahan Oleh Bambang Sumantri. Jakarta: Gramedia Pustaka Utama.
  2. Sembiring, R.K. 2003. Analisis Regresi. Edisi Kedua. Bandung: Institut Teknologi Bandung.
  3. Sunanto, 1993.Budidaya Pala Komoditas Ekspor. Kanisius, Yogyakarta