PENGARUH LUAS PANEN DAN LUAS LAHAN TERHADAP PRODUKSI PADI DI PAPUA BARAT MENGGUNAKAN ANALISIS REGRESI LINIER BERGANDA

Yosi Sandia Pradita

2023-05-31

Library:

> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")

1 PENDAHULUAN

1.1 Latar Belakang

Padi merupakan salah satu komoditas pertanian yang saat ini menjadi bahan makanan utama di Indonesia. Pertanian juga merupakan salah satu sektor utama dalam perekonomian Papua Barat. Produksi padi perlu ditingkatkan untuk mencukupi kebutuhan pangan penduduk yang terus bertambah. Untuk mencapai hal tersebut, faktor-faktor yang mempengaruhi produksi padi perlu dipahami.

Terdapat beberapa faktor yang memiliki potensi untuk mempengaruhi produksi padi, yaitu luas panen dan luas lahan. Luas panen merupakan luas lahan tempat komoditi yang sudah siap panen (Matulessy dan Tambunan, 2023). Sedangkan, luas lahan merupakan luas lahan yang digunakan untuk budidaya padi. Hubungan antara luas panen, luas lahan, dan produksi padi di Papua Barat perlu diteliti secara mendalam untuk memperoleh pemahaman yang lebih baik tentang faktor-faktor yang berkontribusi terhadap produksi padi di daerah ini.

1.2 Rumusan Masalah

Berdasarkan latar belakang yang telah diuraikan sebelumnya, rumusan masalah dalam penelitian ini adalah:

  1. Bagaimana pengaruh luas panen dan luas lahan terhadap produksi padi di Papua Barat?

1.3 Tujuan

  1. Mengetahui pengaruh luas panen dan luas lahan terhadap produksi padi di Papua Barat.

1.4 Data Penelitian

Data yang digunakan pada penelitian ini merupakan data sekunder yang berasal dari website Badan Pusat Statistik. Obyek pada penelitian ini adalah Provinsi Papua Barat. Terdapat 3 variabel yang digunakan yaitu luas panen dan luas lahan sebagai variabel prediktor, lalu produksi padi sebagai variabel respons.

Sumber data: BPS

Keterangan:

  • X1: luas panen (hektar)

  • X2: luas lahan (hektar)

  • Y : produksi padi (ton)

2 TINJAUAN PUSTAKA

2.1 Statistika Deskriptif

Statistika deskriptif merupakan suatu metode untuk mengumpulkan, menyusun, menggambarkan, menganalisis, dan mengintepretasikan suatu data. Metode ini digunakan untuk menyajikan data dalam bentuk tabel, diagram, atau grafik agar dapat dianalisis dan diambil kesimpulan (Silvia, 2020).

2.2 Analisis Regresi Linier Berganda

Analisis regresi linier berganda merupakan suatu metode untuk memeriksa hubungan ketergantungan linier antara lebih dari satu variabel prediktor (X) dengan satu variabel respons (Y). Model duga hubungan linier tersebut dapat dinyatakan sebagai berikut :

\[Y= \beta_{0}+\beta_{1}x_{1}+\beta_{2}x_{2}+...+\beta_{n}x_{n}+\varepsilon\] Keterangan:

  • \(\beta_{0}: intercept/konstanta\)

  • \(\beta_{i}\): koefisien regresi

  • \(\varepsilon: galat\)

  • Y: variabel respons

  • x: variabel prediktor

2.2.1 Pendugaan Parameter

\(\beta\) dapat diperoleh dengan rumus berikut:

2.2.2 Uji Simultan (Uji F)

Uji simultan bertujuan untuk menguji apakah variabel prediktor secara bersama-sama berpengaruh terhadap variabel respons (Ghozali, 2016).

Hipotesis:

  • \(H_{0}:\beta_{1}= \beta_{2}= 0\)

  • \(H_{1}\) : minimal ada satu pasang \(\beta_{i}\ne 0\)

Kriteria Pengujian: Tolak \(H_{0}\) jika \(F_{hitung}\) > \(F_{tabel}\) atau nilai p < \(\alpha\)

2.2.3 UJi Parsial (Uji t)

Uji parsial bertujuan untuk menguji masing-masing variabel prediktor secara parsial berpengaruh terhadap variabel respons (Ghozali, 2016).

Hipotesis:

  • \(H_{0}:\beta_{i}= 0\)

  • \(H_{1}\) : \(\beta_{1}\ne 0\)

Kriteria Pengujian: Tolak \(H_{0}\) jika \(t_{hitung}\) > \(t_{tabel}\) atau nilai p < \(\alpha\)

2.2.4 Koefisien Determinasi

Uji koefisien determinasi dilakukan untuk mengetahui seberapa besar pengaruh variabel prediktor terhadap variabel respons. Koefisien determinasi juga digunakan untuk mengetahui apakah model sudah sesuai. Nilai koefisien determinasi terletak antara 0 sampai 1. Jika nilai koefisien determinasi mendekati 1 maka kemampuan variabel prediktor untuk mempengaruhi variabel respons kuat. Koefisien determinasi dapat diperoleh menggunakan rumus berikut: \[R^2=\frac{JKR}{JKT}\]

2.3 Asumsi-asumsi Regresi Linier Berganda

Terdapat beberapa asumsi yang harus dipenuhi dalam analisis regresi agar hasil statistik yang diperoleh sesuai dan sah.

2.3.1 Asumsi Normalitas

Asumsi ini menyatakan bahwa galat atau residual dari model regresi menyebar secara normal. Asumsi ini dapat diuji menggunakan plot ataupun uji statistik seperti uji Shapiro Wilk, uji Jarque Bera, dan uji Kolmogorov-Smirnov.

Hipotesis:

  • \(H_{0}\): Galat menyebar normal

  • \(H_{1}\): Galat tidak menyebar normal

2.3.2 Asumsi Homoskedastisitas

Asumsi ini menyatakan bahwa setiap galat memiliki ragam yang sama. Homoskedastisitas merupakan suatu kondisi dimana ragam galat sama pada setiap variabel. Asumsi ini dapat diuji menggunakan scatter plot, uji korelasi Rank Spearman, uji Breusch-pagan, dan lainnya.

Hipotesis:

  • \(H_{0}\): Homogenitas galat terpenuhi

  • \(H_{1}\): Homogenitas galat tidak terpenuhi

2.3.3 Asumsi Non Autokorelasi

Asumsi ini menyatakan bahwa tidak ada korelasi antar galat. Apabila asumsi ini tidak terpenuhi dapat menghasilkan estimasi standard error yang tidak akurat sehingga informasi yang diberikan salah. Asumsi ini dapat diuji menggunakan uji Durbin Watson.

Hipotesis:

  • \(H_{0}\): Tidak terjadi autokorelasi

  • \(H_{1}\): Terjadi autokorelasi

2.3.4 Asumsi Non Multikolinearitas

Asumsi ini menyatakan bahwa pada model tidak terjadi multikolinearitas yaitu adanya korelasi yang tinggi di antara variabel prediktor. Multikolinearitas dapat dideteksi menggunakan tolerance(TOL) dan Variance Inflating Factor (VIF). \[TOL_{j}=\frac{1}{VIF_{j}}=1-R_{j}^2\]

Nilai TOL berada di antara 0 dan 1. Jika nilai TOL 0 berarti adanya korelasi sempurna antar variabel prediktor, sedngkan jika nilai TOL 1 berati tidak ada multikolinearitas.

\[VIF_{j}=\frac{1}{1-R_{j}^2}\] Nilai VIF > 10 mengindikasikan adanya korelasi yang antar variabel prediktor.

3 SOURCE CODE

3.1 Library

> library(readxl)
> library(knitr)
> library(rmarkdown)
> library(dplyr)
> library(lmtest)
> library(tseries)
> library(car)

3.2 Data

> # Input data
> data <- read_excel("C:/Users/Acer/OneDrive/Documents/College/semester 4/dataregresi.xlsx")
> kable(data)
Tahun X1 X2 Y
2005 7823 7051 24702
2006 8545 7735 27073
2007 8357 8395 28204
2008 11467 9116 39537
2009 10486 9249 36985
2010 9464 7711 34254
2011 8283 7648 29304
2012 7750 8330 30245
2013 7523 9587 29912
2014 6880 9587 27665
2015 7202 10126 30219

3.3 Statistika Deskriptif

> summary(data)
     Tahun            X1              X2              Y        
 Min.   :2005   Min.   : 6880   Min.   : 7051   Min.   :24702  
 1st Qu.:2008   1st Qu.: 7636   1st Qu.: 7723   1st Qu.:27935  
 Median :2010   Median : 8283   Median : 8395   Median :29912  
 Mean   :2010   Mean   : 8525   Mean   : 8594   Mean   :30736  
 3rd Qu.:2012   3rd Qu.: 9004   3rd Qu.: 9418   3rd Qu.:32250  
 Max.   :2015   Max.   :11467   Max.   :10126   Max.   :39537  
> boxplot(data$X1, main="Gambar 1.1. Boxplot Luas Panen",sub=paste("Outlier rows: ", boxplot.stats(data$X1)$out), col="aliceblue")

> boxplot(data$X2, main="Gambar 1.2. Boxplot Luas Lahan",sub=paste("Outlier rows: ", boxplot.stats(data$X2)$out), col="blue")

> boxplot(data$Y, main="Gambar 1.3. Boxplot Produksi Padi",sub=paste("Outlier rows: ", boxplot.stats(data$Y)$out), col="darkblue")

3.4 Analisis Regresi Linier Berganda

Analisis regresi menggunakan cara manual

> Y <- as.matrix(data$Y, ncol=1)
> n <- dim(Y)[1]
> X1 <- data$X1
> X2 <- data$X2
> X0 <- rep(1,n)
> X <- data.frame(X0, X1, X2)
> X <- as.matrix(X)

3.4.1 Pendugaan parameter

> beta_duga <- solve(t(X)%*%X)%*%(t(X)%*%Y)
> beta_duga
           [,1]
X0 -8886.945829
X1     2.768516
X2     1.864124
> 
> y_duga <- X%*%beta_duga
> u_duga <- Y - y_duga
> y_bar <- rep(mean(Y),n)

3.4.2 Analisis ragam

> JKT <- t(Y-y_bar)%*%(Y-y_bar)
> JKR <- t(y_duga-y_bar)%*%(y_duga-y_bar)
> JKG <- JKT-JKR
> JK <- c(JKR, JKG, JKT)
> JK
[1] 176280343  21510341 197790685
> k = 3 #banyaknya peubah
> dbR <- k-1
> dbT <- n-1
> dbG <- dbT-dbR
> db <- c(dbR, dbG, dbT)
> KT <- JK/db
> 
> SK <- c("Regresi", "Galat", "Total")
> anova <- data.frame(SK, JK, db, KT)
> names(anova) <- c("SK", "JK", "db", "KT")
> anova
       SK        JK db       KT
1 Regresi 176280343  2 88140172
2   Galat  21510341  8  2688793
3   Total 197790685 10 19779068

3.4.3 Uji F

> SU_F <- anova$KT[1]/anova$KT[2]
> SU_F
[1] 32.78058
> #menghitung pvalue
> pvalue_f <- pf(SU_F, anova$db[1], anova$db[2], lower.tail=FALSE)
> pvalue_f
[1] 0.0001398833

3.4.4 Uji T

> var_cov <- anova$KT[2]*solve(t(X)%*%X)
> var_cov
             X0            X1            X2
X0 32467856.664 -1284.6478099 -2475.0976782
X1    -1284.648     0.1351518     0.0154079
X2    -2475.098     0.0154079     0.2727151
> sd <- rep(0,k)
> for (i in 1:k){
+   sd[i] <- sqrt(var_cov[i,i])
+ }
> sd
[1] 5698.0572710    0.3676300    0.5222213
> thit <- beta_duga/sd
> thit
        [,1]
X0 -1.559645
X1  7.530712
X2  3.569606
> pvalue_t <- 2*pt(abs(thit), anova$db[2], lower.tail=FALSE)
> pvalue_t
           [,1]
X0 1.574636e-01
X1 6.729501e-05
X2 7.297859e-03

3.4.5 Koefisien determinasi

> Rsq <- anova$JK[1]/anova$JK[3]
> Rsq
[1] 0.8912469

Analisis regresi menggunakan fungsi Im()

> reg <- lm(Y~X1+X2,data=data) 
> summary(reg)

Call:
lm(formula = Y ~ X1 + X2, data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-2116.0  -806.5  -316.0   646.7  2565.4 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept) -8886.9458  5698.0573  -1.560   0.1575    
X1              2.7685     0.3676   7.531 6.73e-05 ***
X2              1.8641     0.5222   3.570   0.0073 ** 
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 1640 on 8 degrees of freedom
Multiple R-squared:  0.8912,    Adjusted R-squared:  0.8641 
F-statistic: 32.78 on 2 and 8 DF,  p-value: 0.0001399

3.5 Uji Asumsi Klasik Regresi Linier Berganda

3.5.1 Asumsi Normalitas

> sisa <- residuals(reg)
> shapiro.test(sisa)

    Shapiro-Wilk normality test

data:  sisa
W = 0.95312, p-value = 0.684

3.5.2 Asumsi Homoskedastisitas

> bptest(reg)

    studentized Breusch-Pagan test

data:  reg
BP = 4.1594, df = 2, p-value = 0.125

3.5.3 Asumsi Non Autokorelasi

> dwtest(reg)

    Durbin-Watson test

data:  reg
DW = 0.94342, p-value = 0.005865
alternative hypothesis: true autocorrelation is greater than 0

3.5.4 Asumsi Non Multikolinearitas

> vif(reg)
      X1       X2 
1.006483 1.006483 

4 HASIL DAN PEMBAHASAN

4.1 Statistika Deskriptif

> kable(summary(data))
Tahun X1 X2 Y
Min. :2005 Min. : 6880 Min. : 7051 Min. :24702
1st Qu.:2008 1st Qu.: 7636 1st Qu.: 7723 1st Qu.:27935
Median :2010 Median : 8283 Median : 8395 Median :29912
Mean :2010 Mean : 8525 Mean : 8594 Mean :30736
3rd Qu.:2012 3rd Qu.: 9004 3rd Qu.: 9418 3rd Qu.:32250
Max. :2015 Max. :11467 Max. :10126 Max. :39537

Berdasarkan data yang digunakan diperoleh hasil seperti berikut:

  1. Luas Panen
Nilai minimum luas panen adalah 6880.

Quartil pertama sebesar 7636 yang berarti bahwa 25% memiliki nilai di bawah 7635.

Median luas panen sebesar 8525 yang berarti bahwa 50% memiliki nilai di bawah 8525.

Rata-rata luas panen sebesar 8525.

Quartil ketiga sebesar 9004 yang berarti bahwa 75% memiliki nilai di bawah 9004.

Nilai maksimum luas panen adalah 11467.
  1. Luas Lahan
Nilai minimum luas lahan adalah 7051.

Quartil pertama sebesar 7723 yang berarti bahwa 25% memiliki nilai di bawah 7723.

Median luas lahan sebesar 8395 yang berarti bahwa 50% memiliki nilai di bawah 8395.

Rata-rata luas lahan sebesar 8594.

Quartil ketiga sebesar 9418 yang berarti bahwa 75% memiliki nilai di bawah 9418.

Nilai maksimum luas lahan adalah 10126.
  1. Produksi Padi
Nilai minimum produksi padi adalah 24702 .

Quartil pertama sebesar 27935 yang berarti bahwa 25% memiliki nilai di bawah 27935.

Median produksi padi sebesar 29912 yang berarti bahwa 50% memiliki nilai di bawah 29912.

Rata-rata produksi padi sebesar 30736.

Quartil ketiga sebesar 32250 yang berarti bahwa 75% memiliki nilai di bawah 32250.

Nilai maksimum produksi padi adalah 39537.

4.2 Analisis Regresi Linier Berganda

4.2.1 Model duga

Diperoleh model duga regresi linier berganda: \[ Y= -8886.9458+2.7685x_{1}+1.8641x_{2} \] Interpretasi:

  • \(\beta_{0}\)= -8886.9458 yang artinya jika seluruh variabel prediktor bernilai 0 maka produksi padi di Papua Barat menjadi -8886.9458 ton.

  • \(\beta_{1}\)= 2.7685 yang artinya jika luas panen naik 1 hektar maka produksi padi di Papua Barat akan mengalami peningkatan sebesar 2.7685 ton dengan asumsi variabel prediktor lain bernilai 0.

  • \(\beta_{2}\)= 1.8641, yang artinya jika luas lahan naik 1 hektar maka produksi padi di Papua Barat akan mengalami peningkatan sebesar 1.8641 ton dengan asumsi variabel prediktor lain bernilai 0.

4.2.2 Uji F

Hipotesis:

  • \(H_{0}:\beta_{1}= \beta_{2}= 0\) (Seluruh variabel prediktor secara bersama-sama tidak berpengaruh terhadap produksi padi di Papua Barat)

  • \(H_{1}\):minimal ada satu pasang \(\beta_{i}\ne 0\) (Seluruh variabel prediktor secara bersama-sama berpengaruh terhadap produksi padi di Papua Barat)

Statistik uji: Berdasarkan hasil analisis diperoleh nilai statistik uji sebesar 32.78 dan nilai p sebesar 0.0001399.

Keputusan: Karena nilai p < \(\alpha\), maka tolak H0.

Kesimpulan: Dengan taraf nyata 5 %, dapat disimpulkan bahwa seluruh variabel prediktor (luas panen dan luas lahan) secara bersama-sama berpengaruh terhadap produksi padi di Papua Barat.

4.2.3 Uji T

Hipotesis:

  • \(H_{0}:\beta_{i}= 0\) (Seluruh variabel prediktor secara parsial tidak berpengaruh terhadap produksi padi di Papua Barat)

  • \(H_{1}\) : \(\beta_{1}\ne 0\), i=1, 2 (Seluruh variabel prediktor secara parsial berpengaruh terhadap produksi padi di Papua Barat)

Statistik uji: p-value luas panen sebesar 6.729501e-05 p-value luas lahan sebesar 7.297859e-03

Keputusan: p-value luas panen < \(\alpha\), maka tolak \(H_{0}\) p-value luas lahan < \(\alpha\), maka tolak \(H_{0}\)

Kesimpulan: Dengan taraf nyata 5 %, dapat disimpulkan bahwa luas panen dan luas lahan secara parsial berpengaruh terhadap produksi padi di Papua Barat.

4.2.4 Koefisien Determinasi

> Rsq <- anova$JK[1]/anova$JK[3]
> Rsq
[1] 0.8912469

Berdasarkan data yang digunakan, diperoleh koefisien determinasi sebesar 89.12% yang berarti bahwa luas panen dan luas lahan produksi padi di Papua Barat sebesar 89.12%, sedangkan 10.88% lainnya dipengaruhi variabel lain di luar penelitian.

4.3 Uji Asumsi Klasik

4.3.1 Asumsi Normalitas

Uji Shapiro Wilk

> sisa <- residuals(reg)
> shapiro.test(sisa)

    Shapiro-Wilk normality test

data:  sisa
W = 0.95312, p-value = 0.684

Hipotesis:

  • \(H_{0}\): Galat menyebar normal

  • \(H_{1}\): Galat tidak menyebar normal

\(\alpha\)=0.05

Statistik uji: Berdasarkan uji yang dilakukan, diperoleh p-value sebesar 0.684.

Keputusan: Karena p-value > \(\alpha\), maka keputusannya adalah terima \(H_{0}\).

Kesimpulan: Dapat disimpulkan bahwa asumsi normalitas galat terpenuhi.

4.3.2 Asumsi Homoskedastisitas

Uji Breusch-Pagan

> bptest(reg)

    studentized Breusch-Pagan test

data:  reg
BP = 4.1594, df = 2, p-value = 0.125

Hipotesis:

  • \(H_{0}\): Homogenitas galat terpenuhi

  • \(H_{1}\): Homogenitas galat tidak terpenuhi

\(\alpha\)=0.05

Statistik uji: Berdasarkan uji yang dilakukan, diperoleh p-value sebesar 0.125.

Keputusan: Karena p-value > \(\alpha\), maka keputusannya adalah terima \(H_{0}\).

Kesimpulan: Dapat disimpulkan bahwa asumsi homoskedastisitas terpenuhi.

4.3.3 Asumsi Non Autokorelasi

Uji Durbin Watson

> dwtest(reg)

    Durbin-Watson test

data:  reg
DW = 0.94342, p-value = 0.005865
alternative hypothesis: true autocorrelation is greater than 0

Hipotesis:

  • \(H_{0}\): Tidak terjadi autokorelasi

  • \(H_{1}\): Terjadi autokorelasi

\(\alpha\)=0.05

Statistik uji: Berdasarkan uji yang dilakukan, diperoleh p-value sebesar 0.005865.

Keputusan: Karena p-value < \(\alpha\), maka tolak \(H_{0}\).

Kesimpulan: Dapat disimpulkan bahwa terdapat autokorelasi antar amatan.

4.3.4 Asumsi Non Multikolinearitas

> vif(reg)
      X1       X2 
1.006483 1.006483 

Berdasarkan uji yang dilakukan, diperoleh nilai VIF X1 dan X2 sebesar 1.006483. Kedua nilai VIF < 10 sehingga dapat disimpulkan bahwa tidak terdapat multikolinearitas antara variabel prediktor.

5 KESIMPULAN

Berdasarkan hasil pengujian di atas, diperoleh kesimpulan bahwa luas panen dan luas lahan berpengaruh terhadap produksi padi di Papua Barat. Variabel luas panen dan luas lahan berpengaruh secara simultan dan parsial terhadap produksi padi di Papua Barat. Diperoleh model duga sebagai berikut: \[Y= -8886.9458+2.7685x_{1}+1.8641x_{2}\]

6 DAFTAR PUSTAKA

Badan Pusat Statistik Papua Barat. 2015. Luas Panen, Produksi, dan Produktivitas Padi Menurut Kabupaten/Kota 2005-2014. Diakses dari: https://papuabarat.bps.go.id/statictable/2015/03/10/68/luas-panen-produksi-dan-produktivitas-padi-menurut-kabupaten-kota-2005---2014.html

Badan Pusat Statistik. 2013 . Luas Lahan Sawah. Diakses dari: https://www.bps.go.id/indicator/53/179/1/luas-lahan-sawah.html

Ghozali, I. 2016. Aplikasi Analisis Multivariate Dengan Program IBM SPSS 23. Edisi 8. Semarang: Badan Penerbit Universitas Diponegoro.

Matulessy, E. R., & Tambunan, A. U. 2023. Analisis Regresi PLS Sebagai Alternatif Dari Regresi Linear Berganda: Studi Kasus Pengaruh Luas Lahan dan Luas Panen Terhadap Produksi Padi di Kabupaten Manokwari. Jurnal Pendidikan dan Konseling (JPDK), 5(1), 3358-3361.

Vivi Silvia, S. E. 2020. Statistika Deskriptif. Penerbit Andi.