> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")1 PENDAHULUAN
1.1 Latar Belakang
Analisis regresi adalah salah satu teknik dalam statistika yang sering digunakan untuk mempelajari hubungan antara beberapa variabel dan melakukan prediksi terhadap suatu variabel (Kutner dkk., 2004). Istilah “regresi” pertama kali diperkenalkan oleh Sir Francis Galton (1822-1911), seorang ahli antropologi dan meteorologi terkenal dari Inggris, dalam makalahnya pada tahun 1885. Sebelum melakukan analisis regresi terlebih dahulu perlu menentukan satu variabel yang disebut dengan variabel respons (terikat) dan satu atau beberapa variabel prediktor (bebas). Jika ingin menganalisis pengaruh satu variabel prediktor, maka model regresi yang digunakan adalah model regresi linier sederhana. Sedangkan jika ingin menganalisis hubungan atau pengaruh dua atau lebih variabel prediktor, maka model regresi yang digunakan adalah model regresi linier berganda. Model regresi linier berganda inilah yang akan dipakai dalam mengetahui bagaimana pengaruh luas lahan panen, kelembapan, curah hujan, dan suhu terhadap hasil produksi tanaman padi di Sumatra pada tahun 1993-2020.
2 TINJAUAN PUSTAKA
2.1 Regresi Linier
Analisis regresi adalah suatu teknik statistika untuk pemeriksaan dan pemodelan hubungan antar variabel. Analisis ini terdiri dari dua komponen yang dihubungkan, yakni variabel respons dan satu atau beberapa variabel prediktor. Dalam beberapa literatur variabel prediktor dapat disebut juga dengan variabel bebas, independen, dan penjelas. Sedangkan variabel respons sering disebut juga dengan variabel terikat, dependen, dan lainnya. Dalam persamaan regresi, hanya terdapat satu variabel respons (Efendi dkk., 2020).
Analisis regresi adalah salah satu analisis yang paling populer dan luas pemakaiannya. Analisis regresi dipakai secara luas untuk melakukan prediksi dan ramalan, dengan penggunaan yang saling melengkapi dengan bidang pembelajaran mesin. Analisis ini juga digunakan untuk memahami variabel bebas mana saja yang berhubungan dengan variabel terikat, dan untuk mengetahui bentuk-bentuk hubungan tersebut. Tujuan utama analisis regresi adalah untuk memahami dan memodelkan hubungan antara variabel-variabel tersebut, serta untuk melakukan prediksi atau estimasi nilai variabel dependen berdasarkan nilai-nilai variabel independen.
Menurut Suyono (2012), terdapat dua model dalam regresi linier yaitu model regresi linier sederhana dan model regresi linier berganda. Regresi linier sederhana adalah metode statistik yang digunakan untuk mempelajari hubungan linier antara satu variabel independen (X) dan satu variabel dependen (Y) (Montgomery dkk., 2012). Model regresi linier sederhana dinyatakan dengan \[ Y = β_0+β_1 X_1+ε \] di mana:
\(Y\) = Variabel respons atau variabel terikat
\(β_0\) = Intercept atau konstanta
\(β_1\) = Koefisien regresi
\(X_1\) = Variabel prediktor atau variabel bebas
\(ε\) = Sisa (error)
Sedangkan regresi linier berganda adalah metode statistik yang digunakan untuk mempelajari hubungan linier antara satu vaiabel dependen (variabel terikat) dan dua atau lebih variabel independen (variabel bebas) (Hair dkk., 2006). Model regresi linier berganda dinyatakan dengan
\[ Y=β_0+β_1 X_1+β_2 X_2+⋯+β_i X_i+ε \] di mana:
\(Y\) = Variabel respons atau variabel terikat
\(β_0\) = Intercept atau konstanta
\(β_i\) = Koefisien regresi ke-i
\(X_i\) = Variabel prediktor atau variabel bebas ke-i
\(ε\) = Sisa (error)
Jika menggunakan matriks, penduga bisa ditetukan dengan rumus \(β_i=(X^T X)^{-1}*(X^T Y)\).
2.2 Uji Hipotesis Regresi Linier
Uji hipotesis dalam analisis regresi linier digunakan untuk mengetahui pengaruh keseluruhan variabel prediktor terhadap variabel respons ataupun pengaruh masing-masing variabel prediktor terhadap variabel respons. Uji hipotesis dibagi menjadi dua, yaitu Uji Simultan (Uji F) dan Uji Parsial (Uji T).
2.2.1 Uji Simultan (Uji F)
Uji Simultan bertujuan untuk mengetahui apakah variabel prediktor secara bersama-sama (simultan) mempengaruhi variabel respons. Langkah-langkah Uji Simultan adalah sebagai berikut.
Hipotesis
\(H_0:β_1=⋯=β_i=0\)
\(H_1:Minimal\) \(terdapat\) \(salah\) \(satu\) \(β_i≠0,\) \(di\) \(mana\) \(i=1,2,…\)
Statistik Uji
\(JKR=β^T (X^T Y)-nY ̅^2\)
\(JKT=Y^T Y-nY ̅^2\)
\(JKG=JKT-JKR\)
| Sumber Keragaman | Derajat Bebas | Jumlah Kuadrat | Kuadrat Tengah | F Hitung |
|---|---|---|---|---|
| Regresi | i | JKR | JKR/i | KTR/KTG |
| Galat | n-2 | JKG | JKG/(n-2) | |
| Total | n-1 | JKT |
Keputusan
\(F_{hitung}>F_{tabel}\), maka \(Tolak\) \(H_0\)
atau
\(p_{value}<α\), maka \(Tolak\) \(H_0\)
Kesimpulan
Kesimpulan didasarkan hipotesis dan keputusan yang didapatkan
2.2.2 Uji Parsial (Uji T)
Uji Parsial bertujuan untuk mengetahui apakah masing-masing variabel prediktor mempengaruhi variabel respons. Langkah-langkah Uji Parsial adalah sebagai berikut.
Hipotesis
\(H_0:β_j=0,di\) \(mana\) \(j=1,2,…\)
\(H_1: β_j≠0,di\) \(mana\) \(j=1,2,…\)
Statistik Uji
\(t_{hitung}=\)\(\frac{(β ̂_1-β_0)}{s_d} =\frac{(β ̂_1-β_0)}{√(KTG×(X^T X)^{-1})}\)
Keputusan
\(t_{hitung}>t_{tabel}\), maka \(Tolak\) \(H_0\)
atau
\(p_{value}<α\), maka \(Tolak\) \(H_0\)
Kesimpulan
Kesimpulan didasarkan hipotesis dan keputusan yang didapatkan
2.3 Koefisien Determinasi
Koefisien determinasi digunakan untuk mengukur kemampuan model dalam menerangkan seberapa besar pengaruh variabel prediktor secara bersama-sama mempengaruhi variabel respons. Nilai koefisien determinasi diperoleh melalui \[R^2=\frac{JKR}{JKT}\]
2.4 Asumsi Regresi Linier
Penggunaan analisis regresi tidak bisa langsung dilakukan harus dilakukan asumsi terlebih dahulu agar penaksiran parameter dan koefisien regresi tidak bias. Asumsi-asumsi yang harus dipenuhi tersebut memiliki sebutan asumsi klasik. Asumsi-asumsi tersebut adalah sebagai berikut.
2.4.1 Asumsi Normalitas Galat
Uji normalitas berfungsi untuk menguji apakah dalam sebuah model regresi, variabel pengganggu memiliki distribusi normal (Ghozali, 2011). Uji normalitas adalah pengujian data untuk melihat apakah nilai residual terdistribusi normal atau tidak. Salah satunya menggunakan Uji Jarque Bera dengan langkah-langkah sebagai berikut.
Hipotesis
\(H_0:\) \(Sampel\) \(diambil\) \(dari\) \(populasi\) \(yang\) \(berdistribusi\) \(normal\)
\(H_1:\) \(Sampel\) \(diambil\) \(dari\) \(populasi\) \(yang\) \(tidak\) \(berdistribusi\) \(normal\)
Statistik Uji
\(JB=\frac{n}{6} (S^2+\frac{(K-3)^2}{4})\)
di mana
\(S=\frac{\frac{1}{n} ∑(x_i-x ̅ )^3}{(\frac{1}{n} ∑(x_i-x̅^2 ) )^{3/2}}\)
\(K=\frac{\frac{1}{n} ∑(x_i-x ̅ )^4 )}{(\frac{1}{n}) ∑(x_i-x̅^2 ) )^2}\)
Keputusan
\(JB>X_{tabel}^2\), maka \(Tolak\) \(H_0\)
atau
\(p_{value}<α\), maka \(Tolak\) \(H_0\)
Kesimpulan
Kesimpulan didasarkan hipotesis dan keputusan yang didapatkan
2.4.2 Asumsi Homoskedastisitas
Priyatno (2016) menyatakan bahwa uji homoskedastisitas digunakan untuk menguji apakah di dalam model regresi terjadi ketidaksamaan varian dari residual pada satu pengamatan ke pengamatan yang lainnya. Salah satunya yaitu Uji Breusch Pagan dengan langkah-langkah sebagai berikut.
Hipotesis
\(H_0:\) \(Homogenitas\) \(galat\) \(terpenuhi\)
\(H_1:\) \(Homogenitas\) \(galat\) \(tidak\) \(terpenuhi\)
Statistik Uji
\(LM=\frac{nT}{2(T-1)} (\frac{∑_{i=1}^n(∑_{i=1}^nu ̂_{it})^2}{(∑_{i=1}^n∑_{i=1}^nu ̂_{it}^2 )}-1)\)
Keputusan
\(LM>X_{tabel}^2\), maka \(Tolak\) \(H_0\)
atau
\(p_{value}<α\), maka \(Tolak\) \(H_0\)
Kesimpulan
Kesimpulan didasarkan hipotesis dan keputusan yang didapatkan
2.4.3 Asumsi Non Autokorelasi
Menurut Ghozali (2011), Autokolerasi bertujuan menguji apakah dalam model regresi linear ada kolerasi antara kesalahan pengganggu pada periode t dengan kesalahan pengganggu pada periode t-1 (sebelumnya). Salah satu uji yang menganalisis asumsi Non Autokorelasi adalah Uji Durbin Watson dengan langkah-langkah sebagai berikut.
Hipotesis
\(H_0:\) \(Tidak\) \(terjadi\) \(autokorelasi\)
\(H_1:\) \(Terjadi\) \(autokorelasi\)
Statistik Uji
\(d=\frac{∑_{t=2}^n(e ̂_t-e ̂_{t-1})^2}{∑_{t=1}^ne ̂_t^2}\)
Keputusan
\(d<dL\) atau \(d>4-dL\), maka \(Tolak\) \(H_0\)
atau
\(p_{value}<α\), maka \(Tolak\) \(H_0\)
Kesimpulan
Kesimpulan didasarkan hipotesis dan keputusan yang didapatkan
2.4.4 Asumsi Non Multikolinieritas
Menurut Ghozali (2011), Multikolinearitas digunakan untuk mengetahui ada atau tidaknya korelasi antar variabel independen dalam model regresi. Model regresi yang baik adalah yang tidak mengandung multikolinearitas. Untuk mendeteksi apakah terdapat multikolinieritas dapat digunakan Variance Inflaction Factor (VIF) dengan langkah-langkah sebagai berikut.
Hipotesis
\(H_0:\) \(Tidak\) \(terjadi\) \(multikolinieritas\)
\(H_1:\) \(Terjadi\) \(multikolinieritas\)
Statistik Uji
\(VIF_j=\frac{1}{1-R_j^2}, j=1,2,…,k\)
Keputusan
\(VIF>10\), maka \(Tolak\) \(H_0\)
Kesimpulan
Kesimpulan didasarkan hipotesis dan keputusan yang didapatkan
3 SOURCE CODE
3.1 Input Data
> library(readxl)
>
> #Input Data
> data <- read_excel("D:/Analisis Regresi Berganda.xlsx")
> data
# A tibble: 224 × 5
Produksi Luas_Panen Kelembapan Curah_Hujan Suhu
<dbl> <dbl> <dbl> <dbl> <dbl>
1 3079960 792534 83.8 2166. 26.4
2 3134533 795183 81.7 2917. 26.6
3 3136760 790051 81.3 2326. 26.3
4 3212208 797545 81.8 1865 26.4
5 3321049 823749 83.5 2497. 27.2
6 3451430 838626 84.6 3087. 26.4
7 3514253 847610 82.9 1290. 27.7
8 3291515 801948 72.8 3595. 28.0
9 3153305 765161 72.3 1945. 28.4
10 3403075 825188 72.1 3140. 29.6
# ℹ 214 more rows3.2 Regresi Linier Berganda
> #Membuat Model Koefisien Regresi Linier Berganda, Uji Simultan, Uji Parsial, dan Koefisien Determinasi
> model <- lm(Produksi~Luas_Panen+Curah_Hujan+Kelembapan+Suhu,data=data)
> summary(model)
Call:
lm(formula = Produksi ~ Luas_Panen + Curah_Hujan + Kelembapan +
Suhu, data = data)
Residuals:
Min 1Q Median 3Q Max
-911182 -203210 -75736 67299 2843199
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 2.183e+06 1.215e+06 1.797 0.0738 .
Luas_Panen 4.564e+00 1.421e-01 32.118 <2e-16 ***
Curah_Hujan 3.225e+01 3.273e+01 0.985 0.3255
Kelembapan -6.207e+03 7.364e+03 -0.843 0.4002
Suhu -6.672e+04 3.088e+04 -2.161 0.0318 *
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 489300 on 219 degrees of freedom
Multiple R-squared: 0.8257, Adjusted R-squared: 0.8225
F-statistic: 259.3 on 4 and 219 DF, p-value: < 2.2e-163.3 Asumsi Regresi Linier Berganda
3.3.1 Asumsi Normalitas Galat
> #Uji Asumsi Normalitas
> library(tseries)
> sisa <- residuals(model)
> jarque.bera.test(sisa)
Jarque Bera Test
data: sisa
X-squared = 2024.9, df = 2, p-value < 2.2e-163.3.2 Asumsi Homoskedastisitas
> #Uji Asumsi Homoskedastisitas
> library(lmtest)
> bptest(model)
studentized Breusch-Pagan test
data: model
BP = 2.3745, df = 4, p-value = 0.66723.3.3 Asumsi Non Autokorelasi
> #Uji Asumsi Non Autokorelasi
> dwtest(model)
Durbin-Watson test
data: model
DW = 0.64617, p-value < 2.2e-16
alternative hypothesis: true autocorrelation is greater than 03.3.4 Asumsi Non Multikolinieritas
> #Uji Asumsi Non Multikolinieritas
> library(car)
> vif(model)
Luas_Panen Curah_Hujan Kelembapan Suhu
1.018732 1.062129 1.201933 1.272314 4 HASIL DAN PEMBAHASAN
4.1 Regresi Linier Berganda
4.1.1 Estimasi Koefisien Regresi Linier Berganda
Berdasarkan hasil summary pada poin 3, diperoleh model regresi dari data yang dianalisis adalah sebagai berikut.
\[Ŷ=2.183.000+4,564X_1+32,25X_2-6,207X_3-66,720X_4\] Interpretasi Koefisien
\(β_0=2.183.000\)
Jika luas lahan panen (\(X_1\)), kelembapan (\(X_2\)), curah hujan (\(X_3\)), dan suhu (\(X_4\)) memiliki nilai 0, maka tanaman padi di daerah Sumatra tahun 1993-2020 memiliki hasil produksi sebesar 2.183.000 ton.
\(β_1=4,564\)
Jika kelembapan (\(X_2\)), curah hujan (\(X_3\)), suhu (\(X_4\)) memiliki nilai yang konstan dan luas lahan panen (\(X_1\)) meningkat sebesar 1%, maka tanaman padi di daerah Sumatra tahun 1993-2020 memiliki hasil produksi yang meningkat sebesar 4,564 ton.
\(β_2=32,25\)
Jika luas lahan panen (\(X_1\)), curah hujan (\(X_3\)), suhu (\(X_4\)) memiliki nilai yang konstan dan kelembapan (\(X_2\)) meningkat sebesar 1%, maka tanaman padi di daerah Sumatra tahun 1993-2020 memiliki hasil produksi yang meningkat sebesar 32,25 ton.
\(β_3=-6,207\)
Jika luas lahan panen (\(X_1\)), kelembapan (\(X_2\)), suhu (\(X_4\)) memiliki nilai yang konstan dan curah hujan (\(X_3\)) meningkat sebesar 1%, maka tanaman padi di daerah Sumatra tahun 1993-2020 memiliki hasil produksi yang menurun sebesar 6,207 ton.
\(β_4=-66,720\)
Jika luas lahan panen (\(X_1\)), kelembapan (\(X_2\)), curah hujan (\(X_3\)), memiliki nilai yang konstan dan suhu (\(X_4\)) meningkat sebesar 1%, maka tanaman padi di Sumatra tahun 1993-2020 memiliki hasil produksi yang menurun sebesar 66,720 ton.
4.1.2 Uji Hipotesis Regresi Linier Berganda
Uji Simultan (Uji F)
\(p_{value}= <2,2×10^{-16}\)
Karena \(p_{value} (<2,2×10^{-16} )<α (0,05)\), maka \(Tolak\) \(H_0\)
Sehingga dapat disimpulkan bahwa minimal terdapat satu dari variabel luas lahan panen, kelembapan, curah hujan, dan suhu yang berpengaruh secara signifikan terhadap hasil produksi tanaman padi di Sumatra tahun 1993-2020.
Uji Parsial (Uji T)
\(X_1\)
\(p_{value}= <2×10^{-16}\)
Karena \(p_{value} (<2×10^{-16} )<α (0,05)\), maka \(Tolak\) \(H_0\)
Sehingga dapat disimpulkan bahwa variabel luas lahan panen berpengaruh secara signifikan terhadap hasil produksi tanaman padi di Sumatra tahun 1993-2020.
\(X_2\)
\(p_{value}=0,3255\)
Karena \(p_{value} (0,3255)>α (0,05)\), maka \(Terima\) \(H_0\)
Sehingga dapat disimpulkan bahwa variabel kelembapan tidak berpengaruh secara signifikan terhadap hasil produksi tanaman padi di Sumatra tahun 1993-2020.
\(X_3\)
\(p_{value}=0,4002\)
Karena \(p_{value} (0,4002)>α (0,05)\), maka \(Terima\) \(H_0\)
Sehingga dapat disimpulkan bahwa variabel curah hujan tidak berpengaruh secara signifikan terhadap hasil produksi tanaman padi di Sumatra tahun 1993-2020.
\(X_4\)
\(p_{value}=0,0318\)
Karena \(p_{value} (0,0318)<α (0,05)\), maka \(Tolak\) \(H_0\)
Sehingga dapat disimpulkan bahwa variabel suhu berpengaruh secara signifikan terhadap hasil produksi tanaman padi di Sumatra tahun 1993-2020.
4.1.3 Koefisien Determinasi
\(R_{adj}^2=0,8225\)
Variabel luas lahan panen, kelembapan, curah hujan, dan suhu secara bersama-sama mempengaruhi variabel hasil produksi tanaman padi di Sumatra tahun 1993-2020 sebesar 82,25%, sedangkan 17,75% sisanya dipengaruhi oleh variabel lain di luar model.
4.2 Asumsi Regresi Linier Berganda
4.2.1 Asumsi Normalitas Galat
\(p_{value}= <2,2×10^{-16}\)
Karena \(p_{value}(<2,2×10^{-16})<α(0,05)\), maka \(Tolak\) \(H_0\)
Sehingga dapat disimpulkan bahwa sampel diambil dari galat populasi yang tidak berdistribusi normal atau asumsi normalitas galat tidak terpenuhi.
4.2.2 Asumsi Homoskedastisitas
\(p_{value}=0,6672\)
Karena \(p_{value}(0,6672)>α (0,05)\), maka \(Terima\) \(H_0\)
Sehingga dapat disimpulkan bahwa ragam galat homogen atau asumsi homoskedastisitas terpenuhi.
4.2.3 Asumsi Non Autokorelasi
\(p_{value}= <2,2×10^{-16}\)
Karena \(p_{value}(<2,2×10^{-16})<α (0,05)\), maka \(Tolak\) \(H_0\)
Sehingga dapat disimpulkan bahwa terjadi autokorelasi atau asumsi non autokorelasi tidak terpenuhi.
4.2.4 Asumsi Non Multikolinieritas
- \(VIF_1=1,018732\)
- \(VIF_2=1,062129\)
- \(VIF_3=1,201933\)
- \(VIF_4=1,272314\)
Karena \(VIF\) seluruh variabel \(<10\), maka \(Terima\) \(H_0\)
Sehingga dapat disimpulkan bahwa tidak terjadi multikolinieritas antar variabel atau asumsi non multikolinieritas terpenuhi.
5 KESIMPULAN DAN SARAN
Berdasarkan analisis mengenai pengaruh luas lahan panen, kelembapan, curah hujan, dan suhu dapat disimpulkan bahwa data ini masih mengandung kesalahan karena masih belum memenuhi asumsi analisis regresi yaitu asumsi normalitas dan non autokorelasi. Saran dari hal ini adalah dapat dilakukan transformasi data agar penaksiran parameter dan koefisien regresi tidak bias dan dilakukan analisis regresi berganda kembali.
6 DAFTAR PUSTAKA
Efendi, A., Wardhani, N. W. S., Fitriani, R., & Sumarminingsih, E. 2020. Analisis Regresi: Teori dan Aplikasi dengan R. Malang: Universitas Brawijaya Press.
Ghozali, I. 2011. Aplikasi Analisis Multivariate dengan Progam SPSS. Semarang: Badan Penerbit Universitas Diponegoro.
Ghozali, I. 2016. Aplikasi Analisis Multivariate dengan Program IBM SPSS 23. Edisi 8. Semarang: Badan Penerbit Universitas Diponegoro.
Hair, J.F., Black, W.C., Babin, B.J., Anderson, R.E., & Tatham, R.L. 2006. Multivariate Data Analysis (6th ed.). Pearson Prentice Hall.
Khasanah, U. 2021. Analisis Regresi. Yogyakarta: UAD PRESS.
Kutner, M.H., Nachtsheim, C.J. dan Neter, J. 2004. Applied Linear Regression Models.New York: McGraw-Hill/Irwin.
Priyatno, Duwi. 2016. Belajar Alat Analisis Data dan Cara Pengolahannya Dengan SPSS Praktis dan Mudah Dipahami untuk Tingkat Pemula dan Menengah. Yogyakarta: Gava Media.
Suyono. 2012. Analisis Regresi untuk Penelitian. Yogyakarta: Deepublish.