Library:
> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")
> # install.packages("car")
> # install.packages("lmtest")
Indonesia merupakan negara yang memiliki sumber daya alam yang
melimpah dan memiliki potensi untuk menjadi negara maju. Sebagai negara
agraris, sektor pertanian tentu memiliki pengaruh bagi negara Indonesia,
baik sebagai sumber mata pencaharian maupun penopang pembangunan. Namun
sebagai negara berkembang, Indonesia masih memiliki kekurangan dalam
beberapa aspeknya yang salah satunya adalah bahan makanan pokok. Bangsa
Indonesia menggunakan nasi sebagai bahan makanan pokoknya dan untuk
memenuhi kebutuhan karbohidrat dalam tubuh. Kebutuhan padi sebagai bahan
makanan pokok selalu mengalami kenaikan tiap tahunnya. Namun tidak
sejalan dengan penggunaannya yang besar, produksi padi di Negara kita
masih belum menenuhi kebutuhan. Pemerintah Indonesia masih harus
mengimpor beras dari luar negeri tiap tahunnya karena hasil tanam padi
dalam negeri masih belum memenuhi kebutuhan. Oleh karena itu hasil
produksi pertanian harus lebih diperhatikan agar mengalami peningkatan
tiap tahunnya.
Dari tahun ke tahun, berdasarkan data yang ada, produksi pertanian di
Kabupaten Semarang mengalami peningkatan terutama di bagian produksi
Padi. Pada umumnya para petani memiliki keinginan untuk meningkatkan
produksi pertaniannya tetapi karena banyak masalah yang dihadapi, sulit
untuk mencapai apa yang diinginkan. Produksi padi dipengaruhi oleh
beberapa faktor antara lain luas lahan garapan, jumlah tenaga kerja
efektif, jumlah pupuk, jumlah pestisida, jarak lahan dengan rumah
petani, dan sistem irigasi. DIlihat dari beberapa faktor tersebut,
masalah sempitnya lahan, tinggi tempat usaha dan jarak lokasi lahan tani
umumnya sangat berpengaruh terhadap produksi pertanian terutama dalam
hasil produksi padi. Maka berdasarkan latar belakang tersebut, penulis
tertarik untuk melakukan penelitian mengenai pengaruh luas penggunaan
lahan dan tinggi tempat terhadap produksi padi.
Metode Analisis yang akan digunakan dalam penelitian ini adalah analisis
regresi. Analisis regresi bertujuan untuk melihat bentuk hubungan antara
kedua variabel atau lebih yang diteliti.
Statistika Deskriptif adalah statistika yang tingkat kegunaannya mencakup cara-cara mengumpulkan data, menyusun atau mengatur data, mengolah data, menyajikan data dan menganalisis data angka. Mean, median dan modus termasuk dalam ukuran pemusatan data statistika deskriptif. Selain melihat ukuran pemusatan data, statistika deskriptif juga melihat bagaimana sebaran masing-masing data dan hubungan antara prediktor dan respon. Untuk melihat sebaran masing-masing data dapat menggunakan plot histogram sedangkan untuk melihat hubungan antara prediktor dan respon dapat menggunakan scatter plot.
Analisis Regresi merupakan analisis statistik yang mempelajari
hubungan antara dua variabel atau lebih. Secara umum ada dua macam
hubungan antara dua variabel atau lebih, yaitu bentuk hubungan dua
keeratan hubungan. Untuk mengetahui bentuk hubungan digunakan analisis
regresi. Analisis regresi dipergunakan untuk melihat hubungan satu arah
antara variabel yang lebih khusus, dimana varabel x berfungsi sebagai
variabel bebas variabel yang mempengaruhi, dan variabel y sebagai
variabel terikat adalah variabel yang dipengaruhi. Biasanya variabel x
juga disebut sebagai variabel independen atau vaiabel responden, dan
variabel y sebagai dependen (Sukestiyarno, 2015).
Persamaan Analisis Regresi yang digunakan dalam penelitian ini dapat
dinyatakan sebagai berikut:
\[
\ Y = \alpha + b_{1}X_1 + b_{2}X_2 +\varepsilon
\] dimana:
\(Y\) : Model regresi (subyek dalam
variabel dependen yang diprediksikan)
\(\alpha\) : Harga konstan (Harga Y
(Produksi Padi) ketika X = 0)
\(\beta_1X_1\) : nilai koefisien
regresi variabel X1 (Luas Lahan)
\(\beta_2X_2\) : nilai koefisien
regresi variabel X2 (Tinggi Tempat)
\(\varepsilon\) : Galat
Konstanta a, Koefisien \(b_{1}\) dan koefisien \(b_{2}\) dapat dihitung menggunakan rumus:
\[
a = \frac{(\sum y)-{b_{1} \sum x_{1})-(b_{2} \sum x_{2})}}{n}
\] \[
b_{1}=\frac{[(\sum x_{2}^2 \sum x_{1}y)-(\sum x_{1}y \sum
x_{1}x_{2})]}{[(\sum x_{1}^2 \sum x_{2}^2)-(\sum x_{1}\sum x_{2})^2]}
\] \[
b_{2}=\frac{[(\sum x_{1}^2 \sum x_{2}y)-(\sum x_{1}y \sum
x_{1}x_{2})]}{[(\sum x_{1}^2 \sum x_{2}^2)-(\sum x_{1}\sum x_{2})^2]}
\] setelah itu bisa kita hitung nilai F dengan rumus F hitung
sebagai berikut:
\[
F hit = \frac{r^2/k}{(1-r^2)/(n-k-1)}
\] Keterangan: \(r^2\) =
Koefisien Determinasi
n = Jumlah Data
k = Jumlah Variabel Independen
dimana \(r^2\) dapat dihitung dengan
rumus:
\[
r^2 = \frac{(b_{1}\sum x_{1} y)+(b_{2}\sum x_{2} y)}{\sum y^2}
\]
Dalam analisis regresi penelitian ini ada beberapa asumsi yang harus
dipenuhi yakni:
1. Uji Asumsi Normalitas.
2. Uji Asumsi Multikolinearitas.
3. Uji Asumsi Homogenitas.
4. Uji Asumsi Non Autokorelasi.
Data yang digunakan adalah data yang diambil dari Buku Kabupaten Semarang Dalam Angka 2019. Variabel bebas (Independen) merupakan variabel yang memengaruhi atau sebab dari timbulnya variabel terikat (dependen). Dalam penelitian ini, Variabel luas penggunaan lahan digunakan sebagai variabel \(X_{1}\) dan variabel tinggi tempat sebagai variabel \(X_{2}\). Sedangkan variabel terikat (\(Y\)) dalam penelitian ini adalah produksi padi.
Library yang dibutuhkan:
> library(knitr)
> library(rmarkdown)
> library(prettydoc)
> library(equatiomatic)
> library(car)
> library(lmtest)
> data <- file.path("C:/Users/ASUS/Downloads/Data Penelitian.csv")
> data_penelitian <- read.csv(data,header = TRUE)
> str(data_penelitian)
'data.frame': 19 obs. of 5 variables:
$ No : int 1 2 3 4 5 6 7 8 9 10 ...
$ Kecamatan : chr "Getasan" "Tengaran" "Susukan" "Kaliwungu" ...
$ Luas_Lahan : num 64 867 1942 1109 2934 ...
$ Tinggi_Tempat: int 1450 729 497 497 660 584 480 478 572 900 ...
$ Produksi_Padi: num 23.4 8046 28373 15968 36701 ...
> X1 <- data_penelitian$Luas_Lahan
> X2 <- data_penelitian$Tinggi_Tempat
> Y <- data_penelitian$Produksi_Padi
> X1
[1] 64.00 866.60 1941.70 1108.80 2933.80 2312.60 1460.40 1225.00 461.00
[10] 729.70 915.70 1556.00 1099.50 2041.70 1186.80 1255.00 995.70 912.54
[19] 678.76
> X2
[1] 1450 729 497 497 660 584 480 478 572 900 514 750 650 357 357
[16] 400 400 318 318
> Y
[1] 23.37 8046.00 28373.00 15968.00 36701.00 26288.00 15103.00 13562.00
[9] 4261.00 3127.00 8302.00 7264.00 10780.00 23700.00 9461.00 12420.00
[17] 8130.00 8943.00 7332.00
> summary(X1)
Min. 1st Qu. Median Mean 3rd Qu. Max.
64.0 889.6 1108.8 1249.8 1508.2 2933.8
> summary(X2)
Min. 1st Qu. Median Mean 3rd Qu. Max.
318.0 400.0 497.0 574.3 655.0 1450.0
> summary(Y)
Min. 1st Qu. Median Mean 3rd Qu. Max.
23.37 7689.00 9461.00 13041.28 15535.50 36701.00
> hist(X1, main = "Histogram Luas Lahan (Ha)")
> hist(X2, main = "Histogram Tinggi Tempat (m)")
> hist(Y, main = "Histogram Produksi Padi (ton)")
> plot(X1, Y, main = "Plot Luas Lahan terhadap Produksi Padi", ylab = "Produksi Padi", xlab = "Luas Lahan")
> plot(X2, Y, main = "Plot Tinggi Tempat terhadap Produksi Padi", ylab = "Produksi Padi", xlab = "Tinggi Tempat")
Dilakukan perhitungan manual dan digunakan perintah function
lm() untuk melakukan analisis regresi.
> X <- c(rep(1,19),X1,X2)
> matriksX <- matrix(X,19)
> matriksX
[,1] [,2] [,3]
[1,] 1 64.00 1450
[2,] 1 866.60 729
[3,] 1 1941.70 497
[4,] 1 1108.80 497
[5,] 1 2933.80 660
[6,] 1 2312.60 584
[7,] 1 1460.40 480
[8,] 1 1225.00 478
[9,] 1 461.00 572
[10,] 1 729.70 900
[11,] 1 915.70 514
[12,] 1 1556.00 750
[13,] 1 1099.50 650
[14,] 1 2041.70 357
[15,] 1 1186.80 357
[16,] 1 1255.00 400
[17,] 1 995.70 400
[18,] 1 912.54 318
[19,] 1 678.76 318
> Y <- Y
> beta_duga <- solve(t(matriksX)%*%matriksX)%*%t(matriksX)%*%Y
> beta_duga
[,1]
[1,] -2716.2235093
[2,] 12.9713209
[3,] -0.7895967
> Y_duga <- matriksX%*%beta_duga
> Y_duga
[,1]
[1,] -3030.974
[2,] 7949.107
[3,] 22077.761
[4,] 11273.948
[5,] 34817.904
[6,] 26820.129
[7,] 15848.087
[8,] 12796.217
[9,] 2811.906
[10,] 6038.312
[11,] 8755.762
[12,] 16874.954
[13,] 11032.506
[14,] 23485.436
[15,] 12396.254
[16,] 13246.946
[17,] 9883.482
[18,] 8869.534
[19,] 5837.099
> Y_bar = rep(mean(Y), 19)
> Y_bar
[1] 13041.28 13041.28 13041.28 13041.28 13041.28 13041.28 13041.28 13041.28
[9] 13041.28 13041.28 13041.28 13041.28 13041.28 13041.28 13041.28 13041.28
[17] 13041.28 13041.28 13041.28
> sisa <- Y-Y_duga
> sisa
[,1]
[1,] 3054.34425
[2,] 96.89282
[3,] 6295.23925
[4,] 4694.05245
[5,] 1883.09603
[6,] -532.12876
[7,] -745.08713
[8,] 765.78262
[9,] 1449.09390
[10,] -2911.31230
[11,] -453.76233
[12,] -9610.95429
[13,] -252.50596
[14,] 214.56361
[15,] -2935.25413
[16,] -826.94555
[17,] -1753.48204
[18,] 73.46608
[19,] 1494.90148
> JKT = t(Y-Y_bar)%*%(Y-Y_bar)
> JKG = t(Y-Y_duga)%*%(Y-Y_duga)
> JKR = t(Y_duga-Y_bar)%*%(Y_duga-Y_bar)
> JK <- c(JKR, JKG, JKT)
> JK
[1] 1420638960 193849497 1614488456
> dbR = 2-1
> dbTotal = 19-1
> dbGalat = dbTotal-dbR
> db <- c(dbR, dbGalat, dbTotal)
> db
[1] 1 17 18
> KT = JK/db
> SU <- c("Regresi", "Galat","Total")
> anreg <- data.frame(SU, db, JK, KT)
> names(anreg)<- c("SK","db","JK","KT")
> anreg
SK db JK KT
1 Regresi 1 1420638960 1420638960
2 Galat 17 193849497 11402912
3 Total 18 1614488456 89693803
> F_hitung <- anreg$KT[1]/anreg$KT[2]
> F_hitung
[1] 124.5856
> pf <- pf(F_hitung, anreg$db[1],anreg$db[2], lower.tail = FALSE)
> pf
[1] 3.021275e-09
> reg <- lm(formula = Y~X1+X2)
> summary(reg)
Call:
lm(formula = Y ~ X1 + X2)
Residuals:
Min 1Q Median 3Q Max
-9611.0 -786.0 73.5 1472.0 6295.2
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -2716.2235 2907.3484 -0.934 0.364
X1 12.9713 1.2676 10.233 1.99e-08 ***
X2 -0.7896 3.2553 -0.243 0.811
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 3481 on 16 degrees of freedom
Multiple R-squared: 0.8799, Adjusted R-squared: 0.8649
F-statistic: 58.63 on 2 and 16 DF, p-value: 4.32e-08
Uji Asumsi Normalitas dilakukan untuk melihat apakah data variabel Y
(Produksi Padi) berdistribusi normal atau tidak dengan menggunakan
function shapiro.test() ataupun
jarque.bera.test().
> sisa <- residuals(reg)
> shapiro.test(sisa)
Shapiro-Wilk normality test
data: sisa
W = 0.90175, p-value = 0.05234
Uji Asumsi Multikolinieritas dilakukan untuk melihat apakah ada
tidaknya hubungan linier antar variabel prediktor (variabel Luas Lahan
dan Tinggi Tempat) pada regresi berganda. Pengujian dilakukan dengan
menggunakan perintah function vif()
> vif(reg)
X1 X2
1.103126 1.103126
Uji Asumsi Homogenitas digunakan untuk menguji apakah data bersifat
homogen atau tidak. Pengujian ini menggunakan uji Breusch Pagan, yang
memiliki perintah function bptest()
> bptest(reg)
studentized Breusch-Pagan test
data: reg
BP = 1.487, df = 2, p-value = 0.4755
Uji Asumsi Non Autokorelasi adalah uji yang mengasumsikan kebebasan
antar galat. Pelanggaran dari asumsi ini disebut sebagai masalah
autokorelasi, akibat kesalahan spesifikasi model atau tidak digunakannya
variabel prediktor yang penting. Dalam pengujiannya, digunakan perintah
function dwtest() untuk mendapatkan hasilnya.
> dwtest(reg)
Durbin-Watson test
data: reg
DW = 1.4627, p-value = 0.06512
alternative hypothesis: true autocorrelation is greater than 0
1. Variabel Luas Lahan
Berdasarkan data yang digunakan, diperoleh nilai rata-rata luas lahan
sebesar 1249.8 Ha, nilai minimum sebesar 64.0 Ha, nilai maksimum sebesar
2933.8 Ha, nilai quartil bawah sebesar 889.6 Ha, nilai median (quartil
tengah) sebesar 1108.8 Ha dan nilai quatil atas 1508.2 Ha.
\[
\mu = 1249.8 , Min = 64.0 , Max = 2933.8, Q_{1} = 889.6 , Me = 1108.8 ,
Q_{3} = 1508.2
\] 2. Variabel Tinggi Tempat
Berdasarkan data yang digunakan, diperoleh nilai rata-rata luas lahan
sebesar 574.3 m, nilai minimum sebesar 318.0 m, nilai maksimum sebesar
1450.0 m, nilai quartil bawah sebesar 400.0 m, nilai median (quartil
tengah) sebesar 497.0 m dan nilai quatil atas 655.0 m.
\[
\mu = 574.3 , Min = 318.0 , Max = 1450.0, Q_{1} = 400.0 , Me = 497.0 ,
Q_{3} = 655.0
\] 3. Variabel Produksi Padi
Berdasarkan data yang digunakan, diperoleh nilai rata-rata luas lahan
sebesar 13041.28 ton, nilai minimum sebesar 23.37 ton, nilai maksimum
sebesar 36701.00 ton, nilai quartil bawah sebesar 7689.00 ton, nilai
median (quartil tengah) sebesar 9461.00 ton dan nilai quatil atas
15535.50 ton.
\[
\mu = 13041.28 , Min = 23.37 , Max = 36701.00 , Q_{1} = 7689.00 , Me =
9461.00 , Q_{3} = 15535.50
\]
1. Histogram Luas Lahan (Ha)
Berdasarkan histogram di atas, dapat kita ketahui bahwa sebaran data
cenderung miring ke kanan sehingga nilai mean > median >
modus.
2. Histogram Tinggi Tempat (m)
Berdasarkan histogram di atas, dapat kita ketahui bahwa sebaran data
cenderung miring ke kanan sehingga nilai mean > median >
modus.
3. Histogram Produksi Padi (ton)
Berdasarkan histogram di atas, dapat kita ketahui bahwa sebaran data
cenderung miring ke kanan sehingga nilai mean > median >
modus.
1. Plot Luas Lahan terhadap Produksi Padi
Berdasarkan scatter plot yang membentuk pola menyerupai garis lurus dari
kiri bawah ke arah kanan atas, maka dapat kita simpulkan bahwa variabel
luas lahan memiliki hubungan linier yang positif. Ini berarti apabila
terjadi peningkatan luas lahan maka produksi padi juga akan
meningkat.
2. Plot Tinggi Tempat terhadap Produksi Padi
Berdasarkan scatter plot yang membentuk pola dari kiri atas menuju ke
arah kanan bawah, maka dapat kita simpulkan bahwa variabel luas lahan
memiliki hubungan linier yang negatif. Ini berarti apabila terjadi
peningkatan pada tinggi tempat maka produksi padi akan mengalami
penurunan.
Hipotesis:
\(H_{0}\) : = 0 (Tidak ada hubungan
antara luas lahan dan tinggi tempat terhadap produksi padi)
\(H_{1}\) : ≠ 0 (Ada hubungan antara
luas lahan dan tinggi tempat terhadap produksi padi)
Dari analisis yang sudah dilakukan dengan fungsi lm(), dapat kita lihat nilai F hitung yang didapat sebesar 58.63 dan P Value sebesar 4.32e-08.
Keputusan: \(F_{hit}\) (58.63) > \(F_{0.05,2,16}\) (3,634) maka tolak \(H_{0}\)
Kesimpulan: Dengan taraf nyata 5% dapat disimpulkan bahwa terdapat hubungan antara luas lahan dan tinggi tempat terhadap produksi padi.
Kemudian dari analisis diatas, kita mendapatkan nilai koefisien \(a\) = -2716.2235, \(b_{1}\) = 12.9713 dan \(b_{2}\) = -0.7896. Sehingga dapat kita bentuk model regresinya yaitu:
\[
Y = -2716.2235 + 12.9713 X_{1} -0.7896 X_{2}
\] Persamaan tersebut dapat menjelaskan bahwa:
1. Nilai konstanta negatif (-2716.2235) dapat diartikan bahwa rata-rata
kontribusi variabel lain diluar model memberikan dampak negatif terhadap
Produksi Padi.
2. Konstanta sebesar -2716,224 menyatakan jika variabel Luas Lahan,
variabel Tinggi tempat bernilai nol maka besar variabel Produksi Padi
adalah -2716,224.
3. Luas Lahan (\(X_{1}\)) = 12,971
artinya untuk setiap Luas Lahan (\(X_{1}\)) naik satu satuan, nilai variabel
Produksi Padi (\(Y\)) akan naik sebesar
12,971 dengan asumsi variabel tinggi tempat adalah nol.
4. Nilai variabel tinggi tempat (\(X_{2}\)) = -0,790 artinya untuk setiap
tinggi tempat (\(X_{2}\)) naik satu
satuan, nilai variabel Produksi Padi (\(Y\)) akan turun sebesar 0,790 dengan asumsi
variabel Luas Lahan adalah nol.
Hipotesis:
\(H_{0}\) : Variabel Produksi Padi (Y)
berdistribusi normal.
\(H_{1}\) : Variabel Produksi Padi (Y)
tidak berdistribusi normal.
Keputusan: Nilai P Value (0.05234) > \(\alpha\) (0.05) maka terima \(H_{0}\)
Kesimpulan: Dengan taraf nyata 0.05 dapat kita simpulkan bahwa variabel produksi padi berdistribusi normal.
Hipotesis:
\(H_{0}\) : Tidak terjadi
multikolinieritas antara variabel independen.
\(H_{1}\) : Terjadi multikolinieritas
antara variabel independen.
Keputusan: Didapatkan nilai VIF variabel \(X_{1}\) (Luas Lahan) sebesar 1.103126 dan nilai VIF variabel \(X_{2}\) (Tinggi Tempat) sebesar 1.103126 yang mana keduanya bernilai di bawah 10 maka terima \(H_{0}\)
Kesimpulan: Dengan taraf nyata 5% dapat disimpulkan bahwa tidak terjadi multikolinieritas antara variabel independen.
Hipotesis:
\(H_{0}\) : Data variabel Produksi Padi
(Y) homogen.
\(H_{1}\) : Data variabel Produksi Padi
(Y) tidak homogen.
Keputusan: Nilai P Value (0.4755) > \(\alpha\) (0.05) maka terima \(H_{0}\)
Kesimpulan: Dengan taraf nyata 5% dapat disimpulkan bahwa data variabel Produksi Padi (Y) homogen.
Hipotesis:
\(H_{0}\) : Tidak terdapat autokorelasi
pada model regresi.
\(H_{1}\) : Terdapat autokorelasi pada
model regresi.
Keputusan: Nilai P Value (0.06512) > \(\alpha\) (0.05) maka terima \(H_{0}\)
Kesimpulan: Dengan taraf nyata 5% dapat disimpulkan bahwa tidak terdapat autokorelasi pada model regresi.
Setyowati, E & Mashuri. (2020). Analisis Pengaruh Luas Penggunaan
Lahan dan Tinggi Tempat terhadap Produksi Padi di Kabupaten Semarang
Tahun 2018. PRISMA, Prosiding Seminar Nasional Matermatika 3,
199-210.
Mahananto, Sutrisno, S. & Ananda, C.F. (2009). Faktor-Faktor yang
Mempengaruhi Produksi Padi Studi Kasus di Keacamatan Nogosari, Boyolali,
Jawa Tengah. WACANA, 12(1). 179-191.
Husnul, N.R.I dkk.(2020). Statistik Deskriptif. Tangerang Selatan. Unpam
Press.