Library:

> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")
> # install.packages("car")
> # install.packages("lmtest")

PENDAHULUAN

Latar Belakang

Indonesia merupakan negara yang memiliki sumber daya alam yang melimpah dan memiliki potensi untuk menjadi negara maju. Sebagai negara agraris, sektor pertanian tentu memiliki pengaruh bagi negara Indonesia, baik sebagai sumber mata pencaharian maupun penopang pembangunan. Namun sebagai negara berkembang, Indonesia masih memiliki kekurangan dalam beberapa aspeknya yang salah satunya adalah bahan makanan pokok. Bangsa Indonesia menggunakan nasi sebagai bahan makanan pokoknya dan untuk memenuhi kebutuhan karbohidrat dalam tubuh. Kebutuhan padi sebagai bahan makanan pokok selalu mengalami kenaikan tiap tahunnya. Namun tidak sejalan dengan penggunaannya yang besar, produksi padi di Negara kita masih belum menenuhi kebutuhan. Pemerintah Indonesia masih harus mengimpor beras dari luar negeri tiap tahunnya karena hasil tanam padi dalam negeri masih belum memenuhi kebutuhan. Oleh karena itu hasil produksi pertanian harus lebih diperhatikan agar mengalami peningkatan tiap tahunnya.
Dari tahun ke tahun, berdasarkan data yang ada, produksi pertanian di Kabupaten Semarang mengalami peningkatan terutama di bagian produksi Padi. Pada umumnya para petani memiliki keinginan untuk meningkatkan produksi pertaniannya tetapi karena banyak masalah yang dihadapi, sulit untuk mencapai apa yang diinginkan. Produksi padi dipengaruhi oleh beberapa faktor antara lain luas lahan garapan, jumlah tenaga kerja efektif, jumlah pupuk, jumlah pestisida, jarak lahan dengan rumah petani, dan sistem irigasi. DIlihat dari beberapa faktor tersebut, masalah sempitnya lahan, tinggi tempat usaha dan jarak lokasi lahan tani umumnya sangat berpengaruh terhadap produksi pertanian terutama dalam hasil produksi padi. Maka berdasarkan latar belakang tersebut, penulis tertarik untuk melakukan penelitian mengenai pengaruh luas penggunaan lahan dan tinggi tempat terhadap produksi padi.
Metode Analisis yang akan digunakan dalam penelitian ini adalah analisis regresi. Analisis regresi bertujuan untuk melihat bentuk hubungan antara kedua variabel atau lebih yang diteliti.

Tinjauan Pustaka

Statistika Deskriptif

Statistika Deskriptif adalah statistika yang tingkat kegunaannya mencakup cara-cara mengumpulkan data, menyusun atau mengatur data, mengolah data, menyajikan data dan menganalisis data angka. Mean, median dan modus termasuk dalam ukuran pemusatan data statistika deskriptif. Selain melihat ukuran pemusatan data, statistika deskriptif juga melihat bagaimana sebaran masing-masing data dan hubungan antara prediktor dan respon. Untuk melihat sebaran masing-masing data dapat menggunakan plot histogram sedangkan untuk melihat hubungan antara prediktor dan respon dapat menggunakan scatter plot.

Analisis Regresi

Analisis Regresi merupakan analisis statistik yang mempelajari hubungan antara dua variabel atau lebih. Secara umum ada dua macam hubungan antara dua variabel atau lebih, yaitu bentuk hubungan dua keeratan hubungan. Untuk mengetahui bentuk hubungan digunakan analisis regresi. Analisis regresi dipergunakan untuk melihat hubungan satu arah antara variabel yang lebih khusus, dimana varabel x berfungsi sebagai variabel bebas variabel yang mempengaruhi, dan variabel y sebagai variabel terikat adalah variabel yang dipengaruhi. Biasanya variabel x juga disebut sebagai variabel independen atau vaiabel responden, dan variabel y sebagai dependen (Sukestiyarno, 2015).
Persamaan Analisis Regresi yang digunakan dalam penelitian ini dapat dinyatakan sebagai berikut:

\[ \ Y = \alpha + b_{1}X_1 + b_{2}X_2 +\varepsilon \] dimana:
\(Y\) : Model regresi (subyek dalam variabel dependen yang diprediksikan)
\(\alpha\) : Harga konstan (Harga Y (Produksi Padi) ketika X = 0)
\(\beta_1X_1\) : nilai koefisien regresi variabel X1 (Luas Lahan)
\(\beta_2X_2\) : nilai koefisien regresi variabel X2 (Tinggi Tempat)
\(\varepsilon\) : Galat

Konstanta a, Koefisien \(b_{1}\) dan koefisien \(b_{2}\) dapat dihitung menggunakan rumus:

\[ a = \frac{(\sum y)-{b_{1} \sum x_{1})-(b_{2} \sum x_{2})}}{n} \] \[ b_{1}=\frac{[(\sum x_{2}^2 \sum x_{1}y)-(\sum x_{1}y \sum x_{1}x_{2})]}{[(\sum x_{1}^2 \sum x_{2}^2)-(\sum x_{1}\sum x_{2})^2]} \] \[ b_{2}=\frac{[(\sum x_{1}^2 \sum x_{2}y)-(\sum x_{1}y \sum x_{1}x_{2})]}{[(\sum x_{1}^2 \sum x_{2}^2)-(\sum x_{1}\sum x_{2})^2]} \] setelah itu bisa kita hitung nilai F dengan rumus F hitung sebagai berikut:
\[ F hit = \frac{r^2/k}{(1-r^2)/(n-k-1)} \] Keterangan: \(r^2\) = Koefisien Determinasi
n = Jumlah Data
k = Jumlah Variabel Independen

dimana \(r^2\) dapat dihitung dengan rumus:
\[ r^2 = \frac{(b_{1}\sum x_{1} y)+(b_{2}\sum x_{2} y)}{\sum y^2} \]

Dalam analisis regresi penelitian ini ada beberapa asumsi yang harus dipenuhi yakni:
1. Uji Asumsi Normalitas.
2. Uji Asumsi Multikolinearitas.
3. Uji Asumsi Homogenitas.
4. Uji Asumsi Non Autokorelasi.

Data

Data yang digunakan adalah data yang diambil dari Buku Kabupaten Semarang Dalam Angka 2019. Variabel bebas (Independen) merupakan variabel yang memengaruhi atau sebab dari timbulnya variabel terikat (dependen). Dalam penelitian ini, Variabel luas penggunaan lahan digunakan sebagai variabel \(X_{1}\) dan variabel tinggi tempat sebagai variabel \(X_{2}\). Sedangkan variabel terikat (\(Y\)) dalam penelitian ini adalah produksi padi.

SOURCE CODE

Library yang dibutuhkan:

> library(knitr)
> library(rmarkdown)
> library(prettydoc)
> library(equatiomatic)
> library(car)
> library(lmtest)

Data Penelitian

> data <- file.path("C:/Users/ASUS/Downloads/Data Penelitian.csv")
> data_penelitian <- read.csv(data,header = TRUE)
> str(data_penelitian)
'data.frame':   19 obs. of  5 variables:
 $ No           : int  1 2 3 4 5 6 7 8 9 10 ...
 $ Kecamatan    : chr  "Getasan" "Tengaran" "Susukan" "Kaliwungu" ...
 $ Luas_Lahan   : num  64 867 1942 1109 2934 ...
 $ Tinggi_Tempat: int  1450 729 497 497 660 584 480 478 572 900 ...
 $ Produksi_Padi: num  23.4 8046 28373 15968 36701 ...
> X1 <- data_penelitian$Luas_Lahan
> X2 <- data_penelitian$Tinggi_Tempat
> Y <- data_penelitian$Produksi_Padi
> X1
 [1]   64.00  866.60 1941.70 1108.80 2933.80 2312.60 1460.40 1225.00  461.00
[10]  729.70  915.70 1556.00 1099.50 2041.70 1186.80 1255.00  995.70  912.54
[19]  678.76
> X2
 [1] 1450  729  497  497  660  584  480  478  572  900  514  750  650  357  357
[16]  400  400  318  318
> Y
 [1]    23.37  8046.00 28373.00 15968.00 36701.00 26288.00 15103.00 13562.00
 [9]  4261.00  3127.00  8302.00  7264.00 10780.00 23700.00  9461.00 12420.00
[17]  8130.00  8943.00  7332.00

Statistika Deskriptif

> summary(X1)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
   64.0   889.6  1108.8  1249.8  1508.2  2933.8 
> summary(X2)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  318.0   400.0   497.0   574.3   655.0  1450.0 
> summary(Y)
    Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
   23.37  7689.00  9461.00 13041.28 15535.50 36701.00 

Histogram Data

> hist(X1, main = "Histogram Luas Lahan (Ha)")  

> hist(X2, main = "Histogram Tinggi Tempat (m)")  

> hist(Y, main = "Histogram Produksi Padi (ton)")  

Scatter Plot

> plot(X1, Y, main = "Plot Luas Lahan terhadap Produksi Padi", ylab = "Produksi Padi", xlab = "Luas Lahan")

> plot(X2, Y, main = "Plot Tinggi Tempat terhadap Produksi Padi", ylab = "Produksi Padi", xlab = "Tinggi Tempat")

Analisis Regresi

Dilakukan perhitungan manual dan digunakan perintah function lm() untuk melakukan analisis regresi.

Perhitungan Manual

> X <- c(rep(1,19),X1,X2)
> matriksX <- matrix(X,19)
> matriksX
      [,1]    [,2] [,3]
 [1,]    1   64.00 1450
 [2,]    1  866.60  729
 [3,]    1 1941.70  497
 [4,]    1 1108.80  497
 [5,]    1 2933.80  660
 [6,]    1 2312.60  584
 [7,]    1 1460.40  480
 [8,]    1 1225.00  478
 [9,]    1  461.00  572
[10,]    1  729.70  900
[11,]    1  915.70  514
[12,]    1 1556.00  750
[13,]    1 1099.50  650
[14,]    1 2041.70  357
[15,]    1 1186.80  357
[16,]    1 1255.00  400
[17,]    1  995.70  400
[18,]    1  912.54  318
[19,]    1  678.76  318
> Y <- Y
> beta_duga <- solve(t(matriksX)%*%matriksX)%*%t(matriksX)%*%Y
> beta_duga
              [,1]
[1,] -2716.2235093
[2,]    12.9713209
[3,]    -0.7895967
> Y_duga <- matriksX%*%beta_duga
> Y_duga
           [,1]
 [1,] -3030.974
 [2,]  7949.107
 [3,] 22077.761
 [4,] 11273.948
 [5,] 34817.904
 [6,] 26820.129
 [7,] 15848.087
 [8,] 12796.217
 [9,]  2811.906
[10,]  6038.312
[11,]  8755.762
[12,] 16874.954
[13,] 11032.506
[14,] 23485.436
[15,] 12396.254
[16,] 13246.946
[17,]  9883.482
[18,]  8869.534
[19,]  5837.099
> Y_bar = rep(mean(Y), 19)
> Y_bar
 [1] 13041.28 13041.28 13041.28 13041.28 13041.28 13041.28 13041.28 13041.28
 [9] 13041.28 13041.28 13041.28 13041.28 13041.28 13041.28 13041.28 13041.28
[17] 13041.28 13041.28 13041.28
> sisa <- Y-Y_duga
> sisa
             [,1]
 [1,]  3054.34425
 [2,]    96.89282
 [3,]  6295.23925
 [4,]  4694.05245
 [5,]  1883.09603
 [6,]  -532.12876
 [7,]  -745.08713
 [8,]   765.78262
 [9,]  1449.09390
[10,] -2911.31230
[11,]  -453.76233
[12,] -9610.95429
[13,]  -252.50596
[14,]   214.56361
[15,] -2935.25413
[16,]  -826.94555
[17,] -1753.48204
[18,]    73.46608
[19,]  1494.90148
> JKT = t(Y-Y_bar)%*%(Y-Y_bar)
> JKG = t(Y-Y_duga)%*%(Y-Y_duga)
> JKR = t(Y_duga-Y_bar)%*%(Y_duga-Y_bar)
> JK <- c(JKR, JKG, JKT)
> JK
[1] 1420638960  193849497 1614488456
> dbR = 2-1
> dbTotal = 19-1
> dbGalat = dbTotal-dbR
> db <- c(dbR, dbGalat, dbTotal)
> db
[1]  1 17 18
> KT = JK/db
> SU <- c("Regresi", "Galat","Total")
> anreg <- data.frame(SU, db, JK, KT)
> names(anreg)<- c("SK","db","JK","KT")
> anreg
       SK db         JK         KT
1 Regresi  1 1420638960 1420638960
2   Galat 17  193849497   11402912
3   Total 18 1614488456   89693803
> F_hitung <- anreg$KT[1]/anreg$KT[2]
> F_hitung
[1] 124.5856
> pf <- pf(F_hitung, anreg$db[1],anreg$db[2], lower.tail = FALSE)
> pf
[1] 3.021275e-09

Perhitungan dengan function lm()

> reg <- lm(formula = Y~X1+X2)
> summary(reg)

Call:
lm(formula = Y ~ X1 + X2)

Residuals:
    Min      1Q  Median      3Q     Max 
-9611.0  -786.0    73.5  1472.0  6295.2 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept) -2716.2235  2907.3484  -0.934    0.364    
X1             12.9713     1.2676  10.233 1.99e-08 ***
X2             -0.7896     3.2553  -0.243    0.811    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3481 on 16 degrees of freedom
Multiple R-squared:  0.8799,    Adjusted R-squared:  0.8649 
F-statistic: 58.63 on 2 and 16 DF,  p-value: 4.32e-08

Uji Asumsi Normalitas

Uji Asumsi Normalitas dilakukan untuk melihat apakah data variabel Y (Produksi Padi) berdistribusi normal atau tidak dengan menggunakan function shapiro.test() ataupun jarque.bera.test().

> sisa <- residuals(reg)
> shapiro.test(sisa)

    Shapiro-Wilk normality test

data:  sisa
W = 0.90175, p-value = 0.05234

Uji Asumsi Multikolinieritas

Uji Asumsi Multikolinieritas dilakukan untuk melihat apakah ada tidaknya hubungan linier antar variabel prediktor (variabel Luas Lahan dan Tinggi Tempat) pada regresi berganda. Pengujian dilakukan dengan menggunakan perintah function vif()

> vif(reg)
      X1       X2 
1.103126 1.103126 

Uji Asumsi Homogenitas

Uji Asumsi Homogenitas digunakan untuk menguji apakah data bersifat homogen atau tidak. Pengujian ini menggunakan uji Breusch Pagan, yang memiliki perintah function bptest()

> bptest(reg)

    studentized Breusch-Pagan test

data:  reg
BP = 1.487, df = 2, p-value = 0.4755

Uji Asumsi Non Autokorelasi

Uji Asumsi Non Autokorelasi adalah uji yang mengasumsikan kebebasan antar galat. Pelanggaran dari asumsi ini disebut sebagai masalah autokorelasi, akibat kesalahan spesifikasi model atau tidak digunakannya variabel prediktor yang penting. Dalam pengujiannya, digunakan perintah function dwtest() untuk mendapatkan hasilnya.

> dwtest(reg)

    Durbin-Watson test

data:  reg
DW = 1.4627, p-value = 0.06512
alternative hypothesis: true autocorrelation is greater than 0

HASIL DAN PEMBAHASAN

Statistika Deskriptif

1. Variabel Luas Lahan
Berdasarkan data yang digunakan, diperoleh nilai rata-rata luas lahan sebesar 1249.8 Ha, nilai minimum sebesar 64.0 Ha, nilai maksimum sebesar 2933.8 Ha, nilai quartil bawah sebesar 889.6 Ha, nilai median (quartil tengah) sebesar 1108.8 Ha dan nilai quatil atas 1508.2 Ha.
\[ \mu = 1249.8 , Min = 64.0 , Max = 2933.8, Q_{1} = 889.6 , Me = 1108.8 , Q_{3} = 1508.2 \] 2. Variabel Tinggi Tempat
Berdasarkan data yang digunakan, diperoleh nilai rata-rata luas lahan sebesar 574.3 m, nilai minimum sebesar 318.0 m, nilai maksimum sebesar 1450.0 m, nilai quartil bawah sebesar 400.0 m, nilai median (quartil tengah) sebesar 497.0 m dan nilai quatil atas 655.0 m.
\[ \mu = 574.3 , Min = 318.0 , Max = 1450.0, Q_{1} = 400.0 , Me = 497.0 , Q_{3} = 655.0 \] 3. Variabel Produksi Padi
Berdasarkan data yang digunakan, diperoleh nilai rata-rata luas lahan sebesar 13041.28 ton, nilai minimum sebesar 23.37 ton, nilai maksimum sebesar 36701.00 ton, nilai quartil bawah sebesar 7689.00 ton, nilai median (quartil tengah) sebesar 9461.00 ton dan nilai quatil atas 15535.50 ton.
\[ \mu = 13041.28 , Min = 23.37 , Max = 36701.00 , Q_{1} = 7689.00 , Me = 9461.00 , Q_{3} = 15535.50 \]

Histogram

1. Histogram Luas Lahan (Ha)
Berdasarkan histogram di atas, dapat kita ketahui bahwa sebaran data cenderung miring ke kanan sehingga nilai mean > median > modus.

2. Histogram Tinggi Tempat (m)
Berdasarkan histogram di atas, dapat kita ketahui bahwa sebaran data cenderung miring ke kanan sehingga nilai mean > median > modus.

3. Histogram Produksi Padi (ton)
Berdasarkan histogram di atas, dapat kita ketahui bahwa sebaran data cenderung miring ke kanan sehingga nilai mean > median > modus.

Scatter Plot

1. Plot Luas Lahan terhadap Produksi Padi
Berdasarkan scatter plot yang membentuk pola menyerupai garis lurus dari kiri bawah ke arah kanan atas, maka dapat kita simpulkan bahwa variabel luas lahan memiliki hubungan linier yang positif. Ini berarti apabila terjadi peningkatan luas lahan maka produksi padi juga akan meningkat.

2. Plot Tinggi Tempat terhadap Produksi Padi
Berdasarkan scatter plot yang membentuk pola dari kiri atas menuju ke arah kanan bawah, maka dapat kita simpulkan bahwa variabel luas lahan memiliki hubungan linier yang negatif. Ini berarti apabila terjadi peningkatan pada tinggi tempat maka produksi padi akan mengalami penurunan.

Analisis Regresi

Hipotesis:
\(H_{0}\) : = 0 (Tidak ada hubungan antara luas lahan dan tinggi tempat terhadap produksi padi)
\(H_{1}\) : ≠ 0 (Ada hubungan antara luas lahan dan tinggi tempat terhadap produksi padi)

Dari analisis yang sudah dilakukan dengan fungsi lm(), dapat kita lihat nilai F hitung yang didapat sebesar 58.63 dan P Value sebesar 4.32e-08.

Keputusan: \(F_{hit}\) (58.63) > \(F_{0.05,2,16}\) (3,634) maka tolak \(H_{0}\)

Kesimpulan: Dengan taraf nyata 5% dapat disimpulkan bahwa terdapat hubungan antara luas lahan dan tinggi tempat terhadap produksi padi.

Kemudian dari analisis diatas, kita mendapatkan nilai koefisien \(a\) = -2716.2235, \(b_{1}\) = 12.9713 dan \(b_{2}\) = -0.7896. Sehingga dapat kita bentuk model regresinya yaitu:

\[ Y = -2716.2235 + 12.9713 X_{1} -0.7896 X_{2} \] Persamaan tersebut dapat menjelaskan bahwa:
1. Nilai konstanta negatif (-2716.2235) dapat diartikan bahwa rata-rata kontribusi variabel lain diluar model memberikan dampak negatif terhadap Produksi Padi.
2. Konstanta sebesar -2716,224 menyatakan jika variabel Luas Lahan, variabel Tinggi tempat bernilai nol maka besar variabel Produksi Padi adalah -2716,224.
3. Luas Lahan (\(X_{1}\)) = 12,971 artinya untuk setiap Luas Lahan (\(X_{1}\)) naik satu satuan, nilai variabel Produksi Padi (\(Y\)) akan naik sebesar 12,971 dengan asumsi variabel tinggi tempat adalah nol.
4. Nilai variabel tinggi tempat (\(X_{2}\)) = -0,790 artinya untuk setiap tinggi tempat (\(X_{2}\)) naik satu satuan, nilai variabel Produksi Padi (\(Y\)) akan turun sebesar 0,790 dengan asumsi variabel Luas Lahan adalah nol.

Uji Asumsi Normalitas

Hipotesis:
\(H_{0}\) : Variabel Produksi Padi (Y) berdistribusi normal.
\(H_{1}\) : Variabel Produksi Padi (Y) tidak berdistribusi normal.

Keputusan: Nilai P Value (0.05234) > \(\alpha\) (0.05) maka terima \(H_{0}\)

Kesimpulan: Dengan taraf nyata 0.05 dapat kita simpulkan bahwa variabel produksi padi berdistribusi normal.

Uji Asumsi Multikolinieritas

Hipotesis:
\(H_{0}\) : Tidak terjadi multikolinieritas antara variabel independen.
\(H_{1}\) : Terjadi multikolinieritas antara variabel independen.

Keputusan: Didapatkan nilai VIF variabel \(X_{1}\) (Luas Lahan) sebesar 1.103126 dan nilai VIF variabel \(X_{2}\) (Tinggi Tempat) sebesar 1.103126 yang mana keduanya bernilai di bawah 10 maka terima \(H_{0}\)

Kesimpulan: Dengan taraf nyata 5% dapat disimpulkan bahwa tidak terjadi multikolinieritas antara variabel independen.

Uji Asumsi Homogenitas

Hipotesis:
\(H_{0}\) : Data variabel Produksi Padi (Y) homogen.
\(H_{1}\) : Data variabel Produksi Padi (Y) tidak homogen.

Keputusan: Nilai P Value (0.4755) > \(\alpha\) (0.05) maka terima \(H_{0}\)

Kesimpulan: Dengan taraf nyata 5% dapat disimpulkan bahwa data variabel Produksi Padi (Y) homogen.

Uji Asumsi Non Autokorelasi

Hipotesis:
\(H_{0}\) : Tidak terdapat autokorelasi pada model regresi.
\(H_{1}\) : Terdapat autokorelasi pada model regresi.

Keputusan: Nilai P Value (0.06512) > \(\alpha\) (0.05) maka terima \(H_{0}\)

Kesimpulan: Dengan taraf nyata 5% dapat disimpulkan bahwa tidak terdapat autokorelasi pada model regresi.

DAFTAR PUSTAKA

Setyowati, E & Mashuri. (2020). Analisis Pengaruh Luas Penggunaan Lahan dan Tinggi Tempat terhadap Produksi Padi di Kabupaten Semarang Tahun 2018. PRISMA, Prosiding Seminar Nasional Matermatika 3, 199-210.
Mahananto, Sutrisno, S. & Ananda, C.F. (2009). Faktor-Faktor yang Mempengaruhi Produksi Padi Studi Kasus di Keacamatan Nogosari, Boyolali, Jawa Tengah. WACANA, 12(1). 179-191.
Husnul, N.R.I dkk.(2020). Statistik Deskriptif. Tangerang Selatan. Unpam Press.