Analisi Regresi Pengaruh Luas Penggunaan Lahan dan Tinggi Tempat terhadap Produksi Padi di Kabupaten Semarang 2018

Afifa Nur Fani

16 Mei 2022

1 PENDAHULUAN

1.1 Latar Belakang

Statistik adalah kumpulan data dalam bentuk angka dan non angka yang disusun dalam bentuk tabel (daftar) dan atau diagram yang menggambarkan atau berkaitan dengan suatu masalah tertentu (Widarto, et.al, 2019). Sedangkan Statistika adalah ilmu mengumpulkan, menata, menyajikan, menganalisis, dan menginterpretasikan data menjadi informasi untuk pengambilan keputusan yang efekif (Haryadi dan Purwanto, 2016). Merujuk pada paparan tersebut, maka fokus pembahasan dalam hal ini adalah tentang statistika penelitian. Statistika dalam penelitian berfungsi sebagai alat bantu melakukan analisis data dan informasi, terdiri dari 2 jenis statistika, yakni statistika deskriptif dan statistika inferensial (Abdullah,2015). Statistika deskriptif bertujuan memberikan paparan karakteristik data dan informasi; sedangkan statistika inferensial melakukan analisis dan menarik kesimpulan.

Pertanian dalam pengertian yang luas yaitu kegiatan manusia untuk memperoleh hasil yang berasal dari tumbuh-tumbuhan dan atau hewan yang pada mulanya dicapai dengan jalan sengaja menyempurnakan segala kemungkinan yang telah diberikan oleh alam guna mengembangbiakkan tumbuhan dan atau hewan tersebut. Pengertian Pertanian dalam arti sempit yaitu segala aspek biofisik yang berkaitan dengan usaha penyempurnaan budidaya tanaman untuk memperoleh produksi fisik yang maksimum.

Dari tahun 2013 sampai tahun 2018 produksi pertanian di Kabupaten Semarang terutama produksi padi terus mengalami peningkatan (Dalam Angka Kab. Semarang, 2019). Pada umumnya para petani memiliki keinginan untuk meningkatkan produksi pertaniannya tetapi karena banyak masalah yang dihadapinya sehingga sulit untuk mencapai apa yang diinginkannya. Hasil produksi padi dapat di pengaruhi oleh berbagai hal yang sangat penting antara lain luas lahan pertanian dan tinggi tempat. Masalah sempitnya lahan dan tinggi tempat usaha tani umumnya melanda kalangan petani yang menjadi penyebab semakin menjalarnya kemiskinan pada golongan karena sangat berpengaruh terhadap produksi pertanian terutama berpengaruh terhadap hasil produksi padi. Wilayah Kabupaten Semarang seluas 95.020,67 ha terdiri dari 23.745,30 ha lahan pertanian sawah (25%), Kecamatan dengan luas lahan pertanian sawah terluas yakni di Kecamatan Suruh seluas 2.933,80 ha, sedangkan kecamatan dengan luas lahan pertanian sawah terkecil yakni di Kecamatan Getasan seluas 64,00 ha. Dari tahun 2013 sampai tahun 2018 produksi pertanian di Kabupaten Semarang terutama produksi padi terus mengalami peningkatan (Kabupaten Semarang Dalam Angka, 2019).

Berdasarkan latar belakang diatas akan dilakukan analisis regresi dengan judul β€œAnalisis Regresi Pengaruh Luas Penggunaan Lahan dan Tinggi Tempat Terhadap Produksi Padi di Kabupaten Semarang Tahun 2018”.

1.2 Statistika Deskriptif

Statistika Deskriptif menjelaskan karakteristik data secara sistematis mencakup beberapa teknis analisis data yakni: penyebaran data, tendensi sentral , penyajian data, dan lain-lain tentang populasi atau sampel (Radjab & Jama’an,2017 ; Sarwono,2006). Contoh statistika deskriptif adalah: 1) Analisis tendensi sentral terdiri dari Mean atau Rata-rata hitung/rata-rata aritmetika; 2) Median atau nilai pengamatan yang terletak di tengah gugus data; 3) Mode atau data yang paling banyak muncul; ; 4) Ukuran penyebaran data terdiri dari: standar deviasi, varians dan lain-lain (Triola, 2004). Penyajian data ditampilkan dalam bentuk gambar atau skema dalam bentuk histogram, grafik, infografik dan lain-lain. Substansi statistika deskriptif adalah memberikan paparan rangkuman data dalam bentuk yang mudah dipahami. Tujuan utama penelitian deskriptif memberi gambaran tentang suatu keadaan berdasarkan data terkumpul, yang disampaikan dalam bentuk tabel, grafik, skema dan lain-lain (Cooper & Schindler,2014; Mishra & Alok,2017). Dari paparan tersebut bisa disimpulkan bahwa statistika deskriptif merupakan aktivitas pengolahan data secara tepat dan sistimatis dengan tujuan menghasilkan informasi jelas, ringkas dan dimudah dicerna oleh pihak yang berkepentingan.

Statistik Deskriptif adalah statistik yang digunakan untuk analisis data dengan cara menggambarkan data sampel dengan tanpa membuat kesimpulan untuk data populasi. Beberapa hal yang dapat dilakukan adalah penyajian data melalui tabel, grafik, perhitungan modus, median, mean, perhitungan penyebaran data melalui perhitungan rata-rata dan standar deviasi. Statistik Deskriptif digunakan untuk eksplorasi data.

1.3 Statistika Inferensial

Statistika Inferensial berbeda jauh dengan statistika deskriptif, karena statistika inferensial tugasnya melakukan pengolahan data, menganalisis data, sehingga bisa mengambil keputusan atau kesimpulan pada populasi (Bungin,2013; Cooper & Schindler,2014), sehingga kecendrungannya mengarah pada analisis dan pengujian teori atau hipotesis; atau dengan kata lain statistika inferensial banyak berhubungan dengan teori probabilitas, tingkat signifikansi, koefisien korelasi, dan uji hipotesis (Abdullah, 2015). Pada hakekatnya substansi statistika inferensial bertujuan memberikan kesimpulan karakteristik populasi berdasarkan hasil analisis sampel. Penggunanaan statistika inferensial banyak ditemukan dalam penelitian akademis, khususnya pada karya akademis wajib seperti skripsi, tesis, desertasi dan artikel jurnal. Kaidah teknik sampling statistika inferensial adalah teknik probabilita atau teknik acak (Sugiyono,2013).Statistika inferensial melakukan analisis probabilitas, analisis kovarians, analisis korelasi, analisis regresi, uji hipotesis dan terakhir menarik kesimpulan.

1.3.1 Analisis Korelasi

Analisis korelasi merupakan salah satu analisis yang penting dilakukan untuk mengetahui apakah tiap variabel prediktor berpengaruh signifikan terhadap variabel respon.

1.3.2 Analisis Regresi

Analisis regresi merupakan analisis statistik yang mempelajari hubungan antara dua variabel atau lebih. Sacara umum ada dua macam hubungan antara dua variabel atau lebih, yaitu bentuk hubungan dua keeratan hubungan. Untuk mengetahui bentuk hubungan digunakan analisis regresi. Analisis regresi dipergunakan untuk melihat hubungan satu arah antara variabel yang lebih khusus, dimana varabel x berfungsi sebagai variabel bebas variabel yang mempengaruhi, dan variabel y sebagai variabel terikat adalah variabel yang dipengaruhi. Biasanya variabel x juga disebut sebagai variabel independen atau variabel responden, dan variabel y sebagai dependen (Sukestiyarno, 2015).

1.3.3 Analisis Asumsi Klasik

Asumsi yang dibutuhkan dalam perhitungan analisis asumsi klasik adalah uji normalitas, uji multikolinieritas, uji autokorelasi, dan uji heterokedastisitas (Mulyono, 1990).

1.4 Data

Data yang akan saya uji analisis regresi ini berasal dari Jurnal PRISMA, Prosiding Seminar Nasional Matematika 3 yang ditulis oleh Endang Setyowati dan Mashuri. Didalam jurnal tersebut dituliskan bahwa data yang digunakan pada penelitian tersebut diambil dari Buku Kabupaten Semarang Dalam Angka 2019 yang diambil pada tanggal 25 September pada pukul 10:09 WIB. Variabel bebas (Independen) merupakan variabel yang mempengaruhi atau yang menjadi sebab perubahannya atau timbulnya variabel dependen (terikat). Variabel bebas dalam penelitian ini adalah: Variabel luas penggunaan lahan sebagai variabel X1. Variabel tinggi tempat sebagai variabel X2. Variabel terikat (Dependen) merupakan variabel yang dipengaruhi atau menjadi akibat, karena adanya variabel bebas. Variabel terikat sering disimbolkan dengan Y Sebagai variabel terikat dalam penelitian ini adalah produksi padi.

2 SOURCE CODE

2.1 Library yang Dibutuhkan

> # Library
> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")
> # install.packages("tseries")
> # install.packages("car")
> # install.packages("carData")
> # install.packages("lmtest")

2.2 Memanggil Data

> data_penelitian=read.csv(file.choose(), header=TRUE, )
> View(data_penelitian)
> str(data_penelitian)
'data.frame':   19 obs. of  5 variables:
 $ No                 : int  1 2 3 4 5 6 7 8 9 10 ...
 $ Kecamatan          : chr  "getasan" "tengaran" "susukan" "kaliwungu" ...
 $ Luas.Lahan..Ha.    : num  64 867 1942 1109 2934 ...
 $ Tinggi.Tempat..M.  : int  1450 729 497 497 660 584 480 478 572 900 ...
 $ Produksi.Padi..Ton.: num  23.4 8046 28373 15968 36701 ...
> X1=data_penelitian$Luas.Lahan..Ha.
> X1
 [1]   64.00  866.60 1941.70 1108.80 2933.80 2312.60 1460.40 1225.00  461.00
[10]  729.70  915.70 1556.00 1099.50 2041.70 1186.80 1255.00  995.70  912.54
[19]  678.76
> X2=data_penelitian$Tinggi.Tempat..M.
> X2
 [1] 1450  729  497  497  660  584  480  478  572  900  514  750  650  357  357
[16]  400  400  318  318
> Y=data_penelitian$Produksi.Padi..Ton.
> Y
 [1]    23.37  8046.00 28373.00 15968.00 36701.00 26288.00 15103.00 13562.00
 [9]  4261.00  3127.00  8302.00  7264.00 10780.00 23700.00  9461.00 12420.00
[17]  8130.00  8943.00  7332.00
  • data_penelitian=read.csv(file.choose(), header=TRUE, )
    data_penelitian artinya nama dari data yang dimasukkan.
    read.csv berarti file yang akan dibuka berformat csv. File tersebut yaitu file Data.csv.
    file.choose() berarti file yang akan dibuka ditentukan dengan cara memilih.
    header = TRUE berarti baris pertama pada file csv tersebut akan digunakan sebagai header.
  • View(data_penelitian)
    Perintah tersebut digunakan untuk melihat data yang diinputkan.
  • str(data_penelitian)
    Perintah str(…) digunakan untuk melihat gambaran umum tipe variabel di setiap kolom beserta dimensi data dari data_penelitian.
  • X1=data_penelitian$Luas.Lahan..Ha.
    Diasumsikan bahwa data Luas Lahan dari data_penelitian disimpan pada vektor X1.
    X1
    Untuk menampilkan vektor X1.
  • X2=data_penelitian$Tinggi.Tempat..M.
    Diasumsikan bahwa data Tinggi Tempat dari data_penelitian disimpan pada vektor X2.
    X2
    Untuk menampilkan vektor X2.
  • Y=data_penelitian$Produksi.Padi..Ton.
    Diasumsikan bahwa data Produksi Padi dari data_penelitian disimpan pada vektor Y.
    Y
    Untuk menampilkan vektor Y.

2.3 Membentuk data frame yang berisi vektor X1, X2, dan Y

> data<-data.frame(X1, X2, Y)
> data
        X1   X2        Y
1    64.00 1450    23.37
2   866.60  729  8046.00
3  1941.70  497 28373.00
4  1108.80  497 15968.00
5  2933.80  660 36701.00
6  2312.60  584 26288.00
7  1460.40  480 15103.00
8  1225.00  478 13562.00
9   461.00  572  4261.00
10  729.70  900  3127.00
11  915.70  514  8302.00
12 1556.00  750  7264.00
13 1099.50  650 10780.00
14 2041.70  357 23700.00
15 1186.80  357  9461.00
16 1255.00  400 12420.00
17  995.70  400  8130.00
18  912.54  318  8943.00
19  678.76  318  7332.00
  • Membentuk dataframe yang berisi vektor X1, X2, dan Y yang saya beri nama data dengan mengunakan perintah data<-data.frame(X1, X2, Y).
> library(rmarkdown)
> paged_table(as.data.frame(data))
  • Function β€˜paged.table’ digunakan untuk membuat tabel dalam HTML dengan dukungan untuk baris dan kolom paging. Dipanggil dari data frame bernama data.

2.4 Statistika Deskriptif

2.4.1 Analisis Deskriptif Menggunakan Nilai Statistik

> 
> var(X1)
[1] 462117.7
> sd(X1)
[1] 679.7924
> quantile(X1,0.25)
   25% 
889.57 
> median(X1)
[1] 1108.8
> quantile(X1,0.75)
   75% 
1508.2 
> min(X1)
[1] 64
> max(X1)
[1] 2933.8
> mean(X1)
[1] 1249.753
> 
> var(X2)
[1] 70068.87
> sd(X2)
[1] 264.7053
> quantile(X2,0.25)
25% 
400 
> median(X2)
[1] 497
> quantile(X2,0.75)
75% 
655 
> min(X2)
[1] 318
> max(X2)
[1] 1450
> mean(X2)
[1] 574.2632
> 
> var(Y)
[1] 89693803
> sd(Y)
[1] 9470.681
> quantile(Y,0.25)
 25% 
7689 
> median(Y)
[1] 9461
> quantile(Y,0.75)
    75% 
15535.5 
> min(Y)
[1] 23.37
> max(Y)
[1] 36701
> mean(Y)
[1] 13041.28
  • X1 = Luas Lahan(Ha)
  • X2 = Tinggi Tempat(M)
  • Y = Produksi Padi(Ton)
  1. Ragam, menggunakan var()
  2. Simpangan baku, akar dari ragam, atau menggunakan sd()
  3. Quartil 1 menggunakan quantile(…, 0.25)
  4. Median menggunakan median()
  5. Quartil 3 menggunakan quantile(…, 0.75)
  6. Nilai minimum menggunakan min()
  7. Nilai maksimum menggunakan max()
  8. Rata-rata menggunakan mean()
> summary(data)
       X1               X2               Y           
 Min.   :  64.0   Min.   : 318.0   Min.   :   23.37  
 1st Qu.: 889.6   1st Qu.: 400.0   1st Qu.: 7689.00  
 Median :1108.8   Median : 497.0   Median : 9461.00  
 Mean   :1249.8   Mean   : 574.3   Mean   :13041.28  
 3rd Qu.:1508.2   3rd Qu.: 655.0   3rd Qu.:15535.50  
 Max.   :2933.8   Max.   :1450.0   Max.   :36701.00  

Function summary akan menampilkan kesimpulan pada variabel masing-masing. Untuk variabel bertipe character akan menampilkan panjang datanya. Variabel bertipe factor akan menampilkan jumlah data pada masing-masing kelas. Sedangkan untuk variabel bertipe numerik akan memunculkan nilai minimum, Q1,Q2 (median), Q3, mean, dan maximum.

2.4.2 Analisis Deskriptif Menggunakan Visualisasi

> h1<-hist(X1, breaks=10,xlab="Luas Lahan(Ha)", ylab="Frequency", main="Histogram Luas Lahan(Ha) of Data", col="chartreuse4")

1. Diilustrasikan pada data, untuk variabel X1 (Luas Lahan (Ha)).
2. Digunakan perintah h1<-hist(X1, ….).
3. Dibutuhkan informasi mengenai berapa kelas interval yang digunakan: breaks (mis: 10 interval), maka menggunakan (breaks=10).
4. Dapat disajikan judul histogram, menggunakan main (β€œHistogram Luas Lahan(Ha) of Data”).
5. Informasi pada sumbu mendatar, menggunakan xlab (β€œLuas Lahan(Ha)”).
6. Informasi pada sumbu tegak, menggunakan ylab (β€œFrequency”).
7. Warna pada grafik dapat diatur menggunakan perintah col, maka menggunakan (col=β€œchartreuse4”).

> h2<-hist(X2, breaks=10,xlab="Tinggi Tempat(M)", ylab="Frequency", main="Histogram Tinggi Tempat(M) of Data", col="cornflowerblue")

1. Diilustrasikan pada data, untuk variabel X2 (Tinggi Tempat (M)).
2. Digunakan perintah h2<-hist(X2, ….).
3. Dibutuhkan informasi mengenai berapa kelas interval yang digunakan: breaks (mis: 10 interval), maka menggunakan (breaks=10).
4. Dapat disajikan judul histogram, menggunakan main (β€œHistogram Tinggi Tempat(M) of Data”).
5. Informasi pada sumbu mendatar, menggunakan xlab (β€œTinggi Tempat(M)”).
6. Informasi pada sumbu tegak, menggunakan ylab (β€œFrequency”).
7. Warna pada grafik dapat diatur menggunakan perintah col, maka menggunakan (col=β€œcornflowerblue”).

> h3<-hist(Y, breaks=10,xlab="Produksi Padi(Ton)", ylab="Frequency", main="Histogram Produksi Padi(Ton) of Data", col="burlywood3")

  1. Diilustrasikan pada data, untuk variabel Y (Produksi Padi (Ton)).
  2. Digunakan perintah h3<-hist(Y, ….).
  3. Dibutuhkan informasi mengenai berapa kelas interval yang digunakan: breaks (mis: 10 interval), maka menggunakan (breaks=10).
  4. Dapat disajikan judul histogram, menggunakan main (β€œHistogram Produksi Padi(Ton) of Data”).
  5. Informasi pada sumbu mendatar, menggunakan xlab (β€œProduksi Padi(Ton)”).
  6. Informasi pada sumbu tegak, menggunakan ylab (β€œFrequency”).
  7. Warna pada grafik dapat diatur menggunakan perintah col, maka menggunakan (col=β€œburlywood3”).

2.5 Statistika Inferensial

2.5.1 Analisis Korelasi

Analisis korelasi merupakan salah satu analisis yang penting dilakukan untuk mengetahui apakah tiap variabel prediktor berpengaruh signifikan terhadap variabel respon.

Analisi korelasi variabel luas penggunaan lahan(Ha) (X1) dan produksi padi (Ton) (Y) Perhitungan Statistik UJi:

> cor.test(X1,Y)

    Pearson's product-moment correlation

data:  X1 and Y
t = 11.139, df = 17, p-value = 3.118e-09
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 0.8424570 0.9761971
sample estimates:
      cor 
0.9378112 

Analisi korelasi variabel tinggi tempat(M) (X2) dan produksi padi (Ton) (Y) Perhitungan Statistik UJi:

> cor.test(X2,Y)

    Pearson's product-moment correlation

data:  X2 and Y
t = -1.3288, df = 17, p-value = 0.2015
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -0.6678987  0.1713353
sample estimates:
       cor 
-0.3067455 

2.5.2 Analisi Regresi

Setelah dilakukan analisis korelasi dan mendapatkan variabel prediktor yang berpengaruh signifikan terhadap variabel produksi padi(Ton). Selanjutnya dilakukan analisis regresi untuk mendapatkan persamaan model untuk menjelaskan keragaman produksi padi(Ton).

Sebelum melakukan analisis regresi, terdapat asumsi yang harus terpenuhi agar mendapatkan hasil estimasi yang baik. yaitu dengan dilakukan uji asumsi normalitas.
UJI NORMALITAS
Perhitungan Statistik Uji:

> shapiro.test(data$X1)

    Shapiro-Wilk normality test

data:  data$X1
W = 0.94775, p-value = 0.3616

Setelah dilakukan uji normalitas, dilanjutkan dengan analisis regresi.

> analisis_regresi<-lm(Y ~ X1, data = data)
> summary(analisis_regresi)

Call:
lm(formula = Y ~ X1, data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-9778.5  -690.2    10.7  1591.1  6291.2 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) -3287.146   1658.717  -1.982   0.0639 .  
X1             13.065      1.173  11.139 3.12e-09 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3383 on 17 degrees of freedom
Multiple R-squared:  0.8795,    Adjusted R-squared:  0.8724 
F-statistic: 124.1 on 1 and 17 DF,  p-value: 3.118e-09

2.5.3 Menggunakan fungsi lm(…) untuk melakukan analisis regresi untuk Y sebagai fungsi dari X1 dan X2.

> analisis_regresi<-lm(Y ~ X1 + X2, data = data)
> summary(analisis_regresi)

Call:
lm(formula = Y ~ X1 + X2, data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-9611.0  -786.0    73.5  1472.0  6295.2 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept) -2716.2235  2907.3484  -0.934    0.364    
X1             12.9713     1.2676  10.233 1.99e-08 ***
X2             -0.7896     3.2553  -0.243    0.811    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3481 on 16 degrees of freedom
Multiple R-squared:  0.8799,    Adjusted R-squared:  0.8649 
F-statistic: 58.63 on 2 and 16 DF,  p-value: 4.32e-08

2.5.4 Anilisis Asumsi Klasik

2.5.4.1 Uji Normalitas

> #Uji Shapiro Wilk
> sisa<-residuals(analisis_regresi)
> shapiro.test(sisa)

    Shapiro-Wilk normality test

data:  sisa
W = 0.90175, p-value = 0.05234
> plot(analisis_regresi,2)

Uji Shapiro Wilk
- Uji normalitas diterapkan pada sisaan.
- Sisaan diperoleh dengan fungsi residuals(…), dengan argumen berupa obyek lm yang sudah diperoleh sebelumnya.
- Obyek lm bernama analisis_regresi dan sisaan disimpan pada obyek sisa digunakan perintah sisa<-residuals(analisis_regresi).
- Jika menggunakan uji shapiro wilk, tidak perlu instalasi package tertentu.
- Uji dilakukan dengan perintah shapiro.test(..), dengan argument obyek sisa.

2.5.4.2 Uji Multikolinieritas

> library(car)
> vif(analisis_regresi)
      X1       X2 
1.103126 1.103126 
  • Untuk mendeteksi keberadaan multikolinieritas diperlukan instalasi package β€œcar”.
  • Menggiunakan perintah vif(…), dengan argument obyek lm yang sudah dibentuk.
  • VIF (Variance Inflation Factor).
  • Perlu digunakan pada regresi linier berganda.
  • Multikolinieritas serius jika VIF β‰₯ 10.
  • Jika tidak ada multikolinieritas VIF -> 1.

2.5.4.3 Uji Autokorelasi

> library(lmtest)
> dwtest(analisis_regresi)

    Durbin-Watson test

data:  analisis_regresi
DW = 1.4627, p-value = 0.06512
alternative hypothesis: true autocorrelation is greater than 0
  • Terpenuhi tidaknya asumsi dapat diuji menggunakan uji Durbin Watson (DW).
  • Untuk menggunakan uji Durbin Watson, diperlukan instalasi package β€œlmtest”.
  • Uji dilakukan dengan perintah dwtest(…), dengan argument obyek lm yang sudah dibentuk sebelumnya.

2.5.4.4 Uji Homokedastisitas

> library(lmtest)
> bptest(analisis_regresi)

    studentized Breusch-Pagan test

data:  analisis_regresi
BP = 1.487, df = 2, p-value = 0.4755
> plot(analisis_regresi,1) 

- Untuk menggunakan uji Breusch Pagan, diperlukan instalasi package β€œlmtest”. - Uji dilakukan dengan perintah bptest(…), dengan argument obyek lm yang sudah dibentuk sebelumnya.

3 HASIL DAN PEMBAHASAN

3.1 Statistika Deskriptif

3.1.1 Analisis Deskriptif Menggunakan Nilai Statistik

> 
> var(X1)
[1] 462117.7
> sd(X1)
[1] 679.7924
> quantile(X1,0.25)
   25% 
889.57 
> median(X1)
[1] 1108.8
> quantile(X1,0.75)
   75% 
1508.2 
> min(X1)
[1] 64
> max(X1)
[1] 2933.8
> mean(X1)
[1] 1249.753
> 
> var(X2)
[1] 70068.87
> sd(X2)
[1] 264.7053
> quantile(X2,0.25)
25% 
400 
> median(X2)
[1] 497
> quantile(X2,0.75)
75% 
655 
> min(X2)
[1] 318
> max(X2)
[1] 1450
> mean(X2)
[1] 574.2632
> 
> var(Y)
[1] 89693803
> sd(Y)
[1] 9470.681
> quantile(Y,0.25)
 25% 
7689 
> median(Y)
[1] 9461
> quantile(Y,0.75)
    75% 
15535.5 
> min(Y)
[1] 23.37
> max(Y)
[1] 36701
> mean(Y)
[1] 13041.28
  • X1 = Luas Lahan(Ha)
  • X2 = Tinggi Tempat(M)
  • Y = Produksi Padi(Ton)
> summary(data)
       X1               X2               Y           
 Min.   :  64.0   Min.   : 318.0   Min.   :   23.37  
 1st Qu.: 889.6   1st Qu.: 400.0   1st Qu.: 7689.00  
 Median :1108.8   Median : 497.0   Median : 9461.00  
 Mean   :1249.8   Mean   : 574.3   Mean   :13041.28  
 3rd Qu.:1508.2   3rd Qu.: 655.0   3rd Qu.:15535.50  
 Max.   :2933.8   Max.   :1450.0   Max.   :36701.00  

Function summary akan menampilkan kesimpulan pada variabel masing-masing. Untuk variabel bertipe character akan menampilkan panjang datanya. Variabel bertipe factor akan menampilkan jumlah data pada masing-masing kelas. Sedangkan untuk variabel bertipe numerik akan memunculkan nilai minimum, Q1,Q2 (median), Q3, mean, dan maximum.

Analisis Deskriptif Menggunakan Nilai Stastistik untuk Data Luas Penggunaan Lahan dan Tinggi Tempat terhadap Produksi Padi di Kabupaten Semarang 2018 sebagai berikut:
X1 = Luas Penggunaan Lahan(Ha)
- Nilai observasi terkecil dari data luas penggunaan lahan yaitu 64 Ha.
- Nilai yang memotong 25% dari data terendah pada data luas penggunaan lahan yaitu 889,6 Ha.
- Nilai pertengahan untuk data luas penggunaan lahan yaitu 1108,8 Ha.
- Nilai rata-rata untuk data luas penggunaan lahan yaitu 1249,8 Ha.
- Nilai yang memotong 25% dari data tertinggi pada data luas penggunaan lahan yaitu 1508,2 Ha.
- Nilai observasi terbesar dari data luas penggunaan lahan yaitu 2933,8 Ha.
X2 = Tinggi Tempat(M)
- Nilai observasi terkecil dari data tinggi tempat yaitu 318 M.
- Nilai yang memotong 25% dari data terendah pada data tinggi tempat yaitu 400 M.
- Nilai pertengahan untuk data tinggi tempat yaitu 497 M.
- Nilai rata-rata untuk data tinggi tempat yaitu 574,3 M.
- Nilai yang memotong 25% dari data tertinggi pada data tinggi tempat yaitu 655 M.
- Nilai observasi terbesar dari data tinggi tempat yaitu 1450 M.
Y = Produksi Padi(Ton)
- Nilai observasi terkecil dari data produksi padi yaitu 23,37 Ton.
- Nilai yang memotong 25% dari data terendah pada data produksi padi yaitu 7689 Ton.
- Nilai pertengahan untuk data produksi padi yaitu 9461 Ton.
- Nilai rata-rata untuk data produksi padi yaitu 13041,28 Ton.
- Nilai yang memotong 25% dari data tertinggi pada data produksi padi yaitu 15535,5 Ton.
- Nilai observasi terbesar dari data produksi padi yaitu 36701 Ton.

3.1.2 Analisis Deskriptif Menggunakan Visualisasi

> h1<-hist(X1, breaks=10,xlab="Luas Lahan(Ha)", ylab="Frequency", main="Histogram Luas Lahan(Ha) of Data", col="chartreuse4")

Histogram Luas Lahan(Ha) Histogram dari data luas penggunaan lahan(Ha) berbentuk menjulur ke kanan, dimana menunjukkan bahwa nilai mean > median > modus pada data luas penggunaan lahan(Ha) tersebut. Frekuensi terkecil untuk data luas penggunaan lahan(Ha) pada selang 2500-3000 Ha. Frekuensi tertinggi dari data luas penggunaan lahan(Ha) yaitu pada selang 500-1500 Ha.

> h2<-hist(X2, breaks=10,xlab="Tinggi Tempat(M)", ylab="Frequency", main="Histogram Tinggi Tempat(M) of Data", col="cornflowerblue")

Histogram Tinggi Tempat(M) Histogram dari data tinggi tempat (M) berbentuk menjulur ke kanan, dimana menunjukkan bahwa nilai mean > median > modus pada data tinggi tempat(M) tersebut. Dari histogram tersebut juga terlihat pada terdapat pencilan data yaitu terdapat data tinggi tempat yang lebih besar 1400 M, frekuensi tinggi tempat(M) terbanyak yaitu pada selang kurang dari sama dengan 400 M, dan untuk tinggi tempat(M) pada selang 900M-1400M tidak memiliki frekuensi atau data kosong pada selang tersebut.

> h3<-hist(Y, breaks=10,xlab="Produksi Padi(Ton)", ylab="Frequency", main="Histogram Produksi Padi(Ton) of Data", col="burlywood3")

Histogram Produksi Padi(Ton) Histogram dari data Produksi Padi(Ton) berbentuk menjulur ke kanan, dimana menunjukkan bahwa nilai mean > median > modus pada data produksi padi(Ton) tersebut. Frekuensi produksi padi(Ton) terbanyak yaitu pada selang 5000-10000 Ton, dan untuk produksi padi (Ton) pada selang 30000-35000 Ton tidak memiliki frekuensi atau data kosong pada selang tersebut. Dan juga terdapat pencilan data produksi padi(Ton) pada selang 35000-40000Ton.

3.2 Statistika Inferensial

3.2.1 Analisis Korelasi

Analisis korelasi merupakan salah satu analisis yang penting dilakukan untuk mengetahui apakah tiap variabel prediktor berpengaruh signifikan terhadap variabel respon.
Analisi korelasi variabel luas penggunaan lahan(Ha) (X1) dan produksi padi (Ton) (Y) Hipotesis:
H0: \(\rho\) = 0 (Tidak terdapat hubungan yang signifikan antara variabel luas penggunaan lahan(Ha) (X1) dengan produksi padi(Ton) (Y))
H1: \(\rho\) \(\ne\) 0 (Terdapat hubungan yang signifikan antara variabel luas penggunaan lahan(Ha) (X1) dengan produksi padi(Ton) (Y))
Taraf Signifikasi:
\(\alpha\) = 5%
Daerah Penolakan:
Tolak H0 jika:
1. thitung > t\(\alpha\),n-2 dengan t\(\alpha\),n-2 adalah nilai kritis dari tabel distribusi t dengan derajat bebas n-2.
2. Nilai |r| > 0,5.

Perhitungan Statistik UJi:

> cor.test(X1,Y)

    Pearson's product-moment correlation

data:  X1 and Y
t = 11.139, df = 17, p-value = 3.118e-09
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 0.8424570 0.9761971
sample estimates:
      cor 
0.9378112 

Keputusan:
Tolak H0 karena nilai r |0,9378112| > 0,5.
Kesimpulan:
Variabel luas penggunaan lahan (Ha) (X1) memiliki hubungan yang signifikan terhadap produksi padi(Ton) (Y).

Analisi korelasi variabel tinggi tempat(M) (X2) dan produksi padi (Ton) (Y)
Hipotesis:
H0: \(\rho\) = 0 (Tidak terdapat hubungan yang signifikan antara variabel luas penggunaan lahan(Ha) (X1) dengan produksi padi(Ton) (Y))
H1: \(\rho\) \(\ne\) 0 (Terdapat hubungan yang signifikan antara variabel luas penggunaan lahan(Ha) (X1) dengan produksi padi(Ton) (Y))
Taraf Signifikasi:
\(\alpha\) = 5%
Daerah Penolakan:
Tolak H0 jika:
1. thitung > t\(\alpha\),n-2 dengan t\(\alpha\),n-2 adalah nilai kritis dari tabel distribusi t dengan derajat bebas n-2.
2. Nilai |r| > 0,5.
Perhitungan Statistik UJi:

> cor.test(X2,Y)

    Pearson's product-moment correlation

data:  X2 and Y
t = -1.3288, df = 17, p-value = 0.2015
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -0.6678987  0.1713353
sample estimates:
       cor 
-0.3067455 

Keputusan:
Gagal tolak H0 karena nilai r |-0,3067455| < 0,5.
Kesimpulan:
Variabel tinggi tempat(M) (X2) tidak memiliki hubungan yang signifikan terhadap produksi padi(Ton) (Y).

Sehingga untuk analisis selanjutnya, variabel tinggi tempat(M) tidak dimasukkan dalam analisis regresi sederhana karena tidak memiliki pengaruh yang signifikan terhadap produksi padi(Ton).

3.2.2 Analisis Regresi

Setelah dilakukan analisis korelasi dan mendapatkan variabel prediktor yang berpengaruh signifikan terhadap variabel produksi padi(Ton). Selanjutnya dilakukan analisis regresi untuk mendapatkan persamaan model untuk menjelaskan keragaman produksi padi(Ton).

Sebelum melakukan analisis regresi, terdapat asumsi yang harus terpenuhi agar mendapatkan hasil estimasi yang baik. yaitu dengan dilakukan uji asumsi normalitas.
UJI NORMALITAS
Hipotesis:
H0 = Variabel luas penggunaan lahan(Ha) berdistribusi normal.
H1 = Variabel luas penggunaan lahan(Ha) tidak berdistribusi normal.
Taraf Signifikansi:
\(\alpha\) = 5%
Daerah Penolakan:
Tolak H0 jika p-value \(\le\) \(\alpha\)

Perhitungan Statistik Uji:

> shapiro.test(data$X1)

    Shapiro-Wilk normality test

data:  data$X1
W = 0.94775, p-value = 0.3616

Keputusan:
Gagal tolak H0 karena p-value (0,3616) > \(\alpha\) (0,05).
Kesimpulan:
Variabel luar penggunaan lahan(Ha) berdistribusi normal.

Setelah dilakukan uji normalitas, dilanjutkan dengan analisis regresi.
Analisis Regresi linear sederhana itu sendiri memiliki model sebagai berikut:
f(x) = a + bx
dimana:
f(x) = variabel respon
a = konstanta
b = koefisien variabel X
x = variabel prediktor

> analisis_regresi<-lm(Y ~ X1, data = data)
> summary(analisis_regresi)

Call:
lm(formula = Y ~ X1, data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-9778.5  -690.2    10.7  1591.1  6291.2 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) -3287.146   1658.717  -1.982   0.0639 .  
X1             13.065      1.173  11.139 3.12e-09 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3383 on 17 degrees of freedom
Multiple R-squared:  0.8795,    Adjusted R-squared:  0.8724 
F-statistic: 124.1 on 1 and 17 DF,  p-value: 3.118e-09

Diperoleh persamaan model sebagai berikut:
f(x) = -3287,146 + 13,065 X
dengan besar R2 = 0,8795 yang artinya keragaman variabel produksi padi (Ton) yang dapat dijelaskan oleh variabel luas penggunaan lahan(Ha) sebesar 87,95%, sedangkan untuk 12,05% sisanya dijelaskan oleh variabel lain diluar model.

3.2.3 Menggunakan fungsi lm(…) untuk melakukan analisis regresi untuk Y sebagai fungsi dari X1 dan X2.

> analisis_regresi<-lm(Y ~ X1 + X2, data = data)
> summary(analisis_regresi)

Call:
lm(formula = Y ~ X1 + X2, data = data)

Residuals:
    Min      1Q  Median      3Q     Max 
-9611.0  -786.0    73.5  1472.0  6295.2 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept) -2716.2235  2907.3484  -0.934    0.364    
X1             12.9713     1.2676  10.233 1.99e-08 ***
X2             -0.7896     3.2553  -0.243    0.811    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3481 on 16 degrees of freedom
Multiple R-squared:  0.8799,    Adjusted R-squared:  0.8649 
F-statistic: 58.63 on 2 and 16 DF,  p-value: 4.32e-08

Diperoleh persamaan model sebagai berikut:
Y = a + b1 X1 + b2 X2
π‘Œ = βˆ’2716,2235 + 12,9713𝑋1 – 0,7896𝑋2 Dimana:
a. Konstanta = – 2716,2235 artinya apabila variabel Luas Lahan dan tinggi tempat adalah nol, maka variabel Produksi Padi bernilai sebesar – 2716,2235.
b. Luas Lahan (X1) = 12,9713 yang artinya untuk setiap Luas Lahan naik satu satuan, nilai variabel.
Produksi Padi akan naik sebesar 12,9713 dengan asumsi bahwa variabel tinggi tempat adalah nol.
c.Β Tinggi tempat (X2) = -0,7896 yang artinya untuk setiap tinggi tempat naik satu satuan, nilai variabel Produksi Padi akan turun sebesar 0,7896 dengan asumsi bahwa variabel Luas Lahan adalah nol.
Nilai R2 sebesar 0,8799. Artinya kedua variabel tersebut secara bersama-sama mempengaruhi variabel Y yaitu sebesar 87,99%, sedangkan sisanya sebesar 12,01 % dipengaruhi oleh variabel lain diluar model.

3.2.4 Anilisis Asumsi Klasik

3.2.4.1 Uji Normalitas

Pengujian normalitas adalah pengujian tentang kenormalan distribusi data. Uji ini merupakan pengujian yang paling banyak dilakukan untuk analisis statistik parametrik. Maksud data berdistribusi secara normal adalah bahwa data akan mengikuti bentuk distribusi normal (Santosa & Ashari, 2005).
Kriteria pengujian:
1. P-value uji shapiro wilk > 0,05 menunjukkan data berdistribusi normal.
2. P-value uji shapiro wilk < 0,05 menunjukkan data tidak berdistribusi normal.

Menentukan Hipotesis
H0 = Pengamatan berdistribusi normal.
H1 = Pengamatan berdistribusi tidak normal.

> #Uji Shapiro Wilk
> sisa<-residuals(analisis_regresi)
> shapiro.test(sisa)

    Shapiro-Wilk normality test

data:  sisa
W = 0.90175, p-value = 0.05234
> plot(analisis_regresi,2)

Interpretasi:
Nilai p-value(0,05234) > 0,05 maka terima H0. Jadi dapat disimpulkan bahwa tidak terbukti ada pelanggaran asumsi normalitas galat.

3.2.4.2 Uji Multikolinieritas

Uji multikolinieritas bertujuan untuk mengetahui apakah ada hubungan diantara variabel bebas memiliki masalah multikolinearitas atau tidak.
Kriteria pengujian:
1. Jika nilai VIF < 10 maka tidak terjadi gejala multikolinearitas diantara variabel bebas.
2. Jika nilai VIF > 10 maka terjadi gejala multikolinearitas diantara variabel bebas.

Menentukan Hipotesis H0 = Tidak terjadi multikolinieritas antara variabel independen.
H1 = Terjadi multikolinieritas antara variabel independen.

> library(car)
> vif(analisis_regresi)
      X1       X2 
1.103126 1.103126 

Interpretasi: Diperoleh nilai VIF(Variance Inflation Factor) untuk variabel Luas Lahan (X1) adalah 1,103126 sedangkan untuk variabel tinggi tempat (X2) juga 1,103126 yang mana kedua variabel tersebut memiliki nilai kurang dari 10. Maka dapat disimpulkan bahwa H0 diterima yang artinya tidak terjadi proses multikolinearitas diantara variabel-variabel Independen.

3.2.4.3 Uji Autokorelasi

Uji Autokorelasi adalah suatu korelasi antara nilai variabel dengan niai variabel yang sama pada lag satu atau lebih sebelumnya (Suharjo, 2008). Uji autokorelasi dapat dilakukan dengan uji Durbin-Watson, uji Langrage Multiplier (LM), uji statistik Q, dan uji Run Test.
Kriteria pengujian dengan uji Run Test:
1. Jika nilai p-value lebih kecil < dari 0,05 maka terdapat gejala autokorelasi.
2. Jika nilai p-value lebih besar > dari 0,05 maka tidak terdapat gejala autokorelasi.

Menentukan Hipotesis
H0 = Tidak ada masalah autokorelasi.
H1 = Terdapat masalah autokorelasi.

> library(lmtest)
> dwtest(analisis_regresi)

    Durbin-Watson test

data:  analisis_regresi
DW = 1.4627, p-value = 0.06512
alternative hypothesis: true autocorrelation is greater than 0

Interpretasi:
Nilai p-value(0,06512) > 0,05 maka terima H0. Jadi dapat disimpulkan bahwa tidak terdapat masalah autokorelasi.

3.2.4.4 Uji Homokedastisitas

  • Homokedastisitas: ragam galat yang sama di setiap nilai X.
  • Pelanggaran dari asumsi ini: Heteroskedastisitas.

Menentukan Hipotesis
H0 = Tidak terjadi homokedastisitas pada variabel Independen.
H1 = Terjadi homokedastisitas pada variabel Independen.

> library(lmtest)
> bptest(analisis_regresi)

    studentized Breusch-Pagan test

data:  analisis_regresi
BP = 1.487, df = 2, p-value = 0.4755
> plot(analisis_regresi,1) 

Interpretasi: Nilai p-value (0,4755) > 0,05, maka terima Ho. Jadi dapat disimpulkan bahwa terbukti tidak terjadi homokedastisitas pada variabel Independen. Apabila terjadi pelanggaran dari asumsi ini : terjadi gejala Heteroskedastisitas. Oleh karena itu, dapat disimpulkan bahwa tidak terjadi gejala heteroskedastisitas pada variabel independen.

4 DAFTAR PUSTAKA

Setyowati, E. & Mashuri. (2020). Analisis Pengaruh Luas Penggunaan Lahan dan Tinggi Tempat Terhadap Produksi Padi di Kabupaten Semarang Tahun 2018. PRISMA, PROSIDING SEMINAR NASIONAL MATEMATIKA 3, 199-210.
Yam, J. (2020). AMBIGUITAS STATISTIKA DESKRIPTIF & STATISTIKA INFERENSIAL. PELITA: Jurnal Penelitian dan Karya Ilmiah, 117-124.
Syahrul, N. (2020, 31 Juli). Statistics using R for Data Science. Diakses pada 18 Mei 2022, dari https://rpubs.com/Nurulfad/645050.
Aprillyasari, R. Analisis Statistika Sederhana. Diakses pada 20 Mei 2022, dari https://www.rpubs.com/RiskaApril/433949.
Sartono, B. & Kholifatunnisa, A. HISTOGRAM. Diakses pada 20 Mei 2022, dari https://rpubs.com/bagusco/histogram.