1 PENDAHULUAN
1.1 Latar Belakang
Statistik adalah kumpulan data dalam bentuk angka dan non angka yang disusun dalam bentuk tabel (daftar) dan atau diagram yang menggambarkan atau berkaitan dengan suatu masalah tertentu (Widarto, et.al, 2019). Sedangkan Statistika adalah ilmu mengumpulkan, menata, menyajikan, menganalisis, dan menginterpretasikan data menjadi informasi untuk pengambilan keputusan yang efekif (Haryadi dan Purwanto, 2016). Merujuk pada paparan tersebut, maka fokus pembahasan dalam hal ini adalah tentang statistika penelitian. Statistika dalam penelitian berfungsi sebagai alat bantu melakukan analisis data dan informasi, terdiri dari 2 jenis statistika, yakni statistika deskriptif dan statistika inferensial (Abdullah,2015). Statistika deskriptif bertujuan memberikan paparan karakteristik data dan informasi; sedangkan statistika inferensial melakukan analisis dan menarik kesimpulan.
Pertanian dalam pengertian yang luas yaitu kegiatan manusia untuk memperoleh hasil yang berasal dari tumbuh-tumbuhan dan atau hewan yang pada mulanya dicapai dengan jalan sengaja menyempurnakan segala kemungkinan yang telah diberikan oleh alam guna mengembangbiakkan tumbuhan dan atau hewan tersebut. Pengertian Pertanian dalam arti sempit yaitu segala aspek biofisik yang berkaitan dengan usaha penyempurnaan budidaya tanaman untuk memperoleh produksi fisik yang maksimum.
Dari tahun 2013 sampai tahun 2018 produksi pertanian di Kabupaten Semarang terutama produksi padi terus mengalami peningkatan (Dalam Angka Kab. Semarang, 2019). Pada umumnya para petani memiliki keinginan untuk meningkatkan produksi pertaniannya tetapi karena banyak masalah yang dihadapinya sehingga sulit untuk mencapai apa yang diinginkannya. Hasil produksi padi dapat di pengaruhi oleh berbagai hal yang sangat penting antara lain luas lahan pertanian dan tinggi tempat. Masalah sempitnya lahan dan tinggi tempat usaha tani umumnya melanda kalangan petani yang menjadi penyebab semakin menjalarnya kemiskinan pada golongan karena sangat berpengaruh terhadap produksi pertanian terutama berpengaruh terhadap hasil produksi padi. Wilayah Kabupaten Semarang seluas 95.020,67 ha terdiri dari 23.745,30 ha lahan pertanian sawah (25%), Kecamatan dengan luas lahan pertanian sawah terluas yakni di Kecamatan Suruh seluas 2.933,80 ha, sedangkan kecamatan dengan luas lahan pertanian sawah terkecil yakni di Kecamatan Getasan seluas 64,00 ha. Dari tahun 2013 sampai tahun 2018 produksi pertanian di Kabupaten Semarang terutama produksi padi terus mengalami peningkatan (Kabupaten Semarang Dalam Angka, 2019).
Berdasarkan latar belakang diatas akan dilakukan analisis regresi dengan judul βAnalisis Regresi Pengaruh Luas Penggunaan Lahan dan Tinggi Tempat Terhadap Produksi Padi di Kabupaten Semarang Tahun 2018β.
1.2 Statistika Deskriptif
Statistika Deskriptif menjelaskan karakteristik data secara sistematis mencakup beberapa teknis analisis data yakni: penyebaran data, tendensi sentral , penyajian data, dan lain-lain tentang populasi atau sampel (Radjab & Jamaβan,2017 ; Sarwono,2006). Contoh statistika deskriptif adalah: 1) Analisis tendensi sentral terdiri dari Mean atau Rata-rata hitung/rata-rata aritmetika; 2) Median atau nilai pengamatan yang terletak di tengah gugus data; 3) Mode atau data yang paling banyak muncul; ; 4) Ukuran penyebaran data terdiri dari: standar deviasi, varians dan lain-lain (Triola, 2004). Penyajian data ditampilkan dalam bentuk gambar atau skema dalam bentuk histogram, grafik, infografik dan lain-lain. Substansi statistika deskriptif adalah memberikan paparan rangkuman data dalam bentuk yang mudah dipahami. Tujuan utama penelitian deskriptif memberi gambaran tentang suatu keadaan berdasarkan data terkumpul, yang disampaikan dalam bentuk tabel, grafik, skema dan lain-lain (Cooper & Schindler,2014; Mishra & Alok,2017). Dari paparan tersebut bisa disimpulkan bahwa statistika deskriptif merupakan aktivitas pengolahan data secara tepat dan sistimatis dengan tujuan menghasilkan informasi jelas, ringkas dan dimudah dicerna oleh pihak yang berkepentingan.
Statistik Deskriptif adalah statistik yang digunakan untuk analisis data dengan cara menggambarkan data sampel dengan tanpa membuat kesimpulan untuk data populasi. Beberapa hal yang dapat dilakukan adalah penyajian data melalui tabel, grafik, perhitungan modus, median, mean, perhitungan penyebaran data melalui perhitungan rata-rata dan standar deviasi. Statistik Deskriptif digunakan untuk eksplorasi data.
1.3 Statistika Inferensial
Statistika Inferensial berbeda jauh dengan statistika deskriptif, karena statistika inferensial tugasnya melakukan pengolahan data, menganalisis data, sehingga bisa mengambil keputusan atau kesimpulan pada populasi (Bungin,2013; Cooper & Schindler,2014), sehingga kecendrungannya mengarah pada analisis dan pengujian teori atau hipotesis; atau dengan kata lain statistika inferensial banyak berhubungan dengan teori probabilitas, tingkat signifikansi, koefisien korelasi, dan uji hipotesis (Abdullah, 2015). Pada hakekatnya substansi statistika inferensial bertujuan memberikan kesimpulan karakteristik populasi berdasarkan hasil analisis sampel. Penggunanaan statistika inferensial banyak ditemukan dalam penelitian akademis, khususnya pada karya akademis wajib seperti skripsi, tesis, desertasi dan artikel jurnal. Kaidah teknik sampling statistika inferensial adalah teknik probabilita atau teknik acak (Sugiyono,2013).Statistika inferensial melakukan analisis probabilitas, analisis kovarians, analisis korelasi, analisis regresi, uji hipotesis dan terakhir menarik kesimpulan.
1.3.1 Analisis Korelasi
Analisis korelasi merupakan salah satu analisis yang penting dilakukan untuk mengetahui apakah tiap variabel prediktor berpengaruh signifikan terhadap variabel respon.
1.3.2 Analisis Regresi
Analisis regresi merupakan analisis statistik yang mempelajari hubungan antara dua variabel atau lebih. Sacara umum ada dua macam hubungan antara dua variabel atau lebih, yaitu bentuk hubungan dua keeratan hubungan. Untuk mengetahui bentuk hubungan digunakan analisis regresi. Analisis regresi dipergunakan untuk melihat hubungan satu arah antara variabel yang lebih khusus, dimana varabel x berfungsi sebagai variabel bebas variabel yang mempengaruhi, dan variabel y sebagai variabel terikat adalah variabel yang dipengaruhi. Biasanya variabel x juga disebut sebagai variabel independen atau variabel responden, dan variabel y sebagai dependen (Sukestiyarno, 2015).
1.3.3 Analisis Asumsi Klasik
Asumsi yang dibutuhkan dalam perhitungan analisis asumsi klasik adalah uji normalitas, uji multikolinieritas, uji autokorelasi, dan uji heterokedastisitas (Mulyono, 1990).
1.4 Data
Data yang akan saya uji analisis regresi ini berasal dari Jurnal PRISMA, Prosiding Seminar Nasional Matematika 3 yang ditulis oleh Endang Setyowati dan Mashuri. Didalam jurnal tersebut dituliskan bahwa data yang digunakan pada penelitian tersebut diambil dari Buku Kabupaten Semarang Dalam Angka 2019 yang diambil pada tanggal 25 September pada pukul 10:09 WIB. Variabel bebas (Independen) merupakan variabel yang mempengaruhi atau yang menjadi sebab perubahannya atau timbulnya variabel dependen (terikat). Variabel bebas dalam penelitian ini adalah: Variabel luas penggunaan lahan sebagai variabel X1. Variabel tinggi tempat sebagai variabel X2. Variabel terikat (Dependen) merupakan variabel yang dipengaruhi atau menjadi akibat, karena adanya variabel bebas. Variabel terikat sering disimbolkan dengan Y Sebagai variabel terikat dalam penelitian ini adalah produksi padi.
2 SOURCE CODE
2.1 Library yang Dibutuhkan
> # Library
> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")
> # install.packages("tseries")
> # install.packages("car")
> # install.packages("carData")
> # install.packages("lmtest")2.2 Memanggil Data
> data_penelitian=read.csv(file.choose(), header=TRUE, )
> View(data_penelitian)
> str(data_penelitian)
'data.frame': 19 obs. of 5 variables:
$ No : int 1 2 3 4 5 6 7 8 9 10 ...
$ Kecamatan : chr "getasan" "tengaran" "susukan" "kaliwungu" ...
$ Luas.Lahan..Ha. : num 64 867 1942 1109 2934 ...
$ Tinggi.Tempat..M. : int 1450 729 497 497 660 584 480 478 572 900 ...
$ Produksi.Padi..Ton.: num 23.4 8046 28373 15968 36701 ...
> X1=data_penelitian$Luas.Lahan..Ha.
> X1
[1] 64.00 866.60 1941.70 1108.80 2933.80 2312.60 1460.40 1225.00 461.00
[10] 729.70 915.70 1556.00 1099.50 2041.70 1186.80 1255.00 995.70 912.54
[19] 678.76
> X2=data_penelitian$Tinggi.Tempat..M.
> X2
[1] 1450 729 497 497 660 584 480 478 572 900 514 750 650 357 357
[16] 400 400 318 318
> Y=data_penelitian$Produksi.Padi..Ton.
> Y
[1] 23.37 8046.00 28373.00 15968.00 36701.00 26288.00 15103.00 13562.00
[9] 4261.00 3127.00 8302.00 7264.00 10780.00 23700.00 9461.00 12420.00
[17] 8130.00 8943.00 7332.00- data_penelitian=read.csv(file.choose(), header=TRUE,
)
data_penelitian artinya nama dari data yang dimasukkan.
read.csv berarti file yang akan dibuka berformat csv. File tersebut yaitu file Data.csv.
file.choose() berarti file yang akan dibuka ditentukan dengan cara memilih.
header = TRUE berarti baris pertama pada file csv tersebut akan digunakan sebagai header.
- View(data_penelitian)
Perintah tersebut digunakan untuk melihat data yang diinputkan.
- str(data_penelitian)
Perintah str(β¦) digunakan untuk melihat gambaran umum tipe variabel di setiap kolom beserta dimensi data dari data_penelitian.
- X1=data_penelitian$Luas.Lahan..Ha.
Diasumsikan bahwa data Luas Lahan dari data_penelitian disimpan pada vektor X1.
X1
Untuk menampilkan vektor X1.
- X2=data_penelitian$Tinggi.Tempat..M.
Diasumsikan bahwa data Tinggi Tempat dari data_penelitian disimpan pada vektor X2.
X2
Untuk menampilkan vektor X2.
- Y=data_penelitian$Produksi.Padi..Ton.
Diasumsikan bahwa data Produksi Padi dari data_penelitian disimpan pada vektor Y.
Y
Untuk menampilkan vektor Y.
2.3 Membentuk data frame yang berisi vektor X1, X2, dan Y
> data<-data.frame(X1, X2, Y)
> data
X1 X2 Y
1 64.00 1450 23.37
2 866.60 729 8046.00
3 1941.70 497 28373.00
4 1108.80 497 15968.00
5 2933.80 660 36701.00
6 2312.60 584 26288.00
7 1460.40 480 15103.00
8 1225.00 478 13562.00
9 461.00 572 4261.00
10 729.70 900 3127.00
11 915.70 514 8302.00
12 1556.00 750 7264.00
13 1099.50 650 10780.00
14 2041.70 357 23700.00
15 1186.80 357 9461.00
16 1255.00 400 12420.00
17 995.70 400 8130.00
18 912.54 318 8943.00
19 678.76 318 7332.00- Membentuk dataframe yang berisi vektor X1, X2, dan Y yang saya beri nama data dengan mengunakan perintah data<-data.frame(X1, X2, Y).
> library(rmarkdown)
> paged_table(as.data.frame(data))- Function βpaged.tableβ digunakan untuk membuat tabel dalam HTML dengan dukungan untuk baris dan kolom paging. Dipanggil dari data frame bernama data.
2.4 Statistika Deskriptif
2.4.1 Analisis Deskriptif Menggunakan Nilai Statistik
>
> var(X1)
[1] 462117.7
> sd(X1)
[1] 679.7924
> quantile(X1,0.25)
25%
889.57
> median(X1)
[1] 1108.8
> quantile(X1,0.75)
75%
1508.2
> min(X1)
[1] 64
> max(X1)
[1] 2933.8
> mean(X1)
[1] 1249.753
>
> var(X2)
[1] 70068.87
> sd(X2)
[1] 264.7053
> quantile(X2,0.25)
25%
400
> median(X2)
[1] 497
> quantile(X2,0.75)
75%
655
> min(X2)
[1] 318
> max(X2)
[1] 1450
> mean(X2)
[1] 574.2632
>
> var(Y)
[1] 89693803
> sd(Y)
[1] 9470.681
> quantile(Y,0.25)
25%
7689
> median(Y)
[1] 9461
> quantile(Y,0.75)
75%
15535.5
> min(Y)
[1] 23.37
> max(Y)
[1] 36701
> mean(Y)
[1] 13041.28- X1 = Luas Lahan(Ha)
- X2 = Tinggi Tempat(M)
- Y = Produksi Padi(Ton)
- Ragam, menggunakan var()
- Simpangan baku, akar dari ragam, atau menggunakan sd()
- Quartil 1 menggunakan quantile(β¦, 0.25)
- Median menggunakan median()
- Quartil 3 menggunakan quantile(β¦, 0.75)
- Nilai minimum menggunakan min()
- Nilai maksimum menggunakan max()
- Rata-rata menggunakan mean()
> summary(data)
X1 X2 Y
Min. : 64.0 Min. : 318.0 Min. : 23.37
1st Qu.: 889.6 1st Qu.: 400.0 1st Qu.: 7689.00
Median :1108.8 Median : 497.0 Median : 9461.00
Mean :1249.8 Mean : 574.3 Mean :13041.28
3rd Qu.:1508.2 3rd Qu.: 655.0 3rd Qu.:15535.50
Max. :2933.8 Max. :1450.0 Max. :36701.00 Function summary akan menampilkan kesimpulan pada variabel masing-masing. Untuk variabel bertipe character akan menampilkan panjang datanya. Variabel bertipe factor akan menampilkan jumlah data pada masing-masing kelas. Sedangkan untuk variabel bertipe numerik akan memunculkan nilai minimum, Q1,Q2 (median), Q3, mean, dan maximum.
2.4.2 Analisis Deskriptif Menggunakan Visualisasi
> h1<-hist(X1, breaks=10,xlab="Luas Lahan(Ha)", ylab="Frequency", main="Histogram Luas Lahan(Ha) of Data", col="chartreuse4")
1. Diilustrasikan pada data, untuk variabel X1 (Luas Lahan (Ha)).
2. Digunakan perintah h1<-hist(X1, β¦.).
3. Dibutuhkan informasi mengenai berapa kelas interval yang digunakan:
breaks (mis: 10 interval), maka menggunakan (breaks=10).
4. Dapat disajikan judul histogram, menggunakan main (βHistogram Luas
Lahan(Ha) of Dataβ).
5. Informasi pada sumbu mendatar, menggunakan xlab (βLuas
Lahan(Ha)β).
6. Informasi pada sumbu tegak, menggunakan ylab (βFrequencyβ).
7. Warna pada grafik dapat diatur menggunakan perintah col, maka
menggunakan (col=βchartreuse4β).
> h2<-hist(X2, breaks=10,xlab="Tinggi Tempat(M)", ylab="Frequency", main="Histogram Tinggi Tempat(M) of Data", col="cornflowerblue")
1. Diilustrasikan pada data, untuk variabel X2 (Tinggi Tempat
(M)).
2. Digunakan perintah h2<-hist(X2, β¦.).
3. Dibutuhkan informasi mengenai berapa kelas interval yang digunakan:
breaks (mis: 10 interval), maka menggunakan (breaks=10).
4. Dapat disajikan judul histogram, menggunakan main (βHistogram Tinggi
Tempat(M) of Dataβ).
5. Informasi pada sumbu mendatar, menggunakan xlab (βTinggi
Tempat(M)β).
6. Informasi pada sumbu tegak, menggunakan ylab (βFrequencyβ).
7. Warna pada grafik dapat diatur menggunakan perintah col, maka
menggunakan (col=βcornflowerblueβ).
> h3<-hist(Y, breaks=10,xlab="Produksi Padi(Ton)", ylab="Frequency", main="Histogram Produksi Padi(Ton) of Data", col="burlywood3")- Diilustrasikan pada data, untuk variabel Y (Produksi Padi
(Ton)).
- Digunakan perintah h3<-hist(Y, β¦.).
- Dibutuhkan informasi mengenai berapa kelas interval yang digunakan:
breaks (mis: 10 interval), maka menggunakan (breaks=10).
- Dapat disajikan judul histogram, menggunakan main (βHistogram
Produksi Padi(Ton) of Dataβ).
- Informasi pada sumbu mendatar, menggunakan xlab (βProduksi
Padi(Ton)β).
- Informasi pada sumbu tegak, menggunakan ylab (βFrequencyβ).
- Warna pada grafik dapat diatur menggunakan perintah col, maka menggunakan (col=βburlywood3β).
2.5 Statistika Inferensial
2.5.1 Analisis Korelasi
Analisis korelasi merupakan salah satu analisis yang penting dilakukan untuk mengetahui apakah tiap variabel prediktor berpengaruh signifikan terhadap variabel respon.
Analisi korelasi variabel luas penggunaan lahan(Ha) (X1) dan produksi padi (Ton) (Y) Perhitungan Statistik UJi:
> cor.test(X1,Y)
Pearson's product-moment correlation
data: X1 and Y
t = 11.139, df = 17, p-value = 3.118e-09
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
0.8424570 0.9761971
sample estimates:
cor
0.9378112 Analisi korelasi variabel tinggi tempat(M) (X2) dan produksi padi (Ton) (Y) Perhitungan Statistik UJi:
> cor.test(X2,Y)
Pearson's product-moment correlation
data: X2 and Y
t = -1.3288, df = 17, p-value = 0.2015
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.6678987 0.1713353
sample estimates:
cor
-0.3067455 2.5.2 Analisi Regresi
Setelah dilakukan analisis korelasi dan mendapatkan variabel prediktor yang berpengaruh signifikan terhadap variabel produksi padi(Ton). Selanjutnya dilakukan analisis regresi untuk mendapatkan persamaan model untuk menjelaskan keragaman produksi padi(Ton).
Sebelum melakukan analisis regresi, terdapat asumsi yang harus
terpenuhi agar mendapatkan hasil estimasi yang baik. yaitu dengan
dilakukan uji asumsi normalitas.
UJI NORMALITAS
Perhitungan Statistik Uji:
> shapiro.test(data$X1)
Shapiro-Wilk normality test
data: data$X1
W = 0.94775, p-value = 0.3616Setelah dilakukan uji normalitas, dilanjutkan dengan analisis regresi.
> analisis_regresi<-lm(Y ~ X1, data = data)
> summary(analisis_regresi)
Call:
lm(formula = Y ~ X1, data = data)
Residuals:
Min 1Q Median 3Q Max
-9778.5 -690.2 10.7 1591.1 6291.2
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -3287.146 1658.717 -1.982 0.0639 .
X1 13.065 1.173 11.139 3.12e-09 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 3383 on 17 degrees of freedom
Multiple R-squared: 0.8795, Adjusted R-squared: 0.8724
F-statistic: 124.1 on 1 and 17 DF, p-value: 3.118e-092.5.3 Menggunakan fungsi lm(β¦) untuk melakukan analisis regresi untuk Y sebagai fungsi dari X1 dan X2.
> analisis_regresi<-lm(Y ~ X1 + X2, data = data)
> summary(analisis_regresi)
Call:
lm(formula = Y ~ X1 + X2, data = data)
Residuals:
Min 1Q Median 3Q Max
-9611.0 -786.0 73.5 1472.0 6295.2
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -2716.2235 2907.3484 -0.934 0.364
X1 12.9713 1.2676 10.233 1.99e-08 ***
X2 -0.7896 3.2553 -0.243 0.811
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 3481 on 16 degrees of freedom
Multiple R-squared: 0.8799, Adjusted R-squared: 0.8649
F-statistic: 58.63 on 2 and 16 DF, p-value: 4.32e-082.5.4 Anilisis Asumsi Klasik
2.5.4.1 Uji Normalitas
> #Uji Shapiro Wilk
> sisa<-residuals(analisis_regresi)
> shapiro.test(sisa)
Shapiro-Wilk normality test
data: sisa
W = 0.90175, p-value = 0.05234
> plot(analisis_regresi,2)Uji Shapiro Wilk
- Uji normalitas diterapkan pada sisaan.
- Sisaan diperoleh dengan fungsi residuals(β¦), dengan argumen berupa
obyek lm yang sudah diperoleh sebelumnya.
- Obyek lm bernama analisis_regresi dan sisaan disimpan pada obyek sisa
digunakan perintah sisa<-residuals(analisis_regresi).
- Jika menggunakan uji shapiro wilk, tidak perlu instalasi package
tertentu.
- Uji dilakukan dengan perintah shapiro.test(..), dengan argument obyek
sisa.
2.5.4.2 Uji Multikolinieritas
> library(car)
> vif(analisis_regresi)
X1 X2
1.103126 1.103126 - Untuk mendeteksi keberadaan multikolinieritas diperlukan instalasi
package βcarβ.
- Menggiunakan perintah vif(β¦), dengan argument obyek lm yang sudah
dibentuk.
- VIF (Variance Inflation Factor).
- Perlu digunakan pada regresi linier berganda.
- Multikolinieritas serius jika VIF β₯ 10.
- Jika tidak ada multikolinieritas VIF -> 1.
2.5.4.3 Uji Autokorelasi
> library(lmtest)
> dwtest(analisis_regresi)
Durbin-Watson test
data: analisis_regresi
DW = 1.4627, p-value = 0.06512
alternative hypothesis: true autocorrelation is greater than 0- Terpenuhi tidaknya asumsi dapat diuji menggunakan uji Durbin Watson (DW).
- Untuk menggunakan uji Durbin Watson, diperlukan instalasi package
βlmtestβ.
- Uji dilakukan dengan perintah dwtest(β¦), dengan argument obyek lm yang sudah dibentuk sebelumnya.
2.5.4.4 Uji Homokedastisitas
> library(lmtest)
> bptest(analisis_regresi)
studentized Breusch-Pagan test
data: analisis_regresi
BP = 1.487, df = 2, p-value = 0.4755
> plot(analisis_regresi,1)
- Untuk menggunakan uji Breusch Pagan, diperlukan instalasi package
βlmtestβ. - Uji dilakukan dengan perintah bptest(β¦), dengan argument
obyek lm yang sudah dibentuk sebelumnya.
3 HASIL DAN PEMBAHASAN
3.1 Statistika Deskriptif
3.1.1 Analisis Deskriptif Menggunakan Nilai Statistik
>
> var(X1)
[1] 462117.7
> sd(X1)
[1] 679.7924
> quantile(X1,0.25)
25%
889.57
> median(X1)
[1] 1108.8
> quantile(X1,0.75)
75%
1508.2
> min(X1)
[1] 64
> max(X1)
[1] 2933.8
> mean(X1)
[1] 1249.753
>
> var(X2)
[1] 70068.87
> sd(X2)
[1] 264.7053
> quantile(X2,0.25)
25%
400
> median(X2)
[1] 497
> quantile(X2,0.75)
75%
655
> min(X2)
[1] 318
> max(X2)
[1] 1450
> mean(X2)
[1] 574.2632
>
> var(Y)
[1] 89693803
> sd(Y)
[1] 9470.681
> quantile(Y,0.25)
25%
7689
> median(Y)
[1] 9461
> quantile(Y,0.75)
75%
15535.5
> min(Y)
[1] 23.37
> max(Y)
[1] 36701
> mean(Y)
[1] 13041.28- X1 = Luas Lahan(Ha)
- X2 = Tinggi Tempat(M)
- Y = Produksi Padi(Ton)
> summary(data)
X1 X2 Y
Min. : 64.0 Min. : 318.0 Min. : 23.37
1st Qu.: 889.6 1st Qu.: 400.0 1st Qu.: 7689.00
Median :1108.8 Median : 497.0 Median : 9461.00
Mean :1249.8 Mean : 574.3 Mean :13041.28
3rd Qu.:1508.2 3rd Qu.: 655.0 3rd Qu.:15535.50
Max. :2933.8 Max. :1450.0 Max. :36701.00 Function summary akan menampilkan kesimpulan pada variabel masing-masing. Untuk variabel bertipe character akan menampilkan panjang datanya. Variabel bertipe factor akan menampilkan jumlah data pada masing-masing kelas. Sedangkan untuk variabel bertipe numerik akan memunculkan nilai minimum, Q1,Q2 (median), Q3, mean, dan maximum.
Analisis Deskriptif Menggunakan Nilai Stastistik untuk Data Luas
Penggunaan Lahan dan Tinggi Tempat terhadap Produksi Padi di Kabupaten
Semarang 2018 sebagai berikut:
X1 = Luas Penggunaan Lahan(Ha)
- Nilai observasi terkecil dari data luas penggunaan lahan yaitu 64
Ha.
- Nilai yang memotong 25% dari data terendah pada data luas penggunaan
lahan yaitu 889,6 Ha.
- Nilai pertengahan untuk data luas penggunaan lahan yaitu 1108,8
Ha.
- Nilai rata-rata untuk data luas penggunaan lahan yaitu 1249,8
Ha.
- Nilai yang memotong 25% dari data tertinggi pada data luas penggunaan
lahan yaitu 1508,2 Ha.
- Nilai observasi terbesar dari data luas penggunaan lahan yaitu 2933,8
Ha.
X2 = Tinggi Tempat(M)
- Nilai observasi terkecil dari data tinggi tempat yaitu 318 M.
- Nilai yang memotong 25% dari data terendah pada data tinggi tempat
yaitu 400 M.
- Nilai pertengahan untuk data tinggi tempat yaitu 497 M.
- Nilai rata-rata untuk data tinggi tempat yaitu 574,3 M.
- Nilai yang memotong 25% dari data tertinggi pada data tinggi tempat
yaitu 655 M.
- Nilai observasi terbesar dari data tinggi tempat yaitu 1450 M.
Y = Produksi Padi(Ton)
- Nilai observasi terkecil dari data produksi padi yaitu 23,37
Ton.
- Nilai yang memotong 25% dari data terendah pada data produksi padi
yaitu 7689 Ton.
- Nilai pertengahan untuk data produksi padi yaitu 9461 Ton.
- Nilai rata-rata untuk data produksi padi yaitu 13041,28 Ton.
- Nilai yang memotong 25% dari data tertinggi pada data produksi padi
yaitu 15535,5 Ton.
- Nilai observasi terbesar dari data produksi padi yaitu 36701 Ton.
3.1.2 Analisis Deskriptif Menggunakan Visualisasi
> h1<-hist(X1, breaks=10,xlab="Luas Lahan(Ha)", ylab="Frequency", main="Histogram Luas Lahan(Ha) of Data", col="chartreuse4")
Histogram Luas Lahan(Ha) Histogram dari data luas penggunaan lahan(Ha)
berbentuk menjulur ke kanan, dimana menunjukkan bahwa nilai mean >
median > modus pada data luas penggunaan lahan(Ha) tersebut.
Frekuensi terkecil untuk data luas penggunaan lahan(Ha) pada selang
2500-3000 Ha. Frekuensi tertinggi dari data luas penggunaan lahan(Ha)
yaitu pada selang 500-1500 Ha.
> h2<-hist(X2, breaks=10,xlab="Tinggi Tempat(M)", ylab="Frequency", main="Histogram Tinggi Tempat(M) of Data", col="cornflowerblue")
Histogram Tinggi Tempat(M) Histogram dari data tinggi tempat (M)
berbentuk menjulur ke kanan, dimana menunjukkan bahwa nilai mean >
median > modus pada data tinggi tempat(M) tersebut. Dari histogram
tersebut juga terlihat pada terdapat pencilan data yaitu terdapat data
tinggi tempat yang lebih besar 1400 M, frekuensi tinggi tempat(M)
terbanyak yaitu pada selang kurang dari sama dengan 400 M, dan untuk
tinggi tempat(M) pada selang 900M-1400M tidak memiliki frekuensi atau
data kosong pada selang tersebut.
> h3<-hist(Y, breaks=10,xlab="Produksi Padi(Ton)", ylab="Frequency", main="Histogram Produksi Padi(Ton) of Data", col="burlywood3")
Histogram Produksi Padi(Ton) Histogram dari data Produksi Padi(Ton)
berbentuk menjulur ke kanan, dimana menunjukkan bahwa nilai mean >
median > modus pada data produksi padi(Ton) tersebut. Frekuensi
produksi padi(Ton) terbanyak yaitu pada selang 5000-10000 Ton, dan untuk
produksi padi (Ton) pada selang 30000-35000 Ton tidak memiliki frekuensi
atau data kosong pada selang tersebut. Dan juga terdapat pencilan data
produksi padi(Ton) pada selang 35000-40000Ton.
3.2 Statistika Inferensial
3.2.1 Analisis Korelasi
Analisis korelasi merupakan salah satu analisis yang penting
dilakukan untuk mengetahui apakah tiap variabel prediktor berpengaruh
signifikan terhadap variabel respon.
Analisi korelasi variabel luas penggunaan lahan(Ha) (X1) dan produksi
padi (Ton) (Y) Hipotesis:
H0: \(\rho\) = 0 (Tidak terdapat
hubungan yang signifikan antara variabel luas penggunaan lahan(Ha) (X1)
dengan produksi padi(Ton) (Y))
H1: \(\rho\) \(\ne\) 0 (Terdapat hubungan yang signifikan
antara variabel luas penggunaan lahan(Ha) (X1) dengan produksi padi(Ton)
(Y))
Taraf Signifikasi:
\(\alpha\) = 5%
Daerah Penolakan:
Tolak H0 jika:
1. thitung > t\(\alpha\),n-2 dengan t\(\alpha\),n-2 adalah nilai kritis dari
tabel distribusi t dengan derajat bebas n-2.
2. Nilai |r| > 0,5.
Perhitungan Statistik UJi:
> cor.test(X1,Y)
Pearson's product-moment correlation
data: X1 and Y
t = 11.139, df = 17, p-value = 3.118e-09
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
0.8424570 0.9761971
sample estimates:
cor
0.9378112 Keputusan:
Tolak H0 karena nilai r |0,9378112| > 0,5.
Kesimpulan:
Variabel luas penggunaan lahan (Ha) (X1) memiliki hubungan yang
signifikan terhadap produksi padi(Ton) (Y).
Analisi korelasi variabel tinggi tempat(M) (X2) dan produksi padi
(Ton) (Y)
Hipotesis:
H0: \(\rho\) = 0 (Tidak terdapat
hubungan yang signifikan antara variabel luas penggunaan lahan(Ha) (X1)
dengan produksi padi(Ton) (Y))
H1: \(\rho\) \(\ne\) 0 (Terdapat hubungan yang signifikan
antara variabel luas penggunaan lahan(Ha) (X1) dengan produksi padi(Ton)
(Y))
Taraf Signifikasi:
\(\alpha\) = 5%
Daerah Penolakan:
Tolak H0 jika:
1. thitung > t\(\alpha\),n-2 dengan t\(\alpha\),n-2 adalah nilai kritis dari
tabel distribusi t dengan derajat bebas n-2.
2. Nilai |r| > 0,5.
Perhitungan Statistik UJi:
> cor.test(X2,Y)
Pearson's product-moment correlation
data: X2 and Y
t = -1.3288, df = 17, p-value = 0.2015
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.6678987 0.1713353
sample estimates:
cor
-0.3067455 Keputusan:
Gagal tolak H0 karena nilai r |-0,3067455| < 0,5.
Kesimpulan:
Variabel tinggi tempat(M) (X2) tidak memiliki hubungan yang signifikan
terhadap produksi padi(Ton) (Y).
Sehingga untuk analisis selanjutnya, variabel tinggi tempat(M) tidak dimasukkan dalam analisis regresi sederhana karena tidak memiliki pengaruh yang signifikan terhadap produksi padi(Ton).
3.2.2 Analisis Regresi
Setelah dilakukan analisis korelasi dan mendapatkan variabel prediktor yang berpengaruh signifikan terhadap variabel produksi padi(Ton). Selanjutnya dilakukan analisis regresi untuk mendapatkan persamaan model untuk menjelaskan keragaman produksi padi(Ton).
Sebelum melakukan analisis regresi, terdapat asumsi yang harus
terpenuhi agar mendapatkan hasil estimasi yang baik. yaitu dengan
dilakukan uji asumsi normalitas.
UJI NORMALITAS
Hipotesis:
H0 = Variabel luas penggunaan lahan(Ha) berdistribusi normal.
H1 = Variabel luas penggunaan lahan(Ha) tidak berdistribusi
normal.
Taraf Signifikansi:
\(\alpha\) = 5%
Daerah Penolakan:
Tolak H0 jika p-value \(\le\) \(\alpha\)
Perhitungan Statistik Uji:
> shapiro.test(data$X1)
Shapiro-Wilk normality test
data: data$X1
W = 0.94775, p-value = 0.3616Keputusan:
Gagal tolak H0 karena p-value (0,3616) > \(\alpha\) (0,05).
Kesimpulan:
Variabel luar penggunaan lahan(Ha) berdistribusi normal.
Setelah dilakukan uji normalitas, dilanjutkan dengan analisis
regresi.
Analisis Regresi linear sederhana itu sendiri memiliki model sebagai
berikut:
f(x) = a + bx
dimana:
f(x) = variabel respon
a = konstanta
b = koefisien variabel X
x = variabel prediktor
> analisis_regresi<-lm(Y ~ X1, data = data)
> summary(analisis_regresi)
Call:
lm(formula = Y ~ X1, data = data)
Residuals:
Min 1Q Median 3Q Max
-9778.5 -690.2 10.7 1591.1 6291.2
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -3287.146 1658.717 -1.982 0.0639 .
X1 13.065 1.173 11.139 3.12e-09 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 3383 on 17 degrees of freedom
Multiple R-squared: 0.8795, Adjusted R-squared: 0.8724
F-statistic: 124.1 on 1 and 17 DF, p-value: 3.118e-09Diperoleh persamaan model sebagai berikut:
f(x) = -3287,146 + 13,065 X
dengan besar R2 = 0,8795 yang artinya keragaman variabel
produksi padi (Ton) yang dapat dijelaskan oleh variabel luas penggunaan
lahan(Ha) sebesar 87,95%, sedangkan untuk 12,05% sisanya dijelaskan oleh
variabel lain diluar model.
3.2.3 Menggunakan fungsi lm(β¦) untuk melakukan analisis regresi untuk Y sebagai fungsi dari X1 dan X2.
> analisis_regresi<-lm(Y ~ X1 + X2, data = data)
> summary(analisis_regresi)
Call:
lm(formula = Y ~ X1 + X2, data = data)
Residuals:
Min 1Q Median 3Q Max
-9611.0 -786.0 73.5 1472.0 6295.2
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -2716.2235 2907.3484 -0.934 0.364
X1 12.9713 1.2676 10.233 1.99e-08 ***
X2 -0.7896 3.2553 -0.243 0.811
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 3481 on 16 degrees of freedom
Multiple R-squared: 0.8799, Adjusted R-squared: 0.8649
F-statistic: 58.63 on 2 and 16 DF, p-value: 4.32e-08Diperoleh persamaan model sebagai berikut:
Y = a + b1 X1 + b2 X2
π = β2716,2235 + 12,9713π1 β 0,7896π2 Dimana:
a. Konstanta = β 2716,2235 artinya apabila variabel Luas Lahan dan
tinggi tempat adalah nol, maka variabel Produksi Padi bernilai sebesar β
2716,2235.
b. Luas Lahan (X1) = 12,9713 yang artinya untuk setiap Luas Lahan naik
satu satuan, nilai variabel.
Produksi Padi akan naik sebesar 12,9713 dengan asumsi bahwa variabel
tinggi tempat adalah nol.
c.Β Tinggi tempat (X2) = -0,7896 yang artinya untuk setiap tinggi tempat
naik satu satuan, nilai variabel Produksi Padi akan turun sebesar 0,7896
dengan asumsi bahwa variabel Luas Lahan adalah nol.
Nilai R2 sebesar 0,8799. Artinya kedua variabel tersebut
secara bersama-sama mempengaruhi variabel Y yaitu sebesar 87,99%,
sedangkan sisanya sebesar 12,01 % dipengaruhi oleh variabel lain diluar
model.
3.2.4 Anilisis Asumsi Klasik
3.2.4.1 Uji Normalitas
Pengujian normalitas adalah pengujian tentang kenormalan distribusi
data. Uji ini merupakan pengujian yang paling banyak dilakukan untuk
analisis statistik parametrik. Maksud data berdistribusi secara normal
adalah bahwa data akan mengikuti bentuk distribusi normal (Santosa &
Ashari, 2005).
Kriteria pengujian:
1. P-value uji shapiro wilk > 0,05 menunjukkan data berdistribusi
normal.
2. P-value uji shapiro wilk < 0,05 menunjukkan data tidak
berdistribusi normal.
Menentukan Hipotesis
H0 = Pengamatan berdistribusi normal.
H1 = Pengamatan berdistribusi tidak normal.
> #Uji Shapiro Wilk
> sisa<-residuals(analisis_regresi)
> shapiro.test(sisa)
Shapiro-Wilk normality test
data: sisa
W = 0.90175, p-value = 0.05234
> plot(analisis_regresi,2)
Interpretasi:
Nilai p-value(0,05234) > 0,05 maka terima H0. Jadi dapat disimpulkan
bahwa tidak terbukti ada pelanggaran asumsi normalitas galat.
3.2.4.2 Uji Multikolinieritas
Uji multikolinieritas bertujuan untuk mengetahui apakah ada hubungan
diantara variabel bebas memiliki masalah multikolinearitas atau
tidak.
Kriteria pengujian:
1. Jika nilai VIF < 10 maka tidak terjadi gejala multikolinearitas
diantara variabel bebas.
2. Jika nilai VIF > 10 maka terjadi gejala multikolinearitas diantara
variabel bebas.
Menentukan Hipotesis H0 = Tidak terjadi multikolinieritas antara
variabel independen.
H1 = Terjadi multikolinieritas antara variabel independen.
> library(car)
> vif(analisis_regresi)
X1 X2
1.103126 1.103126 Interpretasi: Diperoleh nilai VIF(Variance Inflation Factor) untuk variabel Luas Lahan (X1) adalah 1,103126 sedangkan untuk variabel tinggi tempat (X2) juga 1,103126 yang mana kedua variabel tersebut memiliki nilai kurang dari 10. Maka dapat disimpulkan bahwa H0 diterima yang artinya tidak terjadi proses multikolinearitas diantara variabel-variabel Independen.
3.2.4.3 Uji Autokorelasi
Uji Autokorelasi adalah suatu korelasi antara nilai variabel dengan
niai variabel yang sama pada lag satu atau lebih sebelumnya (Suharjo,
2008). Uji autokorelasi dapat dilakukan dengan uji Durbin-Watson, uji
Langrage Multiplier (LM), uji statistik Q, dan uji Run Test.
Kriteria pengujian dengan uji Run Test:
1. Jika nilai p-value lebih kecil < dari 0,05 maka terdapat gejala
autokorelasi.
2. Jika nilai p-value lebih besar > dari 0,05 maka tidak terdapat
gejala autokorelasi.
Menentukan Hipotesis
H0 = Tidak ada masalah autokorelasi.
H1 = Terdapat masalah autokorelasi.
> library(lmtest)
> dwtest(analisis_regresi)
Durbin-Watson test
data: analisis_regresi
DW = 1.4627, p-value = 0.06512
alternative hypothesis: true autocorrelation is greater than 0Interpretasi:
Nilai p-value(0,06512) > 0,05 maka terima H0. Jadi dapat disimpulkan
bahwa tidak terdapat masalah autokorelasi.
3.2.4.4 Uji Homokedastisitas
- Homokedastisitas: ragam galat yang sama di setiap nilai X.
- Pelanggaran dari asumsi ini: Heteroskedastisitas.
Menentukan Hipotesis
H0 = Tidak terjadi homokedastisitas pada variabel Independen.
H1 = Terjadi homokedastisitas pada variabel Independen.
> library(lmtest)
> bptest(analisis_regresi)
studentized Breusch-Pagan test
data: analisis_regresi
BP = 1.487, df = 2, p-value = 0.4755
> plot(analisis_regresi,1) Interpretasi: Nilai p-value (0,4755) > 0,05, maka terima Ho. Jadi dapat disimpulkan bahwa terbukti tidak terjadi homokedastisitas pada variabel Independen. Apabila terjadi pelanggaran dari asumsi ini : terjadi gejala Heteroskedastisitas. Oleh karena itu, dapat disimpulkan bahwa tidak terjadi gejala heteroskedastisitas pada variabel independen.
4 DAFTAR PUSTAKA
Setyowati, E. & Mashuri. (2020). Analisis Pengaruh Luas
Penggunaan Lahan dan Tinggi Tempat Terhadap Produksi Padi di Kabupaten
Semarang Tahun 2018. PRISMA, PROSIDING SEMINAR NASIONAL MATEMATIKA 3,
199-210.
Yam, J. (2020). AMBIGUITAS STATISTIKA DESKRIPTIF & STATISTIKA
INFERENSIAL. PELITA: Jurnal Penelitian dan Karya Ilmiah, 117-124.
Syahrul, N. (2020, 31 Juli). Statistics using R for Data Science.
Diakses pada 18 Mei 2022, dari https://rpubs.com/Nurulfad/645050.
Aprillyasari, R. Analisis Statistika Sederhana. Diakses pada 20 Mei
2022, dari https://www.rpubs.com/RiskaApril/433949.
Sartono, B. & Kholifatunnisa, A. HISTOGRAM. Diakses pada 20 Mei
2022, dari https://rpubs.com/bagusco/histogram.