Library:

> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")

1 PENDAHULUAN

1.1 Latar Belakang

Data hujan harian sangat diperlukan di sektor pertanian dan perkebunan untuk menentukan musim tanam agar tidak terjadi gagal panen. Berdasarkan permasalahan tersebut perlu dilakukan analisis hubungan antara durasi hujan dengan tebal hujan. Analisis yang akan dilakukan menggunakan analisis regresi linier sederhana dengan variabel prediktor (x) adalah durasi hujan dalam satuan menit sedangkan variabel respon (y) adalah tebal hujan dalam satuan mm. Data yang digunakan berasal dari tahun-tahun sebelumnya. Hal ini bertujuan untuk mendapatkan model persamaan regresi berdasarkan hubungan antara durasi hujan dengan tebal hujan di Stasiun Klimatologi Lasiana Kota Kupang.

1.2 Analisis Regresi Linier Sederhana

Analisis regresi adalah suatu teknik statistika untuk pemeriksaan dan pemodelan hubungan antar variabel. Analisis regresi terdiri dari dua komponen yang dihubungkan, yaitu satu variabel respons (variabel tidak bebas, variabel dependen, variabel terikat) dan satu atau beberapa variabel prediktor(variabel bebas, variabel independen, atau variabel penjelas). Model regresi linier sederhana merupakan suatu model persamaan yang menggambarkan hubungan antara satu variabel bebas/predictor (X) dengan satu variabel tak bebas/respons (Y). \[ y=\beta_{0}+\beta_{1}x+\varepsilon \] \(\beta_{0}= Intersep\)
\(\beta_{1}= Slope\)
\(\varepsilon= error(galat)\)

Asumsi yang melandasi Analisis Regresi:
Normalitas Sisaan, Homoskedastisitas, Non Autokorelasi,Non Multikolinieritas (analisis regresi linier berganda)

1.3 Analisis Pendahuluan

  1. Scatter plot (diagram pencar):
    Untuk memvisualisasi hubungan linier antara variabel prediktor dan respons
  2. Korelasi:
    Memberikan gambaran untuk keeratan dan arah hubungan antar dua variabel (X dan Y), tanpa memperhatikan hubungan sebab akibat. Koefisien korelasi (r) memiliki rentang nilai: -1<=r<=1

1.4 Data

Data yang digunakan adalah data rata-rata tebal hujan maksimum tahunan Stasiun Klimatologi Lasiana Kota Kupang Tahun 2000-2011. Terdiri dari variabel Durasi dalam menit dan Tebal Hujan Rata-Rata dalam milimeter.

2 SOURCE CODE

2.1 Library yang Dibutuhkan

> # library(lmtest)
> #library(rmarkdown)
> 

2.2 Membangkitkan Data

> p<-file.path("D:","Rstudio","hujan.csv")
> data=read.csv(p,header=TRUE)
> library(rmarkdown)
> paged_table(as.data.frame(data))
> scatter.smooth(x=data$Durasi, y=data$Tebal.hujan.rata.rata, main="Durasi~Tebal hujan rata-rata", xlab="Durasi(menit)", ylab="Tebal hujan(mm)", pch=19, col="deeppink1")

Data dibangkitkan dengan cara impor data tersimpan dalam format csv yang telah dibuat sebelumnya dengan nama file “hujan.csv”, digunakan fungsi read.csv, dan disimpan di obyek “data”. Variabel pertama adalah Durasi (menit) dan variabel kedua adalah Tebal hujan rata-rata (mm)

3 HASIL DAN PEMBAHASAN

3.1 Statistika Deskriptif

> summary(data$Tebal.hujan.rata.rata)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  13.87   35.92   57.19   57.45   75.11  115.34 

Nilai minimum dari variabel Tebal hujan rata-rata adalah \(min=13.87\)
Nilai quartil 1 dari variabel Tebal hujan rata-rata adalah \(Q_{1}=35.92\)
Nilai tengah (median) dari variabel Tebal hujan rata-rata adalah \(median=57.19\) Nilai quartil 3 dari variabel Tebal hujan rata-rata adalah \(Q_{3}=75.11\)
Nilai rata-rata dari variabel Tebal hujan rata-rata adalah \(\mu=57.45\)
Nilai maksimum dari variabel Tebal hujan rata-rata adalah \(max=115.34\)

scatter plot pada gambar 2 terlihat bahwa tebal hujan akan bertambah jika durasi bertambah. Masih terdapat hubungan linier antar keduanya

3.2 Korelasi

> cor.test(data$Durasi, data$Tebal.hujan.rata.rata)

    Pearson's product-moment correlation

data:  data$Durasi and data$Tebal.hujan.rata.rata
t = 4.6864, df = 9, p-value = 0.001142
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 0.4897876 0.9580559
sample estimates:
      cor 
0.8422114 

Korelasi antara X dan Y adalah 0.8422114. Korelasi (+) yang cukup tinggi.

3.3 Pendugaan Parameter

Pengolahan matriks X dan Y dari data

> n<-dim(data)[1]
> X<-matrix(c(rep(1,n), data$Durasi), nrow=n)
> Y<-data$Tebal.hujan.rata.rata
> k<-dim(X)[2]

Perhitungan Penduga

> b_hat<-solve(t(X)%*%X)%*%(t(X)%*%Y)
> b_hat
            [,1]
[1,] 41.72549740
[2,]  0.05796299

Diperoleh persamaan regresi adalah \(Y_{i}=41.72549740+0.05796299X_{i}\)
Interpretasi
Jika durasi hujan (X) nilainya adalah 0 maka tebal hujan rata-rata sebesar 41.72549740 Jika durasi hujan mengalami kenaikan 1 menit maka tebal hujan rata-rata akan naik sebesar 0.05796299. Koefisien bernilai positif antara durasi dengan tebal hujan rata-rata, semakin besar durasi hujan maka semakin meningkatkan tebal hujan rata-rata.

Perhitungan Sisaan

> Y_hat<-X%*%b_hat
> Y_hat
           [,1]
 [1,]  42.01531
 [2,]  42.30513
 [3,]  42.59494
 [4,]  43.46439
 [5,]  44.33383
 [6,]  45.20328
 [7,]  48.68106
 [8,]  52.15884
 [9,]  62.59217
[10,]  83.45885
[11,] 125.19220
> sisa<-Y-Y_hat
> sisa
            [,1]
 [1,] -28.145312
 [2,] -21.745127
 [3,] -13.194942
 [4,]  -1.024387
 [5,]   4.406168
 [6,]  11.986723
 [7,]  19.138944
 [8,]  18.561164
 [9,]  16.907826
[10,]   2.961149
[11,]  -9.852205

Penyajian Analisis Ragam
Menghitung nilai Jumlah Kuadrat

> Ybar<-rep(mean(Y), n)
> JKTotal<-t(Y-Ybar)%*%(Y-Ybar)
> JKReg<-t(Y_hat-Ybar)%*%(Y_hat-Ybar)
> JKGalat<-t(Y-Y_hat)%*%(Y-Y_hat)
> JK<-c(JKReg, JKGalat, JKTotal)
> JK
[1] 6602.682 2705.786 9308.468

Menghitung nilai derajat bebas

> dbReg<-k-1
> dbTotal<-n-1
> dbGalat<-dbTotal-dbReg
> db<-c(dbReg, dbTotal, dbGalat)
> db
[1]  1 10  9

Menghitung nilai kuadrat tengah

> KT<-JK/db
> KT
[1] 6602.6821  270.5786 1034.2742

Tabel analisis ragam

> a<-c("Regresi", "Galat", "Total")
> anreg<-data.frame(a, JK, db, KT)
> names(anreg)<-c("SK", "JK", "db", "KT")
> anreg
       SK       JK db        KT
1 Regresi 6602.682  1 6602.6821
2   Galat 2705.786 10  270.5786
3   Total 9308.468  9 1034.2742

Penerapan Fungsi lm(…)

> regresi<-lm(Tebal.hujan.rata.rata~Durasi, data=data)
> print(regresi)

Call:
lm(formula = Tebal.hujan.rata.rata ~ Durasi, data = data)

Coefficients:
(Intercept)       Durasi  
   41.72550      0.05796  

Diperoleh hasil yang sama dengan perhitungan manual.

Menghitung \(R^2\)

> R2<-anreg$JK[1]/anreg$JK[3]
> R2
[1] 0.70932

Nilai \(R^2=0.70932\) Interpretasi: variabel durasi hujan (X) mempengaruhi variabel tebal hujan rata-rata (Y) sebesar 70.9% dan sisanya dipengaruhi oleh variabel lain.

3.4 Asumsi yang Melandasi Analisis Regresi

  1. Normalitas Galat
> shapiro.test(sisa)

    Shapiro-Wilk normality test

data:  sisa
W = 0.92963, p-value = 0.4071

Digunakan uji Shapiro Wilk untuk menguji normalitas galat. Nilai p yang cukup besar. Tidak terbukti adanya pelanggaran normalitas galat pada model
2. Homogenitas Ragam Galat

> library(lmtest)
> bptest(regresi)

    studentized Breusch-Pagan test

data:  regresi
BP = 1.2379, df = 1, p-value = 0.2659

Menguji homogenitas ragam galat dengan Breusch Pagan test. Nilai p yang cukup besar, maka terima \(H_{0}\). Tidak terbukti adanya pelanggaran asumsi homogenitas ragam galat pada model.
3. Non Autokorelasi

> dwtest(regresi)

    Durbin-Watson test

data:  regresi
DW = 0.28164, p-value = 9.429e-08
alternative hypothesis: true autocorrelation is greater than 0

Menguji autokorelasi dengan Durbin Watson test.Nilai p kecil, sehingga tolak \(H_{0}\). Terdapat masalah autokorelasi.

4 DAFTAR PUSTAKA

Bunganaen, W., & dkk. (2013). Analisis Hubungan Tebal Hujan dan Durasi Hujan Pada Stasiun . Jurnal Teknik Sipil, 185-186. Efendi, A., & dkk. (2020). Analisis Regresi-Teori dan Aplikasi dengan R. Malang: UB Press.