Library:
> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")1 PENDAHULUAN
1.1 Latar Belakang
Data hujan harian sangat diperlukan di sektor pertanian dan perkebunan untuk menentukan musim tanam agar tidak terjadi gagal panen. Berdasarkan permasalahan tersebut perlu dilakukan analisis hubungan antara durasi hujan dengan tebal hujan. Analisis yang akan dilakukan menggunakan analisis regresi linier sederhana dengan variabel prediktor (x) adalah durasi hujan dalam satuan menit sedangkan variabel respon (y) adalah tebal hujan dalam satuan mm. Data yang digunakan berasal dari tahun-tahun sebelumnya. Hal ini bertujuan untuk mendapatkan model persamaan regresi berdasarkan hubungan antara durasi hujan dengan tebal hujan di Stasiun Klimatologi Lasiana Kota Kupang.
1.2 Analisis Regresi Linier Sederhana
Analisis regresi adalah suatu teknik statistika untuk pemeriksaan dan pemodelan hubungan antar variabel. Analisis regresi terdiri dari dua komponen yang dihubungkan, yaitu satu variabel respons (variabel tidak bebas, variabel dependen, variabel terikat) dan satu atau beberapa variabel prediktor(variabel bebas, variabel independen, atau variabel penjelas). Model regresi linier sederhana merupakan suatu model persamaan yang menggambarkan hubungan antara satu variabel bebas/predictor (X) dengan satu variabel tak bebas/respons (Y). \[
y=\beta_{0}+\beta_{1}x+\varepsilon
\] \(\beta_{0}= Intersep\)
\(\beta_{1}= Slope\)
\(\varepsilon= error(galat)\)
Asumsi yang melandasi Analisis Regresi:
Normalitas Sisaan, Homoskedastisitas, Non Autokorelasi,Non Multikolinieritas (analisis regresi linier berganda)
1.3 Analisis Pendahuluan
- Scatter plot (diagram pencar):
Untuk memvisualisasi hubungan linier antara variabel prediktor dan respons - Korelasi:
Memberikan gambaran untuk keeratan dan arah hubungan antar dua variabel (X dan Y), tanpa memperhatikan hubungan sebab akibat. Koefisien korelasi (r) memiliki rentang nilai: -1<=r<=1
1.4 Data
Data yang digunakan adalah data rata-rata tebal hujan maksimum tahunan Stasiun Klimatologi Lasiana Kota Kupang Tahun 2000-2011. Terdiri dari variabel Durasi dalam menit dan Tebal Hujan Rata-Rata dalam milimeter.
2 SOURCE CODE
2.1 Library yang Dibutuhkan
> # library(lmtest)
> #library(rmarkdown)
> 2.2 Membangkitkan Data
> p<-file.path("D:","Rstudio","hujan.csv")
> data=read.csv(p,header=TRUE)> library(rmarkdown)
> paged_table(as.data.frame(data))> scatter.smooth(x=data$Durasi, y=data$Tebal.hujan.rata.rata, main="Durasi~Tebal hujan rata-rata", xlab="Durasi(menit)", ylab="Tebal hujan(mm)", pch=19, col="deeppink1")Data dibangkitkan dengan cara impor data tersimpan dalam format csv yang telah dibuat sebelumnya dengan nama file “hujan.csv”, digunakan fungsi read.csv, dan disimpan di obyek “data”. Variabel pertama adalah Durasi (menit) dan variabel kedua adalah Tebal hujan rata-rata (mm)
3 HASIL DAN PEMBAHASAN
3.1 Statistika Deskriptif
> summary(data$Tebal.hujan.rata.rata)
Min. 1st Qu. Median Mean 3rd Qu. Max.
13.87 35.92 57.19 57.45 75.11 115.34 Nilai minimum dari variabel Tebal hujan rata-rata adalah \(min=13.87\)
Nilai quartil 1 dari variabel Tebal hujan rata-rata adalah \(Q_{1}=35.92\)
Nilai tengah (median) dari variabel Tebal hujan rata-rata adalah \(median=57.19\) Nilai quartil 3 dari variabel Tebal hujan rata-rata adalah \(Q_{3}=75.11\)
Nilai rata-rata dari variabel Tebal hujan rata-rata adalah \(\mu=57.45\)
Nilai maksimum dari variabel Tebal hujan rata-rata adalah \(max=115.34\)
scatter plot pada gambar 2 terlihat bahwa tebal hujan akan bertambah jika durasi bertambah. Masih terdapat hubungan linier antar keduanya
3.2 Korelasi
> cor.test(data$Durasi, data$Tebal.hujan.rata.rata)
Pearson's product-moment correlation
data: data$Durasi and data$Tebal.hujan.rata.rata
t = 4.6864, df = 9, p-value = 0.001142
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
0.4897876 0.9580559
sample estimates:
cor
0.8422114 Korelasi antara X dan Y adalah 0.8422114. Korelasi (+) yang cukup tinggi.
3.3 Pendugaan Parameter
Pengolahan matriks X dan Y dari data
> n<-dim(data)[1]
> X<-matrix(c(rep(1,n), data$Durasi), nrow=n)
> Y<-data$Tebal.hujan.rata.rata
> k<-dim(X)[2]Perhitungan Penduga
> b_hat<-solve(t(X)%*%X)%*%(t(X)%*%Y)
> b_hat
[,1]
[1,] 41.72549740
[2,] 0.05796299Diperoleh persamaan regresi adalah \(Y_{i}=41.72549740+0.05796299X_{i}\)
Interpretasi
Jika durasi hujan (X) nilainya adalah 0 maka tebal hujan rata-rata sebesar 41.72549740 Jika durasi hujan mengalami kenaikan 1 menit maka tebal hujan rata-rata akan naik sebesar 0.05796299. Koefisien bernilai positif antara durasi dengan tebal hujan rata-rata, semakin besar durasi hujan maka semakin meningkatkan tebal hujan rata-rata.
Perhitungan Sisaan
> Y_hat<-X%*%b_hat
> Y_hat
[,1]
[1,] 42.01531
[2,] 42.30513
[3,] 42.59494
[4,] 43.46439
[5,] 44.33383
[6,] 45.20328
[7,] 48.68106
[8,] 52.15884
[9,] 62.59217
[10,] 83.45885
[11,] 125.19220
> sisa<-Y-Y_hat
> sisa
[,1]
[1,] -28.145312
[2,] -21.745127
[3,] -13.194942
[4,] -1.024387
[5,] 4.406168
[6,] 11.986723
[7,] 19.138944
[8,] 18.561164
[9,] 16.907826
[10,] 2.961149
[11,] -9.852205Penyajian Analisis Ragam
Menghitung nilai Jumlah Kuadrat
> Ybar<-rep(mean(Y), n)
> JKTotal<-t(Y-Ybar)%*%(Y-Ybar)
> JKReg<-t(Y_hat-Ybar)%*%(Y_hat-Ybar)
> JKGalat<-t(Y-Y_hat)%*%(Y-Y_hat)
> JK<-c(JKReg, JKGalat, JKTotal)
> JK
[1] 6602.682 2705.786 9308.468Menghitung nilai derajat bebas
> dbReg<-k-1
> dbTotal<-n-1
> dbGalat<-dbTotal-dbReg
> db<-c(dbReg, dbTotal, dbGalat)
> db
[1] 1 10 9Menghitung nilai kuadrat tengah
> KT<-JK/db
> KT
[1] 6602.6821 270.5786 1034.2742Tabel analisis ragam
> a<-c("Regresi", "Galat", "Total")
> anreg<-data.frame(a, JK, db, KT)
> names(anreg)<-c("SK", "JK", "db", "KT")
> anreg
SK JK db KT
1 Regresi 6602.682 1 6602.6821
2 Galat 2705.786 10 270.5786
3 Total 9308.468 9 1034.2742Penerapan Fungsi lm(…)
> regresi<-lm(Tebal.hujan.rata.rata~Durasi, data=data)
> print(regresi)
Call:
lm(formula = Tebal.hujan.rata.rata ~ Durasi, data = data)
Coefficients:
(Intercept) Durasi
41.72550 0.05796 Diperoleh hasil yang sama dengan perhitungan manual.
Menghitung \(R^2\)
> R2<-anreg$JK[1]/anreg$JK[3]
> R2
[1] 0.70932Nilai \(R^2=0.70932\) Interpretasi: variabel durasi hujan (X) mempengaruhi variabel tebal hujan rata-rata (Y) sebesar 70.9% dan sisanya dipengaruhi oleh variabel lain.
3.4 Asumsi yang Melandasi Analisis Regresi
- Normalitas Galat
> shapiro.test(sisa)
Shapiro-Wilk normality test
data: sisa
W = 0.92963, p-value = 0.4071Digunakan uji Shapiro Wilk untuk menguji normalitas galat. Nilai p yang cukup besar. Tidak terbukti adanya pelanggaran normalitas galat pada model
2. Homogenitas Ragam Galat
> library(lmtest)
> bptest(regresi)
studentized Breusch-Pagan test
data: regresi
BP = 1.2379, df = 1, p-value = 0.2659Menguji homogenitas ragam galat dengan Breusch Pagan test. Nilai p yang cukup besar, maka terima \(H_{0}\). Tidak terbukti adanya pelanggaran asumsi homogenitas ragam galat pada model.
3. Non Autokorelasi
> dwtest(regresi)
Durbin-Watson test
data: regresi
DW = 0.28164, p-value = 9.429e-08
alternative hypothesis: true autocorrelation is greater than 0Menguji autokorelasi dengan Durbin Watson test.Nilai p kecil, sehingga tolak \(H_{0}\). Terdapat masalah autokorelasi.
4 DAFTAR PUSTAKA
Bunganaen, W., & dkk. (2013). Analisis Hubungan Tebal Hujan dan Durasi Hujan Pada Stasiun . Jurnal Teknik Sipil, 185-186. Efendi, A., & dkk. (2020). Analisis Regresi-Teori dan Aplikasi dengan R. Malang: UB Press.