Library:
install.packages("knitr")
install.packages("rmarkdown")
install.packages("prettydoc")
install.packages("equatiomatic")
1 PENDAHULUAN
1.1 Latar Belakang
Ikan senangin merupakan salah satu komoditas utama di Kelurahan Kampung Nelayan Kabupaten Tanjung Jabung. Sebagai komoditas utama, hasil tangkapan yang banyak sangat diinginkan oleh nelayan wilayah setempat. Adapun keberhasilan penangkapan itu bisa dipengaruhi beberapa faktor antara lain panjang jaring, jumlah BBM, Gt, jumlah ABK, dan lama perendaman. Oleh karena itu, ingin diketahui apakah faktor-faktor tersebut secara signifikan mempengaruhi hasil tangkapan ikan senangin.
Model yang cocok untuk menjawab permasalahan ini adalah analisis regresi berganda karena data terdiri dari 1 variabel dependen (hasil penangkapan) dan 5 variabel independen (panjang jaring, jumlah BBM, Gt, jumlah ABK, dan lama perendaman). Dengan analisis regresi berganda ini juga dapat diketahui apakah seluruh faktor-faktor tersebut secara bersama sama ataupun secara parsial berpengaruh terhadap hasil penangkapan ikan senangin.
1.2 Analisis Regresi Berganda
Analisis regresi berganda merupakan analisis yang digunakan untuk menganalisis pengaruh satu atau lebih variabel independen dengan satu variabel dependen (Gujarati, 2003). Pengaruh variabel independen terhadap variabel dependen bisa diketahui secara simultan atau bersama-sama dengan uji F dan secara parsial atau sebagian dengan uji T.
Tujuan lain analisis regresi adalah untuk mengestimasi atau memprediksi nilai variabel dependennya berdasarkan nilai variabel independen yang sudah diketahui. Prediksi nilai ini bisa didapatkan setelah mendapatkan model regresi yang sesuai.
Bentuk umum model regresi linear berganda dengan k variabel independen: \[
Y=\beta_0+\beta_1X_1+\beta_2X_2+\dots+\beta_kX_k+\varepsilon
\] Keterangan:
\(Y\) : variabel dependen
\(X_1\) : faktor ke-1
\(X_2\) : faktor ke-2
\(X_k\) : faktor ke-k
\(\beta_0\) : konstanta
\(\beta_1\) : koefisien regresi faktor ke-1
\(\beta_2\) : koefisien regresi faktor ke-2
\(\beta_k\) : koefisien regresi faktor ke-k
\(\varepsilon\) : error
1.3 Data
Data yang digunakan adalah data faktor-faktor produksi penangkapan ikan senangin (Eleutheronema tetradactylum) di Kelurahan Kampung Nelayan Kabupaten Tanjung Jabung Barat pada bulan Maret dan April 2020.
> library(readxl)
> data2<- read_excel("D:/data ikan.xlsx")
> View(data2)
> kable(head(data2, 10), caption = "10 Data Faktor-Faktor Produksi Penangkapan Ikan Senangin")
Panjang Jaring (m) | BBM (lt) | Gt | ABK (Orang) | Lama Perendaman (Jam) | Hasil Tangkapan (kg) |
---|---|---|---|---|---|
990 | 6 | 1.5 | 1 | 2 | 4.42 |
900 | 6 | 1.2 | 1 | 2 | 4.03 |
750 | 6 | 1.2 | 1 | 1 | 2.48 |
750 | 7 | 1.2 | 1 | 1 | 2.78 |
990 | 6 | 1.2 | 1 | 2 | 4.23 |
825 | 6 | 1.2 | 1 | 1 | 1.72 |
1050 | 6 | 1.2 | 1 | 2 | 4.15 |
900 | 6 | 1.2 | 1 | 1 | 1.97 |
900 | 6 | 1.5 | 1 | 1 | 2.02 |
750 | 7 | 1.5 | 2 | 1 | 2.35 |
1.4 Uji Asumsi Klasik
Uji asumsi klasik adalah persyaratan statistik yang harus dipenuhi agar hasil analisis regresi dapat diterima
1. Normalitas galat
Maksud normalitas galat adalah error harus menyebar secara normal dengan rata-rata nol dan suatu ragam tertentu. Ada beberapa cara yang bisa dilakukan untuk menguji normalitas galat seperti menggunakan QQ plot dan statistik uji Kolmogorov-Smirnov.
Hipotesis uji normalitas galat:
\(H_0:\) Galat menyebar normal
\(H_1:\) Galat tidak menyebar normal
2. Homoskedastisitas
Homoskedastisitas berarti ragam error bersifat homogen. Statistik uji yang sering digunakan untuk uji homoskedastisitas ini adalah Breusch-Pagan.
Hipotesis uji homoskedastisitas:
\(H_0:\) Ragam error bersifat homoskedastik
\(H_1:\) Ragam error bersifat heteroskedastik
3. Non-autokorelasi
Apabila dalam suatu model terdapat korelasi antara error periode t dan periode t-1 maka terdapat indikasi adanya autokorelasi. Biasanya autokorelasi sering ditemukan pada data time series karena observasi berurutan yang berkaitan antara satu dengan yang lain. Uji statistik yang digunakan untuk mendeteksi adanya autokorelasi adalah Durbin Watson.
4. Non-multikolinieritas
Non-multikolinieritas artinya variabel independen harus saling bebas. Statistik uji yang digunakan untuk menguji kebebasan antar variabel independen adalah Variance Inflation Factor (VIF). Nilai VIF < 10 mengindikasikan bahwa asumsi non-multikolinieritas sudah terpenuhi.
2 SOURCE CODE
2.1 Library yang Dibutuhkan
> library(readxl)
> library(lmtest)
> library(car)
> library(knitr)
2.2 Uji Asumsi Klasik
> #Mendefinisikan variabel
> X1<-data2$`Panjang Jaring (m)`
> X2<-data2$`BBM (lt)`
> X3<-data2$Gt
> X4<-data2$`ABK (Orang)`
> X5<-data2$`Lama Perendaman (Jam)`
> Y<-data2$`Hasil Tangkapan (kg)`
> #Mendefinisikan residu
> Regresi<-lm(Y~X1+X2+X3+X4+X5,data=data2)
> residu<-residuals(Regresi)
- Normalitas Galat
> shapiro.test(residu)
-Wilk normality test
Shapiro
: residu
data= 0.95732, p-value = 0.2642 W
- Asumsi Homoskedastisitas
> library(lmtest)
> bptest(Regresi)
-Pagan test
studentized Breusch
: Regresi
data= 1.4033, df = 5, p-value = 0.9239 BP
- Non-autokorelasi
> dwtest(Regresi)
-Watson test
Durbin
: Regresi
data= 1.5234, p-value = 0.1146
DW : true autocorrelation is greater than 0 alternative hypothesis
- Non-multikolinieritas
> library(car)
> vif(Regresi)
X1 X2 X3 X4 X5 2.886973 1.328452 2.214239 2.061453 2.684999
2.3 Mencari Beta Duga
- Mendefinisikan banyak baris dari data dengan ânâ
> n<-nrow(data2)
- Membuat matriks bernama X yang terdiri dari 6 kolom yaitu kolom pertama berisi angka 1 saja dan kolom 2 sampai 5 berisi nilai variabel independen dengan banyak baris adalah n
> X<-matrix(c(rep(1,n), X1, X2, X3, X4, X5), nrow=n)
- Mendefinisikan banyak kolom dari data dengan âkâ
> k<-ncol(data2)
- Membuat fungsi beta duga dengan dengan argument invers dari transpose X dikalikan X lalu hasil inversnya dikalikan dengan X transpose dikalikan Y
> b_duga<-solve(t(X)%*%X)%*%(t(X)%*%Y)
> b_duga
1]
[,1,] -6.162125184
[2,] 0.004599622
[3,] 0.605846854
[4,] -0.521159598
[5,] 0.232963667
[6,] 1.117152771 [
2.4 Uji Simultan (uji F)
- Membuat fungsi untuk mencari nilai Y duga dengan cara matriks X dikalikan dengan nilai b_duga yang sudah dicari sebelumnya
> Y_duga<-X%*%b_duga
- Mendefinisikan selisih dari vektor Y dan Y_duga sebagai sisa
> sisa<-Y-Y_duga
> sisa
1]
[,1,] 0.707888711
[2,] 0.575506789
[3,] 0.832602824
[4,] 0.526755969
[5,] 0.361540832
[6,] -0.272368808
[7,] 0.005563526
[8,] -0.367340439
[9,] -0.160992560
[10,] 0.020140182
[11,] -0.824379737
[12,] -0.927340439
[13,] -0.459464842
[14,] 0.067631192
[15,] 0.691540832
[16,] -0.546896151
[17,] -0.245074956
[18,] 0.098693603
[19,] -0.257397176
[20,] 0.275620263
[21,] 0.565987036
[22,] 1.672659561
[23,] -0.794436474
[24,] -0.402368808
[25,] -0.612368808
[26,] 0.505620263
[27,] -0.844493211
[28,] -0.341052261
[29,] -0.237397176
[30,] 0.385620263 [
- Mendefinisikan vektor nx1 berisi mean dari nilai Y sebagai Ybar
> Ybar<-rep(mean(Y),n)
- Mencari nilai jumlah kuadrat total (JKT), jumlah kuadrat galat (JKG), dan jumlah kuadrat regresi (JKR)
> JKTotal<-t(Y-Ybar)%*%(Y-Ybar)
> JKGalat<-t(sisa)%*%sisa
> JKRegresi<-JKTotal-JKGalat
> JK<-c(JKRegresi, JKGalat, JKTotal)
> JK
1] 36.53275 10.49015 47.02290 [
- Mencari nilai derajat bebas total, galat, dan regresi
> dbRegresi<-k-1
> dbTotal<-n-1
> dbGalat<-dbTotal-dbRegresi
> db<-c(dbRegresi, dbGalat, dbTotal)
> db
1] 5 24 29 [
- Mencari nilai kuadrat tengah. Rumus untuk mencari kuadrat tengah adalah jumlah kuadrat dibagi dengan derajat bebas
> KT<-JK/db
> KT
1] 7.3065495 0.4370896 1.6214792 [
- Membuat tabel analisis ragam
> SK<-c("Regresi", "Galat", "Total")
> SK
1] "Regresi" "Galat" "Total"
[> anreg<-data.frame("SK"=SK, "JK"=JK, "db"=db, "KT"=KT)
> anreg
SK JK db KT1 Regresi 36.53275 5 7.3065495
2 Galat 10.49015 24 0.4370896
3 Total 47.02290 29 1.6214792
- Menghitung F hitung dan nilai p
> F_hitung<-anreg$KT[1]/anreg$KT[2]
> F_hitung
1] 16.71637
[> pvalue<-pf(F_hitung,anreg$db[1], anreg$db[2], lower.tail = FALSE)
> pvalue
1] 3.899587e-07 [
2.5 Uji Parsial (Uji T)
- Menghitung varian kovarian
> var_cov<-anreg$KT[2]*solve(t(X)%*%X)
> var_cov
1] [,2] [,3] [,4] [,5]
[,1,] 10.454897205 -2.283919e-03 -1.2511052575 -9.401785e-01 0.2040040017
[2,] -0.002283919 1.999985e-06 0.0001476132 5.767783e-05 0.0000736969
[3,] -1.251105258 1.476132e-04 0.2150564808 -1.755330e-01 0.0164265259
[4,] -0.940178496 5.767783e-05 -0.1755330020 2.003770e+00 -0.4979573039
[5,] 0.204004002 7.369690e-05 0.0164265259 -4.979573e-01 0.2599152726
[6,] 0.185843919 -4.283744e-04 0.0045406891 -1.568339e-02 -0.0236758334
[6]
[,1,] 0.1858439189
[2,] -0.0004283744
[3,] 0.0045406891
[4,] -0.0156833869
[5,] -0.0236758334
[6,] 0.1571765770
[> sd<-rep(0,k)
> for (i in 1:k) {
+ sd[i]<-sqrt(var_cov[i,i])
+ }
> sd
1] 3.233403347 0.001414208 0.463741826 1.415545730 0.509818863 0.396455013 [
- Menghitung nilai T dan p
> t<-b_duga/sd
> t
1]
[,1,] -1.9057706
[2,] 3.2524356
[3,] 1.3064313
[4,] -0.3681687
[5,] 0.4569538
[6,] 2.8178551
[> p<-2*pt(abs(t), anreg$db[2], lower.tail=FALSE)
> p
1]
[,1,] 0.068726427
[2,] 0.003381886
[3,] 0.203787869
[4,] 0.715974866
[5,] 0.651813419
[6,] 0.009525395 [
2.6 Koefisien Determinasi (\(R^2\))
> R2<-anreg$JK[1]/anreg$JK[3]
> R2
1] 0.776914 [
2.7 Perhitungan menggunakan function lm (linier model)
- Membentuk regresi antara variabel-variabel independen dengan variabel dependen
> Regresi<-lm(Y~X1+X2+X3+X4+X5,data=data2)
- Mencetak hasil analisis ragam
> anova(Regresi)
Analysis of Variance Table
: Y
ResponsePr(>F)
Df Sum Sq Mean Sq F value 1 31.922 31.922 73.0339 9.619e-09 ***
X1 1 0.806 0.806 1.8436 0.187159
X2 1 0.059 0.059 0.1359 0.715576
X3 1 0.275 0.275 0.6280 0.435842
X4 1 3.471 3.471 7.9403 0.009525 **
X5 24 10.490 0.437
Residuals ---
: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Signif. codes
- Mencetak hasil analisis secara lengkap seperti ringkasan 5 angka dari residual, koefisien penduga, simpangan baku penduga, t hitung, p-value, koefisien determinasi, dan f hitung
> summary(Regresi)
:
Calllm(formula = Y ~ X1 + X2 + X3 + X4 + X5, data = data2)
:
Residuals
Min 1Q Median 3Q Max -0.92734 -0.39361 -0.07771 0.47562 1.67266
:
CoefficientsPr(>|t|)
Estimate Std. Error t value -6.162125 3.233403 -1.906 0.06873 .
(Intercept) 0.004600 0.001414 3.252 0.00338 **
X1 0.605847 0.463742 1.306 0.20379
X2 -0.521160 1.415546 -0.368 0.71597
X3 0.232964 0.509819 0.457 0.65181
X4 1.117153 0.396455 2.818 0.00953 **
X5 ---
: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Signif. codes
: 0.6611 on 24 degrees of freedom
Residual standard error-squared: 0.7769, Adjusted R-squared: 0.7304
Multiple R-statistic: 16.72 on 5 and 24 DF, p-value: 3.9e-07 F
- Mencetak koefisien regresi dari model
> coef(Regresi)
(Intercept) X1 X2 X3 X4 X5 -6.162125184 0.004599622 0.605846854 -0.521159598 0.232963667 1.117152771
- Mencetak matriks ragam peragam dari regresi
> vcov(Regresi)
(Intercept) X1 X2 X310.454897205 -2.283919e-03 -1.2511052575 -9.401785e-01
(Intercept) -0.002283919 1.999985e-06 0.0001476132 5.767783e-05
X1 -1.251105258 1.476132e-04 0.2150564808 -1.755330e-01
X2 -0.940178496 5.767783e-05 -0.1755330020 2.003770e+00
X3 0.204004002 7.369690e-05 0.0164265259 -4.979573e-01
X4 0.185843919 -4.283744e-04 0.0045406891 -1.568339e-02
X5
X4 X50.2040040017 0.1858439189
(Intercept) 0.0000736969 -0.0004283744
X1 0.0164265259 0.0045406891
X2 -0.4979573039 -0.0156833869
X3 0.2599152726 -0.0236758334
X4 -0.0236758334 0.1571765770 X5
- Menyimpan summary dari regresi dengan nama model
> model<-summary(Regresi)
- Mencetak koefisien determinasi dari regresi
> model$r.squared
1] 0.776914 [
3 HASIL DAN PEMBAHASAN
3.1 Uji Asumsi Klasik
- Asumsi Normalitas Galat
Uji | P-value |
---|---|
Shapiro-wilk | 0.2642 |
Karena p-value lebih dari 0.05 maka sisaan galat berdistribusi normal
2. Asumsi Homoskedastisitas
Uji | P-value |
---|---|
Breusch-Pagan | 0.9239 |
Karena p-value lebih dari 0.05 maka asumsi homoskedastisitas terpenuhi
3. Asumsi non-autokorelasi
Uji | P-value |
---|---|
Durbin-Watson | 0.1146 |
Karena p-value lebih dari 0.05 maka tidak dapat autokorelasi pada sisaan
- Asumsi non-multikolinieritas
Variabel | VIF |
---|---|
X1 | 2.886973 |
X2 | 1.328452 |
X3 | 2.214239 |
X4 | 2.061453 |
X5 | 2.684999 |
Karena semua VIF < 10 maka dapat disimpulkan bahwa asumsi non-multikolinieritas terpenuhi
Semua asumsi klasik sudah terpenuhi sehingga analisis regresi berganda dapat dilakukan.
3.2 Koefisien Regresi (Nilai Beta Duga)
[1,] -6.162125184 #Beta duga nol
[2,] 0.004599622 #Beta duga 1
[3,] 0.605846854 #Beta duga 2
[4,] -0.521159598 #Beta duga 3
[5,] 0.232963667 #Beta duga 4
[6,] 1.117152771 #Beta duga 5
Dari nilai beta duga di atas, diperoleh model regresi linier berganda \[Y=-6.16212+ 0.00459X_1+0.60585X_2-0.52116X_3+0.23296X_4+1.11715X_5\] - Koefisien konstanta bernilai negatif artinya ketika mengasumsikan tidak terdapat kelima variabel independen (panjang jaring, jumlah BBM, Gt, jumlah ABK, dan lama perendaman) maka hasil penangkapan ikan senangin mengalami penurunan.
- Koefisien regresi panjang jaring bernilai positif artinya ketika mengasumsikan tidak terdapat variabel independen lain maka apabila jaring lebih panjang maka hasil penangkapan ikan senangin mengalami peningkatan.
- Koefisien regresi jumlah BBM bernilai positif artinya ketika mengasumsikan tidak terdapat variabel independen lain maka apabila jumlah BBM mengalami peningkatan maka hasil penangkapan ikan senangin mengalami peningkatan.
- Koefisien regresi Gt bernilai negatif artinya ketika mengasumsikan tidak terdapat variabel independen lain maka apabila Gt mengalami peningkatan maka hasil penangkapan ikan senangin mengalami penurunan.
- Koefisien regresi jumlah ABK bernilai positif artinya ketika mengasumsikan tidak terdapat variabel independen lain maka apabila jumlah ABK mengalami peningkatan maka hasil penangkapan ikan senangin mengalami peningkatan.
- Koefisien regresi lama perendaman bernilai positif artinya ketika mengasumsikan tidak terdapat variabel independen lain maka apabila lama perendaman ditambah maka hasil penangkapan ikan senangin mengalami peningkatan.
3.3 Tabel Analisis Ragam Uji Simultan
SK | JK | db | KT | Fhit | p-value |
---|---|---|---|---|---|
Regresi | 36.53275 | 5 | 7.3065495 | 16.71637 | 3.899587e-07 |
Galat | 10.49015 | 24 | 0.4370896 | ||
Total | 47.02290 | 29 | 1.6214792 |
Berdasarkan tabel analisis ragam uji simultan, diperoleh nilai F sebesar 16.72
dengan p value yang sangat kecil sehingga dapat membuktikan bahwa secara simultan, X1 (Panjang jaring), X2 (BBM), X3 (Gt), X4 (ABK), dan X5 (lama perendaman) secara signifikan mempengaruhi Y (hasil penangkapan ikan senangin). Hasil analisis ini sesuai dengan kondisi nyatanya. Apabila faktor-faktor produksi ini dimanfaatkan dengan baik maka hasil tangkapan ikan senangin bisa meningkat. Akan tetapi, untuk mengetahui secara spesifik faktor apa saja yang mempengaruhi hasil tangkapan ikan senangin maka perlu dilakukan uji parsial.
3.4 Uji Parsial
Variabel | p-value |
---|---|
intercept | 0.068726427 |
\(X_1\) | 0.003381886 |
\(X_2\) | 0.203787869 |
\(X_3\) | 0.715974866 |
\(X_4\) | 0.651813419 |
\(X_5\) | 0.009525395 |
Berdasarkan hasil p-value uji parsial diperoleh bahwa:
- p-value dari \(X_1\) sangat kecil sehingga variabel \(X_1\) (panjang jaring) secara signifikan mempengaruhi hasil tangkapan ikan senangin
- p-value dari \(X_2\) besar sehingga variabel \(X_2\) (jumlah BBM) tidak mempengaruhi hasil tangkapan ikan senangin
- p-value dari \(X_3\) besar sehingga variabel \(X_3\) (Gt) tidak mempengaruhi hasil tangkapan ikan senangin
- p-value dari \(X_4\) besar sehingga variabel \(X_4\) (jumlah ABK) tidak mempengaruhi hasil tangkapan ikan senangin
- p-value dari \(X_5\) sangat kecil sehingga variabel \(X_5\) (lama perendaman) secara signifikan mempengaruhi hasil tangkapan ikan senangin.
Berdasarkan hasil uji parsial, hanya faktor panjang jaring dan lama perendaman saja yang berpengaruh signifikan terhadap hasil tangkapan ikan senangin. Dengan jaring yang semakin panjang maka jangkauan jaring untuk menangkap ikan semakin lebar sehingga memperbesar kemungkinan hasil tangkapan meningkat. Selain itu, semakin lama jaring direndam maka semakin besar kemungkinan ikan yang akan tertangkap makin banyak sehingga hasil analisis parsial ini sudah sesuai.
3.5 Koefisien Determinasi (\(R^2\))
Dari hasil analisis diperoleh koefisien determinasi (\(R^2\)) sebesar 0.776914
yang artinya bahwa variabel independen dapat menjelaskan variabel dependen sebesar 0.776914
atau 77.69%
dan sisanya dijelaskan oleh faktor lain di luar model.
3.6 Statistika Deskriptif
> summary(data2)
Jaring (m) BBM (lt) Gt ABK (Orang)
Panjang : 750.0 Min. :6.0 Min. :1.20 Min. :1.000
Min. : 825.0 1st Qu.:6.0 1st Qu.:1.20 1st Qu.:1.000
1st Qu.: 900.0 Median :6.0 Median :1.20 Median :1.000
Median : 927.5 Mean :6.1 Mean :1.27 Mean :1.133
Mean : 990.0 3rd Qu.:6.0 3rd Qu.:1.20 3rd Qu.:1.000
3rd Qu.:1200.0 Max. :7.0 Max. :1.50 Max. :2.000
Max. Perendaman (Jam) Hasil Tangkapan (kg)
Lama :1.000 Min. :1.380
Min. :1.000 1st Qu.:1.982
1st Qu.:1.000 Median :2.815
Median :1.467 Mean :3.040
Mean :2.000 3rd Qu.:4.025
3rd Qu.:2.000 Max. :5.340
Max. > boxplot(data2, main="Faktor Produksi Hasil Tangkapan Ikan Senangin")
Berdasarkan Data yang digunakan, diperoleh nilai rataan panjang jaring sebesar 927.5 meter, BBM sebesar 6.1 liter, Gt sebesar 1.27, ABK sebanyak 1.133 atau 1 orang, lama perendaman selama 1.467 jam, dan hasil tangkapan sebanyak 3.040 kg.
Pada boxplot faktor produksi hasil tangkapan ikan senangin, diketahui panjang jaring memiliki nilai tengah paling besar daripada faktor produksi lain seperti Gt, ABK, lama perendaman, dan hasil tangkapan.
4 DAFTAR PUSTAKA
Fauzi, A. (2021). Pengaruh Faktor-Faktor Produksi Terhadap Hasil tangkapan Ikan Senangin (Eleutheronema tetradactylum) di Kelurahan Kampung Nelayan Kabupaten Tanjung Jabung Barat (Doctoral dissertation, pemanfaatan sumberdaya perikanan).
Janie, D. N. A. (2012). Statistik deskriptif & regresi linier berganda dengan SPSS. Jurnal, April.
Kurniawan, D. (2008). Regresi linier. R-Foundation for Statistical Computing. Vienna, Austria, 17.