Faktor-faktor yang Mempengaruhi Pendapatan Usaha Pelabuhan dengan Regresi Logistik
Pendahuluan
Pelabuhan adalah tempat yang terdiri dari daratan dan perairan di sekitarnya dengan batas-batas tertentu sebagai tempat kegiatan pemerintah dan ekonomi yang digunakan sebagai tempat kapal bersandar, berlabuh, naik turun penumpang dan/atau bongkar muat barang yang dilengkapi dengan fasilitas keselamatan pelayaran dan kegiatan penunjang pelabuhan serta sebagai tempat perpindahan intra dan antar moda transportasi.
Menurut Peraturan Pemerintah No.1 Tahun 1969, sumber pendapatan pelabuhan berasal dari : a. pungutan atas jasa-jasa fasilitas pelabuhan b. anggaran Pemerintah c. Sumber-sumber lainnya
Tujuan Penelitian
Tujuan dari penelitian ini adalah ingin mengetahui variabel-variabel apa saja yang mempengaruhi pendapatan usaha pelabuhan.
Konsep dan Definisi
Data yang digunakan bersumber dari Survei Dwelling Time 2019 (SDT2019) yang dilakukan oleh Badan Pusat Statistik. SDT2019 terdiri dari SDT2019-Pelabuhan dan SDT2019-Perusahaan. Untuk penelitian ini, hanya akan digunakan data dari hasil SDT2019-Pelabuhan.
Dalam SDT2019-Pelabuhan terdapat 111 sampel pelabuhan yang hanya mencakup pelabuhan diusahakan yang dikelola oleh PT Pelabuhan Indonesia (Pelindo) I, II, III, dan IV.
Dalam penelitian ini, akan dikaji mengenai variabel-variabel yang berpengaruh terhadap pendapatan pelabuhan. Berikut adalah konsep dan definisi dari variabel-variabel yang akan dikaji :
Pendapatan Pelabuhan
Pendapatan usaha kepelabuhan adalah faktor yang merepresentasikan membaik atau memburuknya prospek usaha kepelabuhanan. Berbagai faktor mempengaruhi tinggi rendahnya pendapatan usaha tersebut, meliputi:
faktor kebijakan pemerintah (Kebijakan tentang pajak dan tarif)
faktor internal pelabuhan (tingkat pelayanan dan pandu, teknologi, penanganan petikemas, tol laut, investasi, dll)
faktor alam (pendangkalan dermaga, cuaca, dll)
faktor ekonomi (Kegiatan usaha pelaku bisnis, permintaan dan arus distribusi barang, kondisi perekonomian daerah setempat, arus mudik lebaran, tinggi rendahnya kunjungan kapal, ada tidaknya kunjungan kapal asing, dan banyaknya volume muatan kapal)
Pendapatan pelabuhan adalah suatu variabel dependent yang berskala biner yaitu “Meningkat” dan “Menurun”. Pendapatan meningkat akan diberi kode “1” dan pendapatan menurun akan diberi kode “0”
Rata-Rata Kunjungan Kapal
Rata-rata kunjungan kapal adalah rata-rata jumlah kapal (dalam satuan unit) yang datang di pelabuhan baik untuk berlabuh di perairan maupun bersandar di dermaga.
Rata-rata Barang yang Dibongkar
Rata-rata bongkar adalah volume rata-rata barang yang dibongkar ke kapal dari pelabuhan asal di Indonesia atau luar negeri.
Rata-rata Kinerja Bongkar Muat Barang
Rata-rata Kinerja Bongkar Muat Barang adalah rata-rata kecepatan operasi bongkar/muat barang non petikemas (dalam satuan T/G/H);
Rata-rata Kinerja Bongkar Muat Kontainer
Rata-rata kinerja bongkar muat kontainer adalah rata-rata kecepatan operasi bongkar/muat petikemas (dalam satuan B/C/H).
Kegiatan Angkutan Laut yang Dilayani
Kegiatan angkutan laut yang dilayani adalah variabel biner dengan kode “1” untuk hanya melayani kegiatan angkutan dalam negeri dan kode “0” untuk melayani kegiatan angkutan dalam dan luar negeri.
Kepemilikan Fasilitas Lapangan Penumpukan Petikemas
Kepemilikan Fasilitas Container Yard adalah variabel biner dengan kode “1” untuk pelabuhan yang memiliki fasilitas lapangan penumpukan petikemas dan kode “0” untuk pelabuhan yang tidak memiliki lapangan penumpukan petikemas.
Metode Penelitian
Regresi logistik merupakan salah satu jenis regresi yang menghubungkan antara satu atau beberapa variabel independen (variabel bebas) dengan variabel dependen yang berupa kategori; biasanya 0 dan 1. Jenis variabel independen berupa kategori inilah yang membedakan regresi logistik dengan regresi berganda atau regresi linear lainnya.
Nilai kategori biasanya tertulis 0 dan 1. 0 biasanya digunakan untuk kategori “tidak” atau “belum”. Sedangkan angka 1 biasanya digunakan untuk mendeskripsikan responden yang bersesuaian dengan maksud penelitian.
Apabila pada regresi linier dengan OLS mewajibkan syarat atau asumsi bahwa error varians (residual) terdistribusi secara normal. Sebaliknya, pada regresi ini tidak dibutuhkan asumsi tersebut sebab pada regresi jenis logistik ini mengikuti distribusi logistik.
Karena nilai Dependen berupa kategori 0 dan 1, tentunya penjelasan persamaan yang menghubungkan antara variabel independen dan variabel dependen tidak bisa dilakukan secara linear seperti yang dilakukan pada regresi umumnya. Maka penggunaan regresi logistik diperlukan untuk menghitung peluang kecenderungan responden untuk bernilai 0 hingga 1.
Tujuan Penggunaan Regresi Logistik
- Menghitung Peluang
Persamaan yang diperoleh dari proses regresi logistik, dapat digunakan untuk menghitung peluang responden diluar responden yang termasuk dalam penelitian. Contoh yang dapat dipahami adalah proses pengajuan kredit. Pihak bank biasanya melakukan evaluasi kelayakan seseorang layak atau tidak untuk menerima kredit pinjaman dari bank. Beberapa pertanyaan diberikan kepada pihak bank terhadap calon penerima kredit. Pertanyaan yang diberikan seputar karakteristik variabel calon penerima modal tersebut merupakan variabel independen yang akan diinput oleh petugas bank kedalam model. Dari beberapa variabel yang dipertanyakan itulah, petugas bank dapat menentukan peluang calon penerima kredit tersebut untuk bisa mengembalikan pinjaman atau tidak, nilai antara 0 – 1.
- Melihat karakteristik
Regresi logistik juga sering digunakan untuk melihat perbedaan karakteristik antara 2 kelompok. Contohnya dalam penggambaran karakteristik petani anorganik dan petani organik. Hasil kesimpulan bahwa peluang petani mampu beralih dari anorganik ke organik adalah karena perbedaan harga produk hasil kedua proses tersebut. Petani organik bersedia beralih dari anorganik ke organik meskipun produktivitas organik lebih kecil dibanding anorganik. Namun, perbedaan harga yang tinggi menjadikan petani organik memiliki pendapatan yang lebih tinggi dibandingkan petani anorganik.
- Faktor yang Mempengaruhi
Tujuan ketiga ini merupakan pengembangan dari tujuan kedua, peneliti mampu mengetahui faktor yang mempengaruhi mengapa terdapat perbedaan antara kedua kelompok tersebut. Nilai odds ratio yang tinggi menandakan varaibel tersebut memiliki pengaruh yang tinggi terhadap pemilihan beda dari responden. Tujuan untuk mengetahui faktor yang mempengaruhi ini adalah diharapkan faktor yang signifikan mempengaruhi tersebut merupakan faktor yang bisa diatur oleh peneliti atau pengambil kebijakan sehingga bisa menggiring responden lainnya untuk berbuat yang sama terhadap responden yang bernilai 1 sebelumnya.
Model Persamaan Regresi Logistik
Regresi linier mempunyai persamaan
\[\mathrm{Y} = B_0 + B_1X_1 + ...+ B_nX_n + \epsilon \]
Dimana b0 sebagai intercept, b1 hingga bn adalah koefisien, dan e adalah error varians atau residual.
Sedangkan pada regresi logistik menggunakan persamaan :
\[\mathrm{Ln\left[ \frac{p}{(1-p)} \right]} = B_0 + B_1X \] Nilai p atau peluang (Y=1) dapat dicari dengan persamaan :
\[\mathrm{p} = \frac{e^{B_0+B_1X}}{(1+e^{B_0+B_1X})} \]
Pembahasan
Tujuan dari penelitian ini adalah untuk mengetahui faktor-faktor yang berpengaruh terhadap pendapatan usaha pelabuhan yang memiliki skala dikotomi yaitu “Meningkat” atau “Menurun”. Sedangkan variabel-variabel bebas yang dikaji adalah Rata-rata kunjungan kapal, Rata-rata barang yang dibongkar, Kinerja Bongkar Muat Barang, Kinerja Bongkar Muat Petikemas, Kegiatan Angkutan Laut yang dilayani, dan Kepemilikan Fasilitas Container Yard.
Berikut adalah data yang digunakan :
Eksplorasi Data
Variabel Penelitian
| Variabel | Data | Keterangan |
|---|---|---|
| X1 | Kunjungan Kapal | Numerik |
| X2 | Rata-rata Barang yang Dibongkar | Numerik |
| X3 | Kinerja Bongkar Muat Barang | Numerik |
| X4 | Kinerja Bongkar Petikemas | Numerik |
| X5 | Kegiataan Angkutan Laut | Kategorik |
| X6 | Kepemilikan Fasilitas Lapangan Penumpukan | Kategorik |
| Y | Pendapatan Pelabuhan | Kategorik |
Visualisasi data pada data Pelabuhan dibedakan menjadi visualisasi data numerik dengan menggunakan histrogram dan kategorik dengan menggunakan diagram batang.
Rata-rata kunjungan Kapal
ggplot(dataPelabuhan, aes(KK,fill=..count..)) +
geom_histogram(aes(y=..density..)) +
geom_density(alpha=.2, fill="purple") Rata-rata barang yang dibongkar
ggplot(dataPelabuhan, aes(Bongkar,fill=..count..)) +
geom_histogram(aes(y=..density..)) +
geom_density(alpha=.2, fill="purple")Rata-rata kinerja bongkar muat barang
ggplot(dataPelabuhan, aes(KinerjaBarang,fill=..count..)) +
geom_histogram(aes(y=..density..)) +
geom_density(alpha=.2, fill="purple") Rata-rata kinerja bongkar muat petikemas
ggplot(dataPelabuhan, aes(KinerjaKontainer,fill=..count..)) +
geom_histogram(aes(y=..density..)) +
geom_density(alpha=.2, fill="purple")Kegiatan Angkutan Laut yang Dilayani
ggplot(dataPelabuhan, aes(x=KegAngLaut))+
geom_bar(stat="count", width=0.7, fill="#E69F00")+
theme_minimal()Kepemilikan Fasilitas Lapangan Penumpukan
ggplot(dataPelabuhan, aes(x=FasilitasCY))+
geom_bar(stat="count", width=0.7, fill="#E69F00")+
theme_minimal()Model Regresi Logistik
Model 1
Akan dimasukkan semua variabel independent ke dalam model, sehingga model yang didapatkan adalah :
reglog <- glm(Pendapatan ~ KK+Bongkar+KinerjaBarang+KinerjaKontainer+KegAngLaut+FasilitasCY, data=dataPelabuhan, family=binomial)
summary(reglog)##
## Call:
## glm(formula = Pendapatan ~ KK + Bongkar + KinerjaBarang + KinerjaKontainer +
## KegAngLaut + FasilitasCY, family = binomial, data = dataPelabuhan)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -1.66372 -0.02596 0.00000 0.00070 1.82094
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -1.222e+01 8.105e+00 -1.508 0.1316
## KK 4.108e-02 2.162e-02 1.900 0.0574 .
## Bongkar 1.425e-03 7.671e-04 1.858 0.0632 .
## KinerjaBarang -1.476e-01 7.607e-02 -1.940 0.0523 .
## KinerjaKontainer 1.324e-01 8.492e-02 1.559 0.1190
## KegAngLaut 5.074e+00 5.842e+00 0.869 0.3851
## FasilitasCY 5.730e+00 2.594e+00 2.209 0.0272 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 119.675 on 86 degrees of freedom
## Residual deviance: 13.595 on 80 degrees of freedom
## AIC: 27.595
##
## Number of Fisher Scoring iterations: 13
Berdasarkan dari Model 1 masih ditemui variabel yang tidak berpengaruh signifikan terhadap model, karena nilai p-value > α=5% sehingga variabel yang tidak berpengaruh harus dihilangkan. Mengeliminasi variabel prediktor dengan cara backward. Untuk langkah selanjutnya adalah menghilangkan variabel Kinerja Kontainer dan Kegiatan Angkutan Laut.
Model 2
reglog2 <- glm(Pendapatan ~ KK+Bongkar+KinerjaBarang+FasilitasCY, data=dataPelabuhan, family=binomial)
summary(reglog2)##
## Call:
## glm(formula = Pendapatan ~ KK + Bongkar + KinerjaBarang + FasilitasCY,
## family = binomial, data = dataPelabuhan)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -1.31020 -0.12832 0.00000 0.01176 2.64300
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -3.3651930 1.8297631 -1.839 0.0659 .
## KK 0.0243944 0.0112639 2.166 0.0303 *
## Bongkar 0.0009207 0.0004625 1.991 0.0465 *
## KinerjaBarang -0.0760275 0.0379170 -2.005 0.0450 *
## FasilitasCY 3.7449231 1.5144524 2.473 0.0134 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 119.675 on 86 degrees of freedom
## Residual deviance: 18.082 on 82 degrees of freedom
## AIC: 28.082
##
## Number of Fisher Scoring iterations: 13
Pada model 2, semua variabel independent sudah signifikan terhadap respon. Sehingga, akan digunakan model 2 dengan variabel independent Rata-rata Kunjungan Kapal, Rata-rata Barang yanng Dibongkar, Kinerja Bongkar Muat Barang, dan Kepemilikan Fasilitas Lapangan Penumpukan Petikemas.
Uji Kesesuaian Model
Goodness of Fit Test
Pengujian kesesuain model menggunakan uji Hosmer-Lemeshow Goodness of Fit Test.
H0 : Model sesuai (tidak terdapat perbedaan yang signifikan antara pengamatan dengan kemungkinan hasil prediksi)
H1 : Model tidak sesuai (terdapat perbedaan yang signifikan antara pengamatan dengan kemungkinan hasil prediksi)
Hipotesis 0 ditolak jika p value < alfa 5% atau nilai chsquare > chisquare tabel
library(ResourceSelection)
hoslem.test(reglog2$y, fitted(reglog2))##
## Hosmer and Lemeshow goodness of fit (GOF) test
##
## data: reglog2$y, fitted(reglog2)
## X-squared = 1.1366, df = 8, p-value = 0.9972
qchisq(0.95, 8)## [1] 15.50731
Nilai chsquare = 1.1366 < chisquare tabel = 15.50731, yang artinya model sesuai atau tidak ada perbedaan antara hasil pengamatan dengan kemungkinan hasil prediksi
Pseudo R2
pscl::pR2(reglog2)["McFadden"]## fitting null model for pseudo-r2
## McFadden
## 0.8489059
Untuk mengukur kebaikan model juga dapat dilakukan dengan meilhat nilai koefisien determinasi, nilai koefisien determinasi pada model adalah 0.8489059 atau 84.89%. Artinya variabel yang ada dalam model dapat menjelaskan 84.89% dari pendapatan pelabuhan, sedangkan 15.11% sisanya dijelaskan oleh variabel lain di luar model.
Klasifikasi Model
Selanjutnya, model yang sudah didapatkan akan digunakan untuk membangun model machine learning untuk mengklasifikasikan pendapatan pelabuhan.
Menjadikan factor
Variabel kategorik akan dijadikan factor terlebih dahulu
dataPelabuhan$Pendapatan <- as.factor(dataPelabuhan$Pendapatan)
dataPelabuhan$FasilitasCY <- as.factor(dataPelabuhan$FasilitasCY)Split Data
Data akan dibagi menjadi Data Latih dan Data Uji dengan perbandingan 80:20
set.seed(98)
pel <- sample(2, nrow(dataPelabuhan), replace = TRUE, prob = c(0.8, 0.2))
dataLatih <- dataPelabuhan[pel==1,]
dataUji <- dataPelabuhan[pel==2,]Berikut adalah Data yang digunakan sebagai Data Latih sebanyak 74 observasi
Berikut adalah Data yang digunakan sebagai Data Uji sebanyak 13 observasi
Membuat Model Regresi Logistik
Akan dibuat model regresi logistik pada Data Latih dengan variabel yang sama dengan sebelumnya pada model ke-2
model1 <- glm(Pendapatan ~ KK+Bongkar+KinerjaBarang+FasilitasCY, data = dataLatih, family = "binomial")
summary(model1)##
## Call:
## glm(formula = Pendapatan ~ KK + Bongkar + KinerjaBarang + FasilitasCY,
## family = "binomial", data = dataLatih)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -1.3261 -0.1278 0.0000 0.0229 2.4428
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -4.0015598 2.2279713 -1.796 0.0725 .
## KK 0.0262172 0.0124928 2.099 0.0359 *
## Bongkar 0.0008457 0.0004842 1.747 0.0807 .
## KinerjaBarang -0.0568729 0.0386677 -1.471 0.1413
## FasilitasCY1 2.8726157 1.5760353 1.823 0.0684 .
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 101.230 on 73 degrees of freedom
## Residual deviance: 16.776 on 69 degrees of freedom
## AIC: 26.776
##
## Number of Fisher Scoring iterations: 13
Prediksi
library(dplyr)
probabilitas <- model1 %>% predict(dataUji, type = "response")
prediksi <- ifelse(probabilitas> 0.8, "1", "0")
tab1 <- table(Predicted = prediksi, Actual=dataUji$Pendapatan)
tab1## Actual
## Predicted 0 1
## 0 7 1
## 1 0 5
testAcc=(sum(diag(tab1))/sum(tab1))*100
round(testAcc,2)## [1] 92.31
Hasil prediksi menunjukkan bahwa berdasarkan data uji, dari 13 observasi, terdapat 7 pelabuhan yang pendapatannya menurun. Model berhasil memprediksi dengan tepat sebanyak 7 pelabuhan. Serta terdapat 6 observasi pelabuhan yang pendapatannya meningkat dan model berhasil memprediksi dengan tepat sebanyak 5 pelabuhan sedangkan 1 pelabuhan lainnya diprediksi memiliki pendapatan menurun. Sehingga keakuratan model dalam memprediksi adalah 92.31%.
Kesimpulan dan Saran
Kesimpulan
Berdasarkan hasil penelitian, dapat disimpulkan dari 6 variabel bebas yang dimodelkan, hanya 4 variabel bebas yang signifikan dalam mempengaruhi pendapatan usaha pelabuhan yaitu Rata-rata kunjungan kapal, Rata-rata barang yang dibongkar, Kinerja Bongkar Muat Barang, dan Kepemilikan Fasilitas Lapangan Penumpukan Petikemas.
Berdasarkan uji kesesuaian model, model yang dibuat dapat menjelaskan 84.89% dari pendapatan usaha pelabuhan, sedangkan 15.11% sisanya dijelaskan oleh faktor lain di luar model. Dan dari hasil goodness of fit test, model sudah sesuai untuk prediksi.
Berdasarkan pengujian prediksi model, dengan membagi data menjadi data latih dan data uji, keakuratan model dalam memprediksi adalah 92.31%.
Saran
Perlu dikaji faktor-faktor atau variabel lain yang dapat mempengaruhi pendapatan usaha pelabuhan
Perlu data yang lebih besar untuk keakuratan model jika dimungkinan
Daftar Pustaka
Anisa,R., Dito, G.A., dan Nurussadad,A.A. (11 Maret 2021).3STA581-05 - Logistics Regression. https://rpubs.com/nurussadad/STA581-05-regresi-logistik
BPS.2020.Laporan Survei Dwelling Time 2019.
https://www.statistikian.com/2015/02/regresi-logistik.html
https://agungbudisantoso.com/pengertian-tutorial-dan-interpretasi-regresi-logistik-dengan-spss/
https://rpubs.com/alfazrinb/regresi-dan-klasifikasi-logistik-biner