Faktor-faktor yang Mempengaruhi Pendapatan Usaha Pelabuhan dengan Regresi Logistik

Pendahuluan

Pelabuhan adalah tempat yang terdiri dari daratan dan perairan di sekitarnya dengan batas-batas tertentu sebagai tempat kegiatan pemerintah dan ekonomi yang digunakan sebagai tempat kapal bersandar, berlabuh, naik turun penumpang dan/atau bongkar muat barang yang dilengkapi dengan fasilitas keselamatan pelayaran dan kegiatan penunjang pelabuhan serta sebagai tempat perpindahan intra dan antar moda transportasi.

Menurut Peraturan Pemerintah No.1 Tahun 1969, sumber pendapatan pelabuhan berasal dari : a. pungutan atas jasa-jasa fasilitas pelabuhan b. anggaran Pemerintah c. Sumber-sumber lainnya

Tujuan Penelitian

Tujuan dari penelitian ini adalah ingin mengetahui variabel-variabel apa saja yang mempengaruhi pendapatan usaha pelabuhan.

Konsep dan Definisi

Data yang digunakan bersumber dari Survei Dwelling Time 2019 (SDT2019) yang dilakukan oleh Badan Pusat Statistik. SDT2019 terdiri dari SDT2019-Pelabuhan dan SDT2019-Perusahaan. Untuk penelitian ini, hanya akan digunakan data dari hasil SDT2019-Pelabuhan.

Dalam SDT2019-Pelabuhan terdapat 111 sampel pelabuhan yang hanya mencakup pelabuhan diusahakan yang dikelola oleh PT Pelabuhan Indonesia (Pelindo) I, II, III, dan IV.

Dalam penelitian ini, akan dikaji mengenai variabel-variabel yang berpengaruh terhadap pendapatan pelabuhan. Berikut adalah konsep dan definisi dari variabel-variabel yang akan dikaji :

Pendapatan Pelabuhan

Pendapatan usaha kepelabuhan adalah faktor yang merepresentasikan membaik atau memburuknya prospek usaha kepelabuhanan. Berbagai faktor mempengaruhi tinggi rendahnya pendapatan usaha tersebut, meliputi:

faktor kebijakan pemerintah (Kebijakan tentang pajak dan tarif)
faktor internal pelabuhan (tingkat pelayanan dan pandu, teknologi, penanganan petikemas, tol laut, investasi, dll)
faktor alam (pendangkalan dermaga, cuaca, dll)
faktor ekonomi (Kegiatan usaha pelaku bisnis, permintaan dan arus distribusi barang, kondisi perekonomian daerah setempat, arus mudik lebaran, tinggi rendahnya kunjungan kapal, ada tidaknya kunjungan kapal asing, dan banyaknya volume muatan kapal)

Pendapatan pelabuhan adalah suatu variabel dependent yang berskala biner yaitu “Meningkat” dan “Menurun”. Pendapatan meningkat akan diberi kode “1” dan pendapatan menurun akan diberi kode “0”

Rata-Rata Kunjungan Kapal

Rata-rata kunjungan kapal adalah rata-rata jumlah kapal (dalam satuan unit) yang datang di pelabuhan baik untuk berlabuh di perairan maupun bersandar di dermaga.

Rata-rata Barang yang Dibongkar

Rata-rata bongkar adalah volume rata-rata barang yang dibongkar ke kapal dari pelabuhan asal di Indonesia atau luar negeri.

Rata-rata Kinerja Bongkar Muat Barang

Rata-rata Kinerja Bongkar Muat Barang adalah rata-rata kecepatan operasi bongkar/muat barang non petikemas (dalam satuan T/G/H);

Rata-rata Kinerja Bongkar Muat Kontainer

Rata-rata kinerja bongkar muat kontainer adalah rata-rata kecepatan operasi bongkar/muat petikemas (dalam satuan B/C/H).

Kegiatan Angkutan Laut yang Dilayani

Kegiatan angkutan laut yang dilayani adalah variabel biner dengan kode “1” untuk hanya melayani kegiatan angkutan dalam negeri dan kode “0” untuk melayani kegiatan angkutan dalam dan luar negeri.

Kepemilikan Fasilitas Lapangan Penumpukan Petikemas

Kepemilikan Fasilitas Container Yard adalah variabel biner dengan kode “1” untuk pelabuhan yang memiliki fasilitas lapangan penumpukan petikemas dan kode “0” untuk pelabuhan yang tidak memiliki lapangan penumpukan petikemas.

Metode Penelitian

Regresi logistik merupakan salah satu jenis regresi yang menghubungkan antara satu atau beberapa variabel independen (variabel bebas) dengan variabel dependen yang berupa kategori; biasanya 0 dan 1. Jenis variabel independen berupa kategori inilah yang membedakan regresi logistik dengan regresi berganda atau regresi linear lainnya.

Nilai kategori biasanya tertulis 0 dan 1. 0 biasanya digunakan untuk kategori “tidak” atau “belum”. Sedangkan angka 1 biasanya digunakan untuk mendeskripsikan responden yang bersesuaian dengan maksud penelitian.

Apabila pada regresi linier dengan OLS mewajibkan syarat atau asumsi bahwa error varians (residual) terdistribusi secara normal. Sebaliknya, pada regresi ini tidak dibutuhkan asumsi tersebut sebab pada regresi jenis logistik ini mengikuti distribusi logistik.

Karena nilai Dependen berupa kategori 0 dan 1, tentunya penjelasan persamaan yang menghubungkan antara variabel independen dan variabel dependen tidak bisa dilakukan secara linear seperti yang dilakukan pada regresi umumnya. Maka penggunaan regresi logistik diperlukan untuk menghitung peluang kecenderungan responden untuk bernilai 0 hingga 1.

Tujuan Penggunaan Regresi Logistik

Menghitung Peluang

Persamaan yang diperoleh dari proses regresi logistik, dapat digunakan untuk menghitung peluang responden diluar responden yang termasuk dalam penelitian. Contoh yang dapat dipahami adalah proses pengajuan kredit. Pihak bank biasanya melakukan evaluasi kelayakan seseorang layak atau tidak untuk menerima kredit pinjaman dari bank. Beberapa pertanyaan diberikan kepada pihak bank terhadap calon penerima kredit. Pertanyaan yang diberikan seputar karakteristik variabel calon penerima modal tersebut merupakan variabel independen yang akan diinput oleh petugas bank kedalam model. Dari beberapa variabel yang dipertanyakan itulah, petugas bank dapat menentukan peluang calon penerima kredit tersebut untuk bisa mengembalikan pinjaman atau tidak, nilai antara 0 – 1.

Melihat karakteristik

Regresi logistik juga sering digunakan untuk melihat perbedaan karakteristik antara 2 kelompok. Contohnya dalam penggambaran karakteristik petani anorganik dan petani organik. Hasil kesimpulan bahwa peluang petani mampu beralih dari anorganik ke organik adalah karena perbedaan harga produk hasil kedua proses tersebut. Petani organik bersedia beralih dari anorganik ke organik meskipun produktivitas organik lebih kecil dibanding anorganik. Namun, perbedaan harga yang tinggi menjadikan petani organik memiliki pendapatan yang lebih tinggi dibandingkan petani anorganik.

Faktor yang Mempengaruhi

Tujuan ketiga ini merupakan pengembangan dari tujuan kedua, peneliti mampu mengetahui faktor yang mempengaruhi mengapa terdapat perbedaan antara kedua kelompok tersebut. Nilai odds ratio yang tinggi menandakan varaibel tersebut memiliki pengaruh yang tinggi terhadap pemilihan beda dari responden. Tujuan untuk mengetahui faktor yang mempengaruhi ini adalah diharapkan faktor yang signifikan mempengaruhi tersebut merupakan faktor yang bisa diatur oleh peneliti atau pengambil kebijakan sehingga bisa menggiring responden lainnya untuk berbuat yang sama terhadap responden yang bernilai 1 sebelumnya.

Model Persamaan Regresi Logistik

Regresi linier mempunyai persamaan

\[\mathrm{Y} = B_0 + B_1X_1 + ...+ B_nX_n + \epsilon \]

Dimana b0 sebagai intercept, b1 hingga bn adalah koefisien, dan e adalah error varians atau residual.

Sedangkan pada regresi logistik menggunakan persamaan :

\[\mathrm{Ln\left[ \frac{p}{(1-p)} \right]} = B_0 + B_1X \] Nilai p atau peluang (Y=1) dapat dicari dengan persamaan :

\[\mathrm{p} = \frac{e^{B_0+B_1X}}{(1+e^{B_0+B_1X})} \]

Pembahasan

Tujuan dari penelitian ini adalah untuk mengetahui faktor-faktor yang berpengaruh terhadap pendapatan usaha pelabuhan yang memiliki skala dikotomi yaitu “Meningkat” atau “Menurun”. Sedangkan variabel-variabel bebas yang dikaji adalah Rata-rata kunjungan kapal, Rata-rata barang yang dibongkar, Kinerja Bongkar Muat Barang, Kinerja Bongkar Muat Petikemas, Kegiatan Angkutan Laut yang dilayani, dan Kepemilikan Fasilitas Container Yard.

Berikut adalah data yang digunakan :

Eksplorasi Data

Variabel Penelitian

Variabel	Data	Keterangan
X1	Kunjungan Kapal	Numerik
X2	Rata-rata Barang yang Dibongkar	Numerik
X3	Kinerja Bongkar Muat Barang	Numerik
X4	Kinerja Bongkar Petikemas	Numerik
X5	Kegiataan Angkutan Laut	Kategorik
X6	Kepemilikan Fasilitas Lapangan Penumpukan	Kategorik
Y	Pendapatan Pelabuhan	Kategorik

Visualisasi data pada data Pelabuhan dibedakan menjadi visualisasi data numerik dengan menggunakan histrogram dan kategorik dengan menggunakan diagram batang.

Rata-rata kunjungan Kapal

ggplot(dataPelabuhan, aes(KK,fill=..count..)) + 
      geom_histogram(aes(y=..density..)) +
      geom_density(alpha=.2, fill="purple")

Rata-rata barang yang dibongkar

ggplot(dataPelabuhan, aes(Bongkar,fill=..count..)) + 
      geom_histogram(aes(y=..density..)) +
      geom_density(alpha=.2, fill="purple")

Rata-rata kinerja bongkar muat barang

ggplot(dataPelabuhan, aes(KinerjaBarang,fill=..count..)) + 
      geom_histogram(aes(y=..density..)) +
      geom_density(alpha=.2, fill="purple")

Rata-rata kinerja bongkar muat petikemas

ggplot(dataPelabuhan, aes(KinerjaKontainer,fill=..count..)) + 
      geom_histogram(aes(y=..density..)) +
      geom_density(alpha=.2, fill="purple")

Kegiatan Angkutan Laut yang Dilayani

ggplot(dataPelabuhan, aes(x=KegAngLaut))+
  geom_bar(stat="count", width=0.7, fill="#E69F00")+
  theme_minimal()

Kepemilikan Fasilitas Lapangan Penumpukan

ggplot(dataPelabuhan, aes(x=FasilitasCY))+
  geom_bar(stat="count", width=0.7, fill="#E69F00")+
  theme_minimal()

Model Regresi Logistik

Model 1

Akan dimasukkan semua variabel independent ke dalam model, sehingga model yang didapatkan adalah :

reglog <- glm(Pendapatan ~ KK+Bongkar+KinerjaBarang+KinerjaKontainer+KegAngLaut+FasilitasCY, data=dataPelabuhan, family=binomial)
summary(reglog)

## 
## Call:
## glm(formula = Pendapatan ~ KK + Bongkar + KinerjaBarang + KinerjaKontainer + 
##     KegAngLaut + FasilitasCY, family = binomial, data = dataPelabuhan)
## 
## Deviance Residuals: 
##      Min        1Q    Median        3Q       Max  
## -1.66372  -0.02596   0.00000   0.00070   1.82094  
## 
## Coefficients:
##                    Estimate Std. Error z value Pr(>|z|)  
## (Intercept)      -1.222e+01  8.105e+00  -1.508   0.1316  
## KK                4.108e-02  2.162e-02   1.900   0.0574 .
## Bongkar           1.425e-03  7.671e-04   1.858   0.0632 .
## KinerjaBarang    -1.476e-01  7.607e-02  -1.940   0.0523 .
## KinerjaKontainer  1.324e-01  8.492e-02   1.559   0.1190  
## KegAngLaut        5.074e+00  5.842e+00   0.869   0.3851  
## FasilitasCY       5.730e+00  2.594e+00   2.209   0.0272 *
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 119.675  on 86  degrees of freedom
## Residual deviance:  13.595  on 80  degrees of freedom
## AIC: 27.595
## 
## Number of Fisher Scoring iterations: 13

Berdasarkan dari Model 1 masih ditemui variabel yang tidak berpengaruh signifikan terhadap model, karena nilai p-value > α=5% sehingga variabel yang tidak berpengaruh harus dihilangkan. Mengeliminasi variabel prediktor dengan cara backward. Untuk langkah selanjutnya adalah menghilangkan variabel Kinerja Kontainer dan Kegiatan Angkutan Laut.

Model 2

reglog2 <- glm(Pendapatan ~ KK+Bongkar+KinerjaBarang+FasilitasCY, data=dataPelabuhan, family=binomial)
summary(reglog2)

## 
## Call:
## glm(formula = Pendapatan ~ KK + Bongkar + KinerjaBarang + FasilitasCY, 
##     family = binomial, data = dataPelabuhan)
## 
## Deviance Residuals: 
##      Min        1Q    Median        3Q       Max  
## -1.31020  -0.12832   0.00000   0.01176   2.64300  
## 
## Coefficients:
##                 Estimate Std. Error z value Pr(>|z|)  
## (Intercept)   -3.3651930  1.8297631  -1.839   0.0659 .
## KK             0.0243944  0.0112639   2.166   0.0303 *
## Bongkar        0.0009207  0.0004625   1.991   0.0465 *
## KinerjaBarang -0.0760275  0.0379170  -2.005   0.0450 *
## FasilitasCY    3.7449231  1.5144524   2.473   0.0134 *
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 119.675  on 86  degrees of freedom
## Residual deviance:  18.082  on 82  degrees of freedom
## AIC: 28.082
## 
## Number of Fisher Scoring iterations: 13

Pada model 2, semua variabel independent sudah signifikan terhadap respon. Sehingga, akan digunakan model 2 dengan variabel independent Rata-rata Kunjungan Kapal, Rata-rata Barang yanng Dibongkar, Kinerja Bongkar Muat Barang, dan Kepemilikan Fasilitas Lapangan Penumpukan Petikemas.

Uji Kesesuaian Model

Goodness of Fit Test

Pengujian kesesuain model menggunakan uji Hosmer-Lemeshow Goodness of Fit Test.

H0 : Model sesuai (tidak terdapat perbedaan yang signifikan antara pengamatan dengan kemungkinan hasil prediksi)

H1 : Model tidak sesuai (terdapat perbedaan yang signifikan antara pengamatan dengan kemungkinan hasil prediksi)

Hipotesis 0 ditolak jika p value < alfa 5% atau nilai chsquare > chisquare tabel

library(ResourceSelection)
hoslem.test(reglog2$y, fitted(reglog2))

## 
##  Hosmer and Lemeshow goodness of fit (GOF) test
## 
## data:  reglog2$y, fitted(reglog2)
## X-squared = 1.1366, df = 8, p-value = 0.9972

qchisq(0.95, 8)

## [1] 15.50731

Nilai chsquare = 1.1366 < chisquare tabel = 15.50731, yang artinya model sesuai atau tidak ada perbedaan antara hasil pengamatan dengan kemungkinan hasil prediksi

Pseudo R2

pscl::pR2(reglog2)["McFadden"]

## fitting null model for pseudo-r2

##  McFadden 
## 0.8489059

Untuk mengukur kebaikan model juga dapat dilakukan dengan meilhat nilai koefisien determinasi, nilai koefisien determinasi pada model adalah 0.8489059 atau 84.89%. Artinya variabel yang ada dalam model dapat menjelaskan 84.89% dari pendapatan pelabuhan, sedangkan 15.11% sisanya dijelaskan oleh variabel lain di luar model.

Klasifikasi Model

Selanjutnya, model yang sudah didapatkan akan digunakan untuk membangun model machine learning untuk mengklasifikasikan pendapatan pelabuhan.

Menjadikan factor

Variabel kategorik akan dijadikan factor terlebih dahulu

dataPelabuhan$Pendapatan <- as.factor(dataPelabuhan$Pendapatan)
dataPelabuhan$FasilitasCY <- as.factor(dataPelabuhan$FasilitasCY)

Split Data

Data akan dibagi menjadi Data Latih dan Data Uji dengan perbandingan 80:20

set.seed(98)
pel <- sample(2, nrow(dataPelabuhan), replace = TRUE, prob = c(0.8, 0.2))
dataLatih <- dataPelabuhan[pel==1,]
dataUji <- dataPelabuhan[pel==2,]

Berikut adalah Data yang digunakan sebagai Data Latih sebanyak 74 observasi

Berikut adalah Data yang digunakan sebagai Data Uji sebanyak 13 observasi

Membuat Model Regresi Logistik

Akan dibuat model regresi logistik pada Data Latih dengan variabel yang sama dengan sebelumnya pada model ke-2

model1 <- glm(Pendapatan ~ KK+Bongkar+KinerjaBarang+FasilitasCY, data = dataLatih, family = "binomial")
summary(model1)

## 
## Call:
## glm(formula = Pendapatan ~ KK + Bongkar + KinerjaBarang + FasilitasCY, 
##     family = "binomial", data = dataLatih)
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -1.3261  -0.1278   0.0000   0.0229   2.4428  
## 
## Coefficients:
##                 Estimate Std. Error z value Pr(>|z|)  
## (Intercept)   -4.0015598  2.2279713  -1.796   0.0725 .
## KK             0.0262172  0.0124928   2.099   0.0359 *
## Bongkar        0.0008457  0.0004842   1.747   0.0807 .
## KinerjaBarang -0.0568729  0.0386677  -1.471   0.1413  
## FasilitasCY1   2.8726157  1.5760353   1.823   0.0684 .
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 101.230  on 73  degrees of freedom
## Residual deviance:  16.776  on 69  degrees of freedom
## AIC: 26.776
## 
## Number of Fisher Scoring iterations: 13

Prediksi

library(dplyr)

probabilitas <- model1 %>% predict(dataUji, type = "response")
prediksi <- ifelse(probabilitas> 0.8, "1", "0")
tab1 <- table(Predicted = prediksi, Actual=dataUji$Pendapatan)

tab1

##          Actual
## Predicted 0 1
##         0 7 1
##         1 0 5

testAcc=(sum(diag(tab1))/sum(tab1))*100
round(testAcc,2)

## [1] 92.31

Hasil prediksi menunjukkan bahwa berdasarkan data uji, dari 13 observasi, terdapat 7 pelabuhan yang pendapatannya menurun. Model berhasil memprediksi dengan tepat sebanyak 7 pelabuhan. Serta terdapat 6 observasi pelabuhan yang pendapatannya meningkat dan model berhasil memprediksi dengan tepat sebanyak 5 pelabuhan sedangkan 1 pelabuhan lainnya diprediksi memiliki pendapatan menurun. Sehingga keakuratan model dalam memprediksi adalah 92.31%.

Kesimpulan dan Saran

Kesimpulan

Berdasarkan hasil penelitian, dapat disimpulkan dari 6 variabel bebas yang dimodelkan, hanya 4 variabel bebas yang signifikan dalam mempengaruhi pendapatan usaha pelabuhan yaitu Rata-rata kunjungan kapal, Rata-rata barang yang dibongkar, Kinerja Bongkar Muat Barang, dan Kepemilikan Fasilitas Lapangan Penumpukan Petikemas.
Berdasarkan uji kesesuaian model, model yang dibuat dapat menjelaskan 84.89% dari pendapatan usaha pelabuhan, sedangkan 15.11% sisanya dijelaskan oleh faktor lain di luar model. Dan dari hasil goodness of fit test, model sudah sesuai untuk prediksi.
Berdasarkan pengujian prediksi model, dengan membagi data menjadi data latih dan data uji, keakuratan model dalam memprediksi adalah 92.31%.

Saran

Perlu dikaji faktor-faktor atau variabel lain yang dapat mempengaruhi pendapatan usaha pelabuhan
Perlu data yang lebih besar untuk keakuratan model jika dimungkinan

Daftar Pustaka

Anisa,R., Dito, G.A., dan Nurussadad,A.A. (11 Maret 2021).3STA581-05 - Logistics Regression. https://rpubs.com/nurussadad/STA581-05-regresi-logistik

BPS.2020.Laporan Survei Dwelling Time 2019.

https://www.statistikian.com/2015/02/regresi-logistik.html

https://agungbudisantoso.com/pengertian-tutorial-dan-interpretasi-regresi-logistik-dengan-spss/

https://rpubs.com/alfazrinb/regresi-dan-klasifikasi-logistik-biner