Metode Seasonal Autoregressive Integrated Moving Average (Sarima) Untuk Meramalkan Jumlah Penumpang Dari Pelayaran Dalam Negeri Di Pelabuhan Kota Makassar

Lyonardo Edipurtta

5/22/2022

1 PENDAHULUAN

1.1 Latar Belakang

Perkembangan ilmu pengetahuan dan teknologi semakin berkembang dan berbanding lurus dengan tingginya tingkat peradaban manusia. Tingginya tingkat peradaban menimbulkan persaingan yang ketat dalam meraih kejayaan dan menjadi yang terbaik. Oleh karena itu, sebelum melakukan kegiatan harus membuat strategi dan menyusun rencana agar memperoleh hasil yang optimal pada waktu pelaksanaan kegiatan tersebut.

Analisis deret waktu pada dasarnya digunakan untuk melakukan analisis data yang mempertimbangkan pengaruh waktu. Data dikumpulkan secara periodik berdasarkan urutan waktu, bisa dalam jam, hari, minggu, bulan, kuartal dan tahun. Analisis deret waktu dapat dilakukan untuk membantu dalam menyusun perencanaan ke depan atau bisa dikatakan sebagai peramalan.

Peramalan merupakan gambaran kondisi di masa akan datang dengan menggunakan data di masa lalu. Peramalan merupakan bagian penting dalam pembuatan rencana dan pengambilan keputusan, karena tidak akan ada rencana dan keputusan tanpa peramalan. Peramalan yang efektif sangat dibutuhkan untuk mencapai tujuan strategis dan operasional dari semua organisasi. Misalnya, pada bidang transportasi untuk memprediksi jumlah penumpang dari pelayaran dalam negeri pada kurun waktu tertentu, maka yang dibutuhkan hanyalah data jumlah penumpang pada tahun-tahun sebelumnya. Seiring dengan bertambahnya jumlah penduduk, maka kebutuhan akan alat transportasi juga meningkat karena alat transportasi merupakan sarana penting bagi penduduk untuk melakukan aktivitasnya.

Berdasarkan data yang diperoleh diketahui bahwa jumlah penumpang dari pelayaran dalam negeri tersebut termasuk dalam data time series, sehingga data yang fluktuatif ini membuat pelabuhan di Kota Makassar dapat melakukan prediksi jumlah penumpang dan alat transportasi yang akan dipersiapkan, serta jalur yang akan dilalui. Hal ini bertujuan untuk mengoptimalkan jumlah kapal yang akan beroperasi dapat menampung banyaknya jumlah penumpang. Oleh karena itu, peramalan tentang jumlah penumpang menjadi hal yang penting karena dengan mengetahui prediksi jumlah penumpang di masa yang akan datang, pemerintah dapat mempersiapkan fasilitas-fasilitas untuk mengantisipasi kenaikan jumlah penumpang, seperti menyiapkan tambahan alat transportasi, tempat pemberhentian yang lebih luas serta perbaikan jalur transportasi.

Data jumlah penumpang dari pelayaran dalam negeri di pelabuhan Kota Makassar diperoleh dari PT. Pelabuhan Indonesia (Pelindo) IV Cab. Makassar pada bulan Januari tahun 2006 sampai dengan bulan Desember tahun 2013. Data jumlah penumpang yang diperoleh digunakan untuk mengetahui peningkatan atau penurunan di masa yang akan datang.

Data jumlah penumpang dari pelayaran dalam negeri di pelabuhan Kota Makassar menunjukan pola musiman sehingga metode SARIMA (Seasonal Autoregressive Integrated Moving Average) merupakan metode yang sesuai digunakan untuk meramalkan jumlah penumpang di masa yang akan datang. Perlu diketahui tidak ada metode peramalan yang dapat dengan tepat meramallkan keadaan di masa yang akan datang, sehingga dapat dikatakan jika metode peramalan juga dapat menghasilkan kesalahan.

1.2 Data

Data yang akan dianalisis diperoleh dari PT. Pelabuhan Indonesia (Pelindo) IV Cab. Makassar pada bulan Januari tahun 2006 sampai dengan bulan Desember tahun 2013 dengan jumlah data sebanyak 96. Data tersebut merupakan jumlah penumpang turun di pelabuhan Kota Makassar. Berikut data jumlah penumpang turun di pelabuhan Kota Makassar.

Jumlah Penumpang Turun di Pelabuhan Kota Makassar
Tahun Bulan Jumlah Penumpang
2006 Jan 23761
2006 Feb 21013
2006 Mar 19253
2006 Apr 19861
2006 Mei 27766
2006 Juni 21900
2006 Juli 36825
2006 Aug 21607
2006 Sep 25284
2006 Okt 38980
2006 Nov 40019
2006 Des 29933
2007 Jan 29065
2007 Feb 27516
2007 Mar 23006
2007 Apr 22760
2007 Mei 23335
2007 Juni 39184
2007 Juli 56188
2007 Aug 22846
2007 Sep 37389
2007 Okt 38146
2007 Nov 34517
2007 Des 32251
2008 Jan 24240
2008 Feb 18261
2008 Mar 20009
2008 Apr 23226
2008 Mei 26148
2008 Juni 30764
2008 Juli 44121
2008 Aug 31031
2008 Sep 30492
2008 Okt 53371
2008 Nov 34864
2008 Des 47911
2009 Jan 29015
2009 Feb 18261
2009 Mar 23634
2009 Apr 22584
2009 Mei 22404
2009 Juni 36710
2009 Juli 39293
2009 Aug 33144
2009 Sep 33315
2009 Okt 37088
2009 Nov 29567
2009 Des 35735
2010 Jan 27759
2010 Feb 18339
2010 Mar 17667
2010 Apr 22584
2010 Mei 16302
2010 Juni 22450
2010 Juli 26274
2010 Aug 28663
2010 Sep 31874
2010 Okt 49090
2010 Nov 23794
2010 Des 24909
2011 Jan 27932
2011 Feb 24181
2011 Mar 20189
2011 Apr 22516
2011 Mei 19432
2011 Juni 22228
2011 Juli 31713
2011 Aug 38574
2011 Sep 44049
2011 Okt 50499
2011 Nov 31100
2011 Des 25180
2012 Jan 30660
2012 Feb 25172
2012 Mar 23849
2012 Apr 23733
2012 Mei 26257
2012 Juni 25551
2012 Juli 35852
2012 Aug 39709
2012 Sep 49131
2012 Okt 49356
2012 Nov 34301
2012 Des 35909
2013 Jan 35909
2013 Feb 23737
2013 Mar 19846
2013 Apr 23972
2013 Mei 23718
2013 Juni 23036
2013 Juli 34475
2013 Aug 37472
2013 Sep 49657
2013 Okt 37230
2013 Nov 29625
2013 Des 23342

1.3 Statistika Deskriptif

Melihat Struktur Data

str(Yt)

Jumlah Penumpang Tiap Bulan

 [1] 23761 21013 19253 19861 27766 21900 36825 21607 25284 38980 40019 29933
[13] 29065 27516 23006 22760 23335 39184 56188 22846 37389 38146 34517 32251
[25] 24240 18261 20009 23226 26148 30764 44121 31031 30492 53371 34864 47911
[37] 29015 18261 23634 22584 22404 36710 39293 33144 33315 37088 29567 35735
[49] 27759 18339 17667 22584 16302 22450 26274 28663 31874 49090 23794 24909
[61] 27932 24181 20189 22516 19432 22228 31713 38574 44049 50499 31100 25180
[73] 30660 25172 23849 23733 26257 25551 35852 39709 49131 49356 34301 35909
[85] 35909 23737 19846 23972 23718 23036 34475 37472 49657 37230 29625 23342

Banyak Data yang Diambil

[1] 96

Data Jumlah Penumpang

   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  16302   23179   27849   30067   35909   56188 

Standar Deviasi Data Jumlah Penumpang

[1] 9084.162

Ragam Data Jumlah Penumpang

[1] 82522006

Range Data Jumlah Penumpang

[1] 39886

1.4 SARIMA (Seasonal Autoregressive Integrated Moving Average)

SARIMA digunakan untuk melakukan peramalan pada data yang bersifat musiman (seasonal) sehingga dapat memprediksi untuk masa depan.

SARIMA terdiri atas beberapa bagian yaitu:

  • Model Autoregressive (AR)

Untuk mengetahui nilai AR dalam membantu menetapkan Model AR terbaik yang akan digunakan

Fungsi dapat menggunakan persamaan berikut ini:

\[ Y_t = \phi_1 Y_{t-1} + \phi_2 Y_{t-2} + \phi_3 Y_{t-3} + \dots + \phi_pY_{t-p} + a_t \tag{1} \] \[ Y_t - \phi_1 Y_{t-1} - \phi_2 Y_{t-2} - \phi_3 Y_{t-3} - \dots - \phi_pY_{t-p} = a_t \tag{2} \] Untuk \(BY_t = Y_{t-1}\), sehingga dapat ditulis sebagai berikut: \[ (1 − 𝜙_1𝐵 − 𝜙_2𝐵^2 − 𝜙_3𝐵^3 − ⋯ − 𝜙_𝑝𝐵^𝑝)𝑌_𝑡 = 𝑎_𝑡 \tag{3} \] \[ 𝜙_1(𝐵)𝑌_𝑡 = 𝑎_𝑡 \tag{4} \]

Dimana, \(𝜙_𝑝(𝐵) = (1 − 𝜙_1𝐵 + 𝜙_2𝐵^2 + 𝜙_3𝐵^3 + ⋯ + 𝜙_𝑝𝐵^𝑝)Y_t =a_t\)

  • Model Moving Average (MA)

Model MA pada orde q menyatakan bahwa suatu model pengamatan ke-t dipengaruhi oleh kesalahan masa lalu.

Berikut persamaan model MA: \[ Y_t = a_t + \theta_1 Y_{t-1} + \theta_2 Y_{t-2} + \theta_3 Y_{t-3} + \dots + \theta_qY_{t-q} \tag{1} \] Untuk \(Ba_t\) = \(a_{t-1}\), sehingga dapat ditulis sebagai berikut: \[ Y_t = (1- \theta_1B - \theta_2B^2-\theta_3B^3-\dots-\theta_qB^q)a_t \tag{2} \] \[ Y_t=\theta_q(B)a_t \tag{3} \] Dimana, \(\theta_q(B)=(1-\theta_1B-\theta2B^2-\theta_3B^3-\dots-\theta_qB^q)\)

  • Model Autoregressive Average (ARMA)

Model ARMA merupakan model penyatuan model AR dan model MA yang umum ditulis ARMA (p,q)

Bentuk persamaan fungsi model ARMA orde p dan q sebagai berikut:

\[ Z_t=\phi_1Z_{t-1}+\dots+\phi_pZ_{t-p}+a_t-\theta_1a_{t-1}-\dots-\theta_qa_{t-q} \tag{1} \] - Model Autoregressive Integrated Moving Average (ARIMA)

Model ARIMA merupakan perluasan dari model ARMA dengan penambahan parameter d yang merupakan jumlah proses Differencing.

\[ \phi_p(B)(1-B)^dY_t=\theta_q(B)a_t \tag{1} \] Dimana,
\(AR(p)\) adalah \(\phi_p(B)=(1-\phi_1B-\dots-\phi_pB^p)\)
\(MA(q)\) adalah \(\theta_q(B)=(1-\theta_1B-\dots-\theta_qB^q)\)
Differencing orde d adalah \((1-B)^d\)
Nilai residual pada saat t adalah \(a_t\)

  • Model SARIMA

Fungsi SARIMA dapat ditulis sebagai berikut: \[ \phi(B)\Phi_p(B^s)(1-B)^d(1-B^s)^DY_t=\phi_q(B)\Theta_Q(B^S)a_t \tag{1} \] Keterangan: \(Y_t\) : Data Y pada periode ke- \(t\)
\(Y_{t+k}\) : Data Y pada periode ke- \(t+k\)
\(B\) : Operator langkah mundur (Backshift Operator)
\(\phi_p(B)\) : Operator autoregresi dengan variabel \(p\) non musiman
\(\theta_q(B)\) : Operaor moving average dengan variabel \(q\) non musiman
\(a_t\) : Nilai kesalahan pada saat \(t\)
\(p, d, q\) : Orde \(AR\), diferensiasi, dan \(MA\) non musiman
\((1-B)^d\) : Orde diferensiasi \(non\) musiman
\(\Phi_p(B^S)\) : Operator autoregressive dengan variabel \(p\) musiman
\(\Theta_Q(B^S)\) : Operator autoregressive dengan variabel \(q\) musiman
\(P, D, Q\) : Orde \(AR\), diferensiasi, dan \(MA\) musiman
\((1-B^S)^D\) : Orde diferensiasi musiman

1.5 Langkah-Langkah Analisis

  • Uji stasioneritas data, untuk mengetahui apakah data time series yang digunakan sudah stasioner (dalam rata-rata dan variansi) atau tidak dengan melihat plot data (time series plot).

  • Melakukan Transformasi Box-Cox, apabila data yang digunakan belum stasioner dalam varian.

  • Melakukan differencing untuk mengatasi data yang tidak stasioner dalam rata-rata.

  • Identifikasi model.

  • Pendugaan parameter dan uji signifikansi menggunakan uji t dan uji p-value.

  • Pengecekan diagnostik model untuk mengetahui apakah telah memenuhi proses white noise atau tidak.

  • Pemilihan model terbaik, dapat dilihat dari nilai \(AIC\) dan \(SBC\).

  • Peramalan (forecasting) dengan model terbaik.

2 SOURCE CODE

2.1 Library

Menyelesaikan Analisis Deret Waktu model SARIMA menggunakan library sebagai berikut:

library(tseries) # *adf.test*
library(forecast) # *time series library*
library(readxl) # membaca data excel
library(lmtest) 
library(car)
library(knitr) # membuat tabel

2.2 Analisis Data

2.2.1 Plot Data

Plot data berguna untuk melihat pola data sehingga memudahkan membaca data untuk menentukan analisis yang dilakukan.

# Plot Data
plot.ts(ADW_Seasonal_SARIMA$`Jumlah Penumpang`,
        main="Time Series Plot",
        xlab="Bulan", ylab="Jumlah Penumpang", 
        type="o",col="blue")

2.2.2 Deskriptif Data

Untuk mencari deskriptif data menggunakan syntax sebagai berikut:
Melihat struktur data

str(Yt)

Jumlah Penumpang Tiap Bulan

x = ADW_Seasonal_SARIMA$`Jumlah Penumpang`
x

Banyak Data yang Diambil

n<-length(x)
n

Data Jumlah Penumpang

summary(x)

Standar Deviasi Data Jumlah Penumpang

sd(x)

Ragam Data Jumlah Penumpang

var(x)

Range Data Jumlah Penumpang

range<-max(x)-min(x)
range

2.2.3 Uji Stasioner

  • Stasioner dalam Rata-Rata

ACF (Autocorrelation FUnction)

Dari bentuk plot data seringkali dapat diketahui bahwa data tersebut stasioner atau tidak stasioner. Apabila dilihat dari plot ACF, maka nilai-nilai autokorelasi dari data stasioner akan turun menuju nol sesudah time lag (selisih waktu).

Persamaan fungsi autokorelasi dari data pada lag k sebagai berikut:

\[ \hat{\rho} =\frac {\sum^{n-k}_{t=1} (Y_t-\bar{Y})(Y_{t+k}-\bar{Y})} {\sum^n_{t-1}(Y_t-\bar{Y}^2)} \] Dengan \(k = 0, 1, 2, \dots,n\)
Keterangan :
\(Y_t\) : data \(Y\) periode ke-\(t\)
\(Y_{t+k}\) : data \(Y\) periode ke- \(t+k\)
\(\hat\rho\) : koefisien autokorelasi pada lag ke- \(k\)
\(\bar{Y}\) : rata-rata data

PACF (Partial Autocorrelation Function)

koefisien autokorelasi parsial yang mengukur tingkat keeratan hubungan parsial antara pengamatan pada waktu ke-t dengan pengamatan pada waktu t+1 apabila lag yang digunakan yaitu 1,2,3, dan seterusnya dengan notasi \(\Phi_{kk}=k=1,2,3,\dots\)

\[ \Phi_{kk}= \frac {\rho_k-\sum^{k-1}_{j=1}\Phi_{k-1,j}\rho{k-j}} {1-\sum^{k-1}_{j=1}\Phi_{k-1,j}\rho{k-j}} \] Keterangan:
\(\Phi_{kk}\) : koefisien autokorelasi pada lag ke \(k\)
\(\rho_k\) : koefisien autokorelasi pada lag ke \(k\)

Syntax R untuk menguji stasioner terhadap rata-rata sebagai berikut:

# Stasioner dalam Rata-Rata
acf(Yt,96) # Uji ACF
pacf(Yt,96) # Uji PACF
adf.test(Yt,k=12) # Uji Statistik ADF
  • Stasioner dalam Ragam

Data time series dikatakan stasioner dalam variansi apabila struktur dari waktu ke waktu mempunyai fluktuasi data yang tetap atau konstan dan tidak berubah-ubah. Secara visual untuk melihat hal tersebut dapat dibantu dengan menggunakan plot time series, yaitu dengan melihat fluktuasi data dari waktu ke waktu. Untuk mengetahui data time series telah stasioner dalam variansi dapat dilakukan dengan menggunakan transformasi Box-Cox.

Berikut syntax R untuk Transformasi Box-Cox melihat stasioneritas terhadap Ragam:

#STASIONERITAS DALAM RAGAM
boxCox(Yt~1) #Uji Box-Cox

2.2.4 Penanganan Data Tidak Stasioner

  • Diferensiasi Untuk Data Tidak Stasioner terhadap Rata-Rata

Data yang digunakan, dilakukan analisis apabila tidak memenuhi kondisi stasioner terhadap rata-rata maka perlu dilakukan proses diferensiasi (differencing).

Persamaan untuk diferensiasi orde ke d dapat didefinisikan sebagai berikut:
\[ \Delta^dY_t=(1-B)^dY_t \] Keterangan:
\(Y_t\) : Nilai variabel \(Y\) pada waktu \(t\)
\(Y_{t-1}\) : Nilai variabel \(Y\) pada waktu \(t-1\)
\(B\) : backward shift

DIfferencing dibagi menjadi dua, yaitu:

Differencing Non-Musiman

Ketika data tidak mempunyai rata-rata yang konstan, maka dapat dibuat data baru dengan rata-rata konstan dengan cara pembedaan (differencing) data, artinya kita menghitung perubahan pada data secara berturut-turut.
Dimulai dengan pembedaan pertama 𝑑 = 1. Jika pembedaan pertama 𝑑 = 1 belum membuat data mempunyai rata-rata yang konstan, maka dilakukan pembedaan ke-2 atau 𝑑 = 2 yang berarti kita menghitung perbedaan kedua dari perbedaan pertama.
Syntax R sebagai berikut:

#differencing non seasonal
Yt_diff<-diff(Yt_trans,lag=1) # Diferensiasi data
Yt_diff
plot.ts(Yt_diff,main="Time Series Plot (non 
seasonal)",xlab="Waktu",ylab="Differencing", 
        type="o",col="purple") # Plot Data setelah Diferensiasi
acf(Yt_diff,96,main="ACF non seasonal") # Uji ACF diferensiasi
pacf(Yt_diff,96,main="PACF non seasonal") # Uji PACF diferensiasi
adf.test(Yt_diff,k=12) # Uji statistik ADF
kpss.test(Yt_diff) # Uji Statistik KPSS

Differencing Musiman

Pembedaan musiman berarti menghitung pergeseran data secara musiman berdasarkan periode waktu tertentu, biasanya dinotasikan s untuk menstimulasi rata-rata dalam seri menjadi konstan.

#differencing seasonal
Yt_diff12<-diff(Yt_trans, lag=12)
Yt_diff12
plot.ts(Yt_diff12,main="Time Series Plot 
(seasonal)",xlab="Waktu",ylab="Differencing_12", 
        type="o",col="purple")
acf(Yt_diff12,96,main="ACF seasonal")
pacf(Yt_diff12,96,main="PACF seasonal")
adf.test(Yt_diff12,k=1)
kpss.test(Yt_diff12)
  • Transformasi Box-Cox Penanganan Stasioneritas Terhadap Ragam

Diperlukan transformasi Box-Cox untuk menstasionerkan data terhadap ragam. Transformasi log dan akar kuadrat merupakan anggota dari keluarga power transformation yang disebut Box-Cox Transformation (Box and Cox, 1964). Dengan transformasi ini didefinisikan seri baru \(Z_t'\) sebagai \[ Z_t' = \frac {Z_t\lambda-1}{\lambda} \] Dimana \(\lambda\) adalah bilangan real. Jika nilai \(\lambda=\frac{1}{2}\) maka disebut transformasi akar, karena \(X_t\frac{1}{2}\) adalah aakr dari \(z_t\).

Syntax R sebagai berikut:

p<-powerTransform(Yt)
Yt_trans<-bcPower(Yt,p$lambda)
Yt_trans
boxCox(Yt_trans~1)

2.2.5 Identifikasi Model

Identifikasi model berfungsi untuk menentukan orde \(p\) dan orde \(q\) serta orde \(P\) dan orde \(Q\) yang akan digunakan dalam menentukan model SARIMA dalam data yang diuji.

2.2.6 Pendugaan Parameter Model

Pada identifikasi model, diketahui kemungkinan model SARIMA, tetapi perlu dilakukan pendugaan terhadap model lainnya yang mungkin. Sehingga dapat dicari model terbaik.
Model yang baik adalah model yang menunjukkan bahwa penaksiran parameternya signifikan. Parameter dinyatakan signifikan jika hasil p-value < α dengan nilai α = 0.05, atau dapat melakukan uji signifikansi parameter secara manual sebagai berikut: \[ t_{hitung} = \frac {EstimasiParameter}{Standar Error Parameter} \] Dengan Hipotesis:
\(H_0\) : Parameter tidak signifikan terhadap model
\(H_1\) : Parameter dignifikan model

Berikut syntax R untuk membuat model

# Membuat Model
model1<-
  Arima(Yt,order=c(0,1,1),
        seasonal=list(order=c(1,1,0),period=12))
model1

Kriteria pengambilan keputusan sebagai berikut:
Tolak \(H_0\) jika \(| t_hitung | > t_{α/2, df}\)
\(df = T-p\)
\(T\) adalah banyaknya data
\(p\) adalah banyaknya parameter ada pada model

2.2.7 Pengecekan Diagnostik Model

Uji White Noise

Proses uji diagnostik dilakukan menggunakan uji White noise. Proses ini bertujuan untuk mengetahui jika model tersebut telah layak atau tidak dalam pemilihan model terbaik. Dapat menggunakan rumus sebagai berikut:
\[ Q= n(n+2)\sum^i_{k=1}\frac{\hat\rho^2_k}{n-k} \] Keterangan:
\(\rho\) : Autokorelasi
\(Q\) : Uji Ljung-Box
\(k\) : lag waktu
\(n\) : Banyak parameter
\(i\) : Banyak sisaan

Hipotesis:
\(H_0\) : Residual memenuhi syarat White Noise
\(H_1\) : Residual tidak White Noise

Uji Normalitas Sisaan

Untuk mengetahui apakah residual berdistribusi normal atau tidak dapat menggunakan uji Kolmogorov-Smirnov.

\[ D=maks|F_n(x)-F_0(x)| \] Keterangan:
\(F_n(x)\) : Fungsi kumulatif contoh
\(F_0(x)\) : Fungsi kumulatif distribusi normal

Hipotesis:
\(H_o : \epsilon_i \sim(\mu. \sigma^2)\)
\(H_1 : \epsilon_i \ne(\mu. \sigma^2)\)

Syntax R untuk pengecekan model sebagai berikut

#MODEL DIAGNOSTIK
coeftest(model1) #Uji White-Noise
plot.ts(model1$residuals,main="Residuals from model 1", 
        ylab="residuals",type='o') #Plot Residual
abline(h=0)
jarque.bera.test(model1$residuals) #Uji Statistik Jarque-Bera
tsdiag(model1)
Box.test(model1$residuals, type="Ljung-Box") # Uji Ljung-Box

2.2.8 Pemilihan Model Terbaik

Kriteria AIC dirumuskan sebagai berikut:
\[ AIC(M)= n\ln\hat\sigma^2_\alpha+2M \] Dengan:
\(n\) : banyak sisaan
\(\hat\sigma^2_\alpha\) : estimasi ragam sisaan
\(M\) : Jumlah parameter model

Model dikatakan baik apabila \(AIC\) dan \(SBC\) bernilai minimum.

Syntax R untuk mendapat nilai AIC sebagai berikut:

#Menentukan model terbaik dengan AIC
AIC(model1,model2,model3,model4,model5,model6)

2.2.9 Peramalan

Model deret waktu yang didapat umumnya digunakan untuk peramalan. Menurut Makridakis, Wheelwright, dan McGee (1999), ramalan (forecast) merupakan prediksi mengenai terjadinya suatu kejadian di waktu yang akan datang.
Dalam menggunakan metode peramalan pasti akan menemui tingkat akurasi dalam peramalan tersebut. Secara umum perhitungan nilai kesalahan dari peramalan adalah sebagai berikut:
\[ e=Y_t-Y_t' \] Keterangan:
\(e\) : kesalahan saat periode ke- \(t\)
\(Y_t\) : Nilai sesungguhnya saat periode ke- \(t\)
\(Y_t'\) : Nilai hasil peramalan saat periode ke- \(t\)

Melakukan peramalan untuk satu tahun kedepan dari model terbaik yang telah didapatkan dari nilai AIC dengan menggunakan R sebagai berikut:

#FORECASTING
plot(forecast(model1, h=12))
prediksi<- predict(model1, n.ahead=12)
prediksi

3 HASIL DAN PEMBAHASAN

3.1 Plot Data

Berdasarkan plot diatas menunjukkan time series plot dari data jumlah penumpang turun di Pelabuhan Kota Makassar pada bulan Januari tahun 2006 sampai dengan bulan Desember tahun 2013. Dapat terlihat dari plot data tersebut membentuk pola musiman yang berulang dalam selang waktu 12 periode, sehingga dapat disimpulkan bahwa data jumlah penumpang turun di pelabuhan Kota Makassar belum stasioner dalam rata-rata maupun stasioner dalam varians. Puncak data berada pada bulan Juli tahun 2007.

3.2 Deskriptif Data

Struktur data

 Time-Series [1:96] from 1 to 96: 23761 21013 19253 19861 27766 ...

Jumlah Penumpang Tiap Bulan

 [1] 23761 21013 19253 19861 27766 21900 36825 21607 25284 38980 40019 29933
[13] 29065 27516 23006 22760 23335 39184 56188 22846 37389 38146 34517 32251
[25] 24240 18261 20009 23226 26148 30764 44121 31031 30492 53371 34864 47911
[37] 29015 18261 23634 22584 22404 36710 39293 33144 33315 37088 29567 35735
[49] 27759 18339 17667 22584 16302 22450 26274 28663 31874 49090 23794 24909
[61] 27932 24181 20189 22516 19432 22228 31713 38574 44049 50499 31100 25180
[73] 30660 25172 23849 23733 26257 25551 35852 39709 49131 49356 34301 35909
[85] 35909 23737 19846 23972 23718 23036 34475 37472 49657 37230 29625 23342

Banyak Data yang Diambil

[1] 96

Data Jumlah Penumpang

   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  16302   23179   27849   30067   35909   56188 

Standar Deviasi Data Jumlah Penumpang

[1] 9084.162

Ragam Data Jumlah Penumpang

[1] 82522006

Range Data Jumlah Penumpang

[1] 39886

3.3 Uji Stasioner

  • Stasioner dalam Rata-Rata

Berikut ini adalah hasil dari uji stasioneritas data jumlah penumpang yang turun dari pelayaran dalam negeri di pelabuhan Kota Makassar dengan menggunakan plot ACF dan PACF.

Gambar diatas merupakan plot ACF dan PACF dari data time series jumlah penumpang yang turun dari pelayaran dalam negeri di pelabuhan Kota Makassar. Berdasarkan plot diatas, data tidak horizontal sepanjang sumbu waktu, atau fluktuasi data tidak berada disekitar suatu nilai rata-rata yang konstan, sehingga dapat disimpulkan bahwa data jumlah penumpang yang turun dari pelayaran dalam negeri di pelabuhan Kota Makassar tersebut belum stasioner baik dalam rata-rata maupun dalam varians. Pada plot ACF diatas juga terlihat jelas bahwa pada lag 12, lag 24, dan lag 36 nilai-nilai korelasi signifikan berbeda dari nol. Nilai korelasi tersebut menunjukkan penurunan secara lambat atau data belum stasioner dalam rata-rata non-musiman dan rata-rata musiman 12. Karena data belum stasioner dalam rata- rata non-musiman dan rata-rata musiman 12, maka data belum dapat langsung digunakan untuk mendapatkan model terbaik. Untuk mengatasi data yang belum stasioner tersebut, maka dilakukan diferensiasi pertama non-musiman (d=1) dan untuk menghilangkan kuatnya pengaruh musiman dilakukan diferensiasi satu musiman 12 (D=1).
Selain itu dapat digunakan uji Augmented Dickey-Fuller untuk membuktikan data asli sudah stasioner terhadap ragam dan rata-rata atau belum.


    Augmented Dickey-Fuller Test

data:  Yt
Dickey-Fuller = -1.6877, Lag order = 12, p-value = 0.7055
alternative hypothesis: stationary

Berdasarkan output diatas diperoleh nilai statistik uji Augmented Dickey-Fuller sebesar -1.6877 dengan lag order = 12 dan p-value sebesar 0.7055.
Hasil p-value sebesar 0.7055 > taraf signifikansi \(\alpha\) sebesar 5%, maka \(H_0\) diterima. Dapat disimpulkan bahwa data asli jumlah penumpang yang turun dari pelayaran dalam negeri di pelabuhan Kota Makassar tidak stasioner. Sehingga perlu dilakukan transformasi Box-Cox untuk menstasionerkan data dalam varians dan differencing untuk menstasionerkan data dalam rata-rata

  • Stasioner dalam Ragam

Berdasarkan output diatas didapatkan grafik bahwa dari hasil analisis data asli jumlah penumpang yang turun dari pelayaran dalam negeri di pelabuhan Kota Makassar diperoleh nilai \(\lambda\ne1\) sehingga dapat dikatakan data asli tersebut tidak stasioner dalam ragam.

3.4 Penanganan Data Tidak Stasioner

  • Transformasi Box-Cox data Tidak Stasioner terhadap Ragam
Time Series:
Start = 1 
End = 96 
Frequency = 1 
 [1] 1.794977 1.794503 1.794146 1.794275 1.795533 1.794666 1.796426 1.794614
 [9] 1.795205 1.796590 1.796664 1.795785 1.795687 1.795502 1.794856 1.794815
[17] 1.794909 1.796605 1.797527 1.794829 1.796470 1.796528 1.796234 1.796024
[25] 1.795051 1.793921 1.794305 1.794892 1.795324 1.795874 1.796929 1.795902
[33] 1.795845 1.797406 1.796264 1.797142 1.795682 1.793921 1.794957 1.794785
[41] 1.794754 1.796417 1.796612 1.796109 1.796125 1.796447 1.795744 1.796338
[49] 1.795532 1.793939 1.793777 1.794785 1.793416 1.794762 1.795341 1.795641
[57] 1.795987 1.797203 1.794982 1.795151 1.795553 1.795042 1.794342 1.794774
[65] 1.794184 1.794724 1.795971 1.796560 1.796924 1.797273 1.795909 1.795190
[73] 1.795863 1.795189 1.794991 1.794973 1.795339 1.795242 1.796347 1.796642
[81] 1.797205 1.797216 1.796215 1.796352 1.796352 1.794973 1.794272 1.795010
[89] 1.794970 1.794861 1.796230 1.796477 1.797231 1.796458 1.795751 1.794910

  • Diferensiasi Untuk Data Tidak Stasioner terhadap Rata-Rata

Diferensiasi Non-Musiman

Diferensiasi pertama non-musiman (d=1)

Time Series:
Start = 2 
End = 96 
Frequency = 1 
 [1] -4.739242e-04 -3.575502e-04  1.290775e-04  1.258405e-03 -8.668808e-04
 [6]  1.760023e-03 -1.812730e-03  5.911185e-04  1.385178e-03  7.392773e-05
[11] -8.791019e-04 -9.724740e-05 -1.852733e-04 -6.464205e-04 -4.090260e-05
[16]  9.455459e-05  1.695219e-03  9.220962e-04 -2.697493e-03  1.641296e-03
[21]  5.774955e-05 -2.945153e-04 -2.095722e-04 -9.730776e-04 -1.130230e-03
[26]  3.843718e-04  5.865108e-04  4.327628e-04  5.492502e-04  1.055021e-03
[31] -1.027190e-03 -5.657244e-05  1.561111e-03 -1.142175e-03  8.777111e-04
[36] -1.459972e-03 -1.760830e-03  1.036276e-03 -1.719919e-04 -3.073717e-05
[41]  1.662731e-03  1.953031e-04 -5.030260e-04  1.591743e-05  3.217029e-04
[46] -7.028228e-04  5.935494e-04 -8.054813e-04 -1.593062e-03 -1.622788e-04
[51]  1.008205e-03 -1.369382e-03  1.346536e-03  5.791688e-04  2.993778e-04
[56]  3.462228e-04  1.215555e-03 -2.220319e-03  1.683555e-04  4.028196e-04
[61] -5.113749e-04 -7.002542e-04  4.317277e-04 -5.892640e-04  5.396661e-04
[66]  1.247036e-03  5.891082e-04  3.643347e-04  3.480989e-04 -1.363839e-03
[71] -7.189006e-04  6.729951e-04 -6.741416e-04 -1.977771e-04 -1.815464e-05
[76]  3.664465e-04 -9.681017e-05  1.105088e-03  2.945719e-04  5.626664e-04
[81]  1.136109e-05 -1.001368e-03  1.374776e-04  0.000000e+00 -1.378805e-03
[86] -7.017407e-04  7.383678e-04 -3.961308e-05 -1.097056e-04  1.369375e-03
[91]  2.468746e-04  7.542106e-04 -7.729922e-04 -7.074679e-04 -8.401609e-04

Output diatas merupakan hasil differencing satu non-musiman (𝑑=1) pada data jumlah penumpang yang turun dari pelayaran dalam negeri di pelabuhan Kota Makassar. Berdasarkan output tersebut diperoleh 95 data jumlah penumpang yang turun dari pelayaran dalam negeri di Kota Makassar setelah dilakukan differencing satu kali non-musiman (𝑑=1).

Plot data setelah dilakukan diferensiasi

Plot ACF dan PACF data hasil diferensiasi satu non-musiman

Gambar diatas yaitu plot proses differencing pertama (𝑑 = 1) data time series untuk jumlah penumpang turun dari pelayaran dalam negeri di pelabuhan Kota Makassar. Plot pada gambar diatas hasil diferensiasi satu nonmusiman terlihat bahwa pada data non-musiman sudah stasioner. Akan tetapi, data belum stasioner dalam rata-rata musiman dimana pada lag musiman nilai autokorelasi cenderung turun lambat. Oleh karena itu, dilakukan proses diferensiasi satu musiman 12 dari data hasil diferensiasi satu non-musiman.

Uji Augmented Dickey-Fuller pada data jumlah penumpang yang turun dari pelayaran dalam negeri di kota Makassar setelah dilakukan differencing satu kali non-musiman.


    Augmented Dickey-Fuller Test

data:  Yt_diff
Dickey-Fuller = -3.6975, Lag order = 12, p-value = 0.02862
alternative hypothesis: stationary

Berdasarkan output diatas diperoleh nilai statistik uji Augmented DickeyFuller sebesar -3.6975 dengan lag order = 12 dan p-value sebesar 0.02862.
Hasil p-value sebesar 0.02862 < taraf signifikansi 𝛼 sebesar 5%, maka \(𝐻_0\) ditolak. Maka dapat disimpulkan bahwa data hasil differencing satu kali non-musiman jumlah penumpang yang turun dari pelayaran dalam negeri di pelabuhan Kota Makassar sudah stasioner.

Berikut adalah output uji KPSS pada data jumlah penumpang yang turun dari pelayaran dalam negeri di kota Makassar setelah dilakukan differencing satu kali non-musiman


    KPSS Test for Level Stationarity

data:  Yt_diff
KPSS Level = 0.024473, Truncation lag parameter = 3, p-value = 0.1

Berdasarkan output diatas diperoleh nilai statistik uji KPSS sebesar 0.024473 dengan lag parameter = 3 dan p-value sebesar 0.1.
Hasil p-value sebesar 0.1 > taraf signifikansi 𝛼 sebesar 5%, maka \(H_0\) diterima. Maka dapat disimpulkan bahwa data hasil differencing satu kali non-musiman jumlah penumpang yang turun dari pelayaran dalam negeri di pelabuhan Kota Makassar sudah stasioner.

Diferensiasi Musiman

Diferensiasi satu musiman 12 (D=1)

Time Series:
Start = 13 
End = 96 
Frequency = 1 
 [1]  7.102942e-04  9.989450e-04  7.100747e-04  5.400945e-04 -6.237554e-04
 [6]  1.938344e-03  1.100418e-03  2.156557e-04  1.265833e-03 -6.159514e-05
[11] -4.300381e-04  2.394916e-04 -6.363386e-04 -1.581296e-03 -5.505031e-04
[16]  7.691027e-05  4.151185e-04 -7.308501e-04 -5.979252e-04  1.072377e-03
[21] -6.254913e-04  8.778701e-04  3.021017e-05  1.117493e-03  6.305993e-04
[26]  0.000000e+00  6.519045e-04 -1.065982e-04 -5.700982e-04  5.433821e-04
[31] -3.163359e-04  2.078281e-04  2.803180e-04 -9.590901e-04 -5.197377e-04
[36] -8.038993e-04 -1.494089e-04  1.835853e-05 -1.180197e-03  0.000000e+00
[41] -1.338644e-03 -1.654839e-03 -1.270973e-03 -4.685696e-04 -1.382643e-04
[46]  7.555880e-04 -7.619086e-04 -1.187103e-03  2.119835e-05  1.102886e-03
[51]  5.649101e-04 -1.156690e-05  7.685506e-04 -3.831921e-05  6.295483e-04
[56]  9.192786e-04  9.373906e-04  6.993428e-05  9.264148e-04  3.915875e-05
[61]  3.093342e-04  1.465675e-04  6.490447e-04  1.991624e-04  1.154873e-03
[66]  5.183967e-04  3.764482e-04  8.191194e-05  2.802436e-04 -5.649422e-05
[71]  3.059765e-04  1.162355e-03  4.893597e-04 -2.153034e-04 -7.192670e-04
[76]  3.725542e-05 -3.688042e-04 -3.816996e-04 -1.174126e-04 -1.651099e-04
[81]  2.643438e-05 -7.579189e-04 -4.640187e-04 -1.441657e-03

Output diatas merupakan hasil differencing satu musiman (D =1) pada data jumlah penumpang yang turun dari pelayaran dalam negeri di pelabuhan Kota Makassar. Berdasarkan output tersebut diperoleh 84 data jumlah penumpang yang turun dari pelayaran dalam negeri di Kota Makassar setelah dilakukan differencing satu kali musiman (D=1).

Plot data setelah dilakukan diferensiasi

Plot deret waktu, ACF dan PACF data jumlah penumpang yang turun di pelabuhan Kota Makassar hasil diferensiasi pertama musiman 12 dengan D=1.

Berdasarkan plot diatas terlihat bahwa data telah stasioner dalam ratarata non-musiman dan rata-rata musiman 12.

uji Augmented Dickey-Fuller pada data jumlah penumpang yang turun dari pelayaran dalam negeri di kota Makassar setelah dilakukan differencing satu kali musiman (D =1).


    Augmented Dickey-Fuller Test

data:  Yt_diff12
Dickey-Fuller = -4.1884, Lag order = 1, p-value = 0.01
alternative hypothesis: stationary

Berdasarkan output diatas diperoleh nilai statistik uji Augmented Dickey-Fuller sebesar -4.1884 dengan lag order = 1 dan p-value sebesar 0.01.
Hasil p-value sebesar 0.01 < taraf signifikansi 𝛼 sebesar 5% atau 0.05, maka \(H_0\) ditolak. Maka dapat disimpulkan bahwa data hasil differencing satu kali musiman jumlah penumpang yang turun dari pelayaran dalam negeri di pelabuhan Kota Makassar sudah stasioner.

Berikut adalah output uji KPSS pada data jumlah penumpang yang turun dari pelayaran dalam negeri di pelabuhan Kota Makassar setelah dilakukan differencing satu kali musiman (D = 1).


    KPSS Test for Level Stationarity

data:  Yt_diff12
KPSS Level = 0.15767, Truncation lag parameter = 3, p-value = 0.1

Berdasarkan output diatas diperoleh nilai statistik uji KPSS sebesar 0.15767 dengan lag parameter = 3 dan p-value sebesar 0.1.
Hasil p-value sebesar 0.1 > taraf signifikansi 𝛼 sebesar 5%, maka \(H_0\) diterima. Maka dapat disimpulkan bahwa data hasil differencing satu kali musiman jumlah penumpang yang turun dari pelayaran dalam negeri di pelabuhan Kota Makassar sudah stasioner.

Berdasarkan hasil plot dan uji statistik didapatkan bahwa data telah stasioner dalam rata-rata non-musiman dan rata-rata musiman 12. Sehingga data sudah dapat langsung digunakan untuk mendapatkan model Seasonal ARIMA terbaik.

3.5 Identifikasi Model

  • Non Musiman

Dari gambar plot ACF non musiman diatas terlihat bahwa plot berbentuk pola cut off after lag 1 sehingga nilai orde MA (q) = 1
Dari gambar plot PACF non musiman diatas diketahui bahwa bentuk pola menurun secara eksponensial sehingga nilai orde AR (p) = 0. Jadi dapat disimpulkan dari plot ACF dan PACF non musiman model ARIMA yang diperoleh adalah (0,1,1).

  • Musiman

Dari gambar plot ACF musiman diatas diketahui bahwa bentuk pola menurun secara eksponensial sehingga nilai orde MA (Q) = 0. Dari gambar plot PACF musiman diatas diketahui bahwa bentuk pola cut off pada lag ke-2 dan pada lag ke-1 keluar dari garis selang kepercayaan sehingga nilai orde AR (P) = 1.
Jadi dapat disimpulkan dari plot ACF dan PACF musiman model ARIMA yang diperoleh adalah (1,1,0).
Kesimpulan dari hasil keseluruhan plot ACF dan PACF non musiman dan musiman didapatkan Model Seasonal ARIMA yang mungkin sesuai untuk data jumlah penumpang turun dari pelayaran dalam negeri di pelabuhan Kota Makassar yaitu Model Seasonal ARIMA \((0,1,1)(1,1,0)^{12}\)

3.6 Pendugaan Parameter

Model yang mungkin adalah Model Seasonal ARIMA \((0,1,1)(1,1,0)^{12}\). Akan tetapi perlu dilakukan pendugaan model lainnya, yaitu Model SARIMA \((0,1,1)(0,1,1)^{12}\), Model SARIMA \((0,1,1)(1,1,1)^{12}\), Model SARIMA \((1,1,1)(1,1,0)^{12}\), Model SARIMA \((1,1,0)(0,1,1)^{12}\), dan Model SARIMA \((1,1,0)(1,1,0)^{12}\). Sehingga dapat dicari model yang terbaik.

  • Model SARIMA \((0,1,1)(1,1,0)^{12}\)
Series: Yt 
ARIMA(0,1,1)(1,1,0)[12] 

Coefficients:
          ma1     sar1
      -0.7444  -0.3745
s.e.   0.0817   0.1094

sigma^2 = 41841087:  log likelihood = -846.38
AIC=1698.76   AICc=1699.07   BIC=1706.02
Series: Yt 
ARIMA(0,1,1)(1,1,0)[12] 

Coefficients:
          ma1     sar1
      -0.7444  -0.3745
s.e.   0.0817   0.1094

sigma^2 = 41841087:  log likelihood = -846.38
AIC=1698.76   AICc=1699.07   BIC=1706.02

Training set error measures:
                  ME     RMSE      MAE       MPE     MAPE      MASE       ACF1
Training set -430.99 5941.668 4381.301 -3.550142 14.82683 0.6416303 0.01593099

Dari output diatas diperoleh hasil pendugaan parameter untuk Model SARIMA \((0,1,1)(1,1,0)^{12}\) yaitu nilai \(𝜃_1\) sebesar -0.7444 dan \(Φ_1\) sebesar -0.3745. Didapatkan juga nilai standard error untuk masing masing parameter sebesar 0.0817 dan 0.1094. Dapat diketahui pula nilai AIC (Akaike’s Information Criterion) sebesar 1698.76 dan nilai BIC (Bayesian Information Criterion) sebesar 1706.02. Nilai ME untuk model tersebut sebesar -430.99, nilai RMSE sebesar 5941.668, nilai MAE sebesar 4381.301, MPE sebesar -3.550142, MAPE sebesar 14.82683, MASE sebesar 0.6416303, dan ACF1 sebesar 0.01593099

  • Model SARIMA \((0,1,1)(0,1,1)^{12}\)
Series: Yt 
ARIMA(0,1,1)(0,1,1)[12] 

Coefficients:
          ma1     sma1
      -0.7601  -0.3913
s.e.   0.0839   0.1170

sigma^2 = 41823076:  log likelihood = -846.48
AIC=1698.97   AICc=1699.27   BIC=1706.22
Series: Yt 
ARIMA(0,1,1)(0,1,1)[12] 

Coefficients:
          ma1     sma1
      -0.7601  -0.3913
s.e.   0.0839   0.1170

sigma^2 = 41823076:  log likelihood = -846.48
AIC=1698.97   AICc=1699.27   BIC=1706.22

Training set error measures:
                    ME     RMSE      MAE       MPE    MAPE      MASE       ACF1
Training set -463.8075 5940.389 4363.885 -3.849776 14.7002 0.6390797 0.02016622

Dari output diatas diperoleh hasil pendugaan parameter yaitu nilai 𝜃1 sebesar -0.7601 dan Θ1 sebesar -0.3913. Didapatkan juga nilai standard error untuk masing masing parameter sebesar 0.0839 dan 0.1170. Dapat diketahui pula nilai AIC (Akaike’s Information Criterion) sebesar 1698.97 dan nilai BIC (Bayesian Information Criterion) sebesar 1706.22. Nilai ME untuk model tersebut sebesar -463.8075, nilai RMSE sebesar 5940.389, nilai MAE sebesar 4363.885, MPE sebesar -3.849776, MAPE sebesar 14.7002, MASE sebesar 0.6390797, dan ACF1 sebesar 0.02016622.

  • Model SARIMA \((0,1,1)(1,1,1)^{12}\)
Series: Yt 
ARIMA(0,1,1)(1,1,1)[12] 

Coefficients:
          ma1     sar1    sma1
      -0.7314  -0.8374  0.5905
s.e.   0.0791   0.1984  0.3093

sigma^2 = 41179231:  log likelihood = -845.91
AIC=1699.81   AICc=1700.32   BIC=1709.49
Series: Yt 
ARIMA(0,1,1)(1,1,1)[12] 

Coefficients:
          ma1     sar1    sma1
      -0.7314  -0.8374  0.5905
s.e.   0.0791   0.1984  0.3093

sigma^2 = 41179231:  log likelihood = -845.91
AIC=1699.81   AICc=1700.32   BIC=1709.49

Training set error measures:
                   ME     RMSE      MAE      MPE     MAPE      MASE        ACF1
Training set -437.748 5857.988 4378.017 -3.32077 14.87518 0.6411493 0.006370568

Dari output diatas diperoleh hasil pendugaan parameter yaitu nilai 𝜃1 sebesar -0.7314, Φ1 sebesar -0.8374 dan Θ1 sebesar 0.5905. Didapatkan juga nilai standard error untuk masing masing parameter sebesar 0.0791, 0.1984 dan 0.3093. Dapat diketahui pula nilai AIC (Akaike’s Information Criterion) sebesar 1699.81 dan nilai BIC (Bayesian Information Criterion) sebesar 1709.49. Nilai ME untuk model tersebut sebesar -437.748, nilai RMSE sebesar 5857.988, nilai MAE sebesar 4378.017, MPE sebesar -3.32077, MAPE sebesar 14.87518, MASE sebesar 0.6411493, dan ACF1 sebesar 0.006370568.

  • Model SARIMA \((1,1,1)(1,1,0)^{12}\)
Series: Yt 
ARIMA(1,1,1)(1,1,0)[12] 

Coefficients:
         ar1      ma1     sar1
      0.0546  -0.7714  -0.3770
s.e.  0.1521   0.1063   0.1092

sigma^2 = 42271948:  log likelihood = -846.32
AIC=1700.63   AICc=1701.14   BIC=1710.31
Series: Yt 
ARIMA(1,1,1)(1,1,0)[12] 

Coefficients:
         ar1      ma1     sar1
      0.0546  -0.7714  -0.3770
s.e.  0.1521   0.1063   0.1092

sigma^2 = 42271948:  log likelihood = -846.32
AIC=1700.63   AICc=1701.14   BIC=1710.31

Training set error measures:
                   ME     RMSE      MAE       MPE     MAPE     MASE        ACF1
Training set -437.368 5935.202 4394.895 -3.565473 14.83876 0.643621 -0.01407937

Dari output diatas diperoleh hasil pendugaan parameter yaitu nilai ɸ1 sebesar 0.0546, 𝜃1 sebesar -0.7714, dan Φ1 sebesar -0.3770. Didapatkan juga nilai standard error untuk masing masing parameter sebesar 0.1521, 0.1063 dan 0.1092. Dapat diketahui pula nilai AIC (Akaike’s Information Criterion) sebesar 1700.63 dan nilai BIC (Bayesian Information Criterion) sebesar 1710.31. Nilai ME untuk model tersebut sebesar -437.368, nilai RMSE sebesar 5935.202, nilai MAE sebesar 4394.895, MPE sebesar -3.565473, MAPE sebesar 14.83876, MASE sebesar 0.643621, dan ACF1 sebesar -0.01407937

  • Model SARIMA \((1,1,0)(0,1,1)^{12}\)
Series: Yt 
ARIMA(1,1,0)(0,1,1)[12] 

Coefficients:
          ar1     sma1
      -0.4724  -0.3311
s.e.   0.0964   0.1152

sigma^2 = 50020940:  log likelihood = -853.29
AIC=1712.59   AICc=1712.89   BIC=1719.84
Series: Yt 
ARIMA(1,1,0)(0,1,1)[12] 

Coefficients:
          ar1     sma1
      -0.4724  -0.3311
s.e.   0.0964   0.1152

sigma^2 = 50020940:  log likelihood = -853.29
AIC=1712.59   AICc=1712.89   BIC=1719.84

Training set error measures:
                    ME     RMSE     MAE       MPE    MAPE      MASE       ACF1
Training set -222.7173 6496.551 4842.04 -2.709115 16.5552 0.7091043 -0.1165093

Dari output diatas diperoleh hasil pendugaan parameter yaitu nilai ɸ1 sebesar -0.4724 dan Θ1sebesar -0.3311.Didapatkan juga nilai standard error untuk masing masing parameter sebesar 0.0964 dan 0.1152. Dapat diketahui pula nilai AIC (Akaike’s Information Criterion) sebesar 1712.59 dan nilai BIC (Bayesian Information Criterion) sebesar 1719.84. Nilai ME untuk model tersebut sebesar -222.7173, nilai RMSE sebesar 6496.551, nilai MAE sebesar 4842.04, MPE sebesar -2.709115, MAPE sebesar 16.5552, MASE sebesar 0.7091043, dan ACF1 sebesar -0.1165093.

  • Model SARIMA \((1,1,0)(1,1,0)^{12}\)
Series: Yt 
ARIMA(1,1,0)(1,1,0)[12] 

Coefficients:
          ar1     sar1
      -0.4666  -0.3300
s.e.   0.0967   0.1123

sigma^2 = 49858200:  log likelihood = -853.15
AIC=1712.3   AICc=1712.6   BIC=1719.55
Series: Yt 
ARIMA(1,1,0)(1,1,0)[12] 

Coefficients:
          ar1     sar1
      -0.4666  -0.3300
s.e.   0.0967   0.1123

sigma^2 = 49858200:  log likelihood = -853.15
AIC=1712.3   AICc=1712.6   BIC=1719.55

Training set error measures:
                    ME     RMSE      MAE       MPE     MAPE      MASE
Training set -212.8257 6485.974 4846.297 -2.580182 16.64911 0.7097277
                   ACF1
Training set -0.1191221

Dari output diatas diperoleh hasil pendugaan parameter yaitu nilai ɸ1 sebesar -0.4666 dan Φ1 sebesar -0.3300. Didapatkan juga nilai standard error untuk masing masing parameter sebesar 0.0967 dan 0.1123. Dapat diketahui pula nilai AIC (Akaike’s Information Criterion) sebesar 1712.3 dan nilai BIC (Bayesian Information Criterion) sebesar 1719.55. Nilai ME untuk model tersebut sebesar -212.8257, nilai RMSE sebesar 6485.974, nilai MAE sebesar 4846.297, MPE sebesar -2.580182, MAPE sebesar 16.64911, MASE sebesar 0.7097277, dan ACF1 sebesar -0.1191221.

3.7 Diagnostik Model

Dilakukan untuk menguji kesesuaian dari parameter yang didapat pada tahap sebelumnya.

  • Model SARIMA \((0,1,1)(1,1,0)^{12}\)

z test of coefficients:

      Estimate Std. Error z value  Pr(>|z|)    
ma1  -0.744444   0.081686 -9.1134 < 2.2e-16 ***
sar1 -0.374529   0.109372 -3.4244 0.0006162 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1


    Jarque Bera Test

data:  model1$residuals
X-squared = 2.0931, df = 2, p-value = 0.3512


    Box-Ljung test

data:  model1$residuals
X-squared = 0.025134, df = 1, p-value = 0.874
  • Model SARIMA \((0,1,1)(0,1,1)^{12}\)

z test of coefficients:

      Estimate Std. Error z value  Pr(>|z|)    
ma1  -0.760051   0.083852 -9.0642 < 2.2e-16 ***
sma1 -0.391277   0.117027 -3.3435 0.0008274 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1


    Jarque Bera Test

data:  model2$residuals
X-squared = 3.1584, df = 2, p-value = 0.2061


    Box-Ljung test

data:  model2$residuals
X-squared = 0.040274, df = 1, p-value = 0.8409
  • Model SARIMA \((0,1,1)(1,1,1)^{12}\)

z test of coefficients:

      Estimate Std. Error z value  Pr(>|z|)    
ma1  -0.731351   0.079111 -9.2446 < 2.2e-16 ***
sar1 -0.837429   0.198372 -4.2215 2.427e-05 ***
sma1  0.590497   0.309258  1.9094   0.05621 .  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1


    Jarque Bera Test

data:  model3$residuals
X-squared = 1.6956, df = 2, p-value = 0.4284


    Box-Ljung test

data:  model3$residuals
X-squared = 0.0040191, df = 1, p-value = 0.9495
  • Model SARIMA \((1,1,1)(1,1,0)^{12}\)

z test of coefficients:

      Estimate Std. Error z value  Pr(>|z|)    
ar1   0.054558   0.152088  0.3587 0.7198007    
ma1  -0.771441   0.106321 -7.2558 3.994e-13 ***
sar1 -0.377006   0.109201 -3.4524 0.0005556 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1


    Jarque Bera Test

data:  model4$residuals
X-squared = 2.1231, df = 2, p-value = 0.3459


    Box-Ljung test

data:  model4$residuals
X-squared = 0.019631, df = 1, p-value = 0.8886
  • Model SARIMA \((1,1,0)(0,1,1)^{12}\)

z test of coefficients:

      Estimate Std. Error z value  Pr(>|z|)    
ar1  -0.472421   0.096423 -4.8995 9.609e-07 ***
sma1 -0.331105   0.115168 -2.8750   0.00404 ** 
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1


    Jarque Bera Test

data:  model5$residuals
X-squared = 0.13647, df = 2, p-value = 0.934


    Box-Ljung test

data:  model5$residuals
X-squared = 1.3443, df = 1, p-value = 0.2463
  • Model SARIMA \((1,1,0)(1,1,0)^{12}\)

z test of coefficients:

     Estimate Std. Error z value  Pr(>|z|)    
ar1  -0.46661    0.09674 -4.8234 1.412e-06 ***
sar1 -0.32997    0.11226 -2.9393   0.00329 ** 
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1


    Jarque Bera Test

data:  model6$residuals
X-squared = 0.089181, df = 2, p-value = 0.9564


    Box-Ljung test

data:  model6$residuals
X-squared = 1.4053, df = 1, p-value = 0.2358

3.8 Pemilihan Model Terbaik

       df      AIC
model1  3 1698.762
model2  3 1698.968
model3  4 1699.810
model4  4 1700.632
model5  3 1712.585
model6  3 1712.298

Didapatkan nilai AIC sebagai berikut
model 1 sebesar 1698.762
model 2 sebesar 1698.968
model 3 sebesar 1699.810
model 4 sebesar 1700.632
model 5 sebesar 1712.585
model 6 sebesar 1712.298
Diantara keenam model tersebut nilai AIC yang paling kecil adalah model 1. Sehingga dapat disimpulkan bahwa model 1 atau SARIMA \((0,1,1)(1,1,0)^{12}\) adalah model terbaik. Dapat ditulis sebagai berikut: \[ Y_t= Y_{t-1}+Y_{t-12}-Y_{t-13}+\Phi_1Y_{t-1}-\Phi_1Y_{t-2}-\Phi_1Y_{t-13}- \Phi_1Y_{t-14}-a_t-\theta_1a_{t-1} \]

3.9 Peramalan

Melakukan peramalan untuk satu tahun kedepan dari model terbaik yang telah didapatkan dari nilai AIC. Sehingga didapatkan peramalan (forecasting) dari model terbaik adalah sebagai berikut:

Sesuai dari hasil peramalan jumlah penumpang dari pelayaran dalam negeri di pelabuhan Kota Makasaar dari bulan Januari 2006 sampai dengan Desember 2013 dengan periode peramalan 12 periode (1 tahun) kedepan, diperoleh hasil sebagai berikut:

$pred
Time Series:
Start = 97 
End = 108 
Frequency = 1 
 [1] 29586.11 19917.46 16988.25 19525.50 20311.94 19620.95 30633.74 33952.83
 [9] 45103.01 37414.55 27019.31 23691.72

$se
Time Series:
Start = 97 
End = 108 
Frequency = 1 
 [1] 6468.469 6676.352 6877.955 7073.814 7264.395 7450.102 7631.291 7808.277
 [9] 7981.340 8150.728 8316.667 8479.360

Dapat dilihat bahwa kenaikan tertinggi jumlah penumpang turun pada tahun 2014 terjadi pada bulan September dengan jumlah penumpang turun sebesar 45103.01 orang.

4 KESIMPULAN

Berdasarkan hasil pembahasan mengenai peramalan jumlah penumpang turun dari pelayaran dalam Negeri di pelabuhan Kota Makassar dari bulan Januari tahun 2006 sampai dengan Desember tahun 2013, diperoleh kesimpulan sebagai berikut:

  1. Model peramalan yang baik untuk data penumpang turun di pelabuhan Kota Makassar yaitu model 1 atau SARIMA (0,1,1)(1,1,0)12 atau bisa ditulis sebagai berikut:

\[ Y_t= Y_{t-1}+Y_{t-12}-Y_{t-13}+\Phi_1Y_{t-1}-\Phi_1Y_{t-2}-\Phi_1Y_{t-13}- \Phi_1Y_{t-14}-a_t-\theta_1a_{t-1} \]

Dengan nilai parameter 𝜃1 sebesar -0.7444 dan Φ1 sebesar -0.3745. Sehingga didapatkan model peramalan terbaik dari model 1 atau SARIMA \((0,1,1)(1,1,0)^{12}\)sebagai berikut:

\[ Y_t= Y_{t-1}+Y_{t-12}-Y_{t-13}+(-0,3745)1Y_{t-1}-(-0,3745)Y_{t-2}-(-0,3745)Y_{t-13}- (-0,3745)Y_{t-14}-a_t-(-0,7444)a_{t-1} \]

  1. Hasil peramalan tertinggi terjadi pada bulan 9 (September) tahun 2014 yaitu sebesar 45103.01 dengan nilai sebenarnya sebesar 38865. Sedangkan, hasil peramalan terendah terjadi pada bulan Maret 2014 yaitu sebesar 16988.25, dengan nilai sebenarnya 28000. Dimana sebenarnya pada data asli tahun tersebut nilai tertinggi diperoleh pada bulan Agustus dan nilai terendah pada bulan Februari.

5 DAFTAR PUSTAKA

Cryer, Jonathan D. dan Chan, Kung-Sik. 2008. Time Series Analysis With Applications in R Second Edition. USA: Springer

Kurnia W., Dwi Fitri.2020. Peramalan Jumlah Penumpang Keberangkatan Bus di Terminal Purabaya Menggunakan Metode SARIMA (SEASONAL AUTOREGRESSIVE INTEGRATED MOVING AVERAGE). Surabaya: Universitas Islam Negeri Sunan Ampel.

Moh. Nasir, Wahida Yanti. 2015. Peramalan Jumlah Penumpang Dari Pelayaran Dalam Negeri di Pelabuhan Kota Makassar Menggunakan Metode SEASONAL AUTOREGRESSIVE INTEGRATED MOVING AVERAGE (SARIMA). Makassar: Universitas Islam Negeri Alauddin Makassar

Mubarok, Muhammad Ilham. 2018. SEASONAL AUTOREGRESSIVE INTEGRATED MOVING AVERAGE (SARIMA) IN R [online]. Diakses tanggal 14 Desember 2020, dari https://muhammadilhammubarok.wordpress.com/2018/08/30/seasonalautoregressive-integrated-moving-average-sarima-in-r/

Shofura, Annisa. Peramalan Data Air Passengers Dengan Metode SARIMA di RStudio[online]. Diakses tanggal 14 Desember 2020, dari https://medium.com/@annisashofuran19/analisis-airpasssengers-dengan-sarimadi-r-studio-6839f8e2c3d9

Tantika, Hani Nastiti. 2018. Metode Seasonal ARIMA Untuk Meramalkan Produksi Kopi dengan Indikator Curah Hujan Menggunakan Aplikasi R di Kabupaten Lampung Barat. Lampung : Universitas Islam Negeri Raden Intan Lampung