1 PENDAHULUAN
1.1 Latar Belakang
Perkembangan ilmu pengetahuan dan teknologi semakin berkembang dan berbanding lurus dengan tingginya tingkat peradaban manusia. Tingginya tingkat peradaban menimbulkan persaingan yang ketat dalam meraih kejayaan dan menjadi yang terbaik. Oleh karena itu, sebelum melakukan kegiatan harus membuat strategi dan menyusun rencana agar memperoleh hasil yang optimal pada waktu pelaksanaan kegiatan tersebut.
Analisis deret waktu pada dasarnya digunakan untuk melakukan analisis data yang mempertimbangkan pengaruh waktu. Data dikumpulkan secara periodik berdasarkan urutan waktu, bisa dalam jam, hari, minggu, bulan, kuartal dan tahun. Analisis deret waktu dapat dilakukan untuk membantu dalam menyusun perencanaan ke depan atau bisa dikatakan sebagai peramalan.
Peramalan merupakan gambaran kondisi di masa akan datang dengan menggunakan data di masa lalu. Peramalan merupakan bagian penting dalam pembuatan rencana dan pengambilan keputusan, karena tidak akan ada rencana dan keputusan tanpa peramalan. Peramalan yang efektif sangat dibutuhkan untuk mencapai tujuan strategis dan operasional dari semua organisasi. Misalnya, pada bidang transportasi untuk memprediksi jumlah penumpang dari pelayaran dalam negeri pada kurun waktu tertentu, maka yang dibutuhkan hanyalah data jumlah penumpang pada tahun-tahun sebelumnya. Seiring dengan bertambahnya jumlah penduduk, maka kebutuhan akan alat transportasi juga meningkat karena alat transportasi merupakan sarana penting bagi penduduk untuk melakukan aktivitasnya.
Berdasarkan data yang diperoleh diketahui bahwa jumlah penumpang dari pelayaran dalam negeri tersebut termasuk dalam data time series, sehingga data yang fluktuatif ini membuat pelabuhan di Kota Makassar dapat melakukan prediksi jumlah penumpang dan alat transportasi yang akan dipersiapkan, serta jalur yang akan dilalui. Hal ini bertujuan untuk mengoptimalkan jumlah kapal yang akan beroperasi dapat menampung banyaknya jumlah penumpang. Oleh karena itu, peramalan tentang jumlah penumpang menjadi hal yang penting karena dengan mengetahui prediksi jumlah penumpang di masa yang akan datang, pemerintah dapat mempersiapkan fasilitas-fasilitas untuk mengantisipasi kenaikan jumlah penumpang, seperti menyiapkan tambahan alat transportasi, tempat pemberhentian yang lebih luas serta perbaikan jalur transportasi.
Data jumlah penumpang dari pelayaran dalam negeri di pelabuhan Kota Makassar diperoleh dari PT. Pelabuhan Indonesia (Pelindo) IV Cab. Makassar pada bulan Januari tahun 2006 sampai dengan bulan Desember tahun 2013. Data jumlah penumpang yang diperoleh digunakan untuk mengetahui peningkatan atau penurunan di masa yang akan datang.
Data jumlah penumpang dari pelayaran dalam negeri di pelabuhan Kota Makassar menunjukan pola musiman sehingga metode SARIMA (Seasonal Autoregressive Integrated Moving Average) merupakan metode yang sesuai digunakan untuk meramalkan jumlah penumpang di masa yang akan datang. Perlu diketahui tidak ada metode peramalan yang dapat dengan tepat meramallkan keadaan di masa yang akan datang, sehingga dapat dikatakan jika metode peramalan juga dapat menghasilkan kesalahan.
1.2 Data
Data yang akan dianalisis diperoleh dari PT. Pelabuhan Indonesia (Pelindo) IV Cab. Makassar pada bulan Januari tahun 2006 sampai dengan bulan Desember tahun 2013 dengan jumlah data sebanyak 96. Data tersebut merupakan jumlah penumpang turun di pelabuhan Kota Makassar. Berikut data jumlah penumpang turun di pelabuhan Kota Makassar.
Tahun | Bulan | Jumlah Penumpang |
---|---|---|
2006 | Jan | 23761 |
2006 | Feb | 21013 |
2006 | Mar | 19253 |
2006 | Apr | 19861 |
2006 | Mei | 27766 |
2006 | Juni | 21900 |
2006 | Juli | 36825 |
2006 | Aug | 21607 |
2006 | Sep | 25284 |
2006 | Okt | 38980 |
2006 | Nov | 40019 |
2006 | Des | 29933 |
2007 | Jan | 29065 |
2007 | Feb | 27516 |
2007 | Mar | 23006 |
2007 | Apr | 22760 |
2007 | Mei | 23335 |
2007 | Juni | 39184 |
2007 | Juli | 56188 |
2007 | Aug | 22846 |
2007 | Sep | 37389 |
2007 | Okt | 38146 |
2007 | Nov | 34517 |
2007 | Des | 32251 |
2008 | Jan | 24240 |
2008 | Feb | 18261 |
2008 | Mar | 20009 |
2008 | Apr | 23226 |
2008 | Mei | 26148 |
2008 | Juni | 30764 |
2008 | Juli | 44121 |
2008 | Aug | 31031 |
2008 | Sep | 30492 |
2008 | Okt | 53371 |
2008 | Nov | 34864 |
2008 | Des | 47911 |
2009 | Jan | 29015 |
2009 | Feb | 18261 |
2009 | Mar | 23634 |
2009 | Apr | 22584 |
2009 | Mei | 22404 |
2009 | Juni | 36710 |
2009 | Juli | 39293 |
2009 | Aug | 33144 |
2009 | Sep | 33315 |
2009 | Okt | 37088 |
2009 | Nov | 29567 |
2009 | Des | 35735 |
2010 | Jan | 27759 |
2010 | Feb | 18339 |
2010 | Mar | 17667 |
2010 | Apr | 22584 |
2010 | Mei | 16302 |
2010 | Juni | 22450 |
2010 | Juli | 26274 |
2010 | Aug | 28663 |
2010 | Sep | 31874 |
2010 | Okt | 49090 |
2010 | Nov | 23794 |
2010 | Des | 24909 |
2011 | Jan | 27932 |
2011 | Feb | 24181 |
2011 | Mar | 20189 |
2011 | Apr | 22516 |
2011 | Mei | 19432 |
2011 | Juni | 22228 |
2011 | Juli | 31713 |
2011 | Aug | 38574 |
2011 | Sep | 44049 |
2011 | Okt | 50499 |
2011 | Nov | 31100 |
2011 | Des | 25180 |
2012 | Jan | 30660 |
2012 | Feb | 25172 |
2012 | Mar | 23849 |
2012 | Apr | 23733 |
2012 | Mei | 26257 |
2012 | Juni | 25551 |
2012 | Juli | 35852 |
2012 | Aug | 39709 |
2012 | Sep | 49131 |
2012 | Okt | 49356 |
2012 | Nov | 34301 |
2012 | Des | 35909 |
2013 | Jan | 35909 |
2013 | Feb | 23737 |
2013 | Mar | 19846 |
2013 | Apr | 23972 |
2013 | Mei | 23718 |
2013 | Juni | 23036 |
2013 | Juli | 34475 |
2013 | Aug | 37472 |
2013 | Sep | 49657 |
2013 | Okt | 37230 |
2013 | Nov | 29625 |
2013 | Des | 23342 |
1.3 Statistika Deskriptif
Melihat Struktur Data
str(Yt)
Jumlah Penumpang Tiap Bulan
[1] 23761 21013 19253 19861 27766 21900 36825 21607 25284 38980 40019 29933
[13] 29065 27516 23006 22760 23335 39184 56188 22846 37389 38146 34517 32251
[25] 24240 18261 20009 23226 26148 30764 44121 31031 30492 53371 34864 47911
[37] 29015 18261 23634 22584 22404 36710 39293 33144 33315 37088 29567 35735
[49] 27759 18339 17667 22584 16302 22450 26274 28663 31874 49090 23794 24909
[61] 27932 24181 20189 22516 19432 22228 31713 38574 44049 50499 31100 25180
[73] 30660 25172 23849 23733 26257 25551 35852 39709 49131 49356 34301 35909
[85] 35909 23737 19846 23972 23718 23036 34475 37472 49657 37230 29625 23342
Banyak Data yang Diambil
[1] 96
Data Jumlah Penumpang
Min. 1st Qu. Median Mean 3rd Qu. Max.
16302 23179 27849 30067 35909 56188
Standar Deviasi Data Jumlah Penumpang
[1] 9084.162
Ragam Data Jumlah Penumpang
[1] 82522006
Range Data Jumlah Penumpang
[1] 39886
1.4 SARIMA (Seasonal Autoregressive Integrated Moving Average)
SARIMA digunakan untuk melakukan peramalan pada data yang bersifat musiman (seasonal) sehingga dapat memprediksi untuk masa depan.
SARIMA terdiri atas beberapa bagian yaitu:
- Model Autoregressive (AR)
Untuk mengetahui nilai AR dalam membantu menetapkan Model AR terbaik yang akan digunakan
Fungsi dapat menggunakan persamaan berikut ini:
\[ Y_t = \phi_1 Y_{t-1} + \phi_2 Y_{t-2} + \phi_3 Y_{t-3} + \dots + \phi_pY_{t-p} + a_t \tag{1} \] \[ Y_t - \phi_1 Y_{t-1} - \phi_2 Y_{t-2} - \phi_3 Y_{t-3} - \dots - \phi_pY_{t-p} = a_t \tag{2} \] Untuk \(BY_t = Y_{t-1}\), sehingga dapat ditulis sebagai berikut: \[ (1 − 𝜙_1𝐵 − 𝜙_2𝐵^2 − 𝜙_3𝐵^3 − ⋯ − 𝜙_𝑝𝐵^𝑝)𝑌_𝑡 = 𝑎_𝑡 \tag{3} \] \[ 𝜙_1(𝐵)𝑌_𝑡 = 𝑎_𝑡 \tag{4} \]
Dimana, \(𝜙_𝑝(𝐵) = (1 − 𝜙_1𝐵 + 𝜙_2𝐵^2 + 𝜙_3𝐵^3 + ⋯ + 𝜙_𝑝𝐵^𝑝)Y_t =a_t\)
- Model Moving Average (MA)
Model MA pada orde q menyatakan bahwa suatu model pengamatan ke-t dipengaruhi oleh kesalahan masa lalu.
Berikut persamaan model MA: \[ Y_t = a_t + \theta_1 Y_{t-1} + \theta_2 Y_{t-2} + \theta_3 Y_{t-3} + \dots + \theta_qY_{t-q} \tag{1} \] Untuk \(Ba_t\) = \(a_{t-1}\), sehingga dapat ditulis sebagai berikut: \[ Y_t = (1- \theta_1B - \theta_2B^2-\theta_3B^3-\dots-\theta_qB^q)a_t \tag{2} \] \[ Y_t=\theta_q(B)a_t \tag{3} \] Dimana, \(\theta_q(B)=(1-\theta_1B-\theta2B^2-\theta_3B^3-\dots-\theta_qB^q)\)
- Model Autoregressive Average (ARMA)
Model ARMA merupakan model penyatuan model AR dan model MA yang umum ditulis ARMA (p,q)
Bentuk persamaan fungsi model ARMA orde p dan q sebagai berikut:
\[ Z_t=\phi_1Z_{t-1}+\dots+\phi_pZ_{t-p}+a_t-\theta_1a_{t-1}-\dots-\theta_qa_{t-q} \tag{1} \] - Model Autoregressive Integrated Moving Average (ARIMA)
Model ARIMA merupakan perluasan dari model ARMA dengan penambahan parameter d yang merupakan jumlah proses Differencing.
\[
\phi_p(B)(1-B)^dY_t=\theta_q(B)a_t \tag{1}
\] Dimana,
\(AR(p)\) adalah \(\phi_p(B)=(1-\phi_1B-\dots-\phi_pB^p)\)
\(MA(q)\) adalah \(\theta_q(B)=(1-\theta_1B-\dots-\theta_qB^q)\)
Differencing orde d adalah \((1-B)^d\)
Nilai residual pada saat t adalah \(a_t\)
- Model SARIMA
Fungsi SARIMA dapat ditulis sebagai berikut: \[
\phi(B)\Phi_p(B^s)(1-B)^d(1-B^s)^DY_t=\phi_q(B)\Theta_Q(B^S)a_t \tag{1}
\] Keterangan: \(Y_t\) : Data Y pada periode ke- \(t\)
\(Y_{t+k}\) : Data Y pada periode ke- \(t+k\)
\(B\) : Operator langkah mundur (Backshift Operator)
\(\phi_p(B)\) : Operator autoregresi dengan variabel \(p\) non musiman
\(\theta_q(B)\) : Operaor moving average dengan variabel \(q\) non musiman
\(a_t\) : Nilai kesalahan pada saat \(t\)
\(p, d, q\) : Orde \(AR\), diferensiasi, dan \(MA\) non musiman
\((1-B)^d\) : Orde diferensiasi \(non\) musiman
\(\Phi_p(B^S)\) : Operator autoregressive dengan variabel \(p\) musiman
\(\Theta_Q(B^S)\) : Operator autoregressive dengan variabel \(q\) musiman
\(P, D, Q\) : Orde \(AR\), diferensiasi, dan \(MA\) musiman
\((1-B^S)^D\) : Orde diferensiasi musiman
1.5 Langkah-Langkah Analisis
Uji stasioneritas data, untuk mengetahui apakah data time series yang digunakan sudah stasioner (dalam rata-rata dan variansi) atau tidak dengan melihat plot data (time series plot).
Melakukan Transformasi Box-Cox, apabila data yang digunakan belum stasioner dalam varian.
Melakukan differencing untuk mengatasi data yang tidak stasioner dalam rata-rata.
Identifikasi model.
Pendugaan parameter dan uji signifikansi menggunakan uji t dan uji p-value.
Pengecekan diagnostik model untuk mengetahui apakah telah memenuhi proses white noise atau tidak.
Pemilihan model terbaik, dapat dilihat dari nilai \(AIC\) dan \(SBC\).
Peramalan (forecasting) dengan model terbaik.
2 SOURCE CODE
2.1 Library
Menyelesaikan Analisis Deret Waktu model SARIMA menggunakan library sebagai berikut:
library(tseries) # *adf.test*
library(forecast) # *time series library*
library(readxl) # membaca data excel
library(lmtest)
library(car)
library(knitr) # membuat tabel
2.2 Analisis Data
2.2.1 Plot Data
Plot data berguna untuk melihat pola data sehingga memudahkan membaca data untuk menentukan analisis yang dilakukan.
# Plot Data
plot.ts(ADW_Seasonal_SARIMA$`Jumlah Penumpang`,
main="Time Series Plot",
xlab="Bulan", ylab="Jumlah Penumpang",
type="o",col="blue")
2.2.2 Deskriptif Data
Untuk mencari deskriptif data menggunakan syntax sebagai berikut:
Melihat struktur data
str(Yt)
Jumlah Penumpang Tiap Bulan
= ADW_Seasonal_SARIMA$`Jumlah Penumpang`
x x
Banyak Data yang Diambil
<-length(x)
n n
Data Jumlah Penumpang
summary(x)
Standar Deviasi Data Jumlah Penumpang
sd(x)
Ragam Data Jumlah Penumpang
var(x)
Range Data Jumlah Penumpang
<-max(x)-min(x)
range range
2.2.3 Uji Stasioner
- Stasioner dalam Rata-Rata
ACF (Autocorrelation FUnction)
Dari bentuk plot data seringkali dapat diketahui bahwa data tersebut stasioner atau tidak stasioner. Apabila dilihat dari plot ACF, maka nilai-nilai autokorelasi dari data stasioner akan turun menuju nol sesudah time lag (selisih waktu).
Persamaan fungsi autokorelasi dari data pada lag k sebagai berikut:
\[
\hat{\rho}
=\frac {\sum^{n-k}_{t=1} (Y_t-\bar{Y})(Y_{t+k}-\bar{Y})}
{\sum^n_{t-1}(Y_t-\bar{Y}^2)}
\] Dengan \(k = 0, 1, 2, \dots,n\)
Keterangan :
\(Y_t\) : data \(Y\) periode ke-\(t\)
\(Y_{t+k}\) : data \(Y\) periode ke- \(t+k\)
\(\hat\rho\) : koefisien autokorelasi pada lag ke- \(k\)
\(\bar{Y}\) : rata-rata data
PACF (Partial Autocorrelation Function)
koefisien autokorelasi parsial yang mengukur tingkat keeratan hubungan parsial antara pengamatan pada waktu ke-t dengan pengamatan pada waktu t+1 apabila lag yang digunakan yaitu 1,2,3, dan seterusnya dengan notasi \(\Phi_{kk}=k=1,2,3,\dots\)
\[
\Phi_{kk}=
\frac {\rho_k-\sum^{k-1}_{j=1}\Phi_{k-1,j}\rho{k-j}}
{1-\sum^{k-1}_{j=1}\Phi_{k-1,j}\rho{k-j}}
\] Keterangan:
\(\Phi_{kk}\) : koefisien autokorelasi pada lag ke \(k\)
\(\rho_k\) : koefisien autokorelasi pada lag ke \(k\)
Syntax R untuk menguji stasioner terhadap rata-rata sebagai berikut:
# Stasioner dalam Rata-Rata
acf(Yt,96) # Uji ACF
pacf(Yt,96) # Uji PACF
adf.test(Yt,k=12) # Uji Statistik ADF
- Stasioner dalam Ragam
Data time series dikatakan stasioner dalam variansi apabila struktur dari waktu ke waktu mempunyai fluktuasi data yang tetap atau konstan dan tidak berubah-ubah. Secara visual untuk melihat hal tersebut dapat dibantu dengan menggunakan plot time series, yaitu dengan melihat fluktuasi data dari waktu ke waktu. Untuk mengetahui data time series telah stasioner dalam variansi dapat dilakukan dengan menggunakan transformasi Box-Cox.
Berikut syntax R untuk Transformasi Box-Cox melihat stasioneritas terhadap Ragam:
#STASIONERITAS DALAM RAGAM
boxCox(Yt~1) #Uji Box-Cox
2.2.4 Penanganan Data Tidak Stasioner
- Diferensiasi Untuk Data Tidak Stasioner terhadap Rata-Rata
Data yang digunakan, dilakukan analisis apabila tidak memenuhi kondisi stasioner terhadap rata-rata maka perlu dilakukan proses diferensiasi (differencing).
Persamaan untuk diferensiasi orde ke d dapat didefinisikan sebagai berikut:
\[
\Delta^dY_t=(1-B)^dY_t
\] Keterangan:
\(Y_t\) : Nilai variabel \(Y\) pada waktu \(t\)
\(Y_{t-1}\) : Nilai variabel \(Y\) pada waktu \(t-1\)
\(B\) : backward shift
DIfferencing dibagi menjadi dua, yaitu:
Differencing Non-Musiman
Ketika data tidak mempunyai rata-rata yang konstan, maka dapat dibuat data baru dengan rata-rata konstan dengan cara pembedaan (differencing) data, artinya kita menghitung perubahan pada data secara berturut-turut.
Dimulai dengan pembedaan pertama 𝑑 = 1. Jika pembedaan pertama 𝑑 = 1 belum membuat data mempunyai rata-rata yang konstan, maka dilakukan pembedaan ke-2 atau 𝑑 = 2 yang berarti kita menghitung perbedaan kedua dari perbedaan pertama.
Syntax R sebagai berikut:
#differencing non seasonal
<-diff(Yt_trans,lag=1) # Diferensiasi data
Yt_diff
Yt_diffplot.ts(Yt_diff,main="Time Series Plot (non
seasonal)",xlab="Waktu",ylab="Differencing",
type="o",col="purple") # Plot Data setelah Diferensiasi
acf(Yt_diff,96,main="ACF non seasonal") # Uji ACF diferensiasi
pacf(Yt_diff,96,main="PACF non seasonal") # Uji PACF diferensiasi
adf.test(Yt_diff,k=12) # Uji statistik ADF
kpss.test(Yt_diff) # Uji Statistik KPSS
Differencing Musiman
Pembedaan musiman berarti menghitung pergeseran data secara musiman berdasarkan periode waktu tertentu, biasanya dinotasikan s untuk menstimulasi rata-rata dalam seri menjadi konstan.
#differencing seasonal
<-diff(Yt_trans, lag=12)
Yt_diff12
Yt_diff12plot.ts(Yt_diff12,main="Time Series Plot
(seasonal)",xlab="Waktu",ylab="Differencing_12",
type="o",col="purple")
acf(Yt_diff12,96,main="ACF seasonal")
pacf(Yt_diff12,96,main="PACF seasonal")
adf.test(Yt_diff12,k=1)
kpss.test(Yt_diff12)
- Transformasi Box-Cox Penanganan Stasioneritas Terhadap Ragam
Diperlukan transformasi Box-Cox untuk menstasionerkan data terhadap ragam. Transformasi log dan akar kuadrat merupakan anggota dari keluarga power transformation yang disebut Box-Cox Transformation (Box and Cox, 1964). Dengan transformasi ini didefinisikan seri baru \(Z_t'\) sebagai \[ Z_t' = \frac {Z_t\lambda-1}{\lambda} \] Dimana \(\lambda\) adalah bilangan real. Jika nilai \(\lambda=\frac{1}{2}\) maka disebut transformasi akar, karena \(X_t\frac{1}{2}\) adalah aakr dari \(z_t\).
Syntax R sebagai berikut:
<-powerTransform(Yt)
p<-bcPower(Yt,p$lambda)
Yt_trans
Yt_transboxCox(Yt_trans~1)
2.2.5 Identifikasi Model
Identifikasi model berfungsi untuk menentukan orde \(p\) dan orde \(q\) serta orde \(P\) dan orde \(Q\) yang akan digunakan dalam menentukan model SARIMA dalam data yang diuji.
2.2.6 Pendugaan Parameter Model
Pada identifikasi model, diketahui kemungkinan model SARIMA, tetapi perlu dilakukan pendugaan terhadap model lainnya yang mungkin. Sehingga dapat dicari model terbaik.
Model yang baik adalah model yang menunjukkan bahwa penaksiran parameternya signifikan. Parameter dinyatakan signifikan jika hasil p-value < α dengan nilai α = 0.05, atau dapat melakukan uji signifikansi parameter secara manual sebagai berikut: \[
t_{hitung} =
\frac {EstimasiParameter}{Standar Error Parameter}
\] Dengan Hipotesis:
\(H_0\) : Parameter tidak signifikan terhadap model
\(H_1\) : Parameter dignifikan model
Berikut syntax R untuk membuat model
# Membuat Model
<-
model1Arima(Yt,order=c(0,1,1),
seasonal=list(order=c(1,1,0),period=12))
model1
Kriteria pengambilan keputusan sebagai berikut:
Tolak \(H_0\) jika \(| t_hitung | > t_{α/2, df}\)
\(df = T-p\)
\(T\) adalah banyaknya data
\(p\) adalah banyaknya parameter ada pada model
2.2.7 Pengecekan Diagnostik Model
Uji White Noise
Proses uji diagnostik dilakukan menggunakan uji White noise. Proses ini bertujuan untuk mengetahui jika model tersebut telah layak atau tidak dalam pemilihan model terbaik. Dapat menggunakan rumus sebagai berikut:
\[
Q= n(n+2)\sum^i_{k=1}\frac{\hat\rho^2_k}{n-k}
\] Keterangan:
\(\rho\) : Autokorelasi
\(Q\) : Uji Ljung-Box
\(k\) : lag waktu
\(n\) : Banyak parameter
\(i\) : Banyak sisaan
Hipotesis:
\(H_0\) : Residual memenuhi syarat White Noise
\(H_1\) : Residual tidak White Noise
Uji Normalitas Sisaan
Untuk mengetahui apakah residual berdistribusi normal atau tidak dapat menggunakan uji Kolmogorov-Smirnov.
\[
D=maks|F_n(x)-F_0(x)|
\] Keterangan:
\(F_n(x)\) : Fungsi kumulatif contoh
\(F_0(x)\) : Fungsi kumulatif distribusi normal
Hipotesis:
\(H_o : \epsilon_i \sim(\mu. \sigma^2)\)
\(H_1 : \epsilon_i \ne(\mu. \sigma^2)\)
Syntax R untuk pengecekan model sebagai berikut
#MODEL DIAGNOSTIK
coeftest(model1) #Uji White-Noise
plot.ts(model1$residuals,main="Residuals from model 1",
ylab="residuals",type='o') #Plot Residual
abline(h=0)
jarque.bera.test(model1$residuals) #Uji Statistik Jarque-Bera
tsdiag(model1)
Box.test(model1$residuals, type="Ljung-Box") # Uji Ljung-Box
2.2.8 Pemilihan Model Terbaik
Kriteria AIC dirumuskan sebagai berikut:
\[
AIC(M)=
n\ln\hat\sigma^2_\alpha+2M
\] Dengan:
\(n\) : banyak sisaan
\(\hat\sigma^2_\alpha\) : estimasi ragam sisaan
\(M\) : Jumlah parameter model
Model dikatakan baik apabila \(AIC\) dan \(SBC\) bernilai minimum.
Syntax R untuk mendapat nilai AIC sebagai berikut:
#Menentukan model terbaik dengan AIC
AIC(model1,model2,model3,model4,model5,model6)
2.2.9 Peramalan
Model deret waktu yang didapat umumnya digunakan untuk peramalan. Menurut Makridakis, Wheelwright, dan McGee (1999), ramalan (forecast) merupakan prediksi mengenai terjadinya suatu kejadian di waktu yang akan datang.
Dalam menggunakan metode peramalan pasti akan menemui tingkat akurasi dalam peramalan tersebut. Secara umum perhitungan nilai kesalahan dari peramalan adalah sebagai berikut:
\[
e=Y_t-Y_t'
\] Keterangan:
\(e\) : kesalahan saat periode ke- \(t\)
\(Y_t\) : Nilai sesungguhnya saat periode ke- \(t\)
\(Y_t'\) : Nilai hasil peramalan saat periode ke- \(t\)
Melakukan peramalan untuk satu tahun kedepan dari model terbaik yang telah didapatkan dari nilai AIC dengan menggunakan R sebagai berikut:
#FORECASTING
plot(forecast(model1, h=12))
<- predict(model1, n.ahead=12)
prediksi prediksi
3 HASIL DAN PEMBAHASAN
3.1 Plot Data
Berdasarkan plot diatas menunjukkan time series plot dari data jumlah penumpang turun di Pelabuhan Kota Makassar pada bulan Januari tahun 2006 sampai dengan bulan Desember tahun 2013. Dapat terlihat dari plot data tersebut membentuk pola musiman yang berulang dalam selang waktu 12 periode, sehingga dapat disimpulkan bahwa data jumlah penumpang turun di pelabuhan Kota Makassar belum stasioner dalam rata-rata maupun stasioner dalam varians. Puncak data berada pada bulan Juli tahun 2007.
3.2 Deskriptif Data
Struktur data
Time-Series [1:96] from 1 to 96: 23761 21013 19253 19861 27766 ...
Jumlah Penumpang Tiap Bulan
[1] 23761 21013 19253 19861 27766 21900 36825 21607 25284 38980 40019 29933
[13] 29065 27516 23006 22760 23335 39184 56188 22846 37389 38146 34517 32251
[25] 24240 18261 20009 23226 26148 30764 44121 31031 30492 53371 34864 47911
[37] 29015 18261 23634 22584 22404 36710 39293 33144 33315 37088 29567 35735
[49] 27759 18339 17667 22584 16302 22450 26274 28663 31874 49090 23794 24909
[61] 27932 24181 20189 22516 19432 22228 31713 38574 44049 50499 31100 25180
[73] 30660 25172 23849 23733 26257 25551 35852 39709 49131 49356 34301 35909
[85] 35909 23737 19846 23972 23718 23036 34475 37472 49657 37230 29625 23342
Banyak Data yang Diambil
[1] 96
Data Jumlah Penumpang
Min. 1st Qu. Median Mean 3rd Qu. Max.
16302 23179 27849 30067 35909 56188
Standar Deviasi Data Jumlah Penumpang
[1] 9084.162
Ragam Data Jumlah Penumpang
[1] 82522006
Range Data Jumlah Penumpang
[1] 39886
3.3 Uji Stasioner
- Stasioner dalam Rata-Rata
Berikut ini adalah hasil dari uji stasioneritas data jumlah penumpang yang turun dari pelayaran dalam negeri di pelabuhan Kota Makassar dengan menggunakan plot ACF dan PACF.
Gambar diatas merupakan plot ACF dan PACF dari data time series jumlah penumpang yang turun dari pelayaran dalam negeri di pelabuhan Kota Makassar. Berdasarkan plot diatas, data tidak horizontal sepanjang sumbu waktu, atau fluktuasi data tidak berada disekitar suatu nilai rata-rata yang konstan, sehingga dapat disimpulkan bahwa data jumlah penumpang yang turun dari pelayaran dalam negeri di pelabuhan Kota Makassar tersebut belum stasioner baik dalam rata-rata maupun dalam varians. Pada plot ACF diatas juga terlihat jelas bahwa pada lag 12, lag 24, dan lag 36 nilai-nilai korelasi signifikan berbeda dari nol. Nilai korelasi tersebut menunjukkan penurunan secara lambat atau data belum stasioner dalam rata-rata non-musiman dan rata-rata musiman 12. Karena data belum stasioner dalam rata- rata non-musiman dan rata-rata musiman 12, maka data belum dapat langsung digunakan untuk mendapatkan model terbaik. Untuk mengatasi data yang belum stasioner tersebut, maka dilakukan diferensiasi pertama non-musiman (d=1) dan untuk menghilangkan kuatnya pengaruh musiman dilakukan diferensiasi satu musiman 12 (D=1).
Selain itu dapat digunakan uji Augmented Dickey-Fuller untuk membuktikan data asli sudah stasioner terhadap ragam dan rata-rata atau belum.
Augmented Dickey-Fuller Test
data: Yt
Dickey-Fuller = -1.6877, Lag order = 12, p-value = 0.7055
alternative hypothesis: stationary
Berdasarkan output diatas diperoleh nilai statistik uji Augmented Dickey-Fuller sebesar -1.6877 dengan lag order = 12 dan p-value sebesar 0.7055.
Hasil p-value sebesar 0.7055 > taraf signifikansi \(\alpha\) sebesar 5%, maka \(H_0\) diterima. Dapat disimpulkan bahwa data asli jumlah penumpang yang turun dari pelayaran dalam negeri di pelabuhan Kota Makassar tidak stasioner. Sehingga perlu dilakukan transformasi Box-Cox untuk menstasionerkan data dalam varians dan differencing untuk menstasionerkan data dalam rata-rata
- Stasioner dalam Ragam
Berdasarkan output diatas didapatkan grafik bahwa dari hasil analisis data asli jumlah penumpang yang turun dari pelayaran dalam negeri di pelabuhan Kota Makassar diperoleh nilai \(\lambda\ne1\) sehingga dapat dikatakan data asli tersebut tidak stasioner dalam ragam.
3.4 Penanganan Data Tidak Stasioner
- Transformasi Box-Cox data Tidak Stasioner terhadap Ragam
Time Series:
Start = 1
End = 96
Frequency = 1
[1] 1.794977 1.794503 1.794146 1.794275 1.795533 1.794666 1.796426 1.794614
[9] 1.795205 1.796590 1.796664 1.795785 1.795687 1.795502 1.794856 1.794815
[17] 1.794909 1.796605 1.797527 1.794829 1.796470 1.796528 1.796234 1.796024
[25] 1.795051 1.793921 1.794305 1.794892 1.795324 1.795874 1.796929 1.795902
[33] 1.795845 1.797406 1.796264 1.797142 1.795682 1.793921 1.794957 1.794785
[41] 1.794754 1.796417 1.796612 1.796109 1.796125 1.796447 1.795744 1.796338
[49] 1.795532 1.793939 1.793777 1.794785 1.793416 1.794762 1.795341 1.795641
[57] 1.795987 1.797203 1.794982 1.795151 1.795553 1.795042 1.794342 1.794774
[65] 1.794184 1.794724 1.795971 1.796560 1.796924 1.797273 1.795909 1.795190
[73] 1.795863 1.795189 1.794991 1.794973 1.795339 1.795242 1.796347 1.796642
[81] 1.797205 1.797216 1.796215 1.796352 1.796352 1.794973 1.794272 1.795010
[89] 1.794970 1.794861 1.796230 1.796477 1.797231 1.796458 1.795751 1.794910
- Diferensiasi Untuk Data Tidak Stasioner terhadap Rata-Rata
Diferensiasi Non-Musiman
Diferensiasi pertama non-musiman (d=1)
Time Series:
Start = 2
End = 96
Frequency = 1
[1] -4.739242e-04 -3.575502e-04 1.290775e-04 1.258405e-03 -8.668808e-04
[6] 1.760023e-03 -1.812730e-03 5.911185e-04 1.385178e-03 7.392773e-05
[11] -8.791019e-04 -9.724740e-05 -1.852733e-04 -6.464205e-04 -4.090260e-05
[16] 9.455459e-05 1.695219e-03 9.220962e-04 -2.697493e-03 1.641296e-03
[21] 5.774955e-05 -2.945153e-04 -2.095722e-04 -9.730776e-04 -1.130230e-03
[26] 3.843718e-04 5.865108e-04 4.327628e-04 5.492502e-04 1.055021e-03
[31] -1.027190e-03 -5.657244e-05 1.561111e-03 -1.142175e-03 8.777111e-04
[36] -1.459972e-03 -1.760830e-03 1.036276e-03 -1.719919e-04 -3.073717e-05
[41] 1.662731e-03 1.953031e-04 -5.030260e-04 1.591743e-05 3.217029e-04
[46] -7.028228e-04 5.935494e-04 -8.054813e-04 -1.593062e-03 -1.622788e-04
[51] 1.008205e-03 -1.369382e-03 1.346536e-03 5.791688e-04 2.993778e-04
[56] 3.462228e-04 1.215555e-03 -2.220319e-03 1.683555e-04 4.028196e-04
[61] -5.113749e-04 -7.002542e-04 4.317277e-04 -5.892640e-04 5.396661e-04
[66] 1.247036e-03 5.891082e-04 3.643347e-04 3.480989e-04 -1.363839e-03
[71] -7.189006e-04 6.729951e-04 -6.741416e-04 -1.977771e-04 -1.815464e-05
[76] 3.664465e-04 -9.681017e-05 1.105088e-03 2.945719e-04 5.626664e-04
[81] 1.136109e-05 -1.001368e-03 1.374776e-04 0.000000e+00 -1.378805e-03
[86] -7.017407e-04 7.383678e-04 -3.961308e-05 -1.097056e-04 1.369375e-03
[91] 2.468746e-04 7.542106e-04 -7.729922e-04 -7.074679e-04 -8.401609e-04
Output diatas merupakan hasil differencing satu non-musiman (𝑑=1) pada data jumlah penumpang yang turun dari pelayaran dalam negeri di pelabuhan Kota Makassar. Berdasarkan output tersebut diperoleh 95 data jumlah penumpang yang turun dari pelayaran dalam negeri di Kota Makassar setelah dilakukan differencing satu kali non-musiman (𝑑=1).
Plot data setelah dilakukan diferensiasi
Plot ACF dan PACF data hasil diferensiasi satu non-musiman
Gambar diatas yaitu plot proses differencing pertama (𝑑 = 1) data time series untuk jumlah penumpang turun dari pelayaran dalam negeri di pelabuhan Kota Makassar. Plot pada gambar diatas hasil diferensiasi satu nonmusiman terlihat bahwa pada data non-musiman sudah stasioner. Akan tetapi, data belum stasioner dalam rata-rata musiman dimana pada lag musiman nilai autokorelasi cenderung turun lambat. Oleh karena itu, dilakukan proses diferensiasi satu musiman 12 dari data hasil diferensiasi satu non-musiman.
Uji Augmented Dickey-Fuller pada data jumlah penumpang yang turun dari pelayaran dalam negeri di kota Makassar setelah dilakukan differencing satu kali non-musiman.
Augmented Dickey-Fuller Test
data: Yt_diff
Dickey-Fuller = -3.6975, Lag order = 12, p-value = 0.02862
alternative hypothesis: stationary
Berdasarkan output diatas diperoleh nilai statistik uji Augmented DickeyFuller sebesar -3.6975 dengan lag order = 12 dan p-value sebesar 0.02862.
Hasil p-value sebesar 0.02862 < taraf signifikansi 𝛼 sebesar 5%, maka \(𝐻_0\) ditolak. Maka dapat disimpulkan bahwa data hasil differencing satu kali non-musiman jumlah penumpang yang turun dari pelayaran dalam negeri di pelabuhan Kota Makassar sudah stasioner.
Berikut adalah output uji KPSS pada data jumlah penumpang yang turun dari pelayaran dalam negeri di kota Makassar setelah dilakukan differencing satu kali non-musiman
KPSS Test for Level Stationarity
data: Yt_diff
KPSS Level = 0.024473, Truncation lag parameter = 3, p-value = 0.1
Berdasarkan output diatas diperoleh nilai statistik uji KPSS sebesar 0.024473 dengan lag parameter = 3 dan p-value sebesar 0.1.
Hasil p-value sebesar 0.1 > taraf signifikansi 𝛼 sebesar 5%, maka \(H_0\) diterima. Maka dapat disimpulkan bahwa data hasil differencing satu kali non-musiman jumlah penumpang yang turun dari pelayaran dalam negeri di pelabuhan Kota Makassar sudah stasioner.
Diferensiasi Musiman
Diferensiasi satu musiman 12 (D=1)
Time Series:
Start = 13
End = 96
Frequency = 1
[1] 7.102942e-04 9.989450e-04 7.100747e-04 5.400945e-04 -6.237554e-04
[6] 1.938344e-03 1.100418e-03 2.156557e-04 1.265833e-03 -6.159514e-05
[11] -4.300381e-04 2.394916e-04 -6.363386e-04 -1.581296e-03 -5.505031e-04
[16] 7.691027e-05 4.151185e-04 -7.308501e-04 -5.979252e-04 1.072377e-03
[21] -6.254913e-04 8.778701e-04 3.021017e-05 1.117493e-03 6.305993e-04
[26] 0.000000e+00 6.519045e-04 -1.065982e-04 -5.700982e-04 5.433821e-04
[31] -3.163359e-04 2.078281e-04 2.803180e-04 -9.590901e-04 -5.197377e-04
[36] -8.038993e-04 -1.494089e-04 1.835853e-05 -1.180197e-03 0.000000e+00
[41] -1.338644e-03 -1.654839e-03 -1.270973e-03 -4.685696e-04 -1.382643e-04
[46] 7.555880e-04 -7.619086e-04 -1.187103e-03 2.119835e-05 1.102886e-03
[51] 5.649101e-04 -1.156690e-05 7.685506e-04 -3.831921e-05 6.295483e-04
[56] 9.192786e-04 9.373906e-04 6.993428e-05 9.264148e-04 3.915875e-05
[61] 3.093342e-04 1.465675e-04 6.490447e-04 1.991624e-04 1.154873e-03
[66] 5.183967e-04 3.764482e-04 8.191194e-05 2.802436e-04 -5.649422e-05
[71] 3.059765e-04 1.162355e-03 4.893597e-04 -2.153034e-04 -7.192670e-04
[76] 3.725542e-05 -3.688042e-04 -3.816996e-04 -1.174126e-04 -1.651099e-04
[81] 2.643438e-05 -7.579189e-04 -4.640187e-04 -1.441657e-03
Output diatas merupakan hasil differencing satu musiman (D =1) pada data jumlah penumpang yang turun dari pelayaran dalam negeri di pelabuhan Kota Makassar. Berdasarkan output tersebut diperoleh 84 data jumlah penumpang yang turun dari pelayaran dalam negeri di Kota Makassar setelah dilakukan differencing satu kali musiman (D=1).
Plot data setelah dilakukan diferensiasi
Plot deret waktu, ACF dan PACF data jumlah penumpang yang turun di pelabuhan Kota Makassar hasil diferensiasi pertama musiman 12 dengan D=1.
Berdasarkan plot diatas terlihat bahwa data telah stasioner dalam ratarata non-musiman dan rata-rata musiman 12.
uji Augmented Dickey-Fuller pada data jumlah penumpang yang turun dari pelayaran dalam negeri di kota Makassar setelah dilakukan differencing satu kali musiman (D =1).
Augmented Dickey-Fuller Test
data: Yt_diff12
Dickey-Fuller = -4.1884, Lag order = 1, p-value = 0.01
alternative hypothesis: stationary
Berdasarkan output diatas diperoleh nilai statistik uji Augmented Dickey-Fuller sebesar -4.1884 dengan lag order = 1 dan p-value sebesar 0.01.
Hasil p-value sebesar 0.01 < taraf signifikansi 𝛼 sebesar 5% atau 0.05, maka \(H_0\) ditolak. Maka dapat disimpulkan bahwa data hasil differencing satu kali musiman jumlah penumpang yang turun dari pelayaran dalam negeri di pelabuhan Kota Makassar sudah stasioner.
Berikut adalah output uji KPSS pada data jumlah penumpang yang turun dari pelayaran dalam negeri di pelabuhan Kota Makassar setelah dilakukan differencing satu kali musiman (D = 1).
KPSS Test for Level Stationarity
data: Yt_diff12
KPSS Level = 0.15767, Truncation lag parameter = 3, p-value = 0.1
Berdasarkan output diatas diperoleh nilai statistik uji KPSS sebesar 0.15767 dengan lag parameter = 3 dan p-value sebesar 0.1.
Hasil p-value sebesar 0.1 > taraf signifikansi 𝛼 sebesar 5%, maka \(H_0\) diterima. Maka dapat disimpulkan bahwa data hasil differencing satu kali musiman jumlah penumpang yang turun dari pelayaran dalam negeri di pelabuhan Kota Makassar sudah stasioner.
Berdasarkan hasil plot dan uji statistik didapatkan bahwa data telah stasioner dalam rata-rata non-musiman dan rata-rata musiman 12. Sehingga data sudah dapat langsung digunakan untuk mendapatkan model Seasonal ARIMA terbaik.
3.5 Identifikasi Model
- Non Musiman
Dari gambar plot ACF non musiman diatas terlihat bahwa plot berbentuk pola cut off after lag 1 sehingga nilai orde MA (q) = 1
Dari gambar plot PACF non musiman diatas diketahui bahwa bentuk pola menurun secara eksponensial sehingga nilai orde AR (p) = 0. Jadi dapat disimpulkan dari plot ACF dan PACF non musiman model ARIMA yang diperoleh adalah (0,1,1).
- Musiman
Dari gambar plot ACF musiman diatas diketahui bahwa bentuk pola menurun secara eksponensial sehingga nilai orde MA (Q) = 0. Dari gambar plot PACF musiman diatas diketahui bahwa bentuk pola cut off pada lag ke-2 dan pada lag ke-1 keluar dari garis selang kepercayaan sehingga nilai orde AR (P) = 1.
Jadi dapat disimpulkan dari plot ACF dan PACF musiman model ARIMA yang diperoleh adalah (1,1,0).
Kesimpulan dari hasil keseluruhan plot ACF dan PACF non musiman dan musiman didapatkan Model Seasonal ARIMA yang mungkin sesuai untuk data jumlah penumpang turun dari pelayaran dalam negeri di pelabuhan Kota Makassar yaitu Model Seasonal ARIMA \((0,1,1)(1,1,0)^{12}\)
3.6 Pendugaan Parameter
Model yang mungkin adalah Model Seasonal ARIMA \((0,1,1)(1,1,0)^{12}\). Akan tetapi perlu dilakukan pendugaan model lainnya, yaitu Model SARIMA \((0,1,1)(0,1,1)^{12}\), Model SARIMA \((0,1,1)(1,1,1)^{12}\), Model SARIMA \((1,1,1)(1,1,0)^{12}\), Model SARIMA \((1,1,0)(0,1,1)^{12}\), dan Model SARIMA \((1,1,0)(1,1,0)^{12}\). Sehingga dapat dicari model yang terbaik.
- Model SARIMA \((0,1,1)(1,1,0)^{12}\)
Series: Yt
ARIMA(0,1,1)(1,1,0)[12]
Coefficients:
ma1 sar1
-0.7444 -0.3745
s.e. 0.0817 0.1094
sigma^2 = 41841087: log likelihood = -846.38
AIC=1698.76 AICc=1699.07 BIC=1706.02
Series: Yt
ARIMA(0,1,1)(1,1,0)[12]
Coefficients:
ma1 sar1
-0.7444 -0.3745
s.e. 0.0817 0.1094
sigma^2 = 41841087: log likelihood = -846.38
AIC=1698.76 AICc=1699.07 BIC=1706.02
Training set error measures:
ME RMSE MAE MPE MAPE MASE ACF1
Training set -430.99 5941.668 4381.301 -3.550142 14.82683 0.6416303 0.01593099
Dari output diatas diperoleh hasil pendugaan parameter untuk Model SARIMA \((0,1,1)(1,1,0)^{12}\) yaitu nilai \(𝜃_1\) sebesar -0.7444 dan \(Φ_1\) sebesar -0.3745. Didapatkan juga nilai standard error untuk masing masing parameter sebesar 0.0817 dan 0.1094. Dapat diketahui pula nilai AIC (Akaike’s Information Criterion) sebesar 1698.76 dan nilai BIC (Bayesian Information Criterion) sebesar 1706.02. Nilai ME untuk model tersebut sebesar -430.99, nilai RMSE sebesar 5941.668, nilai MAE sebesar 4381.301, MPE sebesar -3.550142, MAPE sebesar 14.82683, MASE sebesar 0.6416303, dan ACF1 sebesar 0.01593099
- Model SARIMA \((0,1,1)(0,1,1)^{12}\)
Series: Yt
ARIMA(0,1,1)(0,1,1)[12]
Coefficients:
ma1 sma1
-0.7601 -0.3913
s.e. 0.0839 0.1170
sigma^2 = 41823076: log likelihood = -846.48
AIC=1698.97 AICc=1699.27 BIC=1706.22
Series: Yt
ARIMA(0,1,1)(0,1,1)[12]
Coefficients:
ma1 sma1
-0.7601 -0.3913
s.e. 0.0839 0.1170
sigma^2 = 41823076: log likelihood = -846.48
AIC=1698.97 AICc=1699.27 BIC=1706.22
Training set error measures:
ME RMSE MAE MPE MAPE MASE ACF1
Training set -463.8075 5940.389 4363.885 -3.849776 14.7002 0.6390797 0.02016622
Dari output diatas diperoleh hasil pendugaan parameter yaitu nilai 𝜃1 sebesar -0.7601 dan Θ1 sebesar -0.3913. Didapatkan juga nilai standard error untuk masing masing parameter sebesar 0.0839 dan 0.1170. Dapat diketahui pula nilai AIC (Akaike’s Information Criterion) sebesar 1698.97 dan nilai BIC (Bayesian Information Criterion) sebesar 1706.22. Nilai ME untuk model tersebut sebesar -463.8075, nilai RMSE sebesar 5940.389, nilai MAE sebesar 4363.885, MPE sebesar -3.849776, MAPE sebesar 14.7002, MASE sebesar 0.6390797, dan ACF1 sebesar 0.02016622.
- Model SARIMA \((0,1,1)(1,1,1)^{12}\)
Series: Yt
ARIMA(0,1,1)(1,1,1)[12]
Coefficients:
ma1 sar1 sma1
-0.7314 -0.8374 0.5905
s.e. 0.0791 0.1984 0.3093
sigma^2 = 41179231: log likelihood = -845.91
AIC=1699.81 AICc=1700.32 BIC=1709.49
Series: Yt
ARIMA(0,1,1)(1,1,1)[12]
Coefficients:
ma1 sar1 sma1
-0.7314 -0.8374 0.5905
s.e. 0.0791 0.1984 0.3093
sigma^2 = 41179231: log likelihood = -845.91
AIC=1699.81 AICc=1700.32 BIC=1709.49
Training set error measures:
ME RMSE MAE MPE MAPE MASE ACF1
Training set -437.748 5857.988 4378.017 -3.32077 14.87518 0.6411493 0.006370568
Dari output diatas diperoleh hasil pendugaan parameter yaitu nilai 𝜃1 sebesar -0.7314, Φ1 sebesar -0.8374 dan Θ1 sebesar 0.5905. Didapatkan juga nilai standard error untuk masing masing parameter sebesar 0.0791, 0.1984 dan 0.3093. Dapat diketahui pula nilai AIC (Akaike’s Information Criterion) sebesar 1699.81 dan nilai BIC (Bayesian Information Criterion) sebesar 1709.49. Nilai ME untuk model tersebut sebesar -437.748, nilai RMSE sebesar 5857.988, nilai MAE sebesar 4378.017, MPE sebesar -3.32077, MAPE sebesar 14.87518, MASE sebesar 0.6411493, dan ACF1 sebesar 0.006370568.
- Model SARIMA \((1,1,1)(1,1,0)^{12}\)
Series: Yt
ARIMA(1,1,1)(1,1,0)[12]
Coefficients:
ar1 ma1 sar1
0.0546 -0.7714 -0.3770
s.e. 0.1521 0.1063 0.1092
sigma^2 = 42271948: log likelihood = -846.32
AIC=1700.63 AICc=1701.14 BIC=1710.31
Series: Yt
ARIMA(1,1,1)(1,1,0)[12]
Coefficients:
ar1 ma1 sar1
0.0546 -0.7714 -0.3770
s.e. 0.1521 0.1063 0.1092
sigma^2 = 42271948: log likelihood = -846.32
AIC=1700.63 AICc=1701.14 BIC=1710.31
Training set error measures:
ME RMSE MAE MPE MAPE MASE ACF1
Training set -437.368 5935.202 4394.895 -3.565473 14.83876 0.643621 -0.01407937
Dari output diatas diperoleh hasil pendugaan parameter yaitu nilai ɸ1 sebesar 0.0546, 𝜃1 sebesar -0.7714, dan Φ1 sebesar -0.3770. Didapatkan juga nilai standard error untuk masing masing parameter sebesar 0.1521, 0.1063 dan 0.1092. Dapat diketahui pula nilai AIC (Akaike’s Information Criterion) sebesar 1700.63 dan nilai BIC (Bayesian Information Criterion) sebesar 1710.31. Nilai ME untuk model tersebut sebesar -437.368, nilai RMSE sebesar 5935.202, nilai MAE sebesar 4394.895, MPE sebesar -3.565473, MAPE sebesar 14.83876, MASE sebesar 0.643621, dan ACF1 sebesar -0.01407937
- Model SARIMA \((1,1,0)(0,1,1)^{12}\)
Series: Yt
ARIMA(1,1,0)(0,1,1)[12]
Coefficients:
ar1 sma1
-0.4724 -0.3311
s.e. 0.0964 0.1152
sigma^2 = 50020940: log likelihood = -853.29
AIC=1712.59 AICc=1712.89 BIC=1719.84
Series: Yt
ARIMA(1,1,0)(0,1,1)[12]
Coefficients:
ar1 sma1
-0.4724 -0.3311
s.e. 0.0964 0.1152
sigma^2 = 50020940: log likelihood = -853.29
AIC=1712.59 AICc=1712.89 BIC=1719.84
Training set error measures:
ME RMSE MAE MPE MAPE MASE ACF1
Training set -222.7173 6496.551 4842.04 -2.709115 16.5552 0.7091043 -0.1165093
Dari output diatas diperoleh hasil pendugaan parameter yaitu nilai ɸ1 sebesar -0.4724 dan Θ1sebesar -0.3311.Didapatkan juga nilai standard error untuk masing masing parameter sebesar 0.0964 dan 0.1152. Dapat diketahui pula nilai AIC (Akaike’s Information Criterion) sebesar 1712.59 dan nilai BIC (Bayesian Information Criterion) sebesar 1719.84. Nilai ME untuk model tersebut sebesar -222.7173, nilai RMSE sebesar 6496.551, nilai MAE sebesar 4842.04, MPE sebesar -2.709115, MAPE sebesar 16.5552, MASE sebesar 0.7091043, dan ACF1 sebesar -0.1165093.
- Model SARIMA \((1,1,0)(1,1,0)^{12}\)
Series: Yt
ARIMA(1,1,0)(1,1,0)[12]
Coefficients:
ar1 sar1
-0.4666 -0.3300
s.e. 0.0967 0.1123
sigma^2 = 49858200: log likelihood = -853.15
AIC=1712.3 AICc=1712.6 BIC=1719.55
Series: Yt
ARIMA(1,1,0)(1,1,0)[12]
Coefficients:
ar1 sar1
-0.4666 -0.3300
s.e. 0.0967 0.1123
sigma^2 = 49858200: log likelihood = -853.15
AIC=1712.3 AICc=1712.6 BIC=1719.55
Training set error measures:
ME RMSE MAE MPE MAPE MASE
Training set -212.8257 6485.974 4846.297 -2.580182 16.64911 0.7097277
ACF1
Training set -0.1191221
Dari output diatas diperoleh hasil pendugaan parameter yaitu nilai ɸ1 sebesar -0.4666 dan Φ1 sebesar -0.3300. Didapatkan juga nilai standard error untuk masing masing parameter sebesar 0.0967 dan 0.1123. Dapat diketahui pula nilai AIC (Akaike’s Information Criterion) sebesar 1712.3 dan nilai BIC (Bayesian Information Criterion) sebesar 1719.55. Nilai ME untuk model tersebut sebesar -212.8257, nilai RMSE sebesar 6485.974, nilai MAE sebesar 4846.297, MPE sebesar -2.580182, MAPE sebesar 16.64911, MASE sebesar 0.7097277, dan ACF1 sebesar -0.1191221.
3.7 Diagnostik Model
Dilakukan untuk menguji kesesuaian dari parameter yang didapat pada tahap sebelumnya.
- Model SARIMA \((0,1,1)(1,1,0)^{12}\)
z test of coefficients:
Estimate Std. Error z value Pr(>|z|)
ma1 -0.744444 0.081686 -9.1134 < 2.2e-16 ***
sar1 -0.374529 0.109372 -3.4244 0.0006162 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Jarque Bera Test
data: model1$residuals
X-squared = 2.0931, df = 2, p-value = 0.3512
Box-Ljung test
data: model1$residuals
X-squared = 0.025134, df = 1, p-value = 0.874
- Model SARIMA \((0,1,1)(0,1,1)^{12}\)
z test of coefficients:
Estimate Std. Error z value Pr(>|z|)
ma1 -0.760051 0.083852 -9.0642 < 2.2e-16 ***
sma1 -0.391277 0.117027 -3.3435 0.0008274 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Jarque Bera Test
data: model2$residuals
X-squared = 3.1584, df = 2, p-value = 0.2061
Box-Ljung test
data: model2$residuals
X-squared = 0.040274, df = 1, p-value = 0.8409
- Model SARIMA \((0,1,1)(1,1,1)^{12}\)
z test of coefficients:
Estimate Std. Error z value Pr(>|z|)
ma1 -0.731351 0.079111 -9.2446 < 2.2e-16 ***
sar1 -0.837429 0.198372 -4.2215 2.427e-05 ***
sma1 0.590497 0.309258 1.9094 0.05621 .
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Jarque Bera Test
data: model3$residuals
X-squared = 1.6956, df = 2, p-value = 0.4284
Box-Ljung test
data: model3$residuals
X-squared = 0.0040191, df = 1, p-value = 0.9495
- Model SARIMA \((1,1,1)(1,1,0)^{12}\)
z test of coefficients:
Estimate Std. Error z value Pr(>|z|)
ar1 0.054558 0.152088 0.3587 0.7198007
ma1 -0.771441 0.106321 -7.2558 3.994e-13 ***
sar1 -0.377006 0.109201 -3.4524 0.0005556 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Jarque Bera Test
data: model4$residuals
X-squared = 2.1231, df = 2, p-value = 0.3459
Box-Ljung test
data: model4$residuals
X-squared = 0.019631, df = 1, p-value = 0.8886
- Model SARIMA \((1,1,0)(0,1,1)^{12}\)
z test of coefficients:
Estimate Std. Error z value Pr(>|z|)
ar1 -0.472421 0.096423 -4.8995 9.609e-07 ***
sma1 -0.331105 0.115168 -2.8750 0.00404 **
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Jarque Bera Test
data: model5$residuals
X-squared = 0.13647, df = 2, p-value = 0.934
Box-Ljung test
data: model5$residuals
X-squared = 1.3443, df = 1, p-value = 0.2463
- Model SARIMA \((1,1,0)(1,1,0)^{12}\)
z test of coefficients:
Estimate Std. Error z value Pr(>|z|)
ar1 -0.46661 0.09674 -4.8234 1.412e-06 ***
sar1 -0.32997 0.11226 -2.9393 0.00329 **
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Jarque Bera Test
data: model6$residuals
X-squared = 0.089181, df = 2, p-value = 0.9564
Box-Ljung test
data: model6$residuals
X-squared = 1.4053, df = 1, p-value = 0.2358
3.8 Pemilihan Model Terbaik
df AIC
model1 3 1698.762
model2 3 1698.968
model3 4 1699.810
model4 4 1700.632
model5 3 1712.585
model6 3 1712.298
Didapatkan nilai AIC sebagai berikut
model 1 sebesar 1698.762
model 2 sebesar 1698.968
model 3 sebesar 1699.810
model 4 sebesar 1700.632
model 5 sebesar 1712.585
model 6 sebesar 1712.298
Diantara keenam model tersebut nilai AIC yang paling kecil adalah model 1. Sehingga dapat disimpulkan bahwa model 1 atau SARIMA \((0,1,1)(1,1,0)^{12}\) adalah model terbaik. Dapat ditulis sebagai berikut: \[
Y_t=
Y_{t-1}+Y_{t-12}-Y_{t-13}+\Phi_1Y_{t-1}-\Phi_1Y_{t-2}-\Phi_1Y_{t-13}-
\Phi_1Y_{t-14}-a_t-\theta_1a_{t-1}
\]
3.9 Peramalan
Melakukan peramalan untuk satu tahun kedepan dari model terbaik yang telah didapatkan dari nilai AIC. Sehingga didapatkan peramalan (forecasting) dari model terbaik adalah sebagai berikut:
Sesuai dari hasil peramalan jumlah penumpang dari pelayaran dalam negeri di pelabuhan Kota Makasaar dari bulan Januari 2006 sampai dengan Desember 2013 dengan periode peramalan 12 periode (1 tahun) kedepan, diperoleh hasil sebagai berikut:
$pred
Time Series:
Start = 97
End = 108
Frequency = 1
[1] 29586.11 19917.46 16988.25 19525.50 20311.94 19620.95 30633.74 33952.83
[9] 45103.01 37414.55 27019.31 23691.72
$se
Time Series:
Start = 97
End = 108
Frequency = 1
[1] 6468.469 6676.352 6877.955 7073.814 7264.395 7450.102 7631.291 7808.277
[9] 7981.340 8150.728 8316.667 8479.360
Dapat dilihat bahwa kenaikan tertinggi jumlah penumpang turun pada tahun 2014 terjadi pada bulan September dengan jumlah penumpang turun sebesar 45103.01 orang.
4 KESIMPULAN
Berdasarkan hasil pembahasan mengenai peramalan jumlah penumpang turun dari pelayaran dalam Negeri di pelabuhan Kota Makassar dari bulan Januari tahun 2006 sampai dengan Desember tahun 2013, diperoleh kesimpulan sebagai berikut:
- Model peramalan yang baik untuk data penumpang turun di pelabuhan Kota Makassar yaitu model 1 atau SARIMA (0,1,1)(1,1,0)12 atau bisa ditulis sebagai berikut:
\[ Y_t= Y_{t-1}+Y_{t-12}-Y_{t-13}+\Phi_1Y_{t-1}-\Phi_1Y_{t-2}-\Phi_1Y_{t-13}- \Phi_1Y_{t-14}-a_t-\theta_1a_{t-1} \]
Dengan nilai parameter 𝜃1 sebesar -0.7444 dan Φ1 sebesar -0.3745. Sehingga didapatkan model peramalan terbaik dari model 1 atau SARIMA \((0,1,1)(1,1,0)^{12}\)sebagai berikut:
\[ Y_t= Y_{t-1}+Y_{t-12}-Y_{t-13}+(-0,3745)1Y_{t-1}-(-0,3745)Y_{t-2}-(-0,3745)Y_{t-13}- (-0,3745)Y_{t-14}-a_t-(-0,7444)a_{t-1} \]
- Hasil peramalan tertinggi terjadi pada bulan 9 (September) tahun 2014 yaitu sebesar 45103.01 dengan nilai sebenarnya sebesar 38865. Sedangkan, hasil peramalan terendah terjadi pada bulan Maret 2014 yaitu sebesar 16988.25, dengan nilai sebenarnya 28000. Dimana sebenarnya pada data asli tahun tersebut nilai tertinggi diperoleh pada bulan Agustus dan nilai terendah pada bulan Februari.
5 DAFTAR PUSTAKA
Cryer, Jonathan D. dan Chan, Kung-Sik. 2008. Time Series Analysis With Applications in R Second Edition. USA: Springer
Kurnia W., Dwi Fitri.2020. Peramalan Jumlah Penumpang Keberangkatan Bus di Terminal Purabaya Menggunakan Metode SARIMA (SEASONAL AUTOREGRESSIVE INTEGRATED MOVING AVERAGE). Surabaya: Universitas Islam Negeri Sunan Ampel.
Moh. Nasir, Wahida Yanti. 2015. Peramalan Jumlah Penumpang Dari Pelayaran Dalam Negeri di Pelabuhan Kota Makassar Menggunakan Metode SEASONAL AUTOREGRESSIVE INTEGRATED MOVING AVERAGE (SARIMA). Makassar: Universitas Islam Negeri Alauddin Makassar
Mubarok, Muhammad Ilham. 2018. SEASONAL AUTOREGRESSIVE INTEGRATED MOVING AVERAGE (SARIMA) IN R [online]. Diakses tanggal 14 Desember 2020, dari https://muhammadilhammubarok.wordpress.com/2018/08/30/seasonalautoregressive-integrated-moving-average-sarima-in-r/
Shofura, Annisa. Peramalan Data Air Passengers Dengan Metode SARIMA di RStudio[online]. Diakses tanggal 14 Desember 2020, dari https://medium.com/@annisashofuran19/analisis-airpasssengers-dengan-sarimadi-r-studio-6839f8e2c3d9
Tantika, Hani Nastiti. 2018. Metode Seasonal ARIMA Untuk Meramalkan Produksi Kopi dengan Indikator Curah Hujan Menggunakan Aplikasi R di Kabupaten Lampung Barat. Lampung : Universitas Islam Negeri Raden Intan Lampung