Pariwisata merupakan salah satu sektor yang berperan penting dalam pertumbuhan ekonomi suatu negara. Jumlah kunjungan wisatawan mancanegara dapat menjadi indikator perkembangan sektor pariwisata serta aktivitas ekonomi yang berkaitan dengan transportasi, perhotelan, dan perdagangan. Di Indonesia, Bandara Internasional Soekarno-Hatta merupakan salah satu pintu masuk utama bagi wisatawan mancanegara yang datang dari berbagai negara.
Jumlah kunjungan wisatawan mancanegara umumnya disajikan dalam bentuk data time series, yaitu data yang dikumpulkan secara berkala dalam interval waktu tertentu, seperti bulanan. Data time series sering menunjukkan pola tertentu seperti tren, pola musiman, maupun fluktuasi acak. Namun pada kenyataannya, jumlah kunjungan wisatawan tidak selalu stabil dan sering mengalami fluktuasi yang dipengaruhi oleh berbagai faktor seperti kondisi ekonomi global, musim liburan, maupun kebijakan perjalanan internasional.
Untuk memahami pola perubahan tersebut serta memprediksi jumlah kunjungan wisatawan pada periode mendatang, diperlukan metode analisis yang sesuai. Salah satu metode yang banyak digunakan dalam analisis dan peramalan data time series adalah Autoregressive Integrated Moving Average (ARIMA). Metode ini mampu memodelkan hubungan antara nilai data pada periode sekarang dengan nilai pada periode sebelumnya serta dapat digunakan untuk melakukan peramalan.
Berdasarkan hal tersebut, penelitian ini bertujuan untuk menganalisis pola data jumlah kunjungan wisatawan mancanegara bulanan melalui Bandara Soekarno-Hatta serta menentukan model ARIMA yang sesuai untuk melakukan peramalan jumlah kunjungan wisatawan pada periode mendatang.
Berdasarkan latar belakang dan tahapan analisis yang dilakukan, maka rumusan masalah dalam penelitian ini adalah sebagai berikut:
Bagaimana pola perkembangan jumlah kunjungan wisatawan mancanegara melalui Bandara Soekarno-Hatta berdasarkan data time series yang diamati?
Apakah data jumlah kunjungan wisatawan mancanegara melalui Bandara Soekarno-Hatta telah memenuhi asumsi stasioneritas pada varians dan mean?
Model ARIMA yang paling sesuai untuk memodelkan data jumlah kunjungan wisatawan mancanegara melalui Bandara Soekarno-Hatta berdasarkan kriteria pemilihan model seperti nilai AIC dan uji diagnostik residual?
Bagaimana hasil peramalan jumlah kunjungan wisatawan mancanegara melalui Bandara Soekarno-Hatta untuk beberapa periode ke depan berdasarkan model ARIMA terbaik?
Berdasarkan rumusan masalah yang telah disusun, maka tujuan dari penelitian ini adalah sebagai berikut:
Bagaimana pola perkembangan jumlah kunjungan wisatawan mancanegara melalui Bandara Soekarno-Hatta berdasarkan data time series yang diamati?
Apakah data jumlah kunjungan wisatawan mancanegara melalui Bandara Soekarno-Hatta telah memenuhi asumsi stasioneritas pada varians dan mean?
Model ARIMA yang paling sesuai untuk memodelkan data jumlah kunjungan wisatawan mancanegara melalui Bandara Soekarno-Hatta berdasarkan kriteria pemilihan model seperti nilai AIC dan uji diagnostik residual?
Bagaimana hasil peramalan jumlah kunjungan wisatawan mancanegara melalui Bandara Soekarno-Hatta untuk beberapa periode ke depan berdasarkan model ARIMA terbaik?
Time series merupakan sekumpulan data yang dicatat secara berurutan berdasarkan waktu tertentu, seperti harian, bulanan, atau tahunan. Analisis time series digunakan untuk memahami pola data serta melakukan peramalan terhadap nilai di masa depan.
Secara umum, time series adalah data yang diindeks berdasarkan urutan waktu sehingga setiap observasi memiliki keterkaitan dengan observasi sebelumnya.
Dalam analisis time series, data biasanya memiliki beberapa komponen utama yaitu trend, musiman, siklus, dan komponen acak.
Secara matematis komponen time series dapat dituliskan sebagai:
\[ Y_t = T_t + S_t + C_t + I_t \] dimana:
\(Y_t\) : nilai observasi pada waktu ke-\(t\)
\(T_t\) : komponen trend
\(S_t\) : komponen musiman
\(C_t\) : komponen siklus
\(I_t\) : komponen irregular
Dalam pemodelan ARIMA, salah satu asumsi penting adalah bahwa data harus bersifat stasioner. Suatu deret waktu dikatakan stasioner apabila nilai rata-rata, variansi, dan kovarians tidak berubah terhadap waktu.
Model ARIMA mengharuskan data stasioner sehingga jika data tidak stasioner maka perlu dilakukan transformasi seperti differencing untuk menghilangkan trend atau pola tertentu.
Differencing orde pertama dapat dituliskan sebagai:
\[ \Delta Y_t = Y_t - Y_{t-1} \]
dimana:
\(Y'_t\) = data setelah differencing
\(Y_t\) = nilai pada waktu ke-\(t\)
\(Y_{t-1}\) = nilai pada waktu sebelumnya
Model Autoregressive (AR) merupakan model time series dimana nilai variabel saat ini dipengaruhi oleh nilai variabel pada periode sebelumnya.
Model AR(p) dapat dituliskan sebagai: \[ Y_t = c + \phi_1 Y_{t-1} + \phi_2 Y_{t-2} + ... + \phi_p Y_{t-p} + \varepsilon_t \]
Model Moving Average (MA) merupakan model time series dimana nilai sekarang dipengaruhi oleh error pada periode sebelumnya.
Model MA(q) dapat dinyatakan sebagai: \[ Y_t = \mu + \varepsilon_t + \theta_1\varepsilon_{t-1} + \theta_2\varepsilon_{t-2} + ... + \theta_q\varepsilon_{t-q} \] dimana:
\(Y_t\) = nilai variabel pada waktu \(t\)
\(\phi\) = parameter autoregressive
\(\varepsilon_t\) = error
Model Autoregressive Integrated Moving Average (ARIMA) merupakan model yang menggabungkan komponen autoregressive (AR), differencing (I), dan moving average (MA) untuk menganalisis data time series.
Model ARIMA diperkenalkan oleh Box dan Jenkins dalam metode Box-Jenkins untuk memodelkan dan meramalkan data time series.
Model ARIMA dituliskan sebagai:
ARIMA(p,d,q)
Secara umum model ARIMA dapat ditulis: \[ \phi(B)(1-B)^d Y_t = \theta(B)\varepsilon_t \]
Metode Box-Jenkins merupakan prosedur sistematis yang digunakan untuk membangun model ARIMA dalam analisis time series. Metode ini terdiri dari beberapa tahapan utama yaitu:
Identifikasi model
Estimasi parameter
Diagnostic checking
Forecasting
Metode Box-Jenkins digunakan untuk menentukan model time series yang paling sesuai dengan data historis sehingga dapat digunakan untuk peramalan.
library(readxl)
## Warning: package 'readxl' was built under R version 4.3.3
library(forecast)
## Warning: package 'forecast' was built under R version 4.3.3
## Registered S3 method overwritten by 'quantmod':
## method from
## as.zoo.data.frame zoo
library(tseries)
## Warning: package 'tseries' was built under R version 4.3.3
library(ggplot2)
data <- read_excel("~/Bangun Portofolio/Jumlah Turis SoeTta.xlsx",
col_types = c("numeric", "text", "numeric"))
View(data)
summary(data)
## Year Month Tourist
## Min. :2016 Length:120 Min. : 396
## 1st Qu.:2018 Class :character 1st Qu.:112154
## Median :2020 Mode :character Median :187593
## Mean :2020 Mean :159384
## 3rd Qu.:2023 3rd Qu.:224981
## Max. :2025 Max. :322808
## NA's :110
ts_data <- ts(data$Tourist,
start = c(2016,1),
frequency = 12)
ts_data
## Jan Feb Mar Apr May Jun Jul Aug Sep Oct
## 2016 153503 164317 202669 188369 187545 150956 217452 270496 229964 237914
## 2017 203067 191933 222497 228611 220817 174669 297360 289000 227687 232014
## 2018 210494 201981 244467 224978 191631 182887 322808 308698 250058 244775
## 2019 174963 196183 214161 196977 156654 190031 267143 251596 211775 189231
## 2020 186793 132490 53124 420 396 909 3119 4469 7468 9830
## 2021 1238 5958 10188 15471 12775 13448 5466 1071 4081 13700
## 2022 14073 15406 23320 36061 57844 85587 119179 121427 111033 112527
## 2023 115101 124803 140859 99289 158550 161114 204000 218512 190058 181627
## 2024 157979 187641 160917 157409 201574 225985 271680 272849 250852 218170
## 2025 193433 199306 146390 186523 233751 236013 290369 304970 244404 254968
## Nov Dec
## 2016 219246 193629
## 2017 231183 230483
## 2018 206820 224989
## 2019 183759 186723
## 2020 14309 21812
## 2021 18971 16696
## 2022 113729 124475
## 2023 186695 172397
## 2024 212178 207019
## 2025 240330 230381
plot(ts_data,
main="Jumlah Kedatangan Wisatawan Mancanegara di Bandara Soekarno-Hatta",
ylab="Jumlah",
xlab="Tahun")
Berdasarkan plot time series jumlah kedatangan turis di Bandara Soekarno-Hatta periode 2016–2025, terlihat bahwa data mengalami fluktuasi dari waktu ke waktu. Pada periode 2016 hingga sekitar 2019 jumlah turis relatif stabil dengan beberapa kenaikan dan penurunan. Namun pada sekitar tahun 2020 terjadi penurunan yang sangat tajam hingga mendekati nol, yang kemungkinan disebabkan oleh pembatasan perjalanan internasional selama pandemi COVID-19. Setelah periode tersebut, jumlah turis mulai meningkat kembali secara bertahap hingga tahun 2024–2025. Pola ini menunjukkan adanya perubahan level data dan kecenderungan tren meningkat setelah tahun 2021. Oleh karena itu, secara visual data belum sepenuhnya stasioner karena terdapat perubahan tren dan variasi nilai yang cukup besar sepanjang waktu. Untuk memenuhi asumsi dalam pemodelan ARIMA, kemungkinan diperlukan proses differencing untuk membuat data menjadi lebih stasioner sebelum dilakukan pemodelan lebih lanjut.
lambda <- BoxCox.lambda(ts_data)
lambda
## [1] 1.159736
Nilai lambda hasil transformasi Box-Cox adalah 1.159736. Berdasarkan hasil transformasi Box-Cox diperoleh nilai parameter lambda sebesar 1.159736. Nilai lambda yang mendekati 1 menunjukkan bahwa varians data jumlah kunjungan wisatawan mancanegara melalui Bandara Soekarno-Hatta relatif stabil atau tidak mengalami perubahan varians yang signifikan sepanjang waktu. Dengan demikian dapat disimpulkan bahwa data telah memenuhi asumsi stasioneritas pada varians, sehingga transformasi tambahan untuk menstabilkan varians tidak diperlukan sebelum melanjutkan ke tahap analisis time series berikutnya.
adf_result <- adf.test(ts_data)
adf_result
##
## Augmented Dickey-Fuller Test
##
## data: ts_data
## Dickey-Fuller = -1.3258, Lag order = 4, p-value = 0.8566
## alternative hypothesis: stationary
Berdasarkan hasil transformasi Box-Cox diperoleh nilai parameter lambda sebesar 1.159736. Nilai lambda yang mendekati 1 menunjukkan bahwa varians data jumlah kunjungan wisatawan mancanegara melalui Bandara Soekarno-Hatta relatif stabil atau tidak mengalami perubahan varians yang signifikan sepanjang waktu. Dengan demikian dapat disimpulkan bahwa data telah memenuhi asumsi stasioneritas pada varians, sehingga transformasi tambahan untuk menstabilkan varians tidak diperlukan sebelum melanjutkan ke tahap analisis time series berikutnya.
diff_data <- diff(ts_data)
plot(diff_data,
main="Data Setelah Differencing",
ylab="Jumlah Turis",
xlab="Tahun")
adf.test(diff_data)
##
## Augmented Dickey-Fuller Test
##
## data: diff_data
## Dickey-Fuller = -4.8368, Lag order = 4, p-value = 0.01
## alternative hypothesis: stationary
Berdasarkan hasil uji Augmented Dickey-Fuller (ADF) pada data yang telah dilakukan differencing, diperoleh nilai p-value sebesar 0.01 yang lebih kecil dari tingkat signifikansi 0.05. Hal ini menunjukkan bahwa hipotesis nol yang menyatakan bahwa data tidak stasioner dapat ditolak. Dengan demikian dapat disimpulkan bahwa data diff_data telah stasioner pada mean setelah dilakukan differencing orde pertama. Hasil ini menunjukkan bahwa proses differencing berhasil menghilangkan pola tren pada data sehingga data sudah memenuhi asumsi stasioneritas dan dapat digunakan untuk tahap analisis selanjutnya, yaitu identifikasi model melalui plot ACF dan PACF.
acf(diff_data,
main="Plot ACF Setelah Differencing")
Berdasarkan plot Autocorrelation Function (ACF) pada data yang telah dilakukan differencing, terlihat bahwa sebagian besar nilai autokorelasi berada di dalam batas signifikansi yang ditunjukkan oleh garis putus-putus. Hal ini menunjukkan bahwa hubungan antara data dengan lag sebelumnya relatif kecil setelah proses differencing dilakukan. Namun masih terlihat beberapa spike yang melewati batas signifikansi, khususnya pada lag awal dan sekitar lag musiman, yang mengindikasikan adanya kemungkinan komponen moving average (MA) atau pengaruh musiman dalam data. Secara umum, pola ACF yang menurun secara bertahap (tailing off) menunjukkan bahwa data telah cukup stasioner dan dapat digunakan untuk tahap identifikasi model ARIMA.
pacf(diff_data,
main="Plot PACF Setelah Differencing")
Berdasarkan plot Partial Autocorrelation Function (PACF) pada data setelah differencing, terlihat beberapa spike yang melewati batas signifikansi terutama pada lag awal dan pada lag yang berkaitan dengan periode musiman. Hal ini menunjukkan adanya pengaruh parsial dari beberapa lag sebelumnya terhadap nilai data saat ini. Spike yang muncul pada lag awal mengindikasikan kemungkinan adanya komponen autoregressive (AR) dalam model. Selain itu, adanya spike pada lag yang lebih besar dapat menunjukkan adanya pola musiman dalam data. Oleh karena itu, pola pada plot PACF ini dapat digunakan sebagai dasar dalam menentukan kandidat model ARIMA yang sesuai untuk memodelkan data jumlah kunjungan wisatawan mancanegara melalui Bandara Soekarno-Hatta.
model1 <- arima(ts_data, order=c(1,1,0))
model2 <- arima(ts_data, order=c(0,1,1))
model3 <- arima(ts_data, order=c(1,1,1))
AIC(model1, model2, model3)
## df AIC
## model1 2 2814.155
## model2 2 2814.149
## model3 3 2813.948
model <- auto.arima(ts_data)
model
## Series: ts_data
## ARIMA(0,1,0)(1,0,0)[12]
##
## Coefficients:
## sar1
## 0.5879
## s.e. 0.0751
##
## sigma^2 = 701519594: log likelihood = -1382.84
## AIC=2769.67 AICc=2769.78 BIC=2775.23
Berdasarkan proses identifikasi model ARIMA, dilakukan estimasi beberapa kandidat model yaitu ARIMA(1,1,0), ARIMA(0,1,1), dan ARIMA(1,1,1). Hasil perbandingan menggunakan kriteria Akaike Information Criterion (AIC) menunjukkan bahwa model ARIMA(1,1,1) memiliki nilai AIC paling kecil yaitu 2813.948 dibandingkan dengan model lainnya, sehingga model tersebut merupakan kandidat terbaik di antara model non-musiman yang diuji. Selanjutnya dilakukan pemodelan menggunakan fungsi auto.arima() yang secara otomatis memilih model terbaik dengan mempertimbangkan kemungkinan pola musiman pada data. Hasilnya menunjukkan model \(ARIMA(0,1,0)(1,0,0)_{12}\) dengan nilai AIC sebesar 2769.67, yang lebih kecil dibandingkan model sebelumnya. Hal ini menunjukkan bahwa model dengan komponen musiman lebih mampu memodelkan data jumlah kunjungan wisatawan mancanegara melalui Bandara Soekarno-Hatta, sehingga model \(ARIMA(0,1,0)(1,0,0)_{12}\) dipilih sebagai model terbaik untuk analisis selanjutnya.
Model terbaik yang diperoleh adalah SARIMA(0,1,0)(1,0,0)_{12}. Bentuk model tersebut dapat dituliskan sebagai:
\[ (1 - 0.5879 B^{12})(1-B)Y_t = \varepsilon_t \]
atau dalam bentuk persamaan time series:
\[ Y_t - Y_{t-1} - 0.5879(Y_{t-12} - Y_{t-13}) = \varepsilon_t \]
checkresiduals(model)
##
## Ljung-Box test
##
## data: Residuals from ARIMA(0,1,0)(1,0,0)[12]
## Q* = 20.937, df = 23, p-value = 0.5849
##
## Model df: 1. Total lags used: 24
Hipotesis:
\(H_0\) : Residual bersifat white noise
\(H_0\) : Residual tidak white noise
Taraf Signifikansi :
\(\alpha\) = 0.05
Daerah Kritis:
Tolak \(H_0\), jika \(p\text{-value} \leq 0.05\)
Kesimpulan:
Berdasarkan hasil uji Ljung-Box pada residual model \(ARIMA(0,1,0)(1,0,0)_{12}\) diperoleh nilai p-value sebesar 0.5849, yang lebih besar dari tingkat signifikansi 0.05. Hal ini menunjukkan bahwa hipotesis nol yang menyatakan bahwa residual bersifat white noise tidak dapat ditolak. Dengan demikian dapat disimpulkan bahwa tidak terdapat autokorelasi yang signifikan pada residual model sehingga model telah mampu menangkap pola yang terdapat pada data. Hal ini juga didukung oleh plot diagnostik residual, dimana grafik residual menunjukkan pola yang menyebar secara acak di sekitar nol tanpa pola tertentu, plot ACF residual sebagian besar berada di dalam batas signifikansi, serta histogram residual yang mendekati distribusi normal. Oleh karena itu, model \(ARIMA(0,1,0)(1,0,0)_{12}\) dapat dianggap telah memenuhi asumsi diagnostik model dan layak digunakan
jarque.bera.test(residuals(model))
##
## Jarque Bera Test
##
## data: residuals(model)
## X-squared = 5.9158, df = 2, p-value = 0.05193
qqnorm(residuals(model))
qqline(residuals(model))
Hipotesis:
\(H_0\) : Residual berdistribusi normal
\(H_0\) : Residual tidak berdistribusi normal
Taraf Signifikansi :
\(\alpha\) = 0.05
Daerah Kritis:
Tolak \(H_0\), jika \(p\text{-value} \leq 0.05\)
Kesimpulan:
Berdasarkan hasil uji Jarque–Bera pada residual model diperoleh nilai p-value sebesar 0.05193, yang sedikit lebih besar dari tingkat signifikansi 0.05. Hal ini menunjukkan bahwa hipotesis nol yang menyatakan bahwa residual berdistribusi normal tidak dapat ditolak, sehingga dapat disimpulkan bahwa residual model cenderung mengikuti distribusi normal. Hasil ini juga didukung oleh grafik Normal Q–Q Plot, dimana sebagian besar titik data berada di sekitar garis diagonal yang menunjukkan bahwa distribusi residual mendekati distribusi normal. Meskipun terdapat sedikit penyimpangan pada beberapa titik di bagian ekor distribusi, secara keseluruhan pola yang terbentuk masih mengikuti garis referensi. Oleh karena itu, dapat disimpulkan bahwa model telah memenuhi asumsi normalitas residual dan layak digunakan untuk analisis lebih lanjut.
library(FinTS)
## Loading required package: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
##
## Attaching package: 'FinTS'
## The following object is masked from 'package:forecast':
##
## Acf
ArchTest(residuals(model))
##
## ARCH LM-test; Null hypothesis: no ARCH effects
##
## data: residuals(model)
## Chi-squared = 23.956, df = 12, p-value = 0.02062
Hipotesis:
\(H_0\) : Varian residual sama
\(H_0\) : Varian residual tidak sama
Taraf Signifikansi :
\(\alpha\) = 0.05
Daerah Kritis:
Tolak \(H_0\), jika \(p\text{-value} \leq 0.05\)
Kesimpulan:
Berdasarkan hasil uji ARCH LM-Test pada residual model diperoleh nilai p-value sebesar 0.02062 yang lebih kecil dari tingkat signifikansi 0.05. Hal ini menyebabkan hipotesis nol yang menyatakan bahwa tidak terdapat efek ARCH ditolak. Dengan demikian dapat disimpulkan bahwa residual model mengandung efek ARCH, yang menunjukkan adanya heteroskedastisitas atau varians residual yang tidak konstan dari waktu ke waktu.
accuracy(model)
## ME RMSE MAE MPE MAPE MASE
## Training set 300.8223 26264.57 20049.47 -65.14553 213.4047 0.3573689
## ACF1
## Training set -0.03296903
Berdasarkan hasil pengujian kebaikan model menggunakan fungsi accuracy(), diperoleh beberapa ukuran kesalahan prediksi seperti ME (Mean Error), RMSE (Root Mean Square Error), MAE (Mean Absolute Error), MPE (Mean Percentage Error), MAPE (Mean Absolute Percentage Error), dan MASE (Mean Absolute Scaled Error). Nilai ME sebesar 300.8223 menunjukkan bahwa secara rata-rata model memiliki sedikit bias dalam prediksi, namun nilainya relatif kecil dibandingkan skala data. Nilai RMSE sebesar 26264.57 dan MAE sebesar 20049.47 menunjukkan besarnya rata-rata kesalahan prediksi model terhadap data aktual. Selain itu, nilai MAPE sebesar 213.4047% menunjukkan tingkat kesalahan prediksi dalam bentuk persentase, sedangkan nilai MASE sebesar 0.3573689 yang lebih kecil dari 1 menunjukkan bahwa model memiliki kinerja prediksi yang lebih baik dibandingkan metode naive. Sementara itu, nilai ACF1 sebesar -0.03296903 yang mendekati nol menunjukkan bahwa tidak terdapat autokorelasi yang signifikan pada residual. Secara keseluruhan, hasil ini menunjukkan bahwa model yang digunakan memiliki kemampuan yang cukup baik dalam memodelkan data jumlah kunjungan wisatawan mancanegara melalui Bandara Soekarno-Hatta.
library(forecast)
forecast_turis <- forecast(model, h=12)
forecast_turis
## Point Forecast Lo 80 Hi 80 Lo 95 Hi 95
## Jan 2026 222393.7 188450.2 256337.1 170481.67 274305.7
## Feb 2026 225846.5 177843.2 273849.8 152431.78 299261.2
## Mar 2026 194736.8 135945.0 253528.6 104822.51 284651.0
## Apr 2026 218331.3 150444.4 286218.2 114507.20 322155.3
## May 2026 246096.9 170197.1 321996.8 130018.11 362175.8
## Jun 2026 247426.8 164282.6 330570.9 120268.80 374584.8
## Jul 2026 279383.1 189577.1 369189.0 142036.75 416729.4
## Aug 2026 287967.1 191960.5 383973.7 141137.71 434796.5
## Sep 2026 252359.9 150529.6 354190.3 96623.83 408096.0
## Oct 2026 258570.6 151231.9 365909.2 94410.32 422730.8
## Nov 2026 249964.8 137387.1 362542.5 77792.06 422137.5
## Dec 2026 244115.7 126532.1 361699.2 64287.15 423944.2
plot(forecast_turis,
main="Forecast Jumlah Turis Bandara Soekarno-Hatta",
xlab="Tahun",
ylab="Jumlah Turis")
Berdasarkan hasil peramalan menggunakan model \(ARIMA(0,1,0)(1,0,0)_{12}\), diperoleh prediksi jumlah kunjungan wisatawan mancanegara melalui Bandara Soekarno-Hatta untuk 12 bulan ke depan pada tahun 2026. Nilai point forecast menunjukkan bahwa jumlah turis diperkirakan berada pada kisaran sekitar 194 ribu hingga 279 ribu pengunjung per bulan pada beberapa bulan awal hingga pertengahan tahun 2026. Grafik peramalan menunjukkan bahwa pola pergerakan jumlah turis cenderung mengikuti pola historis sebelumnya dengan fluktuasi yang relatif stabil. Selain itu, area bayangan pada grafik menunjukkan interval kepercayaan 80% dan 95%, yang menggambarkan rentang kemungkinan nilai aktual yang dapat terjadi di masa mendatang. Secara umum, hasil peramalan ini menunjukkan bahwa jumlah kunjungan wisatawan diperkirakan tetap berfluktuasi dengan kecenderungan mengikuti pola musiman yang terdapat pada data historis.
Berdasarkan analisis awal menggunakan plot time series, terlihat bahwa jumlah kunjungan wisatawan mancanegara melalui Bandara Soekarno-Hatta mengalami fluktuasi dari waktu ke waktu dengan adanya perubahan pola yang cukup signifikan pada beberapa periode. Data menunjukkan adanya penurunan yang sangat tajam sekitar tahun 2020 yang kemungkinan berkaitan dengan dampak pandemi COVID-19 terhadap sektor pariwisata. Setelah periode tersebut, jumlah kunjungan wisatawan mulai meningkat kembali secara bertahap. Selain itu, pola data juga menunjukkan adanya indikasi pola musiman yang berulang setiap tahun, sehingga analisis time series dengan mempertimbangkan komponen musiman menjadi relevan untuk digunakan dalam memodelkan data tersebut.
Berdasarkan analisis awal menggunakan plot time series, terlihat bahwa jumlah kunjungan wisatawan mancanegara melalui Bandara Soekarno-Hatta mengalami fluktuasi dari waktu ke waktu dengan adanya perubahan pola yang cukup signifikan pada beberapa periode. Data menunjukkan adanya penurunan yang sangat tajam sekitar tahun 2020 yang kemungkinan berkaitan dengan dampak pandemi COVID-19 terhadap sektor pariwisata. Setelah periode tersebut, jumlah kunjungan wisatawan mulai meningkat kembali secara bertahap. Selain itu, pola data juga menunjukkan adanya indikasi pola musiman yang berulang setiap tahun, sehingga analisis time series dengan mempertimbangkan komponen musiman menjadi relevan untuk digunakan dalam memodelkan data tersebut.
Hasil uji stasioneritas varians menggunakan transformasi Box-Cox menunjukkan nilai parameter lambda sebesar 1.159736, yang mendekati nilai 1 sehingga dapat disimpulkan bahwa varians data relatif stabil dan tidak memerlukan transformasi tambahan. Namun, berdasarkan uji stasioneritas mean menggunakan Augmented Dickey-Fuller (ADF Test) pada data awal diperoleh nilai p-value sebesar 0.8566 yang lebih besar dari tingkat signifikansi 0.05, sehingga data dinyatakan belum stasioner pada mean. Oleh karena itu dilakukan differencing orde pertama, dan hasil uji ADF pada data setelah differencing menunjukkan nilai p-value sebesar 0.01, yang lebih kecil dari 0.05 sehingga data telah memenuhi asumsi stasioneritas pada mean dan siap digunakan untuk proses pemodelan ARIMA.
Berdasarkan analisis plot ACF dan PACF setelah differencing, diperoleh beberapa kandidat model ARIMA yaitu ARIMA(1,1,0), ARIMA(0,1,1), dan ARIMA(1,1,1). Hasil perbandingan menggunakan kriteria Akaike Information Criterion (AIC) menunjukkan bahwa model ARIMA(1,1,1) memiliki nilai AIC paling kecil di antara model non-musiman yang diuji. Namun, hasil pemodelan menggunakan fungsi auto.arima() menunjukkan bahwa model \(ARIMA(0,1,0)(1,0,0)_{12}\) memiliki nilai AIC yang lebih kecil lagi yaitu 2769.67, sehingga model ini dipilih sebagai model terbaik. Model tersebut menunjukkan adanya komponen musiman tahunan yang mempengaruhi jumlah kunjungan wisatawan melalui Bandara Soekarno-Hatta.