Pendahuluan

Data yang digunakan dalam penelitian ini adalah data jumlah penumpang di Bandara Internasional Los Angeles selama 60 bulan yaitu pada periode 2012-2016. Selanjutnya data digunakan untuk memprediksi jumlah penumpang di Bandara Internasional Los Angeles pada masa mendatang dengan metode ARIMA Box-Jenkins. Data yang digunakan diperoleh dari website data.gov dengan judul “Los Angeles International Airport Passenger Traffic”.

Load Data

data <- read.csv("D:/LA.csv",header=TRUE,sep=",")
data
##        Month Passenger_Count
## 1   1/1/2012         4913489
## 2   2/1/2012         4456512
## 3   3/1/2012         5252557
## 4   4/1/2012         5161128
## 5   5/1/2012         5412946
## 6   6/1/2012         5739904
## 7   7/1/2012         6190326
## 8   8/1/2012         6093345
## 9   9/1/2012         5054257
## 10 10/1/2012         5191471
## 11 11/1/2012         4943673
## 12 12/1/2012         5278513
## 13  1/1/2013         5050736
## 14  2/1/2013         4482407
## 15  3/1/2013         5622576
## 16  4/1/2013         5313160
## 17  5/1/2013         5266595
## 18  6/1/2013         6482043
## 19  7/1/2013         6085464
## 20  8/1/2013         5832224
## 21  9/1/2013         5403302
## 22 10/1/2013         5530105
## 23 11/1/2013         5033220
## 24 12/1/2013         5788135
## 25  1/1/2014         5419617
## 26  2/1/2014         4765984
## 27  3/1/2014         5785094
## 28  4/1/2014         6081009
## 29  5/1/2014         5760137
## 30  6/1/2014         6524047
## 31  7/1/2014         6872077
## 32  8/1/2014         6717640
## 33  9/1/2014         5573460
## 34 10/1/2014         5865886
## 35 11/1/2014         5380445
## 36 12/1/2014         5921556
## 37  1/1/2015         5439194
## 38  2/1/2015         4950595
## 39  3/1/2015         6026597
## 40  4/1/2015         5938315
## 41  5/1/2015         6356977
## 42  6/1/2015         6790278
## 43  7/1/2015         7275519
## 44  8/1/2015         7109174
## 45  9/1/2015         6027070
## 46 10/1/2015         6375052
## 47 11/1/2015         6016989
## 48 12/1/2015         6394966
## 49  1/1/2016         6068709
## 50  2/1/2016         5466843
## 51  3/1/2016         6476274
## 52  4/1/2016         6305765
## 53  5/1/2016         6784001
## 54  6/1/2016         7489678
## 55  7/1/2016         7889395
## 56  8/1/2016         7595010
## 57  9/1/2016         6603116
## 58 10/1/2016         6865238
## 59 11/1/2016         6496118
## 60 12/1/2016         6872261

Statistika Deskriptif

summary(data$Passenger_Count)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
## 4456512 5363624 5893721 5930970 6477716 7889395

Rata-rata jumlah penumpang pesawat di Bandara Internasional Los Angeles adalah 5930970 orang. Jumlah penumpang terbanyak selama periode 2012-2016 adalah 7889395 orang dan jumlah penumpang paling sedikit adalah 4456512 orang.

Histogram

hist(data$Passenger_Count, col="lightblue", border = "darkblue", main= "Histogram of Passenger", xlab= "Passenger", breaks = 20)

Jumlah penumpang pesawat di Bandara Internasional Los Angeles paling banyak berada di kisaran 6 juta orang.

Boxplot

boxplot(data$Passenger_Count, main="Passenger Count", col="orange")

Boxplot menunjukkan bahwa tidak terdapat jumlah penumpang di Bandara Internasional Los Angeles yang outlier.

Analisis Time Series

tsplot <- ts(data$Passenger_Count, start = c(2012,1), frequency=12)
    plot(tsplot, main ="Time Series Plot")

Plot menunjukkan bahwa secara visual data belum stasioner serta menunjukkan indikasi adanya pola musiman.

ds_ts <- ts(data$Passenger_Count, frequency=12)
    f <- decompose(ds_ts)
    plot(f)

Gambar dekomposisi diatas juga menunjukkan indikasi bahwa data tidak stasioner karena adanya seasonal effects dan tren (linear trend). Untuk mengetahui secara pasti apakah data sudah stasioner atau belum maka dilakukan uji Aumented Dickey Fuller sebagai berikut.

Uji Augmented Dickey-Fuller

library(tseries)
## Warning: package 'tseries' was built under R version 3.4.4
adf.test(data$Passenger_Count, alternative ="stationary", k=12)
## 
##  Augmented Dickey-Fuller Test
## 
## data:  data$Passenger_Count
## Dickey-Fuller = -1.0481, Lag order = 12, p-value = 0.923
## alternative hypothesis: stationary

Berdasarkan hasil pengujian Augmentende Dickey Fuller didapatkan p-value sebesar 0.923 sehingga dapat disimpulkan bahwa data penumpang di Bandara Internasional Los Angeles tidak stasioner.

Identifikasi dan Estimasi Model Terbaik dengan Metode ARIMA Box Jenkins

library(forecast)
## Warning: package 'forecast' was built under R version 3.4.4
fit <- auto.arima(data$Passenger_Count)
fit
## Series: data$Passenger_Count 
## ARIMA(1,1,1) 
## 
## Coefficients:
##          ar1      ma1
##       0.5374  -0.8818
## s.e.  0.1384   0.0659
## 
## sigma^2 estimated as 2.855e+11:  log likelihood=-861.11
## AIC=1728.22   AICc=1728.66   BIC=1734.46

Berdasarkan hasil penentuan model dengan Metode ARIMA Box-Jenkins didapatkan model terbaiknya adalah ARIMA (1,1,1).

Hasil Peramalan dengan ARIMA (1,1,1)

Berikut adalah hasil peramalan dan plot peramalan untuk 24 bulan ke depan.

forecast(fit, h=24)
##    Point Forecast   Lo 80   Hi 80   Lo 95   Hi 95
## 61        6805063 6120359 7489766 5757899 7852226
## 62        6768952 5950245 7587659 5516848 8021057
## 63        6749548 5869757 7629339 5404024 8095072
## 64        6739121 5823399 7654843 5338645 8139596
## 65        6733518 5792343 7674692 5294116 8172919
## 66        6730507 5768786 7692227 5259682 8201331
## 67        6728889 5749125 7708652 5230469 8227308
## 68        6728019 5731589 7724450 5204110 8251928
## 69        6727552 5715271 7739833 5179402 8275702
## 70        6727301 5699698 7754904 5155718 8298884
## 71        6727166 5684615 7769717 5132721 8321610
## 72        6727093 5669884 7784303 5110231 8343956
## 73        6727054 5655429 7798680 5088145 8365964
## 74        6727033 5641205 7812862 5066403 8387664
## 75        6727022 5627186 7826858 5044968 8409076
## 76        6727016 5613355 7840677 5023819 8430214
## 77        6727013 5599700 7854326 5002936 8451090
## 78        6727011 5586211 7867812 4982307 8471715
## 79        6727010 5572881 7881140 4961922 8492099
## 80        6727010 5559704 7894315 4941770 8512249
## 81        6727009 5546675 7907344 4921844 8532175
## 82        6727009 5533789 7920230 4902136 8551883
## 83        6727009 5521040 7932978 4882639 8571380
## 84        6727009 5508425 7945593 4863345 8590673
plot(forecast(fit, h=24))

Residual Analysis

res <- residuals(fit)
acf(res)

pacf(res)

Baik plot ACF maupun PACF sama-sama terdapat lag yang keluar yaitu pada lag ke-12.

Uji Augmented Dickey-Fuller Residual

library(tseries)
adf.test(fit$residuals, alternative ="stationary")
## Warning in adf.test(fit$residuals, alternative = "stationary"): p-value
## smaller than printed p-value
## 
##  Augmented Dickey-Fuller Test
## 
## data:  fit$residuals
## Dickey-Fuller = -4.1875, Lag order = 3, p-value = 0.01
## alternative hypothesis: stationary

Berdasarkan p-value diatas yaitu 0.01 dapat disimpulkan bahwa residual dari model prediksi ARIMA telah stasioner.

Kesimpulan

Berdasarkan hasil peramalan dapat diketahui bahwa jumlah penumpang di Bandara Internasional Los Angeles pada bulan Januari masih relatif tinggi. Ini disebabkan karena bulan Januari merupakan awal tahun dimana biasanya orang-orang bepergian untuk merayakan tahun baru sehingga jumlah penumpang relatif tinggi. Selain itu, hasil peramalan juga menunjukkan bahwa jumlah penumpang cenderung lebih banyak dari tahun-tahun sebelumnya sehingga pihak bandara harus melakukan persiapan yang lebih lagi baik dari maskapai, armada, maupun dari segi fasilitas bandara.