Notes Theme, silakan gunakan salah satu theme berikut: - cayman (package prettydoc) - architect (package prettydoc) - united (default di RMarkdown)

Library:

> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")

1 PENDAHULUAN

1.1 Latar Belakang

Saat ini, pelayanan penerbangan merupakan salah satu yang paling banyak diminati oleh masyarakat umum di Indonesia. Setiap maskapai penerbangan menawarkan pelayanan terbaiknya untuk memenuhi ekspektasi pelanggan. Bagi tiap maskaspai penerbangan, review pelanggan merupakan suatu hal yang penting sebagai tolak ukur untuk mengetahui seberapa baik performa yang telah diberikan kepada pelanggan. Data kualitatif dan kuantitatif dapat dipilih sebagai alat pendukung strategi maskapai penerbangan dalam pengambilan keputusan. Namun dewasa ini, data kuantitatif lebih disukai orang karena lebih efektif untuk dianalisis.

Statistika sebagai ilmu analisis data memiliki metode peramalan sebagai metode yang tepat dalam pengambilan keputusan. Peramalan yang dilakukan didasarkan pada kejadian masa lampau yang dianalisis dengan metode tertentu. Hasil dari metode peramalan juga dapat digunakan sebagai pembanding kejadian masa lampau dan masa yang akan datang.

Peranan peramalan dalam maskapai penerbangan kali ini digunakan dalam permasalahan pengaduan kerusakan bagasi oleh para pelanggan. Variabel yang akan dianalisis adalah jumlah total pengaduan kerusakan bagasi dan tanggal rekap jumlah pengaduan oleh pelanggan. Oleh karena itu pada analisis ini dibuatlah sebuah metode peramalan yang menggunakan ARIMA sebagai dasar dalam mengidentifikasi jenis model prediksi dan output prediksi serta meminimalkan data error dari hasil prediksi yang akan didapatkan.

1.2 Tinjauan Pustaka

1.2.1 Pemodelan Deret Waktu

Analisis deret waktu adalah metode statistik yang digunakan untuk memodelkan dan meramal data yang diambil secara berurutan dalam berbagai bidang seperti ekonomi, keuangan, meteorologi, dan sains sosial. Data dikumpulkan secara periodik berdasarkan urutan waktu (Hutomo, 2018). Meteode peramalan yang dilakukan ditentukan berdasarkan pola dari data. Data historis dapat digunakan untuk mengidentifikasi pola dan tren yang berulang serta meramalkan kondisi masa depan. Pola data dibedakan menjadi 4 jenis, antara lain tren, musiman, musiman, dan irregular.

Analisis Deret Waktu dilakukan melalui beberapa langkah antara lain :

1. Visualisasi Data

Langkah awal analisis deret waktu adalah membentuk plot untuk mengidentifikasi pola.

2. Stasioneritas

Uji stasioneritas dilakukan untuk memastikan bahwa data tidak memiliki tren atau variabilitas musiman. Uji stasioner dapat dilakukan terhadap rata-rata dan ragam.

3. Identifikasi Model

Model diidentifikasi dengan ACF (Auto Correlation Function) dan PACF (Partial Auto Correlation Function). Hal ini perlu dilakukan untuk menentukan parameter AR dan MA.

4. Estimasi Model

Estimasi dilakukan menggunakan metode Maximum Likelihood untuk menentukan parameter model.

5. Diagnosis Model

Diagnosis model adalah proses mengevaluasi model dengan memeriksa residuals.

6. Prediksi

Prediksi dilakukan dengan menggunakan model yang telah disusun sebelumnya untuk menentukan prediksi di masa yang akan datang.

1.2.2 Auto Regressive Integrated Moving Average (ARIMA)

Metode ARIMA adalah metode peramalan yang tidak menggunakan teori atau pengaruh antarvariabel seperti pada model regresi. Oleh karena itu, metode ARIMA tidak memerlukan pengklasifikasian pada variabel, antara lain variabel dependen dan variabel independen.ARIMA (p,d,q) diperoleh dari kombinasi Auto Regressive (AR), Integrated (I), dan Moving Average (MA). \[ AR (p): Y_{t}=\phi _{1}Y_{t-1}+\phi _{2}Y_{t-2}+...+\phi _{p}Y_{t-p}+e_{t} \\ MA (q): Y_{t}=e _{t}-\theta _{1}e _{t-1}-\theta _{2}e _{t-2}-...-\theta _{q}e _{t-q} \] I(d) : Mengurangi tren atau membuat data stasioner melalui differencing. \[ ARIMA : \phi _{p}(B)(1-B)^{d}Y_{t}=\theta _{q}(B)e_{t} \\\ \]

1.2.3 Exponential Smoothing

Exponential Smoothing dibagi menjadi 3, yaitu (1) Simple Exponential Smoothing untuk data tanpa tren atau musiman, (2) Holt’s Linear Trend Model menggunakan dua parameter untuk level dan tren, (3) Holt’s Winters Seasonal Model untuk data musiman.

1.2.4 Stasioneritas

Data dikatakan stasioner terhadap rata-rata apabila berfluktuasi disekitar garis sejajar dengan waktu (sumbu y) atau disekitar nilai rata-rata yang konstan. Pengujian stasioner terhadap ragam dilakukan melalui plot ACF dan PACF dengan hipotesis sebagai berikut Hipotesis : \[ H_{0} = Data\phantom(Tidak\phantom(Stasioner \\ H_{1} = Data\phantom(stasioner \] Jika data tidak stasioner maka diperlukan proses diferensiasi untuk d \(\geq\) 1 sehingga datanya menjadi stasioner terhadap rata-rata.

Data dikatakan stasioner terhadap ragam apabila ragam konstan dari waktu ke waktu. Kestasioneran terhadap ragam dapat dilihat melalui Box-Cox. Apabil a data terbukti tidak stasioner maka perlu dilakukan transformasi pangkat.

1.3 Data

Data yang digunakan adalah data jumlah total pengaduan kerusakan bagasi dari tahun 2004 sampai dengan 2024. Data diperoleh dari website kaggle dengan judul “Airline Baggage Complains - Time Series Dataset”. Data yang digunakan dapat diakses melalui link berikut : https://www.kaggle.com/datasets/gabrielsantello/airline-baggage-complaints-time-series-dataset

> setwd("C:/Users/LAURA/OneDrive/Documents/Semester 4/Komputasi Statistika")
> laprakkomstat <- read.csv("Airlines Baggage.csv", header=TRUE, sep=";")
> laprakkomstat
          Date Baggage
1   2004-01-01   12502
2   2004-02-01    8977
3   2004-03-01   10289
4   2004-04-01    8095
5   2004-05-01   10618
6   2004-06-01   13684
7   2004-07-01   14121
8   2004-08-01   12732
9   2004-09-01    7895
10  2004-10-01    9444
11  2004-11-01    9582
12  2004-12-01   17555
13  2005-01-01   15361
14  2005-02-01    9561
15  2005-03-01   13002
16  2005-04-01   11071
17  2005-05-01   12300
18  2005-06-01   16373
19  2005-07-01   19701
20  2005-08-01   16666
21  2005-09-01   12636
22  2005-10-01   14258
23  2005-11-01   14440
24  2005-12-01   24696
25  2006-01-01   19255
26  2006-02-01   17319
27  2006-03-01   20344
28  2006-04-01   19726
29  2006-05-01   21248
30  2006-06-01   22767
31  2006-07-01   23184
32  2006-08-01   27630
33  2006-09-01   25922
34  2006-10-01   24699
35  2006-11-01   18954
36  2006-12-01   28556
37  2007-01-01   24190
38  2007-02-01   20753
39  2007-03-01   21928
40  2007-04-01   19483
41  2007-05-01   19209
42  2007-06-01   26213
43  2007-07-01   24993
44  2007-08-01   23156
45  2007-09-01   14816
46  2007-10-01   15351
47  2007-11-01   13946
48  2007-12-01   23762
49  2008-01-01   17507
50  2008-02-01   15795
51  2008-03-01   17782
52  2008-04-01   14566
53  2008-05-01   13522
54  2008-06-01   15620
55  2008-07-01   12885
56  2008-08-01   12148
57  2008-09-01    8729
58  2008-10-01    9110
59  2008-11-01    7591
60  2008-12-01   15475
61  2009-01-01   10231
62  2009-02-01    7538
63  2009-03-01   10093
64  2009-04-01   10547
65  2009-05-01   10279
66  2009-06-01   13220
67  2009-07-01   11625
68  2009-08-01   10832
69  2009-09-01    7052
70  2009-10-01   10000
71  2009-11-01    7081
72  2009-12-01   12496
73  2010-01-01   11059
74  2010-02-01    8973
75  2010-03-01    9762
76  2010-04-01    7864
77  2010-05-01    9399
78  2010-06-01   10431
79  2010-07-01    9840
80  2010-08-01    9583
81  2010-09-01    8324
82  2010-10-01    8498
83  2010-11-01    8067
84  2010-12-01   11526
85  2004-01-01    1717
86  2004-02-01    1599
87  2004-03-01    1327
88  2004-04-01    1350
89  2004-05-01    1304
90  2004-06-01    1697
91  2004-07-01    1398
92  2004-08-01    1259
93  2004-09-01    1033
94  2004-10-01    1176
95  2004-11-01    1084
96  2004-12-01    1146
97  2005-01-01    1206
98  2005-02-01    1154
99  2005-03-01    1541
100 2005-04-01    1348
101 2005-05-01    1408
102 2005-06-01    1625
103 2005-07-01    1906
104 2005-08-01    1726
105 2005-09-01    1236
106 2005-10-01    1443
107 2005-11-01    1286
108 2005-12-01    1629
109 2006-01-01    1461
110 2006-02-01    1388
111 2006-03-01    2049
112 2006-04-01    1522
113 2006-05-01    1305
114 2006-06-01    1411
115 2006-07-01    1530
116 2006-08-01    1733
117 2006-09-01    1421
118 2006-10-01    1757
119 2006-11-01    1790
120 2006-12-01    2252
121 2007-01-01    2046
122 2007-02-01    1922
123 2007-03-01    2331
124 2007-04-01    1583
125 2007-05-01    1601
126 2007-06-01    2163
127 2007-07-01    2529
128 2007-08-01    2013
129 2007-09-01    2064
130 2007-10-01    2069
131 2007-11-01    2086
132 2007-12-01    1962
133 2008-01-01    1795
134 2008-02-01    1273
135 2008-03-01    1511
136 2008-04-01    2449
137 2008-05-01    2696
138 2008-06-01    2618
139 2008-07-01    2791
140 2008-08-01    2121
141 2008-09-01    1428
142 2008-10-01    1556
143 2008-11-01    1532
144 2008-12-01    1803
145 2009-01-01    1303
146 2009-02-01    1389
147 2009-03-01    1323
148 2009-04-01    1300
149 2009-05-01    1251
150 2009-06-01    1381
151 2009-07-01    1573
152 2009-08-01    1604
153 2009-09-01    1313
154 2009-10-01    1319
155 2009-11-01    1140
156 2009-12-01    1179
157 2010-01-01    1326
158 2010-02-01    1200
159 2010-03-01    1180
160 2010-04-01    1076
161 2010-05-01    1264
162 2010-06-01    1360
163 2010-07-01    1386
164 2010-08-01    1283
165 2010-09-01    1912
166 2010-10-01    2265
167 2010-11-01    2020
168 2010-12-01    2705
169 2004-01-01   25015
170 2004-02-01   16660
171 2004-03-01   19318
172 2004-04-01   15638
173 2004-05-01   19302
174 2004-06-01   21892
175 2004-07-01   26666
176 2004-08-01   25510
177 2004-09-01   13305
178 2004-10-01   17736
179 2004-11-01   15812
180 2004-12-01   32458
181 2005-01-01   25861
182 2005-02-01   18647
183 2005-03-01   22264
184 2005-04-01   14262
185 2005-05-01   19977
186 2005-06-01   28024
187 2005-07-01   23513
188 2005-08-01   21000
189 2005-09-01   14138
190 2005-10-01   16628
191 2005-11-01   15254
192 2005-12-01   29235
193 2006-01-01   23232
194 2006-02-01   18551
195 2006-03-01   22246
196 2006-04-01   18019
197 2006-05-01   19996
198 2006-06-01   27588
199 2006-07-01   30325
200 2006-08-01   39123
201 2006-09-01   37039
202 2006-10-01   35640
203 2006-11-01   28896
204 2006-12-01   40483
205 2007-01-01   41787
206 2007-02-01   34581
207 2007-03-01   33920
208 2007-04-01   25667
209 2007-05-01   25524
210 2007-06-01   31242
211 2007-07-01   30356
212 2007-08-01   29331
213 2007-09-01   18033
214 2007-10-01   20147
215 2007-11-01   16927
216 2007-12-01   33269
217 2008-01-01   26113
218 2008-02-01   22059
219 2008-03-01   23932
220 2008-04-01   22994
221 2008-05-01   23217
222 2008-06-01   29690
223 2008-07-01   26604
224 2008-08-01   32827
225 2008-09-01   17551
226 2008-10-01   15429
227 2008-11-01   13138
228 2008-12-01   29803
229 2009-01-01   19653
230 2009-02-01   12627
231 2009-03-01   16285
232 2009-04-01   13517
233 2009-05-01   15083
234 2009-06-01   22844
235 2009-07-01   19259
236 2009-08-01   18646
237 2009-09-01   11270
238 2009-10-01   14513
239 2009-11-01    9814
240 2009-12-01   22845
241 2010-01-01   17307
242 2010-02-01   13269
243 2010-03-01   14782
244 2010-04-01   11121
245 2010-05-01   11947
246 2010-06-01   15784
247 2010-07-01   14309
248 2010-08-01   14099
249 2010-09-01    9435
250 2010-10-01    9565
251 2010-11-01    8597
252 2010-12-01   14415
> head(laprakkomstat)
        Date Baggage
1 2004-01-01   12502
2 2004-02-01    8977
3 2004-03-01   10289
4 2004-04-01    8095
5 2004-05-01   10618
6 2004-06-01   13684

1.4 Tujuan

Analisis ini bertujuan untuk mengetahui : (1)Tren jumlah total pengaduan kerusakan bagasi maskapai dari tahun 2004 sampai dengan 2024, (2) Prediksi jumlah total pengaduan kerusakan bagasi oleh pelanggan maskapai penerbangan, dan (3) Perbedaan jumlah total pengaduan di masa lampau dengan masa yang akan datang.

2 SOURCE CODE

2.1 Library

> # Library
> library(rmarkdown)
> library(tidyr)
> library(readr)
> library(TSA)
> library(tseries)
> library(forecast)
> library(MASS)
> library(lmtest)

2.2 Impor Data

Perintah untuk mengimpor dengan package readr lalu mengatur direktori dimana lokasi file yang akan dijalankan. Selanjutnya, intruksi membaca file berjudul “Airline Baggage” yang telah diimpor dan ditampilkan data tersebut sebanyak 6 baris menggunakan perintah ‘head’.

> setwd("C:/Users/LAURA/OneDrive/Documents/Semester 4/Komputasi Statistika")
> laprakkomstat <- read.csv("Airlines Baggage.csv", header=TRUE, sep=";")
> laprakkomstat
          Date Baggage
1   2004-01-01   12502
2   2004-02-01    8977
3   2004-03-01   10289
4   2004-04-01    8095
5   2004-05-01   10618
6   2004-06-01   13684
7   2004-07-01   14121
8   2004-08-01   12732
9   2004-09-01    7895
10  2004-10-01    9444
11  2004-11-01    9582
12  2004-12-01   17555
13  2005-01-01   15361
14  2005-02-01    9561
15  2005-03-01   13002
16  2005-04-01   11071
17  2005-05-01   12300
18  2005-06-01   16373
19  2005-07-01   19701
20  2005-08-01   16666
21  2005-09-01   12636
22  2005-10-01   14258
23  2005-11-01   14440
24  2005-12-01   24696
25  2006-01-01   19255
26  2006-02-01   17319
27  2006-03-01   20344
28  2006-04-01   19726
29  2006-05-01   21248
30  2006-06-01   22767
31  2006-07-01   23184
32  2006-08-01   27630
33  2006-09-01   25922
34  2006-10-01   24699
35  2006-11-01   18954
36  2006-12-01   28556
37  2007-01-01   24190
38  2007-02-01   20753
39  2007-03-01   21928
40  2007-04-01   19483
41  2007-05-01   19209
42  2007-06-01   26213
43  2007-07-01   24993
44  2007-08-01   23156
45  2007-09-01   14816
46  2007-10-01   15351
47  2007-11-01   13946
48  2007-12-01   23762
49  2008-01-01   17507
50  2008-02-01   15795
51  2008-03-01   17782
52  2008-04-01   14566
53  2008-05-01   13522
54  2008-06-01   15620
55  2008-07-01   12885
56  2008-08-01   12148
57  2008-09-01    8729
58  2008-10-01    9110
59  2008-11-01    7591
60  2008-12-01   15475
61  2009-01-01   10231
62  2009-02-01    7538
63  2009-03-01   10093
64  2009-04-01   10547
65  2009-05-01   10279
66  2009-06-01   13220
67  2009-07-01   11625
68  2009-08-01   10832
69  2009-09-01    7052
70  2009-10-01   10000
71  2009-11-01    7081
72  2009-12-01   12496
73  2010-01-01   11059
74  2010-02-01    8973
75  2010-03-01    9762
76  2010-04-01    7864
77  2010-05-01    9399
78  2010-06-01   10431
79  2010-07-01    9840
80  2010-08-01    9583
81  2010-09-01    8324
82  2010-10-01    8498
83  2010-11-01    8067
84  2010-12-01   11526
85  2004-01-01    1717
86  2004-02-01    1599
87  2004-03-01    1327
88  2004-04-01    1350
89  2004-05-01    1304
90  2004-06-01    1697
91  2004-07-01    1398
92  2004-08-01    1259
93  2004-09-01    1033
94  2004-10-01    1176
95  2004-11-01    1084
96  2004-12-01    1146
97  2005-01-01    1206
98  2005-02-01    1154
99  2005-03-01    1541
100 2005-04-01    1348
101 2005-05-01    1408
102 2005-06-01    1625
103 2005-07-01    1906
104 2005-08-01    1726
105 2005-09-01    1236
106 2005-10-01    1443
107 2005-11-01    1286
108 2005-12-01    1629
109 2006-01-01    1461
110 2006-02-01    1388
111 2006-03-01    2049
112 2006-04-01    1522
113 2006-05-01    1305
114 2006-06-01    1411
115 2006-07-01    1530
116 2006-08-01    1733
117 2006-09-01    1421
118 2006-10-01    1757
119 2006-11-01    1790
120 2006-12-01    2252
121 2007-01-01    2046
122 2007-02-01    1922
123 2007-03-01    2331
124 2007-04-01    1583
125 2007-05-01    1601
126 2007-06-01    2163
127 2007-07-01    2529
128 2007-08-01    2013
129 2007-09-01    2064
130 2007-10-01    2069
131 2007-11-01    2086
132 2007-12-01    1962
133 2008-01-01    1795
134 2008-02-01    1273
135 2008-03-01    1511
136 2008-04-01    2449
137 2008-05-01    2696
138 2008-06-01    2618
139 2008-07-01    2791
140 2008-08-01    2121
141 2008-09-01    1428
142 2008-10-01    1556
143 2008-11-01    1532
144 2008-12-01    1803
145 2009-01-01    1303
146 2009-02-01    1389
147 2009-03-01    1323
148 2009-04-01    1300
149 2009-05-01    1251
150 2009-06-01    1381
151 2009-07-01    1573
152 2009-08-01    1604
153 2009-09-01    1313
154 2009-10-01    1319
155 2009-11-01    1140
156 2009-12-01    1179
157 2010-01-01    1326
158 2010-02-01    1200
159 2010-03-01    1180
160 2010-04-01    1076
161 2010-05-01    1264
162 2010-06-01    1360
163 2010-07-01    1386
164 2010-08-01    1283
165 2010-09-01    1912
166 2010-10-01    2265
167 2010-11-01    2020
168 2010-12-01    2705
169 2004-01-01   25015
170 2004-02-01   16660
171 2004-03-01   19318
172 2004-04-01   15638
173 2004-05-01   19302
174 2004-06-01   21892
175 2004-07-01   26666
176 2004-08-01   25510
177 2004-09-01   13305
178 2004-10-01   17736
179 2004-11-01   15812
180 2004-12-01   32458
181 2005-01-01   25861
182 2005-02-01   18647
183 2005-03-01   22264
184 2005-04-01   14262
185 2005-05-01   19977
186 2005-06-01   28024
187 2005-07-01   23513
188 2005-08-01   21000
189 2005-09-01   14138
190 2005-10-01   16628
191 2005-11-01   15254
192 2005-12-01   29235
193 2006-01-01   23232
194 2006-02-01   18551
195 2006-03-01   22246
196 2006-04-01   18019
197 2006-05-01   19996
198 2006-06-01   27588
199 2006-07-01   30325
200 2006-08-01   39123
201 2006-09-01   37039
202 2006-10-01   35640
203 2006-11-01   28896
204 2006-12-01   40483
205 2007-01-01   41787
206 2007-02-01   34581
207 2007-03-01   33920
208 2007-04-01   25667
209 2007-05-01   25524
210 2007-06-01   31242
211 2007-07-01   30356
212 2007-08-01   29331
213 2007-09-01   18033
214 2007-10-01   20147
215 2007-11-01   16927
216 2007-12-01   33269
217 2008-01-01   26113
218 2008-02-01   22059
219 2008-03-01   23932
220 2008-04-01   22994
221 2008-05-01   23217
222 2008-06-01   29690
223 2008-07-01   26604
224 2008-08-01   32827
225 2008-09-01   17551
226 2008-10-01   15429
227 2008-11-01   13138
228 2008-12-01   29803
229 2009-01-01   19653
230 2009-02-01   12627
231 2009-03-01   16285
232 2009-04-01   13517
233 2009-05-01   15083
234 2009-06-01   22844
235 2009-07-01   19259
236 2009-08-01   18646
237 2009-09-01   11270
238 2009-10-01   14513
239 2009-11-01    9814
240 2009-12-01   22845
241 2010-01-01   17307
242 2010-02-01   13269
243 2010-03-01   14782
244 2010-04-01   11121
245 2010-05-01   11947
246 2010-06-01   15784
247 2010-07-01   14309
248 2010-08-01   14099
249 2010-09-01    9435
250 2010-10-01    9565
251 2010-11-01    8597
252 2010-12-01   14415
> head(laprakkomstat$Baggage)
[1] 12502  8977 10289  8095 10618 13684

2.3 Analisis Deret Waktu

Perintah untuk membuat deret waktu waktu dari jumlah total pengaduan kerusakan bagasi oleh pelanggan sejak tahun 2004 hingga 2024 dengan frekuensi bulanan.

> bagasi <- ts(laprakkomstat$Baggage, start = 2004, frequency = 12)
> bagasi
       Jan   Feb   Mar   Apr   May   Jun   Jul   Aug   Sep   Oct   Nov   Dec
2004 12502  8977 10289  8095 10618 13684 14121 12732  7895  9444  9582 17555
2005 15361  9561 13002 11071 12300 16373 19701 16666 12636 14258 14440 24696
2006 19255 17319 20344 19726 21248 22767 23184 27630 25922 24699 18954 28556
2007 24190 20753 21928 19483 19209 26213 24993 23156 14816 15351 13946 23762
2008 17507 15795 17782 14566 13522 15620 12885 12148  8729  9110  7591 15475
2009 10231  7538 10093 10547 10279 13220 11625 10832  7052 10000  7081 12496
2010 11059  8973  9762  7864  9399 10431  9840  9583  8324  8498  8067 11526
2011  1717  1599  1327  1350  1304  1697  1398  1259  1033  1176  1084  1146
2012  1206  1154  1541  1348  1408  1625  1906  1726  1236  1443  1286  1629
2013  1461  1388  2049  1522  1305  1411  1530  1733  1421  1757  1790  2252
2014  2046  1922  2331  1583  1601  2163  2529  2013  2064  2069  2086  1962
2015  1795  1273  1511  2449  2696  2618  2791  2121  1428  1556  1532  1803
2016  1303  1389  1323  1300  1251  1381  1573  1604  1313  1319  1140  1179
2017  1326  1200  1180  1076  1264  1360  1386  1283  1912  2265  2020  2705
2018 25015 16660 19318 15638 19302 21892 26666 25510 13305 17736 15812 32458
2019 25861 18647 22264 14262 19977 28024 23513 21000 14138 16628 15254 29235
2020 23232 18551 22246 18019 19996 27588 30325 39123 37039 35640 28896 40483
2021 41787 34581 33920 25667 25524 31242 30356 29331 18033 20147 16927 33269
2022 26113 22059 23932 22994 23217 29690 26604 32827 17551 15429 13138 29803
2023 19653 12627 16285 13517 15083 22844 19259 18646 11270 14513  9814 22845
2024 17307 13269 14782 11121 11947 15784 14309 14099  9435  9565  8597 14415

2.4 Visualisasi Data

Perintah membuat plot pada deret waktu dimana sumbu x adalah tahun dan sumbu y adalah jumlah total pengaduan bagasi.

> plot(bagasi, main = 'Jumlah Total Masalah Bagasi Maskapai dari Tahun 2004-2024', 
+      ylab = "Baggage", xlab = "Date" )

##Stasioneritas Perintah untuk membuat transformasi Box-Cox pada deret waktu ‘bagasi’ diregresikan terhadap nilai konstan(1).

> boxcox(lm(bagasi~1))

2.5 Stasioner terhadap Rata-rata

Perintah untuk melakukan uji ADF pada deret waktu ‘bagasi’.

> adf.test(bagasi)

    Augmented Dickey-Fuller Test

data:  bagasi
Dickey-Fuller = -1.4757, Lag order = 6, p-value = 0.7965
alternative hypothesis: stationary

2.6 Differensiasi Data

Perintah melakukan differensiasi pertama pada deret waktu “bagasi” dengan fungsi ‘diff()’ dan hasilnya akan disimpan pada variabel beda_jumlah.

> beda_jumlah <- diff(bagasi,1,1)
> beda_jumlah
        Jan    Feb    Mar    Apr    May    Jun    Jul    Aug    Sep    Oct
2004         -3525   1312  -2194   2523   3066    437  -1389  -4837   1549
2005  -2194  -5800   3441  -1931   1229   4073   3328  -3035  -4030   1622
2006  -5441  -1936   3025   -618   1522   1519    417   4446  -1708  -1223
2007  -4366  -3437   1175  -2445   -274   7004  -1220  -1837  -8340    535
2008  -6255  -1712   1987  -3216  -1044   2098  -2735   -737  -3419    381
2009  -5244  -2693   2555    454   -268   2941  -1595   -793  -3780   2948
2010  -1437  -2086    789  -1898   1535   1032   -591   -257  -1259    174
2011  -9809   -118   -272     23    -46    393   -299   -139   -226    143
2012     60    -52    387   -193     60    217    281   -180   -490    207
2013   -168    -73    661   -527   -217    106    119    203   -312    336
2014   -206   -124    409   -748     18    562    366   -516     51      5
2015   -167   -522    238    938    247    -78    173   -670   -693    128
2016   -500     86    -66    -23    -49    130    192     31   -291      6
2017    147   -126    -20   -104    188     96     26   -103    629    353
2018  22310  -8355   2658  -3680   3664   2590   4774  -1156 -12205   4431
2019  -6597  -7214   3617  -8002   5715   8047  -4511  -2513  -6862   2490
2020  -6003  -4681   3695  -4227   1977   7592   2737   8798  -2084  -1399
2021   1304  -7206   -661  -8253   -143   5718   -886  -1025 -11298   2114
2022  -7156  -4054   1873   -938    223   6473  -3086   6223 -15276  -2122
2023 -10150  -7026   3658  -2768   1566   7761  -3585   -613  -7376   3243
2024  -5538  -4038   1513  -3661    826   3837  -1475   -210  -4664    130
        Nov    Dec
2004    138   7973
2005    182  10256
2006  -5745   9602
2007  -1405   9816
2008  -1519   7884
2009  -2919   5415
2010   -431   3459
2011    -92     62
2012   -157    343
2013     33    462
2014     17   -124
2015    -24    271
2016   -179     39
2017   -245    685
2018  -1924  16646
2019  -1374  13981
2020  -6744  11587
2021  -3220  16342
2022  -2291  16665
2023  -4699  13031
2024   -968   5818

2.7 Visualisasi pada Differensiasi Data

Perintah membuat plot pada deret waktu “beda_jumlah” dimana sumbu x adalah tahun dan sumbu y adalah jumlah total pengaduan bagasi.

> plot(beda_jumlah, main = 'Jumlah Total Masalah Bagasi Maskapai dari Tahun 2004-2024', 
+      ylab = "Baggage", xlab = "Date" )

2.8 Stasioner terhadap Rata-rata pada Differensiasi Data Pertama

Perintah untuk melakukan uji ADF pada deret waktu ‘beda_jumlah’.

> adf.test(beda_jumlah)

    Augmented Dickey-Fuller Test

data:  beda_jumlah
Dickey-Fuller = -5.1525, Lag order = 6, p-value = 0.01
alternative hypothesis: stationary

2.9 Identifikasi Model

Perintah untuk membuat pola ACF dan PACF pada deret waktu ‘beda_jumlah’.

> acf(beda_jumlah)

> acf(beda_jumlah, type = "partial")

2.10 Estimasi Parameter

Perintah untuk menguji hipotesis statistik estimasi parameter 9 model ARIMA, yaitu ARIMA (4,1,1), ARIMA (4,1,0), ARIMA (3,1,1), ARIMA (3,1,0), ARIMA (2,1,1), ARIMA (2,1,0), ARIMA (1,1,1), ARIMA (1,1,0), dan ARIMA (0,1,1) pada data ‘Baggage’ dalam deret waktu ‘laprakkomstat’ menggunakan metode maximum likelihood.

> #ARIMA(4,1,1)
> fit.1 <- Arima(laprakkomstat$Baggage, order = c(4,1,1), method = "ML")
> coeftest(fit.1)

z test of coefficients:

     Estimate Std. Error z value  Pr(>|z|)    
ar1 -0.354231   0.132201 -2.6795 0.0073735 ** 
ar2 -0.254594   0.075288 -3.3816 0.0007206 ***
ar3 -0.375069   0.066447 -5.6446 1.656e-08 ***
ar4 -0.256801   0.071530 -3.5901 0.0003305 ***
ma1 -0.117113   0.126796 -0.9236 0.3556766    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
> #ARIMA(4,1,0)
> fit.2 <- Arima(laprakkomstat$Baggage, order = c(4,1,0), method = "ML")
> coeftest(fit.2)

z test of coefficients:

     Estimate Std. Error z value  Pr(>|z|)    
ar1 -0.460576   0.060541 -7.6077 2.790e-14 ***
ar2 -0.294416   0.062288 -4.7267 2.282e-06 ***
ar3 -0.398427   0.061975 -6.4288 1.286e-10 ***
ar4 -0.284783   0.060298 -4.7229 2.325e-06 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
> #ARIMA(3,1,1)
> fit.3 <- Arima(laprakkomstat$Baggage, order = c(3,1,1), method = "ML")
> coeftest(fit.3)

z test of coefficients:

     Estimate Std. Error z value  Pr(>|z|)    
ar1 -0.019401   0.100223 -0.1936   0.84651    
ar2 -0.119006   0.067443 -1.7645   0.07764 .  
ar3 -0.284926   0.064541 -4.4147 1.012e-05 ***
ma1 -0.418144   0.089764 -4.6583 3.189e-06 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
> #ARIMA(3,1,0)
> fit.4 <- Arima(laprakkomstat$Baggage, order = c(3,1,0), method = "ML")
> coeftest(fit.4)

z test of coefficients:

     Estimate Std. Error z value  Pr(>|z|)    
ar1 -0.377829   0.060531 -6.2419 4.322e-10 ***
ar2 -0.228340   0.063269 -3.6090 0.0003074 ***
ar3 -0.290955   0.060253 -4.8289 1.373e-06 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
> #ARIMA(2,1,1)
> fit.5 <- Arima(laprakkomstat$Baggage, order = c(2,1,1), method = "ML")
> coeftest(fit.5)

z test of coefficients:

     Estimate Std. Error z value  Pr(>|z|)    
ar1  0.218256   0.101310  2.1543   0.03121 *  
ar2 -0.059055   0.074880 -0.7887   0.43031    
ma1 -0.648283   0.080995 -8.0039 1.205e-15 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
> #ARIMA(2,1,0)
> fit.6 <- Arima(laprakkomstat$Baggage, order = c(2,1,0), method = "ML")
> coeftest(fit.6)

z test of coefficients:

     Estimate Std. Error z value  Pr(>|z|)    
ar1 -0.339285   0.062763 -5.4058 6.451e-08 ***
ar2 -0.129450   0.062622 -2.0672   0.03872 *  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
> #ARIMA(1,1,1)
> fit.7 <- Arima(laprakkomstat$Baggage, order = c(1,1,1), method = "ML")
> coeftest(fit.7)

z test of coefficients:

     Estimate Std. Error  z value Pr(>|z|)    
ar1  0.244941   0.096480   2.5388  0.01112 *  
ma1 -0.684507   0.065878 -10.3905  < 2e-16 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
> #ARIMA(1,1,0)
> fit.8 <- Arima(laprakkomstat$Baggage, order = c(1,1,0), method = "ML")
> coeftest(fit.8)

z test of coefficients:

     Estimate Std. Error z value  Pr(>|z|)    
ar1 -0.300352   0.060354 -4.9765 6.475e-07 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
> #ARIMA(0,1,1)
> fit.9 <- Arima(laprakkomstat$Baggage, order = c(0,1,1), method = "ML")
> coeftest(fit.9)

z test of coefficients:

     Estimate Std. Error z value  Pr(>|z|)    
ma1 -0.532709   0.062123  -8.575 < 2.2e-16 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

2.11 Diagnosis Model

Perintah untuk menyusun data frame bernama ‘aic.model’ dari 9 model ARIMA berdasarkan nilai AIC.

> aic.model <- data.frame(Nama=c("fit.1", "fit.2", "fit.3", "fit.4", 
+                                "fit.5", "fit.6", "fit.7", "fit.8", 
+                                "fit.9"),
+                         Model=c("ARIMA (4,1,1)", "ARIMA (4,1,0)", 
+                                 "ARIMA (3,1,1)", "ARIMA (3,1,0)", 
+                                 "ARIMA (2,1,1)", "ARIMA (2,1,0)", 
+                                 "ARIMA (1,1,1)", "ARIMA (1,1,0)",
+                                 "ARIMA (0,1,1)"),
+                         AIC=c(fit.1$aic, fit.2$aic, fit.3$aic, 
+                               fit.4$aic, fit.5$aic, fit.6$aic, 
+                               fit.7$aic, fit.8$aic, fit.9$aic))
> aic.model
   Nama         Model      AIC
1 fit.1 ARIMA (4,1,1) 4877.495
2 fit.2 ARIMA (4,1,0) 4876.276
3 fit.3 ARIMA (3,1,1) 4884.781
4 fit.4 ARIMA (3,1,0) 4895.587
5 fit.5 ARIMA (2,1,1) 4898.326
6 fit.6 ARIMA (2,1,0) 4915.839
7 fit.7 ARIMA (1,1,1) 4896.924
8 fit.8 ARIMA (1,1,0) 4918.076
9 fit.9 ARIMA (0,1,1) 4901.350

2.12 Diagnosis Model Terbaik

Perintah untuk melakukan diagnosis terhadap residual dari fit.2

> checkresiduals(fit.2)


    Ljung-Box test

data:  Residuals from ARIMA(4,1,0)
Q* = 24.986, df = 6, p-value = 0.0003435

Model df: 4.   Total lags used: 10

2.13 Diagnosis Model Terbaik

Perintah untuk melakukan peramalan Baggage dari deret waktu ‘laprakkomstat’ dengan model ‘fit.2’ dan hasil ramalan dalam periode 12 bulan mendatang kemudian disimpan pada variabel ‘forecast’ serta membuat plotnya.

> forecast <- forecast(laprakkomstat$Baggage, model=fit.2, h=12)
> forecast
    Point Forecast    Lo 80    Hi 80       Lo 95    Hi 95
253       13296.80 8234.970 18358.62  5555.40083 21038.19
254       12447.56 6696.250 18198.87  3651.69203 21243.42
255       11125.53 4926.186 17324.88  1644.44896 20606.62
256       10773.11 4463.315 17082.91  1123.11109 20423.11
257       11981.46 5537.156 18425.76  2125.74804 21837.17
258       12297.26 5416.017 19178.50  1773.30680 22821.21
259       12312.96 5012.740 19613.18  1148.23878 23477.68
260       11831.68 4155.726 19507.63    92.32365 23571.03
261       11578.78 3667.020 19490.54  -521.21278 23678.77
262       11740.77 3621.912 19859.62  -675.94915 24157.48
263       11927.90 3561.800 20294.00  -866.94704 24722.75
264       12031.84 3392.367 20671.32 -1181.09436 25244.78
> plot(forecast)

3 HASIL DAN PEMBAHASAN

3.1 Visualisasi Data

Visualisasi data dilakukan dengan membentuk plot untuk data Baggage dalam deret waktu ‘laprakkomstat’ dengan jumlah total pengaduan bagasi sebagai sumbu x dan waktu sebagai tahun.

3.2 Uji Stasioneritas

\[ \begin{align*} \text{Hipotesis :}\\ H_{0} &= Data\phantom(tidak\phantom(stasioner\\ H_{1} &= Data\phantom(stasioner \end{align*} \] Daerah kritis : P-value < \(\alpha\) maka tolak \(H_{0}\) Statistik Uji : P-value = 0.7965 Keputusan : Nilai p-value (0.7965) > \(\alpha\) (0.05), maka terima \(H_{0}\) Kesimpulan : Dengan taraf nyata 5%, dapat disimpulkan bahwa data tidak stasioner. Maka perlu dilakukan differencing agar data stasioner.

3.3 Stasioner terhadap Rata-rata

Hipotesis : \[ H_{0} = Data\phantom(Tidak\phantom(Stasioner \\ H_{1} = Data\phantom(stasioner \]

Daerah kritis : P-value < \(\alpha\) maka tolak \(H_{0}\) Statistik Uji : P-value = 0.01 Keputusan : Nilai p-value (0.01) < \(\alpha\) (0.05), maka tolak \(H_{0}\) Kesimpulan : Dengan taraf nyata 5%, dapat disimpulkan bahwa data stasioner.

3.4 Identifikasi Model

> acf(beda_jumlah)

> acf(beda_jumlah, type = "partial")

Berdasarkan korelogram, batang ACF keluar hingga lag ke-4 sehingga orde MA, q=4. Sedangkan, batang PACF pada lag ke-1 sehingga orde AR, p=1. Sebelumnya telah dilakukan diferencing orde 1 sehingga d=1. Dengan demikian, didapatkan mode ARIMA(4,1,1).

3.5 Estimasi Parameter

Estimasi parameter dilakukan dengan overfitting terhadap model dengan memilih model yang memiliki orde paling rendah dari orde pertama sehingga didapatkan model :

  • ARIMA (4,1,1)

  • ARIMA (4,1,0)

  • ARIMA (3,1,1)

  • ARIMA (3,1,0)

  • ARIMA (2,1,1)

  • ARIMA (2,1,0)

  • ARIMA (1,1,1)

  • ARIMA (1,1,0)

  • ARIMA (0,1,1)

> aic.model <- data.frame(Nama=c("fit.1", "fit.2", "fit.3", "fit.4", 
+                                "fit.5", "fit.6", "fit.7", "fit.8", 
+                                "fit.9"),
+                         Model=c("ARIMA (4,1,1)", "ARIMA (4,1,0)", 
+                                 "ARIMA (3,1,1)", "ARIMA (3,1,0)", 
+                                 "ARIMA (2,1,1)", "ARIMA (2,1,0)", 
+                                 "ARIMA (1,1,1)", "ARIMA (1,1,0)",
+                                 "ARIMA (0,1,1)"),
+                         AIC=c(fit.1$aic, fit.2$aic, fit.3$aic, 
+                               fit.4$aic, fit.5$aic, fit.6$aic, 
+                               fit.7$aic, fit.8$aic, fit.9$aic))
> aic.model
   Nama         Model      AIC
1 fit.1 ARIMA (4,1,1) 4877.495
2 fit.2 ARIMA (4,1,0) 4876.276
3 fit.3 ARIMA (3,1,1) 4884.781
4 fit.4 ARIMA (3,1,0) 4895.587
5 fit.5 ARIMA (2,1,1) 4898.326
6 fit.6 ARIMA (2,1,0) 4915.839
7 fit.7 ARIMA (1,1,1) 4896.924
8 fit.8 ARIMA (1,1,0) 4918.076
9 fit.9 ARIMA (0,1,1) 4901.350

Berdasarkan hasil output Rstudio didapatkan nilai AIC yang paling kecil pada model ARIMA(4,1,0). Dengan demikian, ARIMA(4,1,0) yang menjadi model terbaik.

3.6 Autokorelasi Model

Hipotesis : \[ H_{0} = k=0\phantom((tidak\phantom(ada\phantom(atokorelasi\phantom(residual\phantom(antar\phantom(lag) \\ H_{1} = minimal\phantom(ada\phantom(satu\phantom(k\neq 0\phantom((ada\phantom(autotokorelasi\phantom(residual\phantom(antar\phantom(lag) \\ \]

Taraf Signifikansi : \(\alpha\) = 0.05 Keputusan : Nilai p-value (0.0003435) < \(\alpha\) (0.05), maka tolak \(H_{0}\) Kesimpulan : Dengan taraf nyata 5%, dapat disimpulkan bahwa tidak ada autokorelasi resdiual antar lag atau model ARIMA(4,1,0) residualnya tidak berkorelasi

3.7 Prediksi

Hasil peramalan yang diperoleh adalah sebagai berikut.

> forecast <- forecast(laprakkomstat$Baggage, model=fit.2, h=12)
> forecast
    Point Forecast    Lo 80    Hi 80       Lo 95    Hi 95
253       13296.80 8234.970 18358.62  5555.40083 21038.19
254       12447.56 6696.250 18198.87  3651.69203 21243.42
255       11125.53 4926.186 17324.88  1644.44896 20606.62
256       10773.11 4463.315 17082.91  1123.11109 20423.11
257       11981.46 5537.156 18425.76  2125.74804 21837.17
258       12297.26 5416.017 19178.50  1773.30680 22821.21
259       12312.96 5012.740 19613.18  1148.23878 23477.68
260       11831.68 4155.726 19507.63    92.32365 23571.03
261       11578.78 3667.020 19490.54  -521.21278 23678.77
262       11740.77 3621.912 19859.62  -675.94915 24157.48
263       11927.90 3561.800 20294.00  -866.94704 24722.75
264       12031.84 3392.367 20671.32 -1181.09436 25244.78
> plot(forecast)

Plot ARIMA(4,1,0) menunjukkan tidak adanya tren karena tidak terdapat pola yang kompleks yang menunjukkan pola naik/turun.Model ARIMA(4,1,0) sudah cukup baik dalam menangkap pola acak dalam data tetapi tidak cukup baik untuk menangkap tren yang lebih kompleks.

  • Garis hitam merupakan data historis.

  • Garis biru merupakan nilai peramalan.

  • Area berwarna abu-abu/biru untuk prediksi 80% dan 95.

  • Lebarnya kipas interval prediksi mencerminkan ketidakpastian yang meningkat seiring dengan prediksi yang semakin jauh ke depan.

4 KESIMPULAN

Dari analisis deret waktu yang telah dilakukan, dapat disimpulkan bahwa jumlah total pengaduan kerusakan bagasi oleh pelanggan diprediksi mengalami penurunan dan kenaikan yang berulang pada interval tertentu. Dalam beberapa waktu tertentu, jumlah total pengaduan kerusakan bagasi menurun berarti bahwa bagasi maskapai mengalami minimum kerusakan. Namun setelah itu, terjadi peningkatan yang signifikan kemudian menurun secara perlahan. Hal ini menunjukkan bahwa kasus jumlah total pengaduan bagasi oleh pelanggan termasuk data deret waktu musiman.

Karena data terdeteksi musimaan maka perlu dilakukan metode analisis deret waktu lebih lanjut dengan metode Simple Exponential Smoothing atau Holt Winters Seasonal Model guna mendapatkan prediksi semakin akurat.

5 DAFTAR PUSTAKA

Maulana, H. A., 2018. Pemodelan Deret Waktu dan Peramalan Curah Hujan Pada Dua Belas Stasiun di Bogor. Jurnal Matematika, Statistika, & Komputasi, 15(1), pp. 52-53.

Harjati, L. & Venesia, Y., 2015. Pengaruh Kualitas Layanan dan Persepsi Harga Terhadap Kepuasan Pelanggan Pada Maskapai Penerbangan Tiger Air Mandala. E-Journal WIDYA Ekonomika, 1(1), p. 65.

Annisa, A., 2022. Penerapan Metode SARIMA (Seasonal Autoregressive Integrated Moving Average) dalam Memprediksi Produksi Tebu di Indonesia. [Online] Available at: https://rstudio-pubs-static.s3.amazonaws.com/905379_ad8bb0274f144224b3e508d426a13de1.html [Accessed 01 06 2024].

Halim, V. W., 2024. Analisis Deret Waktu. [Online] Available at: https://rpubs.com/vionawh/1190617 [Accessed 01 06 2024].

Wibisono, A. R., 2022. Tugas 2 Individu - Metode Permalan Deret Waktu. [Online] Available at: https://rpubs.com/akmalrizaw/regresilag-timeseries [Accessed 01 06 2024].

Fernandes. A.A. et al [PowerPoint Pertemuan 12 Komputasi Statistika]. [Brone]. (https://brone.ub.ac.id/course/view.php?id=2818) [Accessed 30 05 2024].

Redi, Aqsa Y., Nobby Nugraha P. dan Almira Rha Anni D. [PowerPoint Praktikum Komstat-C Pengenalan Deret Waktu]. [Google Classroom]. (https://classroom.google.com/c/NjU5MzM4MTcxNzE0/m/Njc5NTgzODg4NDU0/details) [Accessed 30 05 2024].