Notes Theme, silakan gunakan salah satu theme berikut: - cayman (package prettydoc) - architect (package prettydoc) - united (default di RMarkdown)
Library:
> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")
Saat ini, pelayanan penerbangan merupakan salah satu yang paling banyak diminati oleh masyarakat umum di Indonesia. Setiap maskapai penerbangan menawarkan pelayanan terbaiknya untuk memenuhi ekspektasi pelanggan. Bagi tiap maskaspai penerbangan, review pelanggan merupakan suatu hal yang penting sebagai tolak ukur untuk mengetahui seberapa baik performa yang telah diberikan kepada pelanggan. Data kualitatif dan kuantitatif dapat dipilih sebagai alat pendukung strategi maskapai penerbangan dalam pengambilan keputusan. Namun dewasa ini, data kuantitatif lebih disukai orang karena lebih efektif untuk dianalisis.
Statistika sebagai ilmu analisis data memiliki metode peramalan sebagai metode yang tepat dalam pengambilan keputusan. Peramalan yang dilakukan didasarkan pada kejadian masa lampau yang dianalisis dengan metode tertentu. Hasil dari metode peramalan juga dapat digunakan sebagai pembanding kejadian masa lampau dan masa yang akan datang.
Peranan peramalan dalam maskapai penerbangan kali ini digunakan dalam permasalahan pengaduan kerusakan bagasi oleh para pelanggan. Variabel yang akan dianalisis adalah jumlah total pengaduan kerusakan bagasi dan tanggal rekap jumlah pengaduan oleh pelanggan. Oleh karena itu pada analisis ini dibuatlah sebuah metode peramalan yang menggunakan ARIMA sebagai dasar dalam mengidentifikasi jenis model prediksi dan output prediksi serta meminimalkan data error dari hasil prediksi yang akan didapatkan.
Analisis deret waktu adalah metode statistik yang digunakan untuk memodelkan dan meramal data yang diambil secara berurutan dalam berbagai bidang seperti ekonomi, keuangan, meteorologi, dan sains sosial. Data dikumpulkan secara periodik berdasarkan urutan waktu (Hutomo, 2018). Meteode peramalan yang dilakukan ditentukan berdasarkan pola dari data. Data historis dapat digunakan untuk mengidentifikasi pola dan tren yang berulang serta meramalkan kondisi masa depan. Pola data dibedakan menjadi 4 jenis, antara lain tren, musiman, musiman, dan irregular.
Analisis Deret Waktu dilakukan melalui beberapa langkah antara lain :
1. Visualisasi Data
Langkah awal analisis deret waktu adalah membentuk plot untuk mengidentifikasi pola.
2. Stasioneritas
Uji stasioneritas dilakukan untuk memastikan bahwa data tidak memiliki tren atau variabilitas musiman. Uji stasioner dapat dilakukan terhadap rata-rata dan ragam.
3. Identifikasi Model
Model diidentifikasi dengan ACF (Auto Correlation Function) dan PACF (Partial Auto Correlation Function). Hal ini perlu dilakukan untuk menentukan parameter AR dan MA.
4. Estimasi Model
Estimasi dilakukan menggunakan metode Maximum Likelihood untuk menentukan parameter model.
5. Diagnosis Model
Diagnosis model adalah proses mengevaluasi model dengan memeriksa residuals.
6. Prediksi
Prediksi dilakukan dengan menggunakan model yang telah disusun sebelumnya untuk menentukan prediksi di masa yang akan datang.
Metode ARIMA adalah metode peramalan yang tidak menggunakan teori atau pengaruh antarvariabel seperti pada model regresi. Oleh karena itu, metode ARIMA tidak memerlukan pengklasifikasian pada variabel, antara lain variabel dependen dan variabel independen.ARIMA (p,d,q) diperoleh dari kombinasi Auto Regressive (AR), Integrated (I), dan Moving Average (MA). \[ AR (p): Y_{t}=\phi _{1}Y_{t-1}+\phi _{2}Y_{t-2}+...+\phi _{p}Y_{t-p}+e_{t} \\ MA (q): Y_{t}=e _{t}-\theta _{1}e _{t-1}-\theta _{2}e _{t-2}-...-\theta _{q}e _{t-q} \] I(d) : Mengurangi tren atau membuat data stasioner melalui differencing. \[ ARIMA : \phi _{p}(B)(1-B)^{d}Y_{t}=\theta _{q}(B)e_{t} \\\ \]
Exponential Smoothing dibagi menjadi 3, yaitu (1) Simple Exponential Smoothing untuk data tanpa tren atau musiman, (2) Holt’s Linear Trend Model menggunakan dua parameter untuk level dan tren, (3) Holt’s Winters Seasonal Model untuk data musiman.
Data dikatakan stasioner terhadap rata-rata apabila berfluktuasi disekitar garis sejajar dengan waktu (sumbu y) atau disekitar nilai rata-rata yang konstan. Pengujian stasioner terhadap ragam dilakukan melalui plot ACF dan PACF dengan hipotesis sebagai berikut Hipotesis : \[ H_{0} = Data\phantom(Tidak\phantom(Stasioner \\ H_{1} = Data\phantom(stasioner \] Jika data tidak stasioner maka diperlukan proses diferensiasi untuk d \(\geq\) 1 sehingga datanya menjadi stasioner terhadap rata-rata.
Data dikatakan stasioner terhadap ragam apabila ragam konstan dari waktu ke waktu. Kestasioneran terhadap ragam dapat dilihat melalui Box-Cox. Apabil a data terbukti tidak stasioner maka perlu dilakukan transformasi pangkat.
Data yang digunakan adalah data jumlah total pengaduan kerusakan bagasi dari tahun 2004 sampai dengan 2024. Data diperoleh dari website kaggle dengan judul “Airline Baggage Complains - Time Series Dataset”. Data yang digunakan dapat diakses melalui link berikut : https://www.kaggle.com/datasets/gabrielsantello/airline-baggage-complaints-time-series-dataset
> setwd("C:/Users/LAURA/OneDrive/Documents/Semester 4/Komputasi Statistika")
> laprakkomstat <- read.csv("Airlines Baggage.csv", header=TRUE, sep=";")
> laprakkomstat
Date Baggage
1 2004-01-01 12502
2 2004-02-01 8977
3 2004-03-01 10289
4 2004-04-01 8095
5 2004-05-01 10618
6 2004-06-01 13684
7 2004-07-01 14121
8 2004-08-01 12732
9 2004-09-01 7895
10 2004-10-01 9444
11 2004-11-01 9582
12 2004-12-01 17555
13 2005-01-01 15361
14 2005-02-01 9561
15 2005-03-01 13002
16 2005-04-01 11071
17 2005-05-01 12300
18 2005-06-01 16373
19 2005-07-01 19701
20 2005-08-01 16666
21 2005-09-01 12636
22 2005-10-01 14258
23 2005-11-01 14440
24 2005-12-01 24696
25 2006-01-01 19255
26 2006-02-01 17319
27 2006-03-01 20344
28 2006-04-01 19726
29 2006-05-01 21248
30 2006-06-01 22767
31 2006-07-01 23184
32 2006-08-01 27630
33 2006-09-01 25922
34 2006-10-01 24699
35 2006-11-01 18954
36 2006-12-01 28556
37 2007-01-01 24190
38 2007-02-01 20753
39 2007-03-01 21928
40 2007-04-01 19483
41 2007-05-01 19209
42 2007-06-01 26213
43 2007-07-01 24993
44 2007-08-01 23156
45 2007-09-01 14816
46 2007-10-01 15351
47 2007-11-01 13946
48 2007-12-01 23762
49 2008-01-01 17507
50 2008-02-01 15795
51 2008-03-01 17782
52 2008-04-01 14566
53 2008-05-01 13522
54 2008-06-01 15620
55 2008-07-01 12885
56 2008-08-01 12148
57 2008-09-01 8729
58 2008-10-01 9110
59 2008-11-01 7591
60 2008-12-01 15475
61 2009-01-01 10231
62 2009-02-01 7538
63 2009-03-01 10093
64 2009-04-01 10547
65 2009-05-01 10279
66 2009-06-01 13220
67 2009-07-01 11625
68 2009-08-01 10832
69 2009-09-01 7052
70 2009-10-01 10000
71 2009-11-01 7081
72 2009-12-01 12496
73 2010-01-01 11059
74 2010-02-01 8973
75 2010-03-01 9762
76 2010-04-01 7864
77 2010-05-01 9399
78 2010-06-01 10431
79 2010-07-01 9840
80 2010-08-01 9583
81 2010-09-01 8324
82 2010-10-01 8498
83 2010-11-01 8067
84 2010-12-01 11526
85 2004-01-01 1717
86 2004-02-01 1599
87 2004-03-01 1327
88 2004-04-01 1350
89 2004-05-01 1304
90 2004-06-01 1697
91 2004-07-01 1398
92 2004-08-01 1259
93 2004-09-01 1033
94 2004-10-01 1176
95 2004-11-01 1084
96 2004-12-01 1146
97 2005-01-01 1206
98 2005-02-01 1154
99 2005-03-01 1541
100 2005-04-01 1348
101 2005-05-01 1408
102 2005-06-01 1625
103 2005-07-01 1906
104 2005-08-01 1726
105 2005-09-01 1236
106 2005-10-01 1443
107 2005-11-01 1286
108 2005-12-01 1629
109 2006-01-01 1461
110 2006-02-01 1388
111 2006-03-01 2049
112 2006-04-01 1522
113 2006-05-01 1305
114 2006-06-01 1411
115 2006-07-01 1530
116 2006-08-01 1733
117 2006-09-01 1421
118 2006-10-01 1757
119 2006-11-01 1790
120 2006-12-01 2252
121 2007-01-01 2046
122 2007-02-01 1922
123 2007-03-01 2331
124 2007-04-01 1583
125 2007-05-01 1601
126 2007-06-01 2163
127 2007-07-01 2529
128 2007-08-01 2013
129 2007-09-01 2064
130 2007-10-01 2069
131 2007-11-01 2086
132 2007-12-01 1962
133 2008-01-01 1795
134 2008-02-01 1273
135 2008-03-01 1511
136 2008-04-01 2449
137 2008-05-01 2696
138 2008-06-01 2618
139 2008-07-01 2791
140 2008-08-01 2121
141 2008-09-01 1428
142 2008-10-01 1556
143 2008-11-01 1532
144 2008-12-01 1803
145 2009-01-01 1303
146 2009-02-01 1389
147 2009-03-01 1323
148 2009-04-01 1300
149 2009-05-01 1251
150 2009-06-01 1381
151 2009-07-01 1573
152 2009-08-01 1604
153 2009-09-01 1313
154 2009-10-01 1319
155 2009-11-01 1140
156 2009-12-01 1179
157 2010-01-01 1326
158 2010-02-01 1200
159 2010-03-01 1180
160 2010-04-01 1076
161 2010-05-01 1264
162 2010-06-01 1360
163 2010-07-01 1386
164 2010-08-01 1283
165 2010-09-01 1912
166 2010-10-01 2265
167 2010-11-01 2020
168 2010-12-01 2705
169 2004-01-01 25015
170 2004-02-01 16660
171 2004-03-01 19318
172 2004-04-01 15638
173 2004-05-01 19302
174 2004-06-01 21892
175 2004-07-01 26666
176 2004-08-01 25510
177 2004-09-01 13305
178 2004-10-01 17736
179 2004-11-01 15812
180 2004-12-01 32458
181 2005-01-01 25861
182 2005-02-01 18647
183 2005-03-01 22264
184 2005-04-01 14262
185 2005-05-01 19977
186 2005-06-01 28024
187 2005-07-01 23513
188 2005-08-01 21000
189 2005-09-01 14138
190 2005-10-01 16628
191 2005-11-01 15254
192 2005-12-01 29235
193 2006-01-01 23232
194 2006-02-01 18551
195 2006-03-01 22246
196 2006-04-01 18019
197 2006-05-01 19996
198 2006-06-01 27588
199 2006-07-01 30325
200 2006-08-01 39123
201 2006-09-01 37039
202 2006-10-01 35640
203 2006-11-01 28896
204 2006-12-01 40483
205 2007-01-01 41787
206 2007-02-01 34581
207 2007-03-01 33920
208 2007-04-01 25667
209 2007-05-01 25524
210 2007-06-01 31242
211 2007-07-01 30356
212 2007-08-01 29331
213 2007-09-01 18033
214 2007-10-01 20147
215 2007-11-01 16927
216 2007-12-01 33269
217 2008-01-01 26113
218 2008-02-01 22059
219 2008-03-01 23932
220 2008-04-01 22994
221 2008-05-01 23217
222 2008-06-01 29690
223 2008-07-01 26604
224 2008-08-01 32827
225 2008-09-01 17551
226 2008-10-01 15429
227 2008-11-01 13138
228 2008-12-01 29803
229 2009-01-01 19653
230 2009-02-01 12627
231 2009-03-01 16285
232 2009-04-01 13517
233 2009-05-01 15083
234 2009-06-01 22844
235 2009-07-01 19259
236 2009-08-01 18646
237 2009-09-01 11270
238 2009-10-01 14513
239 2009-11-01 9814
240 2009-12-01 22845
241 2010-01-01 17307
242 2010-02-01 13269
243 2010-03-01 14782
244 2010-04-01 11121
245 2010-05-01 11947
246 2010-06-01 15784
247 2010-07-01 14309
248 2010-08-01 14099
249 2010-09-01 9435
250 2010-10-01 9565
251 2010-11-01 8597
252 2010-12-01 14415
> head(laprakkomstat)
Date Baggage
1 2004-01-01 12502
2 2004-02-01 8977
3 2004-03-01 10289
4 2004-04-01 8095
5 2004-05-01 10618
6 2004-06-01 13684
Analisis ini bertujuan untuk mengetahui : (1)Tren jumlah total pengaduan kerusakan bagasi maskapai dari tahun 2004 sampai dengan 2024, (2) Prediksi jumlah total pengaduan kerusakan bagasi oleh pelanggan maskapai penerbangan, dan (3) Perbedaan jumlah total pengaduan di masa lampau dengan masa yang akan datang.
> # Library
> library(rmarkdown)
> library(tidyr)
> library(readr)
> library(TSA)
> library(tseries)
> library(forecast)
> library(MASS)
> library(lmtest)
Perintah untuk mengimpor dengan package readr lalu mengatur direktori dimana lokasi file yang akan dijalankan. Selanjutnya, intruksi membaca file berjudul “Airline Baggage” yang telah diimpor dan ditampilkan data tersebut sebanyak 6 baris menggunakan perintah ‘head’.
> setwd("C:/Users/LAURA/OneDrive/Documents/Semester 4/Komputasi Statistika")
> laprakkomstat <- read.csv("Airlines Baggage.csv", header=TRUE, sep=";")
> laprakkomstat
Date Baggage
1 2004-01-01 12502
2 2004-02-01 8977
3 2004-03-01 10289
4 2004-04-01 8095
5 2004-05-01 10618
6 2004-06-01 13684
7 2004-07-01 14121
8 2004-08-01 12732
9 2004-09-01 7895
10 2004-10-01 9444
11 2004-11-01 9582
12 2004-12-01 17555
13 2005-01-01 15361
14 2005-02-01 9561
15 2005-03-01 13002
16 2005-04-01 11071
17 2005-05-01 12300
18 2005-06-01 16373
19 2005-07-01 19701
20 2005-08-01 16666
21 2005-09-01 12636
22 2005-10-01 14258
23 2005-11-01 14440
24 2005-12-01 24696
25 2006-01-01 19255
26 2006-02-01 17319
27 2006-03-01 20344
28 2006-04-01 19726
29 2006-05-01 21248
30 2006-06-01 22767
31 2006-07-01 23184
32 2006-08-01 27630
33 2006-09-01 25922
34 2006-10-01 24699
35 2006-11-01 18954
36 2006-12-01 28556
37 2007-01-01 24190
38 2007-02-01 20753
39 2007-03-01 21928
40 2007-04-01 19483
41 2007-05-01 19209
42 2007-06-01 26213
43 2007-07-01 24993
44 2007-08-01 23156
45 2007-09-01 14816
46 2007-10-01 15351
47 2007-11-01 13946
48 2007-12-01 23762
49 2008-01-01 17507
50 2008-02-01 15795
51 2008-03-01 17782
52 2008-04-01 14566
53 2008-05-01 13522
54 2008-06-01 15620
55 2008-07-01 12885
56 2008-08-01 12148
57 2008-09-01 8729
58 2008-10-01 9110
59 2008-11-01 7591
60 2008-12-01 15475
61 2009-01-01 10231
62 2009-02-01 7538
63 2009-03-01 10093
64 2009-04-01 10547
65 2009-05-01 10279
66 2009-06-01 13220
67 2009-07-01 11625
68 2009-08-01 10832
69 2009-09-01 7052
70 2009-10-01 10000
71 2009-11-01 7081
72 2009-12-01 12496
73 2010-01-01 11059
74 2010-02-01 8973
75 2010-03-01 9762
76 2010-04-01 7864
77 2010-05-01 9399
78 2010-06-01 10431
79 2010-07-01 9840
80 2010-08-01 9583
81 2010-09-01 8324
82 2010-10-01 8498
83 2010-11-01 8067
84 2010-12-01 11526
85 2004-01-01 1717
86 2004-02-01 1599
87 2004-03-01 1327
88 2004-04-01 1350
89 2004-05-01 1304
90 2004-06-01 1697
91 2004-07-01 1398
92 2004-08-01 1259
93 2004-09-01 1033
94 2004-10-01 1176
95 2004-11-01 1084
96 2004-12-01 1146
97 2005-01-01 1206
98 2005-02-01 1154
99 2005-03-01 1541
100 2005-04-01 1348
101 2005-05-01 1408
102 2005-06-01 1625
103 2005-07-01 1906
104 2005-08-01 1726
105 2005-09-01 1236
106 2005-10-01 1443
107 2005-11-01 1286
108 2005-12-01 1629
109 2006-01-01 1461
110 2006-02-01 1388
111 2006-03-01 2049
112 2006-04-01 1522
113 2006-05-01 1305
114 2006-06-01 1411
115 2006-07-01 1530
116 2006-08-01 1733
117 2006-09-01 1421
118 2006-10-01 1757
119 2006-11-01 1790
120 2006-12-01 2252
121 2007-01-01 2046
122 2007-02-01 1922
123 2007-03-01 2331
124 2007-04-01 1583
125 2007-05-01 1601
126 2007-06-01 2163
127 2007-07-01 2529
128 2007-08-01 2013
129 2007-09-01 2064
130 2007-10-01 2069
131 2007-11-01 2086
132 2007-12-01 1962
133 2008-01-01 1795
134 2008-02-01 1273
135 2008-03-01 1511
136 2008-04-01 2449
137 2008-05-01 2696
138 2008-06-01 2618
139 2008-07-01 2791
140 2008-08-01 2121
141 2008-09-01 1428
142 2008-10-01 1556
143 2008-11-01 1532
144 2008-12-01 1803
145 2009-01-01 1303
146 2009-02-01 1389
147 2009-03-01 1323
148 2009-04-01 1300
149 2009-05-01 1251
150 2009-06-01 1381
151 2009-07-01 1573
152 2009-08-01 1604
153 2009-09-01 1313
154 2009-10-01 1319
155 2009-11-01 1140
156 2009-12-01 1179
157 2010-01-01 1326
158 2010-02-01 1200
159 2010-03-01 1180
160 2010-04-01 1076
161 2010-05-01 1264
162 2010-06-01 1360
163 2010-07-01 1386
164 2010-08-01 1283
165 2010-09-01 1912
166 2010-10-01 2265
167 2010-11-01 2020
168 2010-12-01 2705
169 2004-01-01 25015
170 2004-02-01 16660
171 2004-03-01 19318
172 2004-04-01 15638
173 2004-05-01 19302
174 2004-06-01 21892
175 2004-07-01 26666
176 2004-08-01 25510
177 2004-09-01 13305
178 2004-10-01 17736
179 2004-11-01 15812
180 2004-12-01 32458
181 2005-01-01 25861
182 2005-02-01 18647
183 2005-03-01 22264
184 2005-04-01 14262
185 2005-05-01 19977
186 2005-06-01 28024
187 2005-07-01 23513
188 2005-08-01 21000
189 2005-09-01 14138
190 2005-10-01 16628
191 2005-11-01 15254
192 2005-12-01 29235
193 2006-01-01 23232
194 2006-02-01 18551
195 2006-03-01 22246
196 2006-04-01 18019
197 2006-05-01 19996
198 2006-06-01 27588
199 2006-07-01 30325
200 2006-08-01 39123
201 2006-09-01 37039
202 2006-10-01 35640
203 2006-11-01 28896
204 2006-12-01 40483
205 2007-01-01 41787
206 2007-02-01 34581
207 2007-03-01 33920
208 2007-04-01 25667
209 2007-05-01 25524
210 2007-06-01 31242
211 2007-07-01 30356
212 2007-08-01 29331
213 2007-09-01 18033
214 2007-10-01 20147
215 2007-11-01 16927
216 2007-12-01 33269
217 2008-01-01 26113
218 2008-02-01 22059
219 2008-03-01 23932
220 2008-04-01 22994
221 2008-05-01 23217
222 2008-06-01 29690
223 2008-07-01 26604
224 2008-08-01 32827
225 2008-09-01 17551
226 2008-10-01 15429
227 2008-11-01 13138
228 2008-12-01 29803
229 2009-01-01 19653
230 2009-02-01 12627
231 2009-03-01 16285
232 2009-04-01 13517
233 2009-05-01 15083
234 2009-06-01 22844
235 2009-07-01 19259
236 2009-08-01 18646
237 2009-09-01 11270
238 2009-10-01 14513
239 2009-11-01 9814
240 2009-12-01 22845
241 2010-01-01 17307
242 2010-02-01 13269
243 2010-03-01 14782
244 2010-04-01 11121
245 2010-05-01 11947
246 2010-06-01 15784
247 2010-07-01 14309
248 2010-08-01 14099
249 2010-09-01 9435
250 2010-10-01 9565
251 2010-11-01 8597
252 2010-12-01 14415
> head(laprakkomstat$Baggage)
[1] 12502 8977 10289 8095 10618 13684
Perintah untuk membuat deret waktu waktu dari jumlah total pengaduan kerusakan bagasi oleh pelanggan sejak tahun 2004 hingga 2024 dengan frekuensi bulanan.
> bagasi <- ts(laprakkomstat$Baggage, start = 2004, frequency = 12)
> bagasi
Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
2004 12502 8977 10289 8095 10618 13684 14121 12732 7895 9444 9582 17555
2005 15361 9561 13002 11071 12300 16373 19701 16666 12636 14258 14440 24696
2006 19255 17319 20344 19726 21248 22767 23184 27630 25922 24699 18954 28556
2007 24190 20753 21928 19483 19209 26213 24993 23156 14816 15351 13946 23762
2008 17507 15795 17782 14566 13522 15620 12885 12148 8729 9110 7591 15475
2009 10231 7538 10093 10547 10279 13220 11625 10832 7052 10000 7081 12496
2010 11059 8973 9762 7864 9399 10431 9840 9583 8324 8498 8067 11526
2011 1717 1599 1327 1350 1304 1697 1398 1259 1033 1176 1084 1146
2012 1206 1154 1541 1348 1408 1625 1906 1726 1236 1443 1286 1629
2013 1461 1388 2049 1522 1305 1411 1530 1733 1421 1757 1790 2252
2014 2046 1922 2331 1583 1601 2163 2529 2013 2064 2069 2086 1962
2015 1795 1273 1511 2449 2696 2618 2791 2121 1428 1556 1532 1803
2016 1303 1389 1323 1300 1251 1381 1573 1604 1313 1319 1140 1179
2017 1326 1200 1180 1076 1264 1360 1386 1283 1912 2265 2020 2705
2018 25015 16660 19318 15638 19302 21892 26666 25510 13305 17736 15812 32458
2019 25861 18647 22264 14262 19977 28024 23513 21000 14138 16628 15254 29235
2020 23232 18551 22246 18019 19996 27588 30325 39123 37039 35640 28896 40483
2021 41787 34581 33920 25667 25524 31242 30356 29331 18033 20147 16927 33269
2022 26113 22059 23932 22994 23217 29690 26604 32827 17551 15429 13138 29803
2023 19653 12627 16285 13517 15083 22844 19259 18646 11270 14513 9814 22845
2024 17307 13269 14782 11121 11947 15784 14309 14099 9435 9565 8597 14415
Perintah membuat plot pada deret waktu dimana sumbu x adalah tahun dan sumbu y adalah jumlah total pengaduan bagasi.
> plot(bagasi, main = 'Jumlah Total Masalah Bagasi Maskapai dari Tahun 2004-2024',
+ ylab = "Baggage", xlab = "Date" )
##Stasioneritas Perintah untuk membuat transformasi Box-Cox pada deret waktu ‘bagasi’ diregresikan terhadap nilai konstan(1).
> boxcox(lm(bagasi~1))
Perintah untuk melakukan uji ADF pada deret waktu ‘bagasi’.
> adf.test(bagasi)
Augmented Dickey-Fuller Test
data: bagasi
Dickey-Fuller = -1.4757, Lag order = 6, p-value = 0.7965
alternative hypothesis: stationary
Perintah melakukan differensiasi pertama pada deret waktu “bagasi” dengan fungsi ‘diff()’ dan hasilnya akan disimpan pada variabel beda_jumlah.
> beda_jumlah <- diff(bagasi,1,1)
> beda_jumlah
Jan Feb Mar Apr May Jun Jul Aug Sep Oct
2004 -3525 1312 -2194 2523 3066 437 -1389 -4837 1549
2005 -2194 -5800 3441 -1931 1229 4073 3328 -3035 -4030 1622
2006 -5441 -1936 3025 -618 1522 1519 417 4446 -1708 -1223
2007 -4366 -3437 1175 -2445 -274 7004 -1220 -1837 -8340 535
2008 -6255 -1712 1987 -3216 -1044 2098 -2735 -737 -3419 381
2009 -5244 -2693 2555 454 -268 2941 -1595 -793 -3780 2948
2010 -1437 -2086 789 -1898 1535 1032 -591 -257 -1259 174
2011 -9809 -118 -272 23 -46 393 -299 -139 -226 143
2012 60 -52 387 -193 60 217 281 -180 -490 207
2013 -168 -73 661 -527 -217 106 119 203 -312 336
2014 -206 -124 409 -748 18 562 366 -516 51 5
2015 -167 -522 238 938 247 -78 173 -670 -693 128
2016 -500 86 -66 -23 -49 130 192 31 -291 6
2017 147 -126 -20 -104 188 96 26 -103 629 353
2018 22310 -8355 2658 -3680 3664 2590 4774 -1156 -12205 4431
2019 -6597 -7214 3617 -8002 5715 8047 -4511 -2513 -6862 2490
2020 -6003 -4681 3695 -4227 1977 7592 2737 8798 -2084 -1399
2021 1304 -7206 -661 -8253 -143 5718 -886 -1025 -11298 2114
2022 -7156 -4054 1873 -938 223 6473 -3086 6223 -15276 -2122
2023 -10150 -7026 3658 -2768 1566 7761 -3585 -613 -7376 3243
2024 -5538 -4038 1513 -3661 826 3837 -1475 -210 -4664 130
Nov Dec
2004 138 7973
2005 182 10256
2006 -5745 9602
2007 -1405 9816
2008 -1519 7884
2009 -2919 5415
2010 -431 3459
2011 -92 62
2012 -157 343
2013 33 462
2014 17 -124
2015 -24 271
2016 -179 39
2017 -245 685
2018 -1924 16646
2019 -1374 13981
2020 -6744 11587
2021 -3220 16342
2022 -2291 16665
2023 -4699 13031
2024 -968 5818
Perintah membuat plot pada deret waktu “beda_jumlah” dimana sumbu x adalah tahun dan sumbu y adalah jumlah total pengaduan bagasi.
> plot(beda_jumlah, main = 'Jumlah Total Masalah Bagasi Maskapai dari Tahun 2004-2024',
+ ylab = "Baggage", xlab = "Date" )
Perintah untuk melakukan uji ADF pada deret waktu ‘beda_jumlah’.
> adf.test(beda_jumlah)
Augmented Dickey-Fuller Test
data: beda_jumlah
Dickey-Fuller = -5.1525, Lag order = 6, p-value = 0.01
alternative hypothesis: stationary
Perintah untuk membuat pola ACF dan PACF pada deret waktu ‘beda_jumlah’.
> acf(beda_jumlah)
> acf(beda_jumlah, type = "partial")
Perintah untuk menguji hipotesis statistik estimasi parameter 9 model ARIMA, yaitu ARIMA (4,1,1), ARIMA (4,1,0), ARIMA (3,1,1), ARIMA (3,1,0), ARIMA (2,1,1), ARIMA (2,1,0), ARIMA (1,1,1), ARIMA (1,1,0), dan ARIMA (0,1,1) pada data ‘Baggage’ dalam deret waktu ‘laprakkomstat’ menggunakan metode maximum likelihood.
> #ARIMA(4,1,1)
> fit.1 <- Arima(laprakkomstat$Baggage, order = c(4,1,1), method = "ML")
> coeftest(fit.1)
z test of coefficients:
Estimate Std. Error z value Pr(>|z|)
ar1 -0.354231 0.132201 -2.6795 0.0073735 **
ar2 -0.254594 0.075288 -3.3816 0.0007206 ***
ar3 -0.375069 0.066447 -5.6446 1.656e-08 ***
ar4 -0.256801 0.071530 -3.5901 0.0003305 ***
ma1 -0.117113 0.126796 -0.9236 0.3556766
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
> #ARIMA(4,1,0)
> fit.2 <- Arima(laprakkomstat$Baggage, order = c(4,1,0), method = "ML")
> coeftest(fit.2)
z test of coefficients:
Estimate Std. Error z value Pr(>|z|)
ar1 -0.460576 0.060541 -7.6077 2.790e-14 ***
ar2 -0.294416 0.062288 -4.7267 2.282e-06 ***
ar3 -0.398427 0.061975 -6.4288 1.286e-10 ***
ar4 -0.284783 0.060298 -4.7229 2.325e-06 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
> #ARIMA(3,1,1)
> fit.3 <- Arima(laprakkomstat$Baggage, order = c(3,1,1), method = "ML")
> coeftest(fit.3)
z test of coefficients:
Estimate Std. Error z value Pr(>|z|)
ar1 -0.019401 0.100223 -0.1936 0.84651
ar2 -0.119006 0.067443 -1.7645 0.07764 .
ar3 -0.284926 0.064541 -4.4147 1.012e-05 ***
ma1 -0.418144 0.089764 -4.6583 3.189e-06 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
> #ARIMA(3,1,0)
> fit.4 <- Arima(laprakkomstat$Baggage, order = c(3,1,0), method = "ML")
> coeftest(fit.4)
z test of coefficients:
Estimate Std. Error z value Pr(>|z|)
ar1 -0.377829 0.060531 -6.2419 4.322e-10 ***
ar2 -0.228340 0.063269 -3.6090 0.0003074 ***
ar3 -0.290955 0.060253 -4.8289 1.373e-06 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
> #ARIMA(2,1,1)
> fit.5 <- Arima(laprakkomstat$Baggage, order = c(2,1,1), method = "ML")
> coeftest(fit.5)
z test of coefficients:
Estimate Std. Error z value Pr(>|z|)
ar1 0.218256 0.101310 2.1543 0.03121 *
ar2 -0.059055 0.074880 -0.7887 0.43031
ma1 -0.648283 0.080995 -8.0039 1.205e-15 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
> #ARIMA(2,1,0)
> fit.6 <- Arima(laprakkomstat$Baggage, order = c(2,1,0), method = "ML")
> coeftest(fit.6)
z test of coefficients:
Estimate Std. Error z value Pr(>|z|)
ar1 -0.339285 0.062763 -5.4058 6.451e-08 ***
ar2 -0.129450 0.062622 -2.0672 0.03872 *
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
> #ARIMA(1,1,1)
> fit.7 <- Arima(laprakkomstat$Baggage, order = c(1,1,1), method = "ML")
> coeftest(fit.7)
z test of coefficients:
Estimate Std. Error z value Pr(>|z|)
ar1 0.244941 0.096480 2.5388 0.01112 *
ma1 -0.684507 0.065878 -10.3905 < 2e-16 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
> #ARIMA(1,1,0)
> fit.8 <- Arima(laprakkomstat$Baggage, order = c(1,1,0), method = "ML")
> coeftest(fit.8)
z test of coefficients:
Estimate Std. Error z value Pr(>|z|)
ar1 -0.300352 0.060354 -4.9765 6.475e-07 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
> #ARIMA(0,1,1)
> fit.9 <- Arima(laprakkomstat$Baggage, order = c(0,1,1), method = "ML")
> coeftest(fit.9)
z test of coefficients:
Estimate Std. Error z value Pr(>|z|)
ma1 -0.532709 0.062123 -8.575 < 2.2e-16 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Perintah untuk menyusun data frame bernama ‘aic.model’ dari 9 model ARIMA berdasarkan nilai AIC.
> aic.model <- data.frame(Nama=c("fit.1", "fit.2", "fit.3", "fit.4",
+ "fit.5", "fit.6", "fit.7", "fit.8",
+ "fit.9"),
+ Model=c("ARIMA (4,1,1)", "ARIMA (4,1,0)",
+ "ARIMA (3,1,1)", "ARIMA (3,1,0)",
+ "ARIMA (2,1,1)", "ARIMA (2,1,0)",
+ "ARIMA (1,1,1)", "ARIMA (1,1,0)",
+ "ARIMA (0,1,1)"),
+ AIC=c(fit.1$aic, fit.2$aic, fit.3$aic,
+ fit.4$aic, fit.5$aic, fit.6$aic,
+ fit.7$aic, fit.8$aic, fit.9$aic))
> aic.model
Nama Model AIC
1 fit.1 ARIMA (4,1,1) 4877.495
2 fit.2 ARIMA (4,1,0) 4876.276
3 fit.3 ARIMA (3,1,1) 4884.781
4 fit.4 ARIMA (3,1,0) 4895.587
5 fit.5 ARIMA (2,1,1) 4898.326
6 fit.6 ARIMA (2,1,0) 4915.839
7 fit.7 ARIMA (1,1,1) 4896.924
8 fit.8 ARIMA (1,1,0) 4918.076
9 fit.9 ARIMA (0,1,1) 4901.350
Perintah untuk melakukan diagnosis terhadap residual dari fit.2
> checkresiduals(fit.2)
Ljung-Box test
data: Residuals from ARIMA(4,1,0)
Q* = 24.986, df = 6, p-value = 0.0003435
Model df: 4. Total lags used: 10
Perintah untuk melakukan peramalan Baggage dari deret waktu ‘laprakkomstat’ dengan model ‘fit.2’ dan hasil ramalan dalam periode 12 bulan mendatang kemudian disimpan pada variabel ‘forecast’ serta membuat plotnya.
> forecast <- forecast(laprakkomstat$Baggage, model=fit.2, h=12)
> forecast
Point Forecast Lo 80 Hi 80 Lo 95 Hi 95
253 13296.80 8234.970 18358.62 5555.40083 21038.19
254 12447.56 6696.250 18198.87 3651.69203 21243.42
255 11125.53 4926.186 17324.88 1644.44896 20606.62
256 10773.11 4463.315 17082.91 1123.11109 20423.11
257 11981.46 5537.156 18425.76 2125.74804 21837.17
258 12297.26 5416.017 19178.50 1773.30680 22821.21
259 12312.96 5012.740 19613.18 1148.23878 23477.68
260 11831.68 4155.726 19507.63 92.32365 23571.03
261 11578.78 3667.020 19490.54 -521.21278 23678.77
262 11740.77 3621.912 19859.62 -675.94915 24157.48
263 11927.90 3561.800 20294.00 -866.94704 24722.75
264 12031.84 3392.367 20671.32 -1181.09436 25244.78
> plot(forecast)
Visualisasi data dilakukan dengan membentuk plot untuk data Baggage dalam deret waktu ‘laprakkomstat’ dengan jumlah total pengaduan bagasi sebagai sumbu x dan waktu sebagai tahun.
\[ \begin{align*} \text{Hipotesis :}\\ H_{0} &= Data\phantom(tidak\phantom(stasioner\\ H_{1} &= Data\phantom(stasioner \end{align*} \] Daerah kritis : P-value < \(\alpha\) maka tolak \(H_{0}\) Statistik Uji : P-value = 0.7965 Keputusan : Nilai p-value (0.7965) > \(\alpha\) (0.05), maka terima \(H_{0}\) Kesimpulan : Dengan taraf nyata 5%, dapat disimpulkan bahwa data tidak stasioner. Maka perlu dilakukan differencing agar data stasioner.
Hipotesis : \[ H_{0} = Data\phantom(Tidak\phantom(Stasioner \\ H_{1} = Data\phantom(stasioner \]
Daerah kritis : P-value < \(\alpha\) maka tolak \(H_{0}\) Statistik Uji : P-value = 0.01 Keputusan : Nilai p-value (0.01) < \(\alpha\) (0.05), maka tolak \(H_{0}\) Kesimpulan : Dengan taraf nyata 5%, dapat disimpulkan bahwa data stasioner.
> acf(beda_jumlah)
> acf(beda_jumlah, type = "partial")
Berdasarkan korelogram, batang ACF keluar hingga lag ke-4 sehingga orde
MA, q=4. Sedangkan, batang PACF pada lag ke-1 sehingga orde AR, p=1.
Sebelumnya telah dilakukan diferencing orde 1 sehingga d=1. Dengan
demikian, didapatkan mode ARIMA(4,1,1).
Estimasi parameter dilakukan dengan overfitting terhadap model dengan memilih model yang memiliki orde paling rendah dari orde pertama sehingga didapatkan model :
ARIMA (4,1,1)
ARIMA (4,1,0)
ARIMA (3,1,1)
ARIMA (3,1,0)
ARIMA (2,1,1)
ARIMA (2,1,0)
ARIMA (1,1,1)
ARIMA (1,1,0)
ARIMA (0,1,1)
> aic.model <- data.frame(Nama=c("fit.1", "fit.2", "fit.3", "fit.4",
+ "fit.5", "fit.6", "fit.7", "fit.8",
+ "fit.9"),
+ Model=c("ARIMA (4,1,1)", "ARIMA (4,1,0)",
+ "ARIMA (3,1,1)", "ARIMA (3,1,0)",
+ "ARIMA (2,1,1)", "ARIMA (2,1,0)",
+ "ARIMA (1,1,1)", "ARIMA (1,1,0)",
+ "ARIMA (0,1,1)"),
+ AIC=c(fit.1$aic, fit.2$aic, fit.3$aic,
+ fit.4$aic, fit.5$aic, fit.6$aic,
+ fit.7$aic, fit.8$aic, fit.9$aic))
> aic.model
Nama Model AIC
1 fit.1 ARIMA (4,1,1) 4877.495
2 fit.2 ARIMA (4,1,0) 4876.276
3 fit.3 ARIMA (3,1,1) 4884.781
4 fit.4 ARIMA (3,1,0) 4895.587
5 fit.5 ARIMA (2,1,1) 4898.326
6 fit.6 ARIMA (2,1,0) 4915.839
7 fit.7 ARIMA (1,1,1) 4896.924
8 fit.8 ARIMA (1,1,0) 4918.076
9 fit.9 ARIMA (0,1,1) 4901.350
Berdasarkan hasil output Rstudio didapatkan nilai AIC yang paling kecil pada model ARIMA(4,1,0). Dengan demikian, ARIMA(4,1,0) yang menjadi model terbaik.
Hipotesis : \[ H_{0} = k=0\phantom((tidak\phantom(ada\phantom(atokorelasi\phantom(residual\phantom(antar\phantom(lag) \\ H_{1} = minimal\phantom(ada\phantom(satu\phantom(k\neq 0\phantom((ada\phantom(autotokorelasi\phantom(residual\phantom(antar\phantom(lag) \\ \]
Taraf Signifikansi : \(\alpha\) = 0.05 Keputusan : Nilai p-value (0.0003435) < \(\alpha\) (0.05), maka tolak \(H_{0}\) Kesimpulan : Dengan taraf nyata 5%, dapat disimpulkan bahwa tidak ada autokorelasi resdiual antar lag atau model ARIMA(4,1,0) residualnya tidak berkorelasi
Hasil peramalan yang diperoleh adalah sebagai berikut.
> forecast <- forecast(laprakkomstat$Baggage, model=fit.2, h=12)
> forecast
Point Forecast Lo 80 Hi 80 Lo 95 Hi 95
253 13296.80 8234.970 18358.62 5555.40083 21038.19
254 12447.56 6696.250 18198.87 3651.69203 21243.42
255 11125.53 4926.186 17324.88 1644.44896 20606.62
256 10773.11 4463.315 17082.91 1123.11109 20423.11
257 11981.46 5537.156 18425.76 2125.74804 21837.17
258 12297.26 5416.017 19178.50 1773.30680 22821.21
259 12312.96 5012.740 19613.18 1148.23878 23477.68
260 11831.68 4155.726 19507.63 92.32365 23571.03
261 11578.78 3667.020 19490.54 -521.21278 23678.77
262 11740.77 3621.912 19859.62 -675.94915 24157.48
263 11927.90 3561.800 20294.00 -866.94704 24722.75
264 12031.84 3392.367 20671.32 -1181.09436 25244.78
> plot(forecast)
Plot ARIMA(4,1,0) menunjukkan tidak adanya tren karena tidak terdapat
pola yang kompleks yang menunjukkan pola naik/turun.Model ARIMA(4,1,0)
sudah cukup baik dalam menangkap pola acak dalam data tetapi tidak cukup
baik untuk menangkap tren yang lebih kompleks.
Garis hitam merupakan data historis.
Garis biru merupakan nilai peramalan.
Area berwarna abu-abu/biru untuk prediksi 80% dan 95.
Lebarnya kipas interval prediksi mencerminkan ketidakpastian yang meningkat seiring dengan prediksi yang semakin jauh ke depan.
Dari analisis deret waktu yang telah dilakukan, dapat disimpulkan bahwa jumlah total pengaduan kerusakan bagasi oleh pelanggan diprediksi mengalami penurunan dan kenaikan yang berulang pada interval tertentu. Dalam beberapa waktu tertentu, jumlah total pengaduan kerusakan bagasi menurun berarti bahwa bagasi maskapai mengalami minimum kerusakan. Namun setelah itu, terjadi peningkatan yang signifikan kemudian menurun secara perlahan. Hal ini menunjukkan bahwa kasus jumlah total pengaduan bagasi oleh pelanggan termasuk data deret waktu musiman.
Karena data terdeteksi musimaan maka perlu dilakukan metode analisis deret waktu lebih lanjut dengan metode Simple Exponential Smoothing atau Holt Winters Seasonal Model guna mendapatkan prediksi semakin akurat.
Maulana, H. A., 2018. Pemodelan Deret Waktu dan Peramalan Curah Hujan Pada Dua Belas Stasiun di Bogor. Jurnal Matematika, Statistika, & Komputasi, 15(1), pp. 52-53.
Harjati, L. & Venesia, Y., 2015. Pengaruh Kualitas Layanan dan Persepsi Harga Terhadap Kepuasan Pelanggan Pada Maskapai Penerbangan Tiger Air Mandala. E-Journal WIDYA Ekonomika, 1(1), p. 65.
Annisa, A., 2022. Penerapan Metode SARIMA (Seasonal Autoregressive Integrated Moving Average) dalam Memprediksi Produksi Tebu di Indonesia. [Online] Available at: https://rstudio-pubs-static.s3.amazonaws.com/905379_ad8bb0274f144224b3e508d426a13de1.html [Accessed 01 06 2024].
Halim, V. W., 2024. Analisis Deret Waktu. [Online] Available at: https://rpubs.com/vionawh/1190617 [Accessed 01 06 2024].
Wibisono, A. R., 2022. Tugas 2 Individu - Metode Permalan Deret Waktu. [Online] Available at: https://rpubs.com/akmalrizaw/regresilag-timeseries [Accessed 01 06 2024].
Fernandes. A.A. et al [PowerPoint Pertemuan 12 Komputasi Statistika]. [Brone]. (https://brone.ub.ac.id/course/view.php?id=2818) [Accessed 30 05 2024].
Redi, Aqsa Y., Nobby Nugraha P. dan Almira Rha Anni D. [PowerPoint Praktikum Komstat-C Pengenalan Deret Waktu]. [Google Classroom]. (https://classroom.google.com/c/NjU5MzM4MTcxNzE0/m/Njc5NTgzODg4NDU0/details) [Accessed 30 05 2024].