library(tseries) # for ADF test
library(forecast)# auto.arima

Intro of Math

data(AirPassengers)      # load
class(AirPassengers)

[1] "ts"

summary(AirPassengers)

   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  104.0   180.0   265.5   280.3   360.5   622.0

start(AirPassengers)     # like head(xxx, 1)

[1] 1949    1

end(AirPassengers)

[1] 1960   12

frequency(AirPassengers) # The cycle of this time series: 12

[1] 12

AirPassengers            # displayed as matrix / table due to frequency, but actually 1-dim

     Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
1949 112 118 132 129 121 135 148 148 136 119 104 118
1950 115 126 141 135 125 149 170 170 158 133 114 140
1951 145 150 178 163 172 178 199 199 184 162 146 166
1952 171 180 193 181 183 218 230 242 209 191 172 194
1953 196 196 236 235 229 243 264 272 237 211 180 201
1954 204 188 235 227 234 264 302 293 259 229 203 229
1955 242 233 267 269 270 315 364 347 312 274 237 278
1956 284 277 317 313 318 374 413 405 355 306 271 306
1957 315 301 356 348 355 422 465 467 404 347 305 336
1958 340 318 362 348 363 435 491 505 404 359 310 337
1959 360 342 406 396 420 472 548 559 463 407 362 405
1960 417 391 419 461 472 535 622 606 508 461 390 432

plot(AirPassengers)
linearModel = lm(AirPassengers ~ time(AirPassengers))
abline(reg = linearModel) # fit in a Linear Model (Intercept & Slope), and plot the line

# OBS: Those 3 actions should be done TOGETHER in a chunk /* cuz abline() needs the plot as canvas.  */

cycle(AirPassengers) # the cycle across years.

     Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
1949   1   2   3   4   5   6   7   8   9  10  11  12
1950   1   2   3   4   5   6   7   8   9  10  11  12
1951   1   2   3   4   5   6   7   8   9  10  11  12
1952   1   2   3   4   5   6   7   8   9  10  11  12
1953   1   2   3   4   5   6   7   8   9  10  11  12
1954   1   2   3   4   5   6   7   8   9  10  11  12
1955   1   2   3   4   5   6   7   8   9  10  11  12
1956   1   2   3   4   5   6   7   8   9  10  11  12
1957   1   2   3   4   5   6   7   8   9  10  11  12
1958   1   2   3   4   5   6   7   8   9  10  11  12
1959   1   2   3   4   5   6   7   8   9  10  11  12
1960   1   2   3   4   5   6   7   8   9  10  11  12

t = aggregate(AirPassengers,FUN=mean)
t

Time Series:
Start = 1949 
End = 1960 
Frequency = 1 
 [1] 126.6667 139.6667 170.1667 197.0000 225.0000 238.9167 284.0000 328.2500 368.4167 381.0000 428.3333 476.1667

plot(t) # aggregate the cycles and display a year on year trend.

# the year on year trend clearly shows the incremental pattern.

boxplot(AirPassengers ~ cycle(AirPassengers)) # plot across months, a sense on seasonal effect

acf & pacf

ACF: Auto-correlation Function, aka Total Correlation Chart.

ACF is a plot of total correlation between different lag functions.

PACF: partial auto-correlation function.

apNum = as.numeric(AirPassengers)
apDiff = diff(AirPassengers, differences = 1)
op = par(mfrow=c(1,2))  # start multi plot
acf(apDiff, plot = T)
pacf(apDiff, plot = T)

# both titles are "Series apDiff"
par(op)                 # stop mulit plot

# OBS: this is just example, cuz apDiff is not stationary series.
# OBS: to see the real lag as integers, use the variable apNum instead of AirPassengers.

ARIMA Steps

ARIMA is introduced by Box and Jenkins in 1970s.

step 1 - visualization

plot(AirPassengers)

We can see:

yearly growth trend
yearly variance groth trend
seasonality with a 12 months cycle

step 2 - stationarization

detrending:

For $x(t) = (mean + trend * t) + error$, discard the $(mean + trend * t)$ part.

differencing:

This differencing is called Integration in AR(I)MA.

Three parameters: $ p: AR. d: I. q: MA $

seasonality:

Can also be seen from ACF/PACF.

See the manual arima() part below.

example:

To stationarize the series,

for yearly groth: differencing;

for yearly variance groth: log;

for seasonality: ?????

Test:

adf.test(diff(log(AirPassengers)), alternative="stationary", k=0)

p-value smaller than printed p-value


    Augmented Dickey-Fuller Test

data:  diff(log(AirPassengers))
Dickey-Fuller = -9.6003, Lag order = 0, p-value = 0.01
alternative hypothesis: stationary

ADF test’s NULL-hypothesis: NOT stationary.

The result tells that the alternative hypothesis (stationary) is choosen, which means our strategy (log + diff) is right.

??? problem: it seems that even the original series is stationary according to ADF test, which should not be true. ???

Warn The series that we are using is now a log-ed series, which will be feeded into SARIMA model.

plot(diff(log(AirPassengers)))

step 3 - parameter optimization

Parameter values $p,d,q$ can be found using ACF and PACF.

If d = 0:

acf(log(apNum))

If both ACF and PACF decreases gradually (hard to see cut-off), we need more stationary by introducing $d$.

The decay of ACF chart is very slow, which means that the population is not stationary.

If d = 1:

acf(diff(log(apNum)))

After adding $d$, ARIMA model becomes ARMA model.

pacf(diff(log(apNum)))

??? Clearly, ACF plot cuts off after the first lag. Hence, we understood that value of p should be 0 as the ACF is the curve getting a cut off. While value of q should be 1 or 2. After a few iterations, we found that (0,1,1) as (p,d,q) comes out to be the combination with least AIC and BIC. ???

step 4 - building arima model

Based on previous section, we explore more $(p,d,q)$ combinations.

The one with the lowest BIC (Bayesian Information Criterion, aka Schwarz Criterion, SBC, SBIC) and AIC (Akaike Information Critera) should be our choice.

auto (original):

autoArimaModel = auto.arima(AirPassengers, d = 1)
autoArimaModel

Series: AirPassengers 
ARIMA(0,1,1)(0,1,0)[12]                    

Coefficients:
          ma1
      -0.3184
s.e.   0.0877

sigma^2 estimated as 138.3:  log likelihood=-508.32
AIC=1020.64   AICc=1020.73   BIC=1026.39

auto (log-ed):

autoArimaModelLog = auto.arima(log(AirPassengers), d = 1)
autoArimaModelLog

Series: log(AirPassengers) 
ARIMA(0,1,1)(0,1,1)[12]                    

Coefficients:
          ma1     sma1
      -0.4018  -0.5569
s.e.   0.0896   0.0731

sigma^2 estimated as 0.001371:  log likelihood=244.7
AIC=-483.4   AICc=-483.21   BIC=-474.77

manual:

pdqParam = c(0, 1, 1)
manualFit <- arima(log(AirPassengers), pdqParam, seasonal = list(order = pdqParam, period = 12))

manualFit


Call:
arima(x = log(AirPassengers), order = pdqParam, seasonal = list(order = pdqParam, 
    period = 12))

Coefficients:
          ma1     sma1
      -0.4018  -0.5569
s.e.   0.0896   0.0731

sigma^2 estimated as 0.001348:  log likelihood = 244.7,  aic = -483.4

step 5 - predict & test

auto (original):

autoPred = forecast(autoArimaModel, h=25)
plot(autoPred)

auto (log-ed):

autoPred = forecast(autoArimaModelLog, h=25)
autoPred$mean       = exp(autoPred$mean)
autoPred$lower      = exp(autoPred$lower)
autoPred$upper      = exp(autoPred$upper)
autoPred$x          = exp(autoPred$x)
autoPred$fitted     = exp(autoPred$fitted)
autoPred$residuals  = exp(autoPred$residuals)
plot(autoPred)

manual:

manualPred <- predict(manualFit, n.ahead = 25)
ts.plot(AirPassengers, exp(manualPred$pred), log = "y", lty = c(1,3))

test:

Ljung-Box test is NOT suitable to validate the model, cuz LB test requires:

stationarity.
white noise process has a normal distribution with mean zero.

Box.test(autoArimaModel$resid,type="Ljung-Box")


    Box-Ljung test

data:  autoArimaModel$resid
X-squared = 0.0045141, df = 1, p-value = 0.9464

LS0tDQp0aXRsZTogIlNBUklNQSBmb3IgVGltZSBTZXJpZXMiDQpvdXRwdXQ6DQogIGh0bWxfbm90ZWJvb2s6DQogICAgaGlnaGxpZ2h0OiBoYWRkb2NrDQogICAgdGhlbWU6IGNlcnVsZWFuDQogICAgdG9jOiB5ZXMNCi0tLQ0KW09yaWdpbiByZWZdKGh0dHA6Ly93d3cuZXZlcm5vdGUuY29tL2wvQUpEWDRtQlBjU1pMeGFJbE1EREE0YVNuR1M2WGdyUmVPU3cvKQ0KDQpgYGB7ciwgbWVzc2FnZT1GQUxTRSwgd2FybmluZz1GQUxTRX0NCmxpYnJhcnkodHNlcmllcykgIyBmb3IgQURGIHRlc3QNCmxpYnJhcnkoZm9yZWNhc3QpIyBhdXRvLmFyaW1hDQpgYGANCg0KDQojIEludHJvIG9mIE1hdGgNCg0KYGBge3J9DQpkYXRhKEFpclBhc3NlbmdlcnMpICAgICAgIyBsb2FkDQpjbGFzcyhBaXJQYXNzZW5nZXJzKQ0Kc3VtbWFyeShBaXJQYXNzZW5nZXJzKQ0KYGBgDQoNCmBgYHtyfQ0Kc3RhcnQoQWlyUGFzc2VuZ2VycykgICAgICMgbGlrZSBoZWFkKHh4eCwgMSkNCmVuZChBaXJQYXNzZW5nZXJzKQ0KYGBgDQoNCmBgYHtyfQ0KZnJlcXVlbmN5KEFpclBhc3NlbmdlcnMpICMgVGhlIGN5Y2xlIG9mIHRoaXMgdGltZSBzZXJpZXM6IDEyDQpBaXJQYXNzZW5nZXJzICAgICAgICAgICAgIyBkaXNwbGF5ZWQgYXMgbWF0cml4IC8gdGFibGUgZHVlIHRvIGZyZXF1ZW5jeSwgYnV0IGFjdHVhbGx5IDEtZGltDQpgYGANCg0KYGBge3J9DQpwbG90KEFpclBhc3NlbmdlcnMpDQpsaW5lYXJNb2RlbCA9IGxtKEFpclBhc3NlbmdlcnMgfiB0aW1lKEFpclBhc3NlbmdlcnMpKQ0KYWJsaW5lKHJlZyA9IGxpbmVhck1vZGVsKSAjIGZpdCBpbiBhIExpbmVhciBNb2RlbCAoSW50ZXJjZXB0ICYgU2xvcGUpLCBhbmQgcGxvdCB0aGUgbGluZSANCiMgT0JTOiBUaG9zZSAzIGFjdGlvbnMgc2hvdWxkIGJlIGRvbmUgVE9HRVRIRVIgaW4gYSBjaHVuayAvKiBjdXogYWJsaW5lKCkgbmVlZHMgdGhlIHBsb3QgYXMgY2FudmFzLiAgKi8NCmBgYA0KDQoNCmBgYHtyfQ0KY3ljbGUoQWlyUGFzc2VuZ2VycykgIyB0aGUgY3ljbGUgYWNyb3NzIHllYXJzLg0KYGBgDQoNCmBgYHtyfQ0KdCA9IGFnZ3JlZ2F0ZShBaXJQYXNzZW5nZXJzLEZVTj1tZWFuKQ0KdA0KcGxvdCh0KSAjIGFnZ3JlZ2F0ZSB0aGUgY3ljbGVzIGFuZCBkaXNwbGF5IGEgeWVhciBvbiB5ZWFyIHRyZW5kLg0KIyB0aGUgeWVhciBvbiB5ZWFyIHRyZW5kIGNsZWFybHkgc2hvd3MgdGhlIGluY3JlbWVudGFsIHBhdHRlcm4uDQpgYGANCg0KYGBge3J9DQpib3hwbG90KEFpclBhc3NlbmdlcnMgfiBjeWNsZShBaXJQYXNzZW5nZXJzKSkgIyBwbG90IGFjcm9zcyBtb250aHMsIGEgc2Vuc2Ugb24gc2Vhc29uYWwgZWZmZWN0DQpgYGANCg0KIyMgYWNmICYgcGFjZg0KQUNGOiBBdXRvLWNvcnJlbGF0aW9uIEZ1bmN0aW9uLCBha2EgVG90YWwgQ29ycmVsYXRpb24gQ2hhcnQuDQoNCkFDRiBpcyBhIHBsb3Qgb2YgdG90YWwgY29ycmVsYXRpb24gYmV0d2VlbiBkaWZmZXJlbnQgbGFnIGZ1bmN0aW9ucy4NCg0KUEFDRjogcGFydGlhbCBhdXRvLWNvcnJlbGF0aW9uIGZ1bmN0aW9uLg0KDQpgYGB7cn0NCmFwTnVtID0gYXMubnVtZXJpYyhBaXJQYXNzZW5nZXJzKQ0KYXBEaWZmID0gZGlmZihBaXJQYXNzZW5nZXJzLCBkaWZmZXJlbmNlcyA9IDEpDQoNCm9wID0gcGFyKG1mcm93PWMoMSwyKSkgICMgc3RhcnQgbXVsdGkgcGxvdA0KYWNmKGFwRGlmZiwgcGxvdCA9IFQpDQpwYWNmKGFwRGlmZiwgcGxvdCA9IFQpDQojIGJvdGggdGl0bGVzIGFyZSAiU2VyaWVzIGFwRGlmZiINCnBhcihvcCkgICAgICAgICAgICAgICAgICMgc3RvcCBtdWxpdCBwbG90DQoNCiMgT0JTOiB0aGlzIGlzIGp1c3QgZXhhbXBsZSwgY3V6IGFwRGlmZiBpcyBub3Qgc3RhdGlvbmFyeSBzZXJpZXMuDQojIE9CUzogdG8gc2VlIHRoZSByZWFsIGxhZyBhcyBpbnRlZ2VycywgdXNlIHRoZSB2YXJpYWJsZSBhcE51bSBpbnN0ZWFkIG9mIEFpclBhc3NlbmdlcnMuDQpgYGANCg0KIyBBUklNQSBTdGVwcw0KQVJJTUEgaXMgaW50cm9kdWNlZCBieSBCb3ggYW5kIEplbmtpbnMgaW4gMTk3MHMuDQoNCiMjIHN0ZXAgMSAtIHZpc3VhbGl6YXRpb24NCmBgYHtyfQ0KcGxvdChBaXJQYXNzZW5nZXJzKQ0KYGBgDQpXZSBjYW4gc2VlOiANCg0KKiB5ZWFybHkgZ3Jvd3RoIHRyZW5kDQoNCiogeWVhcmx5IHZhcmlhbmNlIGdyb3RoIHRyZW5kDQoNCiogc2Vhc29uYWxpdHkgd2l0aCBhIDEyIG1vbnRocyBjeWNsZQ0KDQojIyBzdGVwIDIgLSBzdGF0aW9uYXJpemF0aW9uDQoNCiMjIyBkZXRyZW5kaW5nOg0KRm9yICR4KHQpID0gKG1lYW4gKyB0cmVuZCAqIHQpICsgZXJyb3IkLCBkaXNjYXJkIHRoZSAkKG1lYW4gKyB0cmVuZCAqIHQpJCBwYXJ0LiANCg0KIyMjIGRpZmZlcmVuY2luZzoNCg0KVGhpcyBkaWZmZXJlbmNpbmcgaXMgY2FsbGVkICoqSW50ZWdyYXRpb24qKiBpbiBBUihJKU1BLg0KDQpUaHJlZSBwYXJhbWV0ZXJzOg0KKiokIHA6IEFSLiBkOiBJLiBxOiBNQSAkKioNCg0KIyMjIHNlYXNvbmFsaXR5Og0KQ2FuIGFsc28gYmUgc2VlbiBmcm9tIEFDRi9QQUNGLg0KDQpTZWUgdGhlIG1hbnVhbCBhcmltYSgpIHBhcnQgYmVsb3cuDQoNCiMjIyBleGFtcGxlOg0KVG8gc3RhdGlvbmFyaXplIHRoZSBzZXJpZXMsDQoNCmZvciB5ZWFybHkgZ3JvdGg6IGRpZmZlcmVuY2luZzsNCg0KZm9yIHllYXJseSB2YXJpYW5jZSBncm90aDogbG9nOw0KDQpmb3Igc2Vhc29uYWxpdHk6ID8/Pz8/DQoNClRlc3Q6DQpgYGB7cn0NCmFkZi50ZXN0KGRpZmYobG9nKEFpclBhc3NlbmdlcnMpKSwgYWx0ZXJuYXRpdmU9InN0YXRpb25hcnkiLCBrPTApDQpgYGANCkFERiB0ZXN0J3MgTlVMTC1oeXBvdGhlc2lzOiBOT1Qgc3RhdGlvbmFyeS4NCg0KVGhlIHJlc3VsdCB0ZWxscyB0aGF0IHRoZSBhbHRlcm5hdGl2ZSBoeXBvdGhlc2lzIChzdGF0aW9uYXJ5KSBpcyBjaG9vc2VuLCB3aGljaCBtZWFucyBvdXIgc3RyYXRlZ3kgKGxvZyArIGRpZmYpIGlzIHJpZ2h0Lg0KDQo/Pz8gcHJvYmxlbTogaXQgc2VlbXMgdGhhdCBldmVuIHRoZSBvcmlnaW5hbCBzZXJpZXMgaXMgc3RhdGlvbmFyeSBhY2NvcmRpbmcgdG8gQURGIHRlc3QsIHdoaWNoIHNob3VsZCBub3QgYmUgdHJ1ZS4gPz8/DQoNCioqKldhcm4qKioNClRoZSBzZXJpZXMgdGhhdCB3ZSBhcmUgdXNpbmcgaXMgbm93IGEgbG9nLWVkIHNlcmllcywgd2hpY2ggd2lsbCBiZSBmZWVkZWQgaW50byBTQVJJTUEgbW9kZWwuDQoNCmBgYHtyfQ0KcGxvdChkaWZmKGxvZyhBaXJQYXNzZW5nZXJzKSkpDQpgYGANCg0KDQojIyBzdGVwIDMgLSBwYXJhbWV0ZXIgb3B0aW1pemF0aW9uDQpQYXJhbWV0ZXIgdmFsdWVzICRwLGQscSQgY2FuIGJlIGZvdW5kIHVzaW5nIEFDRiBhbmQgUEFDRi4NCg0KSWYgZCA9IDA6DQpgYGB7cn0NCmFjZihsb2coYXBOdW0pKQ0KYGBgDQpJZiBib3RoIEFDRiBhbmQgUEFDRiBkZWNyZWFzZXMgZ3JhZHVhbGx5IChoYXJkIHRvIHNlZSBjdXQtb2ZmKSwgd2UgbmVlZCBtb3JlIHN0YXRpb25hcnkgYnkgaW50cm9kdWNpbmcgJGQkLg0KDQpUaGUgZGVjYXkgb2YgQUNGIGNoYXJ0IGlzIHZlcnkgc2xvdywgd2hpY2ggbWVhbnMgdGhhdCB0aGUgcG9wdWxhdGlvbiBpcyBub3Qgc3RhdGlvbmFyeS4gDQoNCklmIGQgPSAxOg0KYGBge3J9DQphY2YoZGlmZihsb2coYXBOdW0pKSkNCmBgYA0KQWZ0ZXIgYWRkaW5nICRkJCwgQVJJTUEgbW9kZWwgYmVjb21lcyBBUk1BIG1vZGVsLg0KDQoNCmBgYHtyfQ0KcGFjZihkaWZmKGxvZyhhcE51bSkpKQ0KYGBgDQoNCg0KPz8/IA0KQ2xlYXJseSwgQUNGIHBsb3QgY3V0cyBvZmYgYWZ0ZXIgdGhlIGZpcnN0IGxhZy4gSGVuY2UsIHdlIHVuZGVyc3Rvb2QgdGhhdCB2YWx1ZSBvZiBwIHNob3VsZCBiZSAwIGFzIHRoZSBBQ0YgaXMgdGhlIGN1cnZlIGdldHRpbmcgYSBjdXQgb2ZmLiBXaGlsZSB2YWx1ZSBvZiBxIHNob3VsZCBiZSAxIG9yIDIuIEFmdGVyIGEgZmV3IGl0ZXJhdGlvbnMsIHdlIGZvdW5kIHRoYXQgKDAsMSwxKSBhcyAocCxkLHEpIGNvbWVzIG91dCB0byBiZSB0aGUgY29tYmluYXRpb24gd2l0aCBsZWFzdCBBSUMgYW5kIEJJQy4NCj8/Pw0KDQojIyBzdGVwIDQgLSBidWlsZGluZyBhcmltYSBtb2RlbA0KQmFzZWQgb24gcHJldmlvdXMgc2VjdGlvbiwgd2UgZXhwbG9yZSBtb3JlICQocCxkLHEpJCBjb21iaW5hdGlvbnMuDQoNClRoZSBvbmUgd2l0aCB0aGUgbG93ZXN0IEJJQyAoQmF5ZXNpYW4gSW5mb3JtYXRpb24gQ3JpdGVyaW9uLCBha2EgU2Nod2FyeiBDcml0ZXJpb24sIFNCQywgU0JJQykgYW5kIEFJQyAoQWthaWtlIEluZm9ybWF0aW9uIENyaXRlcmEpIHNob3VsZCBiZSBvdXIgY2hvaWNlLg0KDQojIyMgYXV0byAob3JpZ2luYWwpOg0KYGBge3IsIGNhY2hlPVRSVUV9DQphdXRvQXJpbWFNb2RlbCA9IGF1dG8uYXJpbWEoQWlyUGFzc2VuZ2VycywgZCA9IDEpDQphdXRvQXJpbWFNb2RlbA0KYGBgDQoNCiMjIyBhdXRvIChsb2ctZWQpOg0KYGBge3IsIGNhY2hlPVRSVUV9DQphdXRvQXJpbWFNb2RlbExvZyA9IGF1dG8uYXJpbWEobG9nKEFpclBhc3NlbmdlcnMpLCBkID0gMSkNCmF1dG9BcmltYU1vZGVsTG9nDQpgYGANCg0KIyMjIG1hbnVhbDoNCmBgYHtyLCBtZXNzYWdlPUZBTFNFfQ0KcGRxUGFyYW0gPSBjKDAsIDEsIDEpDQptYW51YWxGaXQgPC0gYXJpbWEobG9nKEFpclBhc3NlbmdlcnMpLCBwZHFQYXJhbSwgc2Vhc29uYWwgPSBsaXN0KG9yZGVyID0gcGRxUGFyYW0sIHBlcmlvZCA9IDEyKSkNCmBgYA0KYGBge3J9DQptYW51YWxGaXQNCmBgYA0KDQojIyBzdGVwIDUgLSBwcmVkaWN0ICYgdGVzdA0KDQojIyMgYXV0byAob3JpZ2luYWwpOg0KYGBge3J9DQphdXRvUHJlZCA9IGZvcmVjYXN0KGF1dG9BcmltYU1vZGVsLCBoPTI1KQ0KcGxvdChhdXRvUHJlZCkNCmBgYA0KDQojIyMgYXV0byAobG9nLWVkKToNCmBgYHtyfQ0KYXV0b1ByZWQgPSBmb3JlY2FzdChhdXRvQXJpbWFNb2RlbExvZywgaD0yNSkNCmF1dG9QcmVkJG1lYW4gICAgICAgPSBleHAoYXV0b1ByZWQkbWVhbikNCmF1dG9QcmVkJGxvd2VyICAgICAgPSBleHAoYXV0b1ByZWQkbG93ZXIpDQphdXRvUHJlZCR1cHBlciAgICAgID0gZXhwKGF1dG9QcmVkJHVwcGVyKQ0KYXV0b1ByZWQkeCAgICAgICAgICA9IGV4cChhdXRvUHJlZCR4KQ0KYXV0b1ByZWQkZml0dGVkICAgICA9IGV4cChhdXRvUHJlZCRmaXR0ZWQpDQphdXRvUHJlZCRyZXNpZHVhbHMgID0gZXhwKGF1dG9QcmVkJHJlc2lkdWFscykNCg0KcGxvdChhdXRvUHJlZCkNCmBgYA0KDQoNCiMjIyBtYW51YWw6DQpgYGB7cn0NCm1hbnVhbFByZWQgPC0gcHJlZGljdChtYW51YWxGaXQsIG4uYWhlYWQgPSAyNSkNCnRzLnBsb3QoQWlyUGFzc2VuZ2VycywgZXhwKG1hbnVhbFByZWQkcHJlZCksIGxvZyA9ICJ5IiwgbHR5ID0gYygxLDMpKQ0KYGBgDQoNCg0KIyMjIHRlc3Q6DQoNCkxqdW5nLUJveCB0ZXN0IGlzIE5PVCBzdWl0YWJsZSB0byB2YWxpZGF0ZSB0aGUgbW9kZWwsIGN1eiBMQiB0ZXN0IHJlcXVpcmVzOg0KDQoqIHN0YXRpb25hcml0eS4NCg0KKiB3aGl0ZSBub2lzZSBwcm9jZXNzIGhhcyBhIG5vcm1hbCBkaXN0cmlidXRpb24gd2l0aCBtZWFuIHplcm8uDQoNCltyZWZdKGh0dHBzOi8vd3d3LmV2ZXJub3RlLmNvbS9zaGFyZC9zMTQ0L3NoL2QzMzhkOTAwLTRlNGQtNDQ5Mi1hMTJkLTYzY2E4MGQzMzk0Ni84OTE5NmI3OGFhYjA5MGYzMmRmMjIyZTFiMWRhOTk5OCkgYW5kIHJlbGF0ZWQgW2F1dG8uYXJpbWEoKSBGYWlsZWQgVGhlIExqdW5nLUJveF0oaHR0cHM6Ly93d3cuZXZlcm5vdGUuY29tL3NoYXJkL3MxNDQvc2gvMDZkMTA5NDEtODkzNi00ZDJmLThiNzktMjI5Y2Y0YTZiZTNjLzc4YjlkYTA0YTg0OWIzM2RjY2M5M2Q2ZTdmNGZjMzYyKQ0KDQpgYGB7cn0NCkJveC50ZXN0KGF1dG9BcmltYU1vZGVsJHJlc2lkLHR5cGU9IkxqdW5nLUJveCIpDQpgYGANCg0KDQoNCg0KDQoNCg0K

SARIMA for Time Series

Intro of Math

acf & pacf

ARIMA Steps

step 1 - visualization

step 2 - stationarization

detrending:

differencing:

seasonality:

example:

step 3 - parameter optimization

step 4 - building arima model

auto (original):

auto (log-ed):

manual:

step 5 - predict & test

auto (original):

auto (log-ed):

manual:

test: