Library:
> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")Indonesia merupakan negara agraris yang potensial dengan dukungan kondisi alamnya. Pangan merupakan kebutuhan primer dan utama bagi manusia Oleh karena itu, ketahanan pangan menjadi pondasi yang sangat penting dalam menopang pembangunan di Indonesia (Tambunan, 2003:134).
Gula pasir merupakan salah satu jenis komoditas kebutuhan pokok di Indonesia yang diharapkan mampu untuk memenuhi kebutuhan masyarakat. Selain itu, gula pasir merupakan salah satu jenis kebutuhan pokok yang strategis setelah beras (Maria, 2009:2). Tebu merupakan bahan dasar gula pasir, dimana tebu merupakan tumbuhan musiman. Tumbuhan musiman merupakan istilah agrobotani bagi tumbuhan yang dapat dipanen hasilnya dalam satu musim tanam.
Dalam memenuhi kebutuhan pangan di Indonesia, ditugaskanlah Badan Urusan Logistik (BULOG) untuk melakukan pengadaan pangan yang ada di Indonesia termasuk gula pasir dan bahan pokok lainnya. Dengan adanya BULOG diharapkan mampu untuk mengatasi permasalahan pangan di Indonesia. Selain itu, BULOG bertugas untuk memenuhi kebutuhan pokok di dalam negeri dengan tidak menganggu kestabilan harga baik harga produsen maupun harga konsumen. Dapat dirumuskan secara singkat bahwa tugas utama BULOG adalah sebagai “stabilisator harga pangan”. Untuk melaksanakan hal tersebut dijabarkan dalam fungsi-fungsi yaitu pengadaan, penyimpanan, dan penyaluran.
Salah satu upaya meningkatkan para petani tebu adalah adanya teknologi baru di berbagai bidang kegiatan produksi gula. Hal tersebut membuat pemerintah mendapatkan banyak tantangan baik karena posisi pabrik gula yang ditinggalkan oleh para penjajah telah berada dalam inefisiensi yang tidak menguntungkan lagi, maupun karena lemahnya sumber daya manusia petani tebu (Hafsah. 2002:113). Maka dari itu, urgensi untuk meneliti dan meramal produksi tebu sebagai acuan pada produksi pangan nasional, pemasaran, ketersediaan impor yang berpengaruh pada harga gula pasir cukup penting untuk dibahas.
Salah satu cabang ilmu statistika, yaitu Analisis Deret Waktu memiliki solusi untuk mencapai tujuan tersebut. Dengan memakai SARIMA, nilai masa lalu dan sekarang dari variabel dependen untuk menghasilkan peramalan yang akurat sesuai dengan pola musiman yang sesuai dengan pola musiman tebu.
Oleh karena itu, dengan narasi yang telah disebutkan dan beberapa urgensi yang tercantum, penelitian ini membahas mengenai penerapan analisis deret waktu SARIMA sebagai salah satu metode statistika yang dapat digunakan sebagai teknik untuk meramalkan produksi tebu di Indonesia.
Tujuan yang ingin dicapai pada penelitian ini antara lain:
1. Untuk mengetahui apakah pemodelan SARIMA sesuai dan dapat digunakan
pada data produksi perkebunan tebu di Indonesia,
2. Untuk menerapkan metode SARIMA untuk mendapatkan model terbaik dalam
peramalan pada data produksi perkebunan tebu di Indonesia,
3. Untuk mengetahui peramalan dari data produksi perkebunan tebu di
Indonesia.
Masalah yang dibahas dalam penelitian ini antara lain:
1. Apakah model SARIMA sesuai dan dapat digunakan pada data produksi
perkebunan tebu di Indonesia?
2. Bagaimana penerapan model SARIMA dalam meramalkan data produksi
perkebunan tebu di Indonesia?
3. Bagaimana model SARIMA yang terbentuk untuk meramalkan data produksi
perkebunan tebu di Indonesia?
Batasan masalah dalam skripsi ini adalah sebagai berikut:
1. Data yang digunakan adalah data produksi tebu Indonesia perbulan dari
tahun 2009 sampai dengan 2013.
2. Metode peramalan yang digunakan adalah Metode SARIMA (Seasonal
Autoregressive Integrated Moving Average).
3. Ukuran akurasi peramalan yang digunakan adalah Akaike Information
Criterion (AIC).
Data deret waktu sering kali ditemukan dalam berbagai bidang disiplin ilmu seperti ekonomi, pertanian, meteorologi, biologi, serta disiplin ilmu lainnya. Data bentuk time series dapat dicatat berdasarkan periode waktu harian, mingguan, bulanan, tahunan, ataupun periode waktu tertentu lainnya dalam rentang waktu yang sama (Cryer, 2008). Pada data deret waktu nilai pengamatan suatu periode waktu diasumsikan dipengaruhi oleh nilai pengamatan pada periode waktu sebelumnya. Sehingga, analisis data deret waktu memungkinan untuk melakukan peramalan (forecasting) di masa mendatang.
Data yang termasuk dalam jenis time series kemudian dapat diplot berdasarkan waktu. Hal ini dilakukan untuk mengamati pola dari data untuk selanjutnya menentukan langkah analisis yang akan dilakukan. Berdasarkan bentuk pola yang dibentuk, data time series dapat dibagi menjadi empat yaitu, data stasioner (dilihat dari plot data yang menyebar disekitaran rata-rata serta ragamnya konstan), data trend (plot data menyebar membentuk suatu kecenderungan menaik ataupun menurun secara konstan), data musiman (pola yang berulang dari periode ke periode berikutnya), dan data siklik/siklus (Pola berbentuk trend yang memuat musiman namun periode musimannya lebih panjang).
Peramalan terhadap data deret waktu berguna untuk kepentingan berbagai pihak, selain dapat memprediksi nilai kita juga dapat menentukan suatu kebijakan tertentu yang sangat dipengaruhi oleh besar atau kecilnya nilai ramalan yang diperoleh. Analisis data deret waktu dapat digolongkan berdasarkan banyaknya peubah yang menjadi pengamatan. Data deret waktu yang diambil dari satu peubah pengamatan disebut dengan time series univariat. Analisis pada data time series univariat biasanya dimodelkan dalam beberapa metode seperti Autoregressive (AR), Moving Average (MA), Autoregressive Moving Average (ARMA), ataupun Autoregressive Integrated Moving Average (ARIMA).
• ARIMA Model Autoregresif Integrated Moving Average (ARIMA) adalah model yang secara penuh mengabaikan independen variabel dalam membuat peramalan. ARIMA menggunakan nilai masa lalu dan sekarang dari variabel dependen untuk menghasilkan peramalan jangka pendek yang akurat. ARIMA cocok jika observasi dari deret waktu (time series) secara statistik berhubungan satu sama lain (dependent).
ARIMA sering disebut juga metode runtun waktu Box Jenkins. ARIMA cukup dikenal dalam peramalan time series. ARIMA sangat baik ketepatannya untuk peramalan jangka pendek dan untuk data time series non stasioner pada saat linier (Wiyanti, D. T., & Pulungan, R, 2012.). Model Box-Jenkins (ARIMA) dibagi kedalam 3 kelompok, yaitu:
AR (Autoregressive Model) Bentuk umum model autoregressive dengan ordo p (AR(p)) atau model ARIMA (p,0,0). Model Autoregressive (AR) menghubungkan nilai pengamatan aktual dengan nilai pengamatan masa lalunya. Ini dapat dilakukan ketika sebuah pengamatan tidak lepas dari pengamatan masa lalunya.
MA (Moving Average Model) Pada kasus berhingga bobot taknol, kita memperoleh proses rerata bergerak (moving average process). Bentuk ini dapat dinyatakan sebagai :
\[ X_t=ε_t+θ_1 ε_(t-1)+θ_2 ε_(t-2)+⋯+θ_q ε_(q-t) \]
• SARIMA Model ARIMA yang melibatkan efek musiman didalamnya disebut juga dengan model SARIMA. Secara umum, model SARIMA ditulis dengan persamaan berikut: \[ ∅_p B^S ∅_p (B) 〖(1-B)〗^d (1-B^S )^D Z_t=θ_q (B) θ_Q (B^S)a_t \]
• Stationeritas terhadap ragam Data deret waktu dikatakan stationer terhadap ragam apabil ragamnya konstan dari waktu ke waktu. Stationer terhadap ragam dapat dilihat dari plot Box-Cox. Untuk Pengujian stasioneritas ragam dilakukan dengan metode box jenkins dengan bantuan program R.
Boxcox Apabila kondisi proses stasioner dalam variansi tidak diperoleh maka dilakukan transformasi pangkat (power transformasion) yang diperkenalkan oleh Box dan Cox. Kemudian untuk pengujian stasioneritas rata-rata dilakukan dengan melihat plot ACF dan PACF atau dengan uji Augmented Dicky Fuller Test dengan hipotesis sebagai berikut. H_0: Data tidak stasioner atau memiliki unit root H_1: Data stasioner atau tidak memiliki unit root
Dengan kriteria pengujian : Jika nilai-p ≤ 0.05 Maka H_0 ditolak Jika nilai-p > 0.05 Maka H_0 diterima
• Stationeritas terhadap rata-rata Data dikatakan stationer terhadap rata-rata apabila berfluktuasi disekitar garis sejajar dengan sumbu waktu (t) atau disekitar suatu nilai rata-rata yang konstan. Jika data tidak stationer terhadap rata-rata maka dapat dilakukan proses diferenssiasi atau pembedaan (1-B^d ) Z_t ,untuk d ≥1 sehingga datanya menjadi stationer terhadap rata-rata (Wei,2006).
Model tentatif dapat ditentukan dengan plot ACF dan PACF • Fungsi Autokorelasi (ACF) Korelasi mengukur keeratan hubungan antar peubah pada waktu sama, sedangkan pada autokorelasi, hubungan ini terdapat pada peubah sama namun pada waktu yang berbeda. Autokorelasi didefinisikan sebagai korelasi antar hasil pengamatan yang tersusun berdasarkan waktu (Gujarati, 2004). ACF digunakan untuk mengidentifikasi atau menentukan orde MA. Plot ACF juga dapat digunakan sebagai alat untuk mengidentifikasi kestasioneran data. Jika diagram ACF cenderung turun lambat atau turun secara linear, maka dapat disimpulkan data belum stasioner dalam rata-rata. \[ ρ ̂_k=r_k=corr (Y_t,Y_(t+k) )=(∑_(t=1)^(n=n-k)▒(Y_t-Y ̅ )(Y_(t+k)-Y ̅ ) )/(∑_(t=1)^n▒(Y_t-Y ̅ )^2 ) ;k=1,2,… \] • Fungsi Autokorelasi Parsial (PACF) Autokorelasi parsial digunakan untuk mengukur keeratan hubungan antara Y_t dan Y_(t-k) apabila pengaruh Y_(t-1),Y_(t-2),…,Y_(t-k+1) dianggap tetap dan mengidentifikasi atau menentukan orde AR. Penduga PACF didasarkan pada koefisien autokorelasi pada persamaan Yule Walkers (Cryer dan Chan, 2008), yaitu: \[ ∅_kk=(ρ_k-∑_(j=1)^(k-1)▒〖∅_(k-1,j) ρ_(k-j) 〗)/(1-∑_(j=1)^(k-1)▒〖∅_(k-1,j) ρ_j 〗) \] ## Uji Asumsi
Model yang baik memiliki sifat white noise (memenuhi asumsi white noise), dimana model memenuhi asumsi residual yang bersifat acak dan berdistribusi normal. Normalitas Untuk memeriksa apakah residu bersifat normal atau tidak, dapat dilakukan uji normalitas Kolmogorov-Smirnov dengan hipotesis sebagai berikut; H_0 ∶ Sisaan berdistribusi normal H_1 ∶ Sisaan tidak berdistribusi normal Dengan 𝛼= 0.05 dan statistik uji: \[ D = maksimum |F_0 (X) -S_N (X)| \] Serta kriteria uji: Tolak H_0 jika jika 𝐷ℎ𝑖𝑡 < 𝐷𝑡𝑎𝑏𝑒𝑙 atau 𝑝-𝑣𝑎𝑙𝑢𝑒> 𝛼. Artinya residu bersifat normal.
• Autokorelasi Salah satu asumsi yang perlu dipenuhi adalah sisaan menyebar acak dimana diperiksa dengan memperhatikan fungsi autokorelasi dari barisan sisaan tersebut. Barisan sisaan dikatakan acak apabila tidak terdapat autokorelasi yang signifikan untuk setiap lag yang ditentukan. Hipotesis yang digunakan dalam uji Ljung-Box adalah sebagai berikut:
H_0: ρ_1=ρ_2=⋯〖=ρ〗k=0 (Sisaan independen) H_1: Minimal ada satu nilai ρ_j≠0;j=1,2,…,k (Sisaan dependen) Menurut Cryer dan Chan (2008), statistik uji yang digunakan adalah Q yang dapat dihitung dengan menggunakan persamaan: \[ Q=n(n+2)∑_(k=1)^K▒(ρ ̂_k^2)/(n-k) \] Kriteria penolakan uji Q adalah menolak H_0 jika Q>〖X^2〗((a, K-p-q))
Salah satu kriteria dalam memilih model terbaik selain pemenuhan asumsi adalah dengan menghitung Akaike Information Criterion (AIC). Model dengan nilai AIC terkecil adalah model terbaik. Rumus yang digunakan untuk menghitung AIC adalah sebagai berikut: \[ AIC(M)=n ln〖σ ̂_a^2+2M〗 \]
Salah satu tujuan dari pembentukan suatu model pada data deret waktu adalah untuk dapat meramalkan sekumpulan nilai di masa depan (Cryer dan Chan, 2008). Peramalan (forecasting) penting dalam perencanaan dan controlling agar keputusan yang diambil dapat meningkatkan kinerja perusahaan di masa mendatang. (Wei, 2006)
Penelitian ini menggunakan data sekunder dari website Badan Pusat Statistik (BPS) mengenai produksi tebu Indonesia perbulan dari tahun 2009 sampai dengan 2013 yang dilampirkan pada data Produksi Bulanan Perkebunan Besar (ton) tahun 2009-2013.
Langkah analisis yang diterapkan dalam penelitian ini adalah sebagai berikut: 1. Mendeskripsikan pola dan siklus musiman pada data deret waktu; 2. Menguji stasioneritas data terhadap ragam (Jika tidak stasioner, lakukan transformasi dengan Boxcox); 3. Menguji stasioneritas data terhadap rata-rata (Jika data tidak stationer terhadap rata-rata, lakukan differencing); 4. Menentukan dan mengestimasi parameter model tentatif; 5. Uji signifikansi parameter model; 6. Diagnostik model dengan plot ACF dan PACF sisaan; 7. Uji asumsi untuk model tentatif (white noise, normalitas, autokorelasi); 8. Pemilihan model terbaik berdasarkan asumsi yang terpenuhi dan perhitungan AIC; 9. Peramalan data dengan SARIMA.
> #Library(readxl)
> #Library(agricolae)
> #Library(lmtest)
> #Library(forecast)
> #Library(tseries) library
> #Library yang digunakan
> library(forecast)
> library(tseries)
> library(readxl)
> Tebu <- read_excel("Tebu.xlsx")
> View(Tebu)
Error in .External2(C_dataviewer, x, title): unable to start data viewerdata ts
> #Mengubah data menjadi time series
> tsTebu=ts(Tebu$Data,start=c(2009,1),frequency=12)
> tsTebuN<-as.numeric(tsTebu)
> tsTebuN
[1] 0.70 3.60 4.00 73.30 238.40 402.70 467.30 468.50 362.20 212.20
[11] 97.30 3.70 0.80 3.60 4.10 70.30 236.50 395.00 457.20 460.30
[21] 354.00 206.40 96.30 4.10 1.14 5.24 5.97 77.24 252.67 412.16
[31] 449.62 428.76 343.61 198.97 64.64 4.14 1.22 5.18 6.11 74.15
[41] 276.35 463.77 520.50 490.82 443.57 238.50 68.33 4.08 0.00 0.00
[51] 0.00 44.15 58.87 94.20 588.72 559.28 500.41 396.36 236.87 75.89plot
> #Plot data
> plot.ts(tsTebu)boxcox
> #Transformasi Box-Cox (y*=y^lambda)
> tsTebuN = as.numeric(tsTebu)
> BoxCox.lambda(tsTebuN,method=c("guerrero"),lower=-1,upper=1)
[1] 0.4862838
> tsTebu1<-((tsTebuN^0.4862838)-1)/0.4862838
> BoxCox.lambda(tsTebu1)
[1] 1.182439
> tsTebu2<-ts(tsTebu1, start=c(2009,1),frequency=12)
> tsTebu2
Jan Feb Mar Apr May Jun
2009 -0.3274566 1.7774021 1.9789471 14.5425159 27.3983631 35.9511979
2010 -0.2114631 1.7774021 2.0276942 14.2086096 27.2839740 35.5960429
2011 0.1352927 2.5451928 2.8464979 14.9705552 28.2429251 36.3827888
2012 0.2087826 2.5194947 2.9020761 14.6358406 29.5920334 38.6525454
2013 -2.0564123 -2.0564123 -2.0564123 10.9157792 12.8640059 16.6960876
Jul Aug Sep Oct Nov Dec
2009 38.8029307 38.8539201 34.0417732 25.7771493 16.9936879 1.8288245
2010 38.3710760 38.5041421 33.6420238 25.4045672 16.8982271 2.0276942
2011 38.0437423 37.1280013 33.1286164 24.9193277 13.5580730 2.0470218
2012 41.0023552 39.7903725 37.7804403 27.4043706 13.9853476 2.0179941
2013 43.6599820 42.5336223 40.1859982 35.6590285 27.3062867 14.8251831musiman
> #Musiman
> TebuS<-diff(tsTebu1,lag=12)
> TebuS1<-diffinv(TebuS, differences=1)seasonal
> #ACF PACF seasonal
> acf(TebuS,60)> pacf(TebuS,60)stasioneritas seasonal
> #Test stasioneritas rata-rata
> #Seasonal
> adf.test(TebuS1,k=12)
Augmented Dickey-Fuller Test
data: TebuS1
Dickey-Fuller = -2.4134, Lag order = 12, p-value = 0.4087
alternative hypothesis: stationary
>
> #Non Musiman
> TebuNS<-diff(tsTebu1,lag=1)
> TebuNS1<-diffinv(TebuNS, differences=1)
>
> #ACF Non Seasonal
> acf(TebuNS1,60)> pacf(TebuNS1,60)stasioneritas
> #Test stasioneritas rata-rata
> #Non seasonal
> adf.test(TebuNS1,k=1)
Augmented Dickey-Fuller Test
data: TebuNS1
Dickey-Fuller = -5.4528, Lag order = 1, p-value = 0.01
alternative hypothesis: stationary
>
> #uji differencing H0: data stationer H1: data tidak stasioner
> kpss.test(TebuS)
KPSS Test for Level Stationarity
data: TebuS
KPSS Level = 0.057288, Truncation lag parameter = 3, p-value = 0.1model tentatif
> #Pendugaan Parameter
> #Model tentatif
> model1<-arima(tsTebu2,order=c(1,0,0),seasonal=list(order=c(0,1,0),period=12))
> model1
Call:
arima(x = tsTebu2, order = c(1, 0, 0), seasonal = list(order = c(0, 1, 0), period = 12))
Coefficients:
ar1
0.6599
s.e. 0.1157
sigma^2 estimated as 16.55: log likelihood = -135.74, aic = 275.49
> model2<-arima(tsTebu2,order=c(1,0,0),seasonal=list(order=c(0,1,1),period=12))
> model2
Call:
arima(x = tsTebu2, order = c(1, 0, 0), seasonal = list(order = c(0, 1, 1), period = 12))
Coefficients:
ar1 sma1
0.6611 -0.1435
s.e. 0.1159 0.3227
sigma^2 estimated as 16.4: log likelihood = -135.65, aic = 277.3
> model3<-arima(tsTebu2,order=c(1,0,1),seasonal=list(order=c(0,1,0),period=12))
> model3
Call:
arima(x = tsTebu2, order = c(1, 0, 1), seasonal = list(order = c(0, 1, 0), period = 12))
Coefficients:
ar1 ma1
0.2457 0.6570
s.e. 0.2175 0.1919
sigma^2 estimated as 14.85: log likelihood = -133.33, aic = 272.66
> model4<-arima(tsTebu2,order=c(1,0,1),seasonal=list(order=c(0,1,1),period=12))
> model4
Call:
arima(x = tsTebu2, order = c(1, 0, 1), seasonal = list(order = c(0, 1, 1), period = 12))
Coefficients:
ar1 ma1 sma1
0.2408 0.6665 0.0639
s.e. 0.2150 0.1910 0.3156
sigma^2 estimated as 14.82: log likelihood = -133.31, aic = 274.62
> model5<-arima(tsTebu2,order=c(0,0,1),seasonal=list(order=c(0,1,0),period=12))
> model5
Call:
arima(x = tsTebu2, order = c(0, 0, 1), seasonal = list(order = c(0, 1, 0), period = 12))
Coefficients:
ma1
0.8001
s.e. 0.0979
sigma^2 estimated as 15.21: log likelihood = -133.94, aic = 271.89
> model6<-arima(tsTebu2,order=c(0,0,1),seasonal=list(order=c(0,1,1),period=12))
> model6
Call:
arima(x = tsTebu2, order = c(0, 0, 1), seasonal = list(order = c(0, 1, 1), period = 12))
Coefficients:
ma1 sma1
0.8030 0.0700
s.e. 0.0975 0.3237
sigma^2 estimated as 15.17: log likelihood = -133.92, aic = 273.84coeftest
> lmtest::coeftest(model1)
z test of coefficients:
Estimate Std. Error z value Pr(>|z|)
ar1 0.65986 0.11568 5.7044 1.168e-08 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
> lmtest::coeftest(model2)
z test of coefficients:
Estimate Std. Error z value Pr(>|z|)
ar1 0.66111 0.11588 5.7051 1.163e-08 ***
sma1 -0.14352 0.32266 -0.4448 0.6565
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
> lmtest::coeftest(model3)
z test of coefficients:
Estimate Std. Error z value Pr(>|z|)
ar1 0.24573 0.21745 1.1300 0.2584629
ma1 0.65704 0.19191 3.4237 0.0006177 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
> lmtest::coeftest(model4)
z test of coefficients:
Estimate Std. Error z value Pr(>|z|)
ar1 0.240782 0.214997 1.1199 0.2627426
ma1 0.666543 0.190976 3.4902 0.0004827 ***
sma1 0.063894 0.315577 0.2025 0.8395507
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
> lmtest::coeftest(model5)
z test of coefficients:
Estimate Std. Error z value Pr(>|z|)
ma1 0.800056 0.097922 8.1703 3.075e-16 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
> lmtest::coeftest(model6)
z test of coefficients:
Estimate Std. Error z value Pr(>|z|)
ma1 0.803018 0.097517 8.2347 <2e-16 ***
sma1 0.070002 0.323676 0.2163 0.8288
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1asumsi
> #Uji Asumsi kenormalan dan Autokor(White Noise)
> nortest::sf.test(model1$residuals)
Shapiro-Francia normality test
data: model1$residuals
W = 0.59855, p-value = 5.652e-10
> checkresiduals(model1)
Ljung-Box test
data: Residuals from ARIMA(1,0,0)(0,1,0)[12]
Q* = 17.746, df = 11, p-value = 0.08766
Model df: 1. Total lags used: 12
>
> nortest::sf.test(model5$residuals)
Shapiro-Francia normality test
data: model5$residuals
W = 0.70625, p-value = 1.982e-08
> checkresiduals(model5)
Ljung-Box test
data: Residuals from ARIMA(0,0,1)(0,1,0)[12]
Q* = 21.015, df = 11, p-value = 0.03322
Model df: 1. Total lags used: 12
AIC
> #AIC
> AIC(model1)
[1] 275.4855
> AIC(model5)
[1] 271.8854forecast
> #Peramalan 1 tahun kedepan (model terbaik=model1)
> result<-plot(forecast(model1, h=12))> autoplot(forecast(model1))Berikut merupakan hasil analisis deskriptif dari data produksi tebu tahun 2009 sampai dengan 2013 dengan rata-rata 200.2332, nilai minimum 0, dan nilai maksimum 588.72.
Berdasarkan plot data, dapat diketahui bahwa data memiliki kecenderungan musiman dengan nilai yang meningkat pada setiap mendekati pertengahan tahun dimana puncaknya terjadi setiap bulan Juli, sehingga dapat dipastikan bahwa data memiliki pola musiman setiap 12 bulan.
Stasioneritas Ragam Stasioneritas Ragam dilihat menggunakan BoxCox apabila nilai λ=1 maka data tidak perlu ditransformasi, transfornasi y^=y^λ, untuk λ≠0 dan y^=ln(y) untuk λ=0. Berikut hasil
Karena nilai λ≠1 maka data perlu ditransfomasi terlebih dahulu, sehingga diperoleh grafik sebagai berikut.
Setelah ditransformasi, nilai λ=1, maka data sudah stasioner terhadap ragam dan tidak perlu ditransformasi lagi.
Stasioneritas Rata-Rata Stasioneritas terhadap rata-rata dapat dilihat menggunakan plot ACF dan PACF bila tidak stasioner maka plot ACF dan PACF akan menurun dengan sangat lambat tiap lagnya mengakibatkan tiap lag akan signifikan.
Informasi yang dibutuhkan terlihat dari plot ACF dan PACF, selain menggunakan ACF dan PACF dapat juga digunakan uji ADF (Augmented Dickey-Fuller) dengan hipotesis: H_0 : δ=0 (Data tidak stasioner terhadap rata-rata) H_1 : δ≠0 (Data stasioner terhadap rata-rata) Dengan kriteria pengujian: Jika p-value < nilai alpha (0,05), maka H_0 ditolak. Sehingga dapat dikatakan data stasioner terhadap rata-rata Jika p-value > nilai alpha (0,05), maka H_0 diterima. Sehingga dapat dikatakan data tidak stasioner terhadap rata-rata Setelah dilakukan uji ADF, diketahui bahwa rata-rata tidak stasioner. Sehingga, dilakukan differencing sebanyak satu kali.
Penentuan Model Tentatif Dengan diketahui dari ACF dan PACF setelah
dilakukan transformasi dan differencing diketahui model SARIMA (2, 1,
1)(0,1,1). Sehingga didapat model tentatif sebagai berikut.
(1,0,0)(0,1,0)
(1,0,0)(0,1,1)
(1,0,1)(0,1,0)
(1,0,1)(0,1,1)
(2,0,0)(0,1,0)
(2,0,1)(0,1,1)
(2,0,1)(0,1,0)
(2,0,1)(0,1,1)
(2,0,2)(0,1,0)
(2,0,2)(0,1,1)
(1,0,2)(0,1,0)
(1,0,2)(0,1,1)
(0,0,1)(0,1,0)
(0,0,1)(0,1,1)
Dari 14 model, dipilih p=1 dan d=1 sehingga model tentative yang tersisa
hanya 6, yaitu:
(1,0,1)(0,1,0)
(1,0,1)(0,1,1)
(1,0,2)(0,1,0)
(1,0,2)(0,1,1)
(0,0,1)(0,1,0)
(0,0,1)(0,1,1)
Pendugaan Parameter Setelah menentukan model tentatif, dilakukan pendugaan dan pengujian parameter model dengan lmtest.
Hasil pendugaan dan pengujian parameter model menggunakan software R, dari 6 model yang ada, didapat 2 model yang signifikan, yaitu ARIMA(1,0,0) (0,1,0) dan ARIMA(0,0,1)(0,1,0).
Berdasarkan pada tabel output sebelumnya, dapat diketahui bahwa nilai p-value pada model ARIMA(1,0,0)(0,1,0) sebesar 1.078e-08 dan pada model ARIMA(0,0,1)(0,1,0) sebesar 4.535e-09. Hal ini menunjukkan bahwa kedua model tersebut memiliki p-value yang lebih kecil dari alpha (0,05), sehingga dapat diambil keputusan H_0 ditolak. Dengan demikian, dapat disimpulkan bahwa residual pada model ARIMA(1,0,0)(0,1,0) dan ARIMA(0,0,1)(0,1,0) tidak berdistribusi secara normal.
Berdasarkan plot ACF di atas, terlihat bahwa terdapat lag yang signifikan pada plot ACF residual Model ARIMA(1,0,0)(0,1,0) dan ARIMA(0,0,1)(0,1,0). Sehingga dapat dikatakan residual model ARIMA(1,0,0)(0,1,0) dan ARIMA(0,0,1)(0,1,0) saling berkorelasi atau residual belum white noise. Selain menggunakan plot ACF pada residual model, uji white noise juga dapat dilakukan dengan uji Ljung-Box. Berikut hipotesis yang akan diuji. H_0: Residual memenuhi syarat white noise H_1: Residual tidak memenuhi syarat white noise
Dengan kriteria pengujian: Jika p-value < nilai alpha (0,05), maka H_0 ditolak. Terdapat autokorelasi antar residual, dengan kata lain residual tidak white noise. Jika p-value > nilai alpha (0,05), maka H_0 diterima. Tidak terdapat autokorelasi antar residual, dengan kata lain residual sudah white noise.
Berdasarkan tabel di atas, dapat diketahui bahwa nilai p-value hasil uji Ljung-Box pada model ARIMA(1,0,0)(0,1,0)[12] sebesar 0.01273 dan model ARIMA(0,0,1)(0,1,0) sebesar 7.889e-05. Hal ini menunjukkan bahwa kedua model tersebut memiliki p-value yang lebih kecil dari alpha (0,05), sehingga dapat diambil keputusan H_0 ditolak. Dengan demikian, dapat disimpulkan bahwa residual pada model ARIMA(1,0,0)(0,1,0)[12] dan ARIMA(0,0,1)(0,1,0) terdapat autokorelasi atau dengan kata lain tidak white noise. Maka dengan alpha 5%, karena dua asumsi tersebut terlanggar, sehingga model terbaik dipilih dri AIC.
Berdasarkan pertimbangan dari asumsi sebelumnya, maka dari AIC, model terbaik yang dipilih adalah ARIMA (1,0,0)(0,1,0)[12]. ## Peramalan Peramalan Setelah ditentukan model terbaik, dilakukan peramalan atau forecasting produksi tebu di Indonesia 1 tahun ke depan.
Setelah ditentukan 6 model tentatif didapatkan hasil 4 model di antaranya tidak signifikan dan 2 model signifikan sehingga proses dilanjutkan melakukan uji diagnostik model meliputi Kenormalan dan White Noise (Autokorelasi) didapatkan bahwa model ARIMA(1,0,0)(0,1,0)[12] tidak memenuhi asumsi normalitas namun memenuhi asumsi autokorelasi, sedangkan ARIMA(0,0,1)(0,1,0)[12] tidak memenuhi kedua asumsi. Dengan demikian, dapat disimpulkan bahwa residual pada model ARIMA(1,0,0)(0,1,0)[12] dan ARIMA(0,0,1)(0,1,0) [12] terdapat autokorelasi atau dengan kata lain tidak white noise. Kedua asumsi tersebut terlanggar, sehingga model terbaik dipilih dri AIC. Dari perhitungan yang dilakukan, diketahui bahwa ARIMA(1,0,0)(0,1,0)[12] memiliki nilai AIC paling rendah sehingga ARIMA(1,0,0)(0,1,0)[12] merupakan model terbaik.
\[ Y_t=Y_(t-12)+ϕ_1 Y_(t-1)-ϕ_1 Y_(t-13)+e_t \] \[ Y_t=Y_(t-12)+ϕ_1 (Y_(t-1)-Y_(t-13))+e_t \]
\[ Y_t=Y_(t-12)+0.76167(Y_(t-1)-Y_(t-13))+e_t \]
Saran yang dapat penulis sampaikan dalam penelitian ini adalah
sebagai berikut:
1. Model SARIMA yang tersisa masih belum bersifat white noise sehingga
dibutuhkan differencing lanjutan untuk mendapat model yang lebih
akirat.
2. Penerapan forecasting dalam penelitian ini kurang memberikan
informasi untuk tahun 2021 dan ke depannya sehingga penulis menyarankan
untuk mengambil data terbaru agar forecasting yang dilakukan dapat lebih
jauh lagi.
3. Sebaiknya pemerintah dapat memberikan dukungan secara kontinyu demi
berjalannya produksi tebu di Indonesia sebagai pasokan BULOG
Cryer, J.D,. dan Chan, K., S. 2008. Time Series Analysis With
Application in R. New York: Springer.
Gujarati, D. N. 2004. Basic Econometrics, Fourth edition, Singapore.
McGraw-Hill Inc.
Hafsah, M.J. 2002. Bisnis Gula Di Indonesia. Jakarta: Pustaka Sinar
Harapan.
Junaidi, J. (2014). Analisis Hubungan Deret Waktu untuk Peramalan.
Lubis, D. A., Johra, M. B., & Darmawan, G. (2017). Peramalan Indeks
Harga Konsumen dengan Metode Singular Spectral Analysis (SSA) dan
Seasonal Autoregressive Integrated Moving Average (SARIMA). J. Mat.
MANTIK.
Maria, 2009. Analisis Kebijakan Tataniaga Gula terhadap ketersediaan dan
harga domestik gula pasir di Indonesia. Universitas Kristen Satya
Wacana, Salatiga
Tambunan, T. 2003. Perekonomian Indonesia. Beberapa Masalah Penting.
Ghalia Indonesia : Jakarta.
Wiyanti, D. T., & Pulungan, R. (2012). Peramalan Deret Waktu
Menggunakan Model Fungsi Basis Radial (RBF) dan Auto Regressive
Integrated Moving Average (ARIMA). Indonesian Journal of Mathematics and
Natural Sciences, 35(2).
Wei, W.W.S. 2006. Time Series Analysis : Univariate and Multivariate
Methods. Edisi Kedua. New York :Pearson Education, Inc.