Data yang digunakan adalah data IPM provinsi Kepulauan Riau dari tahun 2010 sampai 2021. Menurut Badan Pusat Statistik Indeks pembangunan manusia (IPM) adalah indeks komposit yang mengukur pembangunan manusia dari tiga aspek dasar yaitu umur Panjang dan hidup sehat, pengetahuan, dan standar hidup layak. Nilai IPM berkisar antara 0 sampai dengan 100.Semakin tinggi nilai IPM suatu negara/daerah, menunjukkan pencapaian pembangunan manusianya semakin baik.
Data IPM provinsi Kepulauan Riau dari tahun 2010 sampai 2021 terdiri dari dua variabel yaitu, ipm dan tahun. Pada analisis model regresi linier sederhana, variabel ipm akan menjadi peubah respon \((y)\) dan tahun sebagai peubah penjelas \((x)\). Jika terdapat autokorelasi pada model, maka akan dilakukan penangannan autokorelasi dengan metode Cochrane-Orcutt dan metode Hildreth-Lu.
library(lmtest)
## Warning: package 'lmtest' was built under R version 4.1.2
## Loading required package: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
library(orcutt)
## Warning: package 'orcutt' was built under R version 4.1.2
library(HoRM)
## Warning: package 'HoRM' was built under R version 4.1.2
## Registered S3 method overwritten by 'quantmod':
## method from
## as.zoo.data.frame zoo
Input data tahun dan IPM kemudian disimpan dengan nama ipm.
ipm <- read.csv("C:/Kuliah/Semester 6/Metode Peramalan Deret Waktu/Tugas 1/ipmkepri.csv")
ipm
## Tahun ipm
## 1 2010 71.13
## 2 2011 71.61
## 3 2012 72.36
## 4 2013 73.02
## 5 2014 73.40
## 6 2015 73.75
## 7 2016 73.99
## 8 2017 74.45
## 9 2018 74.84
## 10 2019 75.48
## 11 2020 75.59
## 12 2021 75.79
Berikut summary dari data IPM Kepulauan Riau :
summary(ipm)
## Tahun ipm
## Min. :2010 Min. :71.13
## 1st Qu.:2013 1st Qu.:72.86
## Median :2016 Median :73.87
## Mean :2016 Mean :73.78
## 3rd Qu.:2018 3rd Qu.:75.00
## Max. :2021 Max. :75.79
IPM Provinsi Kepulauan Riau memiliki nilai minimum 71.13 dan nilai maksimum 75.79. Rata-rata IPM dari Provinsi Kepulauan Riau adalah 73.78. IPM Provinsi Kepulauan Riau dari 2010 - 2021 dapat digolongkan dalam IPM kategori tinggi berdasarkan pengelompokan metode baru menurut Badan Pusat Statistik.
x <- ipm$Tahun
y <- ipm$ipm
plot(x,y, pch = 20, col = "red", main = "Plot Tahun vs IPM Kep. Riau", xlab = "Tahun", ylab = "IPM Kep. Riau")
cor(x,y)
## [1] 0.9899972
Berdasarkan scatter plot tahun vs IPM Kep. Riau terlihat bahwa terdapat hubungan yang kuat antara tahun dan IPM. IPM Kepulauan Riau dan tahun menunjukan hubungan linier yang positif.` Nilai korelasi antara IPM Provinsi Kepulauan Riau dan tahun juga sangat besar yaitu 0.989 yang berarti hubungan linier keduanya sangat kuat.
model<- lm(y~x, data = ipm)
summary(model)
##
## Call:
## lm(formula = y ~ x, data = ipm)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.32897 -0.14432 0.01181 0.18608 0.29711
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -781.81672 38.55893 -20.28 1.88e-09 ***
## x 0.42451 0.01913 22.19 7.76e-10 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.2288 on 10 degrees of freedom
## Multiple R-squared: 0.9801, Adjusted R-squared: 0.9781
## F-statistic: 492.4 on 1 and 10 DF, p-value: 7.755e-10
Model regresi dari IPM Kepulauan Riau sebagai peubah respon (y) dan tahun sebagai peubah penjelas (x): \[\hat{y_t} = -781.81 + 0.42451(x_t)\]
0.42451 nilai dugaan perubahan rataan IPM Kepulauan Riau jika tahun berubah dan -781.81 merupakan nilai IPM Kepulauan Riau yang tidak dapat dijelaskan oleh model ini.
Koefisien determinasi pada model ini adalah 98%. Hal ini berarti sebesar 98 % dari proporsi IPM Provinsi Kepulauan Riau dapat dijelaskan oleh variabel tahun dan 2% dijelaskan oleh hal lain diluar model ini.
P-value pada model regresi ini kurang dari 0.05 sehingga dapat dikatakan bahwa pada model variabel tahun berpengaruh nyata pada model pada taraf nyata 5%.
Selanjutnya perlu dilakukan uji autokorelasi, baik secara eksploratif atau formal. Korelasi antara IPM Kepulauan Riau dan tahun sangat besar, selain itu nilai koefisien determinasi pada model ini juga sangatlah besar sehingga indikasi adanya autokorelasi sangat kuat.
#sisaan dan fitted value
resi1<- residuals(model)
fit<- predict(model)
#Diagnostik dengan eksploratif
par(mfrow = c(2,2))
qqnorm(resi1)
qqline(resi1, col = "steelblue", lwd = 2)
plot(fit, resi1, col = "steelblue", pch = 20, xlab = "Sisaan", ylab = "Fitted Values", main = "Sisaan vs Fitted Values")
abline(a = 0, b = 0, lwd = 1)
plot(seq(1,12,1), resi1, col = "steelblue", pch = 20, xlab = "Sisaan", ylab = "Order", main = "Sisaan vs Order")
lines(seq(1,12,1), resi1, col = "red")
abline(a = 0, b = 0, lwd = 2)
JIka dilihat dari normal Q-Q Plot sisaan menyebar normal karena tebaran mengikuti garis. Plot sisaan vs Fitted Values menunjukan adanya pola tertentu pada tebaran amatan, hal ini mengindikasikan adanya autokorelasi pada model.
par(mfrow = c(1,2))
acf(resi1)
pacf(resi1)
Plot ACF dan PACF menunjukan tidak ada autokorelasi karena data masih berada dalam garis batas.
Selanjutnya dilakukan uji formal Durbin Watson untuk mengetahui apakah ada autokorelasi pada model ini atau tidak.
Hipotesis :
\(H_0\): Tidak terdapat autokorelasi
\(H_1\): Terdapat autokorelasi
dwtest(model)
##
## Durbin-Watson test
##
## data: model
## DW = 0.7724, p-value = 0.001426
## alternative hypothesis: true autocorrelation is greater than 0
Dari Uji Durbin Watson didapatkan nilai p-value < 0.05. Nilai DW = 0.7724 juga berada pada daerah dibawah nilai \(d_l\)= 0.971. Sehingga tolak \(H_0\) cukup bukti untuk mengatakan bahwa terdapat autokorelasi positif pada taraf nyata 5%.
Model regresi IPM Provinsi Kepulauan Riau dan tahun terdeteksi adanya autokorelasi sehingga perlu dilakukan penangannan untuk mengatasi autokorelasi tersbut.
Penanganan autokorelasi akan dilakukan dengan dua cara yaitu Metode Cochrane-Orcutt dan Metode Hildreth-Lu. Keduanya merupakan penanganan dengan transformasi \(x\) menjadi \(x^*\) dengan menambah kompenen \(\rho\)(rho).
modelco<-cochrane.orcutt(model)
summary(modelco)
## Call:
## lm(formula = y ~ x, data = ipm)
##
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -613.259516 86.648746 -7.078 5.808e-05 ***
## x 0.340992 0.042941 7.941 2.348e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.157 on 9 degrees of freedom
## Multiple R-squared: 0.8751 , Adjusted R-squared: 0.8612
## F-statistic: 63.1 on 1 and 9 DF, p-value: < 2.348e-05
##
## Durbin-Watson statistic
## (original): 0.77240 , p-value: 1.426e-03
## (transformed): 1.94827 , p-value: 3.15e-01
rho<- modelco$rho
rho
## [1] 0.6514619
y.trans<- y[-1]-y[-12]*rho
x.trans<- x[-1]-x[-12]*rho
modelcorho<- lm(y.trans~x.trans)
modelcorho
##
## Call:
## lm(formula = y.trans ~ x.trans)
##
## Coefficients:
## (Intercept) x.trans
## -213.744 0.341
Penduga koefisien regresi setelah transformasi ke persamaan awal :
b0 <- -213.744 / (1-rho)
b0
## [1] -613.2586
Setelah autokorelasi ditangani dengan menggunakan metode Cochrane-Orcutt dengan menggunakan library orcutt dan transformasi didapatkan model regresi yang baru yaitu : \[\hat{y_t} = -613.2586 + 0.340992(x_t)\]
0.340992 nilai dugaan perubahan rataan IPM Kepulauan Riau jika tahun berubah dan -613.259 merupakan nilai IPM Kepulauan Riau yang tidak dapat dijelaskan oleh model ini.
Koefisien determinasi pada model ini adalah 87.51%. Hal ini berarti sebesar 87.51 % dari proporsi IPM Provinsi Kepulauan Riau dapat dijelaskan oleh variabel tahun dan 12.49% dijelaskan oleh hal lain diluar model ini.
P-value pada model regresi ini kurang dari 0.05 sehingga dapat dikatakan bahwa pada model variabel tahun berpengaruh nyata pada model pada taraf nyata 5%.
modelco$rho
## [1] 0.6514619
Nilai \(\rho\) pada metode Cochrane-Orcutt didapatkan sebesar 0.6514619.
Dengan menggunakan Metode Hildreth-Lu terlebih dahulu dicari nilai \(\rho\) dengan nilai SSE minimum. Pertama nilai \(\rho\) dicari antara 0.1 - 0.9
hildreth.lu.func<- function(r, model){
x <- model.matrix(model)[,-1]
y <- model.response(model.frame(model))
n <- length(y)
t <- 2:n
y <- y[t]-r*y[t-1]
x <- x[t]-r*x[t-1]
return(lm(y~x))
}
r <- c(seq(0.1,0.8, by= 0.1), seq(0.9,0.99, by= 0.01))
tab <- data.frame("rho" = r, "SSE" = sapply(r, function(i){deviance(hildreth.lu.func(i, model))}))
urut <- tab[order(tab$SSE),]
urut
## rho SSE
## 7 0.70 0.2226264
## 6 0.60 0.2227345
## 8 0.80 0.2299162
## 5 0.50 0.2302407
## 9 0.90 0.2446041
## 4 0.40 0.2451449
## 10 0.91 0.2464798
## 11 0.92 0.2484294
## 12 0.93 0.2504531
## 13 0.94 0.2525507
## 14 0.95 0.2547223
## 15 0.96 0.2569679
## 16 0.97 0.2592874
## 17 0.98 0.2616810
## 18 0.99 0.2641485
## 3 0.30 0.2674471
## 2 0.20 0.2971473
## 1 0.10 0.3342456
plot(tab$SSE ~ tab$rho , type = "l",xlab = "rho", ylab = "SSE",
main = "Plot SSE vs Rho")
abline(v = tab[tab$SSE==min(tab$SSE),"rho"], lty = 3)
Berdasarkan hasil diatas didapatkan nilai \(\rho\) paling minimum adalah berada diantara 0.6 - 0.8. Selanjutnya akan dicari kembali nilai \(\rho\) dengan selang yang lebih kecil yaitu 0.6 - 0.8 untuk mendapatkan nilai SSE paling minimum.
ro <- c(seq(0.6,0.8, by= 0.001))
tabo <- data.frame("rho" = ro, "SSE" = sapply(ro, function(i){deviance(hildreth.lu.func(i, model))}))
head(tabo[order(tabo$SSE),])
## rho SSE
## 52 0.651 0.2217550
## 53 0.652 0.2217550
## 51 0.650 0.2217557
## 54 0.653 0.2217558
## 50 0.649 0.2217571
## 55 0.654 0.2217573
plot(tabo$SSE ~ tabo$rho , type = "l",xlab = "rho", ylab = "SSE",
main = "Plot SSE vs Rho")
abline(v = tabo[tabo$SSE==min(tabo$SSE),"rho"], lty = 3)
Nilai \(\rho\) optimum adalah 0.651 dengan SSE minimum sebesar 0.2217550
modelhl <- hildreth.lu.func(0.651, model)
summary(modelhl)
##
## Call:
## lm(formula = y ~ x)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.211036 -0.128473 -0.008585 0.080109 0.291330
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -214.12225 30.20034 -7.090 5.73e-05 ***
## x 0.34113 0.04288 7.955 2.32e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.157 on 9 degrees of freedom
## Multiple R-squared: 0.8755, Adjusted R-squared: 0.8616
## F-statistic: 63.28 on 1 and 9 DF, p-value: 2.316e-05
Setelah autokorelasi ditangani dengan menggunakan metode Cochrane-Orcutt dengan menggunakan library orcutt didapatkan model regresi yang baru yaitu : \[\hat{y_t} = -214.12 + 0.34113(x_t)\]
0.34113 nilai dugaan perubahan rataan IPM Kepulauan Riau jika tahun berubah dan -214.12 merupakan nilai IPM Kepulauan Riau yang tidak dapat dijelaskan oleh model ini.
Koefisien determinasi pada model ini adalah 87.55%. Hal ini berarti sebesar 87.55 % dari proporsi IPM Provinsi Kepulauan Riau dapat dijelaskan oleh variabel tahun dan 12.45% dijelaskan oleh hal lain diluar model ini.
P-value pada model regresi ini kurang dari 0.05 sehingga dapat dikatakan bahwa pada model variabel tahun berpengaruh nyata pada model pada taraf nyata 5%.
dwtest(modelco)
##
## Durbin-Watson test
##
## data: modelco
## DW = 1.9483, p-value = 0.315
## alternative hypothesis: true autocorrelation is greater than 0
Berdasarkan Uji Durbin Watson didapatkan nilai p-value > 0.05. Nilai DW = 1.9483 juga berada pada daerah diatas nilai \(d_u\)= 1.331. Sehingga tolak \(H_0\) cukup bukti untuk mengatakan bahwa tidak terdapat autokorelasi pada taraf nyata 5%. Model alternatif yang telah ditangani dengan metode Cochrane-Orcutt tidak mengalami autokorelasi.
dwtest(modelhl)
##
## Durbin-Watson test
##
## data: modelhl
## DW = 1.9477, p-value = 0.3147
## alternative hypothesis: true autocorrelation is greater than 0
Berdasarkan Uji Durbin Watson didapatkan nilai p-value > 0.05. Nilai DW = 1.9477 juga berada pada daerah diatas nilai \(d_u\)= 1.331. Sehingga tolak \(H_0\) cukup bukti untuk mengatakan bahwa tidak terdapat autokorelasi pada taraf nyata 5%. Model alternatif yang telah ditangani dengan metode Hildreth-Lu tidak mengalami autokorelasi.
Model regresi pada data IPM provinsi Kepulauan Riau tahun 2010 - 2021 terdapat autokorelasi. Autokorelasi tersebut dapat diatasi dengan metode Cochrane-Orcutt dan Hildreth-Lu.