Persiapan Dataset

library(readxl)
#working direktori
setwd("D:\\KULI-AH\\Semester 6\\Metode Peramalan Deret Waktu\\Pertemuan 3\\tugas")
#membuka file data
dataregresi<-read_xlsx("IPM.xlsx",col_names = T)
head(dataregresi)
## # A tibble: 6 x 2
##   Tahun   IPM
##   <dbl> <dbl>
## 1  2010  71.1
## 2  2011  71.6
## 3  2012  72.4
## 4  2013  73.0
## 5  2014  73.4
## 6  2015  73.8

IPM atau Indeks Pembangunan Manusia merupakan indikator yang berguna dalam mengukur keberhasilan upaya membangun kualitas hidup manusia (masyarakat/penduduk) (BPS 2020).

IPM didapatkan berdasarkan 3 dimensi dasar, antara lain:

  1. Umur panjang dan hidup sehatt
  2. Pengetahuan
  3. Standar hidup layak

Data yang digunakan dalam analisis ini adalah IPM Provinsi Kepulauan Riau dalam rentang waktu 2010-2021.

Eksplorasi Data

plot(dataregresi$Tahun,dataregresi$IPM, pch = 20, col = "blue", main = "Scatter Plot IPM Kepulauan Riau 2010-2021",xlab= "Tahun", ylab = "IPM")

Berdasarkan plot diatas, Terlihat IPM Kep. Riau sejak tahun 2010-2021 mengalami kenaikan. Sejak tahun 2010 IPM Kep. Riau naik sebanyak 6.56% sampai tahun 2021. Namun, kenaikan ini masih dibawah dari kenaikan IPM Nasional yaitu sebesar 7.97% pada rentang waktu yang sama.

Membangun Model Regresi Awal

model<- lm(dataregresi$IPM~dataregresi$Tahun, data = dataregresi)
summary(model)
## 
## Call:
## lm(formula = dataregresi$IPM ~ dataregresi$Tahun, data = dataregresi)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.32897 -0.14432  0.01181  0.18608  0.29711 
## 
## Coefficients:
##                     Estimate Std. Error t value Pr(>|t|)    
## (Intercept)       -781.81672   38.55893  -20.28 1.88e-09 ***
## dataregresi$Tahun    0.42451    0.01913   22.19 7.76e-10 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.2288 on 10 degrees of freedom
## Multiple R-squared:  0.9801, Adjusted R-squared:  0.9781 
## F-statistic: 492.4 on 1 and 10 DF,  p-value: 7.755e-10

Uji Asumsi Gauss-Markov

Asumsi Gauss-Markov dari model regresi linear OLS (Ordinary Least Squares/Metode Kuadrat Terkecil):

  1. Sisaan menyebar normal,
  2. Sisaan homoskedastis (ragam tidak berubah-ubah untuk tiap amatan), dan
  3. Sisaan saling bebas (tidak ada autokorelasi).

Apabila asumsi-asumsi di atas dapat terpenuhi, maka metode OLS akan menghasilkan model BLUE (Best Linear Unbiased Estimator).

Uji normalitas

library(car)
## Loading required package: carData
qqPlot(model$residuals, main = "QQ plot residual")

## [1] 12  1

Secara eksporatif terlihat, residual model menyebar secara normal. Untuk memastikan lebih lanjut akan dilakukan uji formal saphiro wilk.

library(lmtest)
## Loading required package: zoo
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
shapiro.test(model$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  model$residuals
## W = 0.92644, p-value = 0.3439

Hipotesis:

H0 : Sisaan menyebar normal

H1 : Sisaan tidak menyebar normal

Berdasarkan uji Shapiro-Wilk didapatkan nilai p-value > 0.05, artinya tak tolak H0. Disimpulkan bahwa cukup bukti untuk mengatakan sisaan menyebar normal.

Uji Homoskedastis

bptest(model)
## 
##  studentized Breusch-Pagan test
## 
## data:  model
## BP = 0.77447, df = 1, p-value = 0.3788

Hipotesis:

H0 : Ragam sisaan homogen

H1 : Ragam sisaan tidak homogen

Berdasarkan uji Breusch-Pagan, didapatkan nilai p-value > 0.05, artinya tak tolak H0. Disimpulkan bahwa cukup bukti untuk mengatakan ragam sisaan homogen pada taraf nyata 5%.

Uji Autokorelasi

#sisaan dan fitted value
resi1<- residuals(model)
fit<- predict(model)

par(mfrow = c(1,2))
acf(resi1)
pacf(resi1)

library(lmtest)
dwtest(model)
## 
##  Durbin-Watson test
## 
## data:  model
## DW = 0.7724, p-value = 0.001426
## alternative hypothesis: true autocorrelation is greater than 0

Berdasarkan uji eksploratif ACF dan PACF terlihat nilai-nilai autokorelasi tidak ada yang melewati batas. Namun, dengan menggunakan uji formal durbin-watson didapatkan nilai p-value < 0.05, artinya model di atas mengandung autokorelasi yang cukup signifikan pada taraf nyata 5%.

Mengatasi masalah Autokorelasi

Menggunakan Metode Cochrane–Orcutt

library(orcutt)
modelco<-cochrane.orcutt(model,max.iter = 100)
modelco
## Cochrane-orcutt estimation for first order autocorrelation 
##  
## Call:
## lm(formula = dataregresi$IPM ~ dataregresi$Tahun, data = dataregresi)
## 
##  number of interaction: 76
##  rho 0.651462
## 
## Durbin-Watson statistic 
## (original):    0.77240 , p-value: 1.426e-03
## (transformed): 1.94827 , p-value: 3.15e-01
##  
##  coefficients: 
##       (Intercept) dataregresi$Tahun 
##       -613.259516          0.340992

Dengan menggunakan estimasi cochrane-orcutt didapatkan rho sebesar 0.651462. dan terlihat nilai p-value durbin watson meningkat dari 0.001426 menjadi 0.315. Sehingga permasalahan autokorelasi sudah teratasi.

Menggunakan Metode Hildreth-Lu

Rho yang didatkan dari metode Cochrane–Orcutt akan digunakan dalam metode Hildreth-Lu

library(HoRM)
## Registered S3 method overwritten by 'quantmod':
##   method            from
##   as.zoo.data.frame zoo
modelhl<-hildreth.lu(dataregresi$IPM,dataregresi$Tahun,modelco$rho)
summary(modelhl)
## 
## Call:
## lm(formula = y ~ x)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -0.210916 -0.128456 -0.008725  0.080172  0.291371 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -213.74430   30.20039  -7.078 5.81e-05 ***
## x              0.34099    0.04294   7.941 2.35e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.157 on 9 degrees of freedom
## Multiple R-squared:  0.8751, Adjusted R-squared:  0.8612 
## F-statistic: 63.06 on 1 and 9 DF,  p-value: 2.348e-05
dwtest(modelhl)
## 
##  Durbin-Watson test
## 
## data:  modelhl
## DW = 1.9483, p-value = 0.315
## alternative hypothesis: true autocorrelation is greater than 0

Sama halnya menggunakan metode cochrane-orcutt p-value uji durbin-watson > 0.05. Sehingga permasalahan autokorelasi sudah teratasi.

Uji Asumsi Kondisi Gauss-Markov Model Penanganan

Walaupun telah berhasil menangani permasalahan autokorelasi, model regresi hasil penanganan juga harus memenuhi asumsi lainnya. Asumsi yang akan diuji adalah normalitas menggunakan Shapiro-Wilkinson dan homoskedastisitas menggunakan uji Breush-Pagan.

Uji Normalitas Regresi Hasil Penanganan

shapiro.test(modelco$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  modelco$residuals
## W = 0.83891, p-value = 0.02686
shapiro.test(modelhl$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  modelhl$residuals
## W = 0.9624, p-value = 0.8012

Berdasarkan uji saphiro-wilk diatas model penanganangan menggunakan metode cochrane-orcutt memiliki p-value < 0.05. Sehingga sisaan menyebar tidak normal.

Sedangkan model penanganangan menggunakan metode Hildreth-Lu memiliki p-value > 0.05. Sehingga cukup bukti untuk mengatakan sisaan menyebar normal.

Uji Homoskedastis Regresi Hasil Penanganan

bptest(modelco)
## 
##  studentized Breusch-Pagan test
## 
## data:  modelco
## BP = 0.061351, df = 1, p-value = 0.8044
bptest(modelhl)
## 
##  studentized Breusch-Pagan test
## 
## data:  modelhl
## BP = 0.061351, df = 1, p-value = 0.8044

Untuk uji homoskedastis kedua model memiliki p-value > 0.05. Artinya cukup bukti untuk mengatakan ragam sisaan homogen pada taraf nyata 5%.

Simpulan

Setelah dilakukan uji asumsi Gauss-Markov didapatkan model terbaik yang akan digunakan adalah model penanganan Hildreth-Lu.

Transformasi Balik

cat("y = ", coef(modelhl)[1]/(1-modelco$rho), "+", coef(modelhl)[2],"x", sep = "")
## y = -613.2595+0.3409918x

Didapatkan hasil persamaan Y= -613.2595 + 0.3409918X untuk model IPM Provinsi Kepulau Riau pada tahun 2010-2021.

Nilai -613.2595 menunjukkan besarnya nilai yang tidak dapat dijelaskan oleh model IPM Provinsi Kepualaun Riau pada tahun 2010-2021.

Nilai 0.3409918 menunjukkan bahwa setiap tahun besarnya kenaikan nilai IPM Provinsi Kepulauan Riau.