library(rsample)
library(DataExplorer)
library(sjPlot)
## Install package "strengejacke" from GitHub (`devtools::install_github("strengejacke/strengejacke")`) to load all sj-packages at once!
library(lmtest)
## Loading required package: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
library(openxlsx)
library(readxl)
library(plm)
Data
df <- read_excel(path = "Data/data_02.xlsx", col_names = TRUE, sheet="sheet1")
head(df)
## # A tibble: 6 x 8
## provinsi tahun ipm_p idg keluhan_p ahh_p exp_p tidak_sekolah_p
## <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 Aceh 2010 63.5 53.4 37.0 71.1 8.70 5.98
## 2 Aceh 2011 64.1 52.1 32.1 71.2 8.75 4.67
## 3 Aceh 2012 65.0 54.4 32.6 71.2 8.79 4.75
## 4 Aceh 2013 65.7 59.8 30.5 71.3 8.83 4.3
## 5 Aceh 2014 66.9 65.1 32.0 71.3 8.89 3.76
## 6 Aceh 2015 67.5 65.6 30.3 71.5 8.91 4.19
Analisis Data Panel DINAMIS
Membentuk Model
Melakukan Uji Wald
Uji Wald merupakan uji signifikansi model secara simultan untuk mengetahui ada tidaknya hubungan di dalam model. Hipotesis Uji Wald: H0 ∶ Tidak terdapat hubungan di dalam model H1 ∶ Terdapat hubungan di dalam model # Uji Sargan Uji Sargan digunakan untuk mengetahui validitas penggunaan peubah instrumen yang jumlahnya melebihi jumlah parameter yang diduga (kondisi overidentifying restriction). Hipotesisnya adalah: H0 ∶ Kondisi overidentifying restriction dalam pendugaan model valid H1 ∶ Kondisi overidentifying restriction dalam pendugaan model tidak valid
Melakukan Uji Arellano-Bond
Komponen vi,t merupakan sisaan yang diasumsikan tidak mengalami autokorelasi, namun pada pendugaan dalam proses first difference diperoleh (vi,t - vi,t-1), sehingga E(vi,t, vi,t-1) tidak perlu bernilai nol. Namun untuk ordo selanjutnya untuk melihat konsistensi penduga GMM, tetap dikenai asumsi E(vi,t, vi,t-2) = 0 atau tidak adanya autokorelasi antara vi,t dan vi,t-2. Statistik Arellano-Bond digunakan untuk menguji konsistensi penduga yang diperoleh dari proses GMM. Hipotesisnya adalah: H0 ∶ Tidak terdapat autokorelasi pada sisaan first difference orde ke-i H1 ∶ Terdapat autokorelasi pada sisaan first difference orde ke-i
Memilih model dinamis terbaik dengan melihat tiga kriteria berikut:
Tak bias
Penduga dari model data panel dengan AR(1) apabila diduga dengan model gabungan akan menghasilkan penduga yang bersifat bias ke atas (biased upwards), sebaliknya apabila diduga dengan model pengaruh tetap akan menghasilkan penduga yang bersifat bias ke bawah (biased downwards). Penduga tak bias berada di antara keduanya. ## Instrumen valid Validitas diperiksa dengan menggunakan Uji Sargan. Instrumen disebut valid jika Uji Sargan tidak menolak 𝐻o. ## Konsisten Sifat konsistensi dari penduga dapat diperiksa dengan Uji Arellano-Bond m1 dan m2. Penduga disebut konsisten apabila statistik m1 menunjukkan menolak H0, sedangkan statistik m2 tidak menolak 𝐻0.
Model FD-GMM
Melakukan pendugaan parameter menggunakan First Differences generalized method of moments (FD-GMM) Arellano dan Bond (1991) melakukan prosedur pembedaan pertama (first difference) pada persamaan regresi data panel dinamis tanpa peubah penjelas untuk memperoleh instrumen first difference yang valid (berkorelasi dengan yi,t- 1-yi,t-2 dan tidak berkorelasi dengan vi,t-vi,t-1 sehingga menghilangkan pengaruh individu μi). Instrumen GMM dengan lag dari peubah respons mulai dari t-2, atau disebut FD-GMM.
fd.gmm <- pgmm(formula = ipm_p ~ lag(ipm_p) + idg + keluhan_p + ahh_p +
exp_p + tidak_sekolah_p | lag(ipm_p, 2:11),
data = df, effect = "individual", model = "twosteps",
transformation = "d")
## Warning in pgmm(formula = ipm_p ~ lag(ipm_p) + idg + keluhan_p + ahh_p + : the
## second-step matrix is singular, a general inverse is used
summary(fd.gmm)
## Warning in vcovHC.pgmm(object): a general inverse is used
## Oneway (individual) effect Two-steps model Difference GMM
##
## Call:
## pgmm(formula = ipm_p ~ lag(ipm_p) + idg + keluhan_p + ahh_p +
## exp_p + tidak_sekolah_p | lag(ipm_p, 2:11), data = df, effect = "individual",
## model = "twosteps", transformation = "d")
##
## Balanced Panel: n = 34, T = 10, N = 340
##
## Number of Observations Used: 272
## Residuals:
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## -1.481633 -0.138940 0.004444 0.006417 0.144060 2.462326
##
## Coefficients:
## Estimate Std. Error z-value Pr(>|z|)
## lag(ipm_p) 0.6598693 0.0313858 21.0244 < 2.2e-16 ***
## idg 0.0147235 0.0107936 1.3641 0.172538
## keluhan_p 0.0022181 0.0085362 0.2598 0.794982
## ahh_p 0.6764240 0.2397169 2.8218 0.004776 **
## exp_p 4.1528557 0.5900541 7.0381 1.949e-12 ***
## tidak_sekolah_p 0.0195894 0.0133972 1.4622 0.143685
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Sargan test: chisq(35) = 31.32533 (p-value = 0.6462)
## Autocorrelation test (1): normal = -1.784282 (p-value = 0.074378)
## Autocorrelation test (2): normal = -1.049412 (p-value = 0.29399)
## Wald test for coefficients: chisq(6) = 6438.45 (p-value = < 2.22e-16)
summary.fd.gmm <- summary(fd.gmm)
## Warning in vcovHC.pgmm(object): a general inverse is used
Uji Wald
Oleh karena nilai p-value kurang dari taraf uji 0.05 maka dapat disimpulkan bahwa terdapat hubungan di dalam model.
summary.fd.gmm$wald.coef[1]
## $statistic
## chisq
## 6438.45
summary.fd.gmm$wald.coef[2]
## $p.value
## chisq
## 0
summary.fd.gmm$wald.coef[3]
## $parameter
## df
## 6
Uji Sargan
Untuk melihat validitas instrumen digunakan hasil Uji Sargan. Berdasarkan Uji Sargan diperoleh hasil bahwa kedua model, memiliki nilai signifikansi di atas taraf uji 0.05 untuk uji ini. Oleh karenanya dapat disimpulkan bahwa instrumen bersifat valid pada kedua model.
summary.fd.gmm$sargan[1]
## $statistic
## chisq
## 31.32533
summary.fd.gmm$sargan[2]
## $p.value
## chisq
## 0.6462028
summary.fd.gmm$sargan[3]
## $parameter
## df
## 35
Uji Arellano Bond m1
summary.fd.gmm$m1[1]
## $statistic
## [,1]
## [1,] -1.784282
## attr(,"names")
## [1] "normal"
summary.fd.gmm$m1[2]
## $p.value
## [,1]
## [1,] 0.07437778
Uji Arellano Bond m2
summary.fd.gmm$m2[1]
## $statistic
## [,1]
## [1,] -1.049412
## attr(,"names")
## [1] "normal"
summary.fd.gmm$m2[2]
## $p.value
## [,1]
## [1,] 0.2939887
konsistensi penduga pada kedua model dilakukan dengan melihat statistik m1 dan m2 dari Uji Arellano-Bond. Penduga disebut konsisten apabila statistik m1 menunjukkan menolak H0, sedangkan statistik m2 tidak menolak H0. Berdasarkan hasil pengujian, statistik m1 dan m2 pada kedua model memiliki nilai signifikansi yang lebih dari taraf uji 0.05 sehingga disimpulkan penduga tidak konsisten.
Model SYS-GMM
Melakukan pendugaan parameter menggunakan System GMM (SYS-GMM) Metode SYS-(GMM) pada konsep dasarnya adalah menggunakan lagged level dari yi,t sebagai peubah instrumen persamaan dalam first differences dan menggunakan lagged differences dari yi,t sebagai peubah instrumen persamaan dalam level (Blundell dan Bond 1998), sehingga tidak hanya menggunakan momen kondisi dan matriks peubah instrumen dari model first difference yang ditemukan oleh Arellano dan Bond (1991). Blundell dan Bond (1998) melakukan kombinasi momen kondisi first difference dan momen kondisi level serta matriks peubah instrumen first difference dan matriks peubah instrumen level.
sys.gmm <- pgmm(formula = ipm_p ~ lag(ipm_p) + idg + keluhan_p + ahh_p +
exp_p + tidak_sekolah_p | lag(ipm_p, 2:11),
data = df, effect = "individual", model = "twosteps",
transformation = "ld")
## Warning in pgmm(formula = ipm_p ~ lag(ipm_p) + idg + keluhan_p + ahh_p + : the
## second-step matrix is singular, a general inverse is used
summary(sys.gmm)
## Warning in vcovHC.pgmm(object): a general inverse is used
## Oneway (individual) effect Two-steps model System GMM
##
## Call:
## pgmm(formula = ipm_p ~ lag(ipm_p) + idg + keluhan_p + ahh_p +
## exp_p + tidak_sekolah_p | lag(ipm_p, 2:11), data = df, effect = "individual",
## model = "twosteps", transformation = "ld")
##
## Balanced Panel: n = 34, T = 10, N = 340
##
## Number of Observations Used: 578
## Residuals:
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## -4.570688 -0.169461 0.001610 0.002051 0.173063 4.008976
##
## Coefficients:
## Estimate Std. Error z-value Pr(>|z|)
## lag(ipm_p) 0.91740503 0.02085435 43.9911 < 2e-16 ***
## idg -0.00050308 0.00670204 -0.0751 0.94016
## keluhan_p 0.01059601 0.00823471 1.2867 0.19818
## ahh_p 0.01545923 0.01715804 0.9010 0.36759
## exp_p 0.53433128 0.22372513 2.3883 0.01692 *
## tidak_sekolah_p -0.01628794 0.00841680 -1.9352 0.05297 .
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Sargan test: chisq(48) = 28.27162 (p-value = 0.98962)
## Autocorrelation test (1): normal = -1.208332 (p-value = 0.22692)
## Autocorrelation test (2): normal = 0.7609672 (p-value = 0.44668)
## Wald test for coefficients: chisq(6) = 3121486 (p-value = < 2.22e-16)
summary.sys.gmm<-summary(sys.gmm)
## Warning in vcovHC.pgmm(object): a general inverse is used
Uji Wald
Oleh karena nilai p-value kurang dari taraf uji 0.05 maka dapat disimpulkan bahwa terdapat hubungan di dalam model.
summary.sys.gmm$wald.coef[1]
## $statistic
## chisq
## 3121486
summary.sys.gmm$wald.coef[2]
## $p.value
## chisq
## 0
summary.sys.gmm$wald.coef[3]
## $parameter
## df
## 6
Uji Sargan
Untuk melihat validitas instrumen digunakan hasil Uji Sargan. Berdasarkan Uji Sargan diperoleh hasil bahwa kedua model, memiliki nilai signifikansi di atas taraf uji 0.05 untuk uji ini. Oleh karenanya dapat disimpulkan bahwa instrumen bersifat valid.
summary.sys.gmm$sargan[1]
## $statistic
## chisq
## 28.27162
summary.sys.gmm$sargan[2]
## $p.value
## chisq
## 0.9896248
summary.sys.gmm$sargan[3]
## $parameter
## df
## 48
Uji Arellano Bond m1
summary.sys.gmm$m1[1]
## $statistic
## [,1]
## [1,] -1.208332
## attr(,"names")
## [1] "normal"
summary.sys.gmm$m1[2]
## $p.value
## [,1]
## [1,] 0.2269195
Uji Arellano Bond m2
summary.sys.gmm$m2[1]
## $statistic
## [,1]
## [1,] 0.7609672
## attr(,"names")
## [1] "normal"
summary.sys.gmm$m2[2]
## $p.value
## [,1]
## [1,] 0.4466767
konsistensi penduga pada kedua model dilakukan dengan melihat statistik m1 dan m2 dari Uji Arellano-Bond. Penduga disebut konsisten apabila statistik m1 menunjukkan menolak H0, sedangkan statistik m2 tidak menolak H0. Berdasarkan hasil pengujian, statistik m1 dan m2 pada kedua model memiliki nilai signifikansi yang lebih dari taraf uji 0.05 sehingga disimpulkan penduga tidak konsisten.
Kriteria model terbaik antara model FD-GMM dan SYS-GMM tidak dapat dilakukan dengan kriteria penduga tak bias, validitas instrumen, dan konsistensi dari penduga. Hal ini disebabkan kriteria ketiganya yang sama untuk kedua model, yaitu bias, instrumen valid, dan penduga tak konsisten. Meskipun demikian, dapat dipertimbangkan penggunaan taraf uji 0.1 yang dapat menghasilkan penduga konsisten bagi model FD-GMM. Selain itu, nilai penduga lag IPM perempuan untuk model FD-GMM lebih dekat ke penduga lag IPM perempuan model gabungan sehingga model FD-GMM dapat dipilih dibandingkan SYS-GMM.
Evaluasi dan Interpretasi Model
Pemilihan model terbaik dapat didasarkan pada nilai mean absolute percentage error (MAPE) yang terkecil dari kedua metode. Nilai MAPE untuk pendugaan model regresi data panel statis pengaruh tetap individu dan model regresi data panel dinamis FD-GMM dapat dilihat pada Tabel 11. Nilai MAPE untuk model regresi data panel dinamis (model FD-GMM) lebih kecil dibandingkan dengan model regresi data panel statis (model pengaruh tetap individu). Dengan demikian dapat disimpulkan bahwa model regresi data panel dinamis (model FD GMM) lebih baik dibandingkan dengan model regresi data panel statis (model pengaruh tetap individu).
Interpretasi dilakukan terhadap model regresi data panel dinamis FD-GMM yang terbentuk dan ditetapkan sebagai model yang lebih baik. Pada model regresi data panel dinamis FD-GMM, terdapat tiga peubah penjelas yang nyata berpengaruh terhadap respons IPM perempuan dengan taraf nyata 5%, yaitu IPM perempuan tahun sebelumnya (lag IPM perempuan), angka harapan hidup perempuan, dan logaritma natural dari pengeluaran per kapita yang disesuaikan untuk penduduk perempuan.
Interpretasi terhadap koefisien regresi data panel dinamis FD-GMM adalah sebagai berikut:
Koefisien peubah lag IPM perempuan sebesar 0.660 menunjukkan bahwa jika nilai IPM perempuan tahun sebelumnya naik sebesar 1 persen maka IPM perempuan tahun ini akan naik sebesar 0.660 persen, begitu pula sebaliknya dengan asumsi peubah lain yang ada dalam model tetap.
Koefisien Indeks Pemberdayaan Gender (IDG) sebesar 0.015 menunjukkan bahwa jika terjadi peningkatan IDG sebesar 1 persen maka IPM perempuan akan naik sebesar 0.015 persen, begitu pula sebaliknya dengan asumsi peubah lain yang ada dalam model tetap.
Koefisien penduduk perempuan yang mempunyai keluhan kesehatan sebesar 0.002 menunjukkan bahwa jika terjadi peningkatan persentase penduduk perempuan yang mempunyai keluhan kesehatan sebesar 1 persen maka IPM perempuan akan naik sebesar 0.002 persen, begitu pula sebaliknya dengan asumsi peubah lain yang ada dalam model tetap.
Koefisien angka harapan hidup perempuan sebesar 0.676 menunjukkan bahwa jika terjadi peningkatan angka harapan hidup perempuan sebesar 1 tahun maka IPM perempuan akan naik sebesar 0.676 persen, begitu pula sebaliknya dengan asumsi peubah lain yang ada dalam model tetap.
Koefisien pengeluaran per kapita yang disesuaikan untuk penduduk perempuan sebesar 4.153 ditujukan untuk logaritma natural dari besaran pengeluaran per kapita yang disesuaikan untuk penduduk perempuan. Koefisien 4.153 menunjukkan bahwa jika terjadi peningkatan pengeluaran per kapita yang disesuaikan untuk penduduk perempuan sebesar 1 satuan (seribu rupiah) maka IPM perempuan akan naik sebesar 0.04153 persen, begitu pula sebaliknya dengan asumsi peubah lain yang ada dalam model tetap.
Koefisien persentase penduduk perempuan 10 tahun ke atas yang tidak/belum pernah sekolah sebesar 0.020 menunjukkan bahwa jika terjadi peningkatan persentase penduduk perempuan 10 tahun ke atas yang tidak/belum pernah sekolah sebesar 1 persen maka IPM perempuan akan naik sebesar 0.020 persen, begitu pula sebaliknya dengan asumsi peubah lain yang ada dalam model tetap.
SIMPULAN DAN SARAN
Pendugaan model regresi data panel dinamis dengan FD-GMM memiliki nilai MAPE yang lebih kecil dibandingkan dengan model pengaruh tetap individu. Hal ini menunjukkan bahwa model FD-GMM lebih baik untuk memodelkan Indeks Pembangunan Manusia (IPM) perempuan tingkat provinsi di Indonesia. Model yang memasukkan peubah IPM perempuan tahun sebelumnya (lag peubah IPM perempuan) memiliki tingkat kesalahan pendugaan yang lebih rendah dibandingkan dengan model yang tidak memasukan peubah tersebut.
Terdapat tiga peubah penjelas yang memiliki pengaruh positif nyata terhadap respons IPM perempuan dengan taraf nyata 5%, yaitu IPM perempuan tahun sebelumnya, angka harapan hidup perempuan, dan logaritma natural dari pengeluaran per kapita yang disesuaikan untuk penduduk perempuan.