Pemodelan Indeks Pembangunan Gender di Kalimantan Timur Tahun 2017 - 2021 dengan Regresi Data Panel

Data

Data yang digunakan merupakan dataset Indeks Pembangunan Gender (IPG) di Provinsi Kalimantan Timur pada tahun 2017 - 2021 yang bersumber dari Badan Pusat Statistik Provinsi Kalimantan Timur. Peubah yang digunakan pada dataset antara lain sebagai berikut:

  1. Kabupaten/Kota di Provinsi Kalimantan Timur
  2. Tahun (2017-2021)
  3. Indeks Pembangunan Gender (IPG)
  4. Tingkat Partisipasi Angkatan Kerja (%)
  5. Pengeluaran per Kapita Laki-Laki (Ribu Rupiah/Kapita/Tahun)
  6. Pengeluaran per Kapita Perempuan (Ribu Rupiah/Kapita/Tahun)
  7. Harapan Lama Sekolah Perempuan (Tahun)
  8. Rata-Rata Lama Sekolah Perempuan (Tahun)
  9. Sumbangan Pendapatan Perempuan (%)
library(readxl)
dt <- read_excel("C:/Users/ASUS/Downloads/Dataset ADP Kel3.xlsx")
head(dt)
## # A tibble: 6 × 10
##   Kabkot      Tahun   IPG  TPAK   PKL   PKP   HLS   RLS   SPP   PTP
##   <chr>       <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 Paser        2017  69.8  62.2 16968  2733  13.4  7.78  23.1  44.4
## 2 Paser        2018  70.6  66.8 17299  2869  13.4  7.79  23.3  43.6
## 3 Paser        2019  71.4  66.2 17761  2968  13.4  8.12  23.4  46.9
## 4 Paser        2020  71.2  67.9 16973  2902  13.5  8.13  23.7  45.0
## 5 Paser        2021  71.2  65.3 17502  2965  13.5  8.36  23.7  41.2
## 6 Kutai Barat  2017  83.3  66.0 14622  5549  12.8  7.59  25.4  49.9
# data yang dipakai ini
dt1 <- dt[,-10]
head(dt1)
## # A tibble: 6 × 9
##   Kabkot      Tahun   IPG  TPAK   PKL   PKP   HLS   RLS   SPP
##   <chr>       <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 Paser        2017  69.8  62.2 16968  2733  13.4  7.78  23.1
## 2 Paser        2018  70.6  66.8 17299  2869  13.4  7.79  23.3
## 3 Paser        2019  71.4  66.2 17761  2968  13.4  8.12  23.4
## 4 Paser        2020  71.2  67.9 16973  2902  13.5  8.13  23.7
## 5 Paser        2021  71.2  65.3 17502  2965  13.5  8.36  23.7
## 6 Kutai Barat  2017  83.3  66.0 14622  5549  12.8  7.59  25.4

Eksplorasi Data

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
dataipg <- dt1 %>% 
  dplyr::select(c(Kabkot, Tahun, IPG))%>%
  group_by(Tahun) %>%
 summarise(across(where(is.numeric), mean))

dataipg
## # A tibble: 5 × 2
##   Tahun   IPG
##   <dbl> <dbl>
## 1  2017  82.6
## 2  2018  82.9
## 3  2019  83.2
## 4  2020  83.1
## 5  2021  83.3
library(ggplot2)
ggplot(dataipg) +
 aes(x = Tahun, y = IPG) +
  geom_line(color = "darkblue") +
 geom_point(shape = "circle", size = 3, colour = "maroon") +
 labs(x = "Tahun", y = "IPG", title = "Rata-Rata IPG di Provinsi Kaltim", subtitle = "Tahun 2017-2021") +
 theme_gray()

Gambar di atas merupakan diagram garis rata-rata IPG di Provinsi Kaltim berdasarkan tahun. Berdasarkan plot di atas, terlihat bahwa rata-rata IPG di Provinsi Kaltim pada tahun 2017-2019 mengalami peningkatan dan menurun pada tahun 2020. Akan tetapi, rata-rata IPG kembali meningkat pada tahun 2021.

options(dplyr.summarise.inform = FALSE)
dataProv <- dt1%>%                        # Group data
  group_by(Kabkot, Tahun, IPG) %>%
  dplyr::summarise(summarise(across(where(is.numeric), mean)))
dataProv
## # A tibble: 50 × 3
## # Groups:   Kabkot, Tahun [50]
##    Kabkot     Tahun   IPG
##    <chr>      <dbl> <dbl>
##  1 Balikpapan  2017  89.7
##  2 Balikpapan  2018  89.8
##  3 Balikpapan  2019  89.7
##  4 Balikpapan  2020  89.6
##  5 Balikpapan  2021  89.8
##  6 Berau       2017  87.8
##  7 Berau       2018  87.9
##  8 Berau       2019  87.9
##  9 Berau       2020  87.6
## 10 Berau       2021  87.8
## # … with 40 more rows
library(ggplot2)
ggplot(dataProv) +
 aes(x = Tahun, y = IPG, colour = Kabkot, group = Kabkot) +
 geom_line(size = 1) +
 scale_color_manual(values = c(Balikpapan = "#6E2621", 
Berau = "#D74B0C", Bontang = "#A1A400", `Kutai Barat` = "#A5A8E9", `Kutai Kartanegara` = "#2F2933", `Kutai Timur` = "#00BDBD", 
`Mahakam Ulu` = "#ECCD20", Paser = "#253792", `Penajam Paser Utara` = "#9417AD", Samarinda = "pink"
)) +
 theme_gray()
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.

Gambar di atas merupakan diagram garis IPG di Provinsi Kaltim berdasarkan kabupaten/kota dan tahun. Berdasarkan plot di atas, terlihat bahwa IPG setiap kabupaten/kota di Provinsi Kaltim berada di peringkat yang sama sejak tahun 2017-2021. Kabupaten/kota dengan IPG tertinggi adalah Balikpapan dan diikuti dengan Samarinda yang merupakan ibukota Provinsi Kaltim. Sementara itu, terdapat satu kabupaten/kota yang nilai IPG-nya cenderung rendah, yaitu Kabupaten Paser.

library(DataExplorer)
dt1$Tahun <- as.factor(dt1$Tahun)
plot_boxplot(dt1[,c(1,2,3)], by="Tahun")

Gambar di atas merupakan boxplot IPG di Provinsi Kaltim berdasarkan tahun. Berdasarkan boxplot, terlihat bahwa IPG setiap tahun memiliki distribusi data menjulur ke kiri. Artinya, terdapat lebih banyak kabupaten/kota yang memiliki IPG bernilai rendah.

library(corrplot)
## corrplot 0.92 loaded
korel<-cor(dt[,-c(1,2,10)])
corrplot(korel, type ="upper", method="number")

Peubah penjelas yang memiliki korelasi tinggi dengan IPG adalah peubah PKP, dengan nilai koefisien korelasi sebesar 0,91. Artinya, besar pengeluaran per kapita perempuan memiliki hubungan positif yang kuat dengan nilai IPG. Sementara peubah penjelas yang memiliki korelasi rendah dengan IPG adalah peubah SPP, dengan nilai 0.18.

Selain itu, terdapat peubah penjelas yang memiliki korelasi tinggi dengan peubah penjelas lainnya, seperti peubah PKL dan PKP. Hal ini dapat mengindikasikan adanya multikolinearitas antarpeubah penjelas yang digunakan.

Uji Multikolinearitas

Nilai VIF > 10 mengindikasikan adanya masalah multikolinearitas (Ryan 1997).

library(car)
model = lm(IPG~TPAK+PKL+PKP+HLS+RLS+SPP, data = dt)
vif(model)
##      TPAK       PKL       PKP       HLS       RLS       SPP 
##  2.742419 14.374890  4.167895  2.568462 10.373657  2.113963

Didapatkan peubah PKL dan RLS memiliki VIF > 10.

Setelah itu, dilakukan eliminasi terhadap peubah dengan nilai VIF tertinggi, yaitu PKL. Dan diperiksa kembali nilai VIF-nya.

model1 = lm(IPG~TPAK+PKP+HLS+RLS+SPP, data = dt)
vif(model1)
##     TPAK      PKP      HLS      RLS      SPP 
## 1.500798 3.408834 2.281179 4.237061 1.504592

Setelah peubah PKL dihilangkan, tidak terdeteksi adanya multikolinearitas (VIF < 10)

CEM

Common Effect Model (CEM), disebut juga sebagai Pooled Least Square merupakan salah satu model dalam regresi data panel yang menggabungkan data time series dan cross-section sebagai satu kesatuan (Gujarati 2004).

library(plm)
## 
## Attaching package: 'plm'
## The following objects are masked from 'package:dplyr':
## 
##     between, lag, lead
cem <- plm(IPG ~ TPAK + PKP + HLS + RLS + SPP,
           data=dt1,
           model="pooling")

summary(cem)
## Pooling Model
## 
## Call:
## plm(formula = IPG ~ TPAK + PKP + HLS + RLS + SPP, data = dt1, 
##     model = "pooling")
## 
## Balanced Panel: n = 10, T = 5, N = 50
## 
## Residuals:
##     Min.  1st Qu.   Median  3rd Qu.     Max. 
## -4.09514 -0.68801  0.12792  0.84765  3.10191 
## 
## Coefficients:
##                Estimate  Std. Error t-value  Pr(>|t|)    
## (Intercept) 65.46871374  8.11363776  8.0690 3.212e-10 ***
## TPAK         0.24033585  0.06876093  3.4952  0.001094 ** 
## PKP          0.00311827  0.00015338 20.3308 < 2.2e-16 ***
## HLS          1.01067132  0.42823037  2.3601  0.022769 *  
## RLS         -3.28486686  0.42740238 -7.6857 1.145e-09 ***
## SPP         -0.16064699  0.06007160 -2.6743  0.010472 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Total Sum of Squares:    1763.6
## Residual Sum of Squares: 105.51
## R-Squared:      0.94017
## Adj. R-Squared: 0.93338
## F-statistic: 138.294 on 5 and 44 DF, p-value: < 2.22e-16

Semua peubah penjelas dalam model CEM berpengaruh signifikan terhadap peubah respon (IPG) pada taraf nyata 5%. Didapatkan nilai R-Squared sebesar 0.94017 dan Adj R-squared sebesar 0.93338 yang berarti bahwa peubah penjelas model mampu menjelaskan sebesar 93.38% keragaman peubah respon.

FEM

Pendekatan efek tetap atau fixed effect adalah bahwa suatu objek memiliki konstanta yang tetap besarannya untuk berbagai periode waktu. Demikian juga dengan koefisien regresinya, tetap besarannya dari waktu ke waktu. Model fixed effect adalah model dengan intercept berbeda-beda untuk setiap individu, tetapi slope setiap subjek tidak berubah seiring waktu (Gujarati 2004).

# fem individual
fem.ind <- plm(IPG ~ TPAK + PKP + HLS + RLS + SPP, data = dt1, 
               model = "within",effect= "individual", index = c("Kabkot","Tahun"))

summary(fem.ind)
## Oneway (individual) effect Within Model
## 
## Call:
## plm(formula = IPG ~ TPAK + PKP + HLS + RLS + SPP, data = dt1, 
##     effect = "individual", model = "within", index = c("Kabkot", 
##         "Tahun"))
## 
## Balanced Panel: n = 10, T = 5, N = 50
## 
## Residuals:
##      Min.   1st Qu.    Median   3rd Qu.      Max. 
## -0.685520 -0.079220 -0.015385  0.124871  0.452584 
## 
## Coefficients:
##        Estimate Std. Error t-value Pr(>|t|)   
## TPAK 0.00652688 0.02039335  0.3200 0.750834   
## PKP  0.00045849 0.00031465  1.4571 0.154000   
## HLS  0.32040580 0.45245477  0.7081 0.483542   
## RLS  0.99267917 0.30480963  3.2567 0.002506 **
## SPP  0.03682714 0.19513078  0.1887 0.851394   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Total Sum of Squares:    5.6826
## Residual Sum of Squares: 2.5205
## R-Squared:      0.55645
## Adj. R-Squared: 0.37903
## F-statistic: 8.78183 on 5 and 35 DF, p-value: 1.791e-05

Model FEM Individual hanya memiliki satu peubah penjelas yang berpengaruh secara signifikan terhadap peubah respon pada taraf nyata 5%, yaitu peubah RLS. Model ini memiliki nilai R-Squared dan Adj. R-Squared yang relatif rendah, yaitu sebesar 0.55645 dan 0.37903.

# fem time
fem.time <- plm(IPG ~ TPAK + PKP + HLS + RLS + SPP, dt1, model = "within", effect= "time", index = c("Kabkot","Tahun"))

summary(fem.time)
## Oneway (time) effect Within Model
## 
## Call:
## plm(formula = IPG ~ TPAK + PKP + HLS + RLS + SPP, data = dt1, 
##     effect = "time", model = "within", index = c("Kabkot", "Tahun"))
## 
## Balanced Panel: n = 10, T = 5, N = 50
## 
## Residuals:
##     Min.  1st Qu.   Median  3rd Qu.     Max. 
## -3.41824 -0.96071  0.24473  0.88264  2.53727 
## 
## Coefficients:
##         Estimate  Std. Error t-value  Pr(>|t|)    
## TPAK  0.21674486  0.07215860  3.0037  0.004584 ** 
## PKP   0.00318539  0.00015612 20.4029 < 2.2e-16 ***
## HLS   0.97521966  0.42920212  2.2722  0.028525 *  
## RLS  -3.50656670  0.44081020 -7.9548 9.103e-10 ***
## SPP  -0.17672040  0.06034915 -2.9283  0.005602 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Total Sum of Squares:    1760.9
## Residual Sum of Squares: 94.891
## R-Squared:      0.94611
## Adj. R-Squared: 0.93399
## F-statistic: 140.453 on 5 and 40 DF, p-value: < 2.22e-16

Seluruh peubah penjelas dalam model FEM Time memiliki pengaruh yang signifikan terhadap peubah respon pada taraf nyata 5%. Model ini memiliki nilai R-Squared dan Adj. R-Squared yang sangat tinggi, lebih dari 0.9.

# fem two-way
fem.twoway <- plm(IPG ~ TPAK + PKP + HLS + RLS + SPP, dt1, model = "within", effect = "twoway", index = c("Kabkot","Tahun"))

summary(fem.twoway)
## Twoways effects Within Model
## 
## Call:
## plm(formula = IPG ~ TPAK + PKP + HLS + RLS + SPP, data = dt1, 
##     effect = "twoway", model = "within", index = c("Kabkot", 
##         "Tahun"))
## 
## Balanced Panel: n = 10, T = 5, N = 50
## 
## Residuals:
##      Min.   1st Qu.    Median   3rd Qu.      Max. 
## -0.637465 -0.122321 -0.021675  0.118849  0.439089 
## 
## Coefficients:
##         Estimate  Std. Error t-value Pr(>|t|)   
## TPAK  0.00728922  0.02296903  0.3174 0.753106   
## PKP  -0.00100108  0.00086139 -1.1622 0.254033   
## HLS   0.93140983  0.56980225  1.6346 0.112245   
## RLS   1.43730852  0.49734218  2.8900 0.006975 **
## SPP   0.17317199  0.22384787  0.7736 0.445018   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Total Sum of Squares:    2.9862
## Residual Sum of Squares: 2.005
## R-Squared:      0.32858
## Adj. R-Squared: -0.061271
## F-statistic: 3.03421 on 5 and 31 DF, p-value: 0.024175

Model FEM Two-ways hanya memiliki satu peubah penjelas yang berpengaruh secara signifikan terhadap peubah respon pada taraf nyata 5%, yaitu peubah RLS. Model ini memiliki nilai R-Squared dan Adj. R-Squared yang relatif rendah.

REM

Random effect merupakan pendekatan untuk mengestimasi data panel dengan residual memiliki kemungkinan saling berhubungan antar waktu dan individu. Dalam model random effect, parameter-parameter yang berbeda antar individu dan antar waktu dimasukkan ke dalam error sehingga model ini juga disebut sebagai error component model (Gujarati 2004).

# rem individual
rem_ind <- plm(IPG ~ TPAK + PKP + HLS + RLS + SPP, data = dt1, index = c("Kabkot", "Tahun"), effect = "individual", model = "random", random.method = "amemiya")

summary(rem_ind)
## Oneway (individual) effect Random Effect Model 
##    (Amemiya's transformation)
## 
## Call:
## plm(formula = IPG ~ TPAK + PKP + HLS + RLS + SPP, data = dt1, 
##     effect = "individual", model = "random", random.method = "amemiya", 
##     index = c("Kabkot", "Tahun"))
## 
## Balanced Panel: n = 10, T = 5, N = 50
## 
## Effects:
##                    var  std.dev share
## idiosyncratic  0.06301  0.25102 0.003
## individual    18.95768  4.35404 0.997
## theta: 0.9742
## 
## Residuals:
##       Min.    1st Qu.     Median    3rd Qu.       Max. 
## -0.8823180 -0.1220893 -0.0052289  0.1210330  0.5077882 
## 
## Coefficients:
##               Estimate Std. Error z-value  Pr(>|z|)    
## (Intercept) 6.5283e+01 4.8247e+00 13.5310 < 2.2e-16 ***
## TPAK        6.9003e-03 2.0052e-02  0.3441 0.7307528    
## PKP         7.3138e-04 2.7272e-04  2.6818 0.0073218 ** 
## HLS         2.6248e-01 4.2990e-01  0.6106 0.5414880    
## RLS         9.6597e-01 2.7641e-01  3.4947 0.0004746 ***
## SPP         1.8165e-02 1.5998e-01  0.1135 0.9095958    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Total Sum of Squares:    6.8505
## Residual Sum of Squares: 3.0783
## R-Squared:      0.55065
## Adj. R-Squared: 0.49958
## Chisq: 53.9184 on 5 DF, p-value: 2.1784e-10

Terdapat dua peubah penjelas dalam model REM Individual berpengaruh signifikan terhadap peubah respon (IPG) pada taraf nyata 5% yaitu peubah PKP & RLS. Model REM Individual memiliki nilai R-Squared dan Adj R-squared yang relatif rendah.

# rem time
rem_time <- plm(IPG ~ TPAK + PKP + HLS + RLS + SPP, data = dt1, index = c("Kabkot", "Tahun"), effect = "time", model = "random", random.method = "amemiya")

summary(rem_time)
## Oneway (time) effect Random Effect Model 
##    (Amemiya's transformation)
## 
## Call:
## plm(formula = IPG ~ TPAK + PKP + HLS + RLS + SPP, data = dt1, 
##     effect = "time", model = "random", random.method = "amemiya", 
##     index = c("Kabkot", "Tahun"))
## 
## Balanced Panel: n = 10, T = 5, N = 50
## 
## Effects:
##                   var std.dev share
## idiosyncratic 2.10870 1.45214 0.989
## time          0.02308 0.15193 0.011
## theta: 0.05061
## 
## Residuals:
##     Min.  1st Qu.   Median  3rd Qu.     Max. 
## -4.06128 -0.69360  0.13900  0.83246  3.07807 
## 
## Coefficients:
##                Estimate  Std. Error z-value  Pr(>|z|)    
## (Intercept) 65.79433960  8.12469276  8.0981 5.584e-16 ***
## TPAK         0.23846026  0.06877570  3.4672 0.0005259 ***
## PKP          0.00312424  0.00015299 20.4212 < 2.2e-16 ***
## HLS          1.00808382  0.42655620  2.3633 0.0181126 *  
## RLS         -3.30434082  0.42682236 -7.7417 9.808e-15 ***
## SPP         -0.16207097  0.05984962 -2.7080 0.0067696 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Total Sum of Squares:    1763.3
## Residual Sum of Squares: 104.54
## R-Squared:      0.94071
## Adj. R-Squared: 0.93397
## Chisq: 698.139 on 5 DF, p-value: < 2.22e-16

Semua peubah penjelas dalam model REM Time berpengaruh signifikan terhadap peubah respon (IPG) pada taraf nyata 5%. Model REM Time memiliki nilai Adj R-squared sebesar 0.93397 yang berarti bahwa peubah penjelas model mampu menjelaskan keragaman peubah respon sebesar 93.39%.

# rem two-way
rem_twoway <- plm(IPG ~ TPAK + PKP + HLS + RLS + SPP, data = dt1, index = c("Kabkot", "Tahun"), effect = "twoways", model = "random", random.method = "amemiya")
summary(rem_twoway)
## Twoways effects Random Effect Model 
##    (Amemiya's transformation)
## 
## Call:
## plm(formula = IPG ~ TPAK + PKP + HLS + RLS + SPP, data = dt1, 
##     effect = "twoways", model = "random", random.method = "amemiya", 
##     index = c("Kabkot", "Tahun"))
## 
## Balanced Panel: n = 10, T = 5, N = 50
## 
## Effects:
##                    var  std.dev share
## idiosyncratic  0.05569  0.23599 0.001
## individual    51.27724  7.16081 0.998
## time           0.04205  0.20507 0.001
## theta: 0.9853 (id) 0.658 (time) 0.658 (total)
## 
## Residuals:
##       Min.    1st Qu.     Median    3rd Qu.       Max. 
## -0.7966917 -0.0998610 -0.0067011  0.1085657  0.4985103 
## 
## Coefficients:
##               Estimate Std. Error z-value  Pr(>|z|)    
## (Intercept) 5.8695e+01 7.6111e+00  7.7118 1.241e-14 ***
## TPAK        8.1585e-03 1.9706e-02  0.4140    0.6789    
## PKP         1.5138e-04 4.7157e-04  0.3210    0.7482    
## HLS         7.0829e-01 4.6205e-01  1.5329    0.1253    
## RLS         1.3515e+00 3.4489e-01  3.9187 8.901e-05 ***
## SPP         5.9343e-02 1.8346e-01  0.3235    0.7463    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Total Sum of Squares:    3.6833
## Residual Sum of Squares: 2.4972
## R-Squared:      0.32203
## Adj. R-Squared: 0.24499
## Chisq: 20.8998 on 5 DF, p-value: 0.00084612

Peubah penjelas RLS dalam model REM Individual berpengaruh signifikan terhadap peubah respon (IPG) pada taraf nyata 5%. Model REM Individual memiliki nilai R-Squared dan Adj R-squared yang relatif rendah.

Penentuan Model Terbaik

Uji Chow

Hipotesis

H0 : Common Effect Model (CEM) lebih baik untuk digunakan
H1 : Fixed Effect Model (FEM) lebih baik untuk digunakan

# cem vs fem two-way
pooltest(cem, fem.twoway)
## 
##  F statistic
## 
## data:  IPG ~ TPAK + PKP + HLS + RLS + SPP
## F = 123.1, df1 = 13, df2 = 31, p-value < 2.2e-16
## alternative hypothesis: unstability

FEM two-way lebih baik untuk digunakan.

# cem vs fem time
pooltest(cem, fem.time)
## 
##  F statistic
## 
## data:  IPG ~ TPAK + PKP + HLS + RLS + SPP
## F = 1.1186, df1 = 4, df2 = 40, p-value = 0.3613
## alternative hypothesis: unstability

CEM lebih baik.

# cem vs fem individual
pooltest(cem, fem.ind)
## 
##  F statistic
## 
## data:  IPG ~ TPAK + PKP + HLS + RLS + SPP
## F = 158.9, df1 = 9, df2 = 35, p-value < 2.2e-16
## alternative hypothesis: unstability

FEM individual lebih baik.

Uji Hausman

Hipotesis

H0 : Random Effect Model (REM) lebih baik untuk digunakan
H1 : Fixed Effect Model (FEM) lebih baik untuk digunakan

# fem two-way vs rem two-way
phtest(fem.twoway, rem_twoway)
## 
##  Hausman Test
## 
## data:  IPG ~ TPAK + PKP + HLS + RLS + SPP
## chisq = 4.7795, df = 5, p-value = 0.4434
## alternative hypothesis: one model is inconsistent

REM two-way lebih baik.

# fem time vs rem time
phtest(fem.time, rem_time)
## 
##  Hausman Test
## 
## data:  IPG ~ TPAK + PKP + HLS + RLS + SPP
## chisq = 4.9473, df = 5, p-value = 0.4223
## alternative hypothesis: one model is inconsistent

REM time lebih baik.

# fem individual vs rem individual
phtest(fem.ind,rem_ind)
## 
##  Hausman Test
## 
## data:  IPG ~ TPAK + PKP + HLS + RLS + SPP
## chisq = 4.3504, df = 5, p-value = 0.5001
## alternative hypothesis: one model is inconsistent

REM individual lebih baik.

Uji Pengaruh Spesifik

#efek individu dan waktu
plmtest(rem_ind,type = "bp", effect="twoways" )
## 
##  Lagrange Multiplier Test - two-ways effects (Breusch-Pagan)
## 
## data:  IPG ~ TPAK + PKP + HLS + RLS + SPP
## chisq = 32.257, df = 2, p-value = 9.899e-08
## alternative hypothesis: significant effects
#efek individu
plmtest(rem_ind,type = "bp", effect="individual")
## 
##  Lagrange Multiplier Test - (Breusch-Pagan)
## 
## data:  IPG ~ TPAK + PKP + HLS + RLS + SPP
## chisq = 32.238, df = 1, p-value = 1.364e-08
## alternative hypothesis: significant effects
#efek waktu
plmtest(rem_ind, type = "bp", effect="time" )
## 
##  Lagrange Multiplier Test - time effects (Breusch-Pagan)
## 
## data:  IPG ~ TPAK + PKP + HLS + RLS + SPP
## chisq = 0.018438, df = 1, p-value = 0.892
## alternative hypothesis: significant effects

Berdasarkan hasil uji Chow, didapatkan bahwa Fixed Effect Model lebih baik digunakan dibandingkan Common Effect Model. Uji Hausman menyatakan bahwa Random Effect Model lebih baik digunakan dibandingkan Fixed Effect Model. Oleh karena itu, dipilih model Random Effect sebagai metode estimasi terbaik. Setelah dilakukan uji pengaruh spesifik, didapatkan informasi bahwa pengaruh individu dan dua arah signifikan, sementara pengaruh waktu tidak signifikan. Oleh karena itu, dipilih REM dengan pengaruh spesifik individu sebagai model terbaik. Hal ini didasarkan pada nilai R-Squared dan Adj. R-Squared yang lebih besar dibandingkan model pengaruh dua arah.

Melihat pengaruh acak masing-masing unit individu:

library(broom)
library(kableExtra)
## Warning in !is.null(rmarkdown::metadata$output) && rmarkdown::metadata$output
## %in% : 'length(x) = 5 > 1' in coercion to 'logical(1)'
## 
## Attaching package: 'kableExtra'
## The following object is masked from 'package:dplyr':
## 
##     group_rows
tidy_ranef_ind <- tidy(ranef(rem_ind, effect="individual"))
## Warning: 'tidy.numeric' is deprecated.
## See help("Deprecated")
kable(tidy_ranef_ind, digits=3,caption = "Pengaruh Acak Individu", col.names = c("Kabkot", "Pengaruh Acak Individu"))
Pengaruh Acak Individu
Kabkot Pengaruh Acak Individu
Balikpapan 1.882
Berau 3.984
Bontang 0.200
Kutai Barat 2.345
Kutai Kartanegara -2.304
Kutai Timur -4.483
Mahakam Ulu 0.525
Paser -8.727
Penajam Paser Utara 4.277
Samarinda 2.301

Uji Asumsi Model Terbaik

res.rem.ind <- residuals(rem_ind)
1. Sisaan Menyebar Normal

Uji dilakukan dengan Jarque Bera Test dengan hipotesis uji sebagai berikut:

H0 : Sisaan menyebar normal
H1 : Sisaan tidak menyebar normal

# normalitas
library(tseries)
jarque.bera.test(res.rem.ind)
## 
##  Jarque Bera Test
## 
## data:  res.rem.ind
## X-squared = 10.214, df = 2, p-value = 0.006055

Berdasarkan Jarque Bera Test, didapatkan p-value sebesar 0.006055 < α (0.05) sehingga H0 ditolak. Artinya, tidak cukup bukti untuk menyatakan bahwa sisaan menyebar normal pada taraf nyata 5%.

2. Sisaan Saling Bebas

Uji dilakukan dengan Durbin-Watson Test dengan hipotesis uji sebagai berikut:

H0 : Sisaan saling bebas (tidak ada autokorelasi)
H1 : Sisaan tidak saling bebas (ada autokorelasi)

# autokorelasi
pdwtest(rem_ind)
## 
##  Durbin-Watson test for serial correlation in panel models
## 
## data:  IPG ~ TPAK + PKP + HLS + RLS + SPP
## DW = 1.7371, p-value = 0.1524
## alternative hypothesis: serial correlation in idiosyncratic errors

Berdasarkan DW Test, didapatkan p-value sebesar 0.1524 > α (0.05) sehingga H0 tidak ditolak. Artinya, cukup bukti untuk menyatakan bahwa sisaan saling bebas atau terjadi autokorelasi pada taraf nyata 5%.

3. Kehomogenan Ragam

Uji dilakukan dengan Breusch-Pagan Test dengan hipotesis uji sebagai berikut:

H0 : Ragam sisaan homogen
H1 : Ragam sisaan tidak homogen

# kehomogenan ragam
library(lmtest)
bptest(rem_ind)
## 
##  studentized Breusch-Pagan test
## 
## data:  rem_ind
## BP = 17.29, df = 5, p-value = 0.003982

Berdasarkan BP Test, didapatkan p-value sebesar 0.003982 < α (0.05) sehingga H0 ditolak. Artinya, belum cukup bukti untuk menyatakan bahwa ragam sisaan homogen pada taraf nyata 5%

REM Individual dengan Transformasi Logaritma

# rem individual
rem_ind1 <- plm(log(IPG) ~ log(TPAK) + log(PKP) + log(HLS) + log(RLS) + log(SPP), data = dt1, index = c("Kabkot", "Tahun"), effect = "individual", model = "random", random.method = "amemiya")

summary(rem_ind1)
## Oneway (individual) effect Random Effect Model 
##    (Amemiya's transformation)
## 
## Call:
## plm(formula = log(IPG) ~ log(TPAK) + log(PKP) + log(HLS) + log(RLS) + 
##     log(SPP), data = dt1, effect = "individual", model = "random", 
##     random.method = "amemiya", index = c("Kabkot", "Tahun"))
## 
## Balanced Panel: n = 10, T = 5, N = 50
## 
## Effects:
##                     var   std.dev share
## idiosyncratic 0.0000075 0.0027385 0.004
## individual    0.0019067 0.0436653 0.996
## theta: 0.972
## 
## Residuals:
##        Min.     1st Qu.      Median     3rd Qu.        Max. 
## -0.00867309 -0.00167108  0.00014274  0.00140143  0.00533611 
## 
## Coefficients:
##              Estimate Std. Error z-value  Pr(>|z|)    
## (Intercept)  3.302169   0.168621 19.5834 < 2.2e-16 ***
## log(TPAK)    0.010173   0.014841  0.6855     0.493    
## log(PKP)     0.094633   0.017729  5.3376 9.416e-08 ***
## log(HLS)     0.057159   0.062576  0.9134     0.361    
## log(RLS)     0.102872   0.023940  4.2971 1.730e-05 ***
## log(SPP)    -0.039421   0.039639 -0.9945     0.320    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Total Sum of Squares:    0.0011649
## Residual Sum of Squares: 0.0003651
## R-Squared:      0.68657
## Adj. R-Squared: 0.65096
## Chisq: 96.3844 on 5 DF, p-value: < 2.22e-16
res.rem.ind1 <- residuals(rem_ind1)
# normalitas
jarque.bera.test(res.rem.ind1)
## 
##  Jarque Bera Test
## 
## data:  res.rem.ind1
## X-squared = 1.9021, df = 2, p-value = 0.3863

Terpenuhi.

# autokorelasi
pdwtest(rem_ind1)
## 
##  Durbin-Watson test for serial correlation in panel models
## 
## data:  log(IPG) ~ log(TPAK) + log(PKP) + log(HLS) + log(RLS) + log(SPP)
## DW = 1.7898, p-value = 0.1943
## alternative hypothesis: serial correlation in idiosyncratic errors

Terpenuhi.

# kehomogenan ragam
bptest(rem_ind1)
## 
##  studentized Breusch-Pagan test
## 
## data:  rem_ind1
## BP = 13.886, df = 5, p-value = 0.01635

Tidak terpenuhi.

REM Individual dengan peubah yang signifikan saja
# rem individual dgn peubah signifikan
rem_ind2 <- plm(log(IPG) ~ log(PKP) + log(RLS), data = dt1, index = c("Kabkot", "Tahun"), effect = "individual", model = "random", random.method = "amemiya")

summary(rem_ind2)
## Oneway (individual) effect Random Effect Model 
##    (Amemiya's transformation)
## 
## Call:
## plm(formula = log(IPG) ~ log(PKP) + log(RLS), data = dt1, effect = "individual", 
##     model = "random", random.method = "amemiya", index = c("Kabkot", 
##         "Tahun"))
## 
## Balanced Panel: n = 10, T = 5, N = 50
## 
## Effects:
##                     var   std.dev share
## idiosyncratic 8.070e-06 2.841e-03 0.005
## individual    1.644e-03 4.055e-02 0.995
## theta: 0.9687
## 
## Residuals:
##        Min.     1st Qu.      Median     3rd Qu.        Max. 
## -0.00908555 -0.00185802 -0.00043238  0.00176376  0.00666477 
## 
## Coefficients:
##             Estimate Std. Error z-value  Pr(>|z|)    
## (Intercept) 3.372814   0.131536 25.6418 < 2.2e-16 ***
## log(PKP)    0.096287   0.016369  5.8823 4.046e-09 ***
## log(RLS)    0.094540   0.019436  4.8641 1.150e-06 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Total Sum of Squares:    0.0012176
## Residual Sum of Squares: 0.00039199
## R-Squared:      0.67805
## Adj. R-Squared: 0.66435
## Chisq: 98.9853 on 2 DF, p-value: < 2.22e-16
res.rem.ind2 <- residuals(rem_ind2)
# normalitas
jarque.bera.test(res.rem.ind2)
## 
##  Jarque Bera Test
## 
## data:  res.rem.ind2
## X-squared = 2.5848, df = 2, p-value = 0.2746

Terpenuhi.

# autokorelasi
pdwtest(rem_ind2)
## 
##  Durbin-Watson test for serial correlation in panel models
## 
## data:  log(IPG) ~ log(PKP) + log(RLS)
## DW = 1.8367, p-value = 0.2744
## alternative hypothesis: serial correlation in idiosyncratic errors

Terpenuhi.

# kehomogenan ragam
bptest(rem_ind2)
## 
##  studentized Breusch-Pagan test
## 
## data:  rem_ind2
## BP = 4.1479, df = 2, p-value = 0.1257

Terpenuhi.

tidy_ranef_ind <- tidy(ranef(rem_ind2, effect="individual"))
## Warning: 'tidy.numeric' is deprecated.
## See help("Deprecated")
kable(tidy_ranef_ind, digits=3,caption = "Pengaruh Acak Individu", col.names = c("Kabkot", "Pengaruh Acak Individu"))
Pengaruh Acak Individu
Kabkot Pengaruh Acak Individu
Balikpapan 0.009
Berau 0.037
Bontang -0.014
Kutai Barat 0.027
Kutai Kartanegara -0.017
Kutai Timur -0.040
Mahakam Ulu 0.018
Paser -0.077
Penajam Paser Utara 0.040
Samarinda 0.016