Analisis Data Panel

Pemodelan Faktor-Faktor yang Memengaruhi Persentase Kemiskinan di Indonesia

Kelompok 8

Mahesa Ahmad Rahmawan (G1401201001)

Herdian Partawijaya (G1401201022)

Ananda Herlina Lutfitasari (G1401201032)

Mohammad Abror Gustiansyah (G1401201049)

Tias Amalia Safitri (G1401201104)

LATAR BELAKANG

Permasalahan kemiskinan merupakan isu yang sangat penting dan menjadi perhatian serius di seluruh dunia terutama di Indonesia. Oleh sebab itu penurunan kemiskinan menjadi salah satu tujuan dari 17 tujuan pembangunan berkelanjutan. Namun, sampai saat ini permasalahan kemiskinan belum teratasi dengan baik. Hal ini terbukti dari persentase penduduk miskin nasional di Indonesia yang masih tergolong tinggi.

Menurut Badan Pusat Statistik (2021), ada sekitar 26.5 juta penduduk miskin di Indonesia pada September 2021. Mayoritas penduduk miskin berada di Pulau Jawa dengan jumlah 14 juta orang atau sekitar 52% dari total penduduk miskin di Indonesia. Permasalahan kemiskinan dapat disebabkan oleh berbagai faktor yaitu kekurangan pendapatan dan aset dalam pemenuhan kebutuhan seperti sandang, pangan dan papan. Kemiskinan juga terkait dengan terbatasnya lapangan pekerjaan atau pengangguran, pendidikan yang rendah, ekonomi dan kesehatan yang tidak memadai.

Faktor-faktor penyebab kemiskinan tersebut perlu diketahui agar dapat menjadi pertimbangan dalam mengambil kebijakan terkait permasalahan kemiskinan. Pada penelitian kemiskinan tersebut tidak cukup dilakukan dengan satu kali pengamatan saja, tetapi juga perlu mengamati berbagai periode waktu dan pengaruh antar wilayah sehingga dibutuhkan sebuah model yang mampu menggabungkan model cross section dan model time series, salah satunya adalah regresi data panel (Rahmadenni dan Nurjannah 2021). Jadi tujuan dari analisis ini adalah menentukan model terbaik dan menentukan peubah-peubah yang memengaruhi persentase penduduk miskin di Indonesia.

DATA

Data yang digunakan dalam dalam analisis ini adalah data persentase kemiskinan di 31 Provinsi di Indonesia dalam rentang waktu 13 tahun yaitu tahun 2008 - 2020. Peubah yang digunakan sebagai berikut:

  1. X1 (INFRA) : Infrastruktur (juta)
  2. X2 (PEKO) : Pertumbuhan ekonomi (%)
  3. X3 (INFL) : Inflasi (%)
  4. X4 (PGGR) : Pengangguran (%)
  5. Y (KMIS) : Kemiskinan (%)
library(readxl)
library(plm)
data <- read_xlsx("D:/FILE KULIAH SEMESTER 6/MINGGU 7/ADP (P)/Data.xlsx")
head(data)
## # A tibble: 6 × 7
##   PROVINSI TAHUN  INFRA  PEKO  INFL  PGGR  KMIS
##   <chr>    <dbl>  <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 Bali      2008 430814  5.97  9.62  3.31  6.17
## 2 Bali      2009 484340  5.33  4.37  3.13  5.13
## 3 Bali      2010 336352  5.83  8.1   3.06  4.88
## 4 Bali      2011 298867  6.49  3.75  2.95  4.2 
## 5 Bali      2012 348529  6.65  4.71  2.1   3.95
## 6 Bali      2013 398608  6.69  8.16  1.83  4.49
str(data)
## tibble [416 × 7] (S3: tbl_df/tbl/data.frame)
##  $ PROVINSI: chr [1:416] "Bali" "Bali" "Bali" "Bali" ...
##  $ TAHUN   : num [1:416] 2008 2009 2010 2011 2012 ...
##  $ INFRA   : num [1:416] 430814 484340 336352 298867 348529 ...
##  $ PEKO    : num [1:416] 5.97 5.33 5.83 6.49 6.65 6.69 6.73 6.03 6.32 5.56 ...
##  $ INFL    : num [1:416] 9.62 4.37 8.1 3.75 4.71 8.16 8.43 2.75 3.23 3.32 ...
##  $ PGGR    : num [1:416] 3.31 3.13 3.06 2.95 2.1 1.83 1.9 1.99 1.89 1.48 ...
##  $ KMIS    : num [1:416] 6.17 5.13 4.88 4.2 3.95 4.49 4.76 5.25 4.15 4.14 ...

METODOLOGI

Tahapan analisis dari laporan ini sebagai berikut:

  1. Eksplorasi data
  2. Pembuatan model dan pemilihan model terbaik
  3. Interpretasi

Tahap analisis data panel (pemilihan model terbaik)

EKSPLORASI DATA

Plot Korelasi

data2 <- data[,-c(1,2)]
head(data2)
## # A tibble: 6 × 5
##    INFRA  PEKO  INFL  PGGR  KMIS
##    <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 430814  5.97  9.62  3.31  6.17
## 2 484340  5.33  4.37  3.13  5.13
## 3 336352  5.83  8.1   3.06  4.88
## 4 298867  6.49  3.75  2.95  4.2 
## 5 348529  6.65  4.71  2.1   3.95
## 6 398608  6.69  8.16  1.83  4.49
corr_matrix <- round(cor(data2), 2)
library(corrplot)
## corrplot 0.92 loaded
# membuat plot korelasi
corrplot(corr_matrix, 
         type="lower",
         method = "color", 
         tl.cex = 0.5, 
         tl.col = "black",
         addCoef.col = "#2F2F2F",
         addCoefasPercent = FALSE,
         number.cex = 0.5,
         diag = FALSE)

Plot di atas menunjukkan korelasi dari setiap peubah dalam data. Dapat dilihat bahwa peubah respon persentase kemiskinan mempunyai korelasi yang tidak terlalu bagus terhadap peubah-peubah penjelas. Peubah persentase kemiskinan mempunyai korelasi tertinggi dengan peubah pertumbuhan ekonomi yaitu korelasi positif sebesar 0.3.

Persentase penduduk miskin per tahun

library(knitr)
library(kableExtra)
library(htmltools)
library(tidyverse)
library(scales)
library(ExPanDaR)
library(plotly)
library(hrbrthemes)
# Plot
data %>%
  tail(13) %>%
  ggplot( aes(x=TAHUN, y=KMIS)) +
    geom_line( color="Blue", size=1) +
    geom_point(shape=21, color="black", fill="#69b3a2", size=4) +
  scale_x_continuous(limits = c(2008, 2020), breaks = seq(2008, 2020, 1))+
    theme_bw() +
  theme(plot.title=element_text(size=15))+
    labs(title="Persentase Penduduk Miskin di Indonesia", subtitle =" Tahun 2008-2020")+
  theme(plot.title = element_text(size = 14L, face = "bold", hjust = 0.5),
        plot.subtitle = element_text(size = 11L, face = "plain", hjust = 0.5))

Grafik persentase kemiskinan di Indonesia dalam rentang waktu 13 tahun yaitu 2008-2020 menunjukkan bahwa persentase kemiskinan cenderung mengalami penurunan tiap tahun. Persentase kemiskinannya beragam di rentang 13% hingga 21% dengan tingkat kemiskinan tertinggi terjadi pada tahun 2008.

Nilai infrastruktur per tahun

library(hrbrthemes)
# Plot
data %>%
  tail(13) %>%
  ggplot( aes(x=TAHUN, y=INFRA)) +
    geom_line( color="cyan4", size=1) +
    geom_point(shape=21, color="darkred", fill="darkorange", size=4) +
  scale_x_continuous(limits = c(2008, 2020), breaks = seq(2008, 2020, 1))+
    theme_bw() +
  theme(plot.title=element_text(size=15))+
    labs(title="Persentase Infrastruktur di Indonesia", subtitle =" Tahun 2008-2020")+
  theme(plot.title = element_text(size = 14L, face = "bold", hjust = 0.5),
        plot.subtitle = element_text(size = 11L, face = "plain", hjust = 0.5))

Grafik Nilai infrastruktur di Indonesia dalam rentang waktu 13 tahun yaitu 2008-2020 menunjukkan bahwa nilai infrastruktur cenderung mengalami peningkatan tiap tahun dengan nilai infrastruktur tertinggi terjadi pada tahun 2016.

Persentase pertumbuhan ekonomi per tahun

library(hrbrthemes)
# Plot
data %>%
  tail(13) %>%
  ggplot( aes(x=TAHUN, y=PEKO)) +
    geom_line( color="bisque4", size=1) +
    geom_point(shape=21, color="darkred", fill="bisque", size=4) +
  scale_x_continuous(limits = c(2008, 2020), breaks = seq(2008, 2020, 1))+
    theme_bw() +
  theme(plot.title=element_text(size=15))+
    labs(title="Persentase Pertumbuhan Ekonomi di Indonesia", subtitle =" Tahun 2008-2020")+
  theme(plot.title = element_text(size = 14L, face = "bold", hjust = 0.5),
        plot.subtitle = element_text(size = 11L, face = "plain", hjust = 0.5))

Grafik persentase pertumbuhan ekonomi di Indonesia dalam rentang waktu 13 tahun yaitu 2008-2020 menunjukkan bahwa persentase pertumbuhan ekonomi cenderung mengalami penurunan dengan persentase pertumbuhan ekonomi terendah terjadi pada tahun 2020. Meskipun cenderung menurun, ada masa dimana persentase pertumbuhan ekonomi meningkat yaitu tahun 2010 sampai 2011 kemudian mengalami penurunan dan meningkat lagi dari tahun 2015 sampai 2019 dan anjlok pada tahun 2020. Anjloknya pertumbuhan ekonomi pada tahun 2020 disebabkan oleh pandemi covid-19 yang menyebabkan hampir seluruh arus ekonomi dunia terganggu.

Persentase Inflasi per tahun

library(hrbrthemes)
# Plot
data %>%
  tail(13) %>%
  ggplot( aes(x=TAHUN, y=INFL)) +
    geom_line( color="darkturquoise", size=1) +
    geom_point(shape=21, color="darkslategray", fill="darkslategray4", size=4) +
  scale_x_continuous(limits = c(2008, 2020), breaks = seq(2008, 2020, 1))+
    theme_bw() +
  theme(plot.title=element_text(size=15))+
    labs(title="Persentase Inflasi di Indonesia", subtitle =" Tahun 2008-2020")+
  theme(plot.title = element_text(size = 14L, face = "bold", hjust = 0.5),
        plot.subtitle = element_text(size = 11L, face = "plain", hjust = 0.5))

Grafik persentase inflasi di Indonesia dalam rentang waktu 13 tahun yaitu 2008-2020 menunjukkan bahwa nilainya cukup fluktuatif (naik turun) di setiap tahunnya. Dari tahun 2008 yang merupakan masa dimana inflasi di Indonesia yang paling tinggi kemudian turun signifikan pada tahun 2009, dan nilai inflasi paling rendah ada pada tahun 2020.

Persentase pengangguran per tahun

library(hrbrthemes)
# Plot
data %>%
  tail(13) %>%
  ggplot( aes(x=TAHUN, y=PGGR)) +
    geom_line( color="azure4", size=1) +
    geom_point(shape=21, color="antiquewhite3", fill="coral3", size=4) +
  scale_x_continuous(limits = c(2008, 2020), breaks = seq(2008, 2020, 1))+
    theme_bw() +
  theme(plot.title=element_text(size=15))+
    labs(title="Persentase Pengangguran di Indonesia", subtitle =" Tahun 2008-2020")+
  theme(plot.title = element_text(size = 14L, face = "bold", hjust = 0.5),
        plot.subtitle = element_text(size = 11L, face = "plain", hjust = 0.5))

Grafik persentase pengangguran di Indonesia dalam rentang waktu 13 tahun yaitu 2008-2020 menunjukkan bahwa nilainya cukup fluktuatif (naik turun) di setiap tahunnya. Dari tahun 2008 yang merupakan masa dimana pengangguran di Indonesia yang paling tinggi kemudian terus berfluktuasi sampai titik terendah persentase pengangguran pada tahun 2019 dan meningkat lagi pada tahun 2020 yang disebabkan oleh pandemi covid-19 dimana banyak kegiatan perekonomian yang dibatasi sehingga terjadi PHK yang cukup besar.

Pengecekan multikolinearitas

library(car)
model.ols <- lm(KMIS ~ ., data=data2)
vif(model.ols)
##    INFRA     PEKO     INFL     PGGR 
## 1.124957 1.057116 1.157683 1.048047

Dari output di atas dapat disimpulkan bahwa tidak ada indikasi multikolinearitas dalam data berdasarkan nilai VIF yang < 10.

Model CEM (Common Effect Model)

Common effect model merupakan model dimana seluruh data digabungkan baik data cross section maupun data time series, tanpa memperdulikan waktu dan tempat penelitian. Model ini merupakan model yang paling sederhana dalam regresi data panel. Model ini menggunakan Ordinary Least Squares(OLS) dalam menggabungkan data cross sectiondan runtun waktu dalam mengestimasi parameter regresi.

Model

cem <- plm(KMIS ~ INFRA+PEKO+INFL+PGGR, data=data, model="pooling")
summary(cem)
## Pooling Model
## 
## Call:
## plm(formula = KMIS ~ INFRA + PEKO + INFL + PGGR, data = data, 
##     model = "pooling")
## 
## Balanced Panel: n = 32, T = 13, N = 416
## 
## Residuals:
##    Min. 1st Qu.  Median 3rd Qu.    Max. 
## -9.1611 -5.1292 -1.5170  4.5191 19.6026 
## 
## Coefficients:
##               Estimate Std. Error t-value  Pr(>|t|)    
## (Intercept) 6.6707e+00 1.1961e+00  5.5772 4.438e-08 ***
## INFRA       1.0347e-06 2.9780e-07  3.4746 0.0005661 ***
## PEKO        5.0286e-01 8.2736e-02  6.0779 2.781e-09 ***
## INFL        3.1338e-01 1.0394e-01  3.0151 0.0027284 ** 
## PGGR        4.8913e-02 1.3531e-01  0.3615 0.7179249    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Total Sum of Squares:    17772
## Residual Sum of Squares: 15525
## R-Squared:      0.12645
## Adj. R-Squared: 0.11794
## F-statistic: 14.873 on 4 and 411 DF, p-value: 2.3234e-11

Model di atas merupakan common effect model dimana efek cross section dan efek waktu tidak dipertimbangkan. Pada CEM data yang berbentuk panel data akan dianalisis dengan metode yang sama seperti regresi linear berganda biasa. Jadi, model di atas sama seperti model regresi linear dengan metode pendugaan parameter yaitu OLS.

Output di atas memberikan informasi nilai-p dari setiap peubah termasuk intersep. Berdasarkan informasi tersebut dilakukan uji parsial terhadap model sebagai berikut.

\(H0\): \(β_j\) = 0

\(H1\): \(β_j\) ≠ 0

Tolak H0 jika nilai-p < alpha (5%), artinya peubah bebas yang berpengaruh signifikan terhadap peubah respon dari model CEM yang dibuat adalah intersep, INFRA, PEKO, INFL. Selain itu, nilai adjusted R-square model CEM yang diperoleh sebesar 0.11794 artinya 11.79% keragaman dari peubah Y atau persentase kemiskinan dapat dijelaskan oleh peubah-peubah penjelas yang ada.

Asumsi normalitas

\(H0\): sisaan menyebar normal

\(H1\): sisaan tidak menyebar normal

res <- residuals(cem)
ks.test(res, "pnorm")
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  res
## D = 0.45109, p-value < 2.2e-16
## alternative hypothesis: two-sided
hist(res, 
     xlab = "sisaan",
     col = "steelblue", 
     breaks=30,  
     prob = TRUE) 
lines(density(res), # density plot
 lwd = 2, # thickness of line
 col = "chocolate3")

Output di atas memberikan hasil bahwa p-value < \(\alpha\)(5%) maka tolak H0, artinya sisaan tidak menyebar normal. Selain itu, dilihat dari histrogram sisaannya juga tidak menggambarkan sebaran normal.

Asumsi Autokorelasi

\(H0\): tidak terdapat autokorelasi

\(H1\): terdapat autokorelasi

library(lmtest)
## Loading required package: zoo
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
bgtest(cem)
## 
##  Breusch-Godfrey test for serial correlation of order up to 1
## 
## data:  cem
## LM test = 334.13, df = 1, p-value < 2.2e-16

Output di atas memberikan hasil bahwa p-value < \(\alpha\)(5%) maka tolak H0, artinya terdapat autokorelasi.

Asumsi Homoskedastisitas

\(H0\): homoskedastisitas

\(H1\): heteroskedastisitas

bptest(cem)
## 
##  studentized Breusch-Pagan test
## 
## data:  cem
## BP = 16.998, df = 4, p-value = 0.001935

Output di atas memberikan hasil bahwa p-value < \(\alpha\)(5%) maka tolak H0, artinya sisaan tidak homogen.

Model FEM (Fixed Effect Model)

Asumsi dari model ini adalah terdapat pengaruh yang berbeda antar objek. Pada model ini perbedaan karakteristik objek dan periode diakomodasikan pada intersep sehingga intersepnya berubah terhadap periode.

Model

fem <- plm(KMIS ~ INFRA+PEKO+INFL+PGGR, data, model = "within",index = c("PROVINSI","TAHUN"))
summary(fem)
## Oneway (individual) effect Within Model
## 
## Call:
## plm(formula = KMIS ~ INFRA + PEKO + INFL + PGGR, data = data, 
##     model = "within", index = c("PROVINSI", "TAHUN"))
## 
## Balanced Panel: n = 32, T = 13, N = 416
## 
## Residuals:
##     Min.  1st Qu.   Median  3rd Qu.     Max. 
## -4.76845 -0.95405 -0.11980  0.76873  6.62826 
## 
## Coefficients:
##          Estimate  Std. Error t-value  Pr(>|t|)    
## INFRA -6.9364e-07  1.2802e-07 -5.4184 1.070e-07 ***
## PEKO   1.8290e-01  2.5300e-02  7.2293 2.689e-12 ***
## INFL   1.7443e-01  2.9213e-02  5.9708 5.422e-09 ***
## PGGR   6.5787e-01  7.8248e-02  8.4074 8.533e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Total Sum of Squares:    2088
## Residual Sum of Squares: 1025.6
## R-Squared:      0.50881
## Adj. R-Squared: 0.46356
## F-statistic: 98.4064 on 4 and 380 DF, p-value: < 2.22e-16

Output di atas memberikan hasil estimasi koefisien model. Interpretasi dari model yang diperoleh yaitu Persentase kemiskinan di Indonesia akan menurun sebesar -6.9364e-07 setiap peningkatan Infrastruktur sebesar satu satuan dan variabel lain dianggap tetap. Kemudian Persentase kemiskinan di Indonesia akan meningkat sebesar 6.5787e-01 setiap peningkatan Pengangguran sebesar satu satuan dan variabel lain dianggap tetap, begitu selanjutnya untuk interpretasi dari variabel lain.

Output di atas memberikan informasi nilai-p dari setiap peubah termasuk intersep. Berdasarkan informasi tersebut dilakukan uji parsial terhadap model sebagai berikut.

\(H0\): \(β_j\) = 0

\(H1\): \(β_j\) ≠ 0

Tolak H0 jika nilai-p < alpha (5%), artinya peubah bebas yang berpengaruh signifikan terhadap peubah respon dari model CEM yang dibuat adalah INFRA, PEKO, INFL dan PGGR. Selain itu, nilai adjusted R-square model CEM yang diperoleh sebesar 0.46356 artinya 46.35% keragaman dari peubah Y atau persentase kemiskinan dapat dijelaskan oleh peubah-peubah penjelas yang ada.

Model Effect Waktu

fem.time <- plm(KMIS ~ INFRA+PEKO+INFL+PGGR, data, model = "within",effect = "time",index = c("PROVINSI","TAHUN"))
summary(fem.time)
## Oneway (time) effect Within Model
## 
## Call:
## plm(formula = KMIS ~ INFRA + PEKO + INFL + PGGR, data = data, 
##     effect = "time", model = "within", index = c("PROVINSI", 
##         "TAHUN"))
## 
## Balanced Panel: n = 32, T = 13, N = 416
## 
## Residuals:
##     Min.  1st Qu.   Median  3rd Qu.     Max. 
## -11.1310  -4.3205  -1.7469   4.1329  17.5313 
## 
## Coefficients:
##          Estimate  Std. Error t-value  Pr(>|t|)    
## INFRA  1.9886e-06  3.3696e-07  5.9017 7.693e-09 ***
## PEKO   5.2529e-01  9.4188e-02  5.5771 4.516e-08 ***
## INFL   6.0293e-02  2.0750e-01  0.2906   0.77153    
## PGGR  -2.5724e-01  1.3818e-01 -1.8616   0.06339 .  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Total Sum of Squares:    16380
## Residual Sum of Squares: 13680
## R-Squared:      0.16481
## Adj. R-Squared: 0.13131
## F-statistic: 19.6832 on 4 and 399 DF, p-value: 8.4451e-15

Model effect dua arah

fem.tw <- plm(KMIS ~ INFRA+PEKO+INFL+PGGR, data, model = "within",effect = "twoways",index = c("PROVINSI","TAHUN"))
summary(fem.tw)
## Twoways effects Within Model
## 
## Call:
## plm(formula = KMIS ~ INFRA + PEKO + INFL + PGGR, data = data, 
##     effect = "twoways", model = "within", index = c("PROVINSI", 
##         "TAHUN"))
## 
## Balanced Panel: n = 32, T = 13, N = 416
## 
## Residuals:
##      Min.   1st Qu.    Median   3rd Qu.      Max. 
## -3.718143 -0.713539  0.050615  0.682921  4.957867 
## 
## Coefficients:
##          Estimate  Std. Error t-value  Pr(>|t|)    
## INFRA -6.2411e-07  1.5858e-07 -3.9356 9.922e-05 ***
## PEKO   1.5398e-01  2.4514e-02  6.2813 9.478e-10 ***
## INFL   1.1098e-01  4.7496e-02  2.3367   0.01999 *  
## PGGR  -6.3412e-02  7.8861e-02 -0.8041   0.42186    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Total Sum of Squares:    695.57
## Residual Sum of Squares: 592.21
## R-Squared:      0.14859
## Adj. R-Squared: 0.039851
## F-statistic: 16.0562 on 4 and 368 DF, p-value: 3.9613e-12

Mengekstrak informasi waktu

summary(fixef(fem.time, effect="time"))
##      Estimate Std. Error t-value  Pr(>|t|)    
## 2008  13.2114     2.9719  4.4454 1.138e-05 ***
## 2009  12.4802     1.7951  6.9524 1.474e-11 ***
## 2010  10.5120     2.2926  4.5852 6.079e-06 ***
## 2011   9.3642     1.8790  4.9836 9.318e-07 ***
## 2012   8.2289     1.8189  4.5241 8.011e-06 ***
## 2013   8.1076     2.3144  3.5030 0.0005120 ***
## 2014   8.0184     2.3076  3.4747 0.0005674 ***
## 2015   8.2809     1.7461  4.7426 2.942e-06 ***
## 2016   4.3752     1.8103  2.4169 0.0161026 *  
## 2017   5.9215     1.6797  3.5253 0.0004720 ***
## 2018   5.2166     1.6680  3.1274 0.0018928 ** 
## 2019   4.4697     1.6320  2.7389 0.0064413 ** 
## 2020  10.1492     1.4282  7.1064 5.523e-12 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Seluruh waktu berpengaruh signifikan dalam model.

Mengekstrak informasi individu

fixef(fem, type="level")
##        Aceh       BABEL        Bali      Banten    Bengkulu         DIY 
##    12.76929     1.15546     1.53673    -2.43011    13.04266    10.43756 
##   Gorontalo       JABAR       Jambi      JATENG       JATIM      KALBAR 
##    14.13774     3.27902     3.70584    10.57064    10.36797     4.56660 
##      KALSEL     KALTENG      KALTIM       Kepri     Lampung      Maluku 
##     0.50206     2.18406     0.24362     0.73340    11.01549    14.23684 
##       MALUT         NTB         NTT       PAPUA  PapuaBarat        RIAU 
##     3.05684    13.62690    19.07966    24.63917    21.12064     3.00880 
##      SULBAR      SULSEL     SULTENG SulTenggara       SULUT      SUMBAR 
##     8.91121     5.49197    10.85094     9.98109     2.02268     2.45959 
##      SUMSEL       SUMUT 
##     9.57356     5.63776

Output di atas memberikan informasi tentang nilai koefisien yaitu pengaruh individu (Provinsi) dalam model.

Asumsi normalitas

\(H0\): sisaan menyebar normal

\(H1\): sisaan tidak menyebar normal

res.fem <- residuals(fem)
ks.test(res.fem, "pnorm")
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  res.fem
## D = 0.094336, p-value = 0.001217
## alternative hypothesis: two-sided
hist(res.fem, 
     xlab = "sisaan",
     col = "steelblue", 
     breaks=30,  
     prob = TRUE) 
lines(density(res), # density plot
 lwd = 2, # thickness of line
 col = "chocolate3")

Output di atas memberikan hasil bahwa p-value < \(\alpha\)(5%) maka tolak H0, artinya sisaan tidak menyebar normal. Selain itu, dilihat dari histrogram sisaannya juga tidak terlalu menggambarkan sebaran normal.

Asumsi Autokorelasi

\(H0\): tidak terdapat autokorelasi

\(H1\): terdapat autokorelasi

library(lmtest)
bgtest(fem)
## 
##  Breusch-Godfrey test for serial correlation of order up to 1
## 
## data:  fem
## LM test = 334.13, df = 1, p-value < 2.2e-16

Output di atas memberikan hasil bahwa p-value < \(\alpha\)(5%) maka tolak H0, artinya terdapat autokorelasi.

Asumsi Homoskedastisitas

\(H0\): homoskedastisitas

\(H1\): heteroskedastisitas

bptest(fem)
## 
##  studentized Breusch-Pagan test
## 
## data:  fem
## BP = 16.998, df = 4, p-value = 0.001935

Output di atas memberikan hasil bahwa p-value < \(\alpha\)(5%) maka tolak H0, artinya sisaan tidak homogen.

Model REM (Random Effect Model)

Model ini mengasumsikan bahwa pengaruh objek bersifat acak atau random bagi seluruh cross section. Berbeda dengan Fixed Effect Model, perbedaan karakteristik objek dan periode diakomodasikan oleh galat. Random effect modelakan mengestimasi data panel dimana variabel gangguan mungkin saling berhubungan antar waktu atau antar individu. Pada fixed effect model bisa menimbulkan masalah, salah satunya adalah berkurangnya nilai derajat kebebasan (degree of freedom) yang berakibat pada pengurangan efisiensi parameter, sehingga muncul random effect modelyang bertujuan untuk mengatasi masalah yang ditimbulkan oleh fixed effect model.

Model

rem <- plm(KMIS~INFRA+PEKO+INFL+PGGR, data, model = "random", index = c("PROVINSI","TAHUN"))
summary(rem)
## Oneway (individual) effect Random Effect Model 
##    (Swamy-Arora's transformation)
## 
## Call:
## plm(formula = KMIS ~ INFRA + PEKO + INFL + PGGR, data = data, 
##     model = "random", index = c("PROVINSI", "TAHUN"))
## 
## Balanced Panel: n = 32, T = 13, N = 416
## 
## Effects:
##                  var std.dev share
## idiosyncratic  2.699   1.643 0.077
## individual    32.568   5.707 0.923
## theta: 0.9204
## 
## Residuals:
##     Min.  1st Qu.   Median  3rd Qu.     Max. 
## -4.34258 -1.04053 -0.23554  0.60260  7.98492 
## 
## Coefficients:
##                Estimate  Std. Error z-value  Pr(>|z|)    
## (Intercept)  7.8906e+00  1.1801e+00  6.6867 2.283e-11 ***
## INFRA       -6.7502e-07  1.2876e-07 -5.2426 1.583e-07 ***
## PEKO         1.8615e-01  2.5580e-02  7.2771 3.411e-13 ***
## INFL         1.7680e-01  2.9554e-02  5.9823 2.200e-09 ***
## PGGR         6.4310e-01  7.8250e-02  8.2185 < 2.2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Total Sum of Squares:    2187.4
## Residual Sum of Squares: 1136.6
## R-Squared:      0.4804
## Adj. R-Squared: 0.47534
## Chisq: 379.99 on 4 DF, p-value: < 2.22e-16

Output di atas memberikan hasil estimasi koefisien model. Interpretasi dari model yang diperoleh yaitu Persentase kemiskinan di Indonesia akan menurun sebesar -6.7502e-07 setiap peningkatan Infrastruktur sebesar satu satuan dan variabel lain dianggap tetap. Kemudian Persentase kemiskinan di Indonesia akan meningkat sebesar 6.4310e-01 setiap peningkatan Pengangguran sebesar satu satuan dan variabel lain dianggap tetap, begitu selanjutnya untuk interpretasi dari variabel lain.

Output di atas memberikan informasi nilai-p dari setiap peubah termasuk intersep. Berdasarkan informasi tersebut dilakukan uji parsial terhadap model sebagai berikut.

\(H0\): \(β_j\) = 0

\(H1\): \(β_j\) ≠ 0

Tolak H0 jika nilai-p < alpha (5%), artinya peubah bebas yang berpengaruh signifikan terhadap peubah respon dari model CEM yang dibuat adalah INFRA, PEKO, INFL dan PGGR. Selain itu, nilai adjusted R-square model CEM yang diperoleh sebesar 0.47534 artinya 47.53% keragaman dari peubah Y atau persentase kemiskinan dapat dijelaskan oleh peubah-peubah penjelas yang ada.

Model effect waktu

rem.time <- plm(KMIS~INFRA+PEKO+INFL+PGGR, data, model = "random", effect = "time", index = c("PROVINSI","TAHUN"))
summary(rem.time)
## Oneway (time) effect Random Effect Model 
##    (Swamy-Arora's transformation)
## 
## Call:
## plm(formula = KMIS ~ INFRA + PEKO + INFL + PGGR, data = data, 
##     effect = "time", model = "random", index = c("PROVINSI", 
##         "TAHUN"))
## 
## Balanced Panel: n = 32, T = 13, N = 416
## 
## Effects:
##                  var std.dev share
## idiosyncratic 34.287   5.855     1
## time           0.000   0.000     0
## theta: 0
## 
## Residuals:
##    Min. 1st Qu.  Median 3rd Qu.    Max. 
## -9.1611 -5.1292 -1.5170  4.5191 19.6026 
## 
## Coefficients:
##               Estimate Std. Error z-value  Pr(>|z|)    
## (Intercept) 6.6707e+00 1.1961e+00  5.5772 2.445e-08 ***
## INFRA       1.0347e-06 2.9780e-07  3.4746 0.0005117 ***
## PEKO        5.0286e-01 8.2736e-02  6.0779 1.217e-09 ***
## INFL        3.1338e-01 1.0394e-01  3.0151 0.0025690 ** 
## PGGR        4.8913e-02 1.3531e-01  0.3615 0.7177392    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Total Sum of Squares:    17772
## Residual Sum of Squares: 15525
## R-Squared:      0.12645
## Adj. R-Squared: 0.11794
## Chisq: 59.492 on 4 DF, p-value: 3.709e-12

Model effect dua arah

rem.tw <- plm(KMIS~INFRA+PEKO+INFL+PGGR, data, model = "random", effect = "twoways",index = c("PROVINSI","TAHUN"))
summary(rem.tw)
## Twoways effects Random Effect Model 
##    (Swamy-Arora's transformation)
## 
## Call:
## plm(formula = KMIS ~ INFRA + PEKO + INFL + PGGR, data = data, 
##     effect = "twoways", model = "random", index = c("PROVINSI", 
##         "TAHUN"))
## 
## Balanced Panel: n = 32, T = 13, N = 416
## 
## Effects:
##                   var std.dev share
## idiosyncratic  1.6093  1.2686 0.047
## individual    32.6514  5.7141 0.947
## time           0.2158  0.4646 0.006
## theta: 0.9385 (id) 0.5653 (time) 0.5648 (total)
## 
## Residuals:
##     Min.  1st Qu.   Median  3rd Qu.     Max. 
## -3.48112 -0.80340 -0.21541  0.46391  6.46679 
## 
## Coefficients:
##                Estimate  Std. Error z-value  Pr(>|z|)    
## (Intercept)  1.0883e+01  1.2462e+00  8.7327 < 2.2e-16 ***
## INFRA       -7.8316e-07  1.4391e-07 -5.4421 5.266e-08 ***
## PEKO         1.6972e-01  2.4964e-02  6.7988 1.055e-11 ***
## INFL         1.7252e-01  3.8357e-02  4.4977 6.871e-06 ***
## PGGR         1.6255e-01  7.7831e-02  2.0886   0.03675 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Total Sum of Squares:    1018
## Residual Sum of Squares: 773.87
## R-Squared:      0.23978
## Adj. R-Squared: 0.23238
## Chisq: 129.63 on 4 DF, p-value: < 2.22e-16

Asumsi normalitas

\(H0\): sisaan menyebar normal

\(H1\): sisaan tidak menyebar normal

res.rem <- residuals(rem)
ks.test(res.rem, "pnorm")
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  res.rem
## D = 0.12075, p-value = 1.078e-05
## alternative hypothesis: two-sided
hist(res.rem, 
     xlab = "sisaan",
     col = "steelblue", 
     breaks=30,  
     prob = TRUE) 
lines(density(res), # density plot
 lwd = 2, # thickness of line
 col = "chocolate3")

Output di atas memberikan hasil bahwa p-value < \(\alpha\)(5%) maka tolak H0, artinya sisaan tidak menyebar normal. Selain itu, dilihat dari histrogram sisaannya juga tidak terlalu menggambarkan sebaran normal.

Asumsi Autokorelasi

\(H0\): tidak terdapat autokorelasi

\(H1\): terdapat autokorelasi

library(lmtest)
bgtest(rem)
## 
##  Breusch-Godfrey test for serial correlation of order up to 1
## 
## data:  rem
## LM test = 334.13, df = 1, p-value < 2.2e-16

Output di atas memberikan hasil bahwa p-value < \(\alpha\)(5%) maka tolak H0, artinya terdapat autokorelasi.

Asumsi Homoskedastisitas

\(H0\): homoskedastisitas

\(H1\): heteroskedastisitas

bptest(rem)
## 
##  studentized Breusch-Pagan test
## 
## data:  rem
## BP = 16.998, df = 4, p-value = 0.001935

Output di atas memberikan hasil bahwa p-value < \(\alpha\)(5%) maka tolak H0, artinya sisaan tidak homogen.

UJI CHOW

Uji Chow bertujuan untuk mengetahui pilihan modelyang lebih baik digunakan antara common effect dan fixedeffect.

\(H0\): Common Effect Model

\(H1\): Fixed Effect Model

pooltest(cem,fem)
## 
##  F statistic
## 
## data:  KMIS ~ INFRA + PEKO + INFL + PGGR
## F = 173.29, df1 = 31, df2 = 380, p-value < 2.2e-16
## alternative hypothesis: unstability
pooltest(cem,fem.time)
## 
##  F statistic
## 
## data:  KMIS ~ INFRA + PEKO + INFL + PGGR
## F = 4.4836, df1 = 12, df2 = 399, p-value = 8.96e-07
## alternative hypothesis: unstability
pooltest(cem,fem.tw)
## 
##  F statistic
## 
## data:  KMIS ~ INFRA + PEKO + INFL + PGGR
## F = 215.8, df1 = 43, df2 = 368, p-value < 2.2e-16
## alternative hypothesis: unstability

Output di atas menguji perbandingan antara model cem dengan model fem individu, fem waktu, dan fem efek dua arah. Dari ketiga output semuanya memberikan hasil yaitu p-value < \(\alpha\)(5%) maka tolak H0. Artinya penggunaan model FEM lebih baik diterapkan terhadap data daripada model CEM.

UJI HAUSMAN

Uji Hausman digunakan untuk memilih manakah yang lebih tepat antara model random effect atau model fixed effect, dengan hipotesis sebagai berikut :

\(H0\): Random Effect Model

\(H1\): Fixed Effect Model

phtest(fem,rem)
## 
##  Hausman Test
## 
## data:  KMIS ~ INFRA + PEKO + INFL + PGGR
## chisq = 23.361, df = 4, p-value = 0.0001072
## alternative hypothesis: one model is inconsistent
phtest(fem.time,rem.time)
## 
##  Hausman Test
## 
## data:  KMIS ~ INFRA + PEKO + INFL + PGGR
## chisq = 36.442, df = 4, p-value = 2.347e-07
## alternative hypothesis: one model is inconsistent
phtest(fem.tw,rem.tw)
## 
##  Hausman Test
## 
## data:  KMIS ~ INFRA + PEKO + INFL + PGGR
## chisq = 40.108, df = 4, p-value = 4.111e-08
## alternative hypothesis: one model is inconsistent

Output di atas menguji perbandingan antara model rem individu, waktu, dan dua arah dengan model fem individu, fem waktu, dan fem efek dua arah. Dari ketiga output semuanya memberikan hasil yaitu p-value < \(\alpha\)(5%) maka tolak H0. Artinya penggunaan model FEM lebih baik diterapkan terhadap data daripada model REM.

FEM (Fixed Effect Model)

Dari model-model yang telah dibangun sebelumnya yaitu CEM, FEM dan REM kemudian dilakukan pengujian untuk memilih model yang paling baik menggunakan uji Chow dan uji Hausman. Hasilnya model yang paling tepat untuk digunakan adalah Fixed Effect Model. Selanjutnya akan dilihat apakah model FEM yang paling tepat adalah FEM efek satu arah (individu atau waktu) atau efek dua arah.

Pengaruh spesifik individu/waktu

#efek dua arah
plmtest(fem.tw,type = "bp", effect="twoways" )
## 
##  Lagrange Multiplier Test - two-ways effects (Breusch-Pagan)
## 
## data:  KMIS ~ INFRA + PEKO + INFL + PGGR
## chisq = 1746.8, df = 2, p-value < 2.2e-16
## alternative hypothesis: significant effects
#efek individu
plmtest(fem.tw,type = "bp", effect="individual" )
## 
##  Lagrange Multiplier Test - (Breusch-Pagan)
## 
## data:  KMIS ~ INFRA + PEKO + INFL + PGGR
## chisq = 1726.2, df = 1, p-value < 2.2e-16
## alternative hypothesis: significant effects
#efek waktu
plmtest(fem.tw,type = "bp", effect="time" )
## 
##  Lagrange Multiplier Test - time effects (Breusch-Pagan)
## 
## data:  KMIS ~ INFRA + PEKO + INFL + PGGR
## chisq = 20.619, df = 1, p-value = 5.605e-06
## alternative hypothesis: significant effects

Ketiga output di atas menunjukkan hasil bahwa terdapat efek individu dan efek waktu, serta pengujian efek dua arah juga menyatakan bahwa terdapat efek dua arah. Artinya model yang akan dipakai adalah FEM (Fixed Effect Model) dengan efek dua arah (individu dan waktu).

Uji kebebasan pada unit cross section

Biasanya pada datapanel dengan series panjang, seringkali ditemukan adanya dependesi pada unit individu tetapi pada kasus datapanel dengan series yang tidak terlalu panjang hal ini jarang terjadi. Pada bagian ini akan dicek apakah terdapat dependensi pada unit cross section di data panel yang digunakan.

\(H0\): tidak terdapat dependensi antar unit individu

\(H1\): terdapat dependensi antar unit individu

pcdtest(fem.tw, test = c("lm"), index=NULL, w =NULL )
## 
##  Breusch-Pagan LM test for cross-sectional dependence in panels
## 
## data:  KMIS ~ INFRA + PEKO + INFL + PGGR
## chisq = 2733.3, df = 496, p-value < 2.2e-16
## alternative hypothesis: cross-sectional dependence

Karena nilai p-value yang diperoleh < α= 5% maka tolak H0 yang berarti terdapat dependensi pada unit individu.

FEM LSDV

  • Dalam fixed effect model metode LSDV setiap individu merupakan parameter yang tidak diketahui dan akan diestimasi dengan menggunakan teknik variabel boneka sehingga metode ini seringkali disebut dengan Least Square Dummy Variable.
  • FEM LSDV biasanya digunakan untuk mengatasi masalah heterogenitas individual dalam data panel atau data cross-section dengan menggunakan variabel dummy untuk setiap individu.
  • Metode ini cocok digunakan dalam situasi di mana terdapat variasi dalam karakteristik individu dalam dataset yang berpotensi mempengaruhi variabel dependen.

Model

fem.lsdv <- lm((KMIS) ~ INFRA+PEKO+INFL+PGGR + factor(PROVINSI) + factor(TAHUN), data)
summary(fem.lsdv)
## 
## Call:
## lm(formula = (KMIS) ~ INFRA + PEKO + INFL + PGGR + factor(PROVINSI) + 
##     factor(TAHUN), data = data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -3.7181 -0.7135  0.0506  0.6829  4.9579 
## 
## Coefficients:
##                               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)                  2.175e+01  1.057e+00  20.573  < 2e-16 ***
## INFRA                       -6.241e-07  1.586e-07  -3.936 9.92e-05 ***
## PEKO                         1.540e-01  2.451e-02   6.281 9.48e-10 ***
## INFL                         1.110e-01  4.750e-02   2.337   0.0200 *  
## PGGR                        -6.341e-02  7.886e-02  -0.804   0.4219    
## factor(PROVINSI)BABEL       -1.401e+01  6.129e-01 -22.865  < 2e-16 ***
## factor(PROVINSI)Bali        -1.518e+01  6.968e-01 -21.779  < 2e-16 ***
## factor(PROVINSI)Banten      -1.308e+01  5.799e-01 -22.557  < 2e-16 ***
## factor(PROVINSI)Bengkulu    -2.505e+00  6.206e-01  -4.036 6.61e-05 ***
## factor(PROVINSI)DIY         -5.147e+00  6.331e-01  -8.131 6.60e-15 ***
## factor(PROVINSI)Gorontalo   -1.028e+00  6.082e-01  -1.690   0.0918 .  
## factor(PROVINSI)JABAR       -8.556e+00  5.275e-01 -16.219  < 2e-16 ***
## factor(PROVINSI)Jambi       -1.147e+01  6.047e-01 -18.961  < 2e-16 ***
## factor(PROVINSI)JATENG      -3.947e+00  5.575e-01  -7.080 7.33e-12 ***
## factor(PROVINSI)JATIM       -4.978e+00  6.074e-01  -8.196 4.17e-15 ***
## factor(PROVINSI)KALBAR      -1.066e+01  5.775e-01 -18.453  < 2e-16 ***
## factor(PROVINSI)KALSEL      -1.439e+01  5.753e-01 -25.003  < 2e-16 ***
## factor(PROVINSI)KALTENG     -1.340e+01  6.099e-01 -21.966  < 2e-16 ***
## factor(PROVINSI)KALTIM      -1.223e+01  5.326e-01 -22.962  < 2e-16 ***
## factor(PROVINSI)Kepri       -1.265e+01  5.472e-01 -23.120  < 2e-16 ***
## factor(PROVINSI)Lampung     -3.725e+00  5.565e-01  -6.693 8.17e-11 ***
## factor(PROVINSI)Maluku       2.256e+00  5.234e-01   4.311 2.09e-05 ***
## factor(PROVINSI)MALUT       -1.162e+01  5.696e-01 -20.406  < 2e-16 ***
## factor(PROVINSI)NTB         -1.400e+00  5.730e-01  -2.444   0.0150 *  
## factor(PROVINSI)NTT          2.950e+00  6.269e-01   4.706 3.58e-06 ***
## factor(PROVINSI)PAPUA        8.801e+00  6.744e-01  13.050  < 2e-16 ***
## factor(PROVINSI)PapuaBarat   7.547e+00  5.574e-01  13.539  < 2e-16 ***
## factor(PROVINSI)RIAU        -1.073e+01  5.332e-01 -20.124  < 2e-16 ***
## factor(PROVINSI)SULBAR      -7.260e+00  6.636e-01 -10.941  < 2e-16 ***
## factor(PROVINSI)SULSEL      -8.474e+00  5.399e-01 -15.695  < 2e-16 ***
## factor(PROVINSI)SULTENG     -4.472e+00  6.059e-01  -7.381 1.06e-12 ***
## factor(PROVINSI)SulTenggara -5.434e+00  5.969e-01  -9.104  < 2e-16 ***
## factor(PROVINSI)SULUT       -1.065e+01  5.151e-01 -20.673  < 2e-16 ***
## factor(PROVINSI)SUMBAR      -1.126e+01  5.226e-01 -21.539  < 2e-16 ***
## factor(PROVINSI)SUMSEL      -4.923e+00  5.446e-01  -9.039  < 2e-16 ***
## factor(PROVINSI)SUMUT       -8.077e+00  5.242e-01 -15.409  < 2e-16 ***
## factor(TAHUN)2009           -8.688e-02  4.987e-01  -0.174   0.8618    
## factor(TAHUN)2010           -1.668e+00  3.830e-01  -4.355 1.73e-05 ***
## factor(TAHUN)2011           -2.401e+00  4.832e-01  -4.969 1.03e-06 ***
## factor(TAHUN)2012           -3.485e+00  4.907e-01  -7.103 6.34e-12 ***
## factor(TAHUN)2013           -3.813e+00  3.931e-01  -9.698  < 2e-16 ***
## factor(TAHUN)2014           -4.152e+00  3.912e-01 -10.613  < 2e-16 ***
## factor(TAHUN)2015           -3.442e+00  5.053e-01  -6.811 3.96e-11 ***
## factor(TAHUN)2016           -2.700e+00  6.464e-01  -4.177 3.69e-05 ***
## factor(TAHUN)2017           -3.764e+00  5.740e-01  -6.558 1.85e-10 ***
## factor(TAHUN)2018           -4.057e+00  5.925e-01  -6.847 3.17e-11 ***
## factor(TAHUN)2019           -4.230e+00  6.294e-01  -6.720 6.92e-11 ***
## factor(TAHUN)2020           -3.020e+00  6.373e-01  -4.738 3.09e-06 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.269 on 368 degrees of freedom
## Multiple R-squared:  0.9667, Adjusted R-squared:  0.9624 
## F-statistic: 227.1 on 47 and 368 DF,  p-value: < 2.2e-16

Model FEM dengan menggunakan metode LSDV memberikan ukuran kebaikan model yang lebih bagus dimana R-squared nya jauh lebih tinggi daripada model-model yang telah dibangun sebelumnya yaitu 0.9667 dan Adjusted R-squared nya 0.9624.

Asumsi normalitas

\(H0\): sisaan menyebar normal

\(H1\): sisaan tidak menyebar normal

res.lsdv <- residuals(fem.lsdv)
ks.test(res.lsdv, "pnorm")
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  res.lsdv
## D = 0.049765, p-value = 0.2542
## alternative hypothesis: two-sided
hist(res.lsdv, 
     xlab = "sisaan",
     col = "steelblue", 
     breaks=30,  
     prob = TRUE) 
lines(density(res), # density plot
 lwd = 2, # thickness of line
 col = "chocolate3")

Output di atas memberikan hasil bahwa p-value > \(\alpha\)(5%) maka tak tolak H0, artinya sisaan menyebar normal. Selain itu, dilihat dari histrogram sisaannya juga terlihat menggambarkan sebaran normal dengan histogram yang simetris.

Asumsi Autokorelasi

\(H0\): tidak terdapat autokorelasi

\(H1\): terdapat autokorelasi

library(lmtest)
bgtest(fem.lsdv)
## 
##  Breusch-Godfrey test for serial correlation of order up to 1
## 
## data:  fem.lsdv
## LM test = 188.13, df = 1, p-value < 2.2e-16

Output di atas memberikan hasil bahwa p-value < \(\alpha\)(5%) maka tolak H0, artinya terdapat autokorelasi.

Asumsi Homoskedastisitas

\(H0\): homoskedastisitas

\(H1\): heteroskedastisitas

bptest(fem.lsdv)
## 
##  studentized Breusch-Pagan test
## 
## data:  fem.lsdv
## BP = 189.13, df = 47, p-value < 2.2e-16

Output di atas memberikan hasil bahwa p-value < \(\alpha\)(5%) maka tolak H0, artinya sisaan tidak homogen.

PEMILIHAN MODEL TERBAIK

library(performance)
model_performance(cem,metrics = "all")
## # Indices of model performance
## 
## AIC      |     AICc |      BIC |    R2 | R2 (adj.) |  RMSE | Sigma
## ------------------------------------------------------------------
## 2698.279 | 2698.484 | 2722.463 | 0.126 |     0.118 | 6.109 | 6.146
model_performance(fem,metrics = "all")
## # Indices of model performance
## 
## AIC      |     AICc |      BIC |    R2 | R2 (adj.) |  RMSE | Sigma
## ------------------------------------------------------------------
## 1565.948 | 1566.095 | 1586.102 | 0.509 |     0.464 | 1.570 | 1.578
model_performance(fem.time,metrics = "all")
## # Indices of model performance
## 
## AIC      |     AICc |      BIC |    R2 | R2 (adj.) |  RMSE | Sigma
## ------------------------------------------------------------------
## 2643.657 | 2643.803 | 2663.810 | 0.165 |     0.131 | 5.735 | 5.762
model_performance(fem.tw,metrics = "all")
## # Indices of model performance
## 
## AIC      |     AICc |      BIC |    R2 | R2 (adj.) |  RMSE | Sigma
## ------------------------------------------------------------------
## 1337.480 | 1337.626 | 1357.633 | 0.149 |     0.040 | 1.193 | 1.199
model_performance(rem,metrics = "all")
## # Indices of model performance
## 
## AIC      |     AICc |      BIC |    R2 | R2 (adj.) |  RMSE | Sigma
## ------------------------------------------------------------------
## 1610.675 | 1610.881 | 1634.860 | 0.480 |     0.475 | 1.653 | 1.663
model_performance(rem.time,metrics = "all")
## # Indices of model performance
## 
## AIC      |     AICc |      BIC |    R2 | R2 (adj.) |  RMSE | Sigma
## ------------------------------------------------------------------
## 2698.279 | 2698.484 | 2722.463 | 0.126 |     0.118 | 6.109 | 6.146
model_performance(rem.tw,metrics = "all")
## # Indices of model performance
## 
## AIC      |     AICc |      BIC |    R2 | R2 (adj.) |  RMSE | Sigma
## ------------------------------------------------------------------
## 1450.776 | 1450.982 | 1474.960 | 0.240 |     0.232 | 1.364 | 1.372
model_performance(fem.lsdv,metrics = "all")
## # Indices of model performance
## 
## AIC      |     AICc |      BIC |    R2 | R2 (adj.) |  RMSE | Sigma
## ------------------------------------------------------------------
## 1425.480 | 1438.868 | 1622.984 | 0.967 |     0.962 | 1.193 | 1.269
# Membuat data frame
perbandingan <- data.frame(Model = c("CEM", "FEM INDIVIDU", "FEM TIME", "FEM TWO WAYS", "REM INDIVIDU", "REM TIME", "REM TWO WAYS", "FEM LSDV"), NILAI.AIC = c(2698.279, 1565.948, 2643.657, 1337.480, 1610.675, 2698.279, 1450.776, 1425.480), ADJUSTED.R.SQUARE = c(0.118, 0.464, 0.131, 0.040, 0.475, 0.118, 0.232, 0.962), RMSE = c(6.109, 1.570, 5.735, 1.193, 1.653, 6.109, 1.364, 1.193))
# Membuat tabel dengan fungsi kable
tabel <- knitr::kable(perbandingan, align = 'l', caption = "Perbandingan Performa Model")
tabel
Perbandingan Performa Model
Model NILAI.AIC ADJUSTED.R.SQUARE RMSE
CEM 2698.279 0.118 6.109
FEM INDIVIDU 1565.948 0.464 1.570
FEM TIME 2643.657 0.131 5.735
FEM TWO WAYS 1337.480 0.040 1.193
REM INDIVIDU 1610.675 0.475 1.653
REM TIME 2698.279 0.118 6.109
REM TWO WAYS 1450.776 0.232 1.364
FEM LSDV 1425.480 0.962 1.193

Tabel di atas menunjukkan perbandingan performa dari model-model yang sudah dibangun. Performa model dapat dilihat berdasarkan nilai AIC, ADJ R-SQUARE, dan RMSE. Dari tabel tersebut kita akan memilih model dengan performa terbaik yaitu AIC paling kecil, ADJ R-SQUARE paling tinggi dan RMSE paling kecil. Berdasarkan hal tersebut diperoleh model terbaik yaitu FEM LSDV. Nilai AIC paling kecil terdapat pada model FEM TWO-WAYS, namun nilai ADJ R-SQUARE nya sangat kecil. Oleh karena itu disimpulkan model terbaik adalah FEM LSDV dengan nilai AIC yang kecil, ADJ R-SQUARE sangat tinggi dan RMSE yang kecil. Selain itu FEM LSDV juga memenuhi asumsi sisaan menyebar normal.

INTERPRETASI MODEL FEM LSDV

summary(fem.lsdv)
## 
## Call:
## lm(formula = (KMIS) ~ INFRA + PEKO + INFL + PGGR + factor(PROVINSI) + 
##     factor(TAHUN), data = data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -3.7181 -0.7135  0.0506  0.6829  4.9579 
## 
## Coefficients:
##                               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)                  2.175e+01  1.057e+00  20.573  < 2e-16 ***
## INFRA                       -6.241e-07  1.586e-07  -3.936 9.92e-05 ***
## PEKO                         1.540e-01  2.451e-02   6.281 9.48e-10 ***
## INFL                         1.110e-01  4.750e-02   2.337   0.0200 *  
## PGGR                        -6.341e-02  7.886e-02  -0.804   0.4219    
## factor(PROVINSI)BABEL       -1.401e+01  6.129e-01 -22.865  < 2e-16 ***
## factor(PROVINSI)Bali        -1.518e+01  6.968e-01 -21.779  < 2e-16 ***
## factor(PROVINSI)Banten      -1.308e+01  5.799e-01 -22.557  < 2e-16 ***
## factor(PROVINSI)Bengkulu    -2.505e+00  6.206e-01  -4.036 6.61e-05 ***
## factor(PROVINSI)DIY         -5.147e+00  6.331e-01  -8.131 6.60e-15 ***
## factor(PROVINSI)Gorontalo   -1.028e+00  6.082e-01  -1.690   0.0918 .  
## factor(PROVINSI)JABAR       -8.556e+00  5.275e-01 -16.219  < 2e-16 ***
## factor(PROVINSI)Jambi       -1.147e+01  6.047e-01 -18.961  < 2e-16 ***
## factor(PROVINSI)JATENG      -3.947e+00  5.575e-01  -7.080 7.33e-12 ***
## factor(PROVINSI)JATIM       -4.978e+00  6.074e-01  -8.196 4.17e-15 ***
## factor(PROVINSI)KALBAR      -1.066e+01  5.775e-01 -18.453  < 2e-16 ***
## factor(PROVINSI)KALSEL      -1.439e+01  5.753e-01 -25.003  < 2e-16 ***
## factor(PROVINSI)KALTENG     -1.340e+01  6.099e-01 -21.966  < 2e-16 ***
## factor(PROVINSI)KALTIM      -1.223e+01  5.326e-01 -22.962  < 2e-16 ***
## factor(PROVINSI)Kepri       -1.265e+01  5.472e-01 -23.120  < 2e-16 ***
## factor(PROVINSI)Lampung     -3.725e+00  5.565e-01  -6.693 8.17e-11 ***
## factor(PROVINSI)Maluku       2.256e+00  5.234e-01   4.311 2.09e-05 ***
## factor(PROVINSI)MALUT       -1.162e+01  5.696e-01 -20.406  < 2e-16 ***
## factor(PROVINSI)NTB         -1.400e+00  5.730e-01  -2.444   0.0150 *  
## factor(PROVINSI)NTT          2.950e+00  6.269e-01   4.706 3.58e-06 ***
## factor(PROVINSI)PAPUA        8.801e+00  6.744e-01  13.050  < 2e-16 ***
## factor(PROVINSI)PapuaBarat   7.547e+00  5.574e-01  13.539  < 2e-16 ***
## factor(PROVINSI)RIAU        -1.073e+01  5.332e-01 -20.124  < 2e-16 ***
## factor(PROVINSI)SULBAR      -7.260e+00  6.636e-01 -10.941  < 2e-16 ***
## factor(PROVINSI)SULSEL      -8.474e+00  5.399e-01 -15.695  < 2e-16 ***
## factor(PROVINSI)SULTENG     -4.472e+00  6.059e-01  -7.381 1.06e-12 ***
## factor(PROVINSI)SulTenggara -5.434e+00  5.969e-01  -9.104  < 2e-16 ***
## factor(PROVINSI)SULUT       -1.065e+01  5.151e-01 -20.673  < 2e-16 ***
## factor(PROVINSI)SUMBAR      -1.126e+01  5.226e-01 -21.539  < 2e-16 ***
## factor(PROVINSI)SUMSEL      -4.923e+00  5.446e-01  -9.039  < 2e-16 ***
## factor(PROVINSI)SUMUT       -8.077e+00  5.242e-01 -15.409  < 2e-16 ***
## factor(TAHUN)2009           -8.688e-02  4.987e-01  -0.174   0.8618    
## factor(TAHUN)2010           -1.668e+00  3.830e-01  -4.355 1.73e-05 ***
## factor(TAHUN)2011           -2.401e+00  4.832e-01  -4.969 1.03e-06 ***
## factor(TAHUN)2012           -3.485e+00  4.907e-01  -7.103 6.34e-12 ***
## factor(TAHUN)2013           -3.813e+00  3.931e-01  -9.698  < 2e-16 ***
## factor(TAHUN)2014           -4.152e+00  3.912e-01 -10.613  < 2e-16 ***
## factor(TAHUN)2015           -3.442e+00  5.053e-01  -6.811 3.96e-11 ***
## factor(TAHUN)2016           -2.700e+00  6.464e-01  -4.177 3.69e-05 ***
## factor(TAHUN)2017           -3.764e+00  5.740e-01  -6.558 1.85e-10 ***
## factor(TAHUN)2018           -4.057e+00  5.925e-01  -6.847 3.17e-11 ***
## factor(TAHUN)2019           -4.230e+00  6.294e-01  -6.720 6.92e-11 ***
## factor(TAHUN)2020           -3.020e+00  6.373e-01  -4.738 3.09e-06 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.269 on 368 degrees of freedom
## Multiple R-squared:  0.9667, Adjusted R-squared:  0.9624 
## F-statistic: 227.1 on 47 and 368 DF,  p-value: < 2.2e-16

Output diatas menampilkan summary dari model FEM LSDV,dari output tersebut model yang diperoleh sebagai berikut: \(\hat y = 2.175 \times 10^1 - 6.241\times10^{-7}(INFRA)+1.540\times 10^{-1}(PEKO)+1.110\times 10^{-1}(INFL)-6.341\times 10^{-2}(PGGR)\)

  • Setiap kenaikan satu satuan variabel INFRASTRUKTUR maka tingkat kemiskinan akan menurun sebesar -6.241e-07 dan menganggap variabel lain konstan
  • Setiap kenaikan satu satuan variabel PERTUMBUHAN EKONOMI maka tingkat kemiskinan akan naik sebesar 1.540e-01 dan menganggap variabel lain konstan
  • Setiap kenaikan satu satuan variabel INFLASI maka tingkat kemiskinan akan naik sebesar 1.110e-01 dan menganggap variabel lain konstan
  • Setiap kenaikan satu satuan variabel PENGANGGURAN maka tingkat kemiskinan akan turun sebesar -6.341e-02 dan menganggap variabel lain konstan
  • Berdasarkan uji parsial diperoleh bahwa nilai p-value pada variabel INFRASTRUKTUR, PERTUMBUHAN EKONOMI, INFLASI kurang dari alpha 0.05 yang berarti hipotesis nol ditolak. Sehingga, secara parsial variabel independen tersebut berpengaruh signifikan terhadap PERSENTASE KEMISKINAN
  • Selain itu, dapat dilihat nilai adjusted koefisien determinasi sebesar 0.9624. Artinya, variabel independen yaitu infrastruktur, pertumbuhan ekonomi, inflasi dan pengangguran mampu menjelaskan variabel dependen yaitu PDRB sebesar 96.24%, sedangkan sisanya sebesar dijelaskan oleh faktor lain yang tidak disebutkan dalam model.