Analisis Data Panel
Pemodelan Faktor-Faktor yang Memengaruhi Persentase Kemiskinan di Indonesia
Kelompok 8
Mahesa Ahmad Rahmawan (G1401201001)
Herdian Partawijaya (G1401201022)
Ananda Herlina Lutfitasari (G1401201032)
Mohammad Abror Gustiansyah (G1401201049)
Tias Amalia Safitri (G1401201104)
LATAR BELAKANG
Permasalahan kemiskinan merupakan isu yang sangat penting dan menjadi perhatian serius di seluruh dunia terutama di Indonesia. Oleh sebab itu penurunan kemiskinan menjadi salah satu tujuan dari 17 tujuan pembangunan berkelanjutan. Namun, sampai saat ini permasalahan kemiskinan belum teratasi dengan baik. Hal ini terbukti dari persentase penduduk miskin nasional di Indonesia yang masih tergolong tinggi.
Menurut Badan Pusat Statistik (2021), ada sekitar 26.5 juta penduduk miskin di Indonesia pada September 2021. Mayoritas penduduk miskin berada di Pulau Jawa dengan jumlah 14 juta orang atau sekitar 52% dari total penduduk miskin di Indonesia. Permasalahan kemiskinan dapat disebabkan oleh berbagai faktor yaitu kekurangan pendapatan dan aset dalam pemenuhan kebutuhan seperti sandang, pangan dan papan. Kemiskinan juga terkait dengan terbatasnya lapangan pekerjaan atau pengangguran, pendidikan yang rendah, ekonomi dan kesehatan yang tidak memadai.
Faktor-faktor penyebab kemiskinan tersebut perlu diketahui agar dapat menjadi pertimbangan dalam mengambil kebijakan terkait permasalahan kemiskinan. Pada penelitian kemiskinan tersebut tidak cukup dilakukan dengan satu kali pengamatan saja, tetapi juga perlu mengamati berbagai periode waktu dan pengaruh antar wilayah sehingga dibutuhkan sebuah model yang mampu menggabungkan model cross section dan model time series, salah satunya adalah regresi data panel (Rahmadenni dan Nurjannah 2021). Jadi tujuan dari analisis ini adalah menentukan model terbaik dan menentukan peubah-peubah yang memengaruhi persentase penduduk miskin di Indonesia.
DATA
Data yang digunakan dalam dalam analisis ini adalah data persentase kemiskinan di 31 Provinsi di Indonesia dalam rentang waktu 13 tahun yaitu tahun 2008 - 2020. Peubah yang digunakan sebagai berikut:
- X1 (INFRA) : Infrastruktur (juta)
- X2 (PEKO) : Pertumbuhan ekonomi (%)
- X3 (INFL) : Inflasi (%)
- X4 (PGGR) : Pengangguran (%)
- Y (KMIS) : Kemiskinan (%)
library(readxl)
library(plm)
data <- read_xlsx("D:/FILE KULIAH SEMESTER 6/MINGGU 7/ADP (P)/Data.xlsx")
head(data)## # A tibble: 6 × 7
## PROVINSI TAHUN INFRA PEKO INFL PGGR KMIS
## <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 Bali 2008 430814 5.97 9.62 3.31 6.17
## 2 Bali 2009 484340 5.33 4.37 3.13 5.13
## 3 Bali 2010 336352 5.83 8.1 3.06 4.88
## 4 Bali 2011 298867 6.49 3.75 2.95 4.2
## 5 Bali 2012 348529 6.65 4.71 2.1 3.95
## 6 Bali 2013 398608 6.69 8.16 1.83 4.49
str(data)## tibble [416 × 7] (S3: tbl_df/tbl/data.frame)
## $ PROVINSI: chr [1:416] "Bali" "Bali" "Bali" "Bali" ...
## $ TAHUN : num [1:416] 2008 2009 2010 2011 2012 ...
## $ INFRA : num [1:416] 430814 484340 336352 298867 348529 ...
## $ PEKO : num [1:416] 5.97 5.33 5.83 6.49 6.65 6.69 6.73 6.03 6.32 5.56 ...
## $ INFL : num [1:416] 9.62 4.37 8.1 3.75 4.71 8.16 8.43 2.75 3.23 3.32 ...
## $ PGGR : num [1:416] 3.31 3.13 3.06 2.95 2.1 1.83 1.9 1.99 1.89 1.48 ...
## $ KMIS : num [1:416] 6.17 5.13 4.88 4.2 3.95 4.49 4.76 5.25 4.15 4.14 ...
METODOLOGI
Tahapan analisis dari laporan ini sebagai berikut:
- Eksplorasi data
- Pembuatan model dan pemilihan model terbaik
- Interpretasi
Tahap analisis data panel (pemilihan model terbaik)
EKSPLORASI DATA
Plot Korelasi
data2 <- data[,-c(1,2)]
head(data2)## # A tibble: 6 × 5
## INFRA PEKO INFL PGGR KMIS
## <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 430814 5.97 9.62 3.31 6.17
## 2 484340 5.33 4.37 3.13 5.13
## 3 336352 5.83 8.1 3.06 4.88
## 4 298867 6.49 3.75 2.95 4.2
## 5 348529 6.65 4.71 2.1 3.95
## 6 398608 6.69 8.16 1.83 4.49
corr_matrix <- round(cor(data2), 2)
library(corrplot)## corrplot 0.92 loaded
# membuat plot korelasi
corrplot(corr_matrix,
type="lower",
method = "color",
tl.cex = 0.5,
tl.col = "black",
addCoef.col = "#2F2F2F",
addCoefasPercent = FALSE,
number.cex = 0.5,
diag = FALSE)Plot di atas menunjukkan korelasi dari setiap peubah dalam data. Dapat dilihat bahwa peubah respon persentase kemiskinan mempunyai korelasi yang tidak terlalu bagus terhadap peubah-peubah penjelas. Peubah persentase kemiskinan mempunyai korelasi tertinggi dengan peubah pertumbuhan ekonomi yaitu korelasi positif sebesar 0.3.
Persentase penduduk miskin per tahun
library(knitr)
library(kableExtra)
library(htmltools)
library(tidyverse)
library(scales)
library(ExPanDaR)
library(plotly)library(hrbrthemes)
# Plot
data %>%
tail(13) %>%
ggplot( aes(x=TAHUN, y=KMIS)) +
geom_line( color="Blue", size=1) +
geom_point(shape=21, color="black", fill="#69b3a2", size=4) +
scale_x_continuous(limits = c(2008, 2020), breaks = seq(2008, 2020, 1))+
theme_bw() +
theme(plot.title=element_text(size=15))+
labs(title="Persentase Penduduk Miskin di Indonesia", subtitle =" Tahun 2008-2020")+
theme(plot.title = element_text(size = 14L, face = "bold", hjust = 0.5),
plot.subtitle = element_text(size = 11L, face = "plain", hjust = 0.5))Grafik persentase kemiskinan di Indonesia dalam rentang waktu 13 tahun yaitu 2008-2020 menunjukkan bahwa persentase kemiskinan cenderung mengalami penurunan tiap tahun. Persentase kemiskinannya beragam di rentang 13% hingga 21% dengan tingkat kemiskinan tertinggi terjadi pada tahun 2008.
Nilai infrastruktur per tahun
library(hrbrthemes)
# Plot
data %>%
tail(13) %>%
ggplot( aes(x=TAHUN, y=INFRA)) +
geom_line( color="cyan4", size=1) +
geom_point(shape=21, color="darkred", fill="darkorange", size=4) +
scale_x_continuous(limits = c(2008, 2020), breaks = seq(2008, 2020, 1))+
theme_bw() +
theme(plot.title=element_text(size=15))+
labs(title="Persentase Infrastruktur di Indonesia", subtitle =" Tahun 2008-2020")+
theme(plot.title = element_text(size = 14L, face = "bold", hjust = 0.5),
plot.subtitle = element_text(size = 11L, face = "plain", hjust = 0.5))Grafik Nilai infrastruktur di Indonesia dalam rentang waktu 13 tahun yaitu 2008-2020 menunjukkan bahwa nilai infrastruktur cenderung mengalami peningkatan tiap tahun dengan nilai infrastruktur tertinggi terjadi pada tahun 2016.
Persentase pertumbuhan ekonomi per tahun
library(hrbrthemes)
# Plot
data %>%
tail(13) %>%
ggplot( aes(x=TAHUN, y=PEKO)) +
geom_line( color="bisque4", size=1) +
geom_point(shape=21, color="darkred", fill="bisque", size=4) +
scale_x_continuous(limits = c(2008, 2020), breaks = seq(2008, 2020, 1))+
theme_bw() +
theme(plot.title=element_text(size=15))+
labs(title="Persentase Pertumbuhan Ekonomi di Indonesia", subtitle =" Tahun 2008-2020")+
theme(plot.title = element_text(size = 14L, face = "bold", hjust = 0.5),
plot.subtitle = element_text(size = 11L, face = "plain", hjust = 0.5))Grafik persentase pertumbuhan ekonomi di Indonesia dalam rentang waktu 13 tahun yaitu 2008-2020 menunjukkan bahwa persentase pertumbuhan ekonomi cenderung mengalami penurunan dengan persentase pertumbuhan ekonomi terendah terjadi pada tahun 2020. Meskipun cenderung menurun, ada masa dimana persentase pertumbuhan ekonomi meningkat yaitu tahun 2010 sampai 2011 kemudian mengalami penurunan dan meningkat lagi dari tahun 2015 sampai 2019 dan anjlok pada tahun 2020. Anjloknya pertumbuhan ekonomi pada tahun 2020 disebabkan oleh pandemi covid-19 yang menyebabkan hampir seluruh arus ekonomi dunia terganggu.
Persentase Inflasi per tahun
library(hrbrthemes)
# Plot
data %>%
tail(13) %>%
ggplot( aes(x=TAHUN, y=INFL)) +
geom_line( color="darkturquoise", size=1) +
geom_point(shape=21, color="darkslategray", fill="darkslategray4", size=4) +
scale_x_continuous(limits = c(2008, 2020), breaks = seq(2008, 2020, 1))+
theme_bw() +
theme(plot.title=element_text(size=15))+
labs(title="Persentase Inflasi di Indonesia", subtitle =" Tahun 2008-2020")+
theme(plot.title = element_text(size = 14L, face = "bold", hjust = 0.5),
plot.subtitle = element_text(size = 11L, face = "plain", hjust = 0.5))Grafik persentase inflasi di Indonesia dalam rentang waktu 13 tahun yaitu 2008-2020 menunjukkan bahwa nilainya cukup fluktuatif (naik turun) di setiap tahunnya. Dari tahun 2008 yang merupakan masa dimana inflasi di Indonesia yang paling tinggi kemudian turun signifikan pada tahun 2009, dan nilai inflasi paling rendah ada pada tahun 2020.
Persentase pengangguran per tahun
library(hrbrthemes)
# Plot
data %>%
tail(13) %>%
ggplot( aes(x=TAHUN, y=PGGR)) +
geom_line( color="azure4", size=1) +
geom_point(shape=21, color="antiquewhite3", fill="coral3", size=4) +
scale_x_continuous(limits = c(2008, 2020), breaks = seq(2008, 2020, 1))+
theme_bw() +
theme(plot.title=element_text(size=15))+
labs(title="Persentase Pengangguran di Indonesia", subtitle =" Tahun 2008-2020")+
theme(plot.title = element_text(size = 14L, face = "bold", hjust = 0.5),
plot.subtitle = element_text(size = 11L, face = "plain", hjust = 0.5))Grafik persentase pengangguran di Indonesia dalam rentang waktu 13 tahun yaitu 2008-2020 menunjukkan bahwa nilainya cukup fluktuatif (naik turun) di setiap tahunnya. Dari tahun 2008 yang merupakan masa dimana pengangguran di Indonesia yang paling tinggi kemudian terus berfluktuasi sampai titik terendah persentase pengangguran pada tahun 2019 dan meningkat lagi pada tahun 2020 yang disebabkan oleh pandemi covid-19 dimana banyak kegiatan perekonomian yang dibatasi sehingga terjadi PHK yang cukup besar.
Pengecekan multikolinearitas
library(car)
model.ols <- lm(KMIS ~ ., data=data2)
vif(model.ols)## INFRA PEKO INFL PGGR
## 1.124957 1.057116 1.157683 1.048047
Dari output di atas dapat disimpulkan bahwa tidak ada indikasi multikolinearitas dalam data berdasarkan nilai VIF yang < 10.
Model CEM (Common Effect Model)
Common effect model merupakan model dimana seluruh data digabungkan baik data cross section maupun data time series, tanpa memperdulikan waktu dan tempat penelitian. Model ini merupakan model yang paling sederhana dalam regresi data panel. Model ini menggunakan Ordinary Least Squares(OLS) dalam menggabungkan data cross sectiondan runtun waktu dalam mengestimasi parameter regresi.
Model
cem <- plm(KMIS ~ INFRA+PEKO+INFL+PGGR, data=data, model="pooling")
summary(cem)## Pooling Model
##
## Call:
## plm(formula = KMIS ~ INFRA + PEKO + INFL + PGGR, data = data,
## model = "pooling")
##
## Balanced Panel: n = 32, T = 13, N = 416
##
## Residuals:
## Min. 1st Qu. Median 3rd Qu. Max.
## -9.1611 -5.1292 -1.5170 4.5191 19.6026
##
## Coefficients:
## Estimate Std. Error t-value Pr(>|t|)
## (Intercept) 6.6707e+00 1.1961e+00 5.5772 4.438e-08 ***
## INFRA 1.0347e-06 2.9780e-07 3.4746 0.0005661 ***
## PEKO 5.0286e-01 8.2736e-02 6.0779 2.781e-09 ***
## INFL 3.1338e-01 1.0394e-01 3.0151 0.0027284 **
## PGGR 4.8913e-02 1.3531e-01 0.3615 0.7179249
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Total Sum of Squares: 17772
## Residual Sum of Squares: 15525
## R-Squared: 0.12645
## Adj. R-Squared: 0.11794
## F-statistic: 14.873 on 4 and 411 DF, p-value: 2.3234e-11
Model di atas merupakan common effect model dimana efek cross section dan efek waktu tidak dipertimbangkan. Pada CEM data yang berbentuk panel data akan dianalisis dengan metode yang sama seperti regresi linear berganda biasa. Jadi, model di atas sama seperti model regresi linear dengan metode pendugaan parameter yaitu OLS.
Output di atas memberikan informasi nilai-p dari setiap peubah termasuk intersep. Berdasarkan informasi tersebut dilakukan uji parsial terhadap model sebagai berikut.
\(H0\): \(β_j\) = 0
\(H1\): \(β_j\) ≠ 0
Tolak H0 jika nilai-p < alpha (5%), artinya peubah bebas yang berpengaruh signifikan terhadap peubah respon dari model CEM yang dibuat adalah intersep, INFRA, PEKO, INFL. Selain itu, nilai adjusted R-square model CEM yang diperoleh sebesar 0.11794 artinya 11.79% keragaman dari peubah Y atau persentase kemiskinan dapat dijelaskan oleh peubah-peubah penjelas yang ada.
Asumsi normalitas
\(H0\): sisaan menyebar normal
\(H1\): sisaan tidak menyebar normal
res <- residuals(cem)
ks.test(res, "pnorm")##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: res
## D = 0.45109, p-value < 2.2e-16
## alternative hypothesis: two-sided
hist(res,
xlab = "sisaan",
col = "steelblue",
breaks=30,
prob = TRUE)
lines(density(res), # density plot
lwd = 2, # thickness of line
col = "chocolate3")Output di atas memberikan hasil bahwa p-value < \(\alpha\)(5%) maka tolak H0, artinya sisaan tidak menyebar normal. Selain itu, dilihat dari histrogram sisaannya juga tidak menggambarkan sebaran normal.
Asumsi Autokorelasi
\(H0\): tidak terdapat autokorelasi
\(H1\): terdapat autokorelasi
library(lmtest)## Loading required package: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
bgtest(cem)##
## Breusch-Godfrey test for serial correlation of order up to 1
##
## data: cem
## LM test = 334.13, df = 1, p-value < 2.2e-16
Output di atas memberikan hasil bahwa p-value < \(\alpha\)(5%) maka tolak H0, artinya terdapat autokorelasi.
Asumsi Homoskedastisitas
\(H0\): homoskedastisitas
\(H1\): heteroskedastisitas
bptest(cem)##
## studentized Breusch-Pagan test
##
## data: cem
## BP = 16.998, df = 4, p-value = 0.001935
Output di atas memberikan hasil bahwa p-value < \(\alpha\)(5%) maka tolak H0, artinya sisaan tidak homogen.
Model FEM (Fixed Effect Model)
Asumsi dari model ini adalah terdapat pengaruh yang berbeda antar objek. Pada model ini perbedaan karakteristik objek dan periode diakomodasikan pada intersep sehingga intersepnya berubah terhadap periode.
Model
fem <- plm(KMIS ~ INFRA+PEKO+INFL+PGGR, data, model = "within",index = c("PROVINSI","TAHUN"))
summary(fem)## Oneway (individual) effect Within Model
##
## Call:
## plm(formula = KMIS ~ INFRA + PEKO + INFL + PGGR, data = data,
## model = "within", index = c("PROVINSI", "TAHUN"))
##
## Balanced Panel: n = 32, T = 13, N = 416
##
## Residuals:
## Min. 1st Qu. Median 3rd Qu. Max.
## -4.76845 -0.95405 -0.11980 0.76873 6.62826
##
## Coefficients:
## Estimate Std. Error t-value Pr(>|t|)
## INFRA -6.9364e-07 1.2802e-07 -5.4184 1.070e-07 ***
## PEKO 1.8290e-01 2.5300e-02 7.2293 2.689e-12 ***
## INFL 1.7443e-01 2.9213e-02 5.9708 5.422e-09 ***
## PGGR 6.5787e-01 7.8248e-02 8.4074 8.533e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Total Sum of Squares: 2088
## Residual Sum of Squares: 1025.6
## R-Squared: 0.50881
## Adj. R-Squared: 0.46356
## F-statistic: 98.4064 on 4 and 380 DF, p-value: < 2.22e-16
Output di atas memberikan hasil estimasi koefisien model. Interpretasi dari model yang diperoleh yaitu Persentase kemiskinan di Indonesia akan menurun sebesar -6.9364e-07 setiap peningkatan Infrastruktur sebesar satu satuan dan variabel lain dianggap tetap. Kemudian Persentase kemiskinan di Indonesia akan meningkat sebesar 6.5787e-01 setiap peningkatan Pengangguran sebesar satu satuan dan variabel lain dianggap tetap, begitu selanjutnya untuk interpretasi dari variabel lain.
Output di atas memberikan informasi nilai-p dari setiap peubah termasuk intersep. Berdasarkan informasi tersebut dilakukan uji parsial terhadap model sebagai berikut.
\(H0\): \(β_j\) = 0
\(H1\): \(β_j\) ≠ 0
Tolak H0 jika nilai-p < alpha (5%), artinya peubah bebas yang berpengaruh signifikan terhadap peubah respon dari model CEM yang dibuat adalah INFRA, PEKO, INFL dan PGGR. Selain itu, nilai adjusted R-square model CEM yang diperoleh sebesar 0.46356 artinya 46.35% keragaman dari peubah Y atau persentase kemiskinan dapat dijelaskan oleh peubah-peubah penjelas yang ada.
Model Effect Waktu
fem.time <- plm(KMIS ~ INFRA+PEKO+INFL+PGGR, data, model = "within",effect = "time",index = c("PROVINSI","TAHUN"))
summary(fem.time)## Oneway (time) effect Within Model
##
## Call:
## plm(formula = KMIS ~ INFRA + PEKO + INFL + PGGR, data = data,
## effect = "time", model = "within", index = c("PROVINSI",
## "TAHUN"))
##
## Balanced Panel: n = 32, T = 13, N = 416
##
## Residuals:
## Min. 1st Qu. Median 3rd Qu. Max.
## -11.1310 -4.3205 -1.7469 4.1329 17.5313
##
## Coefficients:
## Estimate Std. Error t-value Pr(>|t|)
## INFRA 1.9886e-06 3.3696e-07 5.9017 7.693e-09 ***
## PEKO 5.2529e-01 9.4188e-02 5.5771 4.516e-08 ***
## INFL 6.0293e-02 2.0750e-01 0.2906 0.77153
## PGGR -2.5724e-01 1.3818e-01 -1.8616 0.06339 .
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Total Sum of Squares: 16380
## Residual Sum of Squares: 13680
## R-Squared: 0.16481
## Adj. R-Squared: 0.13131
## F-statistic: 19.6832 on 4 and 399 DF, p-value: 8.4451e-15
Model effect dua arah
fem.tw <- plm(KMIS ~ INFRA+PEKO+INFL+PGGR, data, model = "within",effect = "twoways",index = c("PROVINSI","TAHUN"))
summary(fem.tw)## Twoways effects Within Model
##
## Call:
## plm(formula = KMIS ~ INFRA + PEKO + INFL + PGGR, data = data,
## effect = "twoways", model = "within", index = c("PROVINSI",
## "TAHUN"))
##
## Balanced Panel: n = 32, T = 13, N = 416
##
## Residuals:
## Min. 1st Qu. Median 3rd Qu. Max.
## -3.718143 -0.713539 0.050615 0.682921 4.957867
##
## Coefficients:
## Estimate Std. Error t-value Pr(>|t|)
## INFRA -6.2411e-07 1.5858e-07 -3.9356 9.922e-05 ***
## PEKO 1.5398e-01 2.4514e-02 6.2813 9.478e-10 ***
## INFL 1.1098e-01 4.7496e-02 2.3367 0.01999 *
## PGGR -6.3412e-02 7.8861e-02 -0.8041 0.42186
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Total Sum of Squares: 695.57
## Residual Sum of Squares: 592.21
## R-Squared: 0.14859
## Adj. R-Squared: 0.039851
## F-statistic: 16.0562 on 4 and 368 DF, p-value: 3.9613e-12
Mengekstrak informasi waktu
summary(fixef(fem.time, effect="time"))## Estimate Std. Error t-value Pr(>|t|)
## 2008 13.2114 2.9719 4.4454 1.138e-05 ***
## 2009 12.4802 1.7951 6.9524 1.474e-11 ***
## 2010 10.5120 2.2926 4.5852 6.079e-06 ***
## 2011 9.3642 1.8790 4.9836 9.318e-07 ***
## 2012 8.2289 1.8189 4.5241 8.011e-06 ***
## 2013 8.1076 2.3144 3.5030 0.0005120 ***
## 2014 8.0184 2.3076 3.4747 0.0005674 ***
## 2015 8.2809 1.7461 4.7426 2.942e-06 ***
## 2016 4.3752 1.8103 2.4169 0.0161026 *
## 2017 5.9215 1.6797 3.5253 0.0004720 ***
## 2018 5.2166 1.6680 3.1274 0.0018928 **
## 2019 4.4697 1.6320 2.7389 0.0064413 **
## 2020 10.1492 1.4282 7.1064 5.523e-12 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Seluruh waktu berpengaruh signifikan dalam model.
Mengekstrak informasi individu
fixef(fem, type="level")## Aceh BABEL Bali Banten Bengkulu DIY
## 12.76929 1.15546 1.53673 -2.43011 13.04266 10.43756
## Gorontalo JABAR Jambi JATENG JATIM KALBAR
## 14.13774 3.27902 3.70584 10.57064 10.36797 4.56660
## KALSEL KALTENG KALTIM Kepri Lampung Maluku
## 0.50206 2.18406 0.24362 0.73340 11.01549 14.23684
## MALUT NTB NTT PAPUA PapuaBarat RIAU
## 3.05684 13.62690 19.07966 24.63917 21.12064 3.00880
## SULBAR SULSEL SULTENG SulTenggara SULUT SUMBAR
## 8.91121 5.49197 10.85094 9.98109 2.02268 2.45959
## SUMSEL SUMUT
## 9.57356 5.63776
Output di atas memberikan informasi tentang nilai koefisien yaitu pengaruh individu (Provinsi) dalam model.
Asumsi normalitas
\(H0\): sisaan menyebar normal
\(H1\): sisaan tidak menyebar normal
res.fem <- residuals(fem)
ks.test(res.fem, "pnorm")##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: res.fem
## D = 0.094336, p-value = 0.001217
## alternative hypothesis: two-sided
hist(res.fem,
xlab = "sisaan",
col = "steelblue",
breaks=30,
prob = TRUE)
lines(density(res), # density plot
lwd = 2, # thickness of line
col = "chocolate3")Output di atas memberikan hasil bahwa p-value < \(\alpha\)(5%) maka tolak H0, artinya sisaan tidak menyebar normal. Selain itu, dilihat dari histrogram sisaannya juga tidak terlalu menggambarkan sebaran normal.
Asumsi Autokorelasi
\(H0\): tidak terdapat autokorelasi
\(H1\): terdapat autokorelasi
library(lmtest)
bgtest(fem)##
## Breusch-Godfrey test for serial correlation of order up to 1
##
## data: fem
## LM test = 334.13, df = 1, p-value < 2.2e-16
Output di atas memberikan hasil bahwa p-value < \(\alpha\)(5%) maka tolak H0, artinya terdapat autokorelasi.
Asumsi Homoskedastisitas
\(H0\): homoskedastisitas
\(H1\): heteroskedastisitas
bptest(fem)##
## studentized Breusch-Pagan test
##
## data: fem
## BP = 16.998, df = 4, p-value = 0.001935
Output di atas memberikan hasil bahwa p-value < \(\alpha\)(5%) maka tolak H0, artinya sisaan tidak homogen.
Model REM (Random Effect Model)
Model ini mengasumsikan bahwa pengaruh objek bersifat acak atau random bagi seluruh cross section. Berbeda dengan Fixed Effect Model, perbedaan karakteristik objek dan periode diakomodasikan oleh galat. Random effect modelakan mengestimasi data panel dimana variabel gangguan mungkin saling berhubungan antar waktu atau antar individu. Pada fixed effect model bisa menimbulkan masalah, salah satunya adalah berkurangnya nilai derajat kebebasan (degree of freedom) yang berakibat pada pengurangan efisiensi parameter, sehingga muncul random effect modelyang bertujuan untuk mengatasi masalah yang ditimbulkan oleh fixed effect model.
Model
rem <- plm(KMIS~INFRA+PEKO+INFL+PGGR, data, model = "random", index = c("PROVINSI","TAHUN"))
summary(rem)## Oneway (individual) effect Random Effect Model
## (Swamy-Arora's transformation)
##
## Call:
## plm(formula = KMIS ~ INFRA + PEKO + INFL + PGGR, data = data,
## model = "random", index = c("PROVINSI", "TAHUN"))
##
## Balanced Panel: n = 32, T = 13, N = 416
##
## Effects:
## var std.dev share
## idiosyncratic 2.699 1.643 0.077
## individual 32.568 5.707 0.923
## theta: 0.9204
##
## Residuals:
## Min. 1st Qu. Median 3rd Qu. Max.
## -4.34258 -1.04053 -0.23554 0.60260 7.98492
##
## Coefficients:
## Estimate Std. Error z-value Pr(>|z|)
## (Intercept) 7.8906e+00 1.1801e+00 6.6867 2.283e-11 ***
## INFRA -6.7502e-07 1.2876e-07 -5.2426 1.583e-07 ***
## PEKO 1.8615e-01 2.5580e-02 7.2771 3.411e-13 ***
## INFL 1.7680e-01 2.9554e-02 5.9823 2.200e-09 ***
## PGGR 6.4310e-01 7.8250e-02 8.2185 < 2.2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Total Sum of Squares: 2187.4
## Residual Sum of Squares: 1136.6
## R-Squared: 0.4804
## Adj. R-Squared: 0.47534
## Chisq: 379.99 on 4 DF, p-value: < 2.22e-16
Output di atas memberikan hasil estimasi koefisien model. Interpretasi dari model yang diperoleh yaitu Persentase kemiskinan di Indonesia akan menurun sebesar -6.7502e-07 setiap peningkatan Infrastruktur sebesar satu satuan dan variabel lain dianggap tetap. Kemudian Persentase kemiskinan di Indonesia akan meningkat sebesar 6.4310e-01 setiap peningkatan Pengangguran sebesar satu satuan dan variabel lain dianggap tetap, begitu selanjutnya untuk interpretasi dari variabel lain.
Output di atas memberikan informasi nilai-p dari setiap peubah termasuk intersep. Berdasarkan informasi tersebut dilakukan uji parsial terhadap model sebagai berikut.
\(H0\): \(β_j\) = 0
\(H1\): \(β_j\) ≠ 0
Tolak H0 jika nilai-p < alpha (5%), artinya peubah bebas yang berpengaruh signifikan terhadap peubah respon dari model CEM yang dibuat adalah INFRA, PEKO, INFL dan PGGR. Selain itu, nilai adjusted R-square model CEM yang diperoleh sebesar 0.47534 artinya 47.53% keragaman dari peubah Y atau persentase kemiskinan dapat dijelaskan oleh peubah-peubah penjelas yang ada.
Model effect waktu
rem.time <- plm(KMIS~INFRA+PEKO+INFL+PGGR, data, model = "random", effect = "time", index = c("PROVINSI","TAHUN"))
summary(rem.time)## Oneway (time) effect Random Effect Model
## (Swamy-Arora's transformation)
##
## Call:
## plm(formula = KMIS ~ INFRA + PEKO + INFL + PGGR, data = data,
## effect = "time", model = "random", index = c("PROVINSI",
## "TAHUN"))
##
## Balanced Panel: n = 32, T = 13, N = 416
##
## Effects:
## var std.dev share
## idiosyncratic 34.287 5.855 1
## time 0.000 0.000 0
## theta: 0
##
## Residuals:
## Min. 1st Qu. Median 3rd Qu. Max.
## -9.1611 -5.1292 -1.5170 4.5191 19.6026
##
## Coefficients:
## Estimate Std. Error z-value Pr(>|z|)
## (Intercept) 6.6707e+00 1.1961e+00 5.5772 2.445e-08 ***
## INFRA 1.0347e-06 2.9780e-07 3.4746 0.0005117 ***
## PEKO 5.0286e-01 8.2736e-02 6.0779 1.217e-09 ***
## INFL 3.1338e-01 1.0394e-01 3.0151 0.0025690 **
## PGGR 4.8913e-02 1.3531e-01 0.3615 0.7177392
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Total Sum of Squares: 17772
## Residual Sum of Squares: 15525
## R-Squared: 0.12645
## Adj. R-Squared: 0.11794
## Chisq: 59.492 on 4 DF, p-value: 3.709e-12
Model effect dua arah
rem.tw <- plm(KMIS~INFRA+PEKO+INFL+PGGR, data, model = "random", effect = "twoways",index = c("PROVINSI","TAHUN"))
summary(rem.tw)## Twoways effects Random Effect Model
## (Swamy-Arora's transformation)
##
## Call:
## plm(formula = KMIS ~ INFRA + PEKO + INFL + PGGR, data = data,
## effect = "twoways", model = "random", index = c("PROVINSI",
## "TAHUN"))
##
## Balanced Panel: n = 32, T = 13, N = 416
##
## Effects:
## var std.dev share
## idiosyncratic 1.6093 1.2686 0.047
## individual 32.6514 5.7141 0.947
## time 0.2158 0.4646 0.006
## theta: 0.9385 (id) 0.5653 (time) 0.5648 (total)
##
## Residuals:
## Min. 1st Qu. Median 3rd Qu. Max.
## -3.48112 -0.80340 -0.21541 0.46391 6.46679
##
## Coefficients:
## Estimate Std. Error z-value Pr(>|z|)
## (Intercept) 1.0883e+01 1.2462e+00 8.7327 < 2.2e-16 ***
## INFRA -7.8316e-07 1.4391e-07 -5.4421 5.266e-08 ***
## PEKO 1.6972e-01 2.4964e-02 6.7988 1.055e-11 ***
## INFL 1.7252e-01 3.8357e-02 4.4977 6.871e-06 ***
## PGGR 1.6255e-01 7.7831e-02 2.0886 0.03675 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Total Sum of Squares: 1018
## Residual Sum of Squares: 773.87
## R-Squared: 0.23978
## Adj. R-Squared: 0.23238
## Chisq: 129.63 on 4 DF, p-value: < 2.22e-16
Asumsi normalitas
\(H0\): sisaan menyebar normal
\(H1\): sisaan tidak menyebar normal
res.rem <- residuals(rem)
ks.test(res.rem, "pnorm")##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: res.rem
## D = 0.12075, p-value = 1.078e-05
## alternative hypothesis: two-sided
hist(res.rem,
xlab = "sisaan",
col = "steelblue",
breaks=30,
prob = TRUE)
lines(density(res), # density plot
lwd = 2, # thickness of line
col = "chocolate3")Output di atas memberikan hasil bahwa p-value < \(\alpha\)(5%) maka tolak H0, artinya sisaan tidak menyebar normal. Selain itu, dilihat dari histrogram sisaannya juga tidak terlalu menggambarkan sebaran normal.
Asumsi Autokorelasi
\(H0\): tidak terdapat autokorelasi
\(H1\): terdapat autokorelasi
library(lmtest)
bgtest(rem)##
## Breusch-Godfrey test for serial correlation of order up to 1
##
## data: rem
## LM test = 334.13, df = 1, p-value < 2.2e-16
Output di atas memberikan hasil bahwa p-value < \(\alpha\)(5%) maka tolak H0, artinya terdapat autokorelasi.
Asumsi Homoskedastisitas
\(H0\): homoskedastisitas
\(H1\): heteroskedastisitas
bptest(rem)##
## studentized Breusch-Pagan test
##
## data: rem
## BP = 16.998, df = 4, p-value = 0.001935
Output di atas memberikan hasil bahwa p-value < \(\alpha\)(5%) maka tolak H0, artinya sisaan tidak homogen.
UJI CHOW
Uji Chow bertujuan untuk mengetahui pilihan modelyang lebih baik digunakan antara common effect dan fixedeffect.
\(H0\): Common Effect Model
\(H1\): Fixed Effect Model
pooltest(cem,fem)##
## F statistic
##
## data: KMIS ~ INFRA + PEKO + INFL + PGGR
## F = 173.29, df1 = 31, df2 = 380, p-value < 2.2e-16
## alternative hypothesis: unstability
pooltest(cem,fem.time)##
## F statistic
##
## data: KMIS ~ INFRA + PEKO + INFL + PGGR
## F = 4.4836, df1 = 12, df2 = 399, p-value = 8.96e-07
## alternative hypothesis: unstability
pooltest(cem,fem.tw)##
## F statistic
##
## data: KMIS ~ INFRA + PEKO + INFL + PGGR
## F = 215.8, df1 = 43, df2 = 368, p-value < 2.2e-16
## alternative hypothesis: unstability
Output di atas menguji perbandingan antara model cem dengan model fem individu, fem waktu, dan fem efek dua arah. Dari ketiga output semuanya memberikan hasil yaitu p-value < \(\alpha\)(5%) maka tolak H0. Artinya penggunaan model FEM lebih baik diterapkan terhadap data daripada model CEM.
UJI HAUSMAN
Uji Hausman digunakan untuk memilih manakah yang lebih tepat antara model random effect atau model fixed effect, dengan hipotesis sebagai berikut :
\(H0\): Random Effect Model
\(H1\): Fixed Effect Model
phtest(fem,rem)##
## Hausman Test
##
## data: KMIS ~ INFRA + PEKO + INFL + PGGR
## chisq = 23.361, df = 4, p-value = 0.0001072
## alternative hypothesis: one model is inconsistent
phtest(fem.time,rem.time)##
## Hausman Test
##
## data: KMIS ~ INFRA + PEKO + INFL + PGGR
## chisq = 36.442, df = 4, p-value = 2.347e-07
## alternative hypothesis: one model is inconsistent
phtest(fem.tw,rem.tw)##
## Hausman Test
##
## data: KMIS ~ INFRA + PEKO + INFL + PGGR
## chisq = 40.108, df = 4, p-value = 4.111e-08
## alternative hypothesis: one model is inconsistent
Output di atas menguji perbandingan antara model rem individu, waktu, dan dua arah dengan model fem individu, fem waktu, dan fem efek dua arah. Dari ketiga output semuanya memberikan hasil yaitu p-value < \(\alpha\)(5%) maka tolak H0. Artinya penggunaan model FEM lebih baik diterapkan terhadap data daripada model REM.
FEM (Fixed Effect Model)
Dari model-model yang telah dibangun sebelumnya yaitu CEM, FEM dan REM kemudian dilakukan pengujian untuk memilih model yang paling baik menggunakan uji Chow dan uji Hausman. Hasilnya model yang paling tepat untuk digunakan adalah Fixed Effect Model. Selanjutnya akan dilihat apakah model FEM yang paling tepat adalah FEM efek satu arah (individu atau waktu) atau efek dua arah.
Pengaruh spesifik individu/waktu
#efek dua arah
plmtest(fem.tw,type = "bp", effect="twoways" )##
## Lagrange Multiplier Test - two-ways effects (Breusch-Pagan)
##
## data: KMIS ~ INFRA + PEKO + INFL + PGGR
## chisq = 1746.8, df = 2, p-value < 2.2e-16
## alternative hypothesis: significant effects
#efek individu
plmtest(fem.tw,type = "bp", effect="individual" )##
## Lagrange Multiplier Test - (Breusch-Pagan)
##
## data: KMIS ~ INFRA + PEKO + INFL + PGGR
## chisq = 1726.2, df = 1, p-value < 2.2e-16
## alternative hypothesis: significant effects
#efek waktu
plmtest(fem.tw,type = "bp", effect="time" )##
## Lagrange Multiplier Test - time effects (Breusch-Pagan)
##
## data: KMIS ~ INFRA + PEKO + INFL + PGGR
## chisq = 20.619, df = 1, p-value = 5.605e-06
## alternative hypothesis: significant effects
Ketiga output di atas menunjukkan hasil bahwa terdapat efek individu dan efek waktu, serta pengujian efek dua arah juga menyatakan bahwa terdapat efek dua arah. Artinya model yang akan dipakai adalah FEM (Fixed Effect Model) dengan efek dua arah (individu dan waktu).
Uji kebebasan pada unit cross section
Biasanya pada datapanel dengan series panjang, seringkali ditemukan adanya dependesi pada unit individu tetapi pada kasus datapanel dengan series yang tidak terlalu panjang hal ini jarang terjadi. Pada bagian ini akan dicek apakah terdapat dependensi pada unit cross section di data panel yang digunakan.
\(H0\): tidak terdapat dependensi antar unit individu
\(H1\): terdapat dependensi antar unit individu
pcdtest(fem.tw, test = c("lm"), index=NULL, w =NULL )##
## Breusch-Pagan LM test for cross-sectional dependence in panels
##
## data: KMIS ~ INFRA + PEKO + INFL + PGGR
## chisq = 2733.3, df = 496, p-value < 2.2e-16
## alternative hypothesis: cross-sectional dependence
Karena nilai p-value yang diperoleh < α= 5% maka tolak H0 yang berarti terdapat dependensi pada unit individu.
FEM LSDV
- Dalam fixed effect model metode LSDV setiap individu merupakan parameter yang tidak diketahui dan akan diestimasi dengan menggunakan teknik variabel boneka sehingga metode ini seringkali disebut dengan Least Square Dummy Variable.
- FEM LSDV biasanya digunakan untuk mengatasi masalah heterogenitas individual dalam data panel atau data cross-section dengan menggunakan variabel dummy untuk setiap individu.
- Metode ini cocok digunakan dalam situasi di mana terdapat variasi dalam karakteristik individu dalam dataset yang berpotensi mempengaruhi variabel dependen.
Model
fem.lsdv <- lm((KMIS) ~ INFRA+PEKO+INFL+PGGR + factor(PROVINSI) + factor(TAHUN), data)
summary(fem.lsdv)##
## Call:
## lm(formula = (KMIS) ~ INFRA + PEKO + INFL + PGGR + factor(PROVINSI) +
## factor(TAHUN), data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -3.7181 -0.7135 0.0506 0.6829 4.9579
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 2.175e+01 1.057e+00 20.573 < 2e-16 ***
## INFRA -6.241e-07 1.586e-07 -3.936 9.92e-05 ***
## PEKO 1.540e-01 2.451e-02 6.281 9.48e-10 ***
## INFL 1.110e-01 4.750e-02 2.337 0.0200 *
## PGGR -6.341e-02 7.886e-02 -0.804 0.4219
## factor(PROVINSI)BABEL -1.401e+01 6.129e-01 -22.865 < 2e-16 ***
## factor(PROVINSI)Bali -1.518e+01 6.968e-01 -21.779 < 2e-16 ***
## factor(PROVINSI)Banten -1.308e+01 5.799e-01 -22.557 < 2e-16 ***
## factor(PROVINSI)Bengkulu -2.505e+00 6.206e-01 -4.036 6.61e-05 ***
## factor(PROVINSI)DIY -5.147e+00 6.331e-01 -8.131 6.60e-15 ***
## factor(PROVINSI)Gorontalo -1.028e+00 6.082e-01 -1.690 0.0918 .
## factor(PROVINSI)JABAR -8.556e+00 5.275e-01 -16.219 < 2e-16 ***
## factor(PROVINSI)Jambi -1.147e+01 6.047e-01 -18.961 < 2e-16 ***
## factor(PROVINSI)JATENG -3.947e+00 5.575e-01 -7.080 7.33e-12 ***
## factor(PROVINSI)JATIM -4.978e+00 6.074e-01 -8.196 4.17e-15 ***
## factor(PROVINSI)KALBAR -1.066e+01 5.775e-01 -18.453 < 2e-16 ***
## factor(PROVINSI)KALSEL -1.439e+01 5.753e-01 -25.003 < 2e-16 ***
## factor(PROVINSI)KALTENG -1.340e+01 6.099e-01 -21.966 < 2e-16 ***
## factor(PROVINSI)KALTIM -1.223e+01 5.326e-01 -22.962 < 2e-16 ***
## factor(PROVINSI)Kepri -1.265e+01 5.472e-01 -23.120 < 2e-16 ***
## factor(PROVINSI)Lampung -3.725e+00 5.565e-01 -6.693 8.17e-11 ***
## factor(PROVINSI)Maluku 2.256e+00 5.234e-01 4.311 2.09e-05 ***
## factor(PROVINSI)MALUT -1.162e+01 5.696e-01 -20.406 < 2e-16 ***
## factor(PROVINSI)NTB -1.400e+00 5.730e-01 -2.444 0.0150 *
## factor(PROVINSI)NTT 2.950e+00 6.269e-01 4.706 3.58e-06 ***
## factor(PROVINSI)PAPUA 8.801e+00 6.744e-01 13.050 < 2e-16 ***
## factor(PROVINSI)PapuaBarat 7.547e+00 5.574e-01 13.539 < 2e-16 ***
## factor(PROVINSI)RIAU -1.073e+01 5.332e-01 -20.124 < 2e-16 ***
## factor(PROVINSI)SULBAR -7.260e+00 6.636e-01 -10.941 < 2e-16 ***
## factor(PROVINSI)SULSEL -8.474e+00 5.399e-01 -15.695 < 2e-16 ***
## factor(PROVINSI)SULTENG -4.472e+00 6.059e-01 -7.381 1.06e-12 ***
## factor(PROVINSI)SulTenggara -5.434e+00 5.969e-01 -9.104 < 2e-16 ***
## factor(PROVINSI)SULUT -1.065e+01 5.151e-01 -20.673 < 2e-16 ***
## factor(PROVINSI)SUMBAR -1.126e+01 5.226e-01 -21.539 < 2e-16 ***
## factor(PROVINSI)SUMSEL -4.923e+00 5.446e-01 -9.039 < 2e-16 ***
## factor(PROVINSI)SUMUT -8.077e+00 5.242e-01 -15.409 < 2e-16 ***
## factor(TAHUN)2009 -8.688e-02 4.987e-01 -0.174 0.8618
## factor(TAHUN)2010 -1.668e+00 3.830e-01 -4.355 1.73e-05 ***
## factor(TAHUN)2011 -2.401e+00 4.832e-01 -4.969 1.03e-06 ***
## factor(TAHUN)2012 -3.485e+00 4.907e-01 -7.103 6.34e-12 ***
## factor(TAHUN)2013 -3.813e+00 3.931e-01 -9.698 < 2e-16 ***
## factor(TAHUN)2014 -4.152e+00 3.912e-01 -10.613 < 2e-16 ***
## factor(TAHUN)2015 -3.442e+00 5.053e-01 -6.811 3.96e-11 ***
## factor(TAHUN)2016 -2.700e+00 6.464e-01 -4.177 3.69e-05 ***
## factor(TAHUN)2017 -3.764e+00 5.740e-01 -6.558 1.85e-10 ***
## factor(TAHUN)2018 -4.057e+00 5.925e-01 -6.847 3.17e-11 ***
## factor(TAHUN)2019 -4.230e+00 6.294e-01 -6.720 6.92e-11 ***
## factor(TAHUN)2020 -3.020e+00 6.373e-01 -4.738 3.09e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.269 on 368 degrees of freedom
## Multiple R-squared: 0.9667, Adjusted R-squared: 0.9624
## F-statistic: 227.1 on 47 and 368 DF, p-value: < 2.2e-16
Model FEM dengan menggunakan metode LSDV memberikan ukuran kebaikan model yang lebih bagus dimana R-squared nya jauh lebih tinggi daripada model-model yang telah dibangun sebelumnya yaitu 0.9667 dan Adjusted R-squared nya 0.9624.
Asumsi normalitas
\(H0\): sisaan menyebar normal
\(H1\): sisaan tidak menyebar normal
res.lsdv <- residuals(fem.lsdv)
ks.test(res.lsdv, "pnorm")##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: res.lsdv
## D = 0.049765, p-value = 0.2542
## alternative hypothesis: two-sided
hist(res.lsdv,
xlab = "sisaan",
col = "steelblue",
breaks=30,
prob = TRUE)
lines(density(res), # density plot
lwd = 2, # thickness of line
col = "chocolate3")Output di atas memberikan hasil bahwa p-value > \(\alpha\)(5%) maka tak tolak H0, artinya sisaan menyebar normal. Selain itu, dilihat dari histrogram sisaannya juga terlihat menggambarkan sebaran normal dengan histogram yang simetris.
Asumsi Autokorelasi
\(H0\): tidak terdapat autokorelasi
\(H1\): terdapat autokorelasi
library(lmtest)
bgtest(fem.lsdv)##
## Breusch-Godfrey test for serial correlation of order up to 1
##
## data: fem.lsdv
## LM test = 188.13, df = 1, p-value < 2.2e-16
Output di atas memberikan hasil bahwa p-value < \(\alpha\)(5%) maka tolak H0, artinya terdapat autokorelasi.
Asumsi Homoskedastisitas
\(H0\): homoskedastisitas
\(H1\): heteroskedastisitas
bptest(fem.lsdv)##
## studentized Breusch-Pagan test
##
## data: fem.lsdv
## BP = 189.13, df = 47, p-value < 2.2e-16
Output di atas memberikan hasil bahwa p-value < \(\alpha\)(5%) maka tolak H0, artinya sisaan tidak homogen.
PEMILIHAN MODEL TERBAIK
library(performance)
model_performance(cem,metrics = "all")## # Indices of model performance
##
## AIC | AICc | BIC | R2 | R2 (adj.) | RMSE | Sigma
## ------------------------------------------------------------------
## 2698.279 | 2698.484 | 2722.463 | 0.126 | 0.118 | 6.109 | 6.146
model_performance(fem,metrics = "all")## # Indices of model performance
##
## AIC | AICc | BIC | R2 | R2 (adj.) | RMSE | Sigma
## ------------------------------------------------------------------
## 1565.948 | 1566.095 | 1586.102 | 0.509 | 0.464 | 1.570 | 1.578
model_performance(fem.time,metrics = "all")## # Indices of model performance
##
## AIC | AICc | BIC | R2 | R2 (adj.) | RMSE | Sigma
## ------------------------------------------------------------------
## 2643.657 | 2643.803 | 2663.810 | 0.165 | 0.131 | 5.735 | 5.762
model_performance(fem.tw,metrics = "all")## # Indices of model performance
##
## AIC | AICc | BIC | R2 | R2 (adj.) | RMSE | Sigma
## ------------------------------------------------------------------
## 1337.480 | 1337.626 | 1357.633 | 0.149 | 0.040 | 1.193 | 1.199
model_performance(rem,metrics = "all")## # Indices of model performance
##
## AIC | AICc | BIC | R2 | R2 (adj.) | RMSE | Sigma
## ------------------------------------------------------------------
## 1610.675 | 1610.881 | 1634.860 | 0.480 | 0.475 | 1.653 | 1.663
model_performance(rem.time,metrics = "all")## # Indices of model performance
##
## AIC | AICc | BIC | R2 | R2 (adj.) | RMSE | Sigma
## ------------------------------------------------------------------
## 2698.279 | 2698.484 | 2722.463 | 0.126 | 0.118 | 6.109 | 6.146
model_performance(rem.tw,metrics = "all")## # Indices of model performance
##
## AIC | AICc | BIC | R2 | R2 (adj.) | RMSE | Sigma
## ------------------------------------------------------------------
## 1450.776 | 1450.982 | 1474.960 | 0.240 | 0.232 | 1.364 | 1.372
model_performance(fem.lsdv,metrics = "all")## # Indices of model performance
##
## AIC | AICc | BIC | R2 | R2 (adj.) | RMSE | Sigma
## ------------------------------------------------------------------
## 1425.480 | 1438.868 | 1622.984 | 0.967 | 0.962 | 1.193 | 1.269
# Membuat data frame
perbandingan <- data.frame(Model = c("CEM", "FEM INDIVIDU", "FEM TIME", "FEM TWO WAYS", "REM INDIVIDU", "REM TIME", "REM TWO WAYS", "FEM LSDV"), NILAI.AIC = c(2698.279, 1565.948, 2643.657, 1337.480, 1610.675, 2698.279, 1450.776, 1425.480), ADJUSTED.R.SQUARE = c(0.118, 0.464, 0.131, 0.040, 0.475, 0.118, 0.232, 0.962), RMSE = c(6.109, 1.570, 5.735, 1.193, 1.653, 6.109, 1.364, 1.193))# Membuat tabel dengan fungsi kable
tabel <- knitr::kable(perbandingan, align = 'l', caption = "Perbandingan Performa Model")
tabel| Model | NILAI.AIC | ADJUSTED.R.SQUARE | RMSE |
|---|---|---|---|
| CEM | 2698.279 | 0.118 | 6.109 |
| FEM INDIVIDU | 1565.948 | 0.464 | 1.570 |
| FEM TIME | 2643.657 | 0.131 | 5.735 |
| FEM TWO WAYS | 1337.480 | 0.040 | 1.193 |
| REM INDIVIDU | 1610.675 | 0.475 | 1.653 |
| REM TIME | 2698.279 | 0.118 | 6.109 |
| REM TWO WAYS | 1450.776 | 0.232 | 1.364 |
| FEM LSDV | 1425.480 | 0.962 | 1.193 |
Tabel di atas menunjukkan perbandingan performa dari model-model yang sudah dibangun. Performa model dapat dilihat berdasarkan nilai AIC, ADJ R-SQUARE, dan RMSE. Dari tabel tersebut kita akan memilih model dengan performa terbaik yaitu AIC paling kecil, ADJ R-SQUARE paling tinggi dan RMSE paling kecil. Berdasarkan hal tersebut diperoleh model terbaik yaitu FEM LSDV. Nilai AIC paling kecil terdapat pada model FEM TWO-WAYS, namun nilai ADJ R-SQUARE nya sangat kecil. Oleh karena itu disimpulkan model terbaik adalah FEM LSDV dengan nilai AIC yang kecil, ADJ R-SQUARE sangat tinggi dan RMSE yang kecil. Selain itu FEM LSDV juga memenuhi asumsi sisaan menyebar normal.
INTERPRETASI MODEL FEM LSDV
summary(fem.lsdv)##
## Call:
## lm(formula = (KMIS) ~ INFRA + PEKO + INFL + PGGR + factor(PROVINSI) +
## factor(TAHUN), data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -3.7181 -0.7135 0.0506 0.6829 4.9579
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 2.175e+01 1.057e+00 20.573 < 2e-16 ***
## INFRA -6.241e-07 1.586e-07 -3.936 9.92e-05 ***
## PEKO 1.540e-01 2.451e-02 6.281 9.48e-10 ***
## INFL 1.110e-01 4.750e-02 2.337 0.0200 *
## PGGR -6.341e-02 7.886e-02 -0.804 0.4219
## factor(PROVINSI)BABEL -1.401e+01 6.129e-01 -22.865 < 2e-16 ***
## factor(PROVINSI)Bali -1.518e+01 6.968e-01 -21.779 < 2e-16 ***
## factor(PROVINSI)Banten -1.308e+01 5.799e-01 -22.557 < 2e-16 ***
## factor(PROVINSI)Bengkulu -2.505e+00 6.206e-01 -4.036 6.61e-05 ***
## factor(PROVINSI)DIY -5.147e+00 6.331e-01 -8.131 6.60e-15 ***
## factor(PROVINSI)Gorontalo -1.028e+00 6.082e-01 -1.690 0.0918 .
## factor(PROVINSI)JABAR -8.556e+00 5.275e-01 -16.219 < 2e-16 ***
## factor(PROVINSI)Jambi -1.147e+01 6.047e-01 -18.961 < 2e-16 ***
## factor(PROVINSI)JATENG -3.947e+00 5.575e-01 -7.080 7.33e-12 ***
## factor(PROVINSI)JATIM -4.978e+00 6.074e-01 -8.196 4.17e-15 ***
## factor(PROVINSI)KALBAR -1.066e+01 5.775e-01 -18.453 < 2e-16 ***
## factor(PROVINSI)KALSEL -1.439e+01 5.753e-01 -25.003 < 2e-16 ***
## factor(PROVINSI)KALTENG -1.340e+01 6.099e-01 -21.966 < 2e-16 ***
## factor(PROVINSI)KALTIM -1.223e+01 5.326e-01 -22.962 < 2e-16 ***
## factor(PROVINSI)Kepri -1.265e+01 5.472e-01 -23.120 < 2e-16 ***
## factor(PROVINSI)Lampung -3.725e+00 5.565e-01 -6.693 8.17e-11 ***
## factor(PROVINSI)Maluku 2.256e+00 5.234e-01 4.311 2.09e-05 ***
## factor(PROVINSI)MALUT -1.162e+01 5.696e-01 -20.406 < 2e-16 ***
## factor(PROVINSI)NTB -1.400e+00 5.730e-01 -2.444 0.0150 *
## factor(PROVINSI)NTT 2.950e+00 6.269e-01 4.706 3.58e-06 ***
## factor(PROVINSI)PAPUA 8.801e+00 6.744e-01 13.050 < 2e-16 ***
## factor(PROVINSI)PapuaBarat 7.547e+00 5.574e-01 13.539 < 2e-16 ***
## factor(PROVINSI)RIAU -1.073e+01 5.332e-01 -20.124 < 2e-16 ***
## factor(PROVINSI)SULBAR -7.260e+00 6.636e-01 -10.941 < 2e-16 ***
## factor(PROVINSI)SULSEL -8.474e+00 5.399e-01 -15.695 < 2e-16 ***
## factor(PROVINSI)SULTENG -4.472e+00 6.059e-01 -7.381 1.06e-12 ***
## factor(PROVINSI)SulTenggara -5.434e+00 5.969e-01 -9.104 < 2e-16 ***
## factor(PROVINSI)SULUT -1.065e+01 5.151e-01 -20.673 < 2e-16 ***
## factor(PROVINSI)SUMBAR -1.126e+01 5.226e-01 -21.539 < 2e-16 ***
## factor(PROVINSI)SUMSEL -4.923e+00 5.446e-01 -9.039 < 2e-16 ***
## factor(PROVINSI)SUMUT -8.077e+00 5.242e-01 -15.409 < 2e-16 ***
## factor(TAHUN)2009 -8.688e-02 4.987e-01 -0.174 0.8618
## factor(TAHUN)2010 -1.668e+00 3.830e-01 -4.355 1.73e-05 ***
## factor(TAHUN)2011 -2.401e+00 4.832e-01 -4.969 1.03e-06 ***
## factor(TAHUN)2012 -3.485e+00 4.907e-01 -7.103 6.34e-12 ***
## factor(TAHUN)2013 -3.813e+00 3.931e-01 -9.698 < 2e-16 ***
## factor(TAHUN)2014 -4.152e+00 3.912e-01 -10.613 < 2e-16 ***
## factor(TAHUN)2015 -3.442e+00 5.053e-01 -6.811 3.96e-11 ***
## factor(TAHUN)2016 -2.700e+00 6.464e-01 -4.177 3.69e-05 ***
## factor(TAHUN)2017 -3.764e+00 5.740e-01 -6.558 1.85e-10 ***
## factor(TAHUN)2018 -4.057e+00 5.925e-01 -6.847 3.17e-11 ***
## factor(TAHUN)2019 -4.230e+00 6.294e-01 -6.720 6.92e-11 ***
## factor(TAHUN)2020 -3.020e+00 6.373e-01 -4.738 3.09e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.269 on 368 degrees of freedom
## Multiple R-squared: 0.9667, Adjusted R-squared: 0.9624
## F-statistic: 227.1 on 47 and 368 DF, p-value: < 2.2e-16
Output diatas menampilkan summary dari model FEM LSDV,dari output tersebut model yang diperoleh sebagai berikut: \(\hat y = 2.175 \times 10^1 - 6.241\times10^{-7}(INFRA)+1.540\times 10^{-1}(PEKO)+1.110\times 10^{-1}(INFL)-6.341\times 10^{-2}(PGGR)\)
- Setiap kenaikan satu satuan variabel INFRASTRUKTUR maka tingkat kemiskinan akan menurun sebesar -6.241e-07 dan menganggap variabel lain konstan
- Setiap kenaikan satu satuan variabel PERTUMBUHAN EKONOMI maka tingkat kemiskinan akan naik sebesar 1.540e-01 dan menganggap variabel lain konstan
- Setiap kenaikan satu satuan variabel INFLASI maka tingkat kemiskinan akan naik sebesar 1.110e-01 dan menganggap variabel lain konstan
- Setiap kenaikan satu satuan variabel PENGANGGURAN maka tingkat kemiskinan akan turun sebesar -6.341e-02 dan menganggap variabel lain konstan
- Berdasarkan uji parsial diperoleh bahwa nilai p-value pada variabel INFRASTRUKTUR, PERTUMBUHAN EKONOMI, INFLASI kurang dari alpha 0.05 yang berarti hipotesis nol ditolak. Sehingga, secara parsial variabel independen tersebut berpengaruh signifikan terhadap PERSENTASE KEMISKINAN
- Selain itu, dapat dilihat nilai adjusted koefisien determinasi sebesar 0.9624. Artinya, variabel independen yaitu infrastruktur, pertumbuhan ekonomi, inflasi dan pengangguran mampu menjelaskan variabel dependen yaitu PDRB sebesar 96.24%, sedangkan sisanya sebesar dijelaskan oleh faktor lain yang tidak disebutkan dalam model.