KELOMPOK_10.knit

Kelompok 10

2023-04-07

Pemodelan Kemiskinan di Indonesia dengan Regresi Data Panel Kelompok 10 Paralel 1

Nama Anggota :

1. Nana Oktaviana (G1401201006)

2. Nanda Putri Cintari (G1401201024)

3. Cahya Ireno Anugrah (G1401201034)

4. Maulana Ahsan Fadilah (G1401201062)

5. Steven Kurniawan (G1401201098)

Latar Belakang

Kemiskinan masih menjadi masalah sosial yang signifikan di Indonesia. Meskipun telah dilakukan berbagai upaya untuk mengurangi tingkat kemiskinan, namun angka kemiskinan masih cukup tinggi. Oleh karena itu, perlu dilakukan analisis lebih lanjut untuk memahami faktor-faktor apa yang mempengaruhi kemiskinan di Indonesia.

Pemodelan kemiskinan dengan regresi data panel dengan peubah bebas Infrastruktur, Pertumbuhan Ekonomi, Inflasi,dan Pengangguran dipilih karena peubah-peubah tersebut telah diidentifikasi sebagai faktor yang mempengaruhi kemiskinan di Indonesia. Infrastruktur yang buruk dapat menghambat pertumbuhan ekonomi dan mengurangi akses masyarakat terhadap fasilitas publik. Pertumbuhan ekonomi yang rendah dapat mempengaruhi pendapatan masyarakat dan menyebabkan kemiskinan. Inflasi yang tinggi dapat mengurangi daya beli masyarakat dan memperburuk kondisi kemiskinan. Pengangguran juga merupakan salah satu faktor yang menyebabkan kemiskinan.

Dalam analisis panel data, kita dapat mempertimbangkan perbedaan antar unit (misalnya, perbedaan antara propinsi atau kabupaten/kota) serta perbedaan dalam waktu (misalnya, perbedaan antara tahun-tahun yang berbeda). Dengan demikian, analisis panel data dapat memberikan pemahaman yang lebih komprehensif tentang faktor-faktor apa yang mempengaruhi tingkat kemiskinan di Indonesia.

Dengan memodelkan kemiskinan di Indonesia dengan regresi data panel dengan peubah bebas Infrastruktur, Pertumbuhan Ekonomi, Inflasi, Pengangguran, dan Kemiskinan, diharapkan dapat memberikan pemahaman yang lebih baik tentang faktor-faktor apa yang mempengaruhi kemiskinan di Indonesia dan memberikan dasar untuk kebijakan yang lebih efektif dalam mengurangi tingkat kemiskinan.

Tinjauan Pustaka

Common Effect Model (CEM)

Common Effect Model (CEM) adalah model yang paling sederhana dalam analisis regresi data panel (Mobonggi et al, 2022). Model ini tidak memperhatikan dimensi waktu dan juga dimensi individu atau cross section, sehingga sulit untuk melihat perubahan antar individu karena semua dianggap sama. Pendekatan atau prinsip yang digunakan pada model ini adalah Ordinary Least Square (OLS). Maka dari itu, CEM disebut juga model Pooled Least Square. Berdasarkan asumsi OLS, berikut adalah persamaan dari CEM:

$Y_{it} = \beta_0 + \sum_{K=1}^{n} \beta_k X_{kit} + \epsilon_{it}$

dengan:

$Y_{it} =$ nilai variabel dependen unit cross section ke-$i$ untuk periode ke-$t$

$\beta_0 =$ intersep atau konstanta unit cross section

$X_{kit} = [x_{1n}, x_{2n}, ..., x_{kn}]$ vektor variabel independen berukuran (1x$k$)

$\beta_k = [\beta_1, \beta_2, ..., \beta_k]$ vektor slope atau koefisien regresi sebanyak $k$ variabel independen berukuran ($k$x1)

$\epsilon_{it} =$ galat regresi unit cross section ke-$i$ untuk periode ke-$t$; $\epsilon_{it}\sim \mathcal{N}(0,\sigma^2)$

Fixed Effect Model (FEM)

Model pengaruh tetap mempertimbangkan adanya pengaruh individu dan waktu. Terdapat asumsi bahwa intersep antar individu dan waktu berbeda tetapi koefisien regresi konstan untuk semua individu dan waktu. Pendugaan model pengaruh tetap ini menggunakan metode Least Square Dummy Variable Regression (Baltagi 2005). Adanya pengaruh waktu atau pengaruh individu dalam model pengaruh tetap disebut model sisaan satu arah. Sedangkan adanya pengaruh waktu dan individu disebut model sisaan dua arah. Model sisaan satu arah setiap individu atau waktu memiliki intersep yang berbeda dengan nilai intersep dihitung untuk setiap individu atau waktu yang kemudian dimasukkan ke dalam model. Model ini kemudian memperkirakan koefisien regresi untuk peubah respon yang bersifat homogen di seluruh individu atau waktu. Dalam model sisaan dua arah, terdapat pengaruh waktu dan individu, efek individu mengukur perbedaan antar individu yang tidak dapat dijelaskan oleh peubah-peubah yang diamati, sedangkan efek waktu mengukur perubahan dalam waktu yang tidak dapat dijelaskan oleh peubah-peubah yang diamati (Gujarati 2004). Dengan memasukkan peubah acak ini ke dalam model, dapat diperoleh estimasi yang lebih akurat untuk pengaruh peubah bebas pada peubah respon.

a. Persamaan model secara umum

$y_{it} = \beta_{0it}+\beta_1X_{1it}+\beta_2X_{2it}+...+ \beta_jX_{jit}+\epsilon_{it}$

Persamaan di atas digunakan untuk mengetahui pengaruh dari peubah respon dan peubah bebas secara umum tanpa melihat individu dan periode waktu

b. Persamaan slope tetap dan intercept bervariasi antar unit

$y_{it} = (\beta_{0it}+\beta_{0i})+\beta_1X_{1it}+\beta_2X_{2it}+...+ \beta_jX_{jit}+\epsilon_{it}$

Persamaan di atas digunakan untuk melihat model dari masing-masing unit. Berdasarkan persamaan terdapat penambahan intercept ke-$i$ yang berarti intercept dipengaruhi oleh unit.

c. Persamaan slope tetap dan intercept bervariasi antar unit dan periode waktu

$y_{it} = (\beta_{0it}+\beta_{0i}+\beta_{0t})+\beta_1X_{1it}+\beta_2X_{2it}+...+ \beta_jX_{jit}+\epsilon_{it}$

Persamaan di atas digunakan untuk melihat model masing-masing unit pada periode waktu unit tersebut. Berdasarkan persamaan, penambahan intercept ke-$i$ dan ke-$t$ yang berarti intercept tidak hanya dipengaruhi oleh unit namun juga dipengaruhi oleh periode waktu.

Pendugaan parameter pada model pengaruh tetap diduga dengan menggunakan pendekatan metode OLS dengan data dummy.

Random Effect Model (REM)

Analisis data panel menggunakan Random Effect Model (REM) merupakan model analisis regresi data panel dengan asumsi bahwa nilai dari pengaruh spesifik individu bersifat acak. Model REM lebih baik digunakan dibandingkan model FEM apabila jumlah parameter dan pengurangan derajat kebebasan harus dikurangi (Nandita et al. 2019), Pada model REM, spesifikasi model cocok digunakan saat mengambil $N$ individu dari jumlah populasi yang besar (Wahyuni dan Mahmudah 2017). Untuk model dari REM yakni sebagai berikut:

Model sisaan satu arah dengan faktor individu:

$y_{it} = \alpha+\beta_1X_{1,it}+\beta_2X_{2,it}+...+ \beta_kx_{k,it}+f_i+\epsilon_{it}$

Model sisaan satu arah dengan faktor waktu:

$y_{it} = \alpha+\beta_1X_{1,it}+\beta_2X_{2,it}+...+ \beta_kx_{k,it}+\lambda_i+\epsilon_{it}$

Model sisaan dua arah:

$y_{it} = \alpha+\beta_1X_{1,it}+\beta_2X_{2,it}+...+ \beta_kx_{k,it}+\lambda_i+f_i+\epsilon_{it}$

Pada model REM, digunakan metode -Generalized Least Squares_ (GLS) sebagai penduga parameter (Gujarati 2004). GLS digunakan sebagai penduga karena informasi heterogenitas antara individu dan waktu digunakan sebagai informasi yang penting untung menghasilkan parameter (beta). Persamaan yang digunakan dalam pendugaan parameter GLS yakni:

$\beta = (X^{'}(\sum)^{-1}X)^{-1}X^{'}(\sum)^{-1}y$

Dimana $X$ merupakan matriks peubah penjelas, merupakan matriks kovarians, dan $y$ merupakan vektor peubah respon.

Uji Chow

Uji Chow adalah uji yang digunakan untuk menguji signifikansi antara model pooled least square dengan fixed effect model. Pengujian hipotesis sebagai berikut:

$H_0 : \mu_1 = \mu_1 = ... = \mu_{N-1} = 0$

$H_1 :$ minimal ada satu $i$ sehingga $i ≠ 0$

Statistik uji:

$F_0 = \frac{(RRSS-URSS)/(N-1)}{URSS/(NT-N-K)}$

dengan RRSS (Restricted Residual Sums of Square) diperoleh dari sum square residual hasil pendugaan model pooled least square dan URSS (Unrestricted Residual Sums of Square) didapat dari sum square residual hasil pendugaan fixed effect model (Baltagi 2005). Hipotesis nol menyatakan model yang lebih sesuai digunakan adalah pooled least square, tolak H0 jika $F_0 > F_{N-1, NT-1-k}$

Uji Hausman

Uji Hausman adalah uji yang digunakan untuk menguji apakah model data panel yang lebih sesuai dibangun merupakan random effect model atau fixed effect model. Uji Hausman didasarkan pada perbedaan penduga model pengaruh tetap dengan penduga model pengaruh acak. Kedua penduga konsisten dalam kondisi $H_0$, tetapi akan bias dan tidak konsisten pada $H_1$. Pengujian hipotesis yang digunakan yaitu:

$H_0$ : Model pengaruh acak adalah model yang tepat

$H_1$ : Model pengaruh tetap adalah model yang tepat

Statistik uji:

$\chi^2_{hit} = (\hat{\beta}_{MPA} - \hat{\beta}_{MPT})^{'}(V_{MPT} - V_{MPA})^{-1}(\hat{\beta}_{MPA} - \hat{\beta}_{MPT})$

Keputusan Tolak $H_0$ jika $\chi^2_{hit} > \chi^2_{k, \alpha}$ atau nilai $p-value < \alpha$ (Baltagi, 2005)

Deskripsi Data

Data yang digunakan adalah data panel 31 Provinsi di Indonesia selama 13 tahun dengan peubah-peubah sebagai berikut:

X1 (INFR) : Infrastrukur (Juta)

X2 (PEKO) : Pertumbuhan Ekonomi (%)

X3 (INFL) : Inflasi (%)

X4 (PGGR) : Pengangguran (%)

Y (KMIS) : Kemiskinan (%)

data <- read_excel("D:/Kuliah Semester 6/Data.xlsx") head(data)

## # A tibble: 6 × 7 ## PROVINSI TAHUN INFRA PEKO INFL PGGR KMIS ## <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> ## 1 Bali 2008 430814 5.97 9.62 3.31 6.17 ## 2 Bali 2009 484340 5.33 4.37 3.13 5.13 ## 3 Bali 2010 336352 5.83 8.1 3.06 4.88 ## 4 Bali 2011 298867 6.49 3.75 2.95 4.2 ## 5 Bali 2012 348529 6.65 4.71 2.1 3.95 ## 6 Bali 2013 398608 6.69 8.16 1.83 4.49

Tahapan Analisis

Melakukan Eksplorasi Data

Melakukan pengujian multikolinearitas antar peubah-peubah penjelas

Menentukan model terbaik data panel melalui uji Chow dan uji Haussman

Melakukan Interpretasi hasil dengan model terbaik

Eksplorasi Data

Eksplorasi Spasial

Admin1 <- "idn_admbnda_adm1_bps_20200401.shp" Admin1 <- st_read(Admin1) data2 <- read_excel("D:/Kuliah Semester 6/Data2.xlsx") data2 <- data2%>%filter(TAHUN=="2020") Indo_Geo <- geo_join(spatial_data=Admin1, data_frame=data2, by_sp="ADM1_EN", by_df="PROVINSI", how = "inner") mycol <- c("green", "yellow", "red", "red4") (Spasial<-ggplot()+ geom_sf(data=Indo_Geo,aes(fill=Indo_Geo$KMIS))+theme_bw()+ labs(title = "Persebaran Tingkat Kemiskinan di Indonesia ", subtitle = "Tahun 2020", fill ="Kemiskinan")+ theme( plot.title = element_text(size = 14L, face = "bold", hjust = 0.5, colour = "white"), plot.subtitle = element_text(size = 12L, face = "plain", hjust = 0.5, colour = "white"), legend.title = element_text(colour = "white",face = "bold"), legend.text = element_text(colour = "white"), legend.position = "right",plot.background=element_rect(fill="#141415",color="#141415"), panel.background=element_rect(fill="#141415",color="#141415"), legend.background = element_rect(fill="#141415",color="#141415"), panel.grid.major = element_blank(), panel.grid.minor = element_blank(), panel.border = element_blank(), axis.text.x = element_blank(), axis.text.y = element_blank(),plot.title.position = "plot")+ scale_fill_fermenter(direction = 1))

Gambar di atas menunjukkan persebaran tingkat kemiskinan di Indonesia tahun 2020 yang mana Pulau Papua dan Kepulauan Nusa Tenggara memiliki tingkat kemiskinan paling tinggi yaitu di atas 20. Uniknya, Bali memiliki tingkat kemiskinan yang rendah yaitu dibawah 5. Pulau Kalimantan memiliki persebaran tingkat kemiskinan hampir sama antarprovinsinya yaitu 5-10. Sedangkan pada Pulau Jawa yang menjadi pusat perekonomian memiliki persebaran tingkat kemiskinan dibawah 10 untuk provinsi Jawa Barat, Banten dan Jakarta, sedangkan provinsi lainnya dibawah 15. Pulau Sumatera memiliki tingkat kemiskinan 15-10, sedangkan Provinsi Aceh dan Bengkulu memiliki tingkat kemiskinan di atas 15. Begitupun dengan Pulau Sulawesi hanya 1 provinsi, Gorontalo, memiliki tingkat kemiskinan di atas 15.

Eksplorasi Daerah

mdf <- read_excel("D:/Kuliah Semester 6/Data.xlsx") mdf <- mdf[,c(1,2,7)] Jawa <- mdf%>%filter(PROVINSI %in% c("JABAR","Banten","JATENG","DIY", "JATIM")) Sumatra <- mdf%>%filter(PROVINSI %in% c("Aceh","SUMUT","RIAU","SUMBAR", "Kepri","Jambi","SUMSEL","BABEL", "Bengkulu","Lampung","BABEL")) Kalimantan <- mdf%>%filter(PROVINSI %in% c("KALBAR","KALTENG","KALSEL", "KALTIM")) Bali <- mdf%>%filter(PROVINSI %in% c("Bali","NTB","NTT")) Papua <- mdf%>%filter(PROVINSI %in% c("Maluku","MALUT","PAPUA","PapuaBarat")) Sulawesi <- mdf%>%filter(PROVINSI %in% c("SULUT","Gorontalo","SULTENG", "SULSEL","SULBAR","SulTenggara"))

Eksplorasi Pulau Jawa

ggplot(data=Jawa, aes(x=TAHUN, y=KMIS, group = PROVINSI, colour = PROVINSI))+ theme_bw()+ geom_line(size=1.2) + geom_point( size=3, shape=19, fill="red")+scale_color_manual(values = palette(brewer.pal(n = 24, name = "Spectral")))+labs(colour="Provinsi", title = "Tingkat Kemiskinan di Jawa ",subtitle = "Tahun 2008-2020",)+ theme( plot.title = element_text(size = 14L, face = "bold", hjust = 0.5, color = "white"), plot.subtitle = element_text(size = 12L, face = "bold", hjust = 0.5, color="white"), legend.position = "right", axis.title.y = element_text(hjust = 0.5,face = "bold",colour = "white"), axis.title.x = element_text(hjust = 0.5,face = "bold",colour = "white"),plot.background=element_rect(fill="#141415",color="#141415"), panel.background=element_rect(fill="#141415",color="#141415"), legend.background = element_rect(fill="#141415",color="#141415"), legend.title = element_text(colour = "white",face = "bold"), legend.text = element_text(colour = "white"),axis.text.x = element_text(hjust = 0.5,face = "bold",colour = "white"),axis.text.y = element_text(hjust = 0.5,face = "bold",colour = "white"), panel.grid.major = element_blank(), panel.grid.minor = element_blank(),panel.border = element_rect(colour = "white") )+scale_color_manual(values = palette(brewer.pal(n = 24, name = "Spectral")))

## Scale for colour is already present. ## Adding another scale for colour, which will replace the existing scale.

Persebaran tingkat kemiskinan provinsi di Pulau Jawa rata-rata mengalami penurunan dari tahun 2008. Namun pada 2020 mengalami kenaikan yang cukup signifikan karena adanya pandemi Covid-19 sehingga kegiatan perekonomian berdampak besar. Provinsi Banten memiliki tingkat kemiskinan paling rendah di Pulau Jawa, diikuti Provinsi Jawa Barat. Provinsi DIY, Jawa Tengah dan Jawa Timur memiliki tingkat kemiskinan yang tinggi.

Eksplorasi Pulau Sumatra

ggplot(data=Sumatra, aes(x=TAHUN, y=KMIS, group = PROVINSI, colour = PROVINSI))+ theme_bw()+ geom_line(size=1.2) + geom_point( size=3, shape=19, fill="red")+labs(colour="Provinsi", title = "Tingkat Kemiskinan di Sumatra ",subtitle = "Tahun 2008-2020",)+ theme( plot.title = element_text(size = 14L, face = "bold", hjust = 0.5, color = "white"), plot.subtitle = element_text(size = 12L, face = "bold", hjust = 0.5, color="white"), legend.position = "right", axis.title.y = element_text(hjust = 0.5,face = "bold",colour = "white"), axis.title.x = element_text(hjust = 0.5,face = "bold",colour = "white"),plot.background=element_rect(fill="#141415",color="#141415"), panel.background=element_rect(fill="#141415",color="#141415"), legend.background = element_rect(fill="#141415",color="#141415"), legend.title = element_text(colour = "white",face = "bold"), legend.text = element_text(colour = "white"),axis.text.x = element_text(hjust = 0.5,face = "bold",colour = "white"),axis.text.y = element_text(hjust = 0.5,face = "bold",colour = "white"), panel.grid.major = element_blank(), panel.grid.minor = element_blank(),panel.border = element_rect(colour = "white") )+scale_color_manual(values = palette(brewer.pal(n = 24, name = "Spectral")))

Persebaran tingkat kemiskinan provinsi di Pulau Sumatera rata-rata mengalami penurunan dari tahun 2008. Namun pada 2020 mengalami kenaikan yang cukup signifikan karena adanya pandemi Covid-19 sehingga kegiatan perekonomian berdampak besar. Provinsi Bangka Belitung memiliki tingkat kemiskinan paling rendah di Pulau Sumatera, diikuti Provinsi Kepulauan Riau. Provinsi Aceh dan Bengkulu memiliki tingkat kemiskinan yang tinggi.

Eksplorasi Pulau Kalimantan

ggplot(data=Kalimantan, aes(x=TAHUN, y=KMIS, group = PROVINSI, colour = PROVINSI))+ theme_bw()+ geom_line(size=1.2) + geom_point( size=3, shape=19, fill="red")+labs(colour="Provinsi", title = "Tingkat Kemiskinan di Kalimantan ",subtitle = "Tahun 2008-2020",)+ theme( plot.title = element_text(size = 14L, face = "bold", hjust = 0.5, color = "white"), plot.subtitle = element_text(size = 12L, face = "bold", hjust = 0.5, color="white"), legend.position = "right", axis.title.y = element_text(hjust = 0.5,face = "bold",colour = "white"), axis.title.x = element_text(hjust = 0.5,face = "bold",colour = "white"),plot.background=element_rect(fill="#141415",color="#141415"), panel.background=element_rect(fill="#141415",color="#141415"), legend.background = element_rect(fill="#141415",color="#141415"), legend.title = element_text(colour = "white",face = "bold"), legend.text = element_text(colour = "white"),axis.text.x = element_text(hjust = 0.5,face = "bold",colour = "white"),axis.text.y = element_text(hjust = 0.5,face = "bold",colour = "white"), panel.grid.major = element_blank(), panel.grid.minor = element_blank(),panel.border = element_rect(colour = "white") )+scale_color_manual(values = palette(brewer.pal(n = 24, name = "Spectral")))

Persebaran tingkat kemiskinan provinsi di Pulau Kalimantan rata-rata mengalami penurunan dari tahun 2008. Namun pada 2020 mengalami kenaikan yang cukup signifikan karena adanya pandemi Covid-19 sehingga kegiatan perekonomian berdampak besar. Provinsi Kalimantan Selatan memiliki tingkat kemiskinan paling rendah di Pulau Kalimantan, diikuti Provinsi Kalimantan Tengah. Provinsi Kalimantan Barat memiliki tingkat kemiskinan yang tinggi.

Eksplorasi Pulau Bali dan Sekitarnya

ggplot(data=Bali, aes(x=TAHUN, y=KMIS, group = PROVINSI, colour = PROVINSI))+ theme_bw()+ geom_line(size=1.2) + geom_point( size=3, shape=19, fill="red")+labs(colour="Provinsi", title = "Tingkat Kemiskinan di Bali ",subtitle = "Tahun 2008-2020",)+ theme( plot.title = element_text(size = 14L, face = "bold", hjust = 0.5, color = "white"), plot.subtitle = element_text(size = 12L, face = "bold", hjust = 0.5, color="white"), legend.position = "right", axis.title.y = element_text(hjust = 0.5,face = "bold",colour = "white"), axis.title.x = element_text(hjust = 0.5,face = "bold",colour = "white"),plot.background=element_rect(fill="#141415",color="#141415"), panel.background=element_rect(fill="#141415",color="#141415"), legend.background = element_rect(fill="#141415",color="#141415"), legend.title = element_text(colour = "white",face = "bold"), legend.text = element_text(colour = "white"),axis.text.x = element_text(hjust = 0.5,face = "bold",colour = "white"),axis.text.y = element_text(hjust = 0.5,face = "bold",colour = "white"), panel.grid.major = element_blank(), panel.grid.minor = element_blank(),panel.border = element_rect(colour = "white") )+scale_color_manual(values = palette(brewer.pal(n = 24, name = "Spectral")))

Persebaran tingkat kemiskinan provinsi di Pulau Bali dan sekitarnya rata-rata mengalami naik dan turun dari tahun 2008. Namun pada 2020 mengalami kenaikan yang cukup signifikan karena adanya pandemi Covid-19 sehingga kegiatan perekonomian berdampak besar. Provinsi Bali memiliki tingkat kemiskinan paling rendah di Pulau Bali dan sekitarnya. Provinsi Nusa Tenggara Timur memiliki tingkat kemiskinan yang tinggi.

Eksplorasi Pulau Papua

ggplot(data=Papua, aes(x=TAHUN, y=KMIS, group = PROVINSI, colour = PROVINSI))+ theme_bw()+ geom_line(size=1.2) + geom_point( size=3, shape=19, fill="red")+labs(colour="Provinsi", title = "Tingkat Kemiskinan di Papua ",subtitle = "Tahun 2008-2020",)+ theme( plot.title = element_text(size = 14L, face = "bold", hjust = 0.5, color = "white"), plot.subtitle = element_text(size = 12L, face = "bold", hjust = 0.5, color="white"), legend.position = "right", axis.title.y = element_text(hjust = 0.5,face = "bold",colour = "white"), axis.title.x = element_text(hjust = 0.5,face = "bold",colour = "white"),plot.background=element_rect(fill="#141415",color="#141415"), panel.background=element_rect(fill="#141415",color="#141415"), legend.background = element_rect(fill="#141415",color="#141415"), legend.title = element_text(colour = "white",face = "bold"), legend.text = element_text(colour = "white"),axis.text.x = element_text(hjust = 0.5,face = "bold",colour = "white"),axis.text.y = element_text(hjust = 0.5,face = "bold",colour = "white"), panel.grid.major = element_blank(), panel.grid.minor = element_blank(),panel.border = element_rect(colour = "white") )+scale_color_manual(values = palette(brewer.pal(n = 24, name = "Spectral")))+ scale_y_continuous(limits = c(0, 40))

Persebaran tingkat kemiskinan provinsi di Pulau Papua rata-rata mengalami penurunan dari tahun 2008. Namun pada 2020 mengalami kenaikan yang cukup signifikan karena adanya pandemi Covid-19 sehingga kegiatan perekonomian berdampak besar. Provinsi Maluku Utara memiliki tingkat kemiskinan paling rendah di Pulau Papua. Provinsi Papua Barat memiliki tingkat kemiskinan yang tinggi.

Eksplorasi Pulau Sulawesi

ggplot(data=Sulawesi, aes(x=TAHUN, y=KMIS, group = PROVINSI, colour = PROVINSI))+ theme_bw()+ geom_line(size=1.2) + geom_point( size=3, shape=19, fill="red")+labs(colour="Provinsi", title = "Tingkat Kemiskinan di Sulawesi ",subtitle = "Tahun 2008-2020",)+ theme( plot.title = element_text(size = 14L, face = "bold", hjust = 0.5, color = "white"), plot.subtitle = element_text(size = 12L, face = "bold", hjust = 0.5, color="white"), legend.position = "right", axis.title.y = element_text(hjust = 0.5,face = "bold",colour = "white"), axis.title.x = element_text(hjust = 0.5,face = "bold",colour = "white"),plot.background=element_rect(fill="#141415",color="#141415"), panel.background=element_rect(fill="#141415",color="#141415"), legend.background = element_rect(fill="#141415",color="#141415"), legend.title = element_text(colour = "white",face = "bold"), legend.text = element_text(colour = "white"),axis.text.x = element_text(hjust = 0.5,face = "bold",colour = "white"),axis.text.y = element_text(hjust = 0.5,face = "bold",colour = "white"), panel.grid.major = element_blank(), panel.grid.minor = element_blank(),panel.border = element_rect(colour = "white") )+scale_color_manual(values = palette(brewer.pal(n = 24, name = "Spectral")))

Persebaran tingkat kemiskinan provinsi di Pulau Sulawesi secara garis besar mengalami penurunan dari tahun 2008, namun beberapa provinsi mengalami fluktuasi naik dan turun di tahun 2012-2016. Adanya pandemi Covid-19 berdampak besar pada perekonomian di tahun 2020, sehingga tingkat kemiskinan pada hampir semua provinsi di Pulau Sulawesi mengalami peningkatan. Provinsi Gorontalo merupakan provinsi dengan tingkat kemiskinan tertinggi di Pulau Sulawesi, sedangkan Provinsi Sulawesi Utara merupakan provinsi dengan tingkat kemiskinan terendah.

Pengujian Multikolinearitas

Uji multikolinearitas adalah proses untuk memeriksa apakah terdapat ketergantungan yang tinggi antara dua atau lebih peubah independen dalam model regresi. Ketergantungan ini dapat menyebabkan masalah dalam estimasi koefisien regresi dan penafsiran hasil model.

Salah satu cara untuk menguji multikolinearitas adalah dengan menggunakan statistik VIF (Variance Inflation Factor). VIF mengukur tingkat keragaman dari koefisien regresi yang dipengaruhi oleh korelasi antar peubah independen dalam model.Nilai VIF yang tinggi (biasanya di atas 5 atau 10) menunjukkan adanya multikolinearitas yang signifikan dalam model

Hipotesis yang digunakan adalah

$H_0$ : VIF < 10 (Tidak Multikolinearitas)

$H_1$ : VIF > 10 (Terdapat Multikolinearitas)

model1 <- lm(KMIS~INFRA+PEKO+INFL+PGGR,data%>%filter(TAHUN==2008)) model2 <- lm(KMIS~INFRA+PEKO+INFL+PGGR,data%>%filter(TAHUN==2009)) model3 <- lm(KMIS~INFRA+PEKO+INFL+PGGR,data%>%filter(TAHUN==2010)) model4 <- lm(KMIS~INFRA+PEKO+INFL+PGGR,data%>%filter(TAHUN==2011)) model5 <- lm(KMIS~INFRA+PEKO+INFL+PGGR,data%>%filter(TAHUN==2012)) model6 <- lm(KMIS~INFRA+PEKO+INFL+PGGR,data%>%filter(TAHUN==2013)) model7 <- lm(KMIS~INFRA+PEKO+INFL+PGGR,data%>%filter(TAHUN==2014)) model8 <- lm(KMIS~INFRA+PEKO+INFL+PGGR,data%>%filter(TAHUN==2015)) model9 <- lm(KMIS~INFRA+PEKO+INFL+PGGR,data%>%filter(TAHUN==2016)) model10 <- lm(KMIS~INFRA+PEKO+INFL+PGGR,data%>%filter(TAHUN==2017)) model11 <- lm(KMIS~INFRA+PEKO+INFL+PGGR,data%>%filter(TAHUN==2018)) model12 <- lm(KMIS~INFRA+PEKO+INFL+PGGR,data%>%filter(TAHUN==2019)) model13 <- lm(KMIS~INFRA+PEKO+INFL+PGGR,data%>%filter(TAHUN==2020)) model14 <- lm(KMIS~INFRA+PEKO+INFL+PGGR,data) Multikol <- rbind(as.vector(vif(model1)),as.vector(vif(model2)),as.vector(vif(model3)), as.vector(vif(model4)),as.vector(vif(model5)),as.vector(vif(model6)), as.vector(vif(model7)),as.vector(vif(model8)),as.vector(vif(model9)), as.vector(vif(model10)),as.vector(vif(model11)),as.vector(vif(model12)), as.vector(vif(model13)),as.vector(vif(model14)) ) rownames(Multikol) <- c("Tahun 2008","Tahun 2009","Tahun 2010", "Tahun 2011","Tahun 2012","Tahun 2013","Tahun 2014", "Tahun 2015","Tahun 2016","Tahun 2017","Tahun 2018", "Tahun 2019","Tahun 2020","Tahun 2008-2020") colnames(Multikol) <- c("INFRA","PEKO","INFL","PGGR") Multikol

## INFRA PEKO INFL PGGR ## Tahun 2008 1.018128 1.039962 1.008180 1.027142 ## Tahun 2009 1.005583 1.098824 1.051225 1.093657 ## Tahun 2010 1.026937 1.219132 1.216510 1.062607 ## Tahun 2011 1.135149 1.261387 1.332625 1.157114 ## Tahun 2012 1.073155 1.099455 1.059840 1.077085 ## Tahun 2013 1.089168 1.340071 1.177480 1.363017 ## Tahun 2014 1.003681 1.139900 1.013858 1.158505 ## Tahun 2015 1.027002 1.116258 1.033706 1.118729 ## Tahun 2016 1.018004 1.463559 1.165066 1.269270 ## Tahun 2017 1.001229 1.029898 1.061055 1.062875 ## Tahun 2018 1.005769 1.031605 1.029227 1.008431 ## Tahun 2019 1.023695 1.177636 1.117407 1.037509 ## Tahun 2020 1.059669 1.233411 1.161370 1.117794 ## Tahun 2008-2020 1.124957 1.057116 1.157683 1.048047

Berdasarkan hasil VIF model OLS di atas , semua model pada tahun 2008-2020 memiliki VIF < 10 terima H0 artinya untuk semua peubah pada model tidak ada multikolinearitas.

Pemilihan Model Terbaik

Model Common Effect Model

Model Common Effect (MCE) adalah salah satu jenis model regresi panel data yang digunakan untuk memperkirakan efek dari peubah bebas terhadap peubah terikat pada setiap waktu atau periode, serta mengontrol efek konstan atau tetap pada setiap unit individu dalam panel.Dalam MCE, diasumsikan bahwa setiap unit individu memiliki intercept (efek tetap) yang sama di setiap waktu, dan hanya koefisien regresi peubah bebas yang berbeda-beda untuk setiap individu. Dengan kata lain, efek tetap atau konstan pada setiap individu dianggap homogen atau sama.

cem <- plm(KMIS~INFRA+PEKO+INFL+PGGR, data=data, model = "pooling") summary(cem)

## Pooling Model ## ## Call: ## plm(formula = KMIS ~ INFRA + PEKO + INFL + PGGR, data = data, ## model = "pooling") ## ## Balanced Panel: n = 32, T = 13, N = 416 ## ## Residuals: ## Min. 1st Qu. Median 3rd Qu. Max. ## -9.1611 -5.1292 -1.5170 4.5191 19.6026 ## ## Coefficients: ## Estimate Std. Error t-value Pr(>|t|) ## (Intercept) 6.6707e+00 1.1961e+00 5.5772 4.438e-08 *** ## INFRA 1.0347e-06 2.9780e-07 3.4746 0.0005661 *** ## PEKO 5.0286e-01 8.2736e-02 6.0779 2.781e-09 *** ## INFL 3.1338e-01 1.0394e-01 3.0151 0.0027284 ** ## PGGR 4.8913e-02 1.3531e-01 0.3615 0.7179249 ## --- ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ## ## Total Sum of Squares: 17772 ## Residual Sum of Squares: 15525 ## R-Squared: 0.12645 ## Adj. R-Squared: 0.11794 ## F-statistic: 14.873 on 4 and 411 DF, p-value: 2.3234e-11

Uji Normalitas Model CEM

Hipotesis yang digunakan adalah

$H_0$ = Sisaan menyebar Normal

$H_1$ = Sisaan Tidak Menyebar Normal

res.cem <- residuals(cem) library(tseries)

## Registered S3 method overwritten by 'quantmod': ## method from ## as.zoo.data.frame zoo

(normal <- jarque.bera.test(res.cem))

## ## Jarque Bera Test ## ## data: res.cem ## X-squared = 41.58, df = 2, p-value = 9.355e-10

Uji Homoskesdastisitas Model CEM

Hipotesis yang digunakan adalah

$H_0$ = Sisaan memiliki ragam homogen

$H_1$ = Sisaan Tidak memiliki ragam yang homogen

(homos <- bptest(cem))

## ## studentized Breusch-Pagan test ## ## data: cem ## BP = 16.998, df = 4, p-value = 0.001935

Uji Autokorelasi Model CEM

Hipotesis yang digunakan adalah

$H_0$ : Sisaan saling bebas

$H_1$ : Sisaan Tidak saling bebas

(autokol <- pbgtest(cem)) #alternatif : Terdapat autokorelasi

## ## Breusch-Godfrey/Wooldridge test for serial correlation in panel models ## ## data: KMIS ~ INFRA + PEKO + INFL + PGGR ## chisq = 337.7, df = 13, p-value < 2.2e-16 ## alternative hypothesis: serial correlation in idiosyncratic errors

Model Fixed Effect Model Within Estimator

Model Fixed Effect (MFE) adalah salah satu jenis model regresi panel data yang digunakan untuk memperkirakan efek dari peubah bebas terhadap peubah terikat pada setiap waktu atau periode, serta mengontrol efek tetap atau konstan pada setiap unit individu dalam panel.Dalam MFE, diasumsikan bahwa efek tetap atau konstan pada setiap unit individu berbeda-beda di setiap waktu atau periode, dan hanya koefisien regresi peubah bebas yang sama untuk setiap individu. Dengan kata lain, efek tetap pada setiap individu dianggap heterogen atau berbeda-beda.

fem.twoway <- plm(KMIS~INFRA+PEKO+INFL+PGGR, data, model = "within", effect= "twoways", index = c("PROVINSI","TAHUN")) summary(fem.twoway)

## Twoways effects Within Model ## ## Call: ## plm(formula = KMIS ~ INFRA + PEKO + INFL + PGGR, data = data, ## effect = "twoways", model = "within", index = c("PROVINSI", ## "TAHUN")) ## ## Balanced Panel: n = 32, T = 13, N = 416 ## ## Residuals: ## Min. 1st Qu. Median 3rd Qu. Max. ## -3.718143 -0.713539 0.050615 0.682921 4.957867 ## ## Coefficients: ## Estimate Std. Error t-value Pr(>|t|) ## INFRA -6.2411e-07 1.5858e-07 -3.9356 9.922e-05 *** ## PEKO 1.5398e-01 2.4514e-02 6.2813 9.478e-10 *** ## INFL 1.1098e-01 4.7496e-02 2.3367 0.01999 * ## PGGR -6.3412e-02 7.8861e-02 -0.8041 0.42186 ## --- ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ## ## Total Sum of Squares: 695.57 ## Residual Sum of Squares: 592.21 ## R-Squared: 0.14859 ## Adj. R-Squared: 0.039851 ## F-statistic: 16.0562 on 4 and 368 DF, p-value: 3.9613e-12

res.fem.twoway <- residuals(fem.twoway)

Uji Normalitas Model FEM

Hipotesis yang digunakan adalah

$H_0$ = Sisaan menyebar Normal

$H_1$ = Sisaan Tidak Menyebar Normal

(normal <- jarque.bera.test(res.fem.twoway))

## ## Jarque Bera Test ## ## data: res.fem.twoway ## X-squared = 65.966, df = 2, p-value = 4.774e-15

Uji Homoskesdastisitas Model FEM

Hipotesis yang digunakan adalah

$H_0$ = Sisaan memiliki ragam homogen

$H_1$ = Sisaan Tidak memiliki ragam yang homogen

(homos <- bptest(fem.twoway))

## ## studentized Breusch-Pagan test ## ## data: fem.twoway ## BP = 16.998, df = 4, p-value = 0.001935

Uji Non Autokorelasi

Hipotesis yang digunakan adalah

$H_0$ : Sisaan saling bebas

$H_1$ : Sisaan Tidak saling bebas

(autokol <- pbgtest(fem.twoway))

## ## Breusch-Godfrey/Wooldridge test for serial correlation in panel models ## ## data: KMIS ~ INFRA + PEKO + INFL + PGGR ## chisq = 194.35, df = 13, p-value < 2.2e-16 ## alternative hypothesis: serial correlation in idiosyncratic errors

Uji Chow

Uji Chow digunakan untuk menguji apakah koefisien regresi sama di seluruh kelompok (individual) atau tidak.

$H_0$ : Model Common Effect Lebih Baik Digunakan

$H_1$ : Model Fixed Effect Lebih Baik Digunakan

pooltest(cem,fem.twoway)

## ## F statistic ## ## data: KMIS ~ INFRA + PEKO + INFL + PGGR ## F = 215.8, df1 = 43, df2 = 368, p-value < 2.2e-16 ## alternative hypothesis: unstability

Kesimpulan : Dengan tingkat keyakinan 95%, kita yakin bahwa model fixed effect merupakan model yang lebih baik untuk digunakan bila dibandingkan dengan model common effect.

Model Random Effect Model

Model Random Effect (MRE) adalah salah satu jenis model regresi panel data yang digunakan untuk memperkirakan efek dari peubah bebas terhadap peubah terikat pada setiap waktu atau periode, serta mengontrol efek tetap atau konstan pada setiap unit individu dalam panel.Dalam MRE, diasumsikan bahwa efek tetap atau konstan pada setiap unit individu dan efek regresi peubah bebas pada setiap individu merupakan peubah acak atau random. Dengan kata lain, efek tetap dan efek regresi dianggap sebagai gabungan antara faktor-faktor yang dapat diamati dan faktor-faktor yang tidak diamati.

rem.twoway <- plm(KMIS~INFRA+PEKO+INFL+PGGR, data, model = "random", effect= "twoways", index = c("PROVINSI","TAHUN")) summary(rem.twoway)

## Twoways effects Random Effect Model ## (Swamy-Arora's transformation) ## ## Call: ## plm(formula = KMIS ~ INFRA + PEKO + INFL + PGGR, data = data, ## effect = "twoways", model = "random", index = c("PROVINSI", ## "TAHUN")) ## ## Balanced Panel: n = 32, T = 13, N = 416 ## ## Effects: ## var std.dev share ## idiosyncratic 1.6093 1.2686 0.047 ## individual 32.6514 5.7141 0.947 ## time 0.2158 0.4646 0.006 ## theta: 0.9385 (id) 0.5653 (time) 0.5648 (total) ## ## Residuals: ## Min. 1st Qu. Median 3rd Qu. Max. ## -3.48112 -0.80340 -0.21541 0.46391 6.46679 ## ## Coefficients: ## Estimate Std. Error z-value Pr(>|z|) ## (Intercept) 1.0883e+01 1.2462e+00 8.7327 < 2.2e-16 *** ## INFRA -7.8316e-07 1.4391e-07 -5.4421 5.266e-08 *** ## PEKO 1.6972e-01 2.4964e-02 6.7988 1.055e-11 *** ## INFL 1.7252e-01 3.8357e-02 4.4977 6.871e-06 *** ## PGGR 1.6255e-01 7.7831e-02 2.0886 0.03675 * ## --- ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ## ## Total Sum of Squares: 1018 ## Residual Sum of Squares: 773.87 ## R-Squared: 0.23978 ## Adj. R-Squared: 0.23238 ## Chisq: 129.63 on 4 DF, p-value: < 2.22e-16

res.rem.twoway <- residuals(rem.twoway)

Uji Normalitas Model REM

Hipotesis yang digunakan adalah

$H_0$ = Sisaan menyebar Normal

$H_1$ = Sisaan Tidak Menyebar Normal

(normal <- jarque.bera.test(res.rem.twoway))

## ## Jarque Bera Test ## ## data: res.rem.twoway ## X-squared = 514.16, df = 2, p-value < 2.2e-16

Uji Homoskesdastisitas Model REM

Hipotesis yang digunakan adalah

$H_0$ = Sisaan memiliki ragam homogen

$H_1$ = Sisaan Tidak memiliki ragam yang homogen

(homos <- bptest(rem.twoway))

## ## studentized Breusch-Pagan test ## ## data: rem.twoway ## BP = 16.998, df = 4, p-value = 0.001935

Uji Non Autokorelasi Model REM

Hipotesis yang digunakan adalah

$H_0$ : Sisaan saling bebas

$H_1$ : Sisaan Tidak saling bebas

(autokol <- pbgtest(rem.twoway))

## ## Breusch-Godfrey/Wooldridge test for serial correlation in panel models ## ## data: KMIS ~ INFRA + PEKO + INFL + PGGR ## chisq = 198.12, df = 13, p-value < 2.2e-16 ## alternative hypothesis: serial correlation in idiosyncratic errors

Uji Haussman

$H_0$ : $Cov(U_i,x_{it}')=0$ (Random Effect)

$H_1$ : $Cov(U_i,x_{it}') \neq 0$ (Fixed Effect)

phtest(fem.twoway, rem.twoway)

## ## Hausman Test ## ## data: KMIS ~ INFRA + PEKO + INFL + PGGR ## chisq = 40.108, df = 4, p-value = 4.111e-08 ## alternative hypothesis: one model is inconsistent

Kesimpulan : Dengan tingkat keyakinan 95%, kita yakin bahwa model fixed effect merupakan model yang lebih baik untuk digunakan bila dibandingkan dengan model random effect.

Fixed Effect Model

Pengecekan Efek Individu dan Waktu

#efek individu dan waktu plmtest(fem.twoway,type = "bp", effect="twoways" )

## ## Lagrange Multiplier Test - two-ways effects (Breusch-Pagan) ## ## data: KMIS ~ INFRA + PEKO + INFL + PGGR ## chisq = 1746.8, df = 2, p-value < 2.2e-16 ## alternative hypothesis: significant effects

#efek individual plmtest(fem.twoway,type = "bp", effect="individual" )

## ## Lagrange Multiplier Test - (Breusch-Pagan) ## ## data: KMIS ~ INFRA + PEKO + INFL + PGGR ## chisq = 1726.2, df = 1, p-value < 2.2e-16 ## alternative hypothesis: significant effects

#efek waktu plmtest(fem.twoway,type = "bp", effect="time" )

## ## Lagrange Multiplier Test - time effects (Breusch-Pagan) ## ## data: KMIS ~ INFRA + PEKO + INFL + PGGR ## chisq = 20.619, df = 1, p-value = 5.605e-06 ## alternative hypothesis: significant effects

Berdasarkan hasil di atas model memiliki efek pengaruh waktu dan individu, maka model yang paling tepat digunakan adalah model FEM Two Ways

Uji Kebebasan Unit Cross Section

$H_0$ : Tidak terdapat dependensi antar unit individu

$H_1$ : Terdapat dependensi antar unit individu

pcdtest(fem.twoway, test = c("lm"), index=NULL,w =NULL )

## ## Breusch-Pagan LM test for cross-sectional dependence in panels ## ## data: KMIS ~ INFRA + PEKO + INFL + PGGR ## chisq = 2733.3, df = 496, p-value < 2.2e-16 ## alternative hypothesis: cross-sectional dependence

Berdasarkan uji di atas dapat disimpulkan terdapat depedensi antar unit individu.

Fixed Effect Model dengan LSDV

Alasan menggunakan FEM LSDV dibandingkan dengan Within Estimator adalah sebagai berikut:

Konsistensi Estimator: FEM LSDV memberikan hasil yang lebih konsisten daripada Within Estimator ketika terdapat korelasi antara peubah bebas dan peubah tak terobservasi (unobserved variables). FEM LSDV memperhitungkan peubah tak terobservasi melalui dummy variables untuk setiap unit observasi, sehingga dapat menghilangkan efek dari peubah tak terobservasi tersebut pada estimasi koefisien peubah bebas.

Efisiensi Estimator: FEM LSDV juga lebih efisien dalam kasus panel data dengan jumlah unit waktu (time period) yang sedikit dan jumlah unit cross section yang banyak. Dalam kasus ini, Within Estimator cenderung menghasilkan varian yang besar dan bias yang signifikan.

Uji Hipotesis: FEM LSDV juga memungkinkan penggunaan uji hipotesis untuk perbedaan antar unit cross section (individual effects). Dalam FEM LSDV, uji hipotesis untuk perbedaan antar unit cross section dapat dilakukan melalui uji F.

Model FE yang akan dibentuk pada kasus ini adalah model FE dengan jumlah dummy k-1 dengan k adalah jumlah kategori. Hal ini dilakukan untuk mencegah adanya dummy trap yaitu suatu kondisi di mana dua atau lebih peubah dummy yang digunakan dalam model regresi saling berkaitan satu sama lain. Maka dari itu model FE LSDV yang digunakan adalah model dengan interesep.

fem.lsdv <- lm(KMIS~INFRA+PEKO+INFL+PGGR+factor(TAHUN)+factor(PROVINSI) , data) summary(fem.lsdv)

## ## Call: ## lm(formula = KMIS ~ INFRA + PEKO + INFL + PGGR + factor(TAHUN) + ## factor(PROVINSI), data = data) ## ## Residuals: ## Min 1Q Median 3Q Max ## -3.7181 -0.7135 0.0506 0.6829 4.9579 ## ## Coefficients: ## Estimate Std. Error t value Pr(>|t|) ## (Intercept) 2.175e+01 1.057e+00 20.573 < 2e-16 *** ## INFRA -6.241e-07 1.586e-07 -3.936 9.92e-05 *** ## PEKO 1.540e-01 2.451e-02 6.281 9.48e-10 *** ## INFL 1.110e-01 4.750e-02 2.337 0.0200 * ## PGGR -6.341e-02 7.886e-02 -0.804 0.4219 ## factor(TAHUN)2009 -8.688e-02 4.987e-01 -0.174 0.8618 ## factor(TAHUN)2010 -1.668e+00 3.830e-01 -4.355 1.73e-05 *** ## factor(TAHUN)2011 -2.401e+00 4.832e-01 -4.969 1.03e-06 *** ## factor(TAHUN)2012 -3.485e+00 4.907e-01 -7.103 6.34e-12 *** ## factor(TAHUN)2013 -3.813e+00 3.931e-01 -9.698 < 2e-16 *** ## factor(TAHUN)2014 -4.152e+00 3.912e-01 -10.613 < 2e-16 *** ## factor(TAHUN)2015 -3.442e+00 5.053e-01 -6.811 3.96e-11 *** ## factor(TAHUN)2016 -2.700e+00 6.464e-01 -4.177 3.69e-05 *** ## factor(TAHUN)2017 -3.764e+00 5.740e-01 -6.558 1.85e-10 *** ## factor(TAHUN)2018 -4.057e+00 5.925e-01 -6.847 3.17e-11 *** ## factor(TAHUN)2019 -4.230e+00 6.294e-01 -6.720 6.92e-11 *** ## factor(TAHUN)2020 -3.020e+00 6.373e-01 -4.738 3.09e-06 *** ## factor(PROVINSI)BABEL -1.401e+01 6.129e-01 -22.865 < 2e-16 *** ## factor(PROVINSI)Bali -1.518e+01 6.968e-01 -21.779 < 2e-16 *** ## factor(PROVINSI)Banten -1.308e+01 5.799e-01 -22.557 < 2e-16 *** ## factor(PROVINSI)Bengkulu -2.505e+00 6.206e-01 -4.036 6.61e-05 *** ## factor(PROVINSI)DIY -5.147e+00 6.331e-01 -8.131 6.60e-15 *** ## factor(PROVINSI)Gorontalo -1.028e+00 6.082e-01 -1.690 0.0918 . ## factor(PROVINSI)JABAR -8.556e+00 5.275e-01 -16.219 < 2e-16 *** ## factor(PROVINSI)Jambi -1.147e+01 6.047e-01 -18.961 < 2e-16 *** ## factor(PROVINSI)JATENG -3.947e+00 5.575e-01 -7.080 7.33e-12 *** ## factor(PROVINSI)JATIM -4.978e+00 6.074e-01 -8.196 4.17e-15 *** ## factor(PROVINSI)KALBAR -1.066e+01 5.775e-01 -18.453 < 2e-16 *** ## factor(PROVINSI)KALSEL -1.439e+01 5.753e-01 -25.003 < 2e-16 *** ## factor(PROVINSI)KALTENG -1.340e+01 6.099e-01 -21.966 < 2e-16 *** ## factor(PROVINSI)KALTIM -1.223e+01 5.326e-01 -22.962 < 2e-16 *** ## factor(PROVINSI)Kepri -1.265e+01 5.472e-01 -23.120 < 2e-16 *** ## factor(PROVINSI)Lampung -3.725e+00 5.565e-01 -6.693 8.17e-11 *** ## factor(PROVINSI)Maluku 2.256e+00 5.234e-01 4.311 2.09e-05 *** ## factor(PROVINSI)MALUT -1.162e+01 5.696e-01 -20.406 < 2e-16 *** ## factor(PROVINSI)NTB -1.400e+00 5.730e-01 -2.444 0.0150 * ## factor(PROVINSI)NTT 2.950e+00 6.269e-01 4.706 3.58e-06 *** ## factor(PROVINSI)PAPUA 8.801e+00 6.744e-01 13.050 < 2e-16 *** ## factor(PROVINSI)PapuaBarat 7.547e+00 5.574e-01 13.539 < 2e-16 *** ## factor(PROVINSI)RIAU -1.073e+01 5.332e-01 -20.124 < 2e-16 *** ## factor(PROVINSI)SULBAR -7.260e+00 6.636e-01 -10.941 < 2e-16 *** ## factor(PROVINSI)SULSEL -8.474e+00 5.399e-01 -15.695 < 2e-16 *** ## factor(PROVINSI)SULTENG -4.472e+00 6.059e-01 -7.381 1.06e-12 *** ## factor(PROVINSI)SulTenggara -5.434e+00 5.969e-01 -9.104 < 2e-16 *** ## factor(PROVINSI)SULUT -1.065e+01 5.151e-01 -20.673 < 2e-16 *** ## factor(PROVINSI)SUMBAR -1.126e+01 5.226e-01 -21.539 < 2e-16 *** ## factor(PROVINSI)SUMSEL -4.923e+00 5.446e-01 -9.039 < 2e-16 *** ## factor(PROVINSI)SUMUT -8.077e+00 5.242e-01 -15.409 < 2e-16 *** ## --- ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ## ## Residual standard error: 1.269 on 368 degrees of freedom ## Multiple R-squared: 0.9667, Adjusted R-squared: 0.9624 ## F-statistic: 227.1 on 47 and 368 DF, p-value: < 2.2e-16

Interpretasi Hasil

Perbandingan Metrik Model

Tabel di atas menunjukkan bahwa model FEM LSDV memiliki nilai R-Squared dan Adj R-Squared paling tinggi dibandingkan model CEM, FEM within dan REM yaitu masing-masing 96.67% dan 96.66%. Nilai R-Squared sebesar 96.67% berarti model dapat menjelaskan 96.67% keragaman peubah kemiskinan dapat dijelaskan oleh model (faktor yang memengaruhi), sedangkan sisanya dijelaskan oleh faktor lain yang tidak terdapat dalam model.

R-Squared FEM LSDV cenderung lebih besar karena Efek tetap atau fixed effects yang diestimasi dalam model FEM LSDV memasukkan peubah dummy untuk setiap unit dan waktu, yang mana menghasilkan lebih banyak peubah dalam model. Semakin banyak peubah dalam model, semakin besar kemungkinannya untuk menemukan hubungan yang signifikan antara peubah independen dan peubah dependen, dan oleh karena itu, R-squared menjadi lebih besar.

Dalam model regresi panel, R-squared dapat dianggap sebagai ukuran seberapa baik model dapat menjelaskan keragaman dalam peubah dependen. Ketika efek tetap diperhitungkan, keragaman yang disebabkan oleh perbedaan antar unit dihilangkan dan karenanya model lebih baik dalam menjelaskan keragaman yang tersisa. Hal ini meningkatkan R-squared.

Perbandingan Peubah yang Signifikan

Berdasarkan tabel di atas menunjukan bahwa pada model CEM, FEM within dan FEM LSDV hanya tiga peubah yang signifikan dan peubah PGGR tidak signifikan pada taraf nyata berapapun. Sedangkan pada model REM, peubah PGGR signifikan pada taraf nyara 5%.

Dalam REM, efek tetap diasumsikan untuk diambil dari distribusi normal, yang memungkinkan untuk adanya keragaman acak dalam efek tetap dan menambah kemungkinan signifikansi peubah independen. Dalam FEM, efek tetap dianggap konstan untuk setiap unit dalam sampel dan oleh karena itu, tidak ada keragaman acak dalam efek tetap, sehingga peubah independen mungkin kurang signifikan.

REM memperhitungkan efek tetap dan efek acak secara bersamaan, sedangkan FEM hanya memperhitungkan efek tetap. Karena REM dapat memperhitungkan lebih banyak keragaman dalam data, hal ini dapat meningkatkan kemungkinan signifikansi peubah independen.

Ukuran sampel dapat mempengaruhi signifikansi peubah independen pada REM dan FEM. Karena REM menghasilkan lebih banyak variabilitas dalam model, ukuran sampel yang lebih kecil mungkin masih dapat menunjukkan signifikansi peubah independen. Di sisi lain, FEM dapat mengurangi keragaman dalam model, dan oleh karena itu memerlukan ukuran sampel yang lebih besar untuk menunjukkan signifikansi yang sama dengan REM.

Kesimpulan

Dari hasil yang telah disajikan, terdapat perbandingan antara empat model regresi panel yang berbeda dalam menjelaskan faktor-faktor yang mempengaruhi kemiskinan. Empat model tersebut adalah model CEM (Common Effects Model), FEM within (Fixed Effects Model within), FEM LSDV (Fixed Effects Model dengan Least Squares Dummy Variables), dan REM (Random Effects Model).

Dalam tabel tersebut, terlihat bahwa model FEM LSDV memiliki nilai R-Squared dan Adj R-Squared tertinggi dibandingkan dengan model-model lain. R-Squared dan Adj R-Squared mengindikasikan seberapa besar variasi dari variabel dependen yang dapat dijelaskan oleh model. Nilai R-Squared dan Adj R-Squared untuk model FEM LSDV masing-masing 96,67% dan 96,66%. Hal ini mengindikasikan bahwa model FEM LSDV dapat menjelaskan sebanyak 96,67% keragaman peubah kemiskinan yang dipengaruhi oleh faktor-faktor tertentu.

Salah satu alasan mengapa FEM LSDV memiliki nilai R-Squared yang lebih tinggi adalah karena model ini menggunakan efek tetap yang menghasilkan lebih banyak peubah dalam model. Efek tetap atau fixed effects menghilangkan keragaman yang disebabkan oleh perbedaan antara unit dalam sampel. Dalam FEM LSDV, efek tetap diestimasi dengan memasukkan peubah dummy untuk setiap unit dan waktu. Hal ini menghasilkan lebih banyak peubah dalam model, sehingga R-Squared menjadi lebih besar.

Selain itu, model REM juga memiliki nilai R-Squared yang tinggi, yaitu sebesar 96,30%. Dalam REM, efek tetap dan efek acak diperhitungkan bersamaan. Efek tetap diasumsikan untuk diambil dari distribusi normal, yang memungkinkan untuk adanya keragaman acak dalam efek tetap dan menambah kemungkinan signifikansi peubah independen. Dalam REM, peubah independen dapat lebih signifikan karena efek acak dapat menambah variasi dalam model.

Namun, perlu diingat bahwa ukuran sampel juga dapat mempengaruhi signifikansi peubah independen pada REM dan FEM. Ukuran sampel yang lebih kecil pada REM masih dapat menunjukkan signifikansi peubah independen karena REM dapat mempertimbangkan lebih banyak variasi dalam model. Di sisi lain, FEM dapat mengurangi variasi dalam model dan memerlukan ukuran sampel yang lebih besar untuk menunjukkan signifikansi yang sama dengan REM.

Dalam kesimpulan, tabel tersebut menunjukkan bahwa FEM LSDV dan REM memiliki nilai R-Squared tertinggi dalam menjelaskan faktor-faktor yang mempengaruhi kemiskinan. FEM LSDV menggunakan efek tetap untuk menambahkan peubah dalam model, sehingga R-Squared menjadi lebih besar. Pada model REM, efek tetap dan efek acak digunakan secara bersamaan untuk meningkatkan kemungkinan signifikansi peubah independen. Ukuran sampel juga dapat mempengaruhi signifikansi peubah independen pada kedua model tersebut.

Daftar Pustaka

Baltagi B. H. (2005). Econometrics Analysis of Panel Data. Ed ke-3. England: John Wiley & Sons Ltd.

Gujarati D. N., (2004). Basic Econometrics, Fourth edition, Singapore. McGraw-Hill Inc.

Mobonggi I. D., Achmad, N., Resmawan, Hasan, I., K. (2022). Analisis regresi data panel dengan pendekatan common effect model dan fixed effect model pada Kasus produksi tanaman jagung. INTERVAL: Jurnal Ilmiah Matematika. 2(2): 52-67.

Nandita D. A., Alamsyah L. B., Jati E. P., Widodo E. (2019). Regresi data panel untuk mengetahui faktor-faktor yang mempengaruhi PDRB di Provinsi DIY tahun 2011-2015. Indonesian Jounal of Applied Statistics. 2(1): 42-52.

Wahyuni I. I., Mahmudah. (2017). Random effect model pada regresi panel untuk pemodelan kasus gizi buruk balita di Jawa Timur tahun 2013–2016. Jurnal Biometrika dan Kependudukan. 6(1): 52-61.

Latar Belakang

Tinjauan Pustaka

Common Effect Model (CEM)

Fixed Effect Model (FEM)

a. Persamaan model secara umum

b. Persamaan slope tetap dan intercept bervariasi antar unit

c. Persamaan slope tetap dan intercept bervariasi antar unit dan periode waktu

Random Effect Model (REM)

Uji Chow

Uji Hausman

Deskripsi Data

Tahapan Analisis

Eksplorasi Data

Eksplorasi Spasial

Eksplorasi Daerah

Eksplorasi Pulau Jawa

Eksplorasi Pulau Sumatra

Eksplorasi Pulau Kalimantan

Eksplorasi Pulau Bali dan Sekitarnya

Eksplorasi Pulau Papua

Eksplorasi Pulau Sulawesi

Pengujian Multikolinearitas

Pemilihan Model Terbaik

Model Common Effect Model

Uji Normalitas Model CEM

Uji Homoskesdastisitas Model CEM

Uji Autokorelasi Model CEM

Model Fixed Effect Model Within Estimator

Uji Normalitas Model FEM

Uji Homoskesdastisitas Model FEM

Uji Non Autokorelasi

Uji Chow

Model Random Effect Model

Uji Normalitas Model REM

Uji Homoskesdastisitas Model REM

Uji Non Autokorelasi Model REM

Uji Haussman

Fixed Effect Model

Pengecekan Efek Individu dan Waktu

Uji Kebebasan Unit Cross Section

Fixed Effect Model dengan LSDV

Interpretasi Hasil

Perbandingan Metrik Model

Perbandingan Peubah yang Signifikan

Kesimpulan

Daftar Pustaka