Laporan Praktikum 1 - Penerapan Analisis Regresi Linier Berganda untuk Mengetahui Faktor-Faktor yang Berpengaruh terhadap PDRB di Jawa Timur pada Tahun 2019

Kamila Muazzaroh Savitri

18 Mei 2022

1 PENDAHULUAN

1.1 Latar Belakang

Jawa Timur merupakan salah satu provinsi yang terletak di Pulai Jawa yang secara administratif terbagi menjadi 29 kabupaten dan 9 kota, dengan kota Surabaya sebagai ibukota provinsi. Dimana hal ini menjadikan Jawa Timur sebagai provinsi yang memiliki jumlah kota/kabupaten terbanyak di Indonesia. Jawa Timur memiliki letak yanbg strategis di bidang Industri karena diapit oleh dua provinsi besar yaitu Jawa Tengah dan Bali. Hal tersebut menyebabkan Jawa Timur menjadi pusat pertumbuhan industri ataupun perdagangan. Pertumbuhan ekonomi di Jawa Timut menunjukkan pergerakan yang positif. Badan Pusat Statistik (BPS) mencatat, bahwa perekonomian Jawa Timur Triwulan II-2021 yang diukuur berdasarkan Produk Domestik Regional Bruto (PDRB) atas dasar harga berlaku mencapai RP 604, 84 trilun, sedangkan PDRB atas dasar harga konstan mencapai Rp 413,64 triliun. Ekonomi Jawa Timur Trwiulan II-2021 dibandingkan Triwulan II-2020 meningkat sebesar 7,05% (Badan Pusat Statistik JATIM, 2003) . Karena melihat dari pertumbuhan ekonomi di Jawa Timur yang cukup kuat, sehingga peneliti tertarik untuk meneliti faktor apa saja yang mempengaruhi PDRB (Produk Domestik Regional Bruto) di Provinsi Jawa Timur pada tahun 2019. Oleh karena itu, jenis analisis yang tepat untuk digunakan adalah analisis regresi liner berganda karena dengan analisis ini dapat diketahui faktor apa yang dapat berpengaruh pada Produk Domestik Regional Bruto. Dengan dilakukannya penelitian ini, diharapkan nantinya penelitian ini akan bermanfaat, khususnya untuk pemerintah untuk memperhatikan faktor yang paling berpengaruh untuk penurunan dan kenaikan PDRB di Jawa Timur. Dengan diketahui faktor yang paling berpengaruh maka nantinya permasalahan atau faktor yang menjadi permasalahan dapat dilakukan penanganan dengan tepat, sehingga tidak menurunkan nilai PDRB khusunya di Provinsi Jawa Timur.

2 Tinjauan Pustaka

2.1 Statistika Deskriptif

Sdeskriptif merupakan bagian dari statistika yang membahas tentang proses pengumpulan dan menggambarkan kumpulan data atau hasil pengamatan sehingga dapat menjadi sebuah informasi yang mudah untuk dipahami oleh pembaca. Menurut Walpole, E.R statistika deskriptif merupakan metode yang berkaitan dengan pengumpulan dan penyajian suatu gugusan data sehingga memberikan informasi yang berguna tanpa menarik inferensia atau kesimpulan. Penyusunan tabel,diagram, grafik, dan besaran-besaran lain di majalah dan koran-koran, termasuk dalam kategori statistika deskriptif (Ronald E. Walpole, 1993).

Mean adalah nilai tengah pada suatu kelompok data yang diperoleh dari penjumlahan keseluruhan data pada suatu kelompok dibagi dengan banyaknya data. Terdapat dua nilai tengah yang biasanya kita ketahui yaitu nilai tengah untuk populasi dan nilai tengah untuk sampel. Nilai tengah biasanya juga disebut mean atau rata-rata.

\[ \mu = \frac{\sum\limits_{i=1}^N{x_i}}{ N} \]

2.2 Analisis Regresi Linier Berganda

2.2.1 Analisis Regresi Linier Berganda

Penelitian ini menggunakan meotode statistika untuk keperluan estimasi. Dalam metode ini statistika alat analisis yang biasa dipakai dalam khasanah penelitian adalah analisis regresi. Analisis regresi pada dasarnya adalah studi atas ketergantungan suatu variabel yaitu variabel yang tergantung pada variabel yang lain yang di sebut dengan variabel bebas dengan tujuan untuk mengestimasi dengan meramalkan nilai populasi berdasarkan nilai tertentu dari variabel yang diketaui. \[ Y= β_0+β_1 X_1+β_2 X_2+β_3 X_(3 )+ε \]

2.2.2 Uji Normalitas

Uji Normalitas diperlukan untuk menguji apakah dalam model regresi linier berganda, variabel pengganggu atau residual memiliki distribusi normal. Seperti diketahui bahwa uji T dan F mengasumsikan bahwa nilai residual mengikuti distribusi normal. Jika asumsi normalitas dilangar maka uji statistic yang dilakukan kemudian menjadi tidak valid untuk jumlah sampel kecil. Ada dua cara untuk mendeteksi apakah residual berdistribusi normal atau tidak yaitu dengan uji statistik (Ghozali, 2013). Analisis statistik yang dapat digunakan untuk menguji normalitas adalah uji Kolmogorov Smirnov. Rumus statistik uji Kolmogorov Smirnov adalah sebagai berikut (Yuliasty, 2015):

\[ D_hitung=Sup |F_n (x)-F_0 (x)| \]

2.2.3 Uji Multikolinieritas

Untuk mengetahui terjadinya multikolinieritas diantara variabel independen dalam suatu model regrsi adalah dengan menguji nilai VIF (Variance Inflation Factor) atau Tol (Tolerance). Dengan kedua ukuran ini nantinya didapatkan setiap variabel penjelas manakah yang dijelaskan oleh variabel penjelas yang lain Tolerance akan mengukur ragam dari variabel penjelas yang dipilih yang tidak dijelaskan oleh variabel penjelas lainnya. Sehingga hubungan dari dua ukuran tersebut adalah jika nilai tolerance rendah maka nilai VIF justru akan semakin tinggi. Kelemahan dari dua ukuran ini adalah tidak akan diketahui variabel mana yang saling berhubungan atau berkorelasi (Ghozali, 2018). Rumus menentukan nilai VIF dan Tol adalah sebagai (Supardi, 2013):

\[ VIF=\frac{I}{1-r_i^2} ;i=1,2,3,..,k \]

\[ Tol=\frac{I}{VIF}= 1-r_i^2 \]

2.2.4 Uji Autokorelasi

Untuk mendeteksi apakah pada model regresi tersebut terdapat autokorelasi maka dapat digunakan uji Durbin Watson (DW) (Rayyan, 2018):

\[ DW = \frac{\sum\limits_{t=2}^{N}(ε_t-ε_t-1)^2 }{{\sum\limits_{t=2}^{N}}ε_t^2} \]

2.2.5 Uji Heterokedastisitas

Uji Heterokedastisitas dipergunakan untuk menguji apakah terdapat ragam dari residual yang berbeda yang dapat membiaskan hasil yang telah dihitung (Lestari & Setyawan, 2017). Model regresi yang memenuhi persyaratan adalah dimana terdpat kesamaan ragam dari residual yang berbeda atau yang disebutkan dengan homokedastisitas. Untuk mengetahui terjadi heterokedastisitas diantara variabel independen dalam suatu model regresi dilakukan dengan uji Glesjer. Uji Glesjer secara umum dinotasikan sebagai berikut:

\[ |e|= a_1+b_2 X_2 \]

2.2.6 Uji F

Uji F juga disebut sebagai uji signifikansi keseluruhan karena uji ini nantinya akan menunjukkan apakah variabel Y atau variabel respon (dependen) berhubungan linear dengan keseluruhan variabel X atau variabel penjelas (independen) (Ghozali, 2018).

\[ F= \frac{R^2 (n-k-1)}{k(1-R^2)} \]

2.2.7 Uji T

Uji t atau dapat disebut juga sebagai uji signifikansi secara parsial, yang dilakukan untuk menunjukkan seberapa jauh masing masing variabel independen/ penjelas secara individual dalam menerangkan variasi dari variabel dependen atau variabel respon (Gujarati, 2003)

\[ t= \frac{β_j-β_j}{se(β_j)} \]

2.2.8 Koefisien Determinasi

Koefisien Determinasi digunakan untuk mengukur kemampuan model regresi dalam menerangkan variasi dari variabel respon (dependen). Rentang nilai dari koefisien determinasi adalah dari 0 hingga 1. Dimana semakin mendekat nilai R2 ke angka 0 berarti kemampuan variabel penjelas (independen) semakin terbatas. Begitu pula sebaliknya jika nilai R2 mendekati 1 maka variabel independen dapat menjelaskan informasi yang dibutuhkan untuk memprediksi variabel respon (Ghozali, 2018).

\[ R=\sqrt\frac{{{b_1}\sum{x_1y}+ \dots +{b_k}\sum{x_ky}}}{\sum{y}^2} \]

3 Data

Jenis data yang digunakan dalam penelitian ini adalah data sekunder yang diperoleh dari BPS (Badan Pusat Statistik) Provinsi Jawa Timur. Data yang digunakan adalah Data Produk Domestik Bruto atas Dasar Harga Konstan di Jawa Timur pada Tahun 2019, data Jumlah Penduduk Provinsi Jawa Timur 2019, data Jumlah Penduduk Miskin menurut Kabupaten dan Kota di Provinsi Jawa Timur Tahun 2019, data Tingkat Pengangguran Terbuka dan Tingkat Partisipasi Angkatan Kerja menurut Kabupaten dan Kota Tahun 2019.

Dalam penelitian ini, variabel yang digunakan adalah beberapa faktor yang diduga akan memeberikan pengaruh signifikan terhadap Produk Domestik Regional Bruto (PDRB). Adapun variabel yang digunakan dalam penelitian ini adalah sebagai barikut: 1. Jumlah Penduduk (X1) 2. Jumlah penduduk miskin (X2) 3. Tingkat Partisipasi Angkatan Kerja (TPAK) (X3) 4. Produk Domestik Regional Bruto (PDRB) (Y)

4 SOURCE CODE

4.1 Library yang Dibutuhkan

> # Library
> library(car)
> library(stats)
> library(ggpubr)
> library(lmtest)

4.2 Membangkitkan Data

> library(readxl)
> DATA <- read_excel("D:/KULIAH/SEMESTER 6/Komputasi Statistika/prak komstat/1.xlsx")
> View(DATA)
> data1 <- as.data.frame(DATA)
> data1
   Kabupaten/Kota    Y       X1     X2    X3
1         Pacitan 5.08  555.304  75.86 79.62
2        Ponorogo 5.01  871.370  83.97 71.15
3      Trenggalek 5.08  696.295  76.44 73.45
4     Tulungagung 5.32 1039.284  70.01 70.48
5          Blitar 5.12 1160.677 103.75 72.93
6          Kediri 5.07 1574.272 163.95 71.76
7          Malang 5.50 2606.204 246.60 70.07
8        Lumajang 4.77 1042.395  98.88 66.14
9          Jember 5.31 2450.668 226.57 67.16
10     Banyuwangi 5.55 1613.991 121.37 72.13
11      Bondowoso 5.29  775.715 103.33 76.01
12      Situbondo 5.45  682.978  76.44 72.40
13    Probolinggo 4.56 1168.503 207.22 68.88
14       Pasuruan 5.83 1627.396 141.09 68.82
15       Sidoarjo 5.99 2249.476 119.29 66.98
16      Mojokerto 5.81 1117.688 108.81 69.46
17        Jombang 5.06 1263.814 116.44 71.04
18        Nganjuk 5.36 1054.611 118.51 66.78
19         Madiun 5.42  682.684  71.91 70.47
20        Magetan 5.04  628.977  60.43 72.34
21          Ngawi 5.05  830.108 119.43 72.48
22     Bojonegoro 6.34 1249.692 154.64 71.29
23          Tuban 5.14 1172.790 170.80 68.76
24       Lamongan 5.44 1189.106 157.11 68.96
25         Gresik 5.41 1312.881 148.61 65.83
26      Bangkalan 1.03  986.672 186.11 63.44
27        Sampang 1.42  978.875 202.21 66.74
28      Pamekasan 4.92  879.992 122.43 68.50
29        Sumenep 0.14 1088.910 211.98 75.33
30         Kediri 5.47  287.409  20.54 64.81
31         Blitar 5.84  141.876  10.10 72.15
32         Malang 5.73  870.682  35.39 66.10
33    Probolinggo 5.94  237.208  16.37 64.12
34       Pasuruan 5.56  200.422  12.92 68.12
35      Mojokerto 5.75  129.014   6.63 65.09
36         Madiun 5.69  177.007   7.69 66.86
37       Surabaya 6.10 2896.195 130.55 68.76
38           Batu 6.52  207.490   7.89 71.22

4.3 Plot

> n <- 38
> X1  <- matrix(data1$X1, ncol = 2)
> X2  <- matrix(data1$X2, ncol = 2)
> X3  <- matrix(data1$X3, ncol = 2)
> Y   <- matrix(data1$Y,  ncol = 2)
> x   <- rbind(X1,X2,X3,Y)

> smoothScatter(x, xlab = "X1,X2,X3", ylab = "Y", main = "Gambar 1. Smooth Scatter Plot")

Data yang digunakan berasal dari website Badan Pusat Statistik.

5 HASIL DAN PEMBAHASAN

5.1 Statistika Deskriptif

> summary(data1)
 Kabupaten/Kota           Y               X1               X2        
 Length:38          Min.   :0.140   Min.   : 129.0   Min.   :  6.63  
 Class :character   1st Qu.:5.062   1st Qu.: 682.8   1st Qu.: 70.48  
 Mode  :character   Median :5.385   Median :1013.0   Median :112.62  
                    Mean   :5.082   Mean   :1044.7   Mean   :108.22  
                    3rd Qu.:5.720   3rd Qu.:1234.5   3rd Qu.:153.13  
                    Max.   :6.520   Max.   :2896.2   Max.   :246.60  
       X3       
 Min.   :63.44  
 1st Qu.:66.89  
 Median :69.21  
 Mean   :69.65  
 3rd Qu.:72.04  
 Max.   :79.62

Berdasarkan Data yang digunakan, diperoleh nilai mean sebesar:

\[ \mu_{x_1}=1044.7 \] \[ \mu_{x_2}=108.22 \] \[ \mu_{x_3}=69.65 \] \[ \mu_{y}=5.082 \]

5.2 Analisis Regresi Linier Berganda

> Regresi=lm(Y~X1+X2+X3, data=data1)
> Regresi

Call:
lm(formula = Y ~ X1 + X2 + X3, data = data1)

Coefficients:
(Intercept)           X1           X2           X3  
   4.182290     0.001547    -0.020898     0.022180

Berdasarkan hasil analisis regresi linier berganda dengan data tersebut didapatkan hasil persamaan regresi (model) sebagai berikut

\[ Y = 4.182290 + 0.001547X_1 - 0.020898X_2 + 0.022180X_3 \] Dari model diatas dapat disimpulkan bahwa nilai konstanta sebesar 0.001547 yang berarti bahwa jika jumlah penduduk bertambah maka nilai PDRB akan bertambah sebesar 0.001547. Nilai konstanta sebesar -0.020898 yang berarti bahwa jika jumlah penduduk miskin bertambah maka nilai PDRB akan berkurang sebesar 0.020898. Nilai konstanta sebesar 0.022180 yang berarti bahwa jika prosentase TPAK bertambah maka nilai PDRB akan bertambah sebesar 0.022180.

> summary(Regresi)

Call:
lm(formula = Y ~ X1 + X2 + X3, data = data1)

Residuals:
     Min       1Q   Median       3Q      Max 
-2.96783 -0.33464  0.05598  0.54937  1.87473 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept)  4.182290   3.223517   1.297    0.203    
X1           0.001547   0.000348   4.445 8.89e-05 ***
X2          -0.020898   0.003498  -5.975 9.29e-07 ***
X3           0.022180   0.046085   0.481    0.633    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 0.9677 on 34 degrees of freedom
Multiple R-squared:  0.5123,    Adjusted R-squared:  0.4693 
F-statistic: 11.91 on 3 and 34 DF,  p-value: 1.741e-05

Fungsi summary digunakan untuk melihat hasil analisis regresi secara lengkap. Berdasarkan output diatas didapatkan bahwa:

5.2.1 Uji F

Uji Simultan digunakan untuk melihat seberapa pengaruh faktor faktor yang mempengaruhi tingkat PDRB secara simultan/ bersamaan. Dengan hasil pengujian diatas, sig = 1.741e-05 < alpha = 0,05 maka dapat disimpulkan bahwa tolak H0. Yang berarti bahwa terdapat pengaruh yang signifikan antara jumlah penduduk, jumlah penduduk miskin dan TPAK terhadap PDRB di Jawa Timur pada tahun 2019.

5.2.2 Uji T

Dengan hasil pengujian diatas, untuk variabel jumlah penduduk didapatkan nilai sig = 8.89e-05 < alpha = 0,05 maka dapat disimpulkan bahwa tolak H0, yang berarti bahwa terdapat pengaruh signifikan antara jumlah penduduk terhadap PDRB di Jawa Timur pada tahun 2019. Untuk variabel jumlah penduduk miskin didapatkan nilai sig = 9.29e-07 < alpha = 0,05 maka dapat disimpulkan bahwa tolak H0 yang berarti bahwa terdapat pengaruh yang signifikan antara jumlah penduduk miskin terhadap PDRB di Jawa Timur pada tahun 2019. Dan untuk variabel TPAK didapatkan nilai sig = 0.633 > alpha = 0,05 maka dapat disimpulkan bahwa terima H0 yang berarti bahwa tidak terdapat pengaruh TPAK terhadap PDRB di Jawa Timur pada tahun 2019.

5.2.3 Koefisien Determinasi

Nilai koefisien determinasi yang dihasilkan adalah sebesar 0.5123 atau 51,2%. Nilai tersebut menunjukkan bahwa keempat variabel independen yaitu jumlah penduduk, jumlah penduduk miskin dan TPAK menjelaskan PDRB. Sedangkan sisanya yaitu 49,8% menjelaskan variaben independen lain yang tidak dimasukkan dalam penelitian ini.

5.3 Uji Asumsi Klasik

5.3.1 Uji Normalitas

> Galat<- residuals(Regresi)
> 
> library(ggpubr)
> ggqqplot(Galat)

> 
> library(stats)
> Saphirotest=shapiro.test(Galat)
> Saphirotest

    Shapiro-Wilk normality test

data:  Galat
W = 0.93008, p-value = 0.02018

Pengujian ini bertujuan untuk menguji apakah dalam model regresi, variabel pengganggu atau residual memiliki distribusi normal. Dari uji saphiro wilk didapatkan bahwa p value = 0.02018, yang berarti data mendekati normal.

5.3.2 Uji Multikolonieritas

> library(car)
> Multikolinieritas=vif(Regresi)
> Multikolinieritas
      X1       X2       X3 
2.137946 2.138257 1.010484

Dari hasil pengujian diatas dapat dilihat bahwa keseluruhan nilai VIF kurang dari 10 yaitu, 2.137946 untuk variabel jumlah penduduk, 2.138257 untuk variabel jumlah penduduk miskin dan 1.010484 untuk variabel TPAK sehingga dapat dikatakan bahwa tidak terdapat masalah multikolinieritas.

5.3.3 Uji Heterokedastisitas

> library(lmtest)
> Heteroskedastisitas=bptest(Regresi, studentize=T, data=data)
> Heteroskedastisitas

    studentized Breusch-Pagan test

data:  Regresi
BP = 14.107, df = 3, p-value = 0.002763

Dari pengujian ini dapat disimpulkan bahwa keseluruhan variabel memiliki nilai sig 0.002763 kurang dari 0,05 sehingga dapat disimpulkan bahwa terdapat heterokedastisitas.

5.3.4 Uji Autokorelasi

> library(lmtest)
> Autokorelasi=dwtest(Regresi)
> Autokorelasi

    Durbin-Watson test

data:  Regresi
DW = 1.7183, p-value = 0.1367
alternative hypothesis: true autocorrelation is greater than 0
> AIC(Regresi)
[1] 111.1212

Sehingga dapat disimpulkan bahwa nilai d hitung sebesar 1.7183 dan nilai dL yang tercantum dalam tabel Durbin Watson adalah 1,32 dan dU adalah 1,65. Karena nilai DW lebih besar dari du maka dapat dipastikan data tidak memliki autokorelasi.

6 DAFTAR PUSTAKA

Badan Pusat Statistik. (n.d.). Tenaga Kerja. Retrieved September 19, 2021, from https://www.bps.go.id/subject/6/tenaga-kerja.html#subjekViewTab1

Badan Pusat Statistik Provinsi Jawa Timur. (n.d.). Kemiskinan dan Ketimpangan. Retrieved September 19, 2021, from https://jatim.bps.go.id/subject/23/kemiskinan-dan-ketimpangan.html

BPS Provinsi Jawa Timur. (2021). PRODUK DOMESTIK REGIONAL BRUTO KABUPATEN/KOTA DI PROVINSI JAWA TIMUR MENURUT LAPANGAN USAHA 2016-2020.

Ghozali, I. (2013). Aplikasi Analisis Dengan Program SPSS (edisi ketu). Badan Penerbit Universitas Diponegoro.

Ghozali, I. (2018). Aplikasi Analisis Multivariate dengan Program SPSS 25 (edisi 9). Badan Penerbit Universitas Diponegoro.

Gujarati, D. N. (2003). Basic Econometrics (Fourth edi). McGraw-HiII/lrwin.

Lestari, A., & Setyawan, Y. (2017). Analisis regresi data panel untuk mengetahui faktor yang mempengaruhi belanja daerah di provinsi jawa tengah. 2(1), 1–11.

Rayyan, I. (2018). ANALISIS REGRESI DATA PANEL PADA FAKTOR-FAKTOR YANG MEMPENGARUHI TINGKAT KEMISKINAN PROVINSI SULAWESI SELATAN TAHUN 2011-2015.

Ronald E. Walpole. (1993). Pengantar Statistika Edisi ke-3. PT GRAMEDIA PURTAKA UTAMA.

Supardi, U. (2013). Aplikasi Statistika Dalam Penelitian Edisi Revisi : Konsep Statistika Yang Lebih Komprehensif. Change Pulication Design.

Yuliasty, H. F. (2015). ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI KASUS PENYAKIT INFEKSI SALURAN PERNAPASAN AKUT DI KABUPATEN MOJOKERTO TAHUN 2013.