Jawa Timur merupakan salah satu provinsi yang terletak di Pulai Jawa yang secara administratif terbagi menjadi 29 kabupaten dan 9 kota, dengan kota Surabaya sebagai ibukota provinsi. Dimana hal ini menjadikan Jawa Timur sebagai provinsi yang memiliki jumlah kota/kabupaten terbanyak di Indonesia. Jawa Timur memiliki letak yanbg strategis di bidang Industri karena diapit oleh dua provinsi besar yaitu Jawa Tengah dan Bali. Hal tersebut menyebabkan Jawa Timur menjadi pusat pertumbuhan industri ataupun perdagangan. Pertumbuhan ekonomi di Jawa Timut menunjukkan pergerakan yang positif. Badan Pusat Statistik (BPS) mencatat, bahwa perekonomian Jawa Timur Triwulan II-2021 yang diukuur berdasarkan Produk Domestik Regional Bruto (PDRB) atas dasar harga berlaku mencapai RP 604, 84 trilun, sedangkan PDRB atas dasar harga konstan mencapai Rp 413,64 triliun. Ekonomi Jawa Timur Trwiulan II-2021 dibandingkan Triwulan II-2020 meningkat sebesar 7,05% (Badan Pusat Statistik JATIM, 2003) . Karena melihat dari pertumbuhan ekonomi di Jawa Timur yang cukup kuat, sehingga peneliti tertarik untuk meneliti faktor apa saja yang mempengaruhi PDRB (Produk Domestik Regional Bruto) di Provinsi Jawa Timur pada tahun 2019. Oleh karena itu, jenis analisis yang tepat untuk digunakan adalah analisis regresi liner berganda karena dengan analisis ini dapat diketahui faktor apa yang dapat berpengaruh pada Produk Domestik Regional Bruto. Dengan dilakukannya penelitian ini, diharapkan nantinya penelitian ini akan bermanfaat, khususnya untuk pemerintah untuk memperhatikan faktor yang paling berpengaruh untuk penurunan dan kenaikan PDRB di Jawa Timur. Dengan diketahui faktor yang paling berpengaruh maka nantinya permasalahan atau faktor yang menjadi permasalahan dapat dilakukan penanganan dengan tepat, sehingga tidak menurunkan nilai PDRB khusunya di Provinsi Jawa Timur.
Sdeskriptif merupakan bagian dari statistika yang membahas tentang proses pengumpulan dan menggambarkan kumpulan data atau hasil pengamatan sehingga dapat menjadi sebuah informasi yang mudah untuk dipahami oleh pembaca. Menurut Walpole, E.R statistika deskriptif merupakan metode yang berkaitan dengan pengumpulan dan penyajian suatu gugusan data sehingga memberikan informasi yang berguna tanpa menarik inferensia atau kesimpulan. Penyusunan tabel,diagram, grafik, dan besaran-besaran lain di majalah dan koran-koran, termasuk dalam kategori statistika deskriptif (Ronald E. Walpole, 1993).
Mean adalah nilai tengah pada suatu kelompok data yang diperoleh dari penjumlahan keseluruhan data pada suatu kelompok dibagi dengan banyaknya data. Terdapat dua nilai tengah yang biasanya kita ketahui yaitu nilai tengah untuk populasi dan nilai tengah untuk sampel. Nilai tengah biasanya juga disebut mean atau rata-rata.
\[ \mu = \frac{\sum\limits_{i=1}^N{x_i}}{ N} \]
Penelitian ini menggunakan meotode statistika untuk keperluan estimasi. Dalam metode ini statistika alat analisis yang biasa dipakai dalam khasanah penelitian adalah analisis regresi. Analisis regresi pada dasarnya adalah studi atas ketergantungan suatu variabel yaitu variabel yang tergantung pada variabel yang lain yang di sebut dengan variabel bebas dengan tujuan untuk mengestimasi dengan meramalkan nilai populasi berdasarkan nilai tertentu dari variabel yang diketaui. \[ Y= β_0+β_1 X_1+β_2 X_2+β_3 X_(3 )+ε \]
Uji Normalitas diperlukan untuk menguji apakah dalam model regresi linier berganda, variabel pengganggu atau residual memiliki distribusi normal. Seperti diketahui bahwa uji T dan F mengasumsikan bahwa nilai residual mengikuti distribusi normal. Jika asumsi normalitas dilangar maka uji statistic yang dilakukan kemudian menjadi tidak valid untuk jumlah sampel kecil. Ada dua cara untuk mendeteksi apakah residual berdistribusi normal atau tidak yaitu dengan uji statistik (Ghozali, 2013). Analisis statistik yang dapat digunakan untuk menguji normalitas adalah uji Kolmogorov Smirnov. Rumus statistik uji Kolmogorov Smirnov adalah sebagai berikut (Yuliasty, 2015):
\[ D_hitung=Sup |F_n (x)-F_0 (x)| \]
Untuk mengetahui terjadinya multikolinieritas diantara variabel independen dalam suatu model regrsi adalah dengan menguji nilai VIF (Variance Inflation Factor) atau Tol (Tolerance). Dengan kedua ukuran ini nantinya didapatkan setiap variabel penjelas manakah yang dijelaskan oleh variabel penjelas yang lain Tolerance akan mengukur ragam dari variabel penjelas yang dipilih yang tidak dijelaskan oleh variabel penjelas lainnya. Sehingga hubungan dari dua ukuran tersebut adalah jika nilai tolerance rendah maka nilai VIF justru akan semakin tinggi. Kelemahan dari dua ukuran ini adalah tidak akan diketahui variabel mana yang saling berhubungan atau berkorelasi (Ghozali, 2018). Rumus menentukan nilai VIF dan Tol adalah sebagai (Supardi, 2013):
\[ VIF=\frac{I}{1-r_i^2} ;i=1,2,3,..,k \]
\[ Tol=\frac{I}{VIF}= 1-r_i^2 \]
Untuk mendeteksi apakah pada model regresi tersebut terdapat autokorelasi maka dapat digunakan uji Durbin Watson (DW) (Rayyan, 2018):
\[ DW = \frac{\sum\limits_{t=2}^{N}(ε_t-ε_t-1)^2 }{{\sum\limits_{t=2}^{N}}ε_t^2} \]
Uji Heterokedastisitas dipergunakan untuk menguji apakah terdapat ragam dari residual yang berbeda yang dapat membiaskan hasil yang telah dihitung (Lestari & Setyawan, 2017). Model regresi yang memenuhi persyaratan adalah dimana terdpat kesamaan ragam dari residual yang berbeda atau yang disebutkan dengan homokedastisitas. Untuk mengetahui terjadi heterokedastisitas diantara variabel independen dalam suatu model regresi dilakukan dengan uji Glesjer. Uji Glesjer secara umum dinotasikan sebagai berikut:
\[ |e|= a_1+b_2 X_2 \]
Uji F juga disebut sebagai uji signifikansi keseluruhan karena uji ini nantinya akan menunjukkan apakah variabel Y atau variabel respon (dependen) berhubungan linear dengan keseluruhan variabel X atau variabel penjelas (independen) (Ghozali, 2018).
\[ F= \frac{R^2 (n-k-1)}{k(1-R^2)} \]
Uji t atau dapat disebut juga sebagai uji signifikansi secara parsial, yang dilakukan untuk menunjukkan seberapa jauh masing masing variabel independen/ penjelas secara individual dalam menerangkan variasi dari variabel dependen atau variabel respon (Gujarati, 2003)
\[ t= \frac{β_j-β_j}{se(β_j)} \]
Koefisien Determinasi digunakan untuk mengukur kemampuan model regresi dalam menerangkan variasi dari variabel respon (dependen). Rentang nilai dari koefisien determinasi adalah dari 0 hingga 1. Dimana semakin mendekat nilai R2 ke angka 0 berarti kemampuan variabel penjelas (independen) semakin terbatas. Begitu pula sebaliknya jika nilai R2 mendekati 1 maka variabel independen dapat menjelaskan informasi yang dibutuhkan untuk memprediksi variabel respon (Ghozali, 2018).
\[ R=\sqrt\frac{{{b_1}\sum{x_1y}+ \dots +{b_k}\sum{x_ky}}}{\sum{y}^2} \]
Jenis data yang digunakan dalam penelitian ini adalah data sekunder yang diperoleh dari BPS (Badan Pusat Statistik) Provinsi Jawa Timur. Data yang digunakan adalah Data Produk Domestik Bruto atas Dasar Harga Konstan di Jawa Timur pada Tahun 2019, data Jumlah Penduduk Provinsi Jawa Timur 2019, data Jumlah Penduduk Miskin menurut Kabupaten dan Kota di Provinsi Jawa Timur Tahun 2019, data Tingkat Pengangguran Terbuka dan Tingkat Partisipasi Angkatan Kerja menurut Kabupaten dan Kota Tahun 2019.
Dalam penelitian ini, variabel yang digunakan adalah beberapa faktor yang diduga akan memeberikan pengaruh signifikan terhadap Produk Domestik Regional Bruto (PDRB). Adapun variabel yang digunakan dalam penelitian ini adalah sebagai barikut: 1. Jumlah Penduduk (X1) 2. Jumlah penduduk miskin (X2) 3. Tingkat Partisipasi Angkatan Kerja (TPAK) (X3) 4. Produk Domestik Regional Bruto (PDRB) (Y)
> # Library
> library(car)
> library(stats)
> library(ggpubr)
> library(lmtest)> library(readxl)
> DATA <- read_excel("D:/KULIAH/SEMESTER 6/Komputasi Statistika/prak komstat/1.xlsx")
> View(DATA)
> data1 <- as.data.frame(DATA)
> data1
Kabupaten/Kota Y X1 X2 X3
1 Pacitan 5.08 555.304 75.86 79.62
2 Ponorogo 5.01 871.370 83.97 71.15
3 Trenggalek 5.08 696.295 76.44 73.45
4 Tulungagung 5.32 1039.284 70.01 70.48
5 Blitar 5.12 1160.677 103.75 72.93
6 Kediri 5.07 1574.272 163.95 71.76
7 Malang 5.50 2606.204 246.60 70.07
8 Lumajang 4.77 1042.395 98.88 66.14
9 Jember 5.31 2450.668 226.57 67.16
10 Banyuwangi 5.55 1613.991 121.37 72.13
11 Bondowoso 5.29 775.715 103.33 76.01
12 Situbondo 5.45 682.978 76.44 72.40
13 Probolinggo 4.56 1168.503 207.22 68.88
14 Pasuruan 5.83 1627.396 141.09 68.82
15 Sidoarjo 5.99 2249.476 119.29 66.98
16 Mojokerto 5.81 1117.688 108.81 69.46
17 Jombang 5.06 1263.814 116.44 71.04
18 Nganjuk 5.36 1054.611 118.51 66.78
19 Madiun 5.42 682.684 71.91 70.47
20 Magetan 5.04 628.977 60.43 72.34
21 Ngawi 5.05 830.108 119.43 72.48
22 Bojonegoro 6.34 1249.692 154.64 71.29
23 Tuban 5.14 1172.790 170.80 68.76
24 Lamongan 5.44 1189.106 157.11 68.96
25 Gresik 5.41 1312.881 148.61 65.83
26 Bangkalan 1.03 986.672 186.11 63.44
27 Sampang 1.42 978.875 202.21 66.74
28 Pamekasan 4.92 879.992 122.43 68.50
29 Sumenep 0.14 1088.910 211.98 75.33
30 Kediri 5.47 287.409 20.54 64.81
31 Blitar 5.84 141.876 10.10 72.15
32 Malang 5.73 870.682 35.39 66.10
33 Probolinggo 5.94 237.208 16.37 64.12
34 Pasuruan 5.56 200.422 12.92 68.12
35 Mojokerto 5.75 129.014 6.63 65.09
36 Madiun 5.69 177.007 7.69 66.86
37 Surabaya 6.10 2896.195 130.55 68.76
38 Batu 6.52 207.490 7.89 71.22> n <- 38
> X1 <- matrix(data1$X1, ncol = 2)
> X2 <- matrix(data1$X2, ncol = 2)
> X3 <- matrix(data1$X3, ncol = 2)
> Y <- matrix(data1$Y, ncol = 2)
> x <- rbind(X1,X2,X3,Y)> smoothScatter(x, xlab = "X1,X2,X3", ylab = "Y", main = "Gambar 1. Smooth Scatter Plot")Data yang digunakan berasal dari website Badan Pusat Statistik.
> summary(data1)
Kabupaten/Kota Y X1 X2
Length:38 Min. :0.140 Min. : 129.0 Min. : 6.63
Class :character 1st Qu.:5.062 1st Qu.: 682.8 1st Qu.: 70.48
Mode :character Median :5.385 Median :1013.0 Median :112.62
Mean :5.082 Mean :1044.7 Mean :108.22
3rd Qu.:5.720 3rd Qu.:1234.5 3rd Qu.:153.13
Max. :6.520 Max. :2896.2 Max. :246.60
X3
Min. :63.44
1st Qu.:66.89
Median :69.21
Mean :69.65
3rd Qu.:72.04
Max. :79.62 Berdasarkan Data yang digunakan, diperoleh nilai mean sebesar:
\[ \mu_{x_1}=1044.7 \] \[ \mu_{x_2}=108.22 \] \[ \mu_{x_3}=69.65 \] \[ \mu_{y}=5.082 \]
> Regresi=lm(Y~X1+X2+X3, data=data1)
> Regresi
Call:
lm(formula = Y ~ X1 + X2 + X3, data = data1)
Coefficients:
(Intercept) X1 X2 X3
4.182290 0.001547 -0.020898 0.022180 Berdasarkan hasil analisis regresi linier berganda dengan data tersebut didapatkan hasil persamaan regresi (model) sebagai berikut
\[ Y = 4.182290 + 0.001547X_1 - 0.020898X_2 + 0.022180X_3 \] Dari model diatas dapat disimpulkan bahwa nilai konstanta sebesar 0.001547 yang berarti bahwa jika jumlah penduduk bertambah maka nilai PDRB akan bertambah sebesar 0.001547. Nilai konstanta sebesar -0.020898 yang berarti bahwa jika jumlah penduduk miskin bertambah maka nilai PDRB akan berkurang sebesar 0.020898. Nilai konstanta sebesar 0.022180 yang berarti bahwa jika prosentase TPAK bertambah maka nilai PDRB akan bertambah sebesar 0.022180.
> summary(Regresi)
Call:
lm(formula = Y ~ X1 + X2 + X3, data = data1)
Residuals:
Min 1Q Median 3Q Max
-2.96783 -0.33464 0.05598 0.54937 1.87473
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 4.182290 3.223517 1.297 0.203
X1 0.001547 0.000348 4.445 8.89e-05 ***
X2 -0.020898 0.003498 -5.975 9.29e-07 ***
X3 0.022180 0.046085 0.481 0.633
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 0.9677 on 34 degrees of freedom
Multiple R-squared: 0.5123, Adjusted R-squared: 0.4693
F-statistic: 11.91 on 3 and 34 DF, p-value: 1.741e-05Fungsi summary digunakan untuk melihat hasil analisis regresi secara lengkap. Berdasarkan output diatas didapatkan bahwa:
Uji Simultan digunakan untuk melihat seberapa pengaruh faktor faktor yang mempengaruhi tingkat PDRB secara simultan/ bersamaan. Dengan hasil pengujian diatas, sig = 1.741e-05 < alpha = 0,05 maka dapat disimpulkan bahwa tolak H0. Yang berarti bahwa terdapat pengaruh yang signifikan antara jumlah penduduk, jumlah penduduk miskin dan TPAK terhadap PDRB di Jawa Timur pada tahun 2019.
Dengan hasil pengujian diatas, untuk variabel jumlah penduduk didapatkan nilai sig = 8.89e-05 < alpha = 0,05 maka dapat disimpulkan bahwa tolak H0, yang berarti bahwa terdapat pengaruh signifikan antara jumlah penduduk terhadap PDRB di Jawa Timur pada tahun 2019. Untuk variabel jumlah penduduk miskin didapatkan nilai sig = 9.29e-07 < alpha = 0,05 maka dapat disimpulkan bahwa tolak H0 yang berarti bahwa terdapat pengaruh yang signifikan antara jumlah penduduk miskin terhadap PDRB di Jawa Timur pada tahun 2019. Dan untuk variabel TPAK didapatkan nilai sig = 0.633 > alpha = 0,05 maka dapat disimpulkan bahwa terima H0 yang berarti bahwa tidak terdapat pengaruh TPAK terhadap PDRB di Jawa Timur pada tahun 2019.
Nilai koefisien determinasi yang dihasilkan adalah sebesar 0.5123 atau 51,2%. Nilai tersebut menunjukkan bahwa keempat variabel independen yaitu jumlah penduduk, jumlah penduduk miskin dan TPAK menjelaskan PDRB. Sedangkan sisanya yaitu 49,8% menjelaskan variaben independen lain yang tidak dimasukkan dalam penelitian ini.
> Galat<- residuals(Regresi)
>
> library(ggpubr)
> ggqqplot(Galat)>
> library(stats)
> Saphirotest=shapiro.test(Galat)
> Saphirotest
Shapiro-Wilk normality test
data: Galat
W = 0.93008, p-value = 0.02018Pengujian ini bertujuan untuk menguji apakah dalam model regresi, variabel pengganggu atau residual memiliki distribusi normal. Dari uji saphiro wilk didapatkan bahwa p value = 0.02018, yang berarti data mendekati normal.
> library(car)
> Multikolinieritas=vif(Regresi)
> Multikolinieritas
X1 X2 X3
2.137946 2.138257 1.010484 Dari hasil pengujian diatas dapat dilihat bahwa keseluruhan nilai VIF kurang dari 10 yaitu, 2.137946 untuk variabel jumlah penduduk, 2.138257 untuk variabel jumlah penduduk miskin dan 1.010484 untuk variabel TPAK sehingga dapat dikatakan bahwa tidak terdapat masalah multikolinieritas.
> library(lmtest)
> Heteroskedastisitas=bptest(Regresi, studentize=T, data=data)
> Heteroskedastisitas
studentized Breusch-Pagan test
data: Regresi
BP = 14.107, df = 3, p-value = 0.002763Dari pengujian ini dapat disimpulkan bahwa keseluruhan variabel memiliki nilai sig 0.002763 kurang dari 0,05 sehingga dapat disimpulkan bahwa terdapat heterokedastisitas.
> library(lmtest)
> Autokorelasi=dwtest(Regresi)
> Autokorelasi
Durbin-Watson test
data: Regresi
DW = 1.7183, p-value = 0.1367
alternative hypothesis: true autocorrelation is greater than 0
> AIC(Regresi)
[1] 111.1212Sehingga dapat disimpulkan bahwa nilai d hitung sebesar 1.7183 dan nilai dL yang tercantum dalam tabel Durbin Watson adalah 1,32 dan dU adalah 1,65. Karena nilai DW lebih besar dari du maka dapat dipastikan data tidak memliki autokorelasi.
Badan Pusat Statistik. (n.d.). Tenaga Kerja. Retrieved September 19, 2021, from https://www.bps.go.id/subject/6/tenaga-kerja.html#subjekViewTab1
Badan Pusat Statistik Provinsi Jawa Timur. (n.d.). Kemiskinan dan Ketimpangan. Retrieved September 19, 2021, from https://jatim.bps.go.id/subject/23/kemiskinan-dan-ketimpangan.html
BPS Provinsi Jawa Timur. (2021). PRODUK DOMESTIK REGIONAL BRUTO KABUPATEN/KOTA DI PROVINSI JAWA TIMUR MENURUT LAPANGAN USAHA 2016-2020.
Ghozali, I. (2013). Aplikasi Analisis Dengan Program SPSS (edisi ketu). Badan Penerbit Universitas Diponegoro.
Ghozali, I. (2013). Aplikasi Analisis Dengan Program SPSS (edisi ketu). Badan Penerbit Universitas Diponegoro.
Ghozali, I. (2018). Aplikasi Analisis Multivariate dengan Program SPSS 25 (edisi 9). Badan Penerbit Universitas Diponegoro.
Gujarati, D. N. (2003). Basic Econometrics (Fourth edi). McGraw-HiII/lrwin.
Lestari, A., & Setyawan, Y. (2017). Analisis regresi data panel untuk mengetahui faktor yang mempengaruhi belanja daerah di provinsi jawa tengah. 2(1), 1–11.
Rayyan, I. (2018). ANALISIS REGRESI DATA PANEL PADA FAKTOR-FAKTOR YANG MEMPENGARUHI TINGKAT KEMISKINAN PROVINSI SULAWESI SELATAN TAHUN 2011-2015.
Ronald E. Walpole. (1993). Pengantar Statistika Edisi ke-3. PT GRAMEDIA PURTAKA UTAMA.
Supardi, U. (2013). Aplikasi Statistika Dalam Penelitian Edisi Revisi : Konsep Statistika Yang Lebih Komprehensif. Change Pulication Design.
Yuliasty, H. F. (2015). ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI KASUS PENYAKIT INFEKSI SALURAN PERNAPASAN AKUT DI KABUPATEN MOJOKERTO TAHUN 2013.