1 PENDAHULUAN
1.1 Latar Belakang
Pendapatan daerah adalah penerimaan yang diperoleh daerah dari sumber-sumber dalam wilayah sendiri. Untuk mengukur kemajuan daerah sebagai hasil dari program pembangunan daerah yaitu dengan mengamati seberapa besar laju pertumbuhan ekonomi yang dicapai daerah tersebut yang tercermin dari kenaikan Produk Domestik Regional Bruto (PDRB) yang dibagi menjadi 3 (3) sektor yaitu sektor pertanian, Sektor Perdagangan, Hotel dan Restoran serta sektor jasa-jasa. Dalam menyelesaikanya permasalahan ini bidang keilmuan yang digunakan adalah Regresi Linier Berganda. Regresi Linier Berganda adalah hubungan secara linier antara dua atau lebih variabel independen (X1,X2,…Xn) dengan variabel (Y). Analisis untuk mengetahui arah hubungan antara variabel independen dengan variabel dependen.
2 Tinjauan Pustaka
2.1 Statistika Deskriptif
Statistika deskriptif merupakan bentuk analisis data yang berguna untuk mengeneralkan hasil suatu penelitian yang didasarkan pada pada suatu sampel. Menurut Imam Ghozali (2011:19), statistik deskriptif memberikan gambaran atau deskripsi suatu data yang dilihat dari nilai rata-rata (mean), standar deviasi, varian, maksimum, minimum, sum, range, kurtosis dan skewness (kemencengan distribusi). Statistik deskriptif mendeskripsikan data menjadi sebuah informasi yang lebih jelas dan mudah dipahami.
2.2 Analisis Regresi
• Regresi adalah salah satu teknik statistik yang mempelajari bentuk hubungan antar dua variabel atau lebih. Variabel pada regresi dibedakan menjadi dua, yaitu :
Variabel respon (variabel dependent), adalah variabel tidak bebas yang dipengaruhi oleh variabel lainnya, variabel respon dinotasikan dengan huruf Y.
Variabel prediktor(variabel independent), adalah variabel bebas yang tidak dipengaruhi oleh variabel lainnya, variabel prediktor dinotasikan dengan huruf X.
• Tujuan analisis regresi adalah untuk melakukan peramalan
• Analisa regresi memberikan informasi mengenai ada tidaknya hubungan, pengaruh dan besarnya hubungan antar variabel penelitian. Jika variabel bebas banyaknya lebih dari satu maka disebut dengan regresi linear berganda. Analisis regresi linear berganda bertujuan untuk mengetahui tingkat hubungan antara variabel dan membuat perkiraan nilai Y terhadap X. Secara umum regresi linear dimodelkan sebagai berikut: \[ Y= \beta_0\ + \beta_1X_1\ + \varepsilon\ \] Dan taksiran model dari n sampel adalah sebagai berikut : \[ \hat{Y}\ = b_0 + b_1x_1\ \] dimana :
\(\hat{Y}\) = nilai estimasi variabel Y
\(b_0\) = estimasi parameter \(\beta_0\)
\(b_1\) = estimasi parameter \(\beta_1\ ... \beta_n\)
2.3 Asumsi Klasik
Menurut Imam Ghozali (2011), uji asumsi klasik terhadap model regresi linier yang digunakan untuk dilakukan agar dapat diketahui apakah model regresi baik atau tidak. Tujuan pengujian asumsi klasik adalah untuk memberikan kepastian bahwa persamaan regresi yang diperoleh memiliki ketepatan dalam estimasi, tidak bias, dan konsisten. Sebelum melakukan analisis regresi terlebih dahulu dilakukan pengujian asumsi. Asumsi-asumsi yang harus dipenuhi dalam analisis regresi antara lain: Normalitas, Homoskedastisitas, Nonmultikolinieritas, dan Nonautokorelasi
2.3.1 Asumsi Normalitas
- Uji Normalitas bertujuan untuk menguji apakah dalam model regresi suatu variabel pengganggu atau residual memiliki distribusi yang normal atau tidak.
- Suatau model regresi dikatakan baik jika datanya berdistribusi normal atau mendekati normal.
- Untuk mengetahui normalitas data dapat menggunakan analisis grafik dan uji statistik. Analisis grafik yaitu dengan melihat grafik histogram dan melihat normal probability plot. Sedangkan untuk uji statistik dalam normalitas dibagi dua yaitu uji statistik sederhana dengan melihat nilai kurtosis dan skewness dari residual dan uji statistik non parametrik Kolmogorov-Smirnov (Ghozali, 2009).
2.3.2 Asumsi Homoskedastisitas
Homoskedastisitas atau non heteroskedastisitas yaitu asumsi yang menyatakan bahwa varian setiap sisaan masih tetap sama baik untuk nilai-nilai pada variabel independen yang kecil maupun besar.
2.3.3 Asumsi Non Multikolinieritas
Multikolinearitas adalah keadaan dimana antara dua variabel independen atau lebih pada model regresi terjadi hubungan linier yang sempurna atau mendekati sempurna. Model regresi yang baik mensyaratkan tidak adanya masalah multikolinearitas. Untuk mendeteksi ada tidaknya multikolinearitas, ada beberapa metode diantaranya dengan melihat nilai Tolerance dan VIF. Jika nilai VIF ≤ 10, maka dinyatakan tidak terjadi multikolinearitas. Kebalikannya, jika nilai VIF > 10 makadinyatakan terjadi multikolinearitas \[ VIF_j=\frac{1}{(1-R_j^2)} \] dengan j=1,2,…,k dan k adalah banyaknya variabel independen, sedangkan \(r_j^2\) adalah koefisien determinasi yang dihasilkan dari regresi variabel independen \(X_j\) dengan variabel independen lain.
2.3.4 Heteroskedasitas
Heteroskedastisitas adalah keadaan dimana terjadinya ketidaksamaan varian dari residual pada model regresi. Model regresi yang baik mensyaratkan tidak adanya masalah heteroskedastisitas.Untuk mendeteksi ada tidaknya heteroskedastisitas, penulis menggunakan Metode Uji Spearman’s-rho.
3 SOURCE CODE
3.1 Library yang dibutuhkan
> library("magrittr")
> library("summarytools")
> library(stargazer)
> library(ggplot2)
> library(tseries)
> library(lmtest)
> library(car)
> library(GGally)
3.2 Data dan Variabel
> TAPUT<- data.frame(Pendapatan = c(0.131,0.101,0.294,0.198,0.210,0.228,358.308,435.403,485.050,537.837,563.641,676.187),
+ Pertanian = c(0.924,0.638,0.758,0.904,0.981,1.208,1.334,1.519,1.738,1.857,2.072,2.212),
+ Jasa=c(0.180,0.136,0.162,0.194,0.218,0.269,0.326,0.371,0.419,0.472,0.545,0.618),
+ Perdagangan.Hotel.Restoran=c(0.214,0.124,0.148,0.179,0.241,0.297,0.332,0.327,0.439,0.488,0.558,0.624))
>
> y <- TAPUT$Pendapatan
> x1 <- TAPUT$Pertanian
> x2 <- TAPUT$Jasa
> x3 <- TAPUT$Perdagangan.Hotel.Restoran
>
> str(TAPUT)
'data.frame': 12 obs. of 4 variables:
$ Pendapatan : num 0.131 0.101 0.294 0.198 0.21 ...
$ Pertanian : num 0.924 0.638 0.758 0.904 0.981 ...
$ Jasa : num 0.18 0.136 0.162 0.194 0.218 0.269 0.326 0.371 0.419 0.472 ...
$ Perdagangan.Hotel.Restoran: num 0.214 0.124 0.148 0.179 0.241 0.297 0.332 0.327 0.439 0.488 ...
y : Jumlah Pendapatan x1 : Sektor Pertanian x2 : Sektor Perdanganan, Hotel dan Restoran x3 : Sektor Jasa
3.3 Analisis Regresi
derajat bebas didefenisikan sebagai \(db=n-2\)
> n <- nrow(TAPUT)
> y <- TAPUT[, 1]
> X <- TAPUT[, -1]
> X <- cbind(cons =1, X) %>% as.matrix()
> beta <- solve(t(X) %*% X) %*% (t(X) %*% y)
> beta %>% round(4)
1]
[,-392.0395
cons 405.2396
Pertanian 2570.8648
Jasa -2224.2791 Perdagangan.Hotel.Restoran
Diperoleh persamaan regresi :
\[ \bar{Y}= -392.0395+405.2395X_1+2570.8648X_2-2224.2791X_3 \] Interpretasi model regresi berganda : setiap kenaikan satu satuan x1 akan menaikan Y sebesar 405.2395 satuan. Setiap kenaikan satu satuan x2 akan menaikan Y sebesar 2570.8646 satuan. Setiap kenaikan satu satuan x3 akan menurunkan Y sebesar 2224.271 satuan .
y-duga sisaan \[ \bar{y}=X\beta \]
> y_duga <- X %*% beta
\[ \hat \epsilon=y-\hat{y} \]
> e <- y-y_duga
3.4 Standar Error
Standar error untuk setiap penduga parameter diduga menggunakan matriks varians kovarians
\[ se=\sigma_\epsilon(X'X)^{-1} \] ### \(\sigma_\epsilon\) diduga dengan Kuadrat Tengah Galat \[ \hat\sigma_\epsilon=\frac{\sum{\hat\epsilon^2}}{n-1} \]
> MSE <- sum(e^2)/(n-1)
> VarCov <- MSE * solve(t(X) %*% X)
> Se <- VarCov %>% diag() %>% sqrt()
3.5 Uji Parsial
Menguji signifikansi masing-masing penduga parameter Hipotessis:
\[
H_0:\beta=0
H_1:\beta\neq0
\] Statistik Uji:
Jika \(H_0\) benar maka: \[
t=\frac{\hat{\beta_i}}{se_\hat{\beta_i}}\sim t_{db}^{\frac{\alpha}{2}}
\] dengan \(db=n-1\) untuk \(\beta_0\) dan \(db=n-p\) untuk lainnya,serta \(p\) adalah banyak prediktor.
> p <- ncol(X)
> SU <- beta/Se
> pVal <- c(2* pt(abs(SU[1]), n-1, lower.tail = F),
+ 2* pt(abs(SU[-1]), n-p, lower.tail = F))
> pVal
1] 0.00713881 0.34562199 0.08616800 0.05606033
[> beta
1]
[,-392.0395
cons 405.2396
Pertanian 2570.8648
Jasa -2224.2791 Perdagangan.Hotel.Restoran
Hasil perhitungan dapat dibuat dalam tabel :
> data.frame(
+ Koefisien = beta %>% rownames(),
+ Pend.param = beta %>% round(4),
+ Std.Error = Se %>% round(3),
+ Stat.Uji = SU %>% round(3),
+ pValue = pVal %>% round(3),
+ Sig = ifelse(pVal < 0.001, "***",
+ ifelse(pVal < 0.01, "**",
+ ifelse(pVal < 0.05, "*",
+ ifelse(pVal < 0.1, ".",""))))
+ )
Koefisien Pend.param Std.Error-392.0395 118.974
cons cons 405.2396 404.376
Pertanian Pertanian 2570.8648 1314.241
Jasa Jasa -2224.2791 996.228
Perdagangan.Hotel.Restoran Perdagangan.Hotel.Restoran
Stat.Uji pValue Sig-3.295 0.007 **
cons 1.002 0.346
Pertanian 1.956 0.086 .
Jasa -2.233 0.056 . Perdagangan.Hotel.Restoran
3.6 Koefisien Determinasi
\[ R^2=\frac{JK_{Reg}}{JK_{Tot}}=1-\frac{JK_{Error}}{JK_{Tot}} \]
> JK_Error <- sum(e^2)
> JK_Tot <- sum( (y - mean(y))^2)
> R2 <- 1 - (JK_Error/JK_Tot)
> R2
1] 0.9401522 [
> R2adj <- 1 - MSE/(JK_Tot/(n+2))
> R2adj
1] 0.9238301 [
\(R_2\) = 0.94 atau sebesar 94%, yang artinya variabel prediktor X (Pertanian, Jasa dan Perdagangan) dapat menjelaskan hubungan terhadap kenaikan pendapatan (Y) sebesar 94% sedangkan 6% dipengaruhi oleh faktor lain.
3.7 Uji Simultan
- Pengujian parameter secara bersama
- Hipotesis
$$ H_0:_i=0 H_1:_i
$$
- Statistik Uji
Jika \(H_0\) benar maka: \[ F=\frac{R^2/(p-1)}{(1-R^2)/(n-p+3)}\sim F_{db_1,db_2}^2 \]
Dalam hal ini \(db_1 = n-1\) dan \(db_2=n-p+3\).
> Fhit <- (R2/(p-1))/((1-R2)/(n-p+3))
> pVal2 <- pf(Fhit, p-1, n-p+3, lower.tail =F )
> Fhit; pVal2
1] 57.59985
[1] 5.164701e-07 [
4 Penggunaan Fungsi Built in R
> taput <- TAPUT
> head(taput)
Pendapatan Pertanian Jasa Perdagangan.Hotel.Restoran1 0.131 0.924 0.180 0.214
2 0.101 0.638 0.136 0.124
3 0.294 0.758 0.162 0.148
4 0.198 0.904 0.194 0.179
5 0.210 0.981 0.218 0.241
6 0.228 1.208 0.269 0.297
> str(taput)
'data.frame': 12 obs. of 4 variables:
$ Pendapatan : num 0.131 0.101 0.294 0.198 0.21 ...
$ Pertanian : num 0.924 0.638 0.758 0.904 0.981 ...
$ Jasa : num 0.18 0.136 0.162 0.194 0.218 0.269 0.326 0.371 0.419 0.472 ...
$ Perdagangan.Hotel.Restoran: num 0.214 0.124 0.148 0.179 0.241 0.297 0.332 0.327 0.439 0.488 ...
Data frame berisi 12 pengamatan dengan 4 variabel, yakni pendapatan, pertanian, jasa, perdangangan, hotel dan restoran.
5 Pemodelan regresi menggunakan fungsi~lm
> model.regresi<- lm(formula = Pendapatan ~., data=taput ) %>% summary()
> model.regresi
:
Calllm(formula = Pendapatan ~ ., data = taput)
:
Residuals
Min 1Q Median 3Q Max -128.214 -33.253 -8.346 51.953 110.117
:
CoefficientsPr(>|t|)
Estimate Std. Error t value -392.0 139.5 -2.810 0.0228 *
(Intercept) 405.2 474.2 0.855 0.4176
Pertanian 2570.9 1541.1 1.668 0.1338
Jasa -2224.3 1168.2 -1.904 0.0934 .
Perdagangan.Hotel.Restoran ---
: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Signif. codes
: 79.19 on 8 degrees of freedom
Residual standard error-squared: 0.9402, Adjusted R-squared: 0.9177
Multiple R-statistic: 41.89 on 3 and 8 DF, p-value: 3.081e-05 F
#Pemilihan Model
> model1 <- lm(Pendapatan~Pertanian, taput)
> model2 <- lm(Pendapatan~Pertanian+Jasa, taput)
> model3 <- lm(Pendapatan~Pertanian+Perdagangan.Hotel.Restoran, taput)
> model4 <- lm(Pendapatan~Jasa+Perdagangan.Hotel.Restoran, taput)
> model5 <- lm(Pendapatan~., taput)
> stargazer(model1, model2, model3, model4, model5, type = "text")
=========================================================================================================================================
:
Dependent variable--------------------------------------------------------------------------------------------------------------
Pendapatan 1) (2) (3) (4) (5)
(-----------------------------------------------------------------------------------------------------------------------------------------
495.076*** 40.843 961.613** 405.240
Pertanian 50.800) (493.070) (368.938) (474.172)
(
1,513.260 3,497.222** 2,570.865
Jasa 1,633.773) (1,078.923) (1,541.084)
(
-1,521.884 -1,821.335 -2,224.279*
Perdagangan.Hotel.Restoran 1,192.725) (1,052.676) (1,168.181)
(
-411.285*** -293.222* -535.354*** -282.002*** -392.039**
Constant 73.054) (147.177) (120.317) (52.901) (139.509)
(
-----------------------------------------------------------------------------------------------------------------------------------------
12 12 12 12 12
Observations 0.905 0.913 0.919 0.935 0.940
R2 0.895 0.894 0.901 0.920 0.918
Adjusted R2 89.365 (df = 10) 90.007 (df = 9) 86.684 (df = 9) 77.999 (df = 9) 79.194 (df = 8)
Residual Std. Error 94.976*** (df = 1; 10) 47.242*** (df = 2; 9) 51.285*** (df = 2; 9) 64.400*** (df = 2; 9) 41.891*** (df = 3; 8)
F Statistic =========================================================================================================================================
: *p<0.1; **p<0.05; ***p<0.01 Note
6 Pengujian Asumsi Menggunakan Fungsi Built in
6.1 Uji Normalitas
> sisa <- residuals(model.regresi)
> jarque.bera.test(sisa)
Jarque Bera Test
: sisa
data-squared = 0.25567, df = 2, p-value = 0.88 X
Diperoleh nilai-p = 0.88 lebih besar dari \(\alpha=5%\) maka terima H0. Yang memiliki arti bahwa tidak terdapat bukti adanya pelanggaran asumsi normalitas sisaan pada model regresi.
6.2 Uji Homoskedastisitas
> shapiro.test(sisa)
-Wilk normality test
Shapiro
: sisa
data= 0.98296, p-value = 0.9928 W
Diperoleh nilai-p = 0.9928 lebih besar \(\alpha=5%\) maka terima H0. Yang memiliki arti bahwa tidak terdapat bukti adanya pelanggaran asumsi homoskedastisitas ragam galat pada model regresi.
6.3 Uji Non Multikolinieritas
> anreg<- lm(Pendapatan~Pertanian+Jasa+Perdagangan.Hotel.Restoran, taput)
> vif(anreg)
Pertanian Jasa 110.94142 106.73493
Perdagangan.Hotel.Restoran 64.42679
Ketiga variabel memiliki nilai multikolineritas yang lebih besar dari 10, hal tersebut mengindikasikan adanya hubungan linier antara variabel prediktor. Sehingga model regresi belum memenuhi standar sebagai pemodelan yang baik.
6.4 Uji Asumsi Non AutoKorelasi
> dwtest(model.regresi)
-Watson test
Durbin
: model.regresi
data= 2.2114, p-value = 0.3905
DW : true autocorrelation is greater than 0 alternative hypothesis
Diperoleh nilai-p = 0.3095 lebih besar \(\alpha=5%\) maka terima H0. Yang memiliki arti bahwa tidak terdapat bukti adanya masalah autokorelasi.
6.5 KOrelasi
> cor(TAPUT) %>% round(3)
Pendapatan Pertanian Jasa1.000 0.951 0.955
Pendapatan 0.951 1.000 0.995
Pertanian 0.955 0.995 1.000
Jasa 0.927 0.991 0.991
Perdagangan.Hotel.Restoran
Perdagangan.Hotel.Restoran0.927
Pendapatan 0.991
Pertanian 0.991
Jasa 1.000
Perdagangan.Hotel.Restoran > TAPUT %>% ggpairs(progress = F )
#Kesimpulan Baik dengan mengunakan cara manual dan pengunaan fungsi built in Lm pada software R tetap menghasilkan hasil analisis yang sama. Karena adanya pelanggaran pada uji nonmultikolineritas sehingga model yang regresi belum layak digunakan untuk meramalkan kenaikan pendapatan.
7 Daftar Pustaka
Lamsihar Df Pakpahan, dkk (2013).Penggunaan Metode Stepwise Forward untuk menentukan persamaan regresi liener berganda (Studi Kasus : Jumlah Pendapatan di tapanuli utara) Jammer R. Lawendatu, dkk. Reresi Linier Berganda Untuk Menganalisis Pendapatan Petani Cicih Ratna sari dan Siti Nurjannah (2019) PENGARUH HARGA DAN KUALITAS PRODUK TERHADAP KEPUTUSAN PEMBELIAN MIE INSTAN MEREK MIE SEDAAP SERTA IMPLIKASINYA TERHADAP LOYALITAS PELANGGAN DI PERUMAHAN PEKAYON BEKASI SELATAN