1 PENDAHULUAN

1.1 Latar Belakang

Pendapatan daerah adalah penerimaan yang diperoleh daerah dari sumber-sumber dalam wilayah sendiri. Untuk mengukur kemajuan daerah sebagai hasil dari program pembangunan daerah yaitu dengan mengamati seberapa besar laju pertumbuhan ekonomi yang dicapai daerah tersebut yang tercermin dari kenaikan Produk Domestik Regional Bruto (PDRB) yang dibagi menjadi 3 (3) sektor yaitu sektor pertanian, Sektor Perdagangan, Hotel dan Restoran serta sektor jasa-jasa. Dalam menyelesaikanya permasalahan ini bidang keilmuan yang digunakan adalah Regresi Linier Berganda. Regresi Linier Berganda adalah hubungan secara linier antara dua atau lebih variabel independen (X1,X2,…Xn) dengan variabel (Y). Analisis untuk mengetahui arah hubungan antara variabel independen dengan variabel dependen.

2 Tinjauan Pustaka

2.1 Statistika Deskriptif

Statistika deskriptif merupakan bentuk analisis data yang berguna untuk mengeneralkan hasil suatu penelitian yang didasarkan pada pada suatu sampel. Menurut Imam Ghozali (2011:19), statistik deskriptif memberikan gambaran atau deskripsi suatu data yang dilihat dari nilai rata-rata (mean), standar deviasi, varian, maksimum, minimum, sum, range, kurtosis dan skewness (kemencengan distribusi). Statistik deskriptif mendeskripsikan data menjadi sebuah informasi yang lebih jelas dan mudah dipahami.

2.2 Analisis Regresi

• Regresi adalah salah satu teknik statistik yang mempelajari bentuk hubungan antar dua variabel atau lebih. Variabel pada regresi dibedakan menjadi dua, yaitu :

Variabel respon (variabel dependent), adalah variabel tidak bebas yang dipengaruhi oleh variabel lainnya, variabel respon dinotasikan dengan huruf Y.
Variabel prediktor(variabel independent), adalah variabel bebas yang tidak dipengaruhi oleh variabel lainnya, variabel prediktor dinotasikan dengan huruf X.

• Tujuan analisis regresi adalah untuk melakukan peramalan

• Analisa regresi memberikan informasi mengenai ada tidaknya hubungan, pengaruh dan besarnya hubungan antar variabel penelitian. Jika variabel bebas banyaknya lebih dari satu maka disebut dengan regresi linear berganda. Analisis regresi linear berganda bertujuan untuk mengetahui tingkat hubungan antara variabel dan membuat perkiraan nilai Y terhadap X. Secara umum regresi linear dimodelkan sebagai berikut: \[ Y= \beta_0\ + \beta_1X_1\ + \varepsilon\ \] Dan taksiran model dari n sampel adalah sebagai berikut : \[ \hat{Y}\ = b_0 + b_1x_1\ \] dimana :

$\hat{Y}$ = nilai estimasi variabel Y

$b_0$ = estimasi parameter $\beta_0$

$b_1$ = estimasi parameter $\beta_1\ ... \beta_n$

2.3 Asumsi Klasik

Menurut Imam Ghozali (2011), uji asumsi klasik terhadap model regresi linier yang digunakan untuk dilakukan agar dapat diketahui apakah model regresi baik atau tidak. Tujuan pengujian asumsi klasik adalah untuk memberikan kepastian bahwa persamaan regresi yang diperoleh memiliki ketepatan dalam estimasi, tidak bias, dan konsisten. Sebelum melakukan analisis regresi terlebih dahulu dilakukan pengujian asumsi. Asumsi-asumsi yang harus dipenuhi dalam analisis regresi antara lain: Normalitas, Homoskedastisitas, Nonmultikolinieritas, dan Nonautokorelasi

2.3.1 Asumsi Normalitas

Uji Normalitas bertujuan untuk menguji apakah dalam model regresi suatu variabel pengganggu atau residual memiliki distribusi yang normal atau tidak.
Suatau model regresi dikatakan baik jika datanya berdistribusi normal atau mendekati normal.
Untuk mengetahui normalitas data dapat menggunakan analisis grafik dan uji statistik. Analisis grafik yaitu dengan melihat grafik histogram dan melihat normal probability plot. Sedangkan untuk uji statistik dalam normalitas dibagi dua yaitu uji statistik sederhana dengan melihat nilai kurtosis dan skewness dari residual dan uji statistik non parametrik Kolmogorov-Smirnov (Ghozali, 2009).

2.3.2 Asumsi Homoskedastisitas

Homoskedastisitas atau non heteroskedastisitas yaitu asumsi yang menyatakan bahwa varian setiap sisaan masih tetap sama baik untuk nilai-nilai pada variabel independen yang kecil maupun besar.

2.3.3 Asumsi Non Multikolinieritas

Multikolinearitas adalah keadaan dimana antara dua variabel independen atau lebih pada model regresi terjadi hubungan linier yang sempurna atau mendekati sempurna. Model regresi yang baik mensyaratkan tidak adanya masalah multikolinearitas. Untuk mendeteksi ada tidaknya multikolinearitas, ada beberapa metode diantaranya dengan melihat nilai Tolerance dan VIF. Jika nilai VIF ≤ 10, maka dinyatakan tidak terjadi multikolinearitas. Kebalikannya, jika nilai VIF > 10 makadinyatakan terjadi multikolinearitas \[ VIF_j=\frac{1}{(1-R_j^2)} \] dengan j=1,2,…,k dan k adalah banyaknya variabel independen, sedangkan $r_j^2$ adalah koefisien determinasi yang dihasilkan dari regresi variabel independen $X_j$ dengan variabel independen lain.

2.3.4 Heteroskedasitas

Heteroskedastisitas adalah keadaan dimana terjadinya ketidaksamaan varian dari residual pada model regresi. Model regresi yang baik mensyaratkan tidak adanya masalah heteroskedastisitas.Untuk mendeteksi ada tidaknya heteroskedastisitas, penulis menggunakan Metode Uji Spearman’s-rho.

3 SOURCE CODE

3.1 Library yang dibutuhkan

> library("magrittr")
> library("summarytools")
> library(stargazer)
> library(ggplot2)
> library(tseries)
> library(lmtest)
> library(car)
> library(GGally)

3.2 Data dan Variabel

> TAPUT<- data.frame(Pendapatan = c(0.131,0.101,0.294,0.198,0.210,0.228,358.308,435.403,485.050,537.837,563.641,676.187),
+   Pertanian = c(0.924,0.638,0.758,0.904,0.981,1.208,1.334,1.519,1.738,1.857,2.072,2.212),
+ Jasa=c(0.180,0.136,0.162,0.194,0.218,0.269,0.326,0.371,0.419,0.472,0.545,0.618),
+ Perdagangan.Hotel.Restoran=c(0.214,0.124,0.148,0.179,0.241,0.297,0.332,0.327,0.439,0.488,0.558,0.624))
> 
> y  <- TAPUT$Pendapatan
> x1 <- TAPUT$Pertanian
> x2 <- TAPUT$Jasa
> x3 <- TAPUT$Perdagangan.Hotel.Restoran
> 
> str(TAPUT)
'data.frame':   12 obs. of  4 variables:
 $ Pendapatan                : num  0.131 0.101 0.294 0.198 0.21 ...
 $ Pertanian                 : num  0.924 0.638 0.758 0.904 0.981 ...
 $ Jasa                      : num  0.18 0.136 0.162 0.194 0.218 0.269 0.326 0.371 0.419 0.472 ...
 $ Perdagangan.Hotel.Restoran: num  0.214 0.124 0.148 0.179 0.241 0.297 0.332 0.327 0.439 0.488 ...

y : Jumlah Pendapatan x1 : Sektor Pertanian x2 : Sektor Perdanganan, Hotel dan Restoran x3 : Sektor Jasa

3.3 Analisis Regresi

derajat bebas didefenisikan sebagai $db=n-2$

> n <- nrow(TAPUT)
> y <- TAPUT[, 1]
> X <- TAPUT[, -1]
> X <- cbind(cons =1, X) %>% as.matrix()
> beta <- solve(t(X) %*% X) %*% (t(X) %*% y)
> beta %>% round(4)
                                 [,1]
cons                        -392.0395
Pertanian                    405.2396
Jasa                        2570.8648
Perdagangan.Hotel.Restoran -2224.2791

Diperoleh persamaan regresi :

\[ \bar{Y}= -392.0395+405.2395X_1+2570.8648X_2-2224.2791X_3 \] Interpretasi model regresi berganda : setiap kenaikan satu satuan x1 akan menaikan Y sebesar 405.2395 satuan. Setiap kenaikan satu satuan x2 akan menaikan Y sebesar 2570.8646 satuan. Setiap kenaikan satu satuan x3 akan menurunkan Y sebesar 2224.271 satuan .

y-duga sisaan \[ \bar{y}=X\beta \]

> y_duga <- X %*% beta

\[ \hat \epsilon=y-\hat{y} \]

> e <- y-y_duga

3.4 Standar Error

Standar error untuk setiap penduga parameter diduga menggunakan matriks varians kovarians

\[ se=\sigma_\epsilon(X'X)^{-1} \] ### $\sigma_\epsilon$ diduga dengan Kuadrat Tengah Galat \[ \hat\sigma_\epsilon=\frac{\sum{\hat\epsilon^2}}{n-1} \]

> MSE    <- sum(e^2)/(n-1)
> VarCov <- MSE * solve(t(X) %*% X)
> Se     <- VarCov %>% diag() %>% sqrt()

3.5 Uji Parsial

Menguji signifikansi masing-masing penduga parameter Hipotessis:
\[ H_0:\beta=0 H_1:\beta\neq0 \] Statistik Uji:
Jika $H_0$ benar maka: \[ t=\frac{\hat{\beta_i}}{se_\hat{\beta_i}}\sim t_{db}^{\frac{\alpha}{2}} \] dengan $db=n-1$ untuk $\beta_0$ dan $db=n-p$ untuk lainnya,serta $p$ adalah banyak prediktor.

> p     <- ncol(X)
> SU    <- beta/Se
> pVal  <- c(2* pt(abs(SU[1]), n-1, lower.tail = F),
+            2* pt(abs(SU[-1]), n-p, lower.tail = F))
> pVal
[1] 0.00713881 0.34562199 0.08616800 0.05606033
> beta
                                 [,1]
cons                        -392.0395
Pertanian                    405.2396
Jasa                        2570.8648
Perdagangan.Hotel.Restoran -2224.2791

Hasil perhitungan dapat dibuat dalam tabel :

> data.frame(
+   Koefisien  = beta %>% rownames(),
+   Pend.param = beta %>% round(4),
+   Std.Error  = Se   %>% round(3),
+   Stat.Uji   = SU   %>% round(3),
+   pValue     = pVal %>% round(3),
+   Sig        = ifelse(pVal < 0.001, "***",
+                       ifelse(pVal < 0.01, "**",
+                              ifelse(pVal < 0.05, "*",
+                                     ifelse(pVal < 0.1, ".",""))))
+   )
                                            Koefisien Pend.param Std.Error
cons                                             cons  -392.0395   118.974
Pertanian                                   Pertanian   405.2396   404.376
Jasa                                             Jasa  2570.8648  1314.241
Perdagangan.Hotel.Restoran Perdagangan.Hotel.Restoran -2224.2791   996.228
                           Stat.Uji pValue Sig
cons                         -3.295  0.007  **
Pertanian                     1.002  0.346    
Jasa                          1.956  0.086   .
Perdagangan.Hotel.Restoran   -2.233  0.056   .

3.6 Koefisien Determinasi

\[ R^2=\frac{JK_{Reg}}{JK_{Tot}}=1-\frac{JK_{Error}}{JK_{Tot}} \]

> JK_Error <- sum(e^2)
> JK_Tot   <- sum( (y - mean(y))^2)
> R2       <- 1 - (JK_Error/JK_Tot)
> R2
[1] 0.9401522

> R2adj     <- 1 - MSE/(JK_Tot/(n+2))
> R2adj
[1] 0.9238301

$R_2$ = 0.94 atau sebesar 94%, yang artinya variabel prediktor X (Pertanian, Jasa dan Perdagangan) dapat menjelaskan hubungan terhadap kenaikan pendapatan (Y) sebesar 94% sedangkan 6% dipengaruhi oleh faktor lain.

3.7 Uji Simultan

Pengujian parameter secara bersama
Hipotesis
$$ H_0:_i=0 H_1:_i

Statistik Uji
Jika $H_0$ benar maka: \[ F=\frac{R^2/(p-1)}{(1-R^2)/(n-p+3)}\sim F_{db_1,db_2}^2 \]

Dalam hal ini $db_1 = n-1$ dan $db_2=n-p+3$.

> Fhit   <- (R2/(p-1))/((1-R2)/(n-p+3))
> pVal2  <- pf(Fhit, p-1, n-p+3, lower.tail =F )
> Fhit; pVal2
[1] 57.59985
[1] 5.164701e-07

4 Penggunaan Fungsi Built in R

> taput <- TAPUT
> head(taput)
  Pendapatan Pertanian  Jasa Perdagangan.Hotel.Restoran
1      0.131     0.924 0.180                      0.214
2      0.101     0.638 0.136                      0.124
3      0.294     0.758 0.162                      0.148
4      0.198     0.904 0.194                      0.179
5      0.210     0.981 0.218                      0.241
6      0.228     1.208 0.269                      0.297

> str(taput)
'data.frame':   12 obs. of  4 variables:
 $ Pendapatan                : num  0.131 0.101 0.294 0.198 0.21 ...
 $ Pertanian                 : num  0.924 0.638 0.758 0.904 0.981 ...
 $ Jasa                      : num  0.18 0.136 0.162 0.194 0.218 0.269 0.326 0.371 0.419 0.472 ...
 $ Perdagangan.Hotel.Restoran: num  0.214 0.124 0.148 0.179 0.241 0.297 0.332 0.327 0.439 0.488 ...

Data frame berisi 12 pengamatan dengan 4 variabel, yakni pendapatan, pertanian, jasa, perdangangan, hotel dan restoran.

5 Pemodelan regresi menggunakan fungsi~lm

> model.regresi<- lm(formula = Pendapatan ~., data=taput ) %>% summary()
> model.regresi

Call:
lm(formula = Pendapatan ~ ., data = taput)

Residuals:
     Min       1Q   Median       3Q      Max 
-128.214  -33.253   -8.346   51.953  110.117 

Coefficients:
                           Estimate Std. Error t value Pr(>|t|)  
(Intercept)                  -392.0      139.5  -2.810   0.0228 *
Pertanian                     405.2      474.2   0.855   0.4176  
Jasa                         2570.9     1541.1   1.668   0.1338  
Perdagangan.Hotel.Restoran  -2224.3     1168.2  -1.904   0.0934 .
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 79.19 on 8 degrees of freedom
Multiple R-squared:  0.9402,    Adjusted R-squared:  0.9177 
F-statistic: 41.89 on 3 and 8 DF,  p-value: 3.081e-05

#Pemilihan Model

> model1 <- lm(Pendapatan~Pertanian, taput)
> model2 <- lm(Pendapatan~Pertanian+Jasa, taput)
> model3 <- lm(Pendapatan~Pertanian+Perdagangan.Hotel.Restoran, taput)
> model4 <- lm(Pendapatan~Jasa+Perdagangan.Hotel.Restoran, taput)
> model5 <- lm(Pendapatan~., taput)

> stargazer(model1, model2, model3, model4, model5, type = "text")

=========================================================================================================================================
                                                                        Dependent variable:                                              
                           --------------------------------------------------------------------------------------------------------------
                                                                             Pendapatan                                                  
                                    (1)                    (2)                   (3)                   (4)                   (5)         
-----------------------------------------------------------------------------------------------------------------------------------------
Pertanian                        495.076***              40.843               961.613**                                    405.240       
                                  (50.800)              (493.070)             (368.938)                                   (474.172)      
                                                                                                                                         
Jasa                                                    1,513.260                                  3,497.222**            2,570.865      
                                                       (1,633.773)                                 (1,078.923)           (1,541.084)     
                                                                                                                                         
Perdagangan.Hotel.Restoran                                                   -1,521.884            -1,821.335            -2,224.279*     
                                                                             (1,192.725)           (1,052.676)           (1,168.181)     
                                                                                                                                         
Constant                        -411.285***             -293.222*            -535.354***           -282.002***           -392.039**      
                                  (73.054)              (147.177)             (120.317)             (52.901)              (139.509)      
                                                                                                                                         
-----------------------------------------------------------------------------------------------------------------------------------------
Observations                         12                    12                    12                    12                    12          
R2                                 0.905                  0.913                 0.919                 0.935                 0.940        
Adjusted R2                        0.895                  0.894                 0.901                 0.920                 0.918        
Residual Std. Error           89.365 (df = 10)       90.007 (df = 9)       86.684 (df = 9)       77.999 (df = 9)       79.194 (df = 8)   
F Statistic                94.976*** (df = 1; 10) 47.242*** (df = 2; 9) 51.285*** (df = 2; 9) 64.400*** (df = 2; 9) 41.891*** (df = 3; 8)
=========================================================================================================================================
Note:                                                                                                         *p<0.1; **p<0.05; ***p<0.01

6 Pengujian Asumsi Menggunakan Fungsi Built in

6.1 Uji Normalitas

> sisa <- residuals(model.regresi)
> jarque.bera.test(sisa)

    Jarque Bera Test

data:  sisa
X-squared = 0.25567, df = 2, p-value = 0.88

Diperoleh nilai-p = 0.88 lebih besar dari $\alpha=5%$ maka terima H0. Yang memiliki arti bahwa tidak terdapat bukti adanya pelanggaran asumsi normalitas sisaan pada model regresi.

6.2 Uji Homoskedastisitas

> shapiro.test(sisa)

    Shapiro-Wilk normality test

data:  sisa
W = 0.98296, p-value = 0.9928

Diperoleh nilai-p = 0.9928 lebih besar $\alpha=5%$ maka terima H0. Yang memiliki arti bahwa tidak terdapat bukti adanya pelanggaran asumsi homoskedastisitas ragam galat pada model regresi.

6.3 Uji Non Multikolinieritas

> anreg<- lm(Pendapatan~Pertanian+Jasa+Perdagangan.Hotel.Restoran, taput)
> vif(anreg)
                 Pertanian                       Jasa 
                 110.94142                  106.73493 
Perdagangan.Hotel.Restoran 
                  64.42679

Ketiga variabel memiliki nilai multikolineritas yang lebih besar dari 10, hal tersebut mengindikasikan adanya hubungan linier antara variabel prediktor. Sehingga model regresi belum memenuhi standar sebagai pemodelan yang baik.

6.4 Uji Asumsi Non AutoKorelasi

> dwtest(model.regresi)

    Durbin-Watson test

data:  model.regresi
DW = 2.2114, p-value = 0.3905
alternative hypothesis: true autocorrelation is greater than 0

Diperoleh nilai-p = 0.3095 lebih besar $\alpha=5%$ maka terima H0. Yang memiliki arti bahwa tidak terdapat bukti adanya masalah autokorelasi.

6.5 KOrelasi

> cor(TAPUT) %>% round(3)
                           Pendapatan Pertanian  Jasa
Pendapatan                      1.000     0.951 0.955
Pertanian                       0.951     1.000 0.995
Jasa                            0.955     0.995 1.000
Perdagangan.Hotel.Restoran      0.927     0.991 0.991
                           Perdagangan.Hotel.Restoran
Pendapatan                                      0.927
Pertanian                                       0.991
Jasa                                            0.991
Perdagangan.Hotel.Restoran                      1.000
> TAPUT %>% ggpairs(progress = F )

#Kesimpulan Baik dengan mengunakan cara manual dan pengunaan fungsi built in Lm pada software R tetap menghasilkan hasil analisis yang sama. Karena adanya pelanggaran pada uji nonmultikolineritas sehingga model yang regresi belum layak digunakan untuk meramalkan kenaikan pendapatan.

7 Daftar Pustaka

Lamsihar Df Pakpahan, dkk (2013).Penggunaan Metode Stepwise Forward untuk menentukan persamaan regresi liener berganda (Studi Kasus : Jumlah Pendapatan di tapanuli utara) Jammer R. Lawendatu, dkk. Reresi Linier Berganda Untuk Menganalisis Pendapatan Petani Cicih Ratna sari dan Siti Nurjannah (2019) PENGARUH HARGA DAN KUALITAS PRODUK TERHADAP KEPUTUSAN PEMBELIAN MIE INSTAN MEREK MIE SEDAAP SERTA IMPLIKASINYA TERHADAP LOYALITAS PELANGGAN DI PERUMAHAN PEKAYON BEKASI SELATAN

Analisis Regresi Linier Berganda Menggunakan Software R

Widya Sri Wahyuni Lubis

Mei 2022