Regresi Linear Berganda dan Pengujian Asumsi

Rahma Faizzatun Nafidah

2024-05-29


> # install.packages("knitr")
> library(knitr)
> # install.packages("rmarkdown")
> library(rmarkdown)
> # install.packages("prettydoc")
> library(prettydoc)
> # install.packages("equatiomatic")
> library(equatiomatic)

1 Pendahuluan

1.1 Analisis Regresi

Analisis regresi adalah teknik Statistik yang digunakan untuk mengevaluasi hubungan satu atau lebih variabel independen X1, X2, …, Xk dan variabel dependen kontinu Y.Dalam analisis regresi, model regresi digunakan untuk menggambarkan hubungan matematis antara variabel independen dan variabel dependen. Model ini dapat digunakan untuk melakukan prediksi dan juga untuk mengidentifikasi hubungan yang signifikan antara variabel-variabel tersebut. Regresi linier dikategorikan berdasarkan banyaknya variabel bebas atau prediktor apabila hanya terdapat 1 variabel bebas atau prediktor maka disebut sebagai regresi linier sederhana sedangkan jika terdapat dua atau lebih variabel bebas atau prediktor disebut sebagai regresi linier berganda.

Analisis regresi berganda adalah sebuah metode statistik yang digunakan untuk memodelkan hubungan antara satu variabel dependen (variabel respons) dengan dua atau lebih variabel independen (variabel prediktor). Tujuan dari analisis regresi berganda adalah untuk menentukan sejauh mana variabel-variabel prediktor tersebut berkontribusi terhadap variasi variabel respons. Persamaan regresi linier berganda secara matematik diekspresikan oleh :

\[Y=β0+β1X1+β2X2+...+βnXn\]

Keterangan:

Y = Variabel dependen (variabel terikat)

β0= Konstanta

β1= Koefisien regresi untuk X1

β2= Koefisien regresi untuk X2

βn= Koefisien regresi untuk Xn

X1= Variabel prediktor pertama

X2= Variabel prediktor kedua

Xn= Variabel prediktor ke-n

1.2 Asumsi Analisis Regresi

Menurut imam Ghozali (2011),Uji asumsi klasik terhadap model regresi linier dilakukan agar dapat diketahui apakah model regresi baik atau tidak. Pengujian ini dilakukan dengan tujuan untuk memberikan kepastian bahwa persamaan regresi yang diperoleh memiliki ketepatan estimasi, tidak bias, dan konsisten. Maka dari itu, sebelum melakukan analisis regresi ada beberapa asumsi yang harus dipenuhi antara lain

  • Asumsi Normalitas

  • Asumsi Homoskedastisitas

  • Asumsi Multikolinearitas

  • Asumsi Non Autokorelasi

1.2.1 1. Asumsi Normalitas

Pengujian asumsi normalitas digunakan untuk menentukan apakah residual yang dihasilkan berdistribusi normal atau tidak. Asumsi ini mengatakan bahwa galat atau kesalahan dalam model berdistribusi normal atau mendekati normal. Asumsi normalitas galat ini menyatakan bahwa residu mengikuti distribusi normal, Agresti dan Finlay (2009) Artinya, galat harus memiliki rata-raa mendekati nol dan varians konstan di semua tingkat variabel independen. Asumsi ini dapat diuji dengan grafik residual maupun uji statistik.

Hipotesis untuk Uji Normalitas adalah sebagai berikut:

H0:Residual berdistribusi normal.

H1: Residual tidak berdistribusi normal

Jika asumsi ini terpenuhi, maka data dapat digunakan untuk pengujian statistik yang bergantung pada distribusi normal seperti analisis regresi. Jika asumsi galat terpenuhi, maka dapat dipercaya bahwa estimasi parameter regresi efisien dan benar

1.2.2 2. Asumsi Homoskedastisitas

Asumsi Homoskedastisitas adalah asumsi yang menyatakan bahwa vaians dari galat dalam permodelan regresi harus konstan di semua tingkat variabel independen. Dalam kata lain tidak boleh ada pola tertentu dalam varians galat terhadap prediktor. Jika asumsi homoskedastisitas terpenuhi, hasil estimasi parameter regresi konsisten dan efisien. Akan tetapi jika asumsi tidak terpenuhi maka akan menyebabkan masalah heteroskedastisitas.

Hipotesis dari asumsi homoskedastisitas yaitu

H0 : Tidak terjadi gejala heteroskedastisitas (homoskedastisitas)

H1 : Terjadi gejala heteroskedastisitas (homoskedastisitas)

1.2.3 3. Asumsi Non Multikolinearitas

Asumsi non-multikolinearitas menyatakan bahwa tidak ada hubungan linier sempurna atau mendekati sempurna antara variabel inedpenden dalam model regresi. Asumsi ini penting dalam analisis regresi berganda. Dalam asumsi ini, multikolinieritas terjadi jika ada korelasi yang tinggi antara dua atau lebih variabel independen dalam model regresi.

Pemeriksaan ini menggunakan perhitungan VIF dengan rincian sebagai berikut : \[ VIF= 1/(1-r_s^2) \] Hipotesis:

H0= Tidak Terdapat Multikolinieritas

H1= Terdapat Multikolinieritas

Kriteria pengambilan keputusan : VIF < 10 maka tidak terdapat multikolinieritas (Terima H0)

1.2.4 4. Asusmsi Non Autokorelasi

Uji autokorelasi bertujuan untuk menentukan apakah ada korelasi antara residual pada periode t dengan residual pada periode sebelumnya dalam model regresi.

Salah satu uji yang digunakan untuk mendeteksi autokorelasi adalah Uji Durbin Watson, dengan kriteria keputusan sebagai berikut:

  • Jika \(d < d_L\) atau \(d > 4 - d_L\), maka terjadi autokorelasi.
  • Jika \(d_U < d < 4 - d_U\), maka tidak terjadi autokorelasi.
  • Jika \(d_L \leq d \leq d_U\) atau \(4 - d_U \leq d \leq 4 - d_L\), maka tidak dapat disimpulkan apakah terjadi autokorelasi atau tidak.

1.3 Uji Simultan (Uji F)

Melalui uji F, kita dapat memperoleh informasi tentang apakah semua variabel penjelas (seluruh prediktor) dalam model memiliki pengaruh secara simultan terhadap variabel respon. Uji simultan ini digunakan untuk mengetahui apakah variabel-variabel independen secara bersama-sama mempengaruhi variabel dependen. Nilai uji F dapat ditemukan dalam output regresi yang dihasilkan oleh SPSS. Jika tingkat signifikansi < 0,05 (tingkat kepercayaan yang dipilih), maka H0 ditolak dan H1 diterima.

1.4 Uji Parsial

Digunakan untuk mengetahui apakah variabel independen secara parsial berpengaruh terhadap variabel dependen. Hipotesis yang digunakan dalam uji parsial adalah sebagai berikut:

H0= variabel independen bukan merupakan penjelas yang signifikan terhadap variabel dependen.

H1= variabel independen merupakan penjelas yang signifikan terhadap variabel dependen.

2 Pengaplikasian Pada Data

Data yang digunakan adalah data Terkait Modal investasi dan pengeluaran iklan terhadap Keuntungan yang didapatkan suatu Perusahaan. Pada analisis ini, akan dilakukan analisis regresi berganda untuk mengetahui pengaruh modal investasi dan pengeluaran iklan terhadap keuntungan perusahaan. Tujuannya adalah untuk mengetahui signifikansi pengaruh dari kedua faktor tersebut terhadap keuntungan perusahaan.

X1 X2 Y
4 25 15
5 1 16
3 6 2
1 30 3
2 29 12
0 20 1
4 12 16
5 15 18
4 6 13
2 16 2

X1 = Modal Investasi X2 = Pengeluaran Iklan Y = Keuntungan Perusahaan

2.1 Menginput Data Yang Digunakan

> Data1<-data.frame (Keuntungan_Perusahaan =c(15,16,2,3,12,1,16,18,13,2),     Modal_Investasi=c(25,1,6,30,29,20,12,15,6,16),
+ Pengeluaran_Iklan=c(4,5,3,1,2,0,4,5,4,2)
+ )
> Data1
   Keuntungan_Perusahaan Modal_Investasi Pengeluaran_Iklan
1                     15              25                 4
2                     16               1                 5
3                      2               6                 3
4                      3              30                 1
5                     12              29                 2
6                      1              20                 0
7                     16              12                 4
8                     18              15                 5
9                     13               6                 4
10                     2              16                 2

2.2 Menampilkan Data

> Data1
   Keuntungan_Perusahaan Modal_Investasi Pengeluaran_Iklan
1                     15              25                 4
2                     16               1                 5
3                      2               6                 3
4                      3              30                 1
5                     12              29                 2
6                      1              20                 0
7                     16              12                 4
8                     18              15                 5
9                     13               6                 4
10                     2              16                 2

2.3 library

> library ("car")
> library ("tseries")
> library ("lmtest")

2.4 Pendefinisian Variabel

> Y <- Data1$'Keuntungan_Perusahaan'
> X1 <- Data1$'Modal_Investasi'
> X2 <- Data1$'Pengeluaran_Iklan'
> Data <- data.frame(X1,X2,Y)
> View(Data)

2.5 Analisis Regresi Berganda

> regresi <-lm(Y~X1+X2, data=Data)
> summary(regresi)

Call:
lm(formula = Y ~ X1 + X2, data = Data)

Residuals:
    Min      1Q  Median      3Q     Max 
-4.8787 -1.9818  0.6553  2.5558  3.3344 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  -8.1770     4.2060  -1.944 0.092967 .  
X1            0.2921     0.1357   2.153 0.068355 .  
X2            4.4343     0.8002   5.541 0.000868 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.303 on 7 degrees of freedom
Multiple R-squared:  0.823, Adjusted R-squared:  0.7725 
F-statistic: 16.28 on 2 and 7 DF,  p-value: 0.002332

2.6 Pengujian Asumsi

> #Uji Normalitas Residual
> sisa<-residuals(regresi)
> jarque.bera.test(sisa)

    Jarque Bera Test

data:  sisa
X-squared = 0.88905, df = 2, p-value = 0.6411
> shapiro.test(sisa)

    Shapiro-Wilk normality test

data:  sisa
W = 0.91226, p-value = 0.2969
  • Function residuals digunakan untuk meng-extract hasil residual atau sisaan dari model pada ahasil regresik yang kemudian disimpan dalam object sisa.
  • saphiro.test, dan jarque.bera.test merupakan function untuk mencari normalitas residual dari data sisa.
> #Uji Homoskedastisitas
> bptest(regresi)

    studentized Breusch-Pagan test

data:  regresi
BP = 3.8779, df = 2, p-value = 0.1439
  • Salah satu pengujian homoskedastisitas merupakan uji breusch pagan yang memiliki function bptest
> #Uji Non Autokorelasi
> dwtest(regresi)

    Durbin-Watson test

data:  regresi
DW = 1.691, p-value = 0.2795
alternative hypothesis: true autocorrelation is greater than 0
  • pada pemeriksaan non autokorelasi, dilakukan dengan uji durbin watson dengan function dwtest
> #Pemeriksaan Multikolinearitas
> car::vif(regresi)
      X1       X2 
1.525837 1.525837 
  • Dalam pemeriksaan multikolinearitas digunakan function car::vif

3 Pembahasan

3.1 Persamaan Regresi

Variabel Pendugaan Parameter
Konstanta -8.1770
Modal Investasi (X1) 0.2921
Pengeluaran Iklan (X2) 4.4343

Diperoleh bentuk persamaan dari hasil analisis regresi berganda diatas yaitu: \[ Ŷ = -8.1770 + 0.2921(X_1)+4.4343(X_2) \] 1. Estimasi Koefisien Regresi

  • Variable independen X1 Memiliki koefisien regresi sebesar 0.2920, yang menunjukkan pengaruh X1 terhadap variabel dependen Y linear.

  • Variabel independen X2 Memiliki koefisien regresi sebesar 4.4343, yang menunjukkan pengaruh X2 terhadap variabel dependen Y linear.

Interpretasi

  • Apabila modal investasi bernilai konstan, maka Setiap peningkatan 1 unit modal investasi akan meningkatkan keuntungan perusahaan sebesar 0.2921

  • Apabila pengeluaran iklan bernilai konstan maka Setiap peningkatan 1 unit pengeluaran iklan akan meningkatan keuntungan perusahaan sebesar 4.4343

  • Apabila modal investasi dan pengeluaran iklan bernilai 0, maka keuntungan perusahaan sebesar -8.1770

3.2 Uji Asumsi

Uji Asumsi P-Value
Normalitas (Jarque) 0.6411
Normalitas (Shapiro) 0.2969
Homoskedastitas 0.1439
Non Autokorelasi 0.2795
Multikoliniearitas Nilai VIF
Modal investasi (X1) 1.525837
Pengeluaran iklan(X2) 1.525837

Interpretasi :

  1. Uji Normalitas Residual

    H0 : Residual berdistribusi normal

    H1 : Residual tidak berdistribusi normal

    Keputusan : Jarque P-Value (0.6411) > α (0.05) maka keputusan H0 diterima.

    Interpretasi : Dapat disimpulkan bahwa residual berdistribusi normal

  2. Uji Normalitas Residual Shapiro

    H0 : Residual berdistribusi normal

    H1 : Residual tidak berdistribusi normal

    Keputusan : P-Value (0.2969) > α (0.05) maka keputusan H0 diterima.

    Interpretasi : Dapat disimpulkan bahwa residual berdistribusi normal

  1. Uji Homoskedastisitas

    H0: Variansi galat bersifat homoskedastisitas

    H1: Variansi galat bersifat heteroskedastisitas

    Keputusan : P-Value (0.1439) > α (0.05) maka keputusan H0 diterima.

    Interpretasi : Dapat disimpulkan bahwa residual bersifat homoskedastisitas

  2. Uji Non Autokorelasi

    H0: Tidak terjadi autokorelasi

    H1: Terjadi autokorelasi

    Keputusan : P-Value (0.2795) > α (0.05) maka keputusan H0 diterima.

    Interpretasi : Dapat disimpulkan bahwa tidak terjadi autokorelasi sehingga asumsi sudah terpenuhi.

  3. Pendeteksian Multikolinieritas

    Keputusan :

    Karena nilai VIF < 10, maka asumsi non-multikolinieritas sudah terpenuhi

3.3 Uji Hipotesis

  • Uji Simultan Hipotesis:

    H0 : β0 = β1 = β2 = 0

    H1 : minimal terdapat β dimana βi ≠ 0,i = 0,1,2

    Keputusan : P-Value (0.002332) < α (0.05) maka keputusan H0 ditolak.

    Interpretasi : Dapat disimpulkan bahwa Modal investasi dan pengeluaran iklan berpengaruh signifikan terhadap keuntungan perusahaan

  • Uji Parsial

    Hipotesis:

    H0 : βi = 0

    H1 : βi ≠ 0

    Keputusan :

  • P-Value Variabel modal investasi (0.068355) > α (0.05) maka keputusan H0 diterima. Dapat disimpulkan bahwa peningkatan atau penurunan modal investasi tidak memiliki dampak yang signifikan terhadap keuntungan perusahaan

  • P-Value Variabel pengeluaran iklan (0.000868) < α (0.05) maka keputusan H0 ditolak. Dapat disimpulkan bahwa peningkatan atau penurunan pengeluaran iklan memiliki dampak yang signifikan terhadap keuntungan perusahaan

4 Daftar Pustaka

Agresti, A., & Finlay, B. 2009. Statistical Methods for the Social Sciences (4th ed.). Pearson.

Douglas C. Montgomery, Elizabeth A. Peck, dan G. Geoffrey Vining., Introduction to Linear Regression Analysis

Ghozali, Imam. 2018. Aplikasi Analisis Multivariate Dengan Program IBM SPSS 25 Semarang: Universitas Dipenogoro

Kutner, M. H., Nachtsheim, C. J., Neter, J., & Li, W. (2004). Applied Linear Statistical Models (5th ed.). McGraw-Hill.