1 PENDAHULUAN
1.1 Latar Belakang
Analisis regresi adalah suatu teknik statistika untuk pemeriksaan dan pemodelan hubungan antar variabel. Analisis ini terdiri atas dua komponen yang dihubungkan, yakni variabel tak bebas/ response(Y) yaitu variabel yang keberadaannya dipengaruhi oleh variabel lainnya dan variabel bebas/ predictor (X) yaitu variabel yang tidak dipengaruhi oleh variabel lainnya.
Analisis regresi dapat digunakan di beberapa bidang, antara lain: bidang industri, teknik, manajemen, ekonomi, dan lain sebagainya. Fungsi utama model regresi ditujukan untuk:
* Membuat estimasi rata-rata dan nilai variabel tergantung dengan didasarkan nilai variabel bebas
* Menguji hipotesis karakteristik dependensi.
* Meramalkan nilai rata-rata variabel bebas yang didasari nilai variabel bebas diluar jangkauan sample.
Dalam analisis regreis perlu diperhatikan asumsi yang harus dipenuhi.Asumsi yang harus dipernuhi antara lain: asumsi ragam berdistribusi normal, kehomogenan ragam sisaan, tidak terjadi multikolinearitas, dan tidak autokorelasi.
1.2 Tinjauan Pustaka
1.2.1 Analisis Regresi Linier
Analisis regresi dibagi menjadi 2 yaitu Analisis regresi linier sederhana dan Analisis regresi linier Berganda
a) Analisis regresi linier sederhana
adalah salah satu metode statistika yang digunakan untuk menjelaskan adanya hubungan antara satu variabel bebas (independent) dengan satu variabel respon (dependent), dimana hubungan yang terjadi antara kedua variabel dianggap bersifat linier.
\[ Y=\beta_{0}+\beta_{1}X \] Keterangan:
\(Y\) = Variabel terikat (Respons)
\(X\) = Variabel bebas (Prediktor)
\(\beta_{0}\) = Parameter Intersep
\(\beta_{1}\) = Koefisien Regresi
b) Analisis regresi linier Berganda
Merupakan model persamaan yang menjelaskan hubungan satu variabel tak bebas(Y) dengan dua atau lebih variabel bebas(X1,X2,…,Xn) yang bertujuan untuk mengetahui bagaimanakah arah hubungan variabel tak bebas dengan variabel- variabel bebasnya.
\[ Y=\beta_{0}+\beta_{1}X_{1}+...+\beta_{n}X_{n} \] Keterangan:
\(Y\) = Variabel Respons
\(X_{1},...,X_{n}\) = Variabel Prediktor
\(\beta_{0},...,\beta_{n}\) = Koefisien regresi
1.2.2 Pengujian Asumsi Analisis
Uji asumsi terhadap model regresi linier dilakukan agar dapat mengethaui apakah model regresi baik atau tidak.Tujuan pengujian asumsi untuk memberikan kepastian bahwa persamaan regresi yang diperoleh memiliki ketepatan dalam estimasi, tidak bias, dan konsisten.
1.2.3 Asumsi Normalitas
\(Ho\): Galat berdistribusi normal (Asumsi normalitas terpenuhi)
\(H1\): Galat tidak berdistribusi normal (Asumsi normalitas tidak terpenuhi)
Uji asumsi normalitas adalah analisis regresi yang mengacu padaasumsi bahwa galat (error) model regresi harus berdistribusi normal. Asumsi ini harus terpenuhi agar hasil estimasi model menjadi valid. Uji statistik dapat menggunakan uji Jarque-Berra atau uji Shapiro-Wilk bagi sampel kecil dan uji Kolmogorov-Smirnov bagi sampel besar. Apabila p-value uji lebih besar dari tingkat signifikasi yang ditentukan, maka asumsi normalitas terpenuhi.
1.2.4 Asumsi Homoskedastisitas
\(Ho : \sigma_i^2=\sigma_j^2, i ≠ j\) (Asumsi homoskedastisitas terpenuhi)
\(Ho : \sigma_i^2≠\sigma_j^2, i ≠ j\) (Asumsi homoskedastisitas tidak terpenuhi)
Uji asumsi homoskedastisitas bertujuan untuk menguji apakah dalam model regresi terjadi kesamaan varian pada residual dari suatu pengamatan ke pengamatan lain. Jika varians dari satu pengamatan ke pengamatan lain tetap, maka disebut homoskedastisitas dan jika terjadi varians berbeda maka disebut heteroskedastisitas. Model regresi yang baik adalah model yang homoskedastisitas. JIka terjadi heteroskedastisitas maka hal itu akan mempengaruhi nilai dari analisis data tersebut karenakan terdapat perbedaan yang varian menunjukkan data tersebut masih belum sama atau homogen.
1.2.5 Asumsi Non-Autokorelasi
\(Ho\): Tidak terjadi autokorelasi
\(H1\): Terjadi autokorelasi
Asumsi non-autokorelasi mengacu pada ada atau tidaknya korelasi antara galat (error) ) model regresi pada waktu yang berbeda. Uji statistik dapat menggunakan uji Durbin-Watson. Apabila p-value uji lebih besar dari tingkat signifikasi yang ditentukan, maka asumsi non-autokorelasi terpenuhi.
1.2.6 Asumsi Non Multikolinieritas
Uji multikolinieritas perlu dilakukan untuk melihat adanya hubungan antar dua variabel bebas. Hasil pemeriksaan harus menunjukkan tidak terdapat multikolinieritas karena multikolinieritas menyebabkan semakin melebarnya nilai confidence interval sehingga menyulitkan pengambilan keputusan statistik terhadap hipotesis nol dan hipotesis alternatif.
Pemeriksaan multikolinieritas dapat dilakukan dengan memeriksa nilai tolerance dan Variance Inflating Factor (VIF).
\(TOL_j= \frac{1}{VIF_i}\)
\(VIF_j= \frac{1}{1-R^2}\)
\(j= 1,2,3,...,k\)
Kriteria pemeriksaan, terjadi multikolinieritas apabila:
\(TOL < 0.1\) dan \(VIF > 10\)
1.2.7 Uji F
Uji F dalam uji regresi adalah metode statistik yang digunakan untuk menentukan apakah variabel independen secara bersama-sama (stimultan) mempengaruhi variabel dependen. Uji F dilakukan untuk melihat pengaruh dari seluruh variabel bebas seccara bersama-sama terhadap variabel terikat. Tingkatan yang digunakan adalah sebesar 0.5 atau 5%, jika nilai signifikan F<0.05 maka dapat diartikan bahwa variabel independent secara simultan mempengaruhi variabel dependen ataupun sebaliknya. Adapun ketentuan dari uji F yaitu sebagai berikut:
Jika nilai signifikan F < 0.05, maka tolak \(Ho\) dan terima \(H1\). Artinya semua variabel independent memiliki pengaruh secara signifikan terhadap variabel dependen.
Jika nilai signifikan F > 0.05, maka terima \(Ho\) dan tolak \(H1\). Artinya semua variabel independent tidak memiliki pengaruh secara signifikan terhadap variabel dependen.
1.3 Data
Berikut merupakan data yang akan digunakan untuk analisis regresi linier yaitu analisis linier berganda dalam suatu penelitian dipilih 10 keluarga secara acak, diperoleh data pengeluaran kebutuhan pokok per minggu (Y), pendapatan per minggu (X1), dan jumlah anggota keluarga (X2) sebagai berikut.
| Y (Ratusan Rupiah) | X1 (Ribuan Rupiah) | X2 (Orang) |
|---|---|---|
| 23 | 10 | 7 |
| 7 | 2 | 3 |
| 15 | 4 | 2 |
| 17 | 6 | 4 |
| 23 | 8 | 6 |
| 22 | 7 | 5 |
| 10 | 4 | 3 |
| 14 | 6 | 3 |
| 20 | 7 | 4 |
| 19 | 6 | 3 |
Sumber: https://ss.mipa.ub.ac.id/regresi-linear-berganda-kasus-penerapannya/
1.4 Tujuan
Analisis regresi linier berganda ini bertujuan untuk mengetahui ada atau tidaknya pengaruh yang signifikan dari variabel Pendapatan Per Minggu dan Jumlah Anggota Keluarga terhadap variabel Kebutuhan Pokok Perminggu. Hal ini dapat membantu dalam mengetahui apa saja faktor yang paling berpengaruh terhadap pengeluaran kebutuhan pokok.
2 SOURCE CODE
2.2 Impor Data
> Kebutuhan_Pokok<-c(23,7,15,17,23,22,10,14,20,19)
> Pendapatan <-c(10,2,4,6,8,7,4,6,7,6)
> Jumlah_Keluarga <-c(7,3,2,4,6,5,3,3,4,3)
> datareg<-data.frame(X1=Pendapatan,X2=Jumlah_Keluarga,Y=Kebutuhan_Pokok)
> str(datareg)
'data.frame': 10 obs. of 3 variables:
$ X1: num 10 2 4 6 8 7 4 6 7 6
$ X2: num 7 3 2 4 6 5 3 3 4 3
$ Y : num 23 7 15 17 23 22 10 14 20 19
> head(datareg)
X1 X2 Y
1 10 7 23
2 2 3 7
3 4 2 15
4 6 4 17
5 8 6 23
6 7 5 222.3 Statistika Deskriptif
2.4 Plot
> plot(Kebutuhan_Pokok~Pendapatan,datareg=datareg, xlab ="Pendapatan",ylab ="Kebutuhan_Pokok",main ="Hubungan antara Pendapatan dengan Kebutuhan Pokok")> plot(Kebutuhan_Pokok~Jumlah_Keluarga,datareg=datareg, xlab ="Jumlah_Keluarga",ylab ="Kebutuhan_Pokok",main ="Hubungan antara Pendapatan dengan Kebutuhan Pokok")2.5 Analisis Regresi
> reg <- lm(Y~X1+X2,data=datareg)
> summary(reg)
Call:
lm(formula = Y ~ X1 + X2, data = datareg)
Residuals:
Min 1Q Median 3Q Max
-3.4664 -1.9885 0.2544 1.8463 2.9753
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 3.9187 2.4178 1.621 0.14909
X1 2.4912 0.7029 3.544 0.00942 **
X2 -0.4664 1.0164 -0.459 0.66021
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 2.521 on 7 degrees of freedom
Multiple R-squared: 0.8364, Adjusted R-squared: 0.7897
F-statistic: 17.9 on 2 and 7 DF, p-value: 0.001769Keterangan :
\(Y\) = Pengeluaran Kebutuhan Pokok Perminggu
\(X_{1}\) = Pendapatan Perminggu
\(X_{2}\) = Jumlah Anggota Keluarga
2.6 Asumsi
> #Asumsi Normalitas
> sisareg<-residuals(reg)
> jarque.bera.test(sisareg)
Jarque Bera Test
data: sisareg
X-squared = 0.82178, df = 2, p-value = 0.6631
> shapiro.test(sisareg)
Shapiro-Wilk normality test
data: sisareg
W = 0.93072, p-value = 0.455
> #Asumsi Homoskedastisitas
> bptest(reg)
studentized Breusch-Pagan test
data: reg
BP = 1.0243, df = 2, p-value = 0.5992
> #Asumsi NonAutokorelasi
> dwtest(reg)
Durbin-Watson test
data: reg
DW = 1.516, p-value = 0.1833
alternative hypothesis: true autocorrelation is greater than 0
> #Asumsi Nonmultikolinieritas
> vif(reg)
X1 X2
3.575972 3.575972 3 HASIL DAN PEMBAHASAN
3.1 Analisis Regresi Berganda
> reg <- lm(Y~X1+X2,data=datareg)
> summary(reg)
Call:
lm(formula = Y ~ X1 + X2, data = datareg)
Residuals:
Min 1Q Median 3Q Max
-3.4664 -1.9885 0.2544 1.8463 2.9753
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 3.9187 2.4178 1.621 0.14909
X1 2.4912 0.7029 3.544 0.00942 **
X2 -0.4664 1.0164 -0.459 0.66021
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 2.521 on 7 degrees of freedom
Multiple R-squared: 0.8364, Adjusted R-squared: 0.7897
F-statistic: 17.9 on 2 and 7 DF, p-value: 0.001769Dari analisis regresi,diperoleh \(\beta_0=3.9187,\beta_1=2.4912, \beta_2=-0.4664\), sehingga persamaan regresinya adalah \(Y=3.9187+2.4912X_1-0.4664X_2\)
dimana,
\(Y\) = Pengeluaran Kebutuhan Pokok Perminggu
\(X_{1}\) = Pendapatan Perminggu
\(X_{2}\) = Jumlah Anggota Keluarga
Interpretasi:
Koefisien \(\beta_0=3.9187\) adalah intersep, hal ini menunjukkan bahwa nilai Pengeluaran Kebutuhan Pokok Perminggu ketika nilai Pendapatan Perminggu (\(X_{1}\)) dan Jumlah Anggota Keluarga (\(X_{2}\)) adalah nol. Maka ketika tidak ada Pendapatan dan Jumlah Anggota Keluarga maka pengeluaran kebutuhan pokok memiliki nilai sebesar 3.9187 (Ratusan Rupiah).
Nilai koefisien \(\beta_1=2.4912\) adalah koefisien untuk Pendapatan Perminggu (\(X_{1}\)). Ini menunjukkan seberapa banyak Pengeluaran Kebutuhan Pokok Perminggu meningkat saat Pendapatan Perminggu meningkat 1 satuan.
Nilai koefisien \(\beta_2=-0.4664\) adalah koefisien untuk Jumlah Anggota Keluarga (\(X_{2}\)). Ini menunjukkan seberapa banyak Pengeluaran Kebutuhan Pokok Perminggu menurun saat Jumlah Anggota Keluarga meningkat 1 satuan, dengan mengabaikan efek dari Pendapatan Perminggu.
3.2 Uji F
3.2.1 Hipotesis
- Hipotesis yang diuji:
\(H_0\): \(\beta_0=\beta_1=\beta_2=0\) (Tidak terdapat pengaruh terhadap Pengeluaran Kebutuhan Pokok Perminggu)
\(H_1\): \(\beta_k≠0\) (Terdapat pengaruh Pendapatan Perminggu dan Jumlah Anggota Keluarga dengan Pengeluaran Kebutuhan Pokok Perminggu)
- Hipotesis bagi variabel \(X_{1}\) \(H_0\):
\(\beta_1=0\) (Pendapatan Perminggu secara parsial tidak berpengaruh terhadap Pengeluaran Kebutuhan Pokok Perminggu)
\(H_1\): \(\beta_1≠0\) (Pendapatan Perminggu secara parsial berpengaruh terhadap Pengeluaran Kebutuhan Pokok Perminggu)
- Hipotesis bagi variabel \(X_{2}\)
\(H_0\): \(\beta_2=0\) (Jumlah Anggota Keluarga secara parsial tidak berpengaruh terhadap Pengeluaran Kebutuhan Pokok Perminggu)
\(H_1\): \(\beta_2≠0\) (Jumlah Anggota Keluarga secara parsial berpengaruh terhadap Pengeluaran Kebutuhan Pokok Perminggu)
3.2.2 Statistik Uji F
> summary(reg)
Call:
lm(formula = Y ~ X1 + X2, data = datareg)
Residuals:
Min 1Q Median 3Q Max
-3.4664 -1.9885 0.2544 1.8463 2.9753
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 3.9187 2.4178 1.621 0.14909
X1 2.4912 0.7029 3.544 0.00942 **
X2 -0.4664 1.0164 -0.459 0.66021
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 2.521 on 7 degrees of freedom
Multiple R-squared: 0.8364, Adjusted R-squared: 0.7897
F-statistic: 17.9 on 2 and 7 DF, p-value: 0.001769Interpretasi:
Dapat diketahui P-Value pada variabel Pendapatan Perminggu dan Jumlah Anggota Keluarga sebesar 0.001769. Karena P-Value < α(0.05) artinya Tolak Ho, sehingga dapat disimpulkan bahwa Pendapatan Perminggu (\(X_{1}\)) dan Jumlah Anggota Keluarga (\(X_{2}\)) secara bersama-sama berpengaruh terhadap Pengeluaran Kebutuhan Pokok Perminggu (\(Y\)).
P-Value untuk Pendapatan Perminggu sebesar 0.00942. Karena P-Value < α(0.05) artinya Tolak Ho, sehingga dapat disimpulkan bahwa Pendapatan Perminggu (\(X_{1}\)) secara parsial berpengaruh terhadap Pengeluaran Kebutuhan Pokok Perminggu (\(Y\)).
P-Value untuk Jumlah Anggota Keluarga sebesar 0.66021. Karena P-Value > α(0.05) artinya Terima Ho, sehingga dapat disimpulkan bahwa Jumlah Anggota Keluarga (\(X_{2}\)) secara parsial tidak berpengaruh terhadap Pengeluaran Kebutuhan Pokok Perminggu (\(Y\)).
3.3 Uji Asumsi
3.3.1 Asumsi Normalitas
> sisareg<-residuals(reg)
> jarque.bera.test(sisareg)
Jarque Bera Test
data: sisareg
X-squared = 0.82178, df = 2, p-value = 0.6631Hipotesis:
\(Ho\): Galat berdistribusi normal (Asumsi normalitas terpenuhi).
\(H1\): Galat tidak berdistribusi normal (Asumsi normalitas tidak terpenuhi).
Dengan uji jarque bera didapatkan p-value sebesar 0.6631 > α(0.05) sehingga Terima \(Ho\). Maka tidak terbukti ada pelanggaran asumsi normalitas galat pada model Pengeluaran Kebutuhan Pokok Perminggu sebagai fungsi dari Pendapatan Perminggu dan Jumlah Anggota Keluarga.
Dengan uji Shapiro-wilk didapatkan p-value sebesar 0.455 > α(0.05) sehingga Terima \(Ho\). Maka tidak terbukti ada pelanggaran asumsi normalitas galat pada model Pengeluaran Kebutuhan Pokok Perminggu sebagai fungsi dari Pendapatan Perminggu dan Jumlah Anggota Keluarga.
3.3.2 Asumsi Homoskedastisitas
Hipotesis:
\(Ho : \sigma_i^2=\sigma_j^2, i ≠ j\) (Asumsi homoskedastisitas terpenuhi)
\(Ho : \sigma_i^2≠\sigma_j^2, i ≠ j\) (Asumsi homoskedastisitas tidak terpenuhi)
Dengan uji Breusch-Pagan didapatkan p-value sebesar 0.5992 > \(\alpha(0.05)\) sehingga Terima \(Ho\). Maka tidak terbukti ada pelanggaran asumsi homogenitas ragam galat pada model Pengeluaran Kebutuhan Pokok Perminggu sebagai fungsi dari Pendapatan Perminggu dan Jumlah Anggota Keluarga.
3.3.3 Asumsi NonAutokorelasi
> dwtest(reg)
Durbin-Watson test
data: reg
DW = 1.516, p-value = 0.1833
alternative hypothesis: true autocorrelation is greater than 0Hipotesis:
\(Ho\): Tidak terjadi autokorelasi.
\(H1\): Terjadi autokorelasi.
Dengan uji durbin-watson didaptakan p-value sebesar 0.183 > α(0.05) sehingga Terima \(Ho\). Maka tidak terbukti ada masalah autokorelasi pada model Pengeluaran Kebutuhan Pokok Perminggu sebagai fungsi dari Pendapatan Perminggu dan Jumlah Anggota Keluarga.
3.3.4 Asumsi Nonmultikolinieritas
Hipotesis:
\(Ho\): Tidak terdapat Multikolinieritas.
\(H1\): Terdapat Multikolinieritas.
Nilai VIF masing-masing variabel antara lain, X1= 3.575972 dan X2= 3.575972. Karena nilai VIF keduanya < 10, maka sudah cukup bukti bahwa data tidak terdapat multikolinieritas.
4 KESIMPULAN
Dari pengujian yang telah dilakukan kepada 10 keluarga secara acak, dapat disimpulkan bahwa Pendapatan Perminggu dan Jumlah Anggota Keluarga secara bersama-sama berpengaruh terhadap Pengeluaran Kebutuhan Pokok Perminggu. Namun jika pada masing masing variabel,pada variabel Pendapatan Perminggu secara signifikan berpengaruh terhadap Pengeluaran Kebutuhan Pokok Perminggu sedangkan pada variabel Jumlah Anggota Keluarga secara signifikan tidak berpengaruh terhadap Pengeluaran Kebutuhan Pokok Perminggu.
Berdasarkan uji asumsi, didapatkan informasi bahwa tidak terdapat pelanggaran asumsi normalitas, tidak terdapat pelanggaran homogenitas, tidak ada masalah autokorelasi, dan tidak terdapat multikolinieritas. Sehingga dapat disimpulkan bahwa model tersebut merupakan model regresi yang baik karena telah memenuhi semua asumsi yang ada.
5 DAFTAR PUSTAKA
- Susanti, D.S., Sukmawaty,Y.,& Salam,N.(2019). Analisis Regresi Dan Korelasi. Malang: CV IRDH.
- Made Susilawati.(2003). Modul Analisis Regresi.
- Efendi, A., Wardhani, N. W. S., Fitriani, R., & Sumarminingsih, E. (2020). Analisis Regresi: Teori dan Aplikasi dalam R. Malang: Universitas Brawijaya Press.
- Kurniawan,R.,& Yuniarto,B.(2016). Analisis Regresi.Jakarta: Kencana .