Library:
> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")1 PENDAHULUAN
1.1 Latar Belakang
Di masa sekarang ini kemiskinan adalah salah satu masalah besar untuk banyak daerah. Besarnya pengeluaran daripada pendapatan yang didapat adalah salah satu faktor hal itu terjadi. Sebuah keluarga atau seseorang dapat dikategorikan miskin apabila tidak dapat memenuhi kebutuhan pokok yang paling minimalnya (Suryawati, 2005). Dalam hal ini, pembelian barang-barang tahan lama termasuk kebutuhan pokok paling minimal yang secara tidak langsung juga bisa mengukur tingkat kemiskinan suatu keluarga.
Jika kita dapat mengontrol dan menyeimbangkan antara pengeluaran untuk pembelian barang, pendapatan, dan jumlah anggota dari rumah tangga maka terdapat kemungkinan bahwa angka kemiskinan akan menurun. Di sisi lain, semakin besar angka kemiskinan maka ada kemungkinan yang cukup besar angka kriminalitas dari suatu daerah akan ikut menaik. Ketika seseorang tidak bisa memenuhi kebutuhan hidupnya, maka satu-satu cara yang memungkinkan adalah melakukan tindak kriminalitas. Oleh karena itu, penting untuk mengontrol tingkat kemiskinan dari suatu daerah.
1.2 Regresi Linier Berganda
Mona (dalam Sulistyono & Sulistiyowati, 2018) menyatakan bahwa metode regresi linier berganda adalah metode analisis yang digunakan untuk menjelaskan hubungan antara dua peubah atau lebih khususnya yang diantara peubah-peubah memiliki hubungan sebab-akibat.
Model regresi linier berganda:
\[ \hat{Y}=\hat{\beta_0} + \hat{\beta_1} X_1 + \hat{\beta_2} X_2 +\cdots+ \hat{\beta_k} X_k \]
1.3 Pemeriksa Sisaan
Pemeriksaan Sisaan (Residuals Diagnostic) biasa diuji menggunakan visualisasi berupa plot. Adapun macam-macam plot yang digunakan adalah sebagai berikut:
Residuals vs Fitted
Plot ini digunakan untuk memeriksa ketepatan model
Q-Q Plot
Plot ini digunakan untuk menguji normalitas sisaan tersebut
Scale-Location
Plot ini digunakan untuk memeriksa kesamaan ragam sisaan tersebut
1.4 Uji Asumsi
1.4.1 Pendeteksian Multikolinieritas
Pendeteksian Multikolinieritas digunakan untuk menguji ada atau tidaknya hubungan linier antar variabel prediktor. Pelanggaran dari asumsi ini disebut sebagai masalah multikolinieritas
Adapun kriteria dari uji ini adalah dengan melihat nilai VIF (Variance Infation Factor), jika nilai VIF > 10 maka terjadi masalah multikolinieritas
1.4.2 Uji Normalitas
Selain menggunakan Q-Q plot, untuk mendeteksi normalitas juga dapat diuji menggunakan salah satu dari uji berikut, yaitu Jarque Berra, Saphiro Wilk, Kolmogorov Smirnov, dll.
Adapun kriteria dari uji ini adalah jika P-Value < α, maka tolak H0 yang menandakan bahwa residual tidak berdistribusi normal. Akan tetapi, jika P-Value > α, maka terima H0 yang menandakan bahwa residual berdistribusi normal.
1.4.3 Uji Homogenitas Ragam Galat
Uji ini dapat diuji dengan Uji Breusch Pagan. Uji homogenitas ragam galat juga bisa disebut sebagai uji Homokedastisitas yang jika terjadi pelanggaran dari asumsi ini disebut heteroskedastisitas.
Adapun kriteria dari uji ini adalah jika P-Value > α, maka terima H0 yang menandakan ragam galat homogen. Akan tetapi, jika P-Value < α, maka tolak H0 yang menandakan ragam galat tidak homogen.
1.4.4 Uji Non Autokorelasi
Uji Non Autokorelasi adalah uji untuk mendeteksi asumsi kebebasan antar galat yang jika terjadi pelanggaran pada asumsi ini disebut sebagai masalah autokorelasi.
Adapun kriteria dari uji ini adalah jika P-Value > α, maka terima H0 yang menandakan ragam galat independen. Akan tetapi, jika P-Value < α, maka tolak H0 yang menandakan ragam galat tidak independen.
1.5 Uji Hipotesis
1.5.1 Uji Simultan
Uji ini digunakan untuk melihat pengaruh variabel prediktor (X1, X2, …, Xk) secara bersamaan terhadap variabel respon (Y)
Adapun kriteria dari uji ini adalah jika P-Value > α, maka terima H0 yang menandakan secara simultan variabel prediktor (X) berpengaruh terhadap variabel respon (Y). Akan tetapi, jika P-Value < α, maka tolak H0 yang menandakan bahwa secara simultan variabel prediktor (X) tidak berpengaruh terhadap variabel respon (Y)
1.5.2 Uji Parsial
Uji ini digunakan untuk melihat pengaruh variabel prediktor (X1, X2, …, Xk) secara individu terhadap variabel respon (Y)
Adapun kriteria dari uji ini adalah jika P-Value > α, maka terima H0 yang menandakan secara parsial variabel prediktor (X) berpengaruh terhadap variabel respon (Y). Akan tetapi, jika P-Value < α, maka tolak H0 yang menandakan bahwa secara parsial variabel prediktor (X) tidak berpengaruh terhadap variabel respon (Y)
1.6 Koefisien Determinasi
Koefisien determinasi merupakan ukuran untuk melihat besar kontribusi variabel prediktor (X) terhadap variabel respon (Y). Adapun rumus untuk menguji koefisien determinasi adalah sebagai berikut:
\[ R^{2}=\frac{JKR}{JKT} \]
1.7 Data
Data yang digunakan pada pemodelan ini merupakan data dari 10 rumah tangga yang dipilih secara acak dan dari 10 rumah tangga tersebut diperoleh data pengeluaran untuk pembelian barang-barang tahan lama per minggu (Y), pendapatan per minggu (X1), dan jumlah anggota rumah tangga (X2).
2 SOURCE CODE
2.1 Library yang Dibutuhkan
> # Library
> library(lmtest)
> library(car)
> library(tseries)2.2 Mengimport Data
> d <- file.path("D:","sem 4","komstat","Data Rumah Tangga.csv")
> Data_Rumah_Tangga = read.csv (d,header=TRUE)Untuk mengimport data berformat CSV dapat digunakan perintah file path dan read.csv. Pada perintah file path digunakan untuk mencari letak data yang akan kita import yang disimpan dalam obyek d. Kemudian, gunakan perintah read.csv untuk membaca data yang berformat csv tadi dan simpan dalam Data_Rumah_Tangga.
2.3 Menampilkan Data
> Data_Rumah_Tangga
Y X1 X2
1 23 10 7
2 7 2 3
3 15 4 2
4 17 6 4
5 23 8 6
6 22 7 5
7 10 4 3
8 14 6 3
9 20 7 4
10 19 6 3Untuk melihat data yang sudah kita import tadi, panggil data tersebut dengan menggunakan nama obyek yang kita gunakan untuk menyimpan perintah read.csv tadi.
2.4 Pendefinisian Vektor
> Y <- Data_Rumah_Tangga$Y
> X1 <- Data_Rumah_Tangga$X1
> X2 <- Data_Rumah_Tangga$X2Definisikan tiap variabel agar mudah digunakan pada saat melakukan analisis.
2.5 Membuat Data Frame
> df <- data.frame(X1, X2, Y)Simpan seluruh vektor tadi dalam data frame dengan obyek df.
2.6 Analisis Regresi Berganda
> reg <- lm(Y~X1+X2, data=df)Untuk melakukan Analisis Regresi Berganda dapat digunakan fungsi lm. Kemudian masukkan ketiga variabel yang sebelumnya sudah kita simpan sebagai vektor Y, X1, dan X2 yang berasal dari data frame. Setelah itu, simpan dalam obyek reg untuk memudahkan.
2.7 Summary dari Hasil Analisis
> summary(reg)
Call:
lm(formula = Y ~ X1 + X2, data = df)
Residuals:
Min 1Q Median 3Q Max
-3.4664 -1.9885 0.2544 1.8463 2.9753
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 3.9187 2.4178 1.621 0.14909
X1 2.4912 0.7029 3.544 0.00942 **
X2 -0.4664 1.0164 -0.459 0.66021
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 2.521 on 7 degrees of freedom
Multiple R-squared: 0.8364, Adjusted R-squared: 0.7897
F-statistic: 17.9 on 2 and 7 DF, p-value: 0.001769Untuk melihat hasil analisis dengan fungsi lm yang sebelumnya disimpan dalam obyek reg, dapat digunakan fungsi summary untuk melihat kesimpulan dari fungsi yang sudah disimpan dalam obyek reg tersebut.
2.8 Plot untuk Melihat Sisaan
> par(mfrow=c(2,2))
> plot(reg, 1)
> plot(reg, 2)
> plot(reg, 3)Untuk melihat sisaan sebelum masuk ke dalam uji asumsi, digunakan 3 plot yaitu Residuals vs Fitted, Normal Q-Q, dan Scale-Location untuk membuktikan asumsi sebelum dianalisis lebih lanjut.
2.9 Uji Asumsi
2.9.1 Pendeteksian Multikolinieritas
> vif(reg)
X1 X2
3.575972 3.575972 Fungsi vif yang berasal dari packages car digunakan untuk melakukan pendeteksian multikolinieritas.
2.9.2 Uji Normalitas Residual
> sisa <- residuals(reg)
> jarque.bera.test(sisa)
Jarque Bera Test
data: sisa
X-squared = 0.82178, df = 2, p-value = 0.6631
> shapiro.test(sisa)
Shapiro-Wilk normality test
data: sisa
W = 0.93072, p-value = 0.455Sebelum melakukan uji normalitas residual, dilakukan perhitungan residual terlebih dahulu yang disimpan dalam obyek sisa. Kemudian, untuk melakukan uji normalitas residual digunakan 2 uji tes, yaitu jarque bera dan shapiro wilk dengan fungsi jarque.bera.test dan shhapiro.test yang berasal dari packages tseries.
2.9.3 Uji Homogenitas Ragam Galat
> bptest(reg)
studentized Breusch-Pagan test
data: reg
BP = 1.0243, df = 2, p-value = 0.5992Untuk melakukan uji homogenitas ragam galat, digunakan fungsi bptest yang berasal dari packages lmtest yang dalam hal ini bp sendiri adalah singkatan dari Breusch Pagan.
2.9.4 Uji Non Autokorelasi Galat
> dwtest(reg)
Durbin-Watson test
data: reg
DW = 1.516, p-value = 0.1833
alternative hypothesis: true autocorrelation is greater than 0Untuk menguji non autokorelasi galat, digunakan uji Durbin Watson dengan fungsi dwtest untuk mengetahui apakah terdapat autokorelasi atau tidak.
3 HASIL DAN PEMBAHASAN
3.1 Analisis Regresi
| Variabel | Pendugaan Parameter |
|---|---|
| Pengeluaran | 3.9187 |
| Pendapatan | 2.4912 |
| Anggota | -0.4664 |
Berdasarkan tabel di atas, maka persamaan regresi linier berganda yang terbentuk adalah sebagai berikut:
\[ Ŷ = 3.9187 + 2.4912(X_1) - 0.4664(X_2) \] Interpretasi:
- Apabila pendapatan bernilai konstan, maka setiap peningkatan 1% jumlah anggota rumah tangga akan menaikkan pengeluaran untuk pembelian barang tahan lama sebesar 2.49%
- Apabila jumlah anggota rumah tangga bernilai konstan, maka setiap peningkatan 1% pendapatan akan menurunkan pengeluaran untuk pembelian barang tahan lama sebesar 0.47%
- Apabila pendapatan dan jumlah anggota rumah tangga bernilai 0, maka pengeluaran untuk pembelian barang tahan lama sebesar 3.9187
3.2 Plot Sisaan
Plot 1
Tidak terbentuk pola tertentu maka asumsi linearitas terpenuhi.
Plot 2
Tidak terlihat adanya pelanggaran normalitas dikarenakan sebaran plot mendekati model (garis lurus).
Plot 3
Penyebaran titik-titik data tidak mengumpul hanya di atas atau di bawah saja, maka dapat disimpulkan tidak terdapat gejala heteroskedastisitas.
3.3 Uji Asumsi
| Multikolinieritas | Nilai |
|---|---|
| Pendapatan | 3.575972 |
| Anggota | 3.575972 |
| Asumsi | P-Value |
|---|---|
| Normalitas (Jarque Bera) | 0.6631 |
| Normalitas (Saphiro) | 0.455 |
| Homogenitas | 0.5992 |
| Non Autokorelasi | 0.1833 |
Interpretasi:
Uji Normalitas Residual Jarque Bera
Hipotesis:
H0 : Residual berdistribusi normal
H1 : Residual tidak berdistribusi normal
P-Value (0.6631) > α (0.05) maka keputusan H0 diterima.
Maka dapat disimpulkan dengan taraf nyata 5% bahwa residual berdistribusi normal.
Uji Normalitas Residual Shapiro Wilk
Hipotesis:
H0 : Residual berdistribusi normal
H1 : Residual tidak berdistribusi normal
P-Value (0.455) > α (0.05) maka keputusan H0 diterima.
Maka dapat disimpulkan dengan taraf nyata 5% bahwa residual berdistribusi normal.
Uji Homogenitas
Hipotesis:
H0 : Ragam galat homogen
H1 : Ragam galat tidak homogen
P-Value (0.5992) > α (0.05) maka keputusan H0 diterima.
Maka dapat disimpulkan dengan taraf nyata 5% bahwa ragam galat homogen.
Uji Non Autokorelasi
Hipotesis:
H0 : Ragam galat independent
H1 : Ragam galat tidak independent
P-Value (0,1833) > α (0.05) maka keputusan H0 diterima.
Maka dapat disimpulkan dengan taraf nyata 5% bahwa ragam galat independent dan dapat dikatakan asumsi non autokorelasi antar data model regresi terpenuhi.
Pendeteksian Multikolinieritas
Karena nilai VIF < 10, maka asumsi non-multikolinieritas sudah terpenuhi.
3.4 Uji Hipotesis
Uji Simultan
Hipotesis:
H0 : β0 = β1 = β2 = 0
H1 : minimal terdapat β dimana βi ≠ 0,i = 0,1,2
P-Value (0.14909) > α (0.05) maka keputusan H0 diterima. Maka, dengan taraf nyata 5% dapat disimpulkan bahwa secara simultan tidak terdapat pengaruh antara variabel pendapatan dan jumlah anggota rumah tangga terhadap pengeluaran untuk pembelian barang tahan lama.
Uji Parsial
Hipotesis:
H0 : βi = 0
H1 : minimal terdapat β dimana βi ≠ 0,i = 1,2
Kesimpulan :
P-Value Variabel pendapatan (0.00942) < α (0.05) maka keputusan H0 ditolak. Maka, dengan taraf nyata 5% dapat disimpulkan bahwa secara parsial terdapat pengaruh antara pendapatan dan pengeluaran untuk pembelian barang tahan lama.
P-Value Variabel jumlah anggota rumah tangga (0.66021) > α (0.05) maka keputusan H0 diterima. Maka, dengan taraf nyata 5% dapat disimpulkan bahwa secara parsial tidak cukup bukti untuk mengatakan bahwa terdapat pengaruh antara variabel jumlah anggota rumah tangga terhadap pengeluaran untuk pembelian barang tahan lama.
3.5 Koefisien Determinasi
Dari hasil summary didapatkan nilai koefisien determinasi sebesar 83.64%, dari nilai tersebut dapat disimpulkan bahwa variabel pendapatan dan jumlah anggota rumah tangga dapat menjelaskan hubungan terhadap pembelian barang tahan lama sebesar 83.64% sedangkan sisanya yaitu 6.36% dipengaruhi oleh variabel lain di luar model.
4 DAFTAR PUSTAKA
Contoh Soal Pembahasan Regresi Linier Berganda [Lengkap]. (2020, 16 Mei). Diakses pada 22 Mei, 2022 dari https://www.statmat.net/regresi-linier-berganda/
Suryawati, C. (2005). Memahami kemiskinan secara multidimensional. Jurnal Manajemen Pelayanan Kesehatan, 8(03).
Sulistyono, S., & Sulistiyowati, W. (2018). Peramalan produksi dengan metode regresi linier berganda. PROZIMA (Productivity, Optimization and Manufacturing System Engineering), 1(2), 82-89.