Regresi Linier Berganda
Analisis regresi berganda adalah sebuah metode statistik yang digunakan
untuk memodelkan hubungan antara satu variabel dependen (variabel
respons) dengan dua atau lebih variabel independen (variabel prediktor).
Tujuan dari analisis regresi berganda adalah untuk menentukan sejauh
mana variabel-variabel prediktor tersebut berkontribusi terhadap variasi
variabel respons.
Dalam analisis regresi berganda, kita mencari persamaan regresi yang
terbaik untuk menggambarkan hubungan antara variabel respons dan
variabel prediktor. Persamaan regresi berganda umumnya dinyatakan
sebagai :
\(Y
={β_0}+{β_1X_1}+{β_2X_2}+...+{β_kX_k}+ε\)
Uji Asumsi Klasik
Uji asumsi klasik terhadap model regresi linier dilakukan agar dapat
diketahui apakah model regresi baik atau tidak. Tujuan pengujian asumsi
klasik adalah untuk memberikan kepastian bahwa persamaan regresi yang
diperoleh memiliki ketepatan dalam estimasi, tidak bias, dan konsisten.
Sebelum melakukan analisis regresi terlebih dahulu dilakukan pengujian
asumsi. Asumsi-asumsi yang harus dipenuhi dalam analisis regresi antara
lain: Normalitas, Heteroskedastisitas, Multikolinieritas, dan
Autokorelasi (Ghozali, 2011).
Asumsi Normalitas
Uji Normalitas bertujuan untuk menguji apakah dalam model regresi suatu
variabel pengganggu atau residual memiliki distribusi yang normal atau
tidak. Suatu model regresi dikatakan baik jika datanya berdistribusi
normal atau mendekati normal. Untuk mengetahui normalitas data dapat
menggunakan analisis grafik dan uji statistik. Analisis grafik yaitu
dengan melihat grafik histogram dan melihat normal probability plot.
Sedangkan untuk uji statistik dalam normalitas dibagi dua yaitu uji
statistik sederhana dengan melihat nilai kurtosis dan skewness dari
residual dan uji statistik non parametrik Kolmogorov-Smirnov (Ghozali,
2009).
Asumsi Heteroskedastisitas
Uji heteroskedatisitas bertujuan untuk menguji apakah didalam model
regresi terjadi ketidaksamaan varian dari residual satu pengamatan ke
pengamatan yang lain. Jika varian dari residual satu pengamatan ke
pengamatan yang lain tetap, maka disebut homoskedastisitas dan jika
berbeda disebut heteroskedastisitas. Model regresi yang baik adalah yang
homoskedastisitas atau tidak terjadi Heteroskedastisitas (Ghozali,
2016).
Asumsi Multikolinieritas
Uji multikolinearitas bertujuan untuk menguji apakah pada model regresi
ditemukan adanya korelasi antar variabel bebas (independen) (Ghozali,
2016). Jika ada korelasi diantara variabel-variabel bebasnya, maka
hubungan antara variabel bebas terhadap variabel terikat menjadi
terganggu. Pada model regresi yang baik seharusnya tidak terjadi
korelasi diantara variabel bebas, jadi perlu dideteksi ada atau tidaknya
multikolinearitas dalam suatu persamaan regresi dengan catatan
(Tolerance = 1/VIF) atau (VIF = 1/Tolerance). Nilai yang umum dipakai
untuk menunjukan adanya multikolinieritas atau tidak adalah
- Jika nilai Tolerance > 0,10 atau nilai VIF < 10. maka variabel
dinyatakan bebas multikolinieritas.
- Jika nilai Tolerance < 0,10 atau nilai VIF > 10. maka variabel
dinyatakan ada multikolinieritas.
Asumsi Autokorelasi
Uji autokorelasi bertujuan menguji apakah dalam model regresi ada
kolerasi antara kesalahan pengganggu pada periode-t dengan kesalahan
pengganggu pada pada periode t-1 (sebelumnya) (Ghozali, 2012).
Uji Hipotesis
Uji hipotesis adalah sebuah prosedur penelitian yang digunakan untuk
menguji kebenaran suatu pernyataan secara ilmiah melalui analisa
statistik dan menarik kesimpulan apakah menerima atau menolak pernyataan
tersebut. Uji hipotesis digunakan untuk mengukur kekuatan hubungan
antara dua variabel atau lebih dan untuk menunjukan arah hubungan antara
variabel dependen dan variabel independen.
Uji Simultan (F)
Uji Statistik F pada dasarnya menunjukkan apakah semua variabel
independen atau variabel bebas yang dimasukkan dalam model mempunyai
pengaruh secara bersama-sama terhadap variabel dependen atau variabel
terikat (Ghozali, 2012). Adapun ketentuan dari uji F yaitu sebagai
berikut (Ghozali, 2016):
- Jika nilai signifikan F < 0,05 maka \(H_0\) ditolak dan \(H_a\) diterima. Artinya semua variabel
independent/bebas memiliki pengaruh secara signifikan terhadap variabel
dependen/terikat.
- Jika nilai signifikan F > 0,05 maka \(H_0\) diterima dan \(H_a\) ditolak. Artinya, semua variabel
independent/bebas tidak memiliki pengaruh secara signifikan terhadap
variabel dependen/terikat.
Uji Parsial
Uji beda t-test digunakan untuk menguji seberapa jauh pengaruh variabel
independen yang digunakan dalam penelitian ini secara individual dalam
menerangkan variabel dependen secara parsial (Ghozali, 2012). Adapun
kriteria dari uji statistik t (Ghozali, 2016):
- Jika nilai signifikansi uji t > 0,05 maka \(H_0\) diterima dan \(H_a\) ditolak. Artinya tidak ada pengaruh
antara variabel independen terhadap variaben dependen.
- Jika nilai signifikansi uji t < 0,05 maka \(H_0\) ditolak dan \(H_a\) diterima. Artinya terdapat pengaruh
antara variabel independen terhadap variabel dependen.
Koefisien Determinasi
Menurut Ghozali (2012: 97) koefisien determinasi (\(R^2\)) merupakan alat untuk mengukur
seberapa jauh kemampuan model dalam menerangkan variasi variabel
dependen. Nilai koefisien determinasi adalah antara nol atau satu. Nilai
\(R^2\) yang kecil berarti kemampuan
variabel-variabel independen dalam menjelaskan variasi variabel dependen
amat terbatas. Dan sebaliknya jika nilai yang mendekati 1 berarti
variabel-variabel independen memberikan hampir semua informasi yang
dibutuhkan untuk memprediksi variabel-variabel dependen.
SOURCE CODE
Data yang digunakan dalam analisis ini adalah data Imunisasi Polio,
Imunisasi Hepatitis B dan Angka Harapan Hidup di Indonesia yang diambil
dari tahun 2000-2015.
Library yang digunakan
library(readxl)
library(openxlsx)
library(knitr)
library(lmtest)
## Loading required package: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
library(zoo)
library(car)
## Loading required package: carData
library(stats)
Import data
Data <- read_excel("D:/Sistem Informasi Manajemen/Data_SIM.xlsx")
Data
## # A tibble: 16 × 5
## Negara Tahun Hepatitis_B AHH Polio
## <chr> <dbl> <dbl> <dbl> <dbl>
## 1 Indonesia 2000 65 65.8 72
## 2 Indonesia 2001 62 66 77
## 3 Indonesia 2002 63 66.3 80
## 4 Indonesia 2003 64 66.6 80
## 5 Indonesia 2004 64 67 79
## 6 Indonesia 2005 65 67.3 79
## 7 Indonesia 2006 66 67.7 78
## 8 Indonesia 2007 76 68.1 77
## 9 Indonesia 2008 82 68.5 83
## 10 Indonesia 2009 82 68.9 85
## 11 Indonesia 2010 83 69.2 82
## 12 Indonesia 2011 81 69.5 81
## 13 Indonesia 2012 83 69.9 87
## 14 Indonesia 2013 85 70.2 92
## 15 Indonesia 2014 78 70.5 90
## 16 Indonesia 2015 78 70.8 85
kable(Data)
| Indonesia |
2000 |
65 |
65.8 |
72 |
| Indonesia |
2001 |
62 |
66.0 |
77 |
| Indonesia |
2002 |
63 |
66.3 |
80 |
| Indonesia |
2003 |
64 |
66.6 |
80 |
| Indonesia |
2004 |
64 |
67.0 |
79 |
| Indonesia |
2005 |
65 |
67.3 |
79 |
| Indonesia |
2006 |
66 |
67.7 |
78 |
| Indonesia |
2007 |
76 |
68.1 |
77 |
| Indonesia |
2008 |
82 |
68.5 |
83 |
| Indonesia |
2009 |
82 |
68.9 |
85 |
| Indonesia |
2010 |
83 |
69.2 |
82 |
| Indonesia |
2011 |
81 |
69.5 |
81 |
| Indonesia |
2012 |
83 |
69.9 |
87 |
| Indonesia |
2013 |
85 |
70.2 |
92 |
| Indonesia |
2014 |
78 |
70.5 |
90 |
| Indonesia |
2015 |
78 |
70.8 |
85 |
Dalam data di atas, Angka Harapan Hidup (AHH) sebagai variabel
dependen (Y) sedangkan Imunisasi Polio dan Hepatitis B sebagai variabel
independen (X).
Keterangan :
\(Y\) : Angka Harapan Hidup
\(X_1\) : Imunisasi Polio (%)
\(X_2\) : Imunisasi Hepatitis B
(%)
ANALISIS REGRESI LINIER BERGANDA
model<-lm(AHH ~ Polio+Hepatitis_B, data=Data)
summary(model)
##
## Call:
## lm(formula = AHH ~ Polio + Hepatitis_B, data = Data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.83447 -0.48204 -0.09696 0.36217 1.60764
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 49.24992 2.99536 16.442 4.43e-10 ***
## Polio 0.13848 0.05057 2.738 0.01691 *
## Hepatitis_B 0.10477 0.02937 3.567 0.00345 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.7049 on 13 degrees of freedom
## Multiple R-squared: 0.844, Adjusted R-squared: 0.82
## F-statistic: 35.17 on 2 and 13 DF, p-value: 5.691e-06
Berdasarkan output, didapatkan persamaan estimasi model regresi
linear sederhana sebagai berikut :
\(Y
=49.24992+{0.13848X_1}+{0.10477X_2}\)
Interpretasi Estimasi Model Persamaan Regresi:
- Jika variabel Imunisasi Polio (\(X_1\)) dan Imunisasi Hepatitis B (\(X_2\)) diasumsikan bernilai 0, maka Angka
Harapan Hidup (Y) bernilai 49.24992.
- Setiap kenaikan satu persen Imunisasi Polio (\(X_1\)) akan menaikkan Angka Harapan Hidup
(Y) sebesar 0.13848.
- Setiap kenaikan satu persen Imunisasi Hepatitis B (\(X_2\)) akan menaikkan Angka Harapan Hidup
(Y) sebesar 0.10477.
Kemudian, nilai Adjusted R-squared = 0.82 yang berarti Angka Harapan
Hidup dapat dijelaskan oleh Imunisasi Polio dan Hepatitis B sebesar 82%
sedangkan sisanya 18% dijelaskan oleh faktor lain di luar model.
UJI HIPOTESIS
Uji Simultan (F)
Nilai p-value (5.691 x 10−6) < α(0.05) maka \(H_0\) ditolak. Sehingga dapat disimpulkan
bahwa terdapat pengaruh yang signifikan antara variabel prediktor
terhadap variabel respons secara simultan.
Uji Parsial
Untuk \(X_1\)
Nilai p-value (0.01691) < α(0.05) maka \(H_0\) ditolak. Dapat disimpulkan bahwa
terdapat pengaruh yang signifikan antara variabel \(X_1\) terhadap Y secara parsial.
Untuk \(X_2\)
Nilai p-value (0.00345) < α(0.05) maka \(H_0\) ditolak. Dapat disimpulkan bahwa
terdapat pengaruh yang signifikan antara variabel \(X_2\) terhadap Y secara parsial.
UJI ASUMSI KLASIK
Asumsi Normalitas
\(H_0\) : Sisaan berdistribusi
normal
\(H_1\) : Sisaan tidak berdistribusi
normal
residu<-resid(model)
residu
## 1 2 3 4 5 6
## -0.23017819 -0.40826610 -0.62846662 -0.43323368 0.10524414 0.30047708
## 7 8 9 10 11 12
## 0.73418784 0.22499507 -0.83447420 -0.71142984 -0.10076344 0.54724850
## 13 14 15 16
## -0.09315253 -0.69507574 0.61524931 1.60763840
shapiro.test(residu)
##
## Shapiro-Wilk normality test
##
## data: residu
## W = 0.93558, p-value = 0.2984
Dari output hasi uji asumsi, diketahui nilai p-value yakni 0.2984 >
0,05 (α), maka \(H_0\) diterima
sehingga sisaan berdistribusi normal.
Asumsi Heteroskedastisitas
\(H_0\) : Tidak terjadi gejala
heteroskedastisitas (terjadi gejala homoskedastisitas)
\(H_1\) : Terjadi gejala
heteroskedastisitas (tidak terjadi gejala homoskedastisitas)
bptest(model)
##
## studentized Breusch-Pagan test
##
## data: model
## BP = 1.422, df = 2, p-value = 0.4912
Dari output hasi uji asumsi, diketahui nilai p-value yakni 0.4912 >
0,05 (α), maka \(H_0\) diterima
sehingga tidak terjadi gejala heteroskedastisitas atau terjadi gejala
homokedastisitas.
Asumsi Multikolineritas
\(H_0\) : Tidak terjadi
multikolinieritas
\(H_1\) : Terjadi
multikolinieritas
vif(model)
## Polio Hepatitis_B
## 2.055725 2.055725
Berdasarkan output diperoleh hasil TOL untuk masing-masing variabel
independen > 0.1. Nilai VIF masing-masing variabel independen juga
< 10, maka menghasilkan keputusan terima \(H_0\) dengan taraf nyata 5% sudah cukup
bukti bahwa tidak terjadi multikolinieritas.
Asumsi Autokorelasi
\(H_0\) : Tidak terjadi
autokorelasi
\(H_1\) : Terjadi autokorelasi
bgtest(model)
##
## Breusch-Godfrey test for serial correlation of order up to 1
##
## data: model
## LM test = 2.9478, df = 1, p-value = 0.086
Berdasarkan output diperoleh hasil p−value dari Breusch-Godfrey test
sebesar 0.086. Hal ini berarti bahwa p−value(0.086)> α(0.05), maka
menghasilkan keputusan terima \(H_0\).
Dengan taraf nyata 5%, maka tidak terjadi autokorelasi.
KESIMPULAN
Berdasarkan analisis yang telah dilakukan, didapatkan persamaan
estimasi model regresi linear sederhana sebagai berikut :
\(Y
=49.24992+{0.13848X_1}+{0.10477X_2}\)
Interpretasi Estimasi Model Persamaan Regresi:
- Jika variabel Imunisasi Polio (\(X_1\)) dan Imunisasi Hepatitis B (\(X_2\)) diasumsikan bernilai 0, maka Angka
Harapan Hidup (Y) bernilai 49.24992.
- Setiap kenaikan satu persen Imunisasi Polio (\(X_1\)) akan menaikkan Angka Harapan Hidup
(Y) sebesar 0.13848.
- Setiap kenaikan satu persen Imunisasi Hepatitis B (\(X_2\)) akan menaikkan Angka Harapan Hidup
(Y) sebesar 0.10477.
Kemudian, nilai Adjusted R-squared = 0.82 yang berarti Angka Harapan
Hidup dapat dijelaskan oleh Imunisasi Polio dan Hepatitis B sebesar 82%
sedangkan sisanya 18% dijelaskan oleh faktor lain di luar model.
DAFTAR PUSTAKA
Ghozali, Imam. 2009. Aplikasi Analisis Multivariate dengan Program
SPSS. Semarang : UNDIP.
Ghozali, Imam. 2011. Aplikasi Analisis Multivariate Dengan Program
SPSS. Ed 6. Semarang: Badan Penerbit Universitas Diponegoro
Ghozali, Imam. 2012. Aplikasi Analisis Multivariate dengan Program
IBM SPSS. Yogyakarta: Universitas Diponegoro
Ghozali, Imam. 2016. Aplikasi Analisis Multivariete Dengan Program
IBM SPSS 23. Edisi 8. Semarang: Badan Penerbit Universitas
Diponegoro.