Analsis regresi berganda merupakan analisis yang digunakan untuk menunjukkan ada tidaknya hubungan kausalitas (sebab-akibat) atau pengaruh antara lebih dari satu variabel independent (X1, X2, …, Xi) terhadap satu variabel dependent. Analisis regresi digunakan untuk mengukur seberapa besar pengaruh antara variabel bebas dan variabel terikat. Apabila hanya terdapat satu variabel bebas dan satu variabel terikat, maka regresi tersebut dinamakan regresi linear sederhana (Juliandi, Irfan, & Manurung, 2014). Sebaliknya, apabila terdapat lebih dari satu variabel bebas atau variabel terikat, maka disebut regresi linear berganda. Regresi linear berganda merupakan model regresi yang melibatkan lebih dari satu variabel independen. Analisis regresi linear berganda dilakukan untuk mengetahui arah dan seberapa besar pengaruh variabel independen terhadap variabel dependen (Ghozali, 2018).
Menurut Mentgomery and Peck (2006), persamaan umum model regresi linear berganda dapat ditulis dalam persamaan berikut : \[Y = \beta_0 + \beta_1X_1 + \beta_2X_2 +...+\beta_pX_p + \epsilon_i\]
Pada analisis regresi linear berganda menggunakan beberapa uji asumsi, yaitu:
Asumsi Normalitas
Uji Normalitas adalah sebuah uji yang dilakukan dengan tujuan untuk menilai sebaran data pada sebuah kelompok data atau variabel, apakah sebaran data tersebut berdistribusi normal ataukah tidak.
Asumsi Non-Multikolinearitas
Uji multikolinearitas dilakukan untuk menguji apakah terdapat korelasi antar variabel bebas dalam model regresi. Multikolinearitas berarti adanya hubungan linier yang sempurna antara beberapa atau semua variabel yang menjelaskan model regresi (Ajija, 2011). Ada atau tidaknya multikolinearitas dapat diketahui dari koefisien korelasi dari masing-masing variabel independen.
Asumsi Non-Heteroskedastisitas
Uji heteroskedastisitas dilakukan dengan tujuan untuk menguji apakah terdapat ketidaksamaan variance maupun residual dari suatu pengamatan ke pengamatan lainnya. Uji heteroskedastisitas dilakukan untuk mengetahui apakah pada suatu model regresi terjadi ketidaknyamanan varian dari residual pada satu pengamatan terhadap pengamatan lainnya.
Asumsi Non-Autokorelasi
Uji autokorelasi bertujuan untuk menguji apakah dalam suatu model regresi linear ada korelasi antara kesalahan pengganggu pada periode t dengan kesalahan pada periode t-1 (sebelumnya). Jika terjadi korelasi, maka terdapat autokorelasi.”
Pada analisis ini, akan dilakukan uji regresi linear berganda pada data kematian orang dewasa per seribu populasi di Indonesia pada tahun 2002 sampai 2015. Sebelum diuji lebih lanjut, terlebih dahulu kita siapkan library yang akan digunakan.
# Memuat paket yang diperlukan
library(readxl)
library(dplyr)
library(lmtest)
library(car)
library(ggplot2)
Dari analisis kematian orang dewasa per seribu populasi di Indonesia pada tahun 2002 sampai 2015, kemudian diambil 3 variabel independen yaitu:
Variabel dependen yang akan digunakan adalah Adult_mortality di Indonesia pada tahun 2002 sampai 2015.
# Membaca Data dari File Excel
data <- read_excel("C:/Users/ACER/Documents/dataaa.xlsx")
data
## # A tibble: 16 × 4
## Adult_mortality Alcohol_consumption Measles BMI
## <dbl> <dbl> <dbl> <dbl>
## 1 192. 0.054 24 21.8
## 2 187. 0.071 66 22.3
## 3 176. 0.08 31 23
## 4 181. 0.08 78 22.7
## 5 191. 0.054 29 22
## 6 189. 0.062 50 22.2
## 7 191. 0.063 23 21.6
## 8 183. 0.08 76 22.6
## 9 184. 0.08 74 22.5
## 10 177. 0.09 28 22.9
## 11 185. 0.074 67 22.4
## 12 191. 0.05 21 21.9
## 13 179. 0.09 76 22.8
## 14 191. 0.06 25 21.7
## 15 188. 0.061 73 22.2
## 16 190. 0.059 23 22.1
# statistik Deskriptif Untuk Setiap Variabel
summary(data)
## Adult_mortality Alcohol_consumption Measles BMI
## Min. :175.6 Min. :0.05000 Min. :21.00 Min. :21.60
## 1st Qu.:182.2 1st Qu.:0.05975 1st Qu.:24.75 1st Qu.:21.98
## Median :187.7 Median :0.06700 Median :40.50 Median :22.25
## Mean :186.0 Mean :0.06925 Mean :47.75 Mean :22.29
## 3rd Qu.:190.7 3rd Qu.:0.08000 3rd Qu.:73.25 3rd Qu.:22.62
## Max. :192.1 Max. :0.09000 Max. :78.00 Max. :23.00
Melalui statistik deskriptif diatas, didapatkan nilai minimum, mean, kuartil bawah, median, kuartil atas, dan nilai maksimum dari keempat variabel. Pada variabel Adult_mortality, didapatkan nilai minimum 175.6, mean 186, kuartil bawah 182.2, median 187.7, kuartil atas 190.7, dan nilai maksimumnya 192.1. Begitu hingga hasil pada setiap variabel lainnya.
Untuk melihat hubungan dari masing-masing variabel, maka akan dicari nilai korelasinya.
# Menghitung matriks korelasi
cor_matrix <- cor(data)
cor_matrix <- round(cor_matrix, 2)
cor_matrix
## Adult_mortality Alcohol_consumption Measles BMI
## Adult_mortality 1.00 -0.92 -0.40 -0.96
## Alcohol_consumption -0.92 1.00 0.55 0.88
## Measles -0.40 0.55 1.00 0.51
## BMI -0.96 0.88 0.51 1.00
Melalui output diatas, dapat disimpulkan bahwa:
# Model Regresi
model.mkt=lm(Adult_mortality~.,data=data)
summary(model.mkt)
##
## Call:
## lm(formula = Adult_mortality ~ ., data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.7931 -0.4615 0.1101 0.5524 1.4571
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 387.86600 24.74672 15.673 2.35e-09 ***
## Alcohol_consumption -174.37787 41.81883 -4.170 0.0013 **
## Measles 0.04185 0.01276 3.279 0.0066 **
## BMI -8.60243 1.21766 -7.065 1.31e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.9822 on 12 degrees of freedom
## Multiple R-squared: 0.9736, Adjusted R-squared: 0.967
## F-statistic: 147.4 on 3 and 12 DF, p-value: 9.846e-10
#Uji Asumsi Linearitas Menggunkan Ramsey RESET
ramsey_test <- resettest(model.mkt, power = 3)
ramsey_test
##
## RESET test
##
## data: model.mkt
## RESET = 0.12186, df1 = 1, df2 = 11, p-value = 0.7336
Dengan nilai p-value = 0.7336 > 0.05, maka tidak ada cukup bukti untuk menolak asumsi linearitas dan dapat disimpulkan bahwa model regresi linear berganda tersebut memenuhi asumsi linearitas.
# Grafik QQ Plot Untuk Normalitas Residual
qqnorm(resid(model.mkt))
# Histogram Dari Residual
ggplot(data.frame(Residual=resid(model.mkt)), aes(x=Residual)) +
geom_histogram(binwidth=0.5, fill="maroon", color="black") +
labs(x = "Residual", y = "Count", title = "Histogram of Residuals")
# Uji Normalitas Residual Model
residu = resid(model.mkt)
ks.test(residu, "pnorm")
##
## Exact one-sample Kolmogorov-Smirnov test
##
## data: residu
## D = 0.11141, p-value = 0.9757
## alternative hypothesis: two-sided
shapiro.test(residu)
##
## Shapiro-Wilk normality test
##
## data: residu
## W = 0.98232, p-value = 0.9793
Melalui output diatas, dapat disimpulkan bahwa:
# Grafik Residual Plot Untuk Non-Heteroskedastisitas
plot(model.mkt, which = 1)
# Uji Non-Heteroskedastisitas
bptest(model.mkt)
##
## studentized Breusch-Pagan test
##
## data: model.mkt
## BP = 6.0775, df = 3, p-value = 0.1079
Melalui output diatas, dapat disimpulkan bahwa:
# Uji Multikolinearitas
vif(model.mkt)
## Alcohol_consumption Measles BMI
## 4.595614 1.450730 4.317982
vif_values <- vif(model.mkt)
# Membuat plot VIF
plot(vif_values, type = "bar", main = "VIF Plot")
Dari output diperoleh nilai VIF ketiga variabel independen < 10 sehingga tidak terjadi multikolinearitas yang berarti asumsi non-multikolinearitas terpenuhi.
# Uji Autokorelasi Residual
durbinWatsonTest(model.mkt)
## lag Autocorrelation D-W Statistic p-value
## 1 -0.05850253 1.931174 0.988
## Alternative hypothesis: rho != 0
Berdasarkan uji autokorelasi diatas, diperoleh p-value = 0.938 > 0.05 yang berarti bahwa asumsi tidak terjadinya autokorelasi terpenuhi.
# Ringkasan model
summary(model.mkt)
##
## Call:
## lm(formula = Adult_mortality ~ ., data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.7931 -0.4615 0.1101 0.5524 1.4571
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 387.86600 24.74672 15.673 2.35e-09 ***
## Alcohol_consumption -174.37787 41.81883 -4.170 0.0013 **
## Measles 0.04185 0.01276 3.279 0.0066 **
## BMI -8.60243 1.21766 -7.065 1.31e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.9822 on 12 degrees of freedom
## Multiple R-squared: 0.9736, Adjusted R-squared: 0.967
## F-statistic: 147.4 on 3 and 12 DF, p-value: 9.846e-10
Melalui output diatas, diperoleh:
\[Y = -174.377787X_1 + 0.04185X_2-8.60243X_3 + \epsilon\] Artinya, jika variabel Adult_mortality naik sebanyak 1 orang, maka variabel Alcohol_consumption akan turun sebesar 174.37787, menaikkan variabel Measles sebesar 0.04185, dan menurunkan variabel BMI sebesar 8.60243.
Nilai p-value = 9.846e-10 < 0.05, sehingga dapat disimpulkan bahwa terdapat pengaruh yang signifikan antara variabel independen terhadap variabel dependen secara simultan.
Variabel Alcohol_consumption, Measles, dan BMI memiliki p- value secara berturut-turut 2.35e-09, 0.0066, dan 1.31e-05 < 0.05 yang berarti bahwa kedua variabel ini secara parsial berpengaruh signifikan terhadap variabel dependen.
Nilai ini diperoleh dari Adjusted R-Square yang memiliki nilai 0.967 atau 96,7%. Artinya, variabel independen dalam model regresi ini mampu menjelaskan variasi dari variabel dependen sebesar 96,7%. Sedangkan 3.,3% lainnya dapat dijelaskan oleh variabel lain yang tidak termasuk dalam model ini.