Regresi adalah salah satu metode analisis statistik yang digunakan untuk memahami hubungan antara satu atau lebih variabel independen (biasanya disebut sebagai variabel prediktor atau variabel penjelas) dan satu variabel dependen (biasanya disebut sebagai variabel respons). Tujuan utama dari analisis regresi adalah untuk memahami dan menggambarkan hubungan antara variabel-variabel tersebut, serta untuk membuat prediksi tentang nilai variabel dependen berdasarkan nilai-nilai variabel independen.Terdapat dua jenis umum regresi yaitu regresi linear sederhana dan regresi linear berganda.
Bentuk umum model regresi linear berganda adalah \[Y = {\beta_{0}} + {\beta_{1}}X_{1} + {\beta_{2}}X_{2} + ... + {\beta_{n}}X_{n} + {\epsilon}\] dengan \(Y\) adalah variabel dependen, \(X_{1}, X_{2}, ..., X_{n}\) adalah variabel-variabel independen, \(\epsilon\) adalah galat acak (random error) dan \({\beta_{0}}, {\beta_{1}}, ..., {\beta_{n}}\) adalah parameter-parameter populasi yang nilainya tidak diketahui.
Uji asumsi klasik adalah serangkaian tes yang digunakan untuk memeriksa sejauh mana data atau model statistik memenuhi asumsi-asumsi klasik yang diperlukan untuk validitas hasil analisis regresi linear. Asumsi-asumsi klasik ini penting untuk memastikan bahwa hasil analisis regresi linear berganda dapat diandalkan dan hasilnya dapat diinterpretasikan dengan benar. Agar koefisien regresi tidak bias, maka diperlukan uji asumsi klasik agar pengambilan keputusan mendekati keadaan yang sebenarnya. Uji asumsi klasik terdiri dari uji normalitas, uji heterokedastisitas, uji autokorelasi, dan uji multikolinearitas.
Data yang digunakan pada analisis ini adalah data pengaruh cakupan imunisasi polio (Pol3) pada anak usia 1 tahun dan cakupan imunisasi difteri tetanus toksoid dan pertusis (DTP3) pada anak usia 1 tahun terhadap kematian bayi tahun 2015 di Asia. Analisis data ini bertujuan untuk mengetahui ada tidaknya pengaruh cakupan imunisasi polio (Pol3) pada anak usia 1 tahun dan cakupan imunisasi difteri tetanus toksoid dan pertusis (DTP3) pada anak usia 1 tahun terhadap kematian bayi.
library(readr)
## Warning: package 'readr' was built under R version 4.2.3
data <- read_delim("D:/CM2SIM.csv", delim = ";",
escape_double = FALSE, trim_ws = TRUE)
## Rows: 27 Columns: 3
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## dbl (3): Y, X1, X2
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
data
## # A tibble: 27 × 3
## Y X1 X2
## <dbl> <dbl> <dbl>
## 1 17.4 97 97
## 2 29.2 90 91
## 3 23.2 85 78
## 4 8.3 99 99
## 5 34.9 86 87
## 6 36.4 99 99
## 7 41 89 89
## 8 23.3 98 96
## 9 9.3 99 99
## 10 16.6 99 99
## # … with 17 more rows
Melakukan analisis regresi variabel dengan dataset yang telah ditentukan sesuai dengan analisis. Dengan variabel sebagai berikut :
\(Y\) = Kematian Bayi
\(X_1\) = Cakupan Imunisasi Polio
\(X_2\) = Cakupan Imunisasi Difteri Tetanus Toksoid dan Pertusis
model.mkt<- lm(Y~.,data= data)
summary(model.mkt)
##
## Call:
## lm(formula = Y ~ ., data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -18.246 -7.218 -1.503 6.653 20.582
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 168.550 21.944 7.681 6.44e-08 ***
## X1 -2.879 0.644 -4.471 0.000159 ***
## X2 1.337 0.517 2.585 0.016239 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 9.483 on 24 degrees of freedom
## Multiple R-squared: 0.6487, Adjusted R-squared: 0.6194
## F-statistic: 22.16 on 2 and 24 DF, p-value: 3.538e-06
library(car)
## Warning: package 'car' was built under R version 4.2.3
## Loading required package: carData
## Warning: package 'carData' was built under R version 4.2.3
vif(model.mkt)
## X1 X2
## 9.116309 9.116309
Nilai VIF pada \(X_1\) dan \(X_2\) kurang dari 10 yang berarti bahwa tidak terjadi multikolinearitas, sehingga asumsi multikolinearitas terpenuhi.
library(car)
sisa <- residuals(model.mkt)
sisa
## 1 2 3 4 5 6
## -1.5031334 -1.8390006 -4.8597921 -7.5176340 -2.3099993 20.5823660
## 7 8 9 10 11 12
## 9.7548693 8.6128555 -6.5176340 0.7823660 -7.4176340 4.6281250
## 13 14 15 16 17 18
## -9.3123841 -9.8077752 12.1541170 0.9968666 -6.7603837 -7.0176340
## 19 20 21 22 23 24
## 14.9762359 1.4823660 -18.2458830 4.6929771 8.7029967 10.8548693
## 25 26 27
## 2.1231451 -8.3176340 -8.9176340
shapiro.test(sisa)
##
## Shapiro-Wilk normality test
##
## data: sisa
## W = 0.96642, p-value = 0.5106
\(H_0\): Galat menyebar normal
\(H_1\): Galat tidak menyebar normal
Berdasarkan uji Shapiro-Wilk diatas, diperoleh nilai p-value = 0.5106 > \(\alpha\) = 0.05 sehingga \(H_0\) diterima. Dapat disimpulkan bahwa galat menyebar secara normal, yang artinya asumsi normalitas terpenuhi.
library(lmtest)
## Warning: package 'lmtest' was built under R version 4.2.3
## Loading required package: zoo
## Warning: package 'zoo' was built under R version 4.2.3
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
bptest(model.mkt)
##
## studentized Breusch-Pagan test
##
## data: model.mkt
## BP = 1.2432, df = 2, p-value = 0.5371
\(H_0\): Tidak terjadi heterokedastisitas
\(H_1\): Terjadi heterokedastisitas
Berdasarkan Breusch-Pagan test, diperoleh nilai p-value = 0.5371 > \(\alpha\) = 0.05 sehingga \(H_0\) diterima. Dapat disimpulkan bahwa tidak terjadi heterokedastisitas yang artinya asumsi heterokedastisitas terpenuhi.
dwtest(model.mkt)
##
## Durbin-Watson test
##
## data: model.mkt
## DW = 1.7743, p-value = 0.272
## alternative hypothesis: true autocorrelation is greater than 0
\(H_0\): Tidak terjadi autokorelasi
\(H_1\): Terjadi autokorelasi
Berdasarkan uji Dubin-Watson, diperoleh nilai p-value = 0.272 > \(\alpha\) = 0.05 sehingga \(H_0\) diterima. Dapat disimpulkan bahwa tidak terjadi kasus autokorelasi.
anreg <- lm(data$`Y`~data$`X1`+data$`X2`, data = data)
anreg
##
## Call:
## lm(formula = data$Y ~ data$X1 + data$X2, data = data)
##
## Coefficients:
## (Intercept) data$X1 data$X2
## 168.550 -2.879 1.337
Berdasarkan hasil analisis regresi diatas didapatkan persamaan regresi: \[Y = 168.550 - 2.879X_1+1.337X_2\]
Berdasarkan hasil analisi diatas didapatkan koefisien determinasi atau R-squared sebesar 0.6194 artinya variabel prediktor (\(X_1\) dan \(X_2\)) mempengaruhi variabel respon \((Y)\) sebesar 61.94%, sedangkan sisanya dipengaruhi variabel lain di luar model.Berdasarkan hasil uji asumsi klasik, semua uji asumsi memenuhi model regresi linear berganda, sehingga model regresi berganda dapat digunakan untuk menganalisis data.