Analisis regresi adalah metode statistik yang digunakan untuk menentukan hubungan antara satu variabel dependen (respon) dengan satu atau lebih variabel independen (prediktor). Tujuan utama dari analisis regresi adalah untuk memodelkan dan menganalisis hubungan antara variabel-variabel tersebut sehingga kita dapat memahami bagaimana perubahan dalam variabel independen mempengaruhi variabel dependen.Analisis regresi terbagi menjadi dua jenis yaitu:
Regresi linear sederhanadan
Regresi linear berganda.
Regresi linear berganda merupakan model regresi yang memiliki lebih dari satu variabel independen atau lebih.
Tujuan dari analisi regresi linear berganda adalah untuk memprediksi nilai variabel tak bebas atau response \((Y)\), apabila nilai-nilai variabel bebasnya atau prediktor \((X_1, X_2, ..., X_n)\) diketahui.
Bentuk umum model regresi linear berganda adalah \[Y = {\beta_{0}} + {\beta_{1}}X_{1} + {\beta_{2}}X_{2} + ... + {\beta_{n}}X_{n} + {\epsilon}\] dengan \(Y\) adalah variabel dependen, \(X_{1}, X_{2}, ..., X_{n}\) adalah variabel-variabel independen, \(\epsilon\) adalah galat acar (random error) dan \({\beta_{0}}, {\beta_{1}}, ..., {\beta_{n}}\) adalah parameter-parameter populasi yang nilainya tidak diketahui.
Uji asumsi klasik adalah serangkaian uji statistik yang digunakan untuk memastikan bahwa model regresi memenuhi asumsi-asumsi dasar yang diperlukan untuk validitas estimasi dan inferensi. Berikut adalah asumsi-asumsi klasik dalam regresi linier beserta metode untuk mengujinya:
Uji normalitas berfungsi untuk menguji apakah dalam sebuah model regresi memiliki residual yang berdistribusi normal.Uji statistik yang paling sering digunakan adalah uji Kolmogorof-Smirnov Test (Gujarati, 2003) atau Saphiro-Wilk.
Uji homoskedastisitas digunakan untuk memeriksa apakah terdapat perbedaan varians residual antara satu observasi dengan observasi lainnya dalam sebuah regresi. Salah satu syarat yang harus dipenuhi dalam model regresi adalah tidak adanya heteroskedastisitas (Gujarati, 2003). Pengujian ini dilakukan menggunakan uji Breusch-Pagan.
Autokorelasi diartikan sebagai hubungan antara anggota observasi yang diatur berdasarkan waktu atau ruang. Dalam model regresi linier klasik, diasumsikan bahwa tidak ada autokorelasi dalam error \(\epsilon_i\), yang dikenal sebagai kondisi non-autokorelasi. Salah satu metode untuk mendeteksi autokorelasi adalah dengan menggunakan uji Durbin-Watson.
Cara mendeteksi adanya multikolinearitas dalam model adalah dengan nilai tolerance dan VIF (Variance Inflation Factors).
Data yang digunakan pada analisis ini adalah data Tingkat kematian anak di bawah 5 tahun(\(Y\)), Presentase cakupan imunisasi Hepatitis B di antara anak-anak usia 1 tahun (\(X1\)),dan Presentase cakupan imunisasi campak (\(X2\)) pada tahun 2007 di Asia. Analisis data ini bertujuan untuk mengetahui ada tidaknya pengaruh cakupan imunisasi hepatitis B dan campak terhadap Tingkat kematian anak dibawah 5 tahun.
library(readxl)
## Warning: package 'readxl' was built under R version 4.2.3
data= read.csv('D:\\data sim cm uas.csv')
data
## Y X1 X2
## 1 67.9 60 35
## 2 53.4 82 65
## 3 17.6 98 56
## 4 57.8 95 63
## 5 71.8 85 66
## 6 26.8 94 99
## 7 45.5 62 75
## 8 15.6 96 94
## 9 55.4 82 48
## 10 35.7 94 65
## 11 92.7 75 33
## 12 2.9 96 96
## 13 20.1 92 92
## 14 47.4 98 98
## 15 79.1 50 65
## 16 23.9 67 65
## 17 50.8 95 79
## 18 3.5 83 89
## 19 9.5 97 92
## 20 37.0 99 44
## 21 12.8 98 97
## 22 48.8 84 90
## 23 8.1 96 92
## 24 33.0 87 17
## 25 99.9 63 21
## 26 34.1 98 97
## 27 38.3 76 73
Melakukan Analisis Regresi variabel dependen Tingkat kematian anak di bawah 5 tahun (\(Y\)) dengan variabel independen yaitu Presentase cakupan imunisasi Hepatitis B di antara anak-anak usia 1 tahun (\(X1\)),dan Presentase cakupan imunisasi campak (\(X2\)).
model.mkt <- lm(Y~X1+X2, data = data)
model.mkt
##
## Call:
## lm(formula = Y ~ X1 + X2, data = data)
##
## Coefficients:
## (Intercept) X1 X2
## 136.1927 -0.7353 -0.4696
Berdasarkan hasil analisis regresi diatas didapatkan persamaan regresi: \[Y = 136.1927 -0.7353X_1 -0.4696X_2\] Yang berarti bahwa :
Setiap kenaikan satu satu persen cakupan imunisasi Hepatitis B akan mengurangi tingkat kematian anak dibawah 5 tahun sebesar 0.7353%.
Setiap kenaikan satu satu persen cakupan imunisasi campak akan mengurangi tingkat kematian anak dibawah 5 tahun sebesar 0.4696%
Selanjutnya melakukan Summary dari hasil analisis sebelumnya. Dengan syntax sebagai berikut:
summary(model.mkt)
##
## Call:
## lm(formula = Y ~ X1 + X2, data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -32.501 -11.022 -5.239 16.080 29.291
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 136.1927 22.9968 5.922 4.13e-06 ***
## X1 -0.7353 0.3026 -2.430 0.0229 *
## X2 -0.4696 0.1723 -2.725 0.0118 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 19.17 on 24 degrees of freedom
## Multiple R-squared: 0.5137, Adjusted R-squared: 0.4731
## F-statistic: 12.67 on 2 and 24 DF, p-value: 0.000175
Dari output model MKT didapat Adjusted R-squared: 0.4731 (47.31%) yang berarti bahwa Tingkat kematian anak di bawah 5 tahun dipengaruhi oleh Presentase cakupan imunisasi Hepatitis B di antara anak-anak usia 1 tahun dan Presentase cakupan imunisasi campak sebesar 47.31%. Sedangkan sisanya dipengaruhi oleh variable lain yang belum masuk kedalam model.
Uji Normalitas
library(tseries)
## Warning: package 'tseries' was built under R version 4.2.3
## Registered S3 method overwritten by 'quantmod':
## method from
## as.zoo.data.frame zoo
sisa <- residuals(model.mkt)
sisa
## 1 2 3 4 5 6
## -7.7362985 8.0289554 -20.2317592 21.0493041 29.1045857 6.2190776
## 7 8 9 10 11 12
## -9.8821347 -5.8581602 2.0459815 -0.8468703 27.1547459 -17.6189868
## 13 14 15 16 17 18
## -5.2387250 29.2908823 10.1978240 -32.5012624 21.5626914 -29.8656158
## 19 20 21 22 23 24
## -12.1619857 -5.7314518 -5.7787044 16.6393187 -14.2973336 -31.2344670
## 25 26 27
## 19.8955312 15.5212956 -7.7264381
shapiro.test(sisa)
##
## Shapiro-Wilk normality test
##
## data: sisa
## W = 0.95643, p-value = 0.3055
\(H_0\): Galat menyebar normal
\(H_1\): Galat tidak menyebar normal
Berdasarkan uji Shapiro-Wilk diatas, diperoleh nilai p-value =0.3055 > \(\alpha\) = 0.05 sehingga \(H_0\) diterima. Dapat disimpulkan bahwa galat menyebar secara normal, yang artinya asumsi normalitas terpenuhi.
Uji Homogenitas
library(lmtest)
## Warning: package 'lmtest' was built under R version 4.2.3
## Loading required package: zoo
## Warning: package 'zoo' was built under R version 4.2.3
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
bptest(model.mkt)
##
## studentized Breusch-Pagan test
##
## data: model.mkt
## BP = 1.3307, df = 2, p-value = 0.5141
\(H_0\): Variansi sisaan homogen
\(H_1\): Variansi sisaan tidak homogen
Berdasarkan Breusch-Pagan test, diperoleh nilai p-value = 0.5141 > \(\alpha\) = 0.05 sehingga \(H_0\) diterima. Dapat disimpulkan bahwa tidak terjadi heterokedastisitas yang artinya asumsi homogenitas terpenuhi.
Uji Autokorelasi
dwtest(model.mkt)
##
## Durbin-Watson test
##
## data: model.mkt
## DW = 2.3648, p-value = 0.8194
## alternative hypothesis: true autocorrelation is greater than 0
\(H_0\): Tidak terjadi autokorelasi
\(H_1\): Terjadi autokorelasi
Berdasarkan uji Dubin-Watson, diperoleh nilai p-value = 0.8194 > \(\alpha\) = 0.05 sehingga \(H_0\) diterima. Dapat disimpulkan bahwa tidak terjadi kasus autokorelasi.
Uji Multikolinearitas
library(car)
## Warning: package 'car' was built under R version 4.2.3
## Loading required package: carData
## Warning: package 'carData' was built under R version 4.2.3
vif(model.mkt)
## X1 X2
## 1.29173 1.29173
Nilai VIF pada \(X_1\) dan \(X_2\) berada di bawah 10 maka tidak terjadi multikolinearitas, yang berarti asumsi multikolinearitas pada variabel independen terpenuhi.
Dari analisi regresi berganda pada data Tingkat kematian anak di bawah 5 tahun yang dipengaruhi oleh Presentase cakupan imunisasi Hepatitis B di antara anak-anak usia 1 tahun ,dan Presentase cakupan imunisasi campak, didapatkan model analisis berganda sebagai berikut
\[Y = 136.1927 -0.7353X_1 -0.4696X_2\] Dengan koefisien Determinasi atau R-squared sebesar 0.4731 artinya variabel prediktor \((X_1 dan X_2)\) mempengaruhi variabel respon \((Y)\) sebesar 47.31%, sedangkan sisanya dipengaruhi variabel lain di luar model.