Analisis Regresi Linear Berganda Kematian Orang Dewasa per Seribu Populasi di Indonesia Pada Tahun 2002 Sampai 2015

Aulia Ardila Pratiwi

Pendahuluan

Analsis regresi berganda merupakan analisis yang digunakan untuk menunjukkan ada tidaknya hubungan kausalitas (sebab-akibat) atau pengaruh antara lebih dari satu variabel independent (X1, X2, …, Xi) terhadap satu variabel dependent. Analisis regresi digunakan untuk mengukur seberapa besar pengaruh antara variabel bebas dan variabel terikat. Apabila hanya terdapat satu variabel bebas dan satu variabel terikat, maka regresi tersebut dinamakan regresi linear sederhana (Juliandi, Irfan, & Manurung, 2014). Sebaliknya, apabila terdapat lebih dari satu variabel bebas atau variabel terikat, maka disebut regresi linear berganda. Regresi linear berganda merupakan model regresi yang melibatkan lebih dari satu variabel independen. Analisis regresi linear berganda dilakukan untuk mengetahui arah dan seberapa besar pengaruh variabel independen terhadap variabel dependen (Ghozali, 2018).

Menurut Mentgomery and Peck (2006), persamaan umum model regresi linear berganda dapat ditulis dalam persamaan berikut : \[Y = \beta_0 + \beta_1X_1 + \beta_2X_2 +...+\beta_pX_p + \epsilon_i\]

Pada analisis regresi linear berganda menggunakan beberapa uji asumsi, yaitu:

Asumsi Normalitas

Uji Normalitas adalah sebuah uji yang dilakukan dengan tujuan untuk menilai sebaran data pada sebuah kelompok data atau variabel, apakah sebaran data tersebut berdistribusi normal ataukah tidak.
Asumsi Non-Multikolinearitas

Uji multikolinearitas dilakukan untuk menguji apakah terdapat korelasi antar variabel bebas dalam model regresi. Multikolinearitas berarti adanya hubungan linier yang sempurna antara beberapa atau semua variabel yang menjelaskan model regresi (Ajija, 2011). Ada atau tidaknya multikolinearitas dapat diketahui dari koefisien korelasi dari masing-masing variabel independen.
Asumsi Non-Heteroskedastisitas

Uji heteroskedastisitas dilakukan dengan tujuan untuk menguji apakah terdapat ketidaksamaan variance maupun residual dari suatu pengamatan ke pengamatan lainnya. Uji heteroskedastisitas dilakukan untuk mengetahui apakah pada suatu model regresi terjadi ketidaknyamanan varian dari residual pada satu pengamatan terhadap pengamatan lainnya.
Asumsi Non-Autokorelasi

Uji autokorelasi bertujuan untuk menguji apakah dalam suatu model regresi linear ada korelasi antara kesalahan pengganggu pada periode t dengan kesalahan pada periode t-1 (sebelumnya). Jika terjadi korelasi, maka terdapat autokorelasi.”

Metode Penelitian

Library

Pada analisis ini, akan dilakukan uji regresi linear berganda pada data kematian orang dewasa per seribu populasi di Indonesia pada tahun 2002 sampai 2015. Sebelum diuji lebih lanjut, terlebih dahulu kita siapkan library yang akan digunakan.

# Memuat paket yang diperlukan
library(readxl)
library(dplyr)
library(lmtest)
library(car)
library(ggplot2)

Sumber Data

Dari analisis kematian orang dewasa per seribu populasi di Indonesia pada tahun 2002 sampai 2015, kemudian diambil 3 variabel independen yaitu:

Alcohol_consumption : Konsumsi alkohol murni (dalam liter) per kapita pada usia 15+ tahun
Measles : Mewakili % cakupan imunisasi Campak yang mengandung imunisasi dosis pertama vaksin (MCV1) di antara anak usia 1 tahun
BMI : BMI adalah ukuran status gizi pada orang dewasa. Itu didefinisikan sebagai berat seseorang dalam kilogram dibagi dengan kuadrat

Variabel dependen yang akan digunakan adalah Adult_mortality di Indonesia pada tahun 2002 sampai 2015.

# Membaca Data dari File Excel
data <- read_excel("C:/Users/ACER/Documents/dataaa.xlsx")
data

## # A tibble: 16 × 4
##    Adult_mortality Alcohol_consumption Measles   BMI
##              <dbl>               <dbl>   <dbl> <dbl>
##  1            192.               0.054      24  21.8
##  2            187.               0.071      66  22.3
##  3            176.               0.08       31  23  
##  4            181.               0.08       78  22.7
##  5            191.               0.054      29  22  
##  6            189.               0.062      50  22.2
##  7            191.               0.063      23  21.6
##  8            183.               0.08       76  22.6
##  9            184.               0.08       74  22.5
## 10            177.               0.09       28  22.9
## 11            185.               0.074      67  22.4
## 12            191.               0.05       21  21.9
## 13            179.               0.09       76  22.8
## 14            191.               0.06       25  21.7
## 15            188.               0.061      73  22.2
## 16            190.               0.059      23  22.1

Hasil dan Pembahasan

Statistik Deskriptif

# statistik Deskriptif Untuk Setiap Variabel
summary(data)

##  Adult_mortality Alcohol_consumption    Measles           BMI       
##  Min.   :175.6   Min.   :0.05000     Min.   :21.00   Min.   :21.60  
##  1st Qu.:182.2   1st Qu.:0.05975     1st Qu.:24.75   1st Qu.:21.98  
##  Median :187.7   Median :0.06700     Median :40.50   Median :22.25  
##  Mean   :186.0   Mean   :0.06925     Mean   :47.75   Mean   :22.29  
##  3rd Qu.:190.7   3rd Qu.:0.08000     3rd Qu.:73.25   3rd Qu.:22.62  
##  Max.   :192.1   Max.   :0.09000     Max.   :78.00   Max.   :23.00

Melalui statistik deskriptif diatas, didapatkan nilai minimum, mean, kuartil bawah, median, kuartil atas, dan nilai maksimum dari keempat variabel. Pada variabel Adult_mortality, didapatkan nilai minimum 175.6, mean 186, kuartil bawah 182.2, median 187.7, kuartil atas 190.7, dan nilai maksimumnya 192.1. Begitu hingga hasil pada setiap variabel lainnya.

Korelasi Variabel

Untuk melihat hubungan dari masing-masing variabel, maka akan dicari nilai korelasinya.

# Menghitung matriks korelasi
cor_matrix <- cor(data)
cor_matrix <- round(cor_matrix, 2)
cor_matrix

##                     Adult_mortality Alcohol_consumption Measles   BMI
## Adult_mortality                1.00               -0.92   -0.40 -0.96
## Alcohol_consumption           -0.92                1.00    0.55  0.88
## Measles                       -0.40                0.55    1.00  0.51
## BMI                           -0.96                0.88    0.51  1.00

Melalui output diatas, dapat disimpulkan bahwa:

Adult_mortality dan Alcohol_consumption memiliki nilai korelasi -0,92. Artinya kedua variabel ini memiliki hubungan berkebalikan yang sangat kuat.
Adult_mortality dan Measles memiliki nilai korelasi -0,40. Artinya kedua variabel ini memiliki hubungan berkebalikan yang cukup kuat.
Adult_mortality dan BMI memiliki nilai korelasi -0,96. Artinya kedua variabel ini memiliki hubungan berkebalikan yang sangat kuat.

Uji Asumsi Klasik

# Model Regresi
model.mkt=lm(Adult_mortality~.,data=data)
summary(model.mkt)

## 
## Call:
## lm(formula = Adult_mortality ~ ., data = data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -1.7931 -0.4615  0.1101  0.5524  1.4571 
## 
## Coefficients:
##                       Estimate Std. Error t value Pr(>|t|)    
## (Intercept)          387.86600   24.74672  15.673 2.35e-09 ***
## Alcohol_consumption -174.37787   41.81883  -4.170   0.0013 ** 
## Measles                0.04185    0.01276   3.279   0.0066 ** 
## BMI                   -8.60243    1.21766  -7.065 1.31e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.9822 on 12 degrees of freedom
## Multiple R-squared:  0.9736, Adjusted R-squared:  0.967 
## F-statistic: 147.4 on 3 and 12 DF,  p-value: 9.846e-10

Uji Asumsi Linearitas

#Uji Asumsi Linearitas Menggunkan Ramsey RESET
ramsey_test <- resettest(model.mkt, power = 3)
ramsey_test

## 
##  RESET test
## 
## data:  model.mkt
## RESET = 0.12186, df1 = 1, df2 = 11, p-value = 0.7336

Dengan nilai p-value = 0.7336 > 0.05, maka tidak ada cukup bukti untuk menolak asumsi linearitas dan dapat disimpulkan bahwa model regresi linear berganda tersebut memenuhi asumsi linearitas.

Uji Normalitas Residual

# Grafik QQ Plot Untuk Normalitas Residual
qqnorm(resid(model.mkt))

# Histogram Dari Residual
ggplot(data.frame(Residual=resid(model.mkt)), aes(x=Residual)) +
  geom_histogram(binwidth=0.5, fill="maroon", color="black") +
  labs(x = "Residual", y = "Count", title = "Histogram of Residuals")

# Uji Normalitas Residual Model
residu = resid(model.mkt)
ks.test(residu, "pnorm")

## 
##  Exact one-sample Kolmogorov-Smirnov test
## 
## data:  residu
## D = 0.11141, p-value = 0.9757
## alternative hypothesis: two-sided

shapiro.test(residu)

## 
##  Shapiro-Wilk normality test
## 
## data:  residu
## W = 0.98232, p-value = 0.9793

Melalui output diatas, dapat disimpulkan bahwa:

Melalui plot normal Q-Q, terlihat bahwa plot menunjukkan pola normal. Hal ini terlihat dari titik yang menyebar di sekitar grafik normal dan penyebarannya mengikuti garis diagonal.
Melalui histogram, terlihat bahwa bentuknya sesuai dengan kurva distribusi normal.
Melalui Uji Shapiro-Wilk, diperoleh nilai p-value = 0.9793 > 0.05 maka tidak terbukti adanya pelanggaran pada asumsi normalitas yang berarti asumsi residual berdistribusi normal terpenuhi.

Uji Non - Heteroskedastisitas

# Grafik Residual Plot Untuk Non-Heteroskedastisitas
plot(model.mkt, which = 1)

# Uji Non-Heteroskedastisitas
bptest(model.mkt)

## 
##  studentized Breusch-Pagan test
## 
## data:  model.mkt
## BP = 6.0775, df = 3, p-value = 0.1079

Melalui output diatas, dapat disimpulkan bahwa:

Melalui plot residu untuk non-heteroskedastisitas, terlihat bahwa titik-titik data tersebar dan tidak membentuk pola tertentu, sehingga tidak terjadi perbedaan variansi residual yang artinya model regresi memenuhi uji asumsi non-heteroskedastisitas.
Melalui Uji Breusch-Pagan, diperoleh p-value = 0.1079 > 0.05 yang berarti uji asumsi non-heteroskedastisitas terpenuhi

Uji Non - Multikolinearitas

# Uji Multikolinearitas
vif(model.mkt)

## Alcohol_consumption             Measles                 BMI 
##            4.595614            1.450730            4.317982

vif_values <- vif(model.mkt)

# Membuat plot VIF
plot(vif_values, type = "bar", main = "VIF Plot")

Dari output diperoleh nilai VIF ketiga variabel independen < 10 sehingga tidak terjadi multikolinearitas yang berarti asumsi non-multikolinearitas terpenuhi.

Uji Autokorelasi Residual

# Uji Autokorelasi Residual
durbinWatsonTest(model.mkt)

##  lag Autocorrelation D-W Statistic p-value
##    1     -0.05850253      1.931174   0.988
##  Alternative hypothesis: rho != 0

Berdasarkan uji autokorelasi diatas, diperoleh p-value = 0.938 > 0.05 yang berarti bahwa asumsi tidak terjadinya autokorelasi terpenuhi.

Model Regresi Linear Berganda

# Ringkasan model 
summary(model.mkt)

## 
## Call:
## lm(formula = Adult_mortality ~ ., data = data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -1.7931 -0.4615  0.1101  0.5524  1.4571 
## 
## Coefficients:
##                       Estimate Std. Error t value Pr(>|t|)    
## (Intercept)          387.86600   24.74672  15.673 2.35e-09 ***
## Alcohol_consumption -174.37787   41.81883  -4.170   0.0013 ** 
## Measles                0.04185    0.01276   3.279   0.0066 ** 
## BMI                   -8.60243    1.21766  -7.065 1.31e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.9822 on 12 degrees of freedom
## Multiple R-squared:  0.9736, Adjusted R-squared:  0.967 
## F-statistic: 147.4 on 3 and 12 DF,  p-value: 9.846e-10

Melalui output diatas, diperoleh:

Didapatkan model regresi linear berganda yaitu:

\[Y = -174.377787X_1 + 0.04185X_2-8.60243X_3 + \epsilon\] Artinya, jika variabel Adult_mortality naik sebanyak 1 orang, maka variabel Alcohol_consumption akan turun sebesar 174.37787, menaikkan variabel Measles sebesar 0.04185, dan menurunkan variabel BMI sebesar 8.60243.

Uji Simultan

Nilai p-value = 9.846e-10 < 0.05, sehingga dapat disimpulkan bahwa terdapat pengaruh yang signifikan antara variabel independen terhadap variabel dependen secara simultan.

Uji Parsial

Variabel Alcohol_consumption, Measles, dan BMI memiliki p- value secara berturut-turut 2.35e-09, 0.0066, dan 1.31e-05 < 0.05 yang berarti bahwa kedua variabel ini secara parsial berpengaruh signifikan terhadap variabel dependen.

Nilai Koefisien Determinasi

Nilai ini diperoleh dari Adjusted R-Square yang memiliki nilai 0.967 atau 96,7%. Artinya, variabel independen dalam model regresi ini mampu menjelaskan variasi dari variabel dependen sebesar 96,7%. Sedangkan 3.,3% lainnya dapat dijelaskan oleh variabel lain yang tidak termasuk dalam model ini.