Analisis Pengaruh Pendapatan Per Kapita dan Cakupan Imunisasi Hepatitis B Terhadap Angka Harapan Hidup di Benua Asia pada Tahun 2015 Menggunakan Regresi Linear Berganda

A. Pendahuluan

Di tengah dinamika pertumbuhan dan perkembangan di era globalisasi, angka harapan hidup menjadi salah satu indikator penting dalam mengukur kualitas hidup suatu populasi. Dalam konteks Benua Asia, yang merupakan kawasan dengan keragaman budaya, sosial, dan ekonomi yang luas, faktor-faktor yang memengaruhi angka harapan hidup menjadi perhatian utama dalam upaya meningkatkan kesejahteraan masyarakat. Di tengah kemajuan teknologi dan perubahan sosial yang pesat, studi tentang faktor-faktor yang memengaruhi angka harapan hidup menjadi semakin penting. Angka harapan hidup adalah salah satu indikator kesehatan masyarakat yang penting, dengan faktor-faktor pengaruh yang beragam. Diantaranya, pendapatan perkapita dianggap sebagai indikator kesejahteraan ekonomi suatu negara atau wilayah. Negara-negara dengan pendapatan per kapita tinggi cenderung memiliki akses yang lebih baik terhadap layanan kesehatan, gizi yang lebih baik, dan lingkungan yang lebih sehat, yang semuanya berkontribusi pada peningkatan angka harapan hidup. Sementara itu, imunisasi terhadap hepatitis, sebuah penyakit peradangan pada hati yang disebabkan oleh virus hepatitis, telah terbukti efektif dalam mencegah infeksi, khususnya hepatitis B. Negara-negara yang memiliki program imunisasi yang efektif cenderung memiliki tingkat prevalensi hepatitis yang lebih rendah, yang pada akhirnya dapat meningkatkan angka harapan hidup penduduknya.

Dalam rangka memahami dampak variabel-variabel ini terhadap angka harapan hidup di Benua Asia pada tahun 2015, analisis regresi linear berganda menjadi metode yang tepat. Melalui pendekatan ini, dapat mengidentifikasi dan mengukur seberapa signifikan pengaruh pendapatan per kapita dan imunisasi hepatitis B terhadap angka harapan hidup, serta mengeksplorasi pola hubungan antara variabel-variabel tersebut. Regresi linear berganda adalah sebuah metode statistika yang digunakan untuk memahami hubungan antara satu variabel dependen (terikat) dengan dua atau lebih variabel independen (bebas). Bentuk umum model regresi linear berganda adalah sebagai berikut.

\[ Y = \beta_0 + \beta_1X_1 + \beta_2X_2 + ... + \beta_nX_n + \epsilon \] Dengan $Y$ variabel dependen, $X_1, X_2, ..., X_n$ variabel independen, $\beta_0, \beta_1, \beta_2,.....,\beta_n$ parameter-parameter regresi dan $\epsilon$ sesatan.

B. Deskripsi Data

Data yang digunakan dalam analisis ini telah dipilih dengan cermat untuk memastikan relevansi dan kecocokan dengan tujuan analisis. Data tersebut terdiri dari berbagai variabel yang penting untuk memahami hubungan antara pendapatan per kapita dan persentase cakupan imunisasi hepatitis B dengan angka harapan hidup di negara-negara di Benua Asia pada tahun 2015. Berikut adalah penjelasan mengenai tiga variabel yang digunakan dalam analisis regresi linear berganda:

$Y$ (Life Expectancy): Angka harapan hidup

$X_1$(GDP per Capita): Pendapatan domestik bruto per kapita dalam USD ($)

$X_2$(Hepatitis B): Persentase cakupan imunisasi hepatitis B (HepB3) pada anak usia 1 tahun

1. Library

#Memuat packages 
library(readxl)
library (car)
library (lmtest)
library(plotly)
library(ggplot2)
library(knitr)

2. Data

#Mengimport data
data <- read_excel("D:/data.xlsx")
data

## # A tibble: 27 × 4
##    Country          Y    X1    X2
##    <chr>        <dbl> <dbl> <dbl>
##  1 Vietnam       75.1  2582    97
##  2 Nepal         69.5   902    91
##  3 Indonesia     70.8  3332    78
##  4 China         75.9  8016    99
##  5 India         68.6  1606    87
##  6 Turkmenistan  67.7  6433    99
##  7 Myanmar       65.8  1197    89
##  8 Azerbaijan    72.3  5500    96
##  9 Thailand      76.1  5840    99
## 10 Mongolia      69.1  3875    99
## # ℹ 17 more rows

C. Deskripsi Statistik

Statistika deskriptif adalah metode untuk merangkum dan menggambarkan karakteristik data. Dalam konteks ini, beberapa ukuran utama yang sering digunakan untuk menggambarkan data adalah Nilai Minimal (Min), Kuartil 1 (Q1), Median (Q2), Kuartil 3 (Q3), Rata-Rata (Mean), dan Nilai Maksimal (Max). Berikut merupakan statistika deskriptif dari ketiga variabel yang digunakan.

summary (data)

##    Country                Y               X1              X2       
##  Length:27          Min.   :63.40   Min.   :  556   Min.   :65.00  
##  Class :character   1st Qu.:68.85   1st Qu.: 1302   1st Qu.:89.00  
##  Mode  :character   Median :70.80   Median : 3001   Median :97.00  
##                     Mean   :71.98   Mean   : 7832   Mean   :92.04  
##                     3rd Qu.:75.40   3rd Qu.: 7224   3rd Qu.:99.00  
##                     Max.   :83.80   Max.   :55647   Max.   :99.00

Dalam analisis ini, variabel angka harapan hidup menunjukkan variasi dari angka minimal hingga maksimal, mencerminkan perbedaan dalam kualitas harapan hidup antar negara. Pendapatan per kapita mencerminkan variasi signifikan dalam kekayaan ekonomi di antara negara-negara yang dianalisis. Sementara itu, cakupan imunisasi Hepatitis B secara umum tinggi, namun masih ada negara-negara dengan cakupan yang kurang optimal.

D. Plot Data

1. Scatterplot Y vs X1

# Scatterplot Y vs X1
ggplot(data, aes(x = X1, y = Y)) +
  geom_point(color = "skyblue", shape = 16, size = 4, alpha = 0.7) +  
  geom_smooth(method = "lm", color = "orange", fill = "yellow", alpha = 0.3) + 
  labs(x = "X1", y = "Y", title = "Scatterplot of Y vs X1") +
  theme_minimal(base_size = 12) +
  theme(plot.title = element_text(face = "bold", size = 12),
  axis.title = element_text(face = "bold", size = 10), 
        axis.text = element_text(size = 10),  
        legend.title = element_text(face = "bold", size = 10), 
        legend.text = element_text(size = 10))

Scatter plot di atas menunjukkan hubungan antara dua variabel, $X_1$ dan $Y$. Titik-titik dalam scatter plot mengelompok bersama dalam tren linier positif, yang menunjukkan bahwa ada korelasi positif antara $X_1$ dan $Y$. Ini berarti bahwa ketika nilai $X_1$ meningkat, nilai $Y$ juga cenderung meningkat.

2. Scatterplot Y vs X2

# Scatterplot Y vs X2
ggplot(data, aes(x = X2, y = Y)) +
  geom_point(color = "skyblue", shape = 16, size = 4, alpha = 0.7) +  
  geom_smooth(method = "lm", color = "orange", fill = "yellow", alpha = 0.3) + 
  labs(x = "X2", y = "Y", title = "Scatterplot of Y vs X2") +
  theme_minimal(base_size = 12) +
  theme(plot.title = element_text(face = "bold", size = 12),
  axis.title = element_text(face = "bold", size = 10), 
        axis.text = element_text(size = 10),  
        legend.title = element_text(face = "bold", size = 10), 
        legend.text = element_text(size = 10))

Scatter plot pada gambar menunjukkan hubungan antara dua variabel, $X_2$ dan $Y$. Titik-titik dalam scatter plot mengelompok bersama dalam tren linier positif, yang menunjukkan bahwa ada korelasi positif antara $X_2$ dan $Y$. Ini berarti bahwa ketika nilai $X_2$ meningkat, nilai $Y$ juga cenderung meningkat.

E. Uji Signifikansi

1. Uji F

Uji F dalam regresi adalah alat statistik yang digunakan untuk menentukan apakah variabel independen secara bersama-sama (simultan) memiliki pengaruh yang signifikan terhadap variabel dependen dalam model regresi linear berganda.

Hipotesis:

$H_0$: Kedua variabel $X$ secara simultan tidak berpengaruh signifikan terhadap $Y$ (angka harapan hidup)

$H_1$: Minimal terdapat satu variabel $X$ yang berpengaruh signifikan terhadap $Y$ (angka harapan hidup)

Taraf signifikansi:

(α) = 5%

Daerah Kritis:

$H_0$ ditolak apabila nilai p-value < α = 0,05

Statistik Uji:

model = lm(Y~X1+X2,data = data)
summary(model)

## 
## Call:
## lm(formula = Y ~ X1 + X2, data = data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4.9846 -2.0421 -0.5631  2.3602  5.9937 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 5.568e+01  5.748e+00   9.687 9.12e-10 ***
## X1          2.662e-04  4.736e-05   5.621 8.72e-06 ***
## X2          1.545e-01  6.256e-02   2.469   0.0211 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.034 on 24 degrees of freedom
## Multiple R-squared:  0.6381, Adjusted R-squared:  0.608 
## F-statistic: 21.16 on 2 and 24 DF,  p-value: 5.039e-06

Kesimpulan:

Karena $P-value =$ $5,039$x$10^{-6}$ $< α = 0,05$ maka $H_0$ ditolak sehingga minimal terdapat satu variabel $X$ yang berpengaruh signifikan terhadap variabel $Y$ (angka harapan hidup).

2. Uji T

Uji t dalam regresi adalah alat statistik yang digunakan untuk menguji signifikansi individual dari setiap variabel independen dalam model regresi linear berganda.

Hipotesis:

Variabel $X_1$ (Pendapatan per kapita)

$H_0$: Pendapatan per kapita tidak berpengaruh signifikan terhadap angka harapan hidup

$H_1$: Pendapatan per kapita berpengaruh signifikan terhadap angka harapan hidup

Variabel $X_2$ (Persentase cakupan imunisasi hepatitis B)

$H_0$: Persentase cakupan imunisasi Hepatitis B tidak berpengaruh signifikan terhadap angka harapan hidup

$H_1$: Persentase cakupan imunisasi Hepatitis B berpengaruh signifikan terhadap angka harapan hidup

Taraf signifikansi:

(α) = 5%

Daerah Kritis:

$H_0$ ditolak apabila nilai p-value < α = 0,05

Statistik Uji:

summary(model)

## 
## Call:
## lm(formula = Y ~ X1 + X2, data = data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4.9846 -2.0421 -0.5631  2.3602  5.9937 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 5.568e+01  5.748e+00   9.687 9.12e-10 ***
## X1          2.662e-04  4.736e-05   5.621 8.72e-06 ***
## X2          1.545e-01  6.256e-02   2.469   0.0211 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.034 on 24 degrees of freedom
## Multiple R-squared:  0.6381, Adjusted R-squared:  0.608 
## F-statistic: 21.16 on 2 and 24 DF,  p-value: 5.039e-06

Kesimpulan:

Variabel $X_1$ (Pendapatan per kapita)

Karena $P-value =$ $8,72$x$10^{-6}$ $< α = 0,05$ maka $H_0$ ditolak, sehingga pendapatan per kapita berpengaruh signifikan terhadap angka harapan hidup.

Variabel $X_2$ (Persentase cakupan imunisasi hepatitis B)

Karena $P-value = 0,021$ $< α = 0,05$ maka $H_0$ ditolak, sehingga persentase cakupan imunisasi hepatitis B berpengaruh signifikan terhadap angka harapan hidup.

F. Uji Asumsi Klasik

Uji asumsi klasik adalah serangkaian persyaratan statistik yang harus dipenuhi agar model regresi linear berganda dapat memberikan hasil yang valid dan dapat diandalkan.

1. Uji Normalitas Residu

Hipotesis:

$H_0$: Residu berdistribusi normal

$H_1$: Residu tidak berdistribusi normal

Taraf signifikansi

(α) = 5%

Daerah Kritis:

$H_0$ ditolak apabila nilai p-value < α = 0,05

Statistik Uji:

shapiro.test(model$residuals)

## 
##  Shapiro-Wilk normality test
## 
## data:  model$residuals
## W = 0.96608, p-value = 0.5022

qqnorm(resid(model), col = "skyblue", pch = 20, cex = 1.5, main = "Q-Q Plot of Residuals", xlab = "Theoretical Quantiles", ylab = "Sample Quantiles")
qqline(resid(model), col = "orange", lwd = 2)

Kesimpulan:

Karena $P-value = 0,5022 > α = 0,05$ maka $H_0$ gagal ditolak sehingga residu berdistribusi normal. Selain itu titik-titik pada plot Q-Q tersebar secara merata di sekitar garis diagonal, menunjukkan bahwa distribusi dari residu model berdistribusi normal.

2. Uji Homoskedastisitas

Hipotesis:

$H_0$: Variansi residu homogen

$H_1$: Paling tidak terdapat satu variansi residu tidak homogen

Taraf signifikansi

(α) = 5%

Daerah Kritis:

$H_0$ ditolak apabila nilai p-value < α = 0,05

Statistik Uji:

bptest(model)

## 
##  studentized Breusch-Pagan test
## 
## data:  model
## BP = 4.1505, df = 2, p-value = 0.1255

plot(fitted(model), resid(model), col = "skyblue", pch = 16, main = "Homoskedasticity Plot", xlab = "Fitted Values", ylab = "Residuals")
abline(h = 0, col = "orange")

Kesimpulan:

Karena $P-value = 0,1255 > α = 0,05$ maka $H_0$ gagal ditolak sehingga variansi residu homogen. Selain itu, berdasarkan plot diatas, plot menyebar merata di atas dan di bawah sumbu 0 tanpa membentuk pola tertentu, maka dapat disimpulkan tidak terjadi gejala heterokedastisitas atau variansi residu homogen.

3. Uji Non Multikoleniaritas

Hipotesis:

$H_0$: Tidak terjadi multikoleniaritas

$H_1$: Terjadi multikoleniaritas

Taraf signifikansi

(α) = 5%

Daerah Kritis:

$H_0$ ditolak apabila nilai VIF > 10

Statistik Uji:

vif(model)

##       X1       X2 
## 1.019438 1.019438

Kesimpulan:

Karena nilai $VIF$ $X1$ dan $X2$ $= 1,019 < 10$ maka $H_0$ gagal ditolak sehingga tidak terjadi multikoleniaritas

4. Uji Non Autokorelasi

Hipotesis:

$H_0$: Tidak terdapat autokorelasi antar residu

$H_1$: Terdapat autokorelasi antar residu

Taraf signifikansi

(α) = 5%

Daerah Kritis:

$H_0$ ditolak apabila nilai p-value < α = 0,05

Statistik Uji:

dwtest(model)

## 
##  Durbin-Watson test
## 
## data:  model
## DW = 1.8481, p-value = 0.3361
## alternative hypothesis: true autocorrelation is greater than 0

Kesimpulan:

Karena $P-value = 0,3361 > α = 0,05$ maka $H_0$ gagal ditolak sehingga tidak terdapat autokorelasi antar residu

5. Hasil Uji Asumsi Klasik

Uji Asumsi	Memenuhi
Normalitas Residu	✓
Homoskedastisitas	✓
Non Multikolinearitas	✓
Non Autokorelasi	✓

Model regresi yang digunakan memenuhi uji asumsi klasik, menunjukkan bahwa model tersebut sesuai dengan asumsi-asumsi dasar yang umumnya diterima dalam analisis regresi linear berganda sehingga model tersebut cocok untuk digunakan dalam analisis lebih lanjut.

G. Model Regresi Linear Berganda

modelregresi <- lm(data$Y~data$`X1`+data$`X2`, data = data)
modelregresi

## 
## Call:
## lm(formula = data$Y ~ data$X1 + data$X2, data = data)
## 
## Coefficients:
## (Intercept)      data$X1      data$X2  
##   5.568e+01    2.662e-04    1.545e-01

summary(model)

## 
## Call:
## lm(formula = Y ~ X1 + X2, data = data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4.9846 -2.0421 -0.5631  2.3602  5.9937 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 5.568e+01  5.748e+00   9.687 9.12e-10 ***
## X1          2.662e-04  4.736e-05   5.621 8.72e-06 ***
## X2          1.545e-01  6.256e-02   2.469   0.0211 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.034 on 24 degrees of freedom
## Multiple R-squared:  0.6381, Adjusted R-squared:  0.608 
## F-statistic: 21.16 on 2 and 24 DF,  p-value: 5.039e-06

Berdasarkan hasil analisis regresi diatas didapatkan persamaan regresi:

$Y =$ $5.568$x$10^1$ + $2.662$x$10^{-4}$$X_1$ + $1.545$x$10^{-1}$$X_2$ + $\epsilon$

Interpretasi

Berdasarkan persamaan regresi di atas, setiap kenaikan satu dolar pendapatan per kapita (X1) akan meningkatkan angka harapan hidup (Y) sebesar $2.662$x$10^{-4}$ dan setiap kenaikan satu persen cakupan imunisasi hepatitis B (X2) akan meningkatkan angka harapan hidup (Y) sebesar $1.545$x$10^{-1}$. Selain itu, nilai Koefisien Determinasi sebesar 0,608 atau setara dengan 60,8%. Hal ini menunjukkan bahwa variabel independen dalam model regresi mampu menjelaskan variasi dari variabel dependen sebesar 60,8%. Sementara itu, sebesar 39,2% dari variasi lainnya dapat dijelaskan oleh faktor-faktor lain yang tidak termasuk dalam model ini. Dengan demikian, meskipun model memberikan penjelasan yang cukup signifikan terhadap variasi dalam angka harapan hidup, masih terdapat variasi yang belum dapat dijelaskan oleh variabel-variabel yang ada dalam model tersebut.

H. Kesimpulan

Berdasarkan analisis di atas dapat disimpulkan bahwa variabel $X_1$ (pendapatan per kapita) dan $X_2$ (persentase cakupan imunisasi hepatitis b) berpengaruh signfikan terhadap $Y$ (Life Expectancy) secara bersama-sama atau simultan dan secara parsial. Dan didapatkan persamaan regresi $Y =$ $5.568$x$10^1$ + $2.662$x$10^{-4}$$X_1$ + $1.545$x$10^{-1}$$X_2$ + $\epsilon$.Dengan terpenuhinya uji asumsi yakni uji normalitas residu, uji homoskedastisitas, uji non multikolinearitas, dan uji non autokorelasi maka model regresi ini layak untuk digunakan.

Pemahaman yang komprehensif terhadap faktor-faktor yang memengaruhi angka harapan hidup menjadi landasan yang kuat dalam merancang kebijakan dan program intervensi yang efektif untuk meningkatkan kesehatan dan kesejahteraan masyarakat secara keseluruhan. Dengan mengetahui kontribusi yang signifikan dari pendapatan per kapita dan cakupan imunisasi hepatitis B terhadap angka harapan hidup, pemangku kebijakan dapat mengalokasikan sumber daya dengan lebih cerdas, mengidentifikasi kelompok yang paling rentan, dan merancang strategi yang tepat untuk mengatasi masalah kesehatan masyarakat. Dengan pendekatan ini, upaya intervensi dapat menjadi lebih terarah dan efisien, memungkinkan perbaikan yang lebih besar dalam indikator kesehatan dan kesejahteraan masyarakat.

Analisis Pengaruh Pendapatan Per Kapita dan Cakupan Imunisasi Hepatitis B Terhadap Angka Harapan Hidup di Benua Asia pada Tahun 2015 Menggunakan Regresi Linear Berganda

Rr Rukmining W Dm - M0722068

A. Pendahuluan

B. Deskripsi Data

1. Library

2. Data

C. Deskripsi Statistik

D. Plot Data

1. Scatterplot Y vs X1

2. Scatterplot Y vs X2

E. Uji Signifikansi

1. Uji F

2. Uji T

F. Uji Asumsi Klasik

1. Uji Normalitas Residu

2. Uji Homoskedastisitas

3. Uji Non Multikoleniaritas

4. Uji Non Autokorelasi

5. Hasil Uji Asumsi Klasik

G. Model Regresi Linear Berganda

H. Kesimpulan