Di tengah dinamika pertumbuhan dan perkembangan di era globalisasi, angka harapan hidup menjadi salah satu indikator penting dalam mengukur kualitas hidup suatu populasi. Dalam konteks Benua Asia, yang merupakan kawasan dengan keragaman budaya, sosial, dan ekonomi yang luas, faktor-faktor yang memengaruhi angka harapan hidup menjadi perhatian utama dalam upaya meningkatkan kesejahteraan masyarakat. Di tengah kemajuan teknologi dan perubahan sosial yang pesat, studi tentang faktor-faktor yang memengaruhi angka harapan hidup menjadi semakin penting. Angka harapan hidup adalah salah satu indikator kesehatan masyarakat yang penting, dengan faktor-faktor pengaruh yang beragam. Diantaranya, pendapatan perkapita dianggap sebagai indikator kesejahteraan ekonomi suatu negara atau wilayah. Negara-negara dengan pendapatan per kapita tinggi cenderung memiliki akses yang lebih baik terhadap layanan kesehatan, gizi yang lebih baik, dan lingkungan yang lebih sehat, yang semuanya berkontribusi pada peningkatan angka harapan hidup. Sementara itu, imunisasi terhadap hepatitis, sebuah penyakit peradangan pada hati yang disebabkan oleh virus hepatitis, telah terbukti efektif dalam mencegah infeksi, khususnya hepatitis B. Negara-negara yang memiliki program imunisasi yang efektif cenderung memiliki tingkat prevalensi hepatitis yang lebih rendah, yang pada akhirnya dapat meningkatkan angka harapan hidup penduduknya.
Dalam rangka memahami dampak variabel-variabel ini terhadap angka harapan hidup di Benua Asia pada tahun 2015, analisis regresi linear berganda menjadi metode yang tepat. Melalui pendekatan ini, dapat mengidentifikasi dan mengukur seberapa signifikan pengaruh pendapatan per kapita dan imunisasi hepatitis B terhadap angka harapan hidup, serta mengeksplorasi pola hubungan antara variabel-variabel tersebut. Regresi linear berganda adalah sebuah metode statistika yang digunakan untuk memahami hubungan antara satu variabel dependen (terikat) dengan dua atau lebih variabel independen (bebas). Bentuk umum model regresi linear berganda adalah sebagai berikut.
\[ Y = \beta_0 + \beta_1X_1 + \beta_2X_2 + ... + \beta_nX_n + \epsilon \] Dengan \(Y\) variabel dependen, \(X_1, X_2, ..., X_n\) variabel independen, \(\beta_0, \beta_1, \beta_2,.....,\beta_n\) parameter-parameter regresi dan \(\epsilon\) sesatan.
Data yang digunakan dalam analisis ini telah dipilih dengan cermat untuk memastikan relevansi dan kecocokan dengan tujuan analisis. Data tersebut terdiri dari berbagai variabel yang penting untuk memahami hubungan antara pendapatan per kapita dan persentase cakupan imunisasi hepatitis B dengan angka harapan hidup di negara-negara di Benua Asia pada tahun 2015. Berikut adalah penjelasan mengenai tiga variabel yang digunakan dalam analisis regresi linear berganda:
\(Y\) (Life Expectancy): Angka harapan hidup
\(X_1\)(GDP per Capita): Pendapatan domestik bruto per kapita dalam USD ($)
\(X_2\)(Hepatitis B): Persentase cakupan imunisasi hepatitis B (HepB3) pada anak usia 1 tahun
#Memuat packages
library(readxl)
library (car)
library (lmtest)
library(plotly)
library(ggplot2)
library(knitr)
#Mengimport data
data <- read_excel("D:/data.xlsx")
data
## # A tibble: 27 × 4
## Country Y X1 X2
## <chr> <dbl> <dbl> <dbl>
## 1 Vietnam 75.1 2582 97
## 2 Nepal 69.5 902 91
## 3 Indonesia 70.8 3332 78
## 4 China 75.9 8016 99
## 5 India 68.6 1606 87
## 6 Turkmenistan 67.7 6433 99
## 7 Myanmar 65.8 1197 89
## 8 Azerbaijan 72.3 5500 96
## 9 Thailand 76.1 5840 99
## 10 Mongolia 69.1 3875 99
## # ℹ 17 more rows
Statistika deskriptif adalah metode untuk merangkum dan menggambarkan karakteristik data. Dalam konteks ini, beberapa ukuran utama yang sering digunakan untuk menggambarkan data adalah Nilai Minimal (Min), Kuartil 1 (Q1), Median (Q2), Kuartil 3 (Q3), Rata-Rata (Mean), dan Nilai Maksimal (Max). Berikut merupakan statistika deskriptif dari ketiga variabel yang digunakan.
summary (data)
## Country Y X1 X2
## Length:27 Min. :63.40 Min. : 556 Min. :65.00
## Class :character 1st Qu.:68.85 1st Qu.: 1302 1st Qu.:89.00
## Mode :character Median :70.80 Median : 3001 Median :97.00
## Mean :71.98 Mean : 7832 Mean :92.04
## 3rd Qu.:75.40 3rd Qu.: 7224 3rd Qu.:99.00
## Max. :83.80 Max. :55647 Max. :99.00
Dalam analisis ini, variabel angka harapan hidup menunjukkan variasi dari angka minimal hingga maksimal, mencerminkan perbedaan dalam kualitas harapan hidup antar negara. Pendapatan per kapita mencerminkan variasi signifikan dalam kekayaan ekonomi di antara negara-negara yang dianalisis. Sementara itu, cakupan imunisasi Hepatitis B secara umum tinggi, namun masih ada negara-negara dengan cakupan yang kurang optimal.
# Scatterplot Y vs X1
ggplot(data, aes(x = X1, y = Y)) +
geom_point(color = "skyblue", shape = 16, size = 4, alpha = 0.7) +
geom_smooth(method = "lm", color = "orange", fill = "yellow", alpha = 0.3) +
labs(x = "X1", y = "Y", title = "Scatterplot of Y vs X1") +
theme_minimal(base_size = 12) +
theme(plot.title = element_text(face = "bold", size = 12),
axis.title = element_text(face = "bold", size = 10),
axis.text = element_text(size = 10),
legend.title = element_text(face = "bold", size = 10),
legend.text = element_text(size = 10))
Scatter plot di atas menunjukkan hubungan antara dua variabel, \(X_1\) dan \(Y\). Titik-titik dalam scatter plot mengelompok bersama dalam tren linier positif, yang menunjukkan bahwa ada korelasi positif antara \(X_1\) dan \(Y\). Ini berarti bahwa ketika nilai \(X_1\) meningkat, nilai \(Y\) juga cenderung meningkat.
# Scatterplot Y vs X2
ggplot(data, aes(x = X2, y = Y)) +
geom_point(color = "skyblue", shape = 16, size = 4, alpha = 0.7) +
geom_smooth(method = "lm", color = "orange", fill = "yellow", alpha = 0.3) +
labs(x = "X2", y = "Y", title = "Scatterplot of Y vs X2") +
theme_minimal(base_size = 12) +
theme(plot.title = element_text(face = "bold", size = 12),
axis.title = element_text(face = "bold", size = 10),
axis.text = element_text(size = 10),
legend.title = element_text(face = "bold", size = 10),
legend.text = element_text(size = 10))
Scatter plot pada gambar menunjukkan hubungan antara dua variabel, \(X_2\) dan \(Y\). Titik-titik dalam scatter plot mengelompok bersama dalam tren linier positif, yang menunjukkan bahwa ada korelasi positif antara \(X_2\) dan \(Y\). Ini berarti bahwa ketika nilai \(X_2\) meningkat, nilai \(Y\) juga cenderung meningkat.
Uji F dalam regresi adalah alat statistik yang digunakan untuk menentukan apakah variabel independen secara bersama-sama (simultan) memiliki pengaruh yang signifikan terhadap variabel dependen dalam model regresi linear berganda.
Hipotesis:
\(H_0\): Kedua variabel \(X\) secara simultan tidak berpengaruh signifikan terhadap \(Y\) (angka harapan hidup)
\(H_1\): Minimal terdapat satu variabel \(X\) yang berpengaruh signifikan terhadap \(Y\) (angka harapan hidup)
Taraf signifikansi:
(α) = 5%
Daerah Kritis:
\(H_0\) ditolak apabila nilai p-value < α = 0,05
Statistik Uji:
model = lm(Y~X1+X2,data = data)
summary(model)
##
## Call:
## lm(formula = Y ~ X1 + X2, data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -4.9846 -2.0421 -0.5631 2.3602 5.9937
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 5.568e+01 5.748e+00 9.687 9.12e-10 ***
## X1 2.662e-04 4.736e-05 5.621 8.72e-06 ***
## X2 1.545e-01 6.256e-02 2.469 0.0211 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.034 on 24 degrees of freedom
## Multiple R-squared: 0.6381, Adjusted R-squared: 0.608
## F-statistic: 21.16 on 2 and 24 DF, p-value: 5.039e-06
Kesimpulan:
Karena \(P-value =\) \(5,039\)x\(10^{-6}\) \(< α = 0,05\) maka \(H_0\) ditolak sehingga minimal terdapat satu variabel \(X\) yang berpengaruh signifikan terhadap variabel \(Y\) (angka harapan hidup).
Uji t dalam regresi adalah alat statistik yang digunakan untuk menguji signifikansi individual dari setiap variabel independen dalam model regresi linear berganda.
Hipotesis:
Variabel \(X_1\) (Pendapatan per kapita)
\(H_0\): Pendapatan per kapita tidak berpengaruh signifikan terhadap angka harapan hidup
\(H_1\): Pendapatan per kapita berpengaruh signifikan terhadap angka harapan hidup
Variabel \(X_2\) (Persentase cakupan imunisasi hepatitis B)
\(H_0\): Persentase cakupan imunisasi Hepatitis B tidak berpengaruh signifikan terhadap angka harapan hidup
\(H_1\): Persentase cakupan imunisasi Hepatitis B berpengaruh signifikan terhadap angka harapan hidup
Taraf signifikansi:
(α) = 5%
Daerah Kritis:
\(H_0\) ditolak apabila nilai p-value < α = 0,05
Statistik Uji:
summary(model)
##
## Call:
## lm(formula = Y ~ X1 + X2, data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -4.9846 -2.0421 -0.5631 2.3602 5.9937
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 5.568e+01 5.748e+00 9.687 9.12e-10 ***
## X1 2.662e-04 4.736e-05 5.621 8.72e-06 ***
## X2 1.545e-01 6.256e-02 2.469 0.0211 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.034 on 24 degrees of freedom
## Multiple R-squared: 0.6381, Adjusted R-squared: 0.608
## F-statistic: 21.16 on 2 and 24 DF, p-value: 5.039e-06
Kesimpulan:
Variabel \(X_1\) (Pendapatan per kapita)
Karena \(P-value =\) \(8,72\)x\(10^{-6}\) \(< α = 0,05\) maka \(H_0\) ditolak, sehingga pendapatan per kapita berpengaruh signifikan terhadap angka harapan hidup.
Variabel \(X_2\) (Persentase cakupan imunisasi hepatitis B)
Karena \(P-value = 0,021\) \(< α = 0,05\) maka \(H_0\) ditolak, sehingga persentase cakupan imunisasi hepatitis B berpengaruh signifikan terhadap angka harapan hidup.
Uji asumsi klasik adalah serangkaian persyaratan statistik yang harus dipenuhi agar model regresi linear berganda dapat memberikan hasil yang valid dan dapat diandalkan.
Hipotesis:
\(H_0\): Residu berdistribusi normal
\(H_1\): Residu tidak berdistribusi normal
Taraf signifikansi
(α) = 5%
Daerah Kritis:
\(H_0\) ditolak apabila nilai p-value < α = 0,05
Statistik Uji:
shapiro.test(model$residuals)
##
## Shapiro-Wilk normality test
##
## data: model$residuals
## W = 0.96608, p-value = 0.5022
qqnorm(resid(model), col = "skyblue", pch = 20, cex = 1.5, main = "Q-Q Plot of Residuals", xlab = "Theoretical Quantiles", ylab = "Sample Quantiles")
qqline(resid(model), col = "orange", lwd = 2)
Kesimpulan:
Karena \(P-value = 0,5022 > α = 0,05\) maka \(H_0\) gagal ditolak sehingga residu berdistribusi normal. Selain itu titik-titik pada plot Q-Q tersebar secara merata di sekitar garis diagonal, menunjukkan bahwa distribusi dari residu model berdistribusi normal.
Hipotesis:
\(H_0\): Variansi residu homogen
\(H_1\): Paling tidak terdapat satu variansi residu tidak homogen
Taraf signifikansi
(α) = 5%
Daerah Kritis:
\(H_0\) ditolak apabila nilai p-value < α = 0,05
Statistik Uji:
bptest(model)
##
## studentized Breusch-Pagan test
##
## data: model
## BP = 4.1505, df = 2, p-value = 0.1255
plot(fitted(model), resid(model), col = "skyblue", pch = 16, main = "Homoskedasticity Plot", xlab = "Fitted Values", ylab = "Residuals")
abline(h = 0, col = "orange")
Kesimpulan:
Karena \(P-value = 0,1255 > α = 0,05\) maka \(H_0\) gagal ditolak sehingga variansi residu homogen. Selain itu, berdasarkan plot diatas, plot menyebar merata di atas dan di bawah sumbu 0 tanpa membentuk pola tertentu, maka dapat disimpulkan tidak terjadi gejala heterokedastisitas atau variansi residu homogen.
Hipotesis:
\(H_0\): Tidak terjadi multikoleniaritas
\(H_1\): Terjadi multikoleniaritas
Taraf signifikansi
(α) = 5%
Daerah Kritis:
\(H_0\) ditolak apabila nilai VIF > 10
Statistik Uji:
vif(model)
## X1 X2
## 1.019438 1.019438
Kesimpulan:
Karena nilai \(VIF\) \(X1\) dan \(X2\) \(= 1,019 < 10\) maka \(H_0\) gagal ditolak sehingga tidak terjadi multikoleniaritas
Hipotesis:
\(H_0\): Tidak terdapat autokorelasi antar residu
\(H_1\): Terdapat autokorelasi antar residu
Taraf signifikansi
(α) = 5%
Daerah Kritis:
\(H_0\) ditolak apabila nilai p-value < α = 0,05
Statistik Uji:
dwtest(model)
##
## Durbin-Watson test
##
## data: model
## DW = 1.8481, p-value = 0.3361
## alternative hypothesis: true autocorrelation is greater than 0
Kesimpulan:
Karena \(P-value = 0,3361 > α = 0,05\) maka \(H_0\) gagal ditolak sehingga tidak terdapat autokorelasi antar residu
| Uji Asumsi | Memenuhi |
|---|---|
| Normalitas Residu | ✓ |
| Homoskedastisitas | ✓ |
| Non Multikolinearitas | ✓ |
| Non Autokorelasi | ✓ |
Model regresi yang digunakan memenuhi uji asumsi klasik, menunjukkan bahwa model tersebut sesuai dengan asumsi-asumsi dasar yang umumnya diterima dalam analisis regresi linear berganda sehingga model tersebut cocok untuk digunakan dalam analisis lebih lanjut.
modelregresi <- lm(data$Y~data$`X1`+data$`X2`, data = data)
modelregresi
##
## Call:
## lm(formula = data$Y ~ data$X1 + data$X2, data = data)
##
## Coefficients:
## (Intercept) data$X1 data$X2
## 5.568e+01 2.662e-04 1.545e-01
summary(model)
##
## Call:
## lm(formula = Y ~ X1 + X2, data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -4.9846 -2.0421 -0.5631 2.3602 5.9937
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 5.568e+01 5.748e+00 9.687 9.12e-10 ***
## X1 2.662e-04 4.736e-05 5.621 8.72e-06 ***
## X2 1.545e-01 6.256e-02 2.469 0.0211 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.034 on 24 degrees of freedom
## Multiple R-squared: 0.6381, Adjusted R-squared: 0.608
## F-statistic: 21.16 on 2 and 24 DF, p-value: 5.039e-06
Berdasarkan hasil analisis regresi diatas didapatkan persamaan regresi:
\(Y =\) \(5.568\)x\(10^1\) + \(2.662\)x\(10^{-4}\)\(X_1\) + \(1.545\)x\(10^{-1}\)\(X_2\) + \(\epsilon\)
Interpretasi
Berdasarkan persamaan regresi di atas, setiap kenaikan satu dolar pendapatan per kapita (X1) akan meningkatkan angka harapan hidup (Y) sebesar \(2.662\)x\(10^{-4}\) dan setiap kenaikan satu persen cakupan imunisasi hepatitis B (X2) akan meningkatkan angka harapan hidup (Y) sebesar \(1.545\)x\(10^{-1}\). Selain itu, nilai Koefisien Determinasi sebesar 0,608 atau setara dengan 60,8%. Hal ini menunjukkan bahwa variabel independen dalam model regresi mampu menjelaskan variasi dari variabel dependen sebesar 60,8%. Sementara itu, sebesar 39,2% dari variasi lainnya dapat dijelaskan oleh faktor-faktor lain yang tidak termasuk dalam model ini. Dengan demikian, meskipun model memberikan penjelasan yang cukup signifikan terhadap variasi dalam angka harapan hidup, masih terdapat variasi yang belum dapat dijelaskan oleh variabel-variabel yang ada dalam model tersebut.
Berdasarkan analisis di atas dapat disimpulkan bahwa variabel \(X_1\) (pendapatan per kapita) dan \(X_2\) (persentase cakupan imunisasi hepatitis b) berpengaruh signfikan terhadap \(Y\) (Life Expectancy) secara bersama-sama atau simultan dan secara parsial. Dan didapatkan persamaan regresi \(Y =\) \(5.568\)x\(10^1\) + \(2.662\)x\(10^{-4}\)\(X_1\) + \(1.545\)x\(10^{-1}\)\(X_2\) + \(\epsilon\).Dengan terpenuhinya uji asumsi yakni uji normalitas residu, uji homoskedastisitas, uji non multikolinearitas, dan uji non autokorelasi maka model regresi ini layak untuk digunakan.
Pemahaman yang komprehensif terhadap faktor-faktor yang memengaruhi angka harapan hidup menjadi landasan yang kuat dalam merancang kebijakan dan program intervensi yang efektif untuk meningkatkan kesehatan dan kesejahteraan masyarakat secara keseluruhan. Dengan mengetahui kontribusi yang signifikan dari pendapatan per kapita dan cakupan imunisasi hepatitis B terhadap angka harapan hidup, pemangku kebijakan dapat mengalokasikan sumber daya dengan lebih cerdas, mengidentifikasi kelompok yang paling rentan, dan merancang strategi yang tepat untuk mengatasi masalah kesehatan masyarakat. Dengan pendekatan ini, upaya intervensi dapat menjadi lebih terarah dan efisien, memungkinkan perbaikan yang lebih besar dalam indikator kesehatan dan kesejahteraan masyarakat.