Stunting masih menjadi salah satu masalah kesehatan masyarakat yang serius di Indonesia. Kondisi ini mencerminkan gangguan pertumbuhan jangka panjang akibat kekurangan gizi kronis, infeksi berulang, serta pola asuh dan pola makan yang kurang optimal sejak masa bayi. Menurut hasil Survei Status Gizi Indonesia (SSGI) 2024 yang dirilis oleh Badan Kebijakan Pembangunan Kesehatan, Kementerian Kesehatan RI (2025), prevalensi balita stunting di Indonesia tercatat sebesar 21,5%. Angka ini menunjukkan penurunan dibandingkan tahun 2022 yang mencapai 27,7%, namun masih belum memenuhi target nasional sebesar 14% pada tahun 2024.
Salah satu faktor yang berperan penting dalam menurunkan angka stunting adalah pemberian imunisasi dasar lengkap. Imunisasi berfungsi melindungi bayi dari penyakit infeksi yang dapat menghambat pertumbuhan dan penyerapan gizi. Bayi yang memperoleh imunisasi secara lengkap cenderung memiliki daya tahan tubuh yang lebih baik dan berisiko lebih rendah mengalami kekurangan gizi kronis
Di sisi lain, pola konsumsi makanan tidak sehat pada bayi dan balita juga menjadi penyebab meningkatnya risiko stunting. Konsumsi makanan tinggi gula, garam, atau lemak, serta rendah zat gizi mikro seperti zat besi dan protein, dapat menghambat pertumbuhan optimal anak.
Regresi linear berganda adalah metode analisis statistik yang digunakan untuk mengetahui pengaruh dua atau lebih variabel independen (bebas) terhadap satu variabel dependen (terikat), serta untuk memprediksi nilai variabel dependen tersebut.
Analisis regresi digunakan untuk mengukur seberapa besar pengaruh antara variabel bebas dan variabel terikat. Regresi linier berganda merupakan pengembangan dari regresi sederhana untuk menyatakan hubungan satu variabel tak bebas/ response (\(Y\)) dengan dua atau lebih variabel bebas/ predictor (\(X_1, X_2,…, X_n\)).Persamaan regresi yang diharapkan: \[ y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 +...+\beta_n X_n + \epsilon \]
Suatu model regresi harus memenuhi beberapa asumsi yaitu residual bersifat independen, identik, dan berdistribusi normal, asumsi ini sering disebut dengan IIDN (Gujarati, 2004).
Uji normalitas digunakan dalam model regresi untuk menguji apakah nilai residual yang dihasilkan terdistribusi secara normal atau tidak. Secara formal menguji residual berdistribusi normal dapat digunakan uji Shapiro – Wilk. Apabila nilai p-value < α = 0,05 maka residual berdistribusi normal.
Uji linearitas bertujuan untuk mengetahui apakah dua variabel mempunyai hubungan yang linear atau tidak secara signifikan. Asumsi ini terpenuhi apabila plot-plot pada grafik Scatterplot menyebar acak dan tak membentuk pola.
Uji ini digunakan untuk mengetahui ada atau tidaknya penyimpangan asumsi klasik heteroskedastisitas yaitu adanya ketidaksamaan varian dari residual untuk semua pengamatan pada model regresi. jika residual menyebar secara acak dan tidak membentuk pola, maka asumsi Heteroskedastisitas terpenuhi.Secara formal, dapat dilihat dari nilai signifikansi untuk variabel X jika p-value > α, maka tidak terjadi gejala heteroskedastisitas.
Uji autokorelasi digunakan untuk mengetahui ada atau tidaknya penyimpangan asumsi klasik autokorelasi yaitu korelasi yang terjadi antara residual pada satu pengamatan dengan pengamatan lain pada model regresi. Apabila nilai p-value > α maka dapat disimpulkan bahwa tidak terdapat autokorelasi pada residual model regresi.
Menurut Ghozali (2012), uji multikolinearitas bertujuan untuk menguji apakah model regresi ditemukan adanya korelasi antar variabel bebas (independen). Asumsi Non-Multikolinieritas terpenuhi atau tidak dengan melihat Nilai VIF, apabila nilai VIF < 10 maka dapat disimpulkan Asumsi Non-Multikolinieritas terpenuhi dan apabila nilai VIF > 10 maka Asumsi Non-Multikolinieritas tidak terpenuhi.
Uji F digunakan untuk melakukan uji hipotesis koefisien (slope) regresi secara bersamaan dan memastikan bahwa model yang dipilih layak atau tidak untuk mengintepretasikan pengaruh variabel bebas terhadap variabel terikat. Apabila nilai probabilitas F-statistik < α (0,05) maka secara bersama-sama mempengaruhi variabel terikat.
Uji t digunakan untuk menguji koefisien regresi secara individu. Apabila nilai probabilitas t-statistik < α (0,05), yang berarti bahwa variabel bebas berpengaruh di dalam model terhadap variabel terikat.
Model akhir adalah persamaan yang sesuai dengan uji – uji asumsi yang diperoleh dan memenuhi asumsi – asumsi serta uji signifikansi yang telah dilakukan.
Koefisien determinasi pada regresi linear sering diartikan sebagai seberapa besar kemampuan semua variabel bebas dalam menjelaskan varian dari variabel terikatnya. Koefisien determinasi digunakan untuk mempertimbangkan ketepatan model regresi.
Mean Squared Error (MSE) merupakan salah satu metrik evaluasi yang digunakan untuk mengukur tingkat kesalahan (error) dalam suatu model prediksi atau estimasi. MSE didefinisikan sebagai rata-rata dari kuadrat selisih antara nilai aktual dan nilai prediksi. Semakin kecil nilai MSE, semakin baik performa model dalam melakukan prediksi (Chai & Draxler, 2014).
Data yang digunakan merupakan data dari 17 Provinsi di Indonesia dengan Status Gizi Stunting sebagai Variabel Dependen (\(Y\)), data Imunisasi Dasar Lengkap sebagai variabel independen (\(X_1\)), dan Capaian Tidak Makan Sehat (\(X_2\)). Data tersebut diperoleh dari Survei Status Gizi Indonesia tahun 2024.
library(lmtest)
library(readxl)
library(nortest)
library(car)
data <- read_excel("C:/Users/Acer/Documents/Data_Regresi.xlsx")
head(data)
## # A tibble: 6 × 4
## PROVINSI Y X1 X2
## <chr> <dbl> <dbl> <dbl>
## 1 ACEH 28.6 5.4 46.6
## 2 SUMATERA UTARA 22 27.6 41.2
## 3 SUMATERA BARAT 24.9 23.1 55.8
## 4 RIAU 20.1 27.2 46.1
## 5 JAMBI 17.1 41.3 39.9
## 6 SUMATERA SELATAN 15.9 46.8 41.8
regresi <- lm(Y~X1 + X2, data = data)
summary(regresi)
##
## Call:
## lm(formula = Y ~ X1 + X2, data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -3.2737 -1.6182 -0.5515 1.4019 3.5249
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 17.33973 3.08369 5.623 6.28e-05 ***
## X1 -0.14978 0.02384 -6.282 2.02e-05 ***
## X2 0.18335 0.05945 3.084 0.00808 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 2.223 on 14 degrees of freedom
## Multiple R-squared: 0.781, Adjusted R-squared: 0.7497
## F-statistic: 24.97 on 2 and 14 DF, p-value: 2.414e-05
Berdasarkan output di atas, maka diperoleh model awalnya: \[ y = 17.3397 -0.1498 X_1 + 0.1834 X_2 + \epsilon \]
shapiro.test(residuals(regresi))
##
## Shapiro-Wilk normality test
##
## data: residuals(regresi)
## W = 0.93381, p-value = 0.2518
Berdasarkan output di atas, diperoleh nilai p-value sebesar 0.2518 dimana (p > α = 0,05). Sehingga, residual data berdistribusi normal
plot(regresi,2)
Berdasarkan output di atas, meskipun terdapat sedikit deviasi pada bagian ujung, sebagian besar titik tetap konsisten mengikuti garis linier. Hal ini memperkuat hasil uji Shapiro-Wilk bahwa residual data cenderung berdistribusi normal.
plot(regresi,1)
Uji linearitas dilakukan dengan memeriksa plot Residuals vs Fitted. Berdasarkan grafik tersebut, terlihat bahwa garis merah cenderung mengikuti garis horizontal nol tanpa menunjukkan pola melengkung yang ekstrem (seperti pola parabola). Selain itu, titik-titik residual menyebar secara acak di sekitar garis nol tanpa membentuk pola tertentu. Hal ini menunjukkan bahwa hubungan antara variabel independen dan variabel dependen bersifat linier, sehingga asumsi linearitas dalam model regresi ini terpenuhi.
bptest(regresi)
##
## studentized Breusch-Pagan test
##
## data: regresi
## BP = 1.4283, df = 2, p-value = 0.4896
Uji homoskedastisitas melalui Breusch-Pagan test menghasilkan nilai p-value sebesar 0.4896 dimana (p > α = 0,05), hal ini mengindikasikan bahwa varians residual bersifat homogen.
plot(regresi,3)
Berdasarkan plot share-location garis merah terlihat cukup mendatar dan titik-titik menyebar secara acak. Ini menunjukkan bahwa persebaran data stabil di seluruh rentang nilai prediksi. Sehingga dapat disimpulkan apabila asumsi homoskedastisitas terpenuhi secara visual.
dwtest(regresi)
##
## Durbin-Watson test
##
## data: regresi
## DW = 1.985, p-value = 0.3812
## alternative hypothesis: true autocorrelation is greater than 0
Berdasarkan hasil uji Durbin-Watson, diperoleh p-value sebesar 0.3812 yang mana (p > α = 0,05), sehingga dapat disimpulkan bahwa tidak terdapat autokorelasi pada residual model regresi.
vif(regresi)
## X1 X2
## 1.000578 1.000578
Berdasarkan nilai VIF dari masing-masing variabel diperoleh VIF pada variabel \(X_1\) yaitu 1.0006 dan variabel \(X_2\) yaitu 1.0006, kedua nilai tersebut < 10. Sehingga, dari masing-masing variabel tidak terjadi gejala multikolinearitas.
summary(regresi)
##
## Call:
## lm(formula = Y ~ X1 + X2, data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -3.2737 -1.6182 -0.5515 1.4019 3.5249
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 17.33973 3.08369 5.623 6.28e-05 ***
## X1 -0.14978 0.02384 -6.282 2.02e-05 ***
## X2 0.18335 0.05945 3.084 0.00808 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 2.223 on 14 degrees of freedom
## Multiple R-squared: 0.781, Adjusted R-squared: 0.7497
## F-statistic: 24.97 on 2 and 14 DF, p-value: 2.414e-05
Berdasarkan hasil uji F, diperoleh nilai p-value sebesar 2.4^{-5} yang mana lebih kecil dari taraf signifikansi α = 0,05. Sehingga, dapat disimpulkan bahwa model regresi layak digunakan.
Berdasarkan hasil uji t, diperoleh nilai p-value dari masing-masing variabel sebagai berikut:
\(X_1\) = 2^{-5}
\(X_2\) = 0.008081
Dari kedua variabel tersebut nilai p-value < α = 0,05. Sehingga, dapat disimpulkan bahwa kedua variabel berpengaruh secara signifikan terhadap variabel \(Y\).
Berdasarkan hasil uji koefisien determinasi, diperoleh nilai \(R^2\) sebesar 0.781 yang berarti Imunisasi Dasar Lengkap (\(X_1\)) dan Capaian Tidak Makan Sehat (\(X_2\)) mempengaruhi Status Gizi Stunting (\(Y\)) sebesar 78.1%, sedangkan sisanya 21.9% dipengaruhi oleh faktor lain.
predicted <- predict(regresi, data)
mse <- mean((data$Y - predicted)^2)
print(mse)
## [1] 4.068733
Berdasarkan output di atas diperoleh nilai MSE = 4.0687 Nilai tersebut tergolong rendah, sehingga dapat dikatakan model regresi cukup baik.
Berdasarkan uji F, model regresi yang dibuat cocok digunakan untuk analisis lebih lanjut dan berdasarkan uji t, koefisien parameter regresi \(X\) yaitu \(\beta_1\) dan \(\beta_2\) berpengaruh signfikan terhadap \(Y\), sehingga model akhir sama dengan model awal. Adapun persamaannya, yaitu :
\[ \hat{Y} = 17.3397 -0.1498X_1 + 0.1834X_2 \] Setiap kenaikan 1 satuan Imunisasi Dasar Lengkap sebagai variabel independen (\(X_1\)) akan menurunkan Status Gizi Stunting (\(Y\)) sebesar -0.1498. Sedangkan setiap kenaikan 1 satuan Capaian Tidak Makan Sehat (\(X_2\)) akan menaikkan Status Gizi Stunting (\(Y\)) sebesar 0.1834.