PENDAHULUAN

1. Latar Belakang

Stunting masih menjadi salah satu masalah kesehatan masyarakat yang serius di Indonesia. Kondisi ini mencerminkan gangguan pertumbuhan jangka panjang akibat kekurangan gizi kronis, infeksi berulang, serta pola asuh dan pola makan yang kurang optimal sejak masa bayi. Menurut hasil Survei Status Gizi Indonesia (SSGI) 2024 yang dirilis oleh Badan Kebijakan Pembangunan Kesehatan, Kementerian Kesehatan RI (2025), prevalensi balita stunting di Indonesia tercatat sebesar 21,5%. Angka ini menunjukkan penurunan dibandingkan tahun 2022 yang mencapai 27,7%, namun masih belum memenuhi target nasional sebesar 14% pada tahun 2024.

Salah satu faktor yang berperan penting dalam menurunkan angka stunting adalah pemberian imunisasi dasar lengkap. Imunisasi berfungsi melindungi bayi dari penyakit infeksi yang dapat menghambat pertumbuhan dan penyerapan gizi. Bayi yang memperoleh imunisasi secara lengkap cenderung memiliki daya tahan tubuh yang lebih baik dan berisiko lebih rendah mengalami kekurangan gizi kronis

Di sisi lain, pola konsumsi makanan tidak sehat pada bayi dan balita juga menjadi penyebab meningkatnya risiko stunting. Konsumsi makanan tinggi gula, garam, atau lemak, serta rendah zat gizi mikro seperti zat besi dan protein, dapat menghambat pertumbuhan optimal anak.

TINJAUAN PUSTAKA

1. Regresi Linear Berganda

Regresi linear berganda adalah metode analisis statistik yang digunakan untuk mengetahui pengaruh dua atau lebih variabel independen (bebas) terhadap satu variabel dependen (terikat), serta untuk memprediksi nilai variabel dependen tersebut.

2. Model Awal

Analisis regresi digunakan untuk mengukur seberapa besar pengaruh antara variabel bebas dan variabel terikat. Regresi linier berganda merupakan pengembangan dari regresi sederhana untuk menyatakan hubungan satu variabel tak bebas/ response (\(Y\)) dengan dua atau lebih variabel bebas/ predictor (\(X_1, X_2,…, X_n\)).Persamaan regresi yang diharapkan: \[ y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 +...+\beta_n X_n + \epsilon \]

3. Uji Asumsi

Suatu model regresi harus memenuhi beberapa asumsi yaitu residual bersifat independen, identik, dan berdistribusi normal, asumsi ini sering disebut dengan IIDN (Gujarati, 2004).

a. Normalitas

Uji normalitas digunakan dalam model regresi untuk menguji apakah nilai residual yang dihasilkan terdistribusi secara normal atau tidak. Secara formal menguji residual berdistribusi normal dapat digunakan uji Shapiro – Wilk. Apabila nilai p-value < α = 0,05 maka residual berdistribusi normal.

b. Linearitas

Uji linearitas bertujuan untuk mengetahui apakah dua variabel mempunyai hubungan yang linear atau tidak secara signifikan. Asumsi ini terpenuhi apabila plot-plot pada grafik Scatterplot menyebar acak dan tak membentuk pola.

c. Homoskedastisitas

Uji ini digunakan untuk mengetahui ada atau tidaknya penyimpangan asumsi klasik heteroskedastisitas yaitu adanya ketidaksamaan varian dari residual untuk semua pengamatan pada model regresi. jika residual menyebar secara acak dan tidak membentuk pola, maka asumsi Heteroskedastisitas terpenuhi.Secara formal, dapat dilihat dari nilai signifikansi untuk variabel X jika p-value > α, maka tidak terjadi gejala heteroskedastisitas.

d. Non Autokorelasi

Uji autokorelasi digunakan untuk mengetahui ada atau tidaknya penyimpangan asumsi klasik autokorelasi yaitu korelasi yang terjadi antara residual pada satu pengamatan dengan pengamatan lain pada model regresi. Apabila nilai p-value > α maka dapat disimpulkan bahwa tidak terdapat autokorelasi pada residual model regresi.

e. Multikolinearitas

Menurut Ghozali (2012), uji multikolinearitas bertujuan untuk menguji apakah model regresi ditemukan adanya korelasi antar variabel bebas (independen). Asumsi Non-Multikolinieritas terpenuhi atau tidak dengan melihat Nilai VIF, apabila nilai VIF < 10 maka dapat disimpulkan Asumsi Non-Multikolinieritas terpenuhi dan apabila nilai VIF > 10 maka Asumsi Non-Multikolinieritas tidak terpenuhi.

f. Uji F

Uji F digunakan untuk melakukan uji hipotesis koefisien (slope) regresi secara bersamaan dan memastikan bahwa model yang dipilih layak atau tidak untuk mengintepretasikan pengaruh variabel bebas terhadap variabel terikat. Apabila nilai probabilitas F-statistik < α (0,05) maka secara bersama-sama mempengaruhi variabel terikat.

g. Uji t

Uji t digunakan untuk menguji koefisien regresi secara individu. Apabila nilai probabilitas t-statistik < α (0,05), yang berarti bahwa variabel bebas berpengaruh di dalam model terhadap variabel terikat.

4. Model Akhir

Model akhir adalah persamaan yang sesuai dengan uji – uji asumsi yang diperoleh dan memenuhi asumsi – asumsi serta uji signifikansi yang telah dilakukan.

5. Koefisien Determinasi

Koefisien determinasi pada regresi linear sering diartikan sebagai seberapa besar kemampuan semua variabel bebas dalam menjelaskan varian dari variabel terikatnya. Koefisien determinasi digunakan untuk mempertimbangkan ketepatan model regresi.

6. MSE

Mean Squared Error (MSE) merupakan salah satu metrik evaluasi yang digunakan untuk mengukur tingkat kesalahan (error) dalam suatu model prediksi atau estimasi. MSE didefinisikan sebagai rata-rata dari kuadrat selisih antara nilai aktual dan nilai prediksi. Semakin kecil nilai MSE, semakin baik performa model dalam melakukan prediksi (Chai & Draxler, 2014).

METODOLOGI PENELITIAN

Data yang digunakan merupakan data dari 17 Provinsi di Indonesia dengan Status Gizi Stunting sebagai Variabel Dependen (\(Y\)), data Imunisasi Dasar Lengkap sebagai variabel independen (\(X_1\)), dan Capaian Tidak Makan Sehat (\(X_2\)). Data tersebut diperoleh dari Survei Status Gizi Indonesia tahun 2024.

HASIL & PEMBAHASAN

1. Pre-processing Data

Install Packages

library(lmtest)
library(readxl)
library(nortest)
library(car)

Input Data dari File Excel

data <- read_excel("C:/Users/Acer/Documents/Data_Regresi.xlsx")
head(data)
## # A tibble: 6 × 4
##   PROVINSI             Y    X1    X2
##   <chr>            <dbl> <dbl> <dbl>
## 1 ACEH              28.6   5.4  46.6
## 2 SUMATERA UTARA    22    27.6  41.2
## 3 SUMATERA BARAT    24.9  23.1  55.8
## 4 RIAU              20.1  27.2  46.1
## 5 JAMBI             17.1  41.3  39.9
## 6 SUMATERA SELATAN  15.9  46.8  41.8

2. Model Awal

regresi <- lm(Y~X1 + X2, data = data)
summary(regresi)
## 
## Call:
## lm(formula = Y ~ X1 + X2, data = data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -3.2737 -1.6182 -0.5515  1.4019  3.5249 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 17.33973    3.08369   5.623 6.28e-05 ***
## X1          -0.14978    0.02384  -6.282 2.02e-05 ***
## X2           0.18335    0.05945   3.084  0.00808 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.223 on 14 degrees of freedom
## Multiple R-squared:  0.781,  Adjusted R-squared:  0.7497 
## F-statistic: 24.97 on 2 and 14 DF,  p-value: 2.414e-05

Berdasarkan output di atas, maka diperoleh model awalnya: \[ y = 17.3397 -0.1498 X_1 + 0.1834 X_2 + \epsilon \]

3. Uji Asumsi Klasik

a. Asumsi Normalitas

  • Secara formal
shapiro.test(residuals(regresi))
## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(regresi)
## W = 0.93381, p-value = 0.2518

Berdasarkan output di atas, diperoleh nilai p-value sebesar 0.2518 dimana (p > α = 0,05). Sehingga, residual data berdistribusi normal

  • Secara visual
plot(regresi,2)

Berdasarkan output di atas, meskipun terdapat sedikit deviasi pada bagian ujung, sebagian besar titik tetap konsisten mengikuti garis linier. Hal ini memperkuat hasil uji Shapiro-Wilk bahwa residual data cenderung berdistribusi normal.

b. Asumsi Linearitas

plot(regresi,1)

Uji linearitas dilakukan dengan memeriksa plot Residuals vs Fitted. Berdasarkan grafik tersebut, terlihat bahwa garis merah cenderung mengikuti garis horizontal nol tanpa menunjukkan pola melengkung yang ekstrem (seperti pola parabola). Selain itu, titik-titik residual menyebar secara acak di sekitar garis nol tanpa membentuk pola tertentu. Hal ini menunjukkan bahwa hubungan antara variabel independen dan variabel dependen bersifat linier, sehingga asumsi linearitas dalam model regresi ini terpenuhi.

c. Asumsi Homoskedastisitas

  • Secara formal
bptest(regresi)
## 
##  studentized Breusch-Pagan test
## 
## data:  regresi
## BP = 1.4283, df = 2, p-value = 0.4896

Uji homoskedastisitas melalui Breusch-Pagan test menghasilkan nilai p-value sebesar 0.4896 dimana (p > α = 0,05), hal ini mengindikasikan bahwa varians residual bersifat homogen.

  • Secara visual
plot(regresi,3)

Berdasarkan plot share-location garis merah terlihat cukup mendatar dan titik-titik menyebar secara acak. Ini menunjukkan bahwa persebaran data stabil di seluruh rentang nilai prediksi. Sehingga dapat disimpulkan apabila asumsi homoskedastisitas terpenuhi secara visual.

d. Asumsi non Autokorelasi

dwtest(regresi)
## 
##  Durbin-Watson test
## 
## data:  regresi
## DW = 1.985, p-value = 0.3812
## alternative hypothesis: true autocorrelation is greater than 0

Berdasarkan hasil uji Durbin-Watson, diperoleh p-value sebesar 0.3812 yang mana (p > α = 0,05), sehingga dapat disimpulkan bahwa tidak terdapat autokorelasi pada residual model regresi.

e. Asumsi non Multikolinearitas

vif(regresi)
##       X1       X2 
## 1.000578 1.000578

Berdasarkan nilai VIF dari masing-masing variabel diperoleh VIF pada variabel \(X_1\) yaitu 1.0006 dan variabel \(X_2\) yaitu 1.0006, kedua nilai tersebut < 10. Sehingga, dari masing-masing variabel tidak terjadi gejala multikolinearitas.

4. Uji Asumsi Signifikansi

summary(regresi)
## 
## Call:
## lm(formula = Y ~ X1 + X2, data = data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -3.2737 -1.6182 -0.5515  1.4019  3.5249 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 17.33973    3.08369   5.623 6.28e-05 ***
## X1          -0.14978    0.02384  -6.282 2.02e-05 ***
## X2           0.18335    0.05945   3.084  0.00808 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.223 on 14 degrees of freedom
## Multiple R-squared:  0.781,  Adjusted R-squared:  0.7497 
## F-statistic: 24.97 on 2 and 14 DF,  p-value: 2.414e-05

a. Uji F

Berdasarkan hasil uji F, diperoleh nilai p-value sebesar 2.4^{-5} yang mana lebih kecil dari taraf signifikansi α = 0,05. Sehingga, dapat disimpulkan bahwa model regresi layak digunakan.

b. Uji t

Berdasarkan hasil uji t, diperoleh nilai p-value dari masing-masing variabel sebagai berikut:

\(X_1\) = 2^{-5}

\(X_2\) = 0.008081

Dari kedua variabel tersebut nilai p-value < α = 0,05. Sehingga, dapat disimpulkan bahwa kedua variabel berpengaruh secara signifikan terhadap variabel \(Y\).

5. Uji Koefisien Determinasi (\(R^2\))

Berdasarkan hasil uji koefisien determinasi, diperoleh nilai \(R^2\) sebesar 0.781 yang berarti Imunisasi Dasar Lengkap (\(X_1\)) dan Capaian Tidak Makan Sehat (\(X_2\)) mempengaruhi Status Gizi Stunting (\(Y\)) sebesar 78.1%, sedangkan sisanya 21.9% dipengaruhi oleh faktor lain.

6. MSE

predicted <- predict(regresi, data)
mse <- mean((data$Y - predicted)^2)
print(mse)
## [1] 4.068733

Berdasarkan output di atas diperoleh nilai MSE = 4.0687 Nilai tersebut tergolong rendah, sehingga dapat dikatakan model regresi cukup baik.

KESIMPULAN

Berdasarkan uji F, model regresi yang dibuat cocok digunakan untuk analisis lebih lanjut dan berdasarkan uji t, koefisien parameter regresi \(X\) yaitu \(\beta_1\) dan \(\beta_2\) berpengaruh signfikan terhadap \(Y\), sehingga model akhir sama dengan model awal. Adapun persamaannya, yaitu :

\[ \hat{Y} = 17.3397 -0.1498X_1 + 0.1834X_2 \] Setiap kenaikan 1 satuan Imunisasi Dasar Lengkap sebagai variabel independen (\(X_1\)) akan menurunkan Status Gizi Stunting (\(Y\)) sebesar -0.1498. Sedangkan setiap kenaikan 1 satuan Capaian Tidak Makan Sehat (\(X_2\)) akan menaikkan Status Gizi Stunting (\(Y\)) sebesar 0.1834.