BAB I

PENDAHULUAN

1.1 Latar Belakang

Mortalitas atau kematian merupakan salah satu dari tiga komponen demografiyang dapat mempengaruhi jumlah dan komposisi umur penduduk. Salah satu mortalitas yang dikenal yaitu kematian bayi (infant mortality). Kematian bayi dapat didefinisikan sebagai kematian yang terjadi pada bayi dengan usia kurang dari 1 tahun. Kematian bayi dapat diwakili oleh angka kematian bayi, dimana angka kematian bayi merupakan jumlah kematian bayi di bawah usia 1 tahun padatahun tersebut per 1000 kelahiran(Putri, 2022).

Tujuan SDGs menekankan pentingnya menjamin kehidupan yang sehat bagi seluruh lapisan masyarakat serta meningkatkan kesejahteraan bagi setiap kelompok usia. Menurut data UNICEF tahun 2020, angka kematian bayi (AKB) global menyentuh 2,5 juta kasus kematian sebelum usia 1 bulan (Permata Sari et al., 2023). Menurut Organisasi Kesehatan Dunia (WHO), pada tahun 2022, 2,3 juta anak di seluruh dunia telah meninggal dalam waktu 20 hari setelah lahir. Wilayah Afrika Sub-Sahara menduduki angka kematian bayi paling tinggi secara global, yakni 27 kematian per 1.000 KH. Angka ini disusul oleh wilayah Asia Selatan dan Tengah dengan 21 kematian per 1.000 KH (WHO, 2024).

Menurut data United Nations Inter-agency Group for Child Mortality Estimation tahun 2022 Indonesia menduduki peringkat ke-48 di antara seluruh negara dengan 18 kematian per 1.000 KH(United Nations Inter-agency Group for Child Mortality E & (UNIGME), 2024). Indonesia menduduki urutan ke 6 dengan kasus kematian bayi paling tinggi di ASEAN dengan 18 kematian per 1000 KH pada tahun 2022. Angka ini terbilang tinggi dibandingkan negara Malaysia yang memiliki tingkat kematian bayi sebesar 7 per 1000 KH dan Singapore 2 per 1000 KH. Dari seluruh negara ASEAN, Timor Leste berada pada tingkat kematian bayi paling tinggi, yaitu 42 kematian per 1.000 KH, dan disusul oleh Laos dengan kematian bayi sebesar 33 per 1000 KH (United Nations Inter agency Group for Child Mortality E & (UNIGME), 2024).

untuk menekan kejadian AKB adalah melakukan tindakan preventif terhadap faktor-faktor yang mempengaruhi AKB. Untuk menganalisis faktor-faktor yang memengaruhi AKB, salah satu metode statistik yang umum digunakan adalah analisis regresi, yaitu teknik yang memodelkan hubungan antara variabel terikat dengan satu atau lebih variabel bebas (Chatterjee, 2015). Dalam penerapan analisis regresi memungkinkan adanya kendala dalam asumsi klasik regresi, terutama asumsi homoskedastisitas, yaitu bahwa varians residual bersifat konstan pada seluruh observasi. Namun, dalam praktiknya, data yang digunakan sering kali tidak sepenuhnya memenuhi asumsi-asumsi dasar regresi linier, seperti kesamaan varians (homoskedastisitas) dan tidak adanya pengaruh ekstrem (outlier) pada beberapa observasi. Kondisi tersebut dapat menyebabkan hasil estimasi menjadi kurang efisien dan menurunkan ketepatan interpretasi hubungan antarvariabel.

Selain itu, adanya perbedaan karakteristik antarwilayah, baik dari segi jumlah penduduk, fasilitas kesehatan, maupun kondisi sosial ekonomi, dapat menimbulkan variasi ekstrem dalam data yang tidak dapat sepenuhnya ditangani oleh metode regresi linier biasa (OLS). Oleh karena itu, diperlukan pendekatan yang lebih tahan terhadap pengaruh nilai-nilai ekstrem dan pelanggaran asumsi klasik. Salah satu metode yang dapat digunakan adalah regresi robust dengan estimasi MM (MM-estimator), yang memiliki kemampuan untuk menghasilkan estimasi parameter yang stabil meskipun terdapat outlier atau penyimpangan dari asumsi klasik. Pendekatan ini diharapkan dapat memberikan hasil analisis yang lebih akurat dan mencerminkan hubungan yang sebenarnya antara variabel-variabel yang memengaruhi jumlah kematian bayi di Indonesia.

1.2 Identifikasi Masalah

Berdasarkan uraian pada latar belakang, maka rumusan masalah dalam penelitian ini adalah sebagai berikut:

  1. Bagaimana pengaruh variabel-variabel independen terhadap Angka Kematian Bayi di Indonesia dengan menggunakan OLS?

  2. Apakah terdapat perbedaan hasil estimasi parameter antara model Ordinary Least Squares (OLS) dan model Regresi Robust (MM-Estimator) setelah mengatasi pengaruh outlier?

  3. Apakah penggunaan metode Regresi Robust (MM-Estimator) dapat menghasilkan model yang lebih akurat dan stabil dibandingkan dengan model OLS dalam menjelaskan faktor-faktor yang memengaruhi Angka Kematian Bayi di Indonesia?

1.3 Tujuan

Adapun tujuan dari penelitian ini adalah sebagai berikut:

  1. Untuk menganalisis pengaruh variabel-variabel independen terhadap Angka Kematian Bayi di Indonesia dengan OLS.

  2. Untuk membandingkan hasil estimasi parameter antara model OLS dan Regresi Robust (MM-Estimator) setelah mengatasi pengaruh outlier.

  3. Untuk mengevaluasi efektivitas penggunaan metode Regresi Robust (MM-Estimator) dalam menghasilkan model yang lebih akurat dan stabil dalam menjelaskan faktor-faktor yang memengaruhi Angka Kematian Bayi di Indonesia.

1.4 Keterbatasan

Penelitian ini memiliki beberapa keterbatasan yang perlu diperhatikan dalam interpretasi hasil analisis. Pertama, penelitian hanya berfokus pada perbandingan dua pendekatan pemodelan, yaitu Regresi Ordinary Least Squares (OLS) dan Regresi Robust dengan metode MM-Estimator. Dengan demikian, penelitian ini tidak mencakup metode regresi lain seperti regresi ridge, lasso, atau pendekatan nonlinier yang mungkin dapat memberikan hasil berbeda. Kedua, variabel terikat yang digunakan terbatas pada Angka Kematian Bayi di Indonesia, sehingga hasil analisis tidak secara langsung mencerminkan kondisi indikator kesehatan anak lainnya, seperti angka kematian neonatal atau kematian balita. Ketiga, penelitian ini menggunakan data tingkat provinsi tahun 2024 sehingga hasil yang diperoleh hanya berlaku pada tingkat agregasi dan periode waktu tersebut, serta belum dapat digeneralisasikan untuk analisis lintas tahun atau lintas negara.

BAB II

TINJAUAN PUSTAKA

2.1 Regresi Linear Berganda

Konsep regresi linier pertama kali di kemukakan oleh Sir Francis Galton pada tahun 1894, menurutnya regresi linier merupakan penerapan dari pengujian statistik terhadap sekumpulan data dan menghitung hubungan antar variabel yang di selidiki (Chen, 2002). Variabel yang di selidiki hubungannya adalah variabel bebas (𝑿) dan variabel terikat (𝒀), dimana pada regresi linier berganda variabel bebas terdiri lebih dari satu variabel. Misalkan 𝑘 variabel bebas, model matematis regresi linier berganda diberikan sebagai berikut (Huang, 2015):

\[ Y = \beta_{0} + \beta_{1}X_{1i} + \beta_{2}X_{2i} + \cdots + \beta_{k}X_{ki} + \varepsilon_{i} \]

dimana:

\(Y_i\) : nilai variabel dependen dalam pengamatan ke-i

\(\beta_{0}, \beta_1, \beta_{2}, \cdots , \beta_{k}\) : parameter yang tidak diketahui nilainya

\(X_{1i}, X_{2i},\cdots , X_{ki}\): nilai dari variable independen dari pengamatan ke-i

\(\varepsilon_{i}\) : error

2.2 Regresi OLS

OLS (Ordinary Least Square) merupakan metode regresi yang meminiimumkan jumlah kesalahan (error) kuadrat. Metode estimasi parameter yang digunakan adalah metode OLS (Ordinary Least Square), yaitu menduga koefisien regresi \((β)\) dengan meminimumkan kesalahan (error). Adapun penaksir parameternya adalah sebagai berikut:

\[ \hat{\boldsymbol{\beta}} = (X^{\top}X)^{-1}X^{\top}y \]

Dimana:

\(\hat{\boldsymbol{\beta}}\) : vektor dari parameter yang diestimasi berukuran \((p+1) \times 1\)

\(X\) : matriks variabel prediktor berukuran \(n \times (p+1) \times 1\)

\(y\) : vektor observasi dari variable respon berukuran \(n \times 1\)

Standar error untuk estimator OLS dihitung berdasarkan asumsi homoskedastisitas (varian error konstan) dengan rumus:

\[\widehat{Var}(\hat{\beta}_{OLS}) = \hat{\sigma}^2(\mathbf{X}^\top \mathbf{X})^{-1}\]

Dengan:

\[ \hat{\sigma}^2 = \frac{\sum_{i=1}^n \hat{\varepsilon}_i^2}{n-k} \]

Metode OLS memberikan estimasi yang efisien ketika asumsi klasik terpenuhi. Namun, karena menggunakan kuadrat residual sebagai fungsi loss, OLS menjadi sangat sensitif terhadap outlier dan pelanggaran asumsi homoskedastisitas, yang dapat menyebabkan hasil estimasi menjadi bias dan tidak stabil.

Deteksi Outlier

Cook’s Distance digunakan untuk mendeteksi data outlier atau influential points yang berpotensi memengaruhi hasil model secara signifikan (Cook, 1977).Cook’s Distance mengukur pengaruh observasi terhadap koefisien regresi:

\[ D_i = \frac{\sum_{j=1}^{n} (\hat{y}_j - \hat{y}_{j(i)})^2}{p \times MSE} \]

Dengan:

\(p\) : Jumlah parameter dalam model

\(MSE\) : Mean squared error

\(\hat{y_i}\) :Prediksi dengan model penuh

\(\hat{y}_{j(i)}\) :Prediksi tanpa observasi ke-i

Nilai \(D_i\) yang melebihi batas ambang umum mengindikasikan bahwa observasi tersebut memiliki pengaruh yang besar terhadap hasil estimasi. observasi dengan nilai Cook’s Distance tinggi tidak selalu identik dengan outlier. Outlier mengacu pada penyimpangan nilai yang ekstrem dari pola umum data, sedangkan influential point berfokus pada sejauh mana suatu observasi memengaruhi stabilitas model. Dengan demikian, interpretasi Cook’s Distance perlu mempertimbangkan kedua aspek tersebut agar hasil analisis lebih komprehensif.

2.4 Regresi Robust

Regresi Robust pertama kali diperkenalkan oleh Andrews (1972). Menurut Hurint (2006) Regresi Robust merupakan metode regresi yang digunakan ketika distribusi dari nilai residual tidak normal dan adanya beberapa pencilan berpengaruh pada model. Metode ini merupakan alat penting untuk menganalisa data yang dipengaruhi oleh pencilan sehingga dihasilkan model yang robust atau tahan terhadap pencilan. Secara umum, pada metode estimasi parameter pada regresi robust, akan ditambahkan komponen pembobot yang disimbolkan sebagai 𝑾 (Chen, 2002).

\[ \hat{\boldsymbol{\beta}}_{robust} = (\boldsymbol{X}^t \boldsymbol{W} \boldsymbol{X})^{-1} \boldsymbol{X}^t \boldsymbol{W} \boldsymbol{Y} \] Dimana $_{robust} $ erupakan koefisien regresi robust pada iterasi ke-\(𝑚\) yang berukuran \((𝑘+1)×1\). Dalam regresi robust, dikenal beberapa jenis estimasi parameter, yaitu estimasi Least Trimmed Square (LTS-estimation), estimasi Maximum Likelihood Type (M-estimation), estimasi Scale (S-estimation), dan estimasi Method of Moment (MM-estimation). pada penelitian ini dibatasi hanya dengan menggunakan MM-Estimation.

Robust MM-Estimation

Menurut Chen (2002), MM-estimation pertama kali dikenalkan oleh Yohai (1987) untuk regresi linier. Menurut Yohai (1987), MMestimation merupakan gabungan dari metode estimasi yang mempunyai nilai breakdown tinggi (metode LTS-estimation atau S-estimation) dan metode M-estimation memiliki tiga tahap. Tahap pertama yaitu menghitung estimasi parameter awal regresi dengan metode yang memiliki breakdown value tinggi seperti S-estimation dan LTS estimation. Tahap kedua, menghitung residual dan skala estimasi robust dengan menggunakan Mestimator. Ketiga, menghitung estimasi parameter akhir dengan M-estimation. MM-estimation didefinisikan sebagai berikut.

\[ \hat{\beta} = \min \sum \rho \left( \frac{e_i}{\hat{\sigma}} \right) = \min \sum_{i=1}^{n} \rho \left( \frac{Y_i - \sum_{j=1}^{p} x_{ij} \beta_j}{\hat{\sigma}_s} \right) \]

2.5 Critical Review Metode Alternatif

OLS

Regresi OLS merupakan metode fondasi yang menawarkan solusi estimasi yang efisien dan matematis yang jelas.

  • Kekuatan utamanya adalah sifat BLUE (Best Linear Unbiased Estimator), yang menjamin bahwa di antara semua estimator linier yang tidak bias, OLS memberikan varian terkecil, asalkan asumsi klasik terpenuhi. Namun, kelemahan mendasar OLS terletak pada fungsi loss kuadratik yang digunakan. Dengan meminimumkan \(n \sum \epsilon_i^2\)

  • OLS memberikan bobot yang sangat besar pada observasi yang memiliki residual besar (outlier), yang dapat mendistorsi garis regresi. Akibatnya, estimasi koefisien \(\hat{\beta}\) menjadi bias dan tidak stabil ketika data mengandung pencilan berpengaruh atau terjadi pelanggaran asumsi homoskedastisitas, membuat hasil inferensi standar error \(\widehat{Var}(\hat{\beta}_{\text{OLS}})\) menjadi tidak valid.

Regresi Robust

Regresi Robust, khususnya MM-Estimation, merupakan model alternatif yang dikembangkan untuk mengatasi kerentanan OLS terhadap outlier.

  • Metode ini bekerja dengan meminimumkan fungsi ρ dari residual terstandardisasi, \(\min \sum \rho \left( \frac{e_i}{\hat{\sigma}} \right)\), di mana fungsi ρ tidak membebankan residual besar secara drastis, sehingga membatasi pengaruh pencilan.

  • MM-Estimation memiliki tiga tahap strategis yang bertujuan untuk mencapai breakdown value tinggi (ketahanan maksimum terhadap outlier) sambil mempertahankan efisiensi yang wajar. Dengan menggunakan S-Estimation atau LTS-Estimation di tahap awal untuk mendapatkan estimasi yang sangat tahan, dan diikuti dengan M-Estimation, MM-Estimation memastikan bahwa hasil akhir parameter \(\hat{\beta}\) tidak didominasi oleh beberapa observasi ekstrem.

BAB III

METODOLOGI PENELITIAN

3.1 Data penelitian

Data yang digunakan dalam penelitian ini terdiri atas 3 variabel bebas dan satu variabel terikat dengan jumlah data sebanyak 38 Provinsi di Indonesia yang bersumber dari laporan profil kesehatan Indonesia 2024. Variabel-variabel yang digunakan dalam penelitian ini yaitu angka kematian bayi (\(𝑌\)), berat bayi lahir rendah (\(X_1\)), pemberian imunisasi lengkap (\(X_2\)) dan Jumlah Puskesmas (\(X_3\))

3.2 Alur penelitian

Flowchart Alur Penelitian
Flowchart Alur Penelitian

Alur analisis yang ditunjukkan melalui Flowchart dapat dijelaskan lebih rinci melalui langkah-langkah sistemastis berikut:

  1. Melakukan pengumpulan data yang diperlukan.

  2. Melakukan estimasi parameter regresi dengan menggunakan pendekatan OLS atau metode kuadrat terkecil (MKT).

  3. Melakukan pengujian asumsi klasik dari model OLS yang telah didapatkan, berupa uji normalitas, uji Heteroskedastisitas, uji non autokorelasi dan identifikasi multikolineartas.

  4. Keputusan Asumsi:

  • Ya (Asumsi terpenuhi), proses langsung menuju ke Kesimpulan. Model OLS dianggap valid dan efisien untuk digunakan.

  • Tidak (Asumsi tidak terpenuhi): Proses berlanjut ke Metode Alternatif. Model OLS tidak dapat digunakan karena estimasinya menjadi bias atau standar error-nya tidak valid.

  1. Melakukan deteksi terhadap data pencilan dengan metode Cook’s Distance.

  2. Menggunakan estimasi MM (Minimum Maximum) sebagai metode alternatif untuk estimasi parameter regresi robust.

  3. Membandingkan Koefisien, standar error, residual standar error dan R-squared dari OLS dengan Metode Regresi Robust.

  4. Membuat kesimpulan

BAB IV

HASIL ANALISIS DAN PEMBAHASAN

4.1 Regresi OLS

Statistik Uji Nilai
Residual Standard Error 2.167
Degrees of Freedom (df) 34
Multiple R-squared 0.2254
Adjusted R-squared 0.1571
F-statistic 3.298
p-value (F-statistic) 0.03195

Berdasarkan tabel diatas, nilai Residual Standard Error sebesar 2.167 menunjukkan bahwa rata-rata kesalahan prediksi model terhadap nilai aktual Angka Kematian Bayi (AKB) sekitar 2.17 satuan. Nilai R-squared sebesar 0.2254 dan Adjusted R-squared sebesar 0.1571 mengindikasikan bahwa sekitar 22.54% variasi AKB dapat dijelaskan oleh variabel X1, X2, dan X3, sedangkan sisanya dijelaskan oleh faktor lain di luar model.Nilai F-statistic sebesar 3.298 dengan p-value 0.03195 (< 0.05) menunjukkan bahwa secara simultan variabel X1, X2, dan X3 berpengaruh signifikan terhadap AKB. Dengan demikian, model regresi ini dinilai layak digunakan meskipun kemampuan penjelasan model masih tergolong moderat.

Berikut hasil estimasi model regresi OLS:

Variabel Estimate Std. Error t value Pr(>
(Intercept) 4.046698 1.593177 2.540 0.0158 *
X1 0.476389 0.182801 2.606 0.0135 *
X2 0.029120 0.016605 1.754 0.0885 .
X3 -0.002517 0.001550 -1.624 0.1136

Berdasarkan hasil estimasi model regresi Ordinary Least Squares (OLS), diperoleh persamaan yang menggambarkan hubungan antara variabel independen X1, X2, dan X3 terhadap variabel dependen Y (Angka Kematian Bayi) sebagai berikut:

\[\hat{Y}=4.0467+0.4764X_1+0.0291X_2−0.0025X_3\] Secara keseluruhan, model regresi menunjukkan bahwa variabel X1 memiliki pengaruh paling kuat dan signifikan terhadap AKB, diikuti oleh X2 dengan pengaruh yang lemah, sedangkan X3 tidak berpengaruh signifikan.

4.2 Uji Asumsi

Berikut hasil uji asumsi:

Asumsi Metode Uji Hasil Utama Kesimpulan
Normalitas Shapiro–Wilk p = 0.9922 > 0.05 Terpenuhi
Heteroskedastisitas Breusch–Pagan p = 0.002959 < 0.05 Tidak terpenuhi
Multikolinearitas VIF Semua < 10 (1.13–1.28) Terpenuhi
Autokorelasi Durbin–Watson p = 0.3129 > 0.05 Terpenuhi

Secara keseluruhan, model regresi telah memenuhi tiga dari empat asumsi klasik, yaitu normalitas, tidak adanya multikolinearitas, dan tidak adanya autokorelasi, namun asumsi homoskedastisitas tidak terpenuhi. Kondisi ini menunjukkan adanya ketidakhomogenan varians pada residual yang dapat dipengaruhi oleh keberadaan outlier atau observasi ekstrem dalam data. Oleh karena itu, untuk mengatasi permasalahan heteroskedastisitas, disarankan melakukan pengecekan model dengan mengidentifikasi dan menghilangkan outlier yang berpotensi menyebabkan ketidakhomogenan tersebut.

Model OLS Tanpa Outlier

Variabel Estimate Std. Error t value Pr(> t
(Intercept) 6.928739 1.711802 4.048 0.000294 ***
X1 0.287552 0.175133 1.642 0.110107
X2 0.001258 0.017459 0.072 0.942984
X3 -0.002300 0.001391 -1.654 0.107704

Berdasarkan hasil analisis, perubahan signifikansi variabel BBLR (X1) setelah penghapusan outlier menunjukkan bahwa model OLS sangat sensitif terhadap pengaruh observasi ekstrem. Kondisi ini menandakan adanya ketidakstabilan dalam estimasi parameter dan pelanggaran terhadap asumsi homoskedastisitas. Oleh karena itu, penggunaan metode Regresi Robust dengan estimasi MM menjadi penting untuk memperoleh hasil estimasi yang lebih stabil dan reliabel tanpa harus menghilangkan data ekstrem.

4.3 Regresi Robust

Variabel Estimate Std. Error t value
(Intercept) 5.8672 1.6034 3.6593
X1 0.3566 0.1840 1.9382
X2 0.0102 0.0167 0.6074
X3 -0.0021 0.0016 -1.3524

Hasil regresi robust dengan metode MM Estimator menunjukkan bahwa model mampu menggambarkan hubungan antara variabel bebas dan variabel dependen secara lebih stabil setelah memperhitungkan kemungkinan adanya outlier. Nilai intersep menunjukkan taksiran rata-rata variabel dependen ketika seluruh variabel bebas bernilai nol. Di antara variabel bebas yang diuji, X1 memiliki pengaruh positif terhadap Y, meskipun tingkat signifikansinya relatif lemah. Sementara itu, X2 dan X3 menunjukkan pengaruh yang kecil dan tidak signifikan, sehingga kontribusinya terhadap variasi Y cenderung minimal. Model regresi robust yang diperoleh adalah sebagai berikut.

\[\hat{Y}=5.8672+0.3566X_1+0.0102X_2−0.0021X_3\]

4.4 Perbandingan OLS dan Regresi Robust

Estimasi parameter:

Variabel OLS Estimate Robust Estimate
(Intercept) 4.0467 5.8672
X1 0.4764 0.3566
X2 0.0291 0.0102
X3 -0.0025 -0.0021

hasil perbandingan antara model regresi OLS dan regresi robust menunjukkan adanya perbedaan nilai estimasi pada setiap variabel, yang menandakan bahwa data kemungkinan mengandung outlier atau penyimpangan dari asumsi klasik. Model robust menghasilkan nilai koefisien yang cenderung lebih kecil dibandingkan OLS, menunjukkan bahwa pengaruh variabel independen terhadap variabel dependen menjadi lebih moderat setelah efek outlier dikoreksi. Hal ini berarti model robust memberikan estimasi yang lebih stabil, tidak mudah terpengaruh oleh data ekstrem, dan lebih mencerminkan hubungan sebenarnya antarvariabel. Dengan demikian, penggunaan model robust dapat dianggap lebih tepat ketika data tidak sepenuhnya memenuhi asumsi normalitas dan homoskedastisitas.

Pemilihan Model:

Variabel OLS Robust
(Intercept) 1.5932 1.6034
Std. Error X1 0.1828 0.1840
Std. Error X2 0.0166 0.0167
Std. Error X3 0.0015 0.0016
Residual Standard Error 2.167 1.847
R-Squared 0.1653 0.1496

Hasil tabel tersebut menunjukkan perbandingan antara model regresi OLS (Ordinary Least Squares) dan Robust MM Estimator dalam hal standar error, residual standard error, dan R-squared.Nilai standar error untuk masing-masing variabel pada kedua metode relatif sama, yang berarti tingkat ketidakpastian dalam estimasi koefisien tidak jauh berbeda. Namun, residual standard error pada model Robust MM (1.847) lebih kecil dibandingkan OLS (2.167), menunjukkan bahwa model Robust MM memberikan prediksi yang lebih akurat terhadap data secara keseluruhan.Sementara itu, nilai R-squared pada model OLS (0.1653) lebih tinggi daripada Robust MM (0.1496). Hal ini menunjukkan bahwa model OLS mampu menjelaskan variasi data sedikit lebih besar. Namun, karena OLS lebih sensitif terhadap outlier, nilai R² yang lebih tinggi belum tentu menunjukkan model yang lebih baik.

Plot di atas memperlihatkan perbandingan antara dua metode regresi, yaitu OLS (garis biru putus-putus) dan Robust MM Estimator (garis merah penuh), dalam menggambarkan hubungan antara variabel X1 dan Y. Secara sederhana, kedua garis menunjukkan bahwa semakin besar nilai X1, maka nilai Y juga cenderung meningkat, sehingga hubungan antara keduanya bersifat positif. Namun, jika diperhatikan lebih dekat, garis merah dari metode Robust MM sedikit berbeda dari garis biru OLS. Garis Robust MM tampak lebih stabil dan tidak terlalu dipengaruhi oleh titik data yang jauh dari pola umum (outlier). Berdasarkan analisis, model regresi robust dianggap paling sesuai. Model yang diperoleh dengan metode tersebut adalah sebagai berikut.

\[\hat{Y}=5.8672+0.3566X_1+0.0102X_2−0.0021X_3\]

  • Setiap kenaikan 1 satuan pada variabel X1(BBLR) diperkirakan akan meningkatkan nilai Y sebesar 0,3566 satuan, dengan asumsi bahwa X2(pemberian imunisasi lengkap) dan X3(jumlah puskesmas) tetap konstan. Artinya, X1 memiliki pengaruh positif terhadap Y, sehingga semakin besar nilai X1, maka Y juga cenderung meningkat.

  • Setiap kenaikan 1 satuan pada variabel X2 (pemberian imunisasi lengkap) diperkirakan akan meningkatkan nilai Y(angka kematian bayi) sebesar 0,0102 satuan, dengan menganggap bahwa X1(BBLR) dan X3(jumlah puskesmas) tetap. Namun, besarnya pengaruh ini sangat kecil, sehingga kontribusi X2 terhadap perubahan Y relatif lemah.

  • Sebaliknya, setiap kenaikan 1 satuan pada variabel X3 (jumlah puskesmas) justru menurunkan nilai Y(angka kematian bayi) sebesar 0,0021 satuan, dengan menganggap variabel lainnya konstan. Ini menunjukkan bahwa X3 memiliki pengaruh negatif yang kecil terhadap Y.

  • Nilai intersep sebesar 5,8672 menunjukkan bahwa ketika semua variabel X bernilai nol, maka nilai Y dasar diperkirakan sebesar 5,8672 satuan.

BAB V

KESIMPULAN DAN SARAN

5.1 Kesimpulan

Pemodelan antara variabel X1, X2, dan X3 dengan Angka Kematian Bayi (AKB) berdasarkan Regresi OLS menunjukkan bahwa variabel X1 memiliki pengaruh positif yang kuat dan signifikan terhadap peningkatan AKB. Namun, hasil uji diagnostik mengindikasikan adanya pencilan (outlier) dan pelanggaran asumsi homoskedastisitas. Kepekaan OLS terhadap outlier terbukti karena koefisien dan signifikansi variabel, terutama X1, menjadi tidak stabil (tidak signifikan) setelah data ekstrem dihilangkan.

Pemodelan antara variabel X1, X2, dan X3 dengan AKB berdasarkan Regresi Robust MM Estimator menunjukkan perbaikan kestabilan model dan menghasilkan estimasi koefisien yang lebih reliabel. Model robust ini berhasil mengatasi masalah sensitivitas yang dialami oleh OLS, memberikan estimasi yang lebih tahan uji tanpa perlu menghilangkan data ekstrem.

Perbandingan hasil estimasi antara Regresi OLS dan Regresi Robust menunjukkan bahwa model Robust (MM Estimator) memiliki performa terbaik. Ditunjukkan dengan Residual Standard Error yang lebih rendah pada model robust, mengindikasikan bahwa model tersebut memberikan prediksi yang lebih akurat terhadap data secara keseluruhan. Meskipun R-squared model OLS sedikit lebih tinggi, model robust menghasilkan estimasi koefisien yang lebih stabil dan lebih mencerminkan hubungan sebenarnya antarvariabel dalam kondisi data yang mengandung outlier.

5.2 Saran

Melakukan eksplorasi dan penambahan variabel independen lain yang lebih relevan dalam model di masa mendatang. Langkah ini bertujuan untuk meningkatkan daya jelas dan kemampuan eksplanasi model, mengingat model saat ini masih menyisakan variasi AKB yang cukup besar yang belum dapat dijelaskan oleh variabel X1, X2, dan X3.

DAFTAR PUSTAKA

Chatterjee, S. & Hadi, A. S. (2015). Regression Analysis by Example (5th ed.). John Wiley & Sons.

Chen, C. (2002). Robust Regression and Outlier Detection Woth the ROBUSTREG Procedure.Conference Sugi, 265-270.

Cook, R. D. (1977). Detection of Influential Observation in Linear Regression. Technometrics,19(1),15–18.https://doi.org/10.1080/00401706.1977.10489493

Huang, D., Cabral., & R, de. La. Torre. (2015). Robust Regression. IEEE transactions on pattenr analysis and mechine intelligence, 38(2), 363-375. Kementerian Kesehatan Republik Indonesia. (2024). Profil Kesehatan Indonesia Tahun 2024. Jakarta: Kementerian Kesehatan RI.

Permata Sari, D., Rahmawati, N., & Putri, A. (2023). Analisis Faktor-Faktor yang Mempengaruhi Angka Kematian Bayi di Indonesia dalam Perspektif SDGs. Jurnal Kesehatan dan Pembangunan, 12(3), 45–56.

Putri, A. D., DEVIANTO, D., & YANUAR, F. (2022). Pemodelan Jumlah Kematian Bayi di Kota Bandung dengan Menggunakan Regresi Zero-Inflated Poisson. Jurnal Matematika UNAND, 11(1), 12-24.

United Nations Inter-agency Group for Child Mortality Estimation (UN IGME). (2024). Levels & Trends in Child Mortality: Report 2024. United Nations Children’s Fund. Retrieved from https://childmortality.org

World Health Organization. (2024). Newborn mortality rate 2024: Global estimates and regional trends. WHO Global Health Observatory (GHO) Data.