Stillbirth, atau kelahiran bayi dalam keadaan tidak bernyawa setelah usia kehamilan mencapai 20 minggu atau lebih, merupakan masalah kesehatan serius. Pada tahun 2016, Badan Pusat Statistik (BPS) mencatat Angka Kematian Bayi (AKB) di Indonesia sebesar 25,5, yang berarti ada sekitar 25,5 kematian per 1.000 kelahiran hidup. Beberapa penyebab stillbirth meliputi cacat lahir, masalah tali pusar, masalah plasenta, kondisi kesehatan ibu seperti diabetes atau tekanan darah tinggi, pembatasan pertumbuhan intrauterine (IUGR), malnutrisi, infeksi selama kehamilan, dan paparan agen lingkungan seperti pestisida atau karbon monoksida. Di Kabupaten Aceh Timur, daerah dengan kejadian stillbirth tertinggi adalah Idi Rayeuk, Darul Aman, dan Peureulak Kota, dengan 55 kasus pada tahun 2017. Faktor penyebab utama menurut dinas kesehatan setempat meliputi infeksi selama kehamilan, kelainan bawaan, kondisi kesehatan ibu, dan usia ibu. Penelitian sebelumnya menunjukkan bahwa usia ibu, paritas multipara, preeklampsia, riwayat penyakit, pemeriksaan antenatal care, dan ketuban pecah dini adalah faktor-faktor yang berhubungan dengan stillbirth.
Untuk mengkaji faktor-faktor yang berpengaruh secara signifikan terhadap stillbirth, penelitian ini menggunakan metode regresi logistik biner. Metode ini digunakan untuk mencari hubungan antara variabel respon biner (stillbirth) dan variabel prediktor seperti kondisi kesehatan ibu, usia, dan riwayat penyakit. Dalam model ini, nilai variabel respon Y = 1 menyatakan adanya stillbirth, sedangkan Y = 0 menyatakan tidak adanya stillbirth. Model regresi logistik biner menghasilkan fungsi berbentuk S-Shape yang menggambarkan pengaruh gabungan beberapa variabel prediktor terhadap stillbirth. Dengan menggunakan metode maksimum likelihood untuk menaksir parameter model, penelitian ini bertujuan untuk mengidentifikasi faktor-faktor signifikan yang mempengaruhi kejadian stillbirth di Kabupaten Aceh Timur. Hasil analisis diharapkan dapat memberikan pemahaman lebih mendalam tentang faktor risiko stillbirth dan membantu dalam upaya pencegahan dan intervensi yang lebih efektif.
Muliani, F., Amelia, A., Nabilla, U., & Azizah, A. (2021). Analisis Regresi Logistik Biner untuk Menentukan Faktor Stillbirth di Kabupaten Aceh Timur. BAREKENG: Jurnal Ilmu Matematika dan Terapan, 15(1), 001-008.
Regresi logistik biner merupakan sebuah metode analisis data yang digunakan untuk menentukan hubungan antara variabel respon (Y) yang bersifat biner dan satu atau lebih variabel prediktor (X). Metode ini berguna dalam situasi di mana hasil yang diamati (Y) hanya memiliki dua kemungkinan, seperti sukses (y = 1) atau gagal (y = 0), ya atau tidak, dan sebagainya (Hosmer dan Lemeshow, 2000). Jika dalam dalam model logistic biner menggunakan variabel respon (Y) yang menghasilkan dua kategori yang bernilai 0 dan 1, variabel y mengikuti distribusi Bernoulli, fungsi probabilitas y adalah: \[f(y_t )=π(x_t )^{y_t } (1-π(x_t ))^{1-y_t }, y_t=0,1\]
Model regresi logistik yang digunakan adalah : \[ \pi(x)=\frac{exp(\beta_{0}+\beta_{1}X_{1}+\beta_{2}X_{2}+...+\beta_{k}X_{k})}{1+exp(\beta_{0}+\beta_{1}X_{1}+\beta_{2}X_{2}+...+\beta_{k}X_{k})}\] (π) : peluang kejadian sukses dengan nilai probabilitas
(β0) : Intersept (bilangan konstan)
(β1… βk) : parameter regresi logistik
(X_1…X_k): Nilai peubah bebas
Model transformasi logit dari π(X) dapat dituliskan sebagai berikut: \[ g(X)=ln[\frac{\pi(x)}{1-\pi(x)}]=\beta_{0}+\beta_{1}X_{1}+\beta_{2}X_{2}+...+\beta_{k}X_{k} \]
## Uji Multikolinearitas
Uji multikolinearitas bertujuan untuk mengidentifikasi adanya hubungan antar variabel independen dalam sebuah model regresi. Menurut Ghozali (2018, p. 105), tujuan utama dari uji multikolinearitas adalah untuk memastikan bahwa model regresi yang digunakan tidak memiliki korelasi yang signifikan antar variabel bebas. Model regresi yang ideal adalah model yang variabel-variabel independennya tidak saling berkorelasi. Untuk mendeteksi adanya multikolinearitas, digunakan dua indikator utama, yaitu nilai tolerance dan Variance Inflation Factor (VIF). Jika Nilai VIF \< 10 menunjukkan bahwa tidak terdapat multikolinearitas yang signifikan dalam model tersebut. Sebaliknya, jika nilai VIF \> 10, yang memiliki arti bahwa terdapat multikolinearitas dalam data.Rumus VIF sebagai berikut. $$VIF_j=\frac{1}{(1-R_j^2 )},j=1,2,…,k$$
#Uji Signifikansi Parameter Simultan
Pengujian simultan dilakukan untuk mengetahui apakah parameter β secara keseluruhan signifikan dalam mempengaruhi variabel respons. Untuk menguji signifikansi parameter tersebut, digunakan statistik uji G yang mengikuti distribusi Chi-Square. Hipotesis yang digunakan dalam pengujian ini adalah sebagai berikut:
$$H_0:β_1=β_2 =⋯=β_k=0$$
$$H_1: paling\ sedikit\ ada\ satu\ β_i≠0, dengan\ i=1,2,…k$$
Rumus yang digunakan untuk uji simultan sebagai berikut.
$$Statistik \ Uji: \\
G=-2 \ log(\frac{L_0} {L_p})$$
Keterangan :
$$p:Banyaknya \ Variabel \ Prediktor \ dalam \ Model \\
L_0 :Nilai \ Likelihood \ tanpa \ Variabel \ Prediktor \\
L_1 :Nilai \ Likelihood \ dengan \ Variabel \ Prediktor
$$
Untuk memperoleh keputusan dilakukan perbandingan dengan nilai χ\^2 tabel, dengan derajat bebas (db) = k-1, k merupakan banyaknya variabel prediktor. Kriteria penolakan (tolak 𝐻0) jika nilai
$$G > χ2(db,α)$$ atau jika $$P-value < α$$
## Uji Signifikansi Parameter Parsial
Pengujian individual bertujuan untuk menentukan apakah setiap variabel prediktor layak dimasukkan dalam model regresi. Pengujian ini dilakukan untuk menentukan efek signifikansi parameter variabel bebas secara individu dengan membandingkan nilai koefisien regresi terhadap standar errornya. Hipotesis yang digunakan sebagai berikut. $$H_0:β_i=0$$ $$H_1:β_i≠0$$
Statistik uji yang digunakan adalah uji Wald (W) : $$Statistik \ Uji: \\
W=\frac{\beta_i^2}{SE(\beta_i^2)}
$$
## Odds Ratio
Menurut Hendayana (2013), odds ratio adalah indikator yang digunakan untuk mengukur kecenderungan seseorang dalam melakukan atau tidak melakukan suatu kegiatan. Odds dari suatu peristiwa didefinisikan sebagai perbandingan antara probabilitas terjadinya peristiwa tersebut dengan probabilitas tidak terjadinya peristiwa tersebut. Rumus ini dapat dinyatakan sebagai berikut. $$
Odds \ Ratio=\frac{Odds \ A} {Odds \ B}=\frac{\frac{\pi_A}{(1-\pi_A)}}{\frac{\pi_B}{(1-\pi_B)}}
$$
#Uji Kelayakan Model
Menurut (Ferdinand, 2014, p.239), uji F digunakan untuk menilai kecocokan model regresi yang ada. Kecocokan di sini merujuk pada kemampuan model regresi untuk menjelaskan pengaruh variabel independen (seperti kualitas layanan) terhadap variabel dependen (seperti kepuasan pelanggan). Dengan menggunakan tabel ANOVA, model regresi dianggap cocok jika nilai F-hitung (Sig.) kurang dari 0,05. Dengan kata lain, jika nilai probabilitas yang dihasilkan oleh uji F tersebut kurang dari 0,05, maka model regresi dianggap memiliki kecocokan yang signifikan. Pengujian yang digunakan adalah uji hosmer-lemeshow.
# SOURCE CODE
## LIBRARY
```r
> #LIBRARY
> library(readxl)
> library(pscl)
> library(ResourceSelection)
> library(car)
> library(ggplot2)
> data1 = read_excel("~/komstat/DATA MENTAH 3.xlsx")
> head(data1)
# A tibble: 6 × 6
No Y X1 X2 X3 X4<dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1 1 1 1 0 0 33
2 2 1 1 0 0 38
3 3 0 1 0 1 31
4 4 0 0 1 0 32
5 5 0 1 0 0 24
6 6 0 0 1 0 24
> str(data1)
55 × 6] (S3: tbl_df/tbl/data.frame)
tibble [$ No: num [1:55] 1 2 3 4 5 6 7 8 9 10 ...
$ Y : num [1:55] 1 1 0 0 0 0 0 1 1 1 ...
$ X1: num [1:55] 1 1 1 0 1 0 0 1 0 1 ...
$ X2: num [1:55] 0 0 0 1 0 1 0 0 1 0 ...
$ X3: num [1:55] 0 0 1 0 0 0 0 1 0 0 ...
$ X4: num [1:55] 33 38 31 32 24 24 26 36 30 25 ...
> summary(data1)
No Y X1 X2 : 1.0 Min. :0.0000 Min. :0.0000 Min. :0.0000
Min. :14.5 1st Qu.:0.0000 1st Qu.:0.0000 1st Qu.:0.0000
1st Qu.:28.0 Median :1.0000 Median :1.0000 Median :0.0000
Median :28.0 Mean :0.5455 Mean :0.5455 Mean :0.3273
Mean :41.5 3rd Qu.:1.0000 3rd Qu.:1.0000 3rd Qu.:1.0000
3rd Qu.:55.0 Max. :1.0000 Max. :1.0000 Max. :1.0000
Max.
X3 X4 :0.0000 Min. : 2.00
Min. :0.0000 1st Qu.:26.00
1st Qu.:0.0000 Median :31.00
Median :0.2545 Mean :30.47
Mean :0.5000 3rd Qu.:36.00
3rd Qu.:1.0000 Max. :40.00
Max. > Y = as.factor(data1$Y)
> X1 = as.factor(data1$X1)
> X2 = as.factor(data1$X2)
> X3 = as.factor(data1$X3)
> X4 = data1$X4
>
> datalogistik1 = data.frame(Y, X1, X2, X3, X4)
> str(datalogistik1)
'data.frame': 55 obs. of 5 variables:
$ Y : Factor w/ 2 levels "0","1": 2 2 1 1 1 1 1 2 2 2 ...
$ X1: Factor w/ 2 levels "0","1": 2 2 2 1 2 1 1 2 1 2 ...
$ X2: Factor w/ 2 levels "0","1": 1 1 1 2 1 2 1 1 2 1 ...
$ X3: Factor w/ 2 levels "0","1": 1 1 2 1 1 1 1 2 1 1 ...
$ X4: num 33 38 31 32 24 24 26 36 30 25 ...
> modelrlog1 = glm(Y ~ X1+X2+X3+X4, family = "binomial", data = datalogistik1)
> modelrlog1
: glm(formula = Y ~ X1 + X2 + X3 + X4, family = "binomial", data = datalogistik1)
Call
:
Coefficients
(Intercept) X11 X21 X31 X4 -2.280340 2.561336 1.815215 1.913408 0.001613
: 54 Total (i.e. Null); 50 Residual
Degrees of Freedom: 75.79
Null Deviance: 61.36 AIC: 71.36 Residual Deviance
> vif(modelrlog1)
X1 X2 X3 X4 3.941595 4.038338 1.039264 1.013777
> pR2(modelrlog1)
for pseudo-r2
fitting null model
llh llhNull G2 McFadden r2ML r2CU -30.6800417 -37.8955081 14.4309329 0.1904043 0.2307818 0.3085638
> qchisq(p = 0.5,df = 3)
1] 2.365974 [
> summary(modelrlog1)
:
Callglm(formula = Y ~ X1 + X2 + X3 + X4, family = "binomial", data = datalogistik1)
:
Deviance Residuals
Min 1Q Median 3Q Max -2.1718 -1.0076 0.4489 1.0408 1.3630
:
CoefficientsPr(>|z|)
Estimate Std. Error z value -2.280340 1.680598 -1.357 0.1748
(Intercept) 2.561336 1.229394 2.083 0.0372 *
X11 1.815215 1.270444 1.429 0.1531
X21 1.913408 0.900208 2.126 0.0335 *
X31 0.001613 0.042766 0.038 0.9699
X4 ---
: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Signif. codes
for binomial family taken to be 1)
(Dispersion parameter
: 75.791 on 54 degrees of freedom
Null deviance: 61.360 on 50 degrees of freedom
Residual deviance: 71.36
AIC
: 4 Number of Fisher Scoring iterations
> Rsq1 = 1-(61.360/75.791)
> Rsq1
1] 0.1904052 [
> beta1 = (coef(modelrlog1))
> beta1
(Intercept) X11 X21 X31 X4 -2.280339862 2.561336039 1.815215386 1.913407866 0.001612997
> OR_beta1 = exp(beta1)
> OR_beta1
(Intercept) X11 X21 X31 X4 0.1022495 12.9531116 6.1423990 6.7761417 1.0016143
> cbind(beta1,OR_beta1)
beta1 OR_beta1-2.280339862 0.1022495
(Intercept) 2.561336039 12.9531116
X11 1.815215386 6.1423990
X21 1.913407866 6.7761417
X31 0.001612997 1.0016143 X4
> cross_tab = table(datalogistik1$Y, fitted(modelrlog1) > 0.5)
> cross_tab
FALSE TRUE
0 16 9
1 7 23
> ketepatan = ((23+9)/55)
> ketepatan
1] 0.5818182 [
> library(generalhoslem)
> logitgof(datalogistik1$Y,fitted(modelrlog1))
test (binary model)
Hosmer and Lemeshow
: datalogistik1$Y, fitted(modelrlog1)
data-squared = 10.408, df = 8, p-value = 0.2375 X
> vif(modelrlog1)
X1 X2 X3 X4 3.941595 4.038338 1.039264 1.013777
Keempat variabel tersebut memiliki nilai VIF kurang dari 10. Sehingga dapat disimpulkan bahwa tidak terjadi multikolinieritas pada setiap variabel prediktor yang diuji atau tidak saling berkorelasi.
> modelrlog1
: glm(formula = Y ~ X1 + X2 + X3 + X4, family = "binomial", data = datalogistik1)
Call
:
Coefficients
(Intercept) X11 X21 X31 X4 -2.280340 2.561336 1.815215 1.913408 0.001613
: 54 Total (i.e. Null); 50 Residual
Degrees of Freedom: 75.79
Null Deviance: 61.36 AIC: 71.36 Residual Deviance
Model regresi logistik yang didapatkan dari analisis tersebut adalah sebagai berikut.
\[ \hat{Y}=-2.280340+2.561336X_1+1.815215X_2+1.913408X_3+0.001613X_4 \]
Interpretasi : - Rata-rata Kejadian stillbirth ketika X1,X2, X3, X4 bernilai 0 adalah sebesar -2.280430 - Rata-rata kejadian stillbirth akan naik sebesar 2.561336 apabila variabel X1 (Infeksi selama kehamilan) naik 1 satuan - Rata-rata kejadian stillbirth akan naik sebesar 1.815215 apabila variabel X2 (Kelainan atau cacat bawaan) naik 1 satuan - Rata-rata kejadian stillbirth akan naik sebesar 1.913408 apabila variabel X3 (Kondisi Ibu) naik 1 satuan - Rata-rata kejadian stillbirth akan naik sebesar 0.001613 apabila variabel X4 (Usia Ibu) naik 1 satuan
> pR2(modelrlog1)
for pseudo-r2
fitting null model
llh llhNull G2 McFadden r2ML r2CU -30.6800417 -37.8955081 14.4309329 0.1904043 0.2307818 0.3085638
Dari hasil uji simultan menggunakan likelihood ratio test didapatkan bahwa nilai G (14.4309329) > nilai Chi Square(2.365974). Sehingga dapat disimpulkan bahwa minimal terdapat 1 variabel bebas yang berpengaruh secara signifikan terhadap variabel terikat.
> summary(modelrlog1)
:
Callglm(formula = Y ~ X1 + X2 + X3 + X4, family = "binomial", data = datalogistik1)
:
Deviance Residuals
Min 1Q Median 3Q Max -2.1718 -1.0076 0.4489 1.0408 1.3630
:
CoefficientsPr(>|z|)
Estimate Std. Error z value -2.280340 1.680598 -1.357 0.1748
(Intercept) 2.561336 1.229394 2.083 0.0372 *
X11 1.815215 1.270444 1.429 0.1531
X21 1.913408 0.900208 2.126 0.0335 *
X31 0.001613 0.042766 0.038 0.9699
X4 ---
: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Signif. codes
for binomial family taken to be 1)
(Dispersion parameter
: 75.791 on 54 degrees of freedom
Null deviance: 61.360 on 50 degrees of freedom
Residual deviance: 71.36
AIC
: 4 Number of Fisher Scoring iterations
Dari hasil uji simultan menggunakan likelihood ratio test didapatkan bahwa nilai p pada setiap variabel kurang dari 0.05 (taraf nyata). Sehingga dapat disimpulkan bahwa setiap variabel bebas memberikan pengaruh yang signifikan terhadap variabel terikat secara parsial .
> Rsq1
1] 0.1904052 [
Didapatkan nilai R square sebesar 19.04% sehingga dapat disimpulkan bahwa variabel bebas yang dianalisis dalam laporan ini (4 faktor kejadian stillbirth) mampu menjelaskan variasi variabel bebas (kejadian stillbirth) sebesar 19.04% , sedangkan 80.96% lainnya dijelaskan oleh variabel lain yang tidak dianalisis dalam laporan ini.
> cbind(beta1,OR_beta1)
beta1 OR_beta1-2.280339862 0.1022495
(Intercept) 2.561336039 12.9531116
X11 1.815215386 6.1423990
X21 1.913407866 6.7761417
X31 0.001612997 1.0016143 X4
Interpretasi : - Apabila infeksi selama kehamilan bertambah 1 satuan, maka kecenderungan kejadian stillbirth meningkat 2.561336039 kali lipat. - Apabila kelainan atau cacat bawaan bertambah 1 satuan, maka kecenderungan kejadian stillbirth meningkat 1.815215386 kali lipat. - Apabila kondisi ibu bertambah 1 satuan, maka kecenderungan kejadian stillbirth meningkat 1.913407866 kali lipat. - Apabila usia ibu bertambah 1 satuan, maka kecenderungan kejadian stillbirth meningkat 0.001612997 kali lipat.
> ketepatan
1] 0.5818182 [
Tingkat akurasi model sebesar 58.18%
> logitgof(datalogistik1$Y,fitted(modelrlog1))
test (binary model)
Hosmer and Lemeshow
: datalogistik1$Y, fitted(modelrlog1)
data-squared = 10.408, df = 8, p-value = 0.2375 X
Didapatkan nilai p (0.2375) > 0.05 (taraf nyata) sehingga dapat disimpulkan bahwa model regresi logistik yang terbentuk sudah selaras/layak.
Berdasarkan hasil analisis data, diperoleh beberapa kesimpulan sebagai berikut: Dari seluruh ibu hamil di tiga kecamatan Kabupaten Aceh Timur, sebanyak 54,55% mengalami stillbirth. Di antara mereka, 21 ibu memiliki riwayat infeksi kehamilan, 8 ibu memiliki riwayat kelainan atau cacat bawaan, 12 ibu mengalami preeklampsia, dan 18 ibu memiliki diabetes. Selain itu, 16 ibu yang mengalami stillbirth berusia antara 21 hingga 30 tahun, sementara 14 ibu berusia antara 31 hingga 40 tahun. Berdasarkan model regresi logistik biner, ditemukan bahwa infeksi selama kehamilan adalah faktor yang paling mempengaruhi terjadinya stillbirth, dengan ibu yang mengalami infeksi kehamilan memiliki risiko dua kali lebih tinggi dibandingkan ibu yang tidak mengalami infeksi.
Berdasarkan model regresi biner untuk menggambarkan hubungan antara stillbirth pada ibu hamil dengan infeksi kehamilan, cacat bawaah, kondisi kesehatan ibu, dan usia ibu adalah \[ \pi(x)=\frac{exp(-2.2803399+2.5613360X_1+1.8152154X_{2}+1.913407X_{3}+0.001613X_{4})}{1+exp(-2.2803399+2.5613360X_1+1.8152154X_{2}+1.913407X_{3}+0.001613X_{4})}\]
Muliani, F., Amelia, A., Nabilla, U., & Azizah, A. (2021). Analisis Regresi Logistik Biner untuk Menentukan Faktor Stillbirth di Kabupaten Aceh Timur. BAREKENG: Jurnal Ilmu Matematika dan Terapan, 15(1), 001-008. Kartikasari, D. (2020). Analisis Faktor-Faktor yang Mempengaruhi Level Polusi Udara dengan Metode Regresi Logistik Biner. Mathunesa: Jurnal Ilmiah Matematika, 8(1), 55-59. Kotimah, M. K., & Wulandari, S. P. (2014). Model regresi logistik biner stratifikasi pada partisipasi ekonomi perempuan di Provinsi Jawa Timur. Jurnal Sains dan Seni ITS, 3(1), D1-D6. Nanincova, N. (2019). Pengaruh kualitas layanan terhadap kepuasan pelanggan noach cafe and bistro. Agora, 7(2).