ANALISIS REGRESI LOGISTIK BINER KABUPATEN ACEH TIMUR DALAM MENENTUKAN FAKTOR STILLBIRTH

Hani Fiyadah Al Fatah

1 Juni 2024

1 PENDAHULUAN

1.1 Latar Belakang

Stillbirth, atau kelahiran bayi dalam keadaan tidak bernyawa setelah usia kehamilan mencapai 20 minggu atau lebih, merupakan masalah kesehatan serius. Pada tahun 2016, Badan Pusat Statistik (BPS) mencatat Angka Kematian Bayi (AKB) di Indonesia sebesar 25,5, yang berarti ada sekitar 25,5 kematian per 1.000 kelahiran hidup. Beberapa penyebab stillbirth meliputi cacat lahir, masalah tali pusar, masalah plasenta, kondisi kesehatan ibu seperti diabetes atau tekanan darah tinggi, pembatasan pertumbuhan intrauterine (IUGR), malnutrisi, infeksi selama kehamilan, dan paparan agen lingkungan seperti pestisida atau karbon monoksida. Di Kabupaten Aceh Timur, daerah dengan kejadian stillbirth tertinggi adalah Idi Rayeuk, Darul Aman, dan Peureulak Kota, dengan 55 kasus pada tahun 2017. Faktor penyebab utama menurut dinas kesehatan setempat meliputi infeksi selama kehamilan, kelainan bawaan, kondisi kesehatan ibu, dan usia ibu. Penelitian sebelumnya menunjukkan bahwa usia ibu, paritas multipara, preeklampsia, riwayat penyakit, pemeriksaan antenatal care, dan ketuban pecah dini adalah faktor-faktor yang berhubungan dengan stillbirth.

Untuk mengkaji faktor-faktor yang berpengaruh secara signifikan terhadap stillbirth, penelitian ini menggunakan metode regresi logistik biner. Metode ini digunakan untuk mencari hubungan antara variabel respon biner (stillbirth) dan variabel prediktor seperti kondisi kesehatan ibu, usia, dan riwayat penyakit. Dalam model ini, nilai variabel respon Y = 1 menyatakan adanya stillbirth, sedangkan Y = 0 menyatakan tidak adanya stillbirth. Model regresi logistik biner menghasilkan fungsi berbentuk S-Shape yang menggambarkan pengaruh gabungan beberapa variabel prediktor terhadap stillbirth. Dengan menggunakan metode maksimum likelihood untuk menaksir parameter model, penelitian ini bertujuan untuk mengidentifikasi faktor-faktor signifikan yang mempengaruhi kejadian stillbirth di Kabupaten Aceh Timur. Hasil analisis diharapkan dapat memberikan pemahaman lebih mendalam tentang faktor risiko stillbirth dan membantu dalam upaya pencegahan dan intervensi yang lebih efektif.

1.2 DATA

2 TINJAUAN PUSTAKA

2.1 Analisis Regresi Logistik Biner

Regresi logistik biner merupakan sebuah metode analisis data yang digunakan untuk menentukan hubungan antara variabel respon (Y) yang bersifat biner dan satu atau lebih variabel prediktor (X). Metode ini berguna dalam situasi di mana hasil yang diamati (Y) hanya memiliki dua kemungkinan, seperti sukses (y = 1) atau gagal (y = 0), ya atau tidak, dan sebagainya (Hosmer dan Lemeshow, 2000). Jika dalam dalam model logistic biner menggunakan variabel respon (Y) yang menghasilkan dua kategori yang bernilai 0 dan 1, variabel y mengikuti distribusi Bernoulli, fungsi probabilitas y adalah: \[f(y_t )=π(x_t )^{y_t } (1-π(x_t ))^{1-y_t }, y_t=0,1\]

Model regresi logistik yang digunakan adalah : \[ \pi(x)=\frac{exp(\beta_{0}+\beta_{1}X_{1}+\beta_{2}X_{2}+...+\beta_{k}X_{k})}{1+exp(\beta_{0}+\beta_{1}X_{1}+\beta_{2}X_{2}+...+\beta_{k}X_{k})}\] (π) : peluang kejadian sukses dengan nilai probabilitas

(β0) : Intersept (bilangan konstan)

(β1… βk) : parameter regresi logistik

(X_1…X_k): Nilai peubah bebas

Model transformasi logit dari π(X) dapat dituliskan sebagai berikut: \[ g(X)=ln[\frac{\pi(x)}{1-\pi(x)}]=\beta_{0}+\beta_{1}X_{1}+\beta_{2}X_{2}+...+\beta_{k}X_{k} \]

## Uji Multikolinearitas

Uji multikolinearitas bertujuan untuk mengidentifikasi adanya hubungan antar variabel independen dalam sebuah model regresi. Menurut Ghozali (2018, p. 105), tujuan utama dari uji multikolinearitas adalah untuk memastikan bahwa model regresi yang digunakan tidak memiliki korelasi yang signifikan antar variabel bebas. Model regresi yang ideal adalah model yang variabel-variabel independennya tidak saling berkorelasi. Untuk mendeteksi adanya multikolinearitas, digunakan dua indikator utama, yaitu nilai tolerance dan Variance Inflation Factor (VIF). Jika Nilai VIF \< 10 menunjukkan bahwa tidak terdapat multikolinearitas yang signifikan dalam model tersebut. Sebaliknya, jika nilai VIF \> 10, yang memiliki arti bahwa terdapat multikolinearitas dalam data.Rumus VIF sebagai berikut. $$VIF_j=\frac{1}{(1-R_j^2 )},j=1,2,…,k$$ 

#Uji Signifikansi Parameter Simultan
Pengujian simultan dilakukan untuk mengetahui apakah parameter β secara keseluruhan signifikan dalam mempengaruhi variabel respons. Untuk menguji signifikansi parameter tersebut, digunakan statistik uji G yang mengikuti distribusi Chi-Square. Hipotesis yang digunakan dalam pengujian ini adalah sebagai berikut: 

$$H_0:β_1=β_2  =⋯=β_k=0$$
$$H_1: paling\ sedikit\ ada\ satu\ β_i≠0, dengan\ i=1,2,…k$$ 
Rumus yang digunakan untuk uji simultan sebagai berikut. 
$$Statistik \ Uji: \\
G=-2 \ log(\frac{L_0} {L_p})$$ 
Keterangan :
$$p:Banyaknya \ Variabel \ Prediktor \ dalam \ Model \\
L_0 :Nilai \ Likelihood \ tanpa \ Variabel \ Prediktor \\
L_1 :Nilai \ Likelihood \ dengan \ Variabel \ Prediktor
$$

Untuk memperoleh keputusan dilakukan perbandingan dengan nilai χ\^2 tabel, dengan derajat bebas (db) = k-1, k merupakan banyaknya variabel prediktor. Kriteria penolakan (tolak 𝐻0) jika nilai

$$G > χ2(db,α)$$ atau jika $$P-value < α$$ 

## Uji Signifikansi Parameter Parsial

Pengujian individual bertujuan untuk menentukan apakah setiap variabel prediktor layak dimasukkan dalam model regresi. Pengujian ini dilakukan untuk menentukan efek signifikansi parameter variabel bebas secara individu dengan membandingkan nilai koefisien regresi terhadap standar errornya. Hipotesis yang digunakan sebagai berikut. $$H_0:β_i=0$$ $$H_1:β_i≠0$$

Statistik uji yang digunakan adalah uji Wald (W) : $$Statistik \ Uji: \\
W=\frac{\beta_i^2}{SE(\beta_i^2)}
$$ 

## Odds Ratio 
Menurut Hendayana (2013), odds ratio adalah indikator yang digunakan untuk mengukur kecenderungan seseorang dalam melakukan atau tidak melakukan suatu kegiatan. Odds dari suatu peristiwa didefinisikan sebagai perbandingan antara probabilitas terjadinya peristiwa tersebut dengan probabilitas tidak terjadinya peristiwa tersebut. Rumus ini dapat dinyatakan sebagai berikut. $$
Odds \ Ratio=\frac{Odds \ A} {Odds \ B}=\frac{\frac{\pi_A}{(1-\pi_A)}}{\frac{\pi_B}{(1-\pi_B)}}
$$

#Uji Kelayakan Model
Menurut (Ferdinand, 2014, p.239), uji F digunakan untuk menilai kecocokan model regresi yang ada. Kecocokan di sini merujuk pada kemampuan model regresi untuk menjelaskan pengaruh variabel independen (seperti kualitas layanan) terhadap variabel dependen (seperti kepuasan pelanggan). Dengan menggunakan tabel ANOVA, model regresi dianggap cocok jika nilai F-hitung (Sig.) kurang dari 0,05. Dengan kata lain, jika nilai probabilitas yang dihasilkan oleh uji F tersebut kurang dari 0,05, maka model regresi dianggap memiliki kecocokan yang signifikan. Pengujian yang digunakan adalah uji hosmer-lemeshow.


# SOURCE CODE
## LIBRARY

```r
> #LIBRARY
> library(readxl)
> library(pscl)
> library(ResourceSelection)
> library(car)
> library(ggplot2)

2.2 DATA

> data1 = read_excel("~/komstat/DATA MENTAH 3.xlsx")
> head(data1)
# A tibble: 6 × 6
     No     Y    X1    X2    X3    X4
  <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1     1     1     1     0     0    33
2     2     1     1     0     0    38
3     3     0     1     0     1    31
4     4     0     0     1     0    32
5     5     0     1     0     0    24
6     6     0     0     1     0    24
> str(data1)
tibble [55 × 6] (S3: tbl_df/tbl/data.frame)
 $ No: num [1:55] 1 2 3 4 5 6 7 8 9 10 ...
 $ Y : num [1:55] 1 1 0 0 0 0 0 1 1 1 ...
 $ X1: num [1:55] 1 1 1 0 1 0 0 1 0 1 ...
 $ X2: num [1:55] 0 0 0 1 0 1 0 0 1 0 ...
 $ X3: num [1:55] 0 0 1 0 0 0 0 1 0 0 ...
 $ X4: num [1:55] 33 38 31 32 24 24 26 36 30 25 ...
> summary(data1)
       No             Y                X1               X2        
 Min.   : 1.0   Min.   :0.0000   Min.   :0.0000   Min.   :0.0000  
 1st Qu.:14.5   1st Qu.:0.0000   1st Qu.:0.0000   1st Qu.:0.0000  
 Median :28.0   Median :1.0000   Median :1.0000   Median :0.0000  
 Mean   :28.0   Mean   :0.5455   Mean   :0.5455   Mean   :0.3273  
 3rd Qu.:41.5   3rd Qu.:1.0000   3rd Qu.:1.0000   3rd Qu.:1.0000  
 Max.   :55.0   Max.   :1.0000   Max.   :1.0000   Max.   :1.0000  
       X3               X4       
 Min.   :0.0000   Min.   : 2.00  
 1st Qu.:0.0000   1st Qu.:26.00  
 Median :0.0000   Median :31.00  
 Mean   :0.2545   Mean   :30.47  
 3rd Qu.:0.5000   3rd Qu.:36.00  
 Max.   :1.0000   Max.   :40.00  
> Y = as.factor(data1$Y)
> X1 = as.factor(data1$X1)
> X2 = as.factor(data1$X2)
> X3 = as.factor(data1$X3)
> X4 = data1$X4
> 
> datalogistik1 = data.frame(Y, X1, X2, X3, X4)
> str(datalogistik1)
'data.frame':   55 obs. of  5 variables:
 $ Y : Factor w/ 2 levels "0","1": 2 2 1 1 1 1 1 2 2 2 ...
 $ X1: Factor w/ 2 levels "0","1": 2 2 2 1 2 1 1 2 1 2 ...
 $ X2: Factor w/ 2 levels "0","1": 1 1 1 2 1 2 1 1 2 1 ...
 $ X3: Factor w/ 2 levels "0","1": 1 1 2 1 1 1 1 2 1 1 ...
 $ X4: num  33 38 31 32 24 24 26 36 30 25 ...

2.3 MODEL REGRESI LOGISTIK BINER

> modelrlog1 = glm(Y ~ X1+X2+X3+X4, family = "binomial", data = datalogistik1)
> modelrlog1

Call:  glm(formula = Y ~ X1 + X2 + X3 + X4, family = "binomial", data = datalogistik1)

Coefficients:
(Intercept)          X11          X21          X31           X4  
  -2.280340     2.561336     1.815215     1.913408     0.001613  

Degrees of Freedom: 54 Total (i.e. Null);  50 Residual
Null Deviance:      75.79 
Residual Deviance: 61.36    AIC: 71.36

2.4 ASUMSI MULTIKOLINEARITAS

> vif(modelrlog1)
      X1       X2       X3       X4 
3.941595 4.038338 1.039264 1.013777

2.5 UJI SIMULTAN/SIGNIFIKANSI PARAMETER MODEL

> pR2(modelrlog1)
fitting null model for pseudo-r2
        llh     llhNull          G2    McFadden        r2ML        r2CU 
-30.6800417 -37.8955081  14.4309329   0.1904043   0.2307818   0.3085638 
> qchisq(p = 0.5,df = 3)
[1] 2.365974

2.6 UJI PARSIAL PARAMETER MODEL

> summary(modelrlog1)

Call:
glm(formula = Y ~ X1 + X2 + X3 + X4, family = "binomial", data = datalogistik1)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-2.1718  -1.0076   0.4489   1.0408   1.3630  

Coefficients:
             Estimate Std. Error z value Pr(>|z|)  
(Intercept) -2.280340   1.680598  -1.357   0.1748  
X11          2.561336   1.229394   2.083   0.0372 *
X21          1.815215   1.270444   1.429   0.1531  
X31          1.913408   0.900208   2.126   0.0335 *
X4           0.001613   0.042766   0.038   0.9699  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 75.791  on 54  degrees of freedom
Residual deviance: 61.360  on 50  degrees of freedom
AIC: 71.36

Number of Fisher Scoring iterations: 4

2.7 PSEUDO R-SQUARE

> Rsq1 = 1-(61.360/75.791)
> Rsq1
[1] 0.1904052

2.8 ODDS RATIO

> beta1 = (coef(modelrlog1))
> beta1
 (Intercept)          X11          X21          X31           X4 
-2.280339862  2.561336039  1.815215386  1.913407866  0.001612997 
> OR_beta1 = exp(beta1)
> OR_beta1
(Intercept)         X11         X21         X31          X4 
  0.1022495  12.9531116   6.1423990   6.7761417   1.0016143 
> cbind(beta1,OR_beta1)
                   beta1   OR_beta1
(Intercept) -2.280339862  0.1022495
X11          2.561336039 12.9531116
X21          1.815215386  6.1423990
X31          1.913407866  6.7761417
X4           0.001612997  1.0016143

2.9 UJI KETEPATAN MODEL

> cross_tab = table(datalogistik1$Y, fitted(modelrlog1) > 0.5)
> cross_tab
   
    FALSE TRUE
  0    16    9
  1     7   23
> ketepatan = ((23+9)/55)
> ketepatan
[1] 0.5818182

2.10 KELAYAKAN MODEL

> library(generalhoslem)
> logitgof(datalogistik1$Y,fitted(modelrlog1))

    Hosmer and Lemeshow test (binary model)

data:  datalogistik1$Y, fitted(modelrlog1)
X-squared = 10.408, df = 8, p-value = 0.2375

3 HASIL DAN PEMBAHASAN

3.1 Uji Multikolinieritas

> vif(modelrlog1)
      X1       X2       X3       X4 
3.941595 4.038338 1.039264 1.013777

Keempat variabel tersebut memiliki nilai VIF kurang dari 10. Sehingga dapat disimpulkan bahwa tidak terjadi multikolinieritas pada setiap variabel prediktor yang diuji atau tidak saling berkorelasi.

3.2 Pemodelan Regresi Logistik

> modelrlog1

Call:  glm(formula = Y ~ X1 + X2 + X3 + X4, family = "binomial", data = datalogistik1)

Coefficients:
(Intercept)          X11          X21          X31           X4  
  -2.280340     2.561336     1.815215     1.913408     0.001613  

Degrees of Freedom: 54 Total (i.e. Null);  50 Residual
Null Deviance:      75.79 
Residual Deviance: 61.36    AIC: 71.36

Model regresi logistik yang didapatkan dari analisis tersebut adalah sebagai berikut.

\[ \hat{Y}=-2.280340+2.561336X_1+1.815215X_2+1.913408X_3+0.001613X_4 \]

Interpretasi : - Rata-rata Kejadian stillbirth ketika X1,X2, X3, X4 bernilai 0 adalah sebesar -2.280430 - Rata-rata kejadian stillbirth akan naik sebesar 2.561336 apabila variabel X1 (Infeksi selama kehamilan) naik 1 satuan - Rata-rata kejadian stillbirth akan naik sebesar 1.815215 apabila variabel X2 (Kelainan atau cacat bawaan) naik 1 satuan - Rata-rata kejadian stillbirth akan naik sebesar 1.913408 apabila variabel X3 (Kondisi Ibu) naik 1 satuan - Rata-rata kejadian stillbirth akan naik sebesar 0.001613 apabila variabel X4 (Usia Ibu) naik 1 satuan

3.3 Uji Simultan

> pR2(modelrlog1)
fitting null model for pseudo-r2
        llh     llhNull          G2    McFadden        r2ML        r2CU 
-30.6800417 -37.8955081  14.4309329   0.1904043   0.2307818   0.3085638

Dari hasil uji simultan menggunakan likelihood ratio test didapatkan bahwa nilai G (14.4309329) > nilai Chi Square(2.365974). Sehingga dapat disimpulkan bahwa minimal terdapat 1 variabel bebas yang berpengaruh secara signifikan terhadap variabel terikat.

3.4 Uji Parsial

> summary(modelrlog1)

Call:
glm(formula = Y ~ X1 + X2 + X3 + X4, family = "binomial", data = datalogistik1)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-2.1718  -1.0076   0.4489   1.0408   1.3630  

Coefficients:
             Estimate Std. Error z value Pr(>|z|)  
(Intercept) -2.280340   1.680598  -1.357   0.1748  
X11          2.561336   1.229394   2.083   0.0372 *
X21          1.815215   1.270444   1.429   0.1531  
X31          1.913408   0.900208   2.126   0.0335 *
X4           0.001613   0.042766   0.038   0.9699  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 75.791  on 54  degrees of freedom
Residual deviance: 61.360  on 50  degrees of freedom
AIC: 71.36

Number of Fisher Scoring iterations: 4

Dari hasil uji simultan menggunakan likelihood ratio test didapatkan bahwa nilai p pada setiap variabel kurang dari 0.05 (taraf nyata). Sehingga dapat disimpulkan bahwa setiap variabel bebas memberikan pengaruh yang signifikan terhadap variabel terikat secara parsial .

3.5 Koefisien Determinasi

> Rsq1
[1] 0.1904052

Didapatkan nilai R square sebesar 19.04% sehingga dapat disimpulkan bahwa variabel bebas yang dianalisis dalam laporan ini (4 faktor kejadian stillbirth) mampu menjelaskan variasi variabel bebas (kejadian stillbirth) sebesar 19.04% , sedangkan 80.96% lainnya dijelaskan oleh variabel lain yang tidak dianalisis dalam laporan ini.

3.6 Odds Ratio

> cbind(beta1,OR_beta1)
                   beta1   OR_beta1
(Intercept) -2.280339862  0.1022495
X11          2.561336039 12.9531116
X21          1.815215386  6.1423990
X31          1.913407866  6.7761417
X4           0.001612997  1.0016143

Interpretasi : - Apabila infeksi selama kehamilan bertambah 1 satuan, maka kecenderungan kejadian stillbirth meningkat 2.561336039 kali lipat. - Apabila kelainan atau cacat bawaan bertambah 1 satuan, maka kecenderungan kejadian stillbirth meningkat 1.815215386 kali lipat. - Apabila kondisi ibu bertambah 1 satuan, maka kecenderungan kejadian stillbirth meningkat 1.913407866 kali lipat. - Apabila usia ibu bertambah 1 satuan, maka kecenderungan kejadian stillbirth meningkat 0.001612997 kali lipat.

3.7 Ketepatan Klasifikasi

> ketepatan
[1] 0.5818182

Tingkat akurasi model sebesar 58.18%

3.8 Uji Kelayakan Model

> logitgof(datalogistik1$Y,fitted(modelrlog1))

    Hosmer and Lemeshow test (binary model)

data:  datalogistik1$Y, fitted(modelrlog1)
X-squared = 10.408, df = 8, p-value = 0.2375

Didapatkan nilai p (0.2375) > 0.05 (taraf nyata) sehingga dapat disimpulkan bahwa model regresi logistik yang terbentuk sudah selaras/layak.

4 KESIMPULAN

Berdasarkan hasil analisis data, diperoleh beberapa kesimpulan sebagai berikut: Dari seluruh ibu hamil di tiga kecamatan Kabupaten Aceh Timur, sebanyak 54,55% mengalami stillbirth. Di antara mereka, 21 ibu memiliki riwayat infeksi kehamilan, 8 ibu memiliki riwayat kelainan atau cacat bawaan, 12 ibu mengalami preeklampsia, dan 18 ibu memiliki diabetes. Selain itu, 16 ibu yang mengalami stillbirth berusia antara 21 hingga 30 tahun, sementara 14 ibu berusia antara 31 hingga 40 tahun. Berdasarkan model regresi logistik biner, ditemukan bahwa infeksi selama kehamilan adalah faktor yang paling mempengaruhi terjadinya stillbirth, dengan ibu yang mengalami infeksi kehamilan memiliki risiko dua kali lebih tinggi dibandingkan ibu yang tidak mengalami infeksi.

Berdasarkan model regresi biner untuk menggambarkan hubungan antara stillbirth pada ibu hamil dengan infeksi kehamilan, cacat bawaah, kondisi kesehatan ibu, dan usia ibu adalah \[ \pi(x)=\frac{exp(-2.2803399+2.5613360X_1+1.8152154X_{2}+1.913407X_{3}+0.001613X_{4})}{1+exp(-2.2803399+2.5613360X_1+1.8152154X_{2}+1.913407X_{3}+0.001613X_{4})}\]

5 DAFTAR PUSTAKA

Muliani, F., Amelia, A., Nabilla, U., & Azizah, A. (2021). Analisis Regresi Logistik Biner untuk Menentukan Faktor Stillbirth di Kabupaten Aceh Timur. BAREKENG: Jurnal Ilmu Matematika dan Terapan, 15(1), 001-008. Kartikasari, D. (2020). Analisis Faktor-Faktor yang Mempengaruhi Level Polusi Udara dengan Metode Regresi Logistik Biner. Mathunesa: Jurnal Ilmiah Matematika, 8(1), 55-59. Kotimah, M. K., & Wulandari, S. P. (2014). Model regresi logistik biner stratifikasi pada partisipasi ekonomi perempuan di Provinsi Jawa Timur. Jurnal Sains dan Seni ITS, 3(1), D1-D6. Nanincova, N. (2019). Pengaruh kualitas layanan terhadap kepuasan pelanggan noach cafe and bistro. Agora, 7(2).