Library:

> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")
> # install.packages("pscl")
> # install.packages("generaLhosLem")

1 PENDAHULUAN

1.1 Latar Belakang

Pada saat ini statistika memiliki peranan yang penting dalam mengolah data. Statistika adalah ilmu yang berperan dalam mengumpulkan, menyajikan, dan menganalisis data. Salah satu analisis yang sering digunakan dalam statistika adalah analisis regresi. Analisis regresi adalah metode yang dapat digunakan dalam mengetahui hubungan antara dua atau lebih variabel. Analisis regresi dapat diterapkan di berbagai bidang, salah satunya adalah pada bidang kebidanan.

Permasalahan yang sering dijumpai pada bidang kebidanan adalah masalah kelahiran bayi prematur. Kelahiran dapat dikatakan prematur karena proses persalinan terjadi pada minggu ke 22 sampai minggu ke 37 usia kehamilan. Bayi yang lahir secara prematur mempunyai risiko kematian lebih tinggi dibandingkan dengan bayi pada umumnya. Menurut Badan Kesehatan Dunia, Indonesia masuk 10 besar negara dengan angka kelahiran prematur terbesar di dunia. Secara global kelahiran prematur terjadi pada 5% kehamilan sedangkan keguguran 10%. Banyak penyebab dari kelahiran prematur diantaranya adalah riwayat prematur, ibu menderita darah tinggi (hipertensi), ibu menderita penyakit anemia, dan terjadi pendarahan yang dapat disebabkan karena benturan ataupun lainnya.

Pada laporan ini akan membahas tentang hubungan penyebab kelahiran prematur terhadap kelahiran prematur pada bayi dengan menggunakan model regresi logistik biner. Dengan model yang diperoleh akan mengetahui hubungan penyebab kelahiran prematur terhadap terjadinya kelahiran prematur pada bayi.

2 TINJAUAN PUSTAKA

2.1 Analisis Regresi

Analisis Regresi adalah salah satu analisis dalam statistik yang dapat digunakan dalam mengetahui hubungan antara dua atau lebih variabel. Pada analisis regresi terdapat dua jenis variabel yaitu variabel respon yang dilambangkan sebagai Y dan variabel bebas yang dilambangkan sebagai X. Bentuk umum persamaan analisis regresi adalah sebagai berikut: \[ Y_{i}=\beta_{0}+\beta_{1}X_{i}+\epsilon_{i} \] Dimana:

\(Y_{i}\)= Variabel terikat untuk pengamatan ke-i

\(\beta_{0}\)= Nilai konstanta

\(\beta_{1}\)= Paramtere model

\(X_{i}\)= Variabel bebas pengamatan ke-i

\(\epsilon_{i}\)= Galat regresi

Pada analisis regresi terdapat dua kelompok, yaitu analisis regresi linier dan regresi nonlinier. Salah satu contoh dari regresi nonlinier yang digunakan untuk mengolah data berskala kualitatif adalah model regresi logistik. Tujuan dari regresi logistik adalah untuk mengetahui model terbaik dan sederhana yang dapat digunakan untuk mengetahui hubungan antara variabel bebas dan variabel respon. Regresi linier berbeda dengan regresi logistik pada penggunaan jenis variabel responnya. Pada regresi linier menggunakan variabel respon numerik sedangkan pada regresi logistik menggunakan variabel respon kategorik. Regresi logistik dapat dibagi menjadi regresi logistik biner, regresi logistik ordinal, dan regresi logistik multinomial.

2.2 Regresi Logistik Biner

Regresi logistik biner digunakan dalam mengetahui hubungan antara satu variabel respon dengan beberapa variabel bebas. Variabel respon pada regresi logostik biner berupa data kualitatif dengan nilai 1 menyatakan keberadaan sebuah karakteristik dan nilai 0 menyatakan ketidakberadaan sebuah karakteristik. \[ f(y_{i})= {\pi_{i}^{y_{i}}} (1-\pi_{i})^{(1-y_{i})}, y_{i}=0,1 \] Peluang variabel respon untuk suatu nilai x, dilambangkan dengan persamaan umum sebagai berikut \[ \pi(x) = \frac{exp(\beta_{0}+\beta_1X_1+...+\beta_pX_p)}{1+exp(\beta_{0}+\beta_1X_1+...+\beta_pX_p)} \] Dimana:

\(\pi(x)\)= Peluang terjadinya kategori variabel respon

\(xji\)= Variabel prediktor ke-j

\(p\)= Banyaknya variabel prediktor

\(\beta_0\)= Intersep

\(\beta_0,\beta_1,..,\beta_p\)= Koefisien regresi untuk setiap variabel prediktor

Dan dapat ditransformasi menjadi bentuk logit sebagai berikut \[ g(x)=ln(\frac{\pi(x)}{1-\pi(x)}) \] \[ g(x)=\beta_{0}+\beta_1X_1+...+\beta_pX_p \]

2.3 Uji Signifikansi Keseluruhan Model

Pengujian regresi logistik dilakukan untuk mengetahui apakah model memiliki hubungan yang signifikan dengan cara sebagai berikut. \[ G=-2log (\frac{L_o}{L_p}) \] Dimana:

\(p\)= Banyaknya Variabel Prediktor dalam model

\(L_o\)= Nilai likelihood tanpa variabel prediktor

\(L_p\)= Nilai likelihood dengan variabel prediktor

2.4 Uji Parsial Parameter Model

Uji parsial parameter model digunakan untuk mengetahui pengaruh variabel bebas terhadap variabel respon. Pengujian Parsial Parameter Model dapat dilakukan dengan menggunakan uji Wald.

2.5 Odds Ratio

Odds ratio digunakan dalam menginterpretasikan regresi logistik. Odds adalah rasio peluang suskses terhadap peluang gagal. Nilai odds rato bernilai positif.

2.6 Uji Kelayakan Model

Uji kelayakan model digunakan untuk mengetahui model regresi yang telah didapatkan bisa merepresentasikan data yang diamati. Kelayakan model pada uji regresi logistik atau Goodness of Fit dapat diketahui melalui tabel Hosmer and Lemeshow Test

2.7 Data

Data yang digunakan pada laporan ini adalah data sekunder. Data sekunder adalah data yang diperoleh dari sumber yang telah ada. Data pada analisis ini adalah data kelahiran prematur dan penyebab kelahiran prematur. Terdapat 50 amatan dan 4 variabel yang terdiri dari 3 variabel bebas dan 1 variabel respon, diantaranya adalah:

  • X1= Riwayat prematur (0=Tidak Ada, 1=Ada)

  • X2= Hipertensi (0=Tidak, 1=Ya)

  • X3= Anemia (0=Tidak, 1=Ya)

  • X4= Pendarahan (0=Tidak, 1=Ya)

  • Y= Kelahiran prematur (0=Tidak Prematur, 1=Prematur)

3 SOURCE CODE

3.1 Input Data

> data<-read.csv("D:/LATIHAN, UTS,UAS/SMT 4/KOMSTAT/laprak1.csv", header=TRUE, sep=",")
> X1= as.factor(data$Riwayat_Prematur)
> X2= as.factor(data$Hipertensi)
> X3= as.factor(data$Anemia)
> X4= as.factor(data$Pendarahan)
> Y= as.factor(data$Kelahiran_Prematur)
> df=data.frame(X1,X2,X3,X4,Y)
> str(df)

3.2 Model Regresi Logistik

> Model<-glm(Y~X1+X2+X3+X4, family=binomial, data=df)
> beta=coef(Model)
> OR=exp(beta)
> SK=exp(confint(Model))
> cbind(beta,OR,SK)

3.3 Uji Signifikansi Keseluruhan Model

> library(pscl)
> pR2(Model)

3.4 Uji Parsial Parameter Model

> summary(Model)

3.5 Pengujian Kesesuaian Model

> klasifikasi<-table(df$Y,fitted(Model)>0.5)
> klasifikasi
> 
> library(generalhoslem)
> logitgof(df$Y, fitted(Model))

4 HASIL DAN PEMBAHASAN

4.1 Model Regresi Logistik


Call:
glm(formula = Y ~ X1 + X2 + X3 + X4, family = binomial, data = df)

Coefficients:
            Estimate Std. Error z value Pr(>|z|)  
(Intercept)   1.9929     0.9045   2.203   0.0276 *
X11          -1.3823     0.6879  -2.009   0.0445 *
X21          -0.8838     0.6836  -1.293   0.1960  
X31          -1.6077     0.6880  -2.337   0.0195 *
X41           0.1330     0.6490   0.205   0.8376  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 68.593  on 49  degrees of freedom
Residual deviance: 58.400  on 45  degrees of freedom
AIC: 68.4

Number of Fisher Scoring iterations: 3
(Intercept)         X11         X21         X31         X41 
  7.3367076   0.2510064   0.4131991   0.2003446   1.1422580 

Berdasarkan data yang diamati diperoleh model regresi logistik sebagai berikut.

\[ \pi(x)=\frac{exp(1.9929-1.3823Xi-0.8838X2-1.6077X3+0.1330X4)}{1+exp(1.9929-1.3823Xi-0.8838X2-1.6077X3+0.1330X4)} \] \[ g(x)=ln(\frac{\pi(x)}{1-\pi(x)})=1.9929-1.3823Xi-0.8838X2-1.6077X3+0.1330X4 \] Interpretasi dari model regresi logistik dapat dilihat melalui hasil odds ratio

  • 7.3367 artinya bahwa ketika nilai seluruh variabel X bernilai 0 maka kelahiran prematur pada bayi akan bernilai sebesar 7.3367

  • 0.251 artinya adalah ketika variabel riwayat prematur bernilai 1 dan variabek X lain bernilai konstan maka kelahiran prematur pada bayi akan mengalami pengingkatan sebesar 0.251 kali

  • 0.4132 artinya adalah ketika variabel hipertensi bernilai 1 dan variabek X lain bernilai konstan maka kelahiran prematur pada bayi akan mengalami pengingkatan sebesar 0.4132 kali

  • 0.2003 artinya adalah ketika variabel anemia bernilai 1 dan variabek X lain bernilai konstan maka kelahiran prematur pada bayi akan mengalami pengingkatan sebesar 0.2003 kali

  • 1.1422 artinya adalah ketika variabel pendarahan bernilai 1 dan variabek X lain bernilai konstan maka kelahiran prematur pada bayi akan mengalami pengingkatan sebesar 1.1422 kali

4.2 Uji Signifikansi Keseluruhan Model

fitting null model for pseudo-r2
        llh     llhNull          G2    McFadden        r2ML        r2CU 
-29.1999764 -34.2964900  10.1930272   0.1486016   0.1844239   0.2470961 
[1] 7.814728

Pada output diatas nilai G2 sebesar 10.19303 dengan nilai chisquare sebesar 7.8147. Berdasarkan hasil tersebut nilai G2 lebih besar dibandingkan dengan nilai chisquare sehingga dapat diputuskan bahwa H0 ditolak. Maka dapat disimpulkan bahwa model signifikan atau variabel berpengaruh terhadap kelahiran prematur pada bayi.

4.3 Uji Parsial Parameter Model


Call:
glm(formula = Y ~ X1 + X2 + X3 + X4, family = binomial, data = df)

Coefficients:
            Estimate Std. Error z value Pr(>|z|)  
(Intercept)   1.9929     0.9045   2.203   0.0276 *
X11          -1.3823     0.6879  -2.009   0.0445 *
X21          -0.8838     0.6836  -1.293   0.1960  
X31          -1.6077     0.6880  -2.337   0.0195 *
X41           0.1330     0.6490   0.205   0.8376  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 68.593  on 49  degrees of freedom
Residual deviance: 58.400  on 45  degrees of freedom
AIC: 68.4

Number of Fisher Scoring iterations: 3
  1. Untuk variabel X1

    Nilai-p = 0.0445, karena nilai-p < 0.05 maka tolak H0

    Maka dengan tingkat kepercayaan 95% dapat disimpulkan bahwa riwayat prematur berpengaruh terhadap kelahiran prematur pada bayi

  2. Untuk variabel X2

    Nilai-p = 0.1960, karena nilai-p > 0.05 maka terima H0

    Maka dengan tingkat kepercayaan 95% dapat disimpulkan bahwa hipertensi tidak berpengaruh terhadap kelahiran prematur pada bayi

  3. Untuk variabel X3

    Nilai-p = 0.0195, karena nilai-p < 0.05 maka tolak H0

    Maka dengan tingkat kepercayaan 95% dapat disimpulkan bahwa anemia berpengaruh terhadap kelahiran prematur pada bayi

  4. Untuk variabel X4

    Nilai-p = 0.8376, karena nilai-p > 0.05 maka terima H_0

    Maka dengan tingkat kepercayaan 95% dapat disimpulkan bahwa pendarahan tidak berpengaruh terhadap kelahiran prematur pada bayi

4.4 Klasifikasi

   
    FALSE TRUE
  0    15    7
  1     8   20

Dari 22 amatan dengan Y=0, hanya 7 yang diklasifikasikan dengan benar. Sedangkan dari 28 amatan dengan Y=1, terdapat 20 diantaranya diklasifikasikan dengan benar. Maka dapat disimpulkan bahwa tingkat akurasi model sebesar 54%

4.5 Pengujian Kesesuaian Model


    Hosmer and Lemeshow test (binary model)

data:  df$Y, fitted(Model)
X-squared = 5.9729, df = 8, p-value = 0.6503

Berdasarkan hasil output diatas diperoleh nilai-p 0.6503 lebih besar dari 0.05, maka terima H0. Maka dapat disimpulkan bahwa model yang diperoleh dapat digunakan.

5 KESIMPULAN

Berdasarkan hasil analisis regresi logistik yang telah dilakukan, maka dapat disimpulkan bahwa variabel riwayat prematur dan variabel anemia berpengaruh terhadap kelahiran prematur pada bayi. Sedangkan variabel hipertensi dan variabel pendarahan tidak berpengaruh terhadap kelahiran prematur pada bayi.

6 DAFTAR PUSTAKA

Asyiah, N. 2009. Regresi Logistik dan Penerapannya Dalam Bidang Kesehatan (Studi Kasus Kelahiran Prematur di RSKIA PKU Muhammadiyah Kotagede Yogyakarta). UIN Sunan Kalijaga Yogyakarta

Mutiara, V. 2021. Faktor-Faktor yang Berhubungan dengan Persalinan Prematur. Profesional Health Journal, Vol. 2, No. 2

Sulistiarini, D. 2016. Faktor-Faltor yang Memengaruhi Kelahiran Prematur di Indonesia: Analisis Data Riskesdas 2013. E-Journal WIDYA Kesehatan Dan Lingkungan, Vol. 1 No. 2