1 PENDAHULUAN
1.1 Latar Belakang
Analisis Regresi Logistik adalah sebuah metode statistika yang digunakan untuk memahami hubungan antara satu atau lebih variabel independen (biasanya disebut prediktor) dengan variabel dependen biner (disebut juga variabel respons atau variabel terikat), di mana variabel dependen memiliki dua kategori atau nilai yang mungkin. Tujuan utama dari analisis regresi logistik adalah untuk memprediksi probabilitas bahwa suatu kejadian akan terjadi berdasarkan nilai-nilai variabel independen yang terkait dengannya.
Proses analisis regresi logistik melibatkan pembuatan model matematika yang memetakan nilai-nilai variabel independen ke probabilitas variabel dependen yang berada dalam rentang antara 0 dan 1. Model ini menggunakan fungsi logit atau log-odds untuk memodelkan hubungan ini. Fungsi logit mengubah probabilitas ke dalam rentang nilai yang tidak terbatas, sehingga memungkinkan penggunaan metode statistika konvensional seperti metode maksimum likelihood untuk menentukan parameter-model yang paling sesuai dengan data.
Analisis regresi logistik memiliki banyak aplikasi dalam berbagai bidang, termasuk ilmu sosial, kedokteran, ekonomi, dan bisnis. Contoh penggunaannya termasuk memprediksi kemungkinan seseorang membeli produk berdasarkan karakteristik demografis mereka, memodelkan risiko kekambuhan penyakit berdasarkan faktor-faktor tertentu, dan menilai pengaruh kampanye pemasaran terhadap peningkatan penjualan.
Keuntungan dari analisis regresi logistik termasuk kemampuannya untuk menangani variabel dependen yang biner, fleksibilitas dalam memperluas model untuk mengakomodasi lebih dari dua kategori pada variabel dependen, serta kemampuannya untuk memberikan interpretasi probabilistik yang jelas terhadap hubungan antara variabel. Namun, seperti halnya dengan metode statistika lainnya, analisis regresi logistik juga memiliki batasan, termasuk sensitivitas terhadap asumsi-asumsi model tertentu dan kebutuhan akan sampel yang cukup besar untuk memperoleh estimasi parameter yang stabil.
2 Tinjauan Pustaka
2.1 Analisis Regresi
Analisis regresi adalah teknik statistik yang digunakan untuk memeriksa dan memodelkan hubungan antara variabel-variabel. Teknik ini melibatkan dua jenis variabel yang terhubung, yaitu variabel respons dan satu atau lebih variabel prediktor. Dalam berbagai literatur, variabel respons sering kali disebut dengan berbagai istilah lain seperti variabel tidak bebas, variabel dependen, atau variabel terikat. Di sisi lain, variabel prediktor dapat dikenal dengan sebutan variabel bebas, variabel independen, atau variabel penjelas. Dalam model regresi, hanya ada satu variabel respons yang menjadi fokus utama analisis.
Model regresi memainkan peran penting dalam berbagai bidang, termasuk teknik, fisika, ekonomi, manajemen, biologi, pertanian, dan banyak lagi. Tujuan utama dari penggunaan model regresi meliputi beberapa aspek berikut:
Deskripsi Data: Analisis regresi digunakan untuk memberikan gambaran menyeluruh tentang data yang ada, sehingga memungkinkan pemahaman lebih dalam mengenai pola dan hubungan di antara variabel-variabel.
Penaksiran Parameter: Melalui analisis regresi, parameter-parameter dalam model dapat diestimasi, yang membantu dalam mengukur kekuatan dan arah hubungan antara variabel independen dan variabel dependen.
Prediksi: Salah satu fungsi utama dari model regresi adalah memprediksi nilai variabel dependen berdasarkan nilai variabel independen. Ini sangat bermanfaat dalam membuat perkiraan atau proyeksi di masa depan.
Kontrol: Dalam banyak aplikasi, analisis regresi digunakan untuk mengontrol variabel-variabel tertentu guna memahami dampaknya terhadap variabel respons, yang dapat membantu dalam pengambilan keputusan yang lebih tepat dan efektif.
Dengan demikian, analisis regresi merupakan alat yang sangat berharga dalam penelitian dan aplikasi praktis di berbagai disiplin ilmu, karena kemampuannya untuk menganalisis hubungan kompleks antara variabel dan memberikan wawasan yang berguna untuk deskripsi, estimasi, prediksi, dan pengendalian.
Berikut adalah bentuk umum dari model regresi linear berganda:
\[ Y = \beta _{0} + \beta _{1}X_{1}+\beta _{2}X_{2}+...+\beta _{p}X_{p}+\epsilon \] Keterangan:
\(Y\) = Variabel respons (yang dipengaruhi)
\(X_{i}\) = Variabel prediktor (yang memengaruhi)
\(\beta_{0}\) = Intercept atau konstanta
\(\beta_{i}\) = Koefisien regresi variabel prediktor
2.2 Analisis Regresi Logistik Biner
Analisis Regresi Logistik Biner adalah metode statistik yang digunakan untuk memodelkan hubungan antara satu atau lebih variabel independen (prediktor) dengan variabel dependen biner (biasanya variabel target yang memiliki dua nilai, seperti 0 dan 1). Oleh karena itu,variabel dependen biner mengikuti distribusi bernoulli yang memiliki fungsi kepekatan peluang sebagai berikut.
\[ f(y_{i})=\pi (x_{i})^{y_{i}}(1-\pi (x_{i}))^{1-y_{i}},y_{i}=0,1 \] Keterangan:
\(y_{i}\)= Variabel respons ke-i (dengan nilai 0 atau 1)
\(\pi_{i}\) = Peluang kejadian ke-i
Jika analisis regresi logistik terdiri dari beberapa variabel prediktor maka model yang terbentuk sebagai berikut:
\[ \pi(x_{i})=\frac{exp(\beta _{0}+\beta _{1}x _{1i}+\beta _{2}x _{2i}+...+\beta _{p}x _{pi})}{1+exp(\beta _{0}+\beta _{1}x _{1i}+\beta _{2}x _{2i}+...+\beta _{p}x _{pi})} \] Keterangan:
\(\pi(x_{i})\) = Peluang terjadinya kategori variabel respon
\(x_{ji}\) = Variabel prediktor ke-j
\(p\) = Banyaknya variabel prediktor
\(\beta_{0}\) = Intercept
\(\beta_{0},\beta_{1},...\beta_{p}\) = Koefiesien regresi untuk setiap variabel prediktor
2.3 Data
Data berikut merupakan data mengenai faktor stillbirth di Kabupaten Aceh Timur. Data berikut diperoleh dari jurnal dengan judul “ANALISIS REGRESI LOGISTIK BINER UNTUK MENENTUKAN FAKTOR STILLBIRTH DI KABUPATEN ACEH TIMUR”.
> setwd("C:/Users/HP/Documents")
> data <- read.csv("Data Regresi Logistik.csv", header = TRUE, sep = ";")
> head(data)
Y X1 X2 X3 X4
1 1 1 0 0 33
2 1 1 0 0 38
3 0 1 0 1 31
4 0 0 1 0 32
5 0 1 0 0 24
6 0 0 1 0 24Keterangan:
\(Y\) = Status kejadian stillbirth
\(X_{1}\) = Infeksi selama kehamilan (0 = tidak terjadinya infeksi kehamilan, 1 = terjadinya infeksi kehamilan)
\(X_{2}\) = Kelainan atau cacat bawaan (0 = tidak mengalami kelainan atau cacat bawaan, 1 = mengalami kelainan atau cacat bawaan)
\(X_{3}\) = Kondisi Ibu (0 = preklamsia, 1 = diabetes)
\(X_{4}\) = Usia Ibu (0 = 24 - 31 tahun, 1 = 32 - 40 tahun)
Sumber : https://ojs3.unpatti.ac.id/index.php/barekeng/article/view/1580/2689
2.4 Tujuan
Penelitian ini bertujuan untuk meninjau faktor penyebab yang berpengaruh signifikan terhadap stillbirth. Stillbirth merupakan kelahiran bayi dalam keadaan tidak bernyawa yang telah mencapai umur kehamilan 20 minggu atau sebelum masa persalinan. Terdapat beberapa penyebab stillbirth yaitu infeksi selama kehamilan, kelainan atau cacat bawaan, kondisi kesehatan ibu, usia ibu, dan sebagainya.
3 SOURCE CODE
3.1 Library
> library(knitr)
> library(rmarkdown)
> library(prettydoc)
> library(equatiomatic)3.2 Impor Data
> setwd("C:/Users/HP/Documents")
> data <- read.csv("Data Regresi Logistik.csv", header = TRUE, sep = ";")
> show(data)
Y X1 X2 X3 X4
1 1 1 0 0 33
2 1 1 0 0 38
3 0 1 0 1 31
4 0 0 1 0 32
5 0 1 0 0 24
6 0 0 1 0 24
7 0 0 0 0 26
8 1 1 0 1 36
9 1 0 1 0 30
10 1 1 0 0 25
11 0 1 0 1 40
12 0 0 0 0 31
13 1 0 1 0 39
14 1 1 0 1 25
15 1 1 0 0 26
16 0 0 1 0 38
17 1 1 0 1 31
18 0 0 0 0 37
19 0 1 0 0 37
20 0 0 1 0 36
21 1 0 1 0 40
22 1 1 0 0 30
23 0 0 1 0 26
24 0 0 1 0 39
25 1 1 0 1 31
26 1 1 0 0 24
27 1 0 1 0 40
28 1 1 0 1 30
29 0 0 1 0 32
30 1 1 0 0 28
31 1 0 1 1 33
32 1 1 0 1 27
33 0 0 0 0 2
34 0 0 1 0 39
35 0 1 0 0 26
36 0 1 0 0 33
37 0 1 0 0 32
38 1 1 0 0 36
39 1 1 0 1 25
40 0 0 1 0 25
41 0 0 0 0 34
42 0 1 0 0 33
43 1 1 0 0 24
44 1 1 0 1 33
45 1 1 0 0 25
46 0 0 1 0 3
47 0 0 0 0 37
48 0 1 0 0 38
49 1 1 0 0 31
50 1 0 1 1 29
51 1 1 0 0 38
52 1 0 0 1 28
53 1 1 0 1 27
54 1 0 1 0 24
55 1 0 1 0 353.3 Analisis
> reglog <- glm(Y~X1+X2+X3+X4, family = binomial, data = data)
> summary(reglog)
Call:
glm(formula = Y ~ X1 + X2 + X3 + X4, family = binomial, data = data)
Deviance Residuals:
Min 1Q Median 3Q Max
-2.1718 -1.0076 0.4489 1.0408 1.3630
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -2.280340 1.680598 -1.357 0.1748
X1 2.561336 1.229394 2.083 0.0372 *
X2 1.815215 1.270444 1.429 0.1531
X3 1.913408 0.900208 2.126 0.0335 *
X4 0.001613 0.042766 0.038 0.9699
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 75.791 on 54 degrees of freedom
Residual deviance: 61.360 on 50 degrees of freedom
AIC: 71.36
Number of Fisher Scoring iterations: 4> #Hasil R-Squared
> Rsq <- 1-(61.360/75.791)
> Rsq
[1] 0.1904052> #Pembentukan tabel berisi penduga parameter
> beta <- coef(reglog)
> OR_beta <- exp(beta)
> sk_OR <- exp(confint(reglog))
> cbind(beta,OR_beta,sk_OR)
beta OR_beta 2.5 % 97.5 %
(Intercept) -2.280339862 0.1022495 0.002087498 1.909019
X1 2.561336039 12.9531116 1.606006716 296.404960
X2 1.815215386 6.1423990 0.695077071 148.759380
X3 1.913407866 6.7761417 1.386450287 55.815711
X4 0.001612997 1.0016143 0.922129607 1.098100> #Klasifikasi Model
> yp_hat <- fitted(reglog)
> Y <- data$Y
> class <- table(Y,yp_hat > 0.5)
> class
Y FALSE TRUE
0 16 9
1 7 234 HASIL DAN PEMBAHASAN
4.1 Model Logit
Berdasarkan hasil output di atas model logit yang terbentuk sebagai berikut: \[ Logit[\hat{\pi }(X)]=-2.28034+2.56134{X_{1}}+1.81522{X_{2}}+1.91341{X_{3}}+0.00161{X_{4}} \] Interpretasi:
Jika \(X_{1}\)(Infeksi selama kehamilan), \(X_{2}\)(Kehamilan atau cacat bawaan), \(X_{3}\)(Kondisi Ibu), \(X_{4}\)(Usia Ibu) bernilai = 0, maka nilai stillbirth adalah sebesar -2.28034 jiwa
Setiap kejadian infeksi kehamilan pada Ibu akan meningkatkan kejadian stillbirth sebesar 2.56134 jiwa
Setiap kejadian kelainan atau cacat bawaan pada Ibu akan meningkatkan kejadian stillbirth sebesar 1.81522 jiwa
Setiap status diabetes pada ibu akan meningkatkan kejadian stillbirth sebesar 1.91341 jiwa
Setiap status usia Ibu 32 - 40 tahun akan meningkatkan kejadian stillbirth sebesar 0.00161 jiwa
4.2 Uji Parsial
4.2.1 Nilai p untuk variabel prediktor \(X_{1}\) yang diperoleh pada hasil output tersebut:
> 0.0372
[1] 0.0372Interpretasi:
Dengan taraf nyata sebesar 5% dapat dibuktikan bahwa infeksi kehamilan memberikan pengaruh signifikan terhadap kejadian stillbirth.
4.2.2 Nilai p untuk variabel prediktor \(X_{2}\) yang diperoleh pada hasil output tersebut:
> 0.1531
[1] 0.1531Interpretasi:
Dengan taraf nyata sebesar 5% dapat dibuktikan bahwa kelainan atau cacat bawaan tidak memberikan pengaruh signifikan terhadap kejadian stillbirth.
4.2.3 Nilai p untuk variabel prediktor \(X_{3}\) yang diperoleh pada hasil output tersebut:
> 0.0335
[1] 0.0335Interpretasi:
Dengan taraf nyata sebesar 5% dapat dibuktikan bahwa status diabetes pada ibu memberikan pengaruh signifikan terhadap kejadian stillbirth.
4.2.4 Nilai p untuk variabel prediktor \(X_{4}\) yang diperoleh pada hasil output tersebut:
> 0.9699
[1] 0.9699Interpretasi:
Dengan taraf nyata sebesar 5% dapat dibuktikan bahwa status usia ibu 32 - 40 tahun tidak memberikan pengaruh signifikan terhadap kejadian stillbirth.
4.3 R-Squared
Hasil R-Squared yang didapat:
> Rsq
[1] 0.1904052Interpretasi:
Variabel infeksi selama kehamilan, kelainan atau cacat bawaan, kondisi kesehatan ibu dan usia ibu hanya menjelaskan pengaruh terhadap stillbirth sebesar 19%. Sedangkan 81% dipengaruhi oleh variabel lain di luar model.
4.4 Odds Ratio
Odds Ratio yang dihasilkan oleh output sebagai berikut:
> OR_beta
(Intercept) X1 X2 X3 X4
0.1022495 12.9531116 6.1423990 6.7761417 1.0016143 Interpretasi:
Jika terjadi infeksi kehamilan pada Ibu, maka kecenderungan kejadian stillbirth meningkat sebesar 12.9531 jiwa. Dengan kata lain, semakin seorang Ibu menderita infeksi kehamilan maka potensi kejadian stillbirth juga akan meningkat.
Jika terjadi kelainan atau cacat bawaan pada Ibu, maka kecenderungan kejadian stillbirth meningkat sebesar 6.1424 jiwa. Dengan kata lain, semakin seorang Ibu memiliki kelainan atau cacat bawaan maka potensi kejadian stillbirth juga akan meningkat.
Jika status Ibu menderita diabetes, maka kecenderungan kejadian stillbirth meningkat sebesar 6.7761 jiwa. Dengan kata lain, semakin seorang Ibu menderita diabetes maka potensi kejadian stillbirth juga akan meningkat.
Jika status usia Ibu berada diantara 32 - 40 tahun, maka kecenderungan kejadian stillbirth meningkat sebesar 1.0016 jiwa. Dengan kata lain, semakin seorang Ibu berusia 32 - 40 tahun maka potensi kejadian stillbirth juga akan meningkat.
4.5 Klasifikasi Model
Klasifikasi model yang dihasilkan oleh output sebagai berikut:
> class
Y FALSE TRUE
0 16 9
1 7 23Interpretasi:
Dari 25 amatan \(Y\)= 0 yang dihasilkan, hanya 9 amatan yang terklasifikasi sebagai benar
Dari 30 amatan \(Y\)= 1 yang dihasilkan, 23 amatan yang terklasifikasi sebagai benar
5 KESIMPULAN
Dari hasil perhitungan analisis regresi logistik yang telah dilakukan dapat disimpulkan bahwa variabel infeksi kehamilan dan status diabetes pada Ibu cukup memberikan pengaruh terhadap kejadian stillbirth. Hal ini berarti bahwa jika seorang Ibu menderita infeksi kehamilan dan mengidap diabetes maka akan meningkatkan potensi kejadian stillbirth. Sehingga, seorang Ibu hamil harus menjaga kesehatannya untuk menghindari atau memperkecil kemungkinan kejadian stillbirth
6 DAFTAR PUSTAKA
F. Muliani, Amelia, U. Nabilla, Azizah. “ANALISIS REGRESI LOGISTIK BINER UNTUK MENENTUKAN FAKTOR STILLBIRTH DI KABUPATEN ACEH TIMUR”, BAREKENG: J. Il Mat. & Ter., vol.15, no. 1, pp. 001-008, Mar.2021.
Achmad Effendi, Ni Wayan Surya Wardhani, Rahma Fitriani, Eni Sumarminingsih. (2020). Analisis Regresi: Teori dan Aplikasi dalam R. Malang: Universitas Brawijaya Press.