Penerapan Analisis Regresi Logistik untuk Mengetahui Pengaruh Pengetahuan Ibu dan Status Pekerjaan terhadap Pemberian ASI Eksklusif

Anindya Raissa Putri

2023-06-01

1 PENDAHULUAN

1.1 Latar Belakang

Air Susu Ibu (ASI) merupakan frasa yang sering kita dengar ataupun baca. tentulah sebagai seorang ibu, ingin memberikan hak anak-anaknya, termasuk memberikan ASI sampai usia 2 tahun. Namun, pada kenyataannya tidak semua ibu berhasil melakukannya (Derni & Orin, 2007).

Faktor yang dapat mempengaruhi pemberian ASI eksklusif adalah pengetahuan dan status pekerjaan. Para ibu beralih ke susu formula karena terhentinya pemberian ASI eksklusif terjadi pada ibu bekerja, terutama di perkotaan. Cheatterji dan Frick (2005) menyatakan bahwa kembali bekerja dalam tiga bulan pertama setelah melahirkan sangat berhubungan dengan penurunan untuk memulai menyusui sebesar 16%-18%, dan pengurangan durasi menyusui sekitar 4-5 minggu. Pada percobaan ini akan diamati untuk mengetahui ada atau tidaknya pengaruh antara pengetahuan ibu dan status pekerjaan sebagai variabel prediktor \((X)\) terhadap pemberian ASI eksklusif sebagai variabel dependen \((Y)\).

1.2 Rumusan Masalah

  1. Bagaimana model dari metode regresi logistik biner dari data Pemberian ASI Eksklusif?
  2. Apa saja faktor-faktor yang berpengaruh secara signifikan terhadap Pemberian ASI Eksklusif?
  3. Bagaimana kesimpulan yang dapat diambil dari kasus Pemberian ASI Eksklusif?

1.3 Tujuan Penelitian

  1. Memberikan informasi mengenai model dari metode regresi logistic biner dari data Pemberian ASI Eksklusif.
  2. Memberikan informasi mengenai factor-faktor yang berpengaruh secara signifikan terhadap Pemberian ASI Eksklusif.
  3. Memberikan informasi mengenai kesimpulan yang dapat diambil dari kasus Pemberian ASI Eksklusif.

1.4 Data Penelitian

Data berasal dari Repositori Universitas Dian Nuswantoro yaitu berupa data Pengetahuan Ibu dan Status Pekerjaan yang diasumsikan mengikuti regresi logistik biner beserta faktor yang diduga berpengaruh terhadap Pemberian ASI Eksklusif.

Keterangan:

\(Y\) = Pemberian ASI Eksklusif (jika diberikan ASI Eksklusif = “1”, tidak diberikan ASI Eksklusif = “0”)

\(X_1\) = Status Pekerjaan (jika bekerja = “1”, tidak bekerja = “0”)

\(X_2\) = Pengetahuan Ibu (jika tidak memiliki pengetahuan = “1”, kurang memiliki pengetahuan =“2”, cukup memiliki pengetahuan = “3”, memiliki pengetahuan yang baik = “4”, memiliki pengetahuan sangat baik = “5”)

2 TINJAUAN PUSTAKA

2.1 Asumsi Multikolinearitas

Asumsi multikolinieritas adalah asumsi dalam analisis regresi yang menyatakan bahwa tidak ada hubungan linier sempurna antara variabel independen yang digunakan dalam model regresi. Multikolinieritas terjadi ketika dua atau lebih variabel independen dalam model regresi memiliki hubungan linier yang kuat antara satu sama lain. Metode yang digunakan untuk menguji ada atau tidak adanya multikoliniearitas adalah dengan melihat nilai tolerance value atau variance inflation factor (VIF).

Batas tolerance value adalah 0.10 atau nilai VIF adalah 10. Jika VIF lebih dari 10 dan nilai tolerance kurang dari 0.1, maka terjadi multikoliniearitas yang tinggi antar variabel bebas dengan variabel bebas lainnya. Namun apabila VIF kurang dari 10 dan nilai tolerance lebih dari 0.10, maka dapat diartikan tidak terdapat multikolinieritas. Regresi yang baik memiliki VIF sekitar angka 1 dan mempunyai nilai tolerance mendekati 1. Berikut rumus VIF dan Tolerance :

\(VIF = \frac{1}{Tolerance}\)

\(Tolerance = \frac{1}{(1-R^2)}\)

2.2 Analisis Regresi

Analisis regresi sederhana bertujuan untuk mengetahui pengaruh dari suatu variabel terhadap variabel lainnya. Pada analisis regresi suatu variabel yang mempengaruhi disebut variabel bebas atau independent variable, sedangkan variabel yang dipengaruhi disebut variabel terkait atau dependent variable. Jika persamaan regresi hanya terdapat satu variabel bebas dengan satu variabel terkait, maka disebut dengan persamaan regresi sederhana. Jika variabel bebasnya lebih dari satu, maka disebut dengan persamaan regresi berganda. Pada regresi sederhana kita dapat mengetahui berapa besar perubahan dari variabel bebas dapat mempengaruhi suatu variabel terkait.Pada analisis regresi sederhana, hubungan antara \(x\) dan \(y\) dijelaskan oleh persamaan regresi :

\(Y = \beta _0 + \beta _1 X + \varepsilon\)

di mana \(y\) adalah variabel dependen, \(x\) adalah variabel independen, \(\alpha\) adalah intercept (nilai \(y\) ketika \(x=0\)), \(\beta_0\) adalah konstanta, \(\beta_1\) adalah koefisien regresi, dan \(\varepsilon\) adalah galat.

2.3 Regresi Logistik Biner

Regresi logistik adalah bagian dari analisis regresi yang digunakan untuk menganalisis variabel dependen yang bersifat kategori dan variabel independen bersifat kategori, kontinu, atau gabungan dari keduanya. Model regresi logistik biner digunakan untuk menganalisa hubungan antara satu variabel respon (variabel tak bebas) dan beberapa variabel bebas, dengan variabel responnya berupa data kualitatif dikotomi yaitu bernilai 1 untuk menyatakan keberadaan sebuah karakteristik dan bernilai 0 untuk menyatakan ketidakberadaaan sebuah karakteristik (Agresti , 2007). Model regresi logistik tersebut adalah :

Untuk mengetahui pengaruh variabel bebas, maka dilakukan uji signifikansi parameter baik secara keseluruhan maupun secara individu. Statistik uji yang digunakan dalam uji keseluruhan adalah uji G atau likelihood ratio test. Sedangkan statistik uji yang digunakan dalam uji parsial adalah statistik uji Wald (Hosmer & Lemeshow, 2000).

2.4 Uji Simultan

Uji simultan adalah metode statistik yang digunakan untuk menguji secara bersama-sama apakah semua koefisien regresi dalam suatu model regresi linier signifikan secara keseluruhan. Uji ini memberikan informasi tentang apakah setidaknya satu variabel independen memiliki pengaruh yang signifikan terhadap variabel dependen dalam model regresi.

Hipotesis

\(H0 : 𝛽_1= 𝛽_2=…= 𝛽_𝑝= 0\) (Tidak ada pengaruh antara variabel independen terhadap variabel dependen).

\(H1:\) Minimal terdapat satu \(𝛽_𝑗 ≠ 0.\) Dengan \(j = 1,2, … p\) (Ada pengaruh antara variabel independen terhadap variabel dependen).

Statistik Uji G

\(G = -2log(L0/Lp)\)

  • \(p :\) banyaknya variabel prediktor dalam model

  • \(L0 :\) nilai likelihood tanpa variabel prediktor

  • \(Lp :\) nilai likelihood dengan variabel prediktor

Keputusan

Tolak \(H_0\) apabila nilai statistik uji \(G > χ2(α,v)\), dengan taraf nyata sebesar \(α\) dan \(v\) adalah banyaknya variabel prediktor atau p-value statistik uji \(G < α(0,05)\).

2.5 Uji Parsial

Uji parsial, juga dikenal sebagai uji koefisien parsial atau uji t, adalah metode statistik yang digunakan untuk menguji secara individual apakah setiap koefisien regresi dalam model regresi linier signifikan. Uji ini memungkinkan kita untuk mengevaluasi pengaruh yang dimiliki oleh masing-masing variabel independen terhadap variabel dependen dalam model regresi. Tujuan dari uji parsial adalah untuk menentukan apakah koefisien regresi untuk setiap variabel independen secara individual memiliki pengaruh yang signifikan terhadap variabel dependen.

Hipotesis

\(𝐻_0: 𝛽_𝑗= 0.\) Dengan \(j = 1,2, … p\) (Tidak ada pengaruh antara masing-masing variabel independen terhadap variabel dependen).

\(𝐻_1: 𝛽𝑗 ≠ 0.\) Dengan \(j = 1,2, … p\) (Ada pengaruh antara masing-masing variabel independen terhadap variabel dependen).

Statistik Uji Wald

Keputusan

Tolak \(|𝑊| > Z(α/2)\) atau \(p-value\) statistik uji wald \(< α(0,05).\)

2.6 Odds Ratio

Odds ratio adalah ukuran perbandingan peluang (odds) terjadinya suatu kejadian atau kondisi antara kelompok yang terpapar dengan faktor risiko tertentu dan kelompok yang tidak terpapar. Odds ratio memberikan gambaran tentang seberapa besar perbedaan peluang kejadian tersebut antara kedua kelompok (Rothman dan Greenland : 1998).

Statistik Uji Odds Ratio

Keputusan

Bila nilai \(ψ = 1\), maka antara kedua variabel tersebut tidak terdapat hubungan.

Bila nilai \(ψ < 1\), maka antara kedua variabel terdapat hubungan negatif terhadap perubahan kategori dari nilai \(x\) dan demikian sebaliknya bila \(ψ >1.\)

2.7 Uji Kesesuaian Model

Uji kesesuaian model adalah prosedur statistik yang digunakan untuk mengevaluasi sejauh mana model regresi logistik cocok dengan data yang diamati. Uji ini menguji hipotesis nol bahwa tidak ada perbedaan yang signifikan antara nilai yang diprediksi oleh model dan nilai yang diobservasi dalam data (Hosmer dan Lemeshow :2000).

Hipotesis

\(H_0 :\) Model sesuai (tidak terdapat perbedaan yang signifikan antara hasil observasi dengan kemungkinan prediksi model)

\(H1:\) Model tidak sesuai (terdapat perbedaan yang signifikan antara hasil observasi dengan kemungkinan prediksi

Keputusan

Terima \(H_0\) jika nilai Sig. \(> 0.05\) maka dapat disimpulkan bahwa model regresi layak.

Tolak \(H_0\) jika nilai Sig. \(< 0.05\) maka dapat disimpulkan bahwa model regresi tidak layak.

2.8 Uji Ketepatan Klasifikasi

Uji ketepatan klasifikasi adalah metode untuk mengevaluasi seberapa akurat model klasifikasi dalam memprediksi kelas atau label yang benar dari data yang diamati. Uji ini membandingkan hasil prediksi model dengan label sebenarnya dalam data untuk menghitung tingkat akurasi atau ketepatan klasifikasi (Hastie, Tibshirani, dan Friedman : 2009).

3 SOURCE CODE, HASIL, DAN PEMBAHASAN

3.1 Library

> library(readxl)
> library(pscl)
> library(ResourceSelection)

3.2 Inisiasi Data

> #Menginput Data
> data <- read_excel("C:/Users/ASUS/OneDrive/Documents/semester 4/komstat/Data Pemberian ASI Eksklusif.xlsx")
> head(data)
# A tibble: 6 × 3
  Status_Pekerjaan Pengetahuan Pemberian_ASI
             <dbl>       <dbl>         <dbl>
1                1           1             0
2                1           1             0
3                1           2             0
4                1           2             0
5                1           2             0
6                1           2             0
> str(data)
tibble [40 × 3] (S3: tbl_df/tbl/data.frame)
 $ Status_Pekerjaan: num [1:40] 1 1 1 1 1 1 1 1 1 1 ...
 $ Pengetahuan     : num [1:40] 1 1 2 2 2 2 3 5 2 2 ...
 $ Pemberian_ASI   : num [1:40] 0 0 0 0 0 0 0 1 0 0 ...
> #Menginisiasi Data
> Y <- data$Pemberian_ASI
> X1 <- data$Status_Pekerjaan
> X2 <- data$Pengetahuan
> # Membuat Data Frame
> df <- data.frame(Y,X1,X2)
> df
   Y X1 X2
1  0  1  1
2  0  1  1
3  0  1  2
4  0  1  2
5  0  1  2
6  0  1  2
7  0  1  3
8  1  1  5
9  0  1  2
10 0  1  2
11 0  1  1
12 1  1  4
13 1  1  1
14 0  1  3
15 1  1  4
16 1  0  5
17 1  0  3
18 1  0  4
19 1  0  5
20 1  0  4
21 1  0  4
22 1  0  4
23 1  0  3
24 1  0  4
25 1  0  5
26 1  0  3
27 1  0  4
28 0  0  2
29 1  0  4
30 1  0  4
31 0  1  4
32 1  1  1
33 0  1  3
34 1  1  4
35 1  0  5
36 1  0  3
37 1  0  4
38 1  0  5
39 0  0  4
40 1  0  4

3.3 Asumsi Multikolinearitas

> #Uji Asumsi Multikolinearitas
> reglog_X1 <- lm(X1~X2, data=df)
> VIF_X1 <- 1 / (1 - summary(reglog_X1)$r.squared)
> reglog_X2 <- lm(X2~X1, data=df)
> VIF_X2 <- 1 / (1 - summary(reglog_X2)$r.squared)
> VIF <- data.frame(VIF_X1,VIF_X2)
> VIF
    VIF_X1   VIF_X2
1 1.523175 1.523175

Berdasarkan hasil perhitungan diatas, nilai VIF pada masing masing variabel prediktor menghasilkan nilai kurang dari 10. Dapat disimpulkan bahwa tidak terjadi multikolinieritas antar variabel prediktor \((X)\) atau tidak saling berkorelasi. Sehingga data yang merupakan faktor-faktor yang mempengaruhi Pemberian ASI Eksklusif dapat digunakan.

3.4 Analisis Regresi Logistik Biner

> #Regresi Logistik BIner
> reglog <- glm(Y~X1+X2,family = "binomial", data=df)
> summary(reglog)

Call:
glm(formula = Y ~ X1 + X2, family = "binomial", data = df)

Coefficients:
            Estimate Std. Error z value Pr(>|z|)  
(Intercept)  -1.0769     1.6931  -0.636   0.5247  
X1           -2.0904     0.9887  -2.114   0.0345 *
X2            0.8934     0.4307   2.074   0.0380 *
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 52.925  on 39  degrees of freedom
Residual deviance: 31.772  on 37  degrees of freedom
AIC: 37.772

Number of Fisher Scoring iterations: 5

Pembentukan model regresi logistik dilakukan dengan menggunakan perintah glm(), sedangkan perintah summary() Untuk memunculkan ringkasan dari model yang telah dibentuk. Diperoleh model regresi logistik berdasarkan data Pemberian ASI EKsklusif sebagai berikut:

\(g(x) = -1.0769 - 2.0904X_1 + 0.8934X_2\)

Interpretasi :

  • \(-2.0904\) berarti bahwa ketika nilai variabel \(X_1\)(Status Pekerjaan) meningkat 1 kejadian dan variabel prediktor lain bernilai konstan, maka akan terjadi penurunan sebesar \(0.27748\) pada pemberian ASI eksklusif.
  • \(0.8934\) berarti bahwa ketika nilai variabel \(X_2\)(Pengetahuan Ibu) meningkat 1 kejadian dan variabel prediktor lain bernilai konstan, maka akan terjadi kenaikan sebesar \(0.8934\) pada pemberian ASI eksklusif.
> Rsq <- 1-(31.772/52.925)
> Rsq
[1] 0.3996788

Dari nilai R square diatas, dapat disimpulka bahwa variabel Status Pekerjaan \((X_1)\) dan variabel Pengetahuan Ibu \((X2)\) dapat menjelaskan 39.97% potensi terjadinya kejadian Pemberian ASI Eksklusif. Sedangkan 60.03% dijelaskan oleh variabel lain yang tidak dicantumkan pada model ini.

3.5 Uji Signifikansi Parameter

3.5.1 Uji Simultan

> pR2(reglog)
fitting null model for pseudo-r2
        llh     llhNull          G2    McFadden        r2ML        r2CU 
-15.8858260 -26.4625295  21.1534071   0.3996860   0.4107090   0.5597789 
> qchisq(0.95,1)
[1] 3.841459

Pada hasil perhitungan uji simultan, didapatkan nilai \(G^2\) sebesar \(21.1534071\) dengan nilai chi-square tabel sebesar \(3.841459\). Berdasarkan hal tersebut dapat diartikan bahwa nilai \(G^2\) lebih besar dibandingkan dengan nilai chi-square, sehingga dapat diputuskan \(H_0\) ditolak.

Dengan demikian dapat disimpulkan bahwa terdapat pengaruh secara signifikan antara variabel independen terhadap pemberian ASI eksklusif.

3.5.2 Uji Parsial

> uji_parsial <- summary(reglog)
> uji_parsial

Call:
glm(formula = Y ~ X1 + X2, family = "binomial", data = df)

Coefficients:
            Estimate Std. Error z value Pr(>|z|)  
(Intercept)  -1.0769     1.6931  -0.636   0.5247  
X1           -2.0904     0.9887  -2.114   0.0345 *
X2            0.8934     0.4307   2.074   0.0380 *
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 52.925  on 39  degrees of freedom
Residual deviance: 31.772  on 37  degrees of freedom
AIC: 37.772

Number of Fisher Scoring iterations: 5
  • Status Pekerjaan \((X_1)\)

Keputusan : Karena nilai \(p-value (0.0345) < α(0.05)\) , maka tolak \(H_0.\)

Kesimpulan : Dengan tingkat kepercayaan \(95%,\) maka dapat disimpulkan bahwa tidak terdapat cukup bukti variabel \(X_1\) (Status Pekerjaan) berpengaruh secara signifikan terhadap pemberian ASI eksklusif.

  • Pengetahuan Ibu \((X_2)\)

Keputusan : Karena nilai \(p-value (0.0380) < α(0.05)\) , maka tolak \(H_0.\)

Kesimpulan : Dengan tingkat kepercayaan \(95%,\) maka dapat disimpulkan bahwa tidak terdapat cukup bukti variabel \(X_2\) (Pengetahuan Ibu) berpengaruh secara signifikan terhadap pemberian ASI eksklusif.

3.6 Odds Ratio

> # Menghitung Odds Ratio
> beta <- (coef(reglog))
> beta
(Intercept)          X1          X2 
 -1.0769190  -2.0903986   0.8933595 
> OddsRatio_beta <- exp(beta)
> OddsRatio_beta
(Intercept)          X1          X2 
  0.3406434   0.1236378   2.4433242 
> cbind(beta, OddsRatio_beta)
                  beta OddsRatio_beta
(Intercept) -1.0769190      0.3406434
X1          -2.0903986      0.1236378
X2           0.8933595      2.4433242

Interpretasi :

Status Pekerjaan \((X_1)\) Apabila ibu bekerja bertambah 1 kejadian, maka kecenderungan terhadap pemberian ASI eksklusif meningkat sebesar 0.1236378 kali lipat.

Pengetahuan Ibu \((X_2)\) Apabila pengetahuan ibu bertambah 1 kejadian, maka kecenderungan terhadap pemberian ASI eksklusif meningkat sebesar 2.4433242 kali lipat.

3.7 Uji Kesesuaian Model

> # Uji Kesesuaian Model
> model_sesuai <- hoslem.test(df$Y,fitted(reglog))
> model_sesuai

    Hosmer and Lemeshow goodness of fit (GOF) test

data:  df$Y, fitted(reglog)
X-squared = 3.8264, df = 8, p-value = 0.8724

Berdasarkan hasil perhitungan dari uji kesesuain model diatas, diperoleh nilai \(p-value (0.8724) > α(0.05)\) maka keputusan yang dapat diambil yaitu Terima \(H_0.\) Dengan demikian dapat disimpulkan bahwa model yang telah terbentuk sesuai untuk digunakan.

3.8 Uji Ketepatan Klasifikasi

> # Membuat Tabel Klasisifikasi
> cross_table <- table(df$Y,fitted(reglog)>0.5)
> cross_table
   
    FALSE TRUE
  0    12    3
  1     2   23
> Akurasi <- ((23+3)/40)*100
> print(paste(Akurasi,"%"))
[1] "65 %"

Berdasarkan pembentukan tabel ketetapan klasifikasi yang merupakan tabel frekuensi dua arah antara variabel respon dan prediktor, maka diperoleh tingkat akurasi model sebesar 65%.

4 KESIMPULAN

Berdasarkan hasil pengujian terhadap data Pemberian ASI Eksklusif dengan menerapkan analisis regresi logistik biner, maka didapatkan kesimpulan sebagai berikut :

  1. Model dari metode regresi logistik biner pada data Pemberian ASI Eksklusif yaitu: \(g(x)=ln(π(x)/1−π(x))= -1.0769 - 2.0904X_1 + 0.8934X_2\)

  2. Berdasarkan data pemberian ASI eksklusif tidak terdapat cukup bukti untuk membuktikan bahwa variabel \(X_1\) (Status Pekerjaan) dan variabel \(X_2\) berpengaruh signifikan terhdap pemberian ASI eksklusif. Maka dari itu kedua faktor dianggap tidak mempengaruhi variabel respon (pemberian ASI eksklusif).

5 DAFTAR PUSTAKA

Hosmer, D.W., dan S. Lemeshow. 2000. Applied Logistic Regression. Edisi ke-2. John Wiley and Sons,Inc.Canada.

Walpole, R. 1997. Pengantar Metode Statistik Edisi Ke-3. Jakarta: PT Gramedia Pustaka Utama.

Hosmer, D.W., S. Lemeshow dan R. X. Sturdivant. 2013. Applied Logistic Regression. Edisi ke-3. John Wiley and Sons,Inc.Canada.