1 PENDAHULUAN
1.1 Latar Belakang
Air Susu Ibu (ASI) merupakan frasa yang sering kita dengar ataupun baca. tentulah sebagai seorang ibu, ingin memberikan hak anak-anaknya, termasuk memberikan ASI sampai usia 2 tahun. Namun, pada kenyataannya tidak semua ibu berhasil melakukannya (Derni & Orin, 2007).
Faktor yang dapat mempengaruhi pemberian ASI eksklusif adalah pengetahuan dan status pekerjaan. Para ibu beralih ke susu formula karena terhentinya pemberian ASI eksklusif terjadi pada ibu bekerja, terutama di perkotaan. Cheatterji dan Frick (2005) menyatakan bahwa kembali bekerja dalam tiga bulan pertama setelah melahirkan sangat berhubungan dengan penurunan untuk memulai menyusui sebesar 16%-18%, dan pengurangan durasi menyusui sekitar 4-5 minggu. Pada percobaan ini akan diamati untuk mengetahui ada atau tidaknya pengaruh antara pengetahuan ibu dan status pekerjaan sebagai variabel prediktor \((X)\) terhadap pemberian ASI eksklusif sebagai variabel dependen \((Y)\).
1.2 Rumusan Masalah
- Bagaimana model dari metode regresi logistik biner dari data Pemberian ASI Eksklusif?
- Apa saja faktor-faktor yang berpengaruh secara signifikan terhadap Pemberian ASI Eksklusif?
- Bagaimana kesimpulan yang dapat diambil dari kasus Pemberian ASI Eksklusif?
1.3 Tujuan Penelitian
- Memberikan informasi mengenai model dari metode regresi logistic biner dari data Pemberian ASI Eksklusif.
- Memberikan informasi mengenai factor-faktor yang berpengaruh secara signifikan terhadap Pemberian ASI Eksklusif.
- Memberikan informasi mengenai kesimpulan yang dapat diambil dari kasus Pemberian ASI Eksklusif.
1.4 Data Penelitian
Data berasal dari Repositori Universitas Dian Nuswantoro yaitu berupa data Pengetahuan Ibu dan Status Pekerjaan yang diasumsikan mengikuti regresi logistik biner beserta faktor yang diduga berpengaruh terhadap Pemberian ASI Eksklusif.
Keterangan:
\(Y\) = Pemberian ASI Eksklusif (jika diberikan ASI Eksklusif = “1”, tidak diberikan ASI Eksklusif = “0”)
\(X_1\) = Status Pekerjaan (jika bekerja = “1”, tidak bekerja = “0”)
\(X_2\) = Pengetahuan Ibu (jika tidak memiliki pengetahuan = “1”, kurang memiliki pengetahuan =“2”, cukup memiliki pengetahuan = “3”, memiliki pengetahuan yang baik = “4”, memiliki pengetahuan sangat baik = “5”)
2 TINJAUAN PUSTAKA
2.1 Asumsi Multikolinearitas
Asumsi multikolinieritas adalah asumsi dalam analisis regresi yang menyatakan bahwa tidak ada hubungan linier sempurna antara variabel independen yang digunakan dalam model regresi. Multikolinieritas terjadi ketika dua atau lebih variabel independen dalam model regresi memiliki hubungan linier yang kuat antara satu sama lain. Metode yang digunakan untuk menguji ada atau tidak adanya multikoliniearitas adalah dengan melihat nilai tolerance value atau variance inflation factor (VIF).
Batas tolerance value adalah 0.10 atau nilai VIF adalah 10. Jika VIF lebih dari 10 dan nilai tolerance kurang dari 0.1, maka terjadi multikoliniearitas yang tinggi antar variabel bebas dengan variabel bebas lainnya. Namun apabila VIF kurang dari 10 dan nilai tolerance lebih dari 0.10, maka dapat diartikan tidak terdapat multikolinieritas. Regresi yang baik memiliki VIF sekitar angka 1 dan mempunyai nilai tolerance mendekati 1. Berikut rumus VIF dan Tolerance :
\(VIF = \frac{1}{Tolerance}\)
\(Tolerance = \frac{1}{(1-R^2)}\)
2.2 Analisis Regresi
Analisis regresi sederhana bertujuan untuk mengetahui pengaruh dari suatu variabel terhadap variabel lainnya. Pada analisis regresi suatu variabel yang mempengaruhi disebut variabel bebas atau independent variable, sedangkan variabel yang dipengaruhi disebut variabel terkait atau dependent variable. Jika persamaan regresi hanya terdapat satu variabel bebas dengan satu variabel terkait, maka disebut dengan persamaan regresi sederhana. Jika variabel bebasnya lebih dari satu, maka disebut dengan persamaan regresi berganda. Pada regresi sederhana kita dapat mengetahui berapa besar perubahan dari variabel bebas dapat mempengaruhi suatu variabel terkait.Pada analisis regresi sederhana, hubungan antara \(x\) dan \(y\) dijelaskan oleh persamaan regresi :
\(Y = \beta _0 + \beta _1 X + \varepsilon\)
di mana \(y\) adalah variabel dependen, \(x\) adalah variabel independen, \(\alpha\) adalah intercept (nilai \(y\) ketika \(x=0\)), \(\beta_0\) adalah konstanta, \(\beta_1\) adalah koefisien regresi, dan \(\varepsilon\) adalah galat.
2.3 Regresi Logistik Biner
Regresi logistik adalah bagian dari analisis regresi yang digunakan untuk menganalisis variabel dependen yang bersifat kategori dan variabel independen bersifat kategori, kontinu, atau gabungan dari keduanya. Model regresi logistik biner digunakan untuk menganalisa hubungan antara satu variabel respon (variabel tak bebas) dan beberapa variabel bebas, dengan variabel responnya berupa data kualitatif dikotomi yaitu bernilai 1 untuk menyatakan keberadaan sebuah karakteristik dan bernilai 0 untuk menyatakan ketidakberadaaan sebuah karakteristik (Agresti , 2007). Model regresi logistik tersebut adalah :
Untuk mengetahui pengaruh variabel bebas, maka dilakukan uji signifikansi parameter baik secara keseluruhan maupun secara individu. Statistik uji yang digunakan dalam uji keseluruhan adalah uji G atau likelihood ratio test. Sedangkan statistik uji yang digunakan dalam uji parsial adalah statistik uji Wald (Hosmer & Lemeshow, 2000).
2.4 Uji Simultan
Uji simultan adalah metode statistik yang digunakan untuk menguji secara bersama-sama apakah semua koefisien regresi dalam suatu model regresi linier signifikan secara keseluruhan. Uji ini memberikan informasi tentang apakah setidaknya satu variabel independen memiliki pengaruh yang signifikan terhadap variabel dependen dalam model regresi.
Hipotesis
\(H0 : 𝛽_1= 𝛽_2=…= 𝛽_𝑝= 0\) (Tidak ada pengaruh antara variabel independen terhadap variabel dependen).
\(H1:\) Minimal terdapat satu \(𝛽_𝑗 ≠ 0.\) Dengan \(j = 1,2, … p\) (Ada pengaruh antara variabel independen terhadap variabel dependen).
Statistik Uji G
\(G = -2log(L0/Lp)\)
\(p :\) banyaknya variabel prediktor dalam model
\(L0 :\) nilai likelihood tanpa variabel prediktor
\(Lp :\) nilai likelihood dengan variabel prediktor
Keputusan
Tolak \(H_0\) apabila nilai statistik uji \(G > χ2(α,v)\), dengan taraf nyata sebesar \(α\) dan \(v\) adalah banyaknya variabel prediktor atau p-value statistik uji \(G < α(0,05)\).
2.5 Uji Parsial
Uji parsial, juga dikenal sebagai uji koefisien parsial atau uji t, adalah metode statistik yang digunakan untuk menguji secara individual apakah setiap koefisien regresi dalam model regresi linier signifikan. Uji ini memungkinkan kita untuk mengevaluasi pengaruh yang dimiliki oleh masing-masing variabel independen terhadap variabel dependen dalam model regresi. Tujuan dari uji parsial adalah untuk menentukan apakah koefisien regresi untuk setiap variabel independen secara individual memiliki pengaruh yang signifikan terhadap variabel dependen.
Hipotesis
\(𝐻_0: 𝛽_𝑗= 0.\) Dengan \(j = 1,2, … p\) (Tidak ada pengaruh antara masing-masing variabel independen terhadap variabel dependen).
\(𝐻_1: 𝛽𝑗 ≠ 0.\) Dengan \(j = 1,2, … p\) (Ada pengaruh antara masing-masing variabel independen terhadap variabel dependen).
Statistik Uji Wald
Keputusan
Tolak \(|𝑊| > Z(α/2)\) atau \(p-value\) statistik uji wald \(< α(0,05).\)
2.6 Odds Ratio
Odds ratio adalah ukuran perbandingan peluang (odds) terjadinya suatu kejadian atau kondisi antara kelompok yang terpapar dengan faktor risiko tertentu dan kelompok yang tidak terpapar. Odds ratio memberikan gambaran tentang seberapa besar perbedaan peluang kejadian tersebut antara kedua kelompok (Rothman dan Greenland : 1998).
Statistik Uji Odds Ratio
Keputusan
Bila nilai \(ψ = 1\), maka antara kedua variabel tersebut tidak terdapat hubungan.
Bila nilai \(ψ < 1\), maka antara kedua variabel terdapat hubungan negatif terhadap perubahan kategori dari nilai \(x\) dan demikian sebaliknya bila \(ψ >1.\)
2.7 Uji Kesesuaian Model
Uji kesesuaian model adalah prosedur statistik yang digunakan untuk mengevaluasi sejauh mana model regresi logistik cocok dengan data yang diamati. Uji ini menguji hipotesis nol bahwa tidak ada perbedaan yang signifikan antara nilai yang diprediksi oleh model dan nilai yang diobservasi dalam data (Hosmer dan Lemeshow :2000).
Hipotesis
\(H_0 :\) Model sesuai (tidak terdapat perbedaan yang signifikan antara hasil observasi dengan kemungkinan prediksi model)
\(H1:\) Model tidak sesuai (terdapat perbedaan yang signifikan antara hasil observasi dengan kemungkinan prediksi
Keputusan
Terima \(H_0\) jika nilai Sig. \(> 0.05\) maka dapat disimpulkan bahwa model regresi layak.
Tolak \(H_0\) jika nilai Sig. \(< 0.05\) maka dapat disimpulkan bahwa model regresi tidak layak.
2.8 Uji Ketepatan Klasifikasi
Uji ketepatan klasifikasi adalah metode untuk mengevaluasi seberapa akurat model klasifikasi dalam memprediksi kelas atau label yang benar dari data yang diamati. Uji ini membandingkan hasil prediksi model dengan label sebenarnya dalam data untuk menghitung tingkat akurasi atau ketepatan klasifikasi (Hastie, Tibshirani, dan Friedman : 2009).
3 SOURCE CODE, HASIL, DAN PEMBAHASAN
3.1 Library
> library(readxl)
> library(pscl)
> library(ResourceSelection)
3.2 Inisiasi Data
> #Menginput Data
> data <- read_excel("C:/Users/ASUS/OneDrive/Documents/semester 4/komstat/Data Pemberian ASI Eksklusif.xlsx")
> head(data)
# A tibble: 6 × 3
Status_Pekerjaan Pengetahuan Pemberian_ASI<dbl> <dbl> <dbl>
1 1 1 0
2 1 1 0
3 1 2 0
4 1 2 0
5 1 2 0
6 1 2 0
> str(data)
40 × 3] (S3: tbl_df/tbl/data.frame)
tibble [$ Status_Pekerjaan: num [1:40] 1 1 1 1 1 1 1 1 1 1 ...
$ Pengetahuan : num [1:40] 1 1 2 2 2 2 3 5 2 2 ...
$ Pemberian_ASI : num [1:40] 0 0 0 0 0 0 0 1 0 0 ...
> #Menginisiasi Data
> Y <- data$Pemberian_ASI
> X1 <- data$Status_Pekerjaan
> X2 <- data$Pengetahuan
> # Membuat Data Frame
> df <- data.frame(Y,X1,X2)
> df
Y X1 X21 0 1 1
2 0 1 1
3 0 1 2
4 0 1 2
5 0 1 2
6 0 1 2
7 0 1 3
8 1 1 5
9 0 1 2
10 0 1 2
11 0 1 1
12 1 1 4
13 1 1 1
14 0 1 3
15 1 1 4
16 1 0 5
17 1 0 3
18 1 0 4
19 1 0 5
20 1 0 4
21 1 0 4
22 1 0 4
23 1 0 3
24 1 0 4
25 1 0 5
26 1 0 3
27 1 0 4
28 0 0 2
29 1 0 4
30 1 0 4
31 0 1 4
32 1 1 1
33 0 1 3
34 1 1 4
35 1 0 5
36 1 0 3
37 1 0 4
38 1 0 5
39 0 0 4
40 1 0 4
3.3 Asumsi Multikolinearitas
> #Uji Asumsi Multikolinearitas
> reglog_X1 <- lm(X1~X2, data=df)
> VIF_X1 <- 1 / (1 - summary(reglog_X1)$r.squared)
> reglog_X2 <- lm(X2~X1, data=df)
> VIF_X2 <- 1 / (1 - summary(reglog_X2)$r.squared)
> VIF <- data.frame(VIF_X1,VIF_X2)
> VIF
VIF_X1 VIF_X21 1.523175 1.523175
Berdasarkan hasil perhitungan diatas, nilai VIF pada masing masing variabel prediktor menghasilkan nilai kurang dari 10. Dapat disimpulkan bahwa tidak terjadi multikolinieritas antar variabel prediktor \((X)\) atau tidak saling berkorelasi. Sehingga data yang merupakan faktor-faktor yang mempengaruhi Pemberian ASI Eksklusif dapat digunakan.
3.4 Analisis Regresi Logistik Biner
> #Regresi Logistik BIner
> reglog <- glm(Y~X1+X2,family = "binomial", data=df)
> summary(reglog)
:
Callglm(formula = Y ~ X1 + X2, family = "binomial", data = df)
:
CoefficientsPr(>|z|)
Estimate Std. Error z value -1.0769 1.6931 -0.636 0.5247
(Intercept) -2.0904 0.9887 -2.114 0.0345 *
X1 0.8934 0.4307 2.074 0.0380 *
X2 ---
: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Signif. codes
for binomial family taken to be 1)
(Dispersion parameter
: 52.925 on 39 degrees of freedom
Null deviance: 31.772 on 37 degrees of freedom
Residual deviance: 37.772
AIC
: 5 Number of Fisher Scoring iterations
Pembentukan model regresi logistik dilakukan dengan menggunakan perintah glm(), sedangkan perintah summary() Untuk memunculkan ringkasan dari model yang telah dibentuk. Diperoleh model regresi logistik berdasarkan data Pemberian ASI EKsklusif sebagai berikut:
\(g(x) = -1.0769 - 2.0904X_1 + 0.8934X_2\)
Interpretasi :
- \(-2.0904\) berarti bahwa ketika nilai variabel \(X_1\)(Status Pekerjaan) meningkat 1 kejadian dan variabel prediktor lain bernilai konstan, maka akan terjadi penurunan sebesar \(0.27748\) pada pemberian ASI eksklusif.
- \(0.8934\) berarti bahwa ketika nilai variabel \(X_2\)(Pengetahuan Ibu) meningkat 1 kejadian dan variabel prediktor lain bernilai konstan, maka akan terjadi kenaikan sebesar \(0.8934\) pada pemberian ASI eksklusif.
> Rsq <- 1-(31.772/52.925)
> Rsq
1] 0.3996788 [
Dari nilai R square diatas, dapat disimpulka bahwa variabel Status Pekerjaan \((X_1)\) dan variabel Pengetahuan Ibu \((X2)\) dapat menjelaskan 39.97% potensi terjadinya kejadian Pemberian ASI Eksklusif. Sedangkan 60.03% dijelaskan oleh variabel lain yang tidak dicantumkan pada model ini.
3.5 Uji Signifikansi Parameter
3.5.1 Uji Simultan
> pR2(reglog)
for pseudo-r2
fitting null model
llh llhNull G2 McFadden r2ML r2CU -15.8858260 -26.4625295 21.1534071 0.3996860 0.4107090 0.5597789
> qchisq(0.95,1)
1] 3.841459 [
Pada hasil perhitungan uji simultan, didapatkan nilai \(G^2\) sebesar \(21.1534071\) dengan nilai chi-square tabel sebesar \(3.841459\). Berdasarkan hal tersebut dapat diartikan bahwa nilai \(G^2\) lebih besar dibandingkan dengan nilai chi-square, sehingga dapat diputuskan \(H_0\) ditolak.
Dengan demikian dapat disimpulkan bahwa terdapat pengaruh secara signifikan antara variabel independen terhadap pemberian ASI eksklusif.
3.5.2 Uji Parsial
> uji_parsial <- summary(reglog)
> uji_parsial
:
Callglm(formula = Y ~ X1 + X2, family = "binomial", data = df)
:
CoefficientsPr(>|z|)
Estimate Std. Error z value -1.0769 1.6931 -0.636 0.5247
(Intercept) -2.0904 0.9887 -2.114 0.0345 *
X1 0.8934 0.4307 2.074 0.0380 *
X2 ---
: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Signif. codes
for binomial family taken to be 1)
(Dispersion parameter
: 52.925 on 39 degrees of freedom
Null deviance: 31.772 on 37 degrees of freedom
Residual deviance: 37.772
AIC
: 5 Number of Fisher Scoring iterations
- Status Pekerjaan \((X_1)\)
Keputusan : Karena nilai \(p-value (0.0345) < α(0.05)\) , maka tolak \(H_0.\)
Kesimpulan : Dengan tingkat kepercayaan \(95%,\) maka dapat disimpulkan bahwa tidak terdapat cukup bukti variabel \(X_1\) (Status Pekerjaan) berpengaruh secara signifikan terhadap pemberian ASI eksklusif.
- Pengetahuan Ibu \((X_2)\)
Keputusan : Karena nilai \(p-value (0.0380) < α(0.05)\) , maka tolak \(H_0.\)
Kesimpulan : Dengan tingkat kepercayaan \(95%,\) maka dapat disimpulkan bahwa tidak terdapat cukup bukti variabel \(X_2\) (Pengetahuan Ibu) berpengaruh secara signifikan terhadap pemberian ASI eksklusif.
3.6 Odds Ratio
> # Menghitung Odds Ratio
> beta <- (coef(reglog))
> beta
(Intercept) X1 X2 -1.0769190 -2.0903986 0.8933595
> OddsRatio_beta <- exp(beta)
> OddsRatio_beta
(Intercept) X1 X2 0.3406434 0.1236378 2.4433242
> cbind(beta, OddsRatio_beta)
beta OddsRatio_beta-1.0769190 0.3406434
(Intercept) -2.0903986 0.1236378
X1 0.8933595 2.4433242 X2
Interpretasi :
Status Pekerjaan \((X_1)\) Apabila ibu bekerja bertambah 1 kejadian, maka kecenderungan terhadap pemberian ASI eksklusif meningkat sebesar 0.1236378 kali lipat.
Pengetahuan Ibu \((X_2)\) Apabila pengetahuan ibu bertambah 1 kejadian, maka kecenderungan terhadap pemberian ASI eksklusif meningkat sebesar 2.4433242 kali lipat.
3.7 Uji Kesesuaian Model
> # Uji Kesesuaian Model
> model_sesuai <- hoslem.test(df$Y,fitted(reglog))
> model_sesuai
fit (GOF) test
Hosmer and Lemeshow goodness of
: df$Y, fitted(reglog)
data-squared = 3.8264, df = 8, p-value = 0.8724 X
Berdasarkan hasil perhitungan dari uji kesesuain model diatas, diperoleh nilai \(p-value (0.8724) > α(0.05)\) maka keputusan yang dapat diambil yaitu Terima \(H_0.\) Dengan demikian dapat disimpulkan bahwa model yang telah terbentuk sesuai untuk digunakan.
3.8 Uji Ketepatan Klasifikasi
> # Membuat Tabel Klasisifikasi
> cross_table <- table(df$Y,fitted(reglog)>0.5)
> cross_table
FALSE TRUE
0 12 3
1 2 23
> Akurasi <- ((23+3)/40)*100
> print(paste(Akurasi,"%"))
1] "65 %" [
Berdasarkan pembentukan tabel ketetapan klasifikasi yang merupakan tabel frekuensi dua arah antara variabel respon dan prediktor, maka diperoleh tingkat akurasi model sebesar 65%.
4 KESIMPULAN
Berdasarkan hasil pengujian terhadap data Pemberian ASI Eksklusif dengan menerapkan analisis regresi logistik biner, maka didapatkan kesimpulan sebagai berikut :
Model dari metode regresi logistik biner pada data Pemberian ASI Eksklusif yaitu: \(g(x)=ln(π(x)/1−π(x))= -1.0769 - 2.0904X_1 + 0.8934X_2\)
Berdasarkan data pemberian ASI eksklusif tidak terdapat cukup bukti untuk membuktikan bahwa variabel \(X_1\) (Status Pekerjaan) dan variabel \(X_2\) berpengaruh signifikan terhdap pemberian ASI eksklusif. Maka dari itu kedua faktor dianggap tidak mempengaruhi variabel respon (pemberian ASI eksklusif).
5 DAFTAR PUSTAKA
Hosmer, D.W., dan S. Lemeshow. 2000. Applied Logistic Regression. Edisi ke-2. John Wiley and Sons,Inc.Canada.
Walpole, R. 1997. Pengantar Metode Statistik Edisi Ke-3. Jakarta: PT Gramedia Pustaka Utama.
Hosmer, D.W., S. Lemeshow dan R. X. Sturdivant. 2013. Applied Logistic Regression. Edisi ke-3. John Wiley and Sons,Inc.Canada.