Analisis regresi logistik merupakan suatu pendekatan untuk membuat model prediksi seperti halnya regresi linear atau yang biasa disebut dengan istilah Ordinary Least Squares (OLS) regression. Perbedaannya yaitu pada regresi logistik, peneliti memprediksi variabel terikat yang berskala dikotomi (skala data nominal dengan dua kategori, misalnya : berhasil dan gagal, dll). Tujuan dari Regresi logistik adalah untuk menguji apakah probabilitas terjadinya variabel terikat (dependent) dapat diprediksi dengan variabel bebas (independent).
Pada regresi logistik tidak mensyaratkan adanya normalitas, karena pada regresi logistik mengikuti distribusi logistik. Berikut syarat yang ada dalam regresi logistik yaitu:
Adapun pada Regresi Logistik dapat dikelompokan menjadi 2 macam, yaitu:
Regresi Logistik Biner (Binary Logistic Regression) Regresi Logistik biner digunakan ketika hanya ada 2 kemungkinan variabel terikat (Y), contoh misalkan untung dan rugi.
Regresi Logistik Multinomial (Multinomial Logistic Regression) Regresi Logistik Multinomial digunakan ketika pada variabel terikat (Y) terdapat lebih dari 2 kategorisasi.
Analisis regresi merupakan salah satu analisis yang bertujuan untuk mengetahui pengaruh suatu variabel terhadap variabel lain. Persamaan regresi dapat terdiri dari satu atau lebih variabel independen dan satu variabel dependen. Persamaan yang terdiri dari satu variabel independen dan satu variabel dependen disebut persamaan regresi sederhana, sedangkan yang terdiri dari beberapa variabel independen dan satu variabel dependen disebut persamaan regresi berganda. Regresi juga dapat dibedakan menjadi regresi linear dan regresi non linear. Biasanya model dari analisis regresi dituliskan sebagai berikut
\(\hat Y=\beta_0+\beta_1X_1+\beta_2X_2+...+\beta_nX_n\)
Keterangan :
\(\hat Y=\) Nilai prediksi
\(X_i=\) Variabel Independen
\(\beta_0=\) Konstanta
\(\beta_1=\) Koefisien regresi
Analisis regresi logistik biner digunakan untuk menganalisis hubungan antara satu variabel dependen dan beberapa variabel independen, dengan variabel dependen berupa data kualitatif dikotomi yaitu bernilai 1 untuk menyatakan keberadaan sebuah karakteristik dan bernilai 0 untuk menyatakan ketidakberadaan sebuah karakteristik, sehingga analisis regresi logistik mengikuti distribusi Bernoulli sebagai berikut :
\(f(y_i)=\pi^{y_i}_i(1-\pi_i)^{1-y_i}\)
Keterangan :
\(y_i=\) Variabel dependen ke - i (dengan nilai 0 atau 1)
\(\pi_i=\) Peluang kejadian ke i
Bentuk model regresi logistik dengan satu variabel prediktor adalah :
\(\pi(X)=\frac{exp(\beta_0+\beta_1X)}{1-exp(\beta_0+\beta_1X)}\)
Untuk mempermudah menaksir parameter regresi, maka 𝜋(x) pada persamaan diatas ditransformasikan sehingga menghasilkan bentuk logit regresi logistik, sebagai berikut :
\(g(X)=ln[\frac{\pi(X)}{1-\pi(X)}]=\beta_0+\beta_1X\)
Link sumber : https://repository.its.ac.id/42156/1/1311030069-%20Non_Degree.pdf
pada gambar di atas menunjukkan bahwa dari total 107 bayi, terdapat 75 bayi (70.1%) yang tidak mendapatkan ASI Ekslusif memiliki BMI yang tidak ideal dan 3 bayi (2.8%) lainnya memiliki BMI ideal. Sedangkan 19 bayi (17.7%) yang mendapatkan ASI Ekslusif memiliki BMI yang ideal dan 10 bayi (9.4%) lainnya memiliki BMI tidak ideal. Uraian tersebut mengindikasikan bahwa pemberian ASI Ekslusif pada 6 bulan pertama kelahiran memberikan pengaruh terhadap BMI bayi.
Analisis tersebut dilakukan karena untuk mencari tahu apakah terdapat hubungan antara variabel independen (Pemberian Asi Ekskludif) dengan variabel dependen (Berat Badan Bayi), dengan begitu kedepannya akan lebih mudah diprediksi.
> #Library
> library(readr)
> library(generalhoslem)
> library(pscl)
> #Memasukan Data
> setwd("C:/Users/zahra/OneDrive/Documents")
> Laprak2 <- read.csv("TugasLaprak2Komstat.csv",header = TRUE, sep = ";")
> Laprak2
Y X
1 1 0
2 1 0
3 1 0
4 1 1
5 1 1
6 1 1
7 1 1
8 1 1
9 1 1
10 1 1
11 1 1
12 1 1
13 1 1
14 1 1
15 1 1
16 1 1
17 1 1
18 1 1
19 1 1
20 1 1
21 1 1
22 1 1
23 0 0
24 0 0
25 0 0
26 0 0
27 0 0
28 0 0
29 0 0
30 0 0
31 0 0
32 0 0
33 0 0
34 0 0
35 0 0
36 0 0
37 0 0
38 0 0
39 0 0
40 0 0
41 0 0
42 0 0
43 0 0
44 0 0
45 0 0
46 0 0
47 0 0
48 0 0
49 0 0
50 0 0
51 0 0
52 0 0
53 0 0
54 0 0
55 0 0
56 0 0
57 0 0
58 0 0
59 0 0
60 0 0
61 0 0
62 0 0
63 0 0
64 0 0
65 0 0
66 0 0
67 0 0
68 0 0
69 0 0
70 0 0
71 0 0
72 0 0
73 0 0
74 0 0
75 0 0
76 0 0
77 0 0
78 0 0
79 0 0
80 0 0
81 0 0
82 0 0
83 0 0
84 0 0
85 0 0
86 0 0
87 0 0
88 0 0
89 0 0
90 0 0
91 0 0
92 0 0
93 0 0
94 0 0
95 0 0
96 0 0
97 0 0
98 0 1
99 0 1
100 0 1
101 0 1
102 0 1
103 0 1
104 0 1
105 0 1
106 0 1
107 0 1
> str(Laprak2)
'data.frame': 107 obs. of 2 variables:
$ Y: int 1 1 1 1 1 1 1 1 1 1 ...
$ X: int 0 0 0 1 1 1 1 1 1 1 ...
> head(Laprak2)
Y X
1 1 0
2 1 0
3 1 0
4 1 1
5 1 1
6 1 1
Keterangan :
Y = Berat Badan Bayi (1 = Ideal, 0 = Tidak Ideal)
X = Pemberian Asi Eksklusif (1 = Iya, 0 = Tidak)
> #Menghitung Regresi Logika
> RegresiLogika <- glm(Y~X, family = binomial(link = 'logit'), data = Laprak2)
> summary(RegresiLogika)
Call:
glm(formula = Y ~ X, family = binomial(link = "logit"), data = Laprak2)
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -3.2189 0.5888 -5.467 4.58e-08 ***
X 3.8607 0.7066 5.464 4.66e-08 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 108.729 on 106 degrees of freedom
Residual deviance: 62.794 on 105 degrees of freedom
AIC: 66.794
Number of Fisher Scoring iterations: 6
>
> #Uji Signifikansi Keseluruhan Model
> pR2(RegresiLogika)
fitting null model for pseudo-r2
llh llhNull G2 McFadden r2ML r2CU
-31.3972306 -54.3643945 45.9343278 0.4224670 0.3490307 0.5470558
> qchisq(0.95, 1)
[1] 3.841459
>
> #R square
> Rsq <- 1-(62.794/108.729)
> Rsq
[1] 0.4224724
>
> #Odds Ratio
> beta <- coef(RegresiLogika)
> beta
(Intercept) X
-3.218876 3.860730
> OR_beta<-exp(beta)
> OR_beta
(Intercept) X
0.04 47.50
> cbind(beta,OR_beta)
beta OR_beta
(Intercept) -3.218876 0.04
X 3.860730 47.50
>
> #Membentuk klasifikasi
> yp_hat <- fitted(RegresiLogika)
> class <- table(Laprak2$Y, yp_hat > 0.5)
> class
FALSE TRUE
0 75 10
1 3 19
>
> #Uji Kelayakan Model
> logitgof(Laprak2$Y, fitted(RegresiLogika))
Hosmer and Lemeshow test (binary model)
data: Laprak2$Y, fitted(RegresiLogika)
X-squared = 2.252e-28, df = -1, p-value = NA
Berdasarkan hasil output RStudio di atas, model logit yang terbentuk sebagai berikut :
\(Logit[\hat\pi(X)]=-3.2189+3.8607X\)
Interpretasi :
Dari model tersebut, diketahui bahwa \(\beta_1\) bernilai positif, sehingga setiap kenaikan 1 kategori pada pemberian asi eksklusif akan meningkatkan peluang naiknya berat badan bayi.
Hipotesis :
\(H_0=\hat\beta_j=0\)
\(H_0=\hat\beta_j\neq0\)
Hasil :
> summary(RegresiLogika)
Call:
glm(formula = Y ~ X, family = binomial(link = "logit"), data = Laprak2)
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -3.2189 0.5888 -5.467 4.58e-08 ***
X 3.8607 0.7066 5.464 4.66e-08 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 108.729 on 106 degrees of freedom
Residual deviance: 62.794 on 105 degrees of freedom
AIC: 66.794
Number of Fisher Scoring iterations: 6
Keputusan :
p-value < α (0.05), maka tolak \(H_0\)
Interpretasi :
Dari Keputusan di atas, maka dapat disimpulkan bahwa pemberian asi eksklusif berpengaruh signifikan terhadap berat badan bayi.
Hasil :
> #R square
> Rsq <- 1-(62.794/108.729)
> Rsq
[1] 0.4224724
Interpretasi :
Dari nilai R square dapat diketahui bahwa variable X dapat menjelaskan 42.25% potensi berat badan bayi.
Hasil :
> cbind(beta,OR_beta)
beta OR_beta
(Intercept) -3.218876 0.04
X 3.860730 47.50
Interpretasi :
Apabila pemberian asi pada bayi naik 1 kategori, maka bayi akan memiliki kecenderungan naik berat badan sebesar 47.5 kali.
Hipotesis :
\(H_0=\beta_1=\beta_2=...=\beta_p=0\)
\(H_1=\) Minimal ada satu \(\beta_j\neq0\)
Hasil :
> pR2(RegresiLogika)
fitting null model for pseudo-r2
llh llhNull G2 McFadden r2ML r2CU
-31.3972306 -54.3643945 45.9343278 0.4224670 0.3490307 0.5470558
> qchisq(0.95, 1)
[1] 3.841459
Keputusan :
\(G^2>\chi^2_{0,05;1}\) (3,841), maka tolak \(H_0\)
Interpretasi :
Berdasarkan keputusan tersebut, dapat disimpulkan bahwa model signifikan atau berpengaruh terhadap berat badan bayi.
Hasil :
> class <- table(Laprak2$Y, yp_hat > 0.5)
> class
FALSE TRUE
0 75 10
1 3 19
Interpretasi :
Dari 85 amatan Y=0 yang dihasilkan, hanya 10 amatan yang terverifikasi sebagai benar
Dari 22 amatan Y=1 yang dihasilkan, hanya 19 amatan yang terverivikasi sebagai benar
Dari hasil perhitungan analisis regresi logistik di atas, dapat disimpulkan bahwa variabel independen (pemberian ASI eksklusif) berpengaruh terhadap variabel dependen (berat badan bayi) yang berarti bahwa seorang ibu harus memberikan ASI eksklusif untuk dapat meningkatkan berat badan bayi.
Adriani Tampil, Y., Komalig, H., Langi, Y., Studi Matematika, P., Matematika dan Ilmu Pengetahuan Alam, F., & Sam Ratulangi Manado, U. (n.d.). Analisis Regresi Logistik Untuk Menentukan Faktor-Faktor Yang Mempengaruhi Indeks Prestasi Kumulatif (IPK) Mahasiswa FMIPA Universitas Sam Ratulangi Manado.
Pengantar Analisis Regresi dan Korelasi. (n.d.).
PERTEMUAN 18 REGRESI LOGISTIK. (n.d.).
Regresi Logistik Biner Faktor-faktor Yang Mempengaruhi Berat Badan Bayi Usia, P., & Pembimbing Ir SRI PINGIT WULANDARI, D. (n.d.). TUGAS AKHIR-SS 145561.