Analisis regresi logistik merupakan analisis yang menjelaskan korelasi antara satu atau lebih variabel bebas terhadap satu variabel terikan yang merupakan variabel dikotomis. Berbeda dengan regresi linier yang memprediksi nilai numerik, regresi logistik memprediksi probabilitas kejadian dari suatu peristiwa. Dengan menggunakan regresi logistik, maka dapat mengidentifikassi dan mengukur pengaruh dari berbagai faktor atau variabel indipenden terhadap probabilitas hasil tertentu
Peranan analisis regresi logistik dalam berbagai bidang cukup luas seperti pada bidang kedokteran, pemasaran dan juga bidang ilmu sosial. Tujuan dari analisis regresi logistik adalah menangani variabel indipenden yang bersifat kontinyu dan kategorikan, serta tidak mengharuskan hubungan linier antara variabel independen dan dependen.
Regresi Logistik
Regresi logistik (logistic regression) merupakah suatu bentuk regresi yang digunakan pada saat variabel tak bebas (dependent variable) bersifat kategorik (berskala nominal atau ordinal). Regresi logistik memungkinkan peneliti untuk memahami bagauimana variabel indipendent mempengaruhi probabilitas hasil tertentu. Berikut persamaan untuk analisis regresi logistik :
\[Y=\beta_{0}+\beta_{1}X_{1}+\beta_{2}X_{2}+...+ \beta_{p}X_{p}\]
Keterangan :
\(Y=\) Variabel Respon (yang dipengaruhi)
\(Xi=\) Variabel Prediktor (yang mempengaruhi)
\(\beta_{0}=\) Intercept
\(\beta_{1}=\) Koefisiensi regresi variabel prediktor
Regresi Logistik Biner
Regresi logistik biner merupakan metode statistik yang digunakan untuk menghubungkan antara satu atau lebih variabel prediktor(independen) dan variabel respon biner(dependen) yang hanya memilki dua kategori, seperti “ya” atau “tidak”, “sukses” atau “gagal”, dan “benar” atau “salah”. Berikut persamaan untuk analisis regresi logistik biner:
\[\pi_{i}(x)= \frac{exp(\beta_{0}+\beta_{1i}X_{1i}+\beta_{2i}X_{2i}+...+ \beta_{p}X_{pi})}{1+ exp(\beta_{0}+\beta_{1i}X_{1i}+\beta_{2i}X_{2i}+...+ \beta_{p}X_{pi})})\]
menjadi \[g(x)=ln (\frac{\pi(x)}{1-\pi(x)})\]
\[g(x)=\beta_{0}+\beta_{1}X_{1}+\beta_{2}X_{2}+...+ \beta_{p}X_{p}\]
Keterangan:
\(P(Y=1)\) = Probabilitas bahwa variabel dependen Y sama dengan 1
\(\beta_{0}=\) Intercept model
\(\beta_{1},\beta_{2},...,\beta_{k}=\) Koefisien regresi untuk variabel prediktor X1 ,…, Xk
Asumsi Linieritas pada Logit
Asumsi pada model regresi logistik penting dikarenakan jika tidak terpenuhi, maka model dapat memberikan hasil yang tidak akurat. Asumsi linieritas dalam model regresi logistik mengacu pada hubungan linier antara variabel indipenden dan logit dari probabilitas kejadian.
Uji Kelayakan Model
Uji ini dinilai dengan menggunakan Hosmer dan Lemeshow’s yang diukur dengan nilai chi-square. Model ini menguji dengan hipotesis \(H_{0}\) = Model layak versus \(H_{1}\)= Model tidak layak. Pengambilan keputusan terkait uji kelayakan model adalah jika nilai probabilitis (p-value) 0,05 ≤ (nilai signifikasi), maka tolak \(H_{0}\) artinya terdapat perbedaan signifikasi antara model dengan nilai observasinya, sehingga Goodness of Fit Test tidak bisa mempredrediksi nilai observasinya. Jika nilai probabilitas (p-value) \(≥\) 0,05 (nilai signifikasi), maka terima \(H_{0}\) artinya model sesuai dengan nilai observasinya, sehingga Goodness of Fit Test bisa mempredrediksi nilai observasinya.
Uji Signifikasi Keseluruhan Model
Uji signifikasi model adalah teknik untuk menguji apakah model regresi yang dibuat menunjukkan efek signifikan secara statistika pada variabel dependen. Uji ini juga dapat menguji apakah model regresi memenuhi persyaratan asumsi untuk analisis regresi.
Uji Parsial Parameter Model
Pengujian parsial ini dilakukan dengan menguji setiap \(\beta_j\) secara parsial. Hasil dari pengujian ini akan menunjukkan apakah suatu variabel bebas layak unruk masuk dalam model atau tidak. Uji parsial ini menguji dengan hipotesis \(H_{0}= \beta_j\) (tidak terdapat pengaruh variabel bebas ke-j terhadap variabel terikat) versus \(H_{1}=\beta_j≠0\) (terdapat pengaruh variabel bebas ke-j terhadap variabel terikat).
Pengambilan keputusan terkait uji kelayakan model adalah jika nilai probabilitis (p-value) ≤ 0,05(nilai signifikasi), maka tolak \(H_{0}\). Jika nilai probabilitas (p-value) ≥ 0,05 (nilai signifikasi), maka terima \(H_{0}\).
Koefisien Determinasi (R-Squared)
Koefisien Determinasi pada regresi logistik dilihat dari Nagelkerke R Square. Nagelkerke R-Square merupakan modisikasi cox dan snell untuk memastikan bahwa nilai akan bervariasi dari 0 sampai 1.
Pengambilan keputusan koefisiensi determinasi adalah jika R-Squared mendekati 0 maka kemampuan variabel-variabel dalam menjelaskan variabel dependen sangat terbatas, sedangkan R-Squared mendekati 1 maka variabel independen mampu memberikan semua informasi yang dibutuhkan untuk memprediksi variabilitas variabel dependen.
Odds Ratio
Odds Ratio (OR) merupakah ukuran kekuatan asosiasi antara dua kejadian. Odds ratio di dalam regresi logistik menunjukkan seberapa besar kemungkinan terjadinya peristiwa (kejadian) untuk setiap unit perubahan dalam variabel indipenden.
Klasifikasi
Klasifikasi merupakan suatu teknik yang digunakan untuk memprediksi kelas dari suatu objek berdasarkan variabel yang ada. Klasifikasi ini menunjukkan kekuatan prediksi dari model regresi logistik untuk mempredeksi kemungkinan terjadinya kejadian.
Sumber Data: https://images.app.goo.gl/Vtik9AVsYbZqjgPi8
Tujuan dari analisis ini untuk mengidentifikasi faktor yang signifikan mempengaruhi hasil biner. Selain itu, analisis ini juga bertujuan untuk mengembangkan model prediktif yang dapat digunakan memperkirakan probabilitas kejadian suatu peristiwa di masa depan. Diharapkan hasil analisis ini dapat memberikan wawasan yang berharga bagi pengambil keputusan untuk merumuskan strategi yang lebih efektif.
Berikut merupakan library yang digunakan untuk analisis regresi logistik:
> #Library
> library(knitr)
> library(rmarkdown)
> library(tinytex)
> library(prettydoc)
> library(generalhoslem)
> library(pscl)
knitr digunakan untuk mengubah dokumen
yang berisi format lain seperti HTML, PDF, atau Word.rmarkdown digunakan untuk membuat dan
merender dokumen dari R Markdown (.Rmd) menjadi beberapa format seperti
HTML, PDF, atau Word.tinytex digunakan untuk mengelola
instalasi LaTeX dan membuat proses render dokumen R Markdown ke format
PDF.prettydoc digunakan untuk membuat
dokumen HTML dari R Markdown dengan tampilan yang lebih menarik dan
profesional.generalhoslem digunakan untuk
melakukan uji kelayakan model Library
generalhoslem memanggil function
logistgofpscl digunakan untuk menilai kekuatan
prediksi dari model regresi logistik Library pscl
memanggil function pR2> #Import Data
> Y <- c(0,0,1,1,1,1,1,1,1,1,1,1,
+ 0,1,0,1,0,1,1,1,1,0,1,0,
+ 0,1,0,1,0,1,1,0,1,0,0)
> Y
[1] 0 0 1 1 1 1 1 1 1 1 1 1 0 1 0 1 0 1 1 1 1 0 1 0 0 1 0 1 0 1 1 0 1 0 0
>
> X <- c(45,15,40,83,90,25,35,65,
+ 95,35,75,45,50,75,30,25,
+ 20,60,70,30,60,61,65,15,
+ 20,45,15,25,15,20,40,15,
+ 135,20,40)
> X
[1] 45 15 40 83 90 25 35 65 95 35 75 45 50 75 30 25 20 60 70
[20] 30 60 61 65 15 20 45 15 25 15 20 40 15 135 20 40
> #Membuat data frame
> data <- data.frame (Y,X)
> data
Y X
1 0 45
2 0 15
3 1 40
4 1 83
5 1 90
6 1 25
7 1 35
8 1 65
9 1 95
10 1 35
11 1 75
12 1 45
13 0 50
14 1 75
15 0 30
16 1 25
17 0 20
18 1 60
19 1 70
20 1 30
21 1 60
22 0 61
23 1 65
24 0 15
25 0 20
26 1 45
27 0 15
28 1 25
29 0 15
30 1 20
31 1 40
32 0 15
33 1 135
34 0 20
35 0 40
>
> str(data)
'data.frame': 35 obs. of 2 variables:
$ Y: num 0 0 1 1 1 1 1 1 1 1 ...
$ X: num 45 15 40 83 90 25 35 65 95 35 ...
> head(data)
Y X
1 0 45
2 0 15
3 1 40
4 1 83
5 1 90
6 1 25
data.frame digunakan untuk membuat
data frame. Argument yang diisikan dalam
function adalah Y dan Y. Argument ini digunakan untuk
memanggil data yang akan di input pada data
frame.str digunakan untuk membuat data
frame. Argument yang diisikan dalam function
adalah Y dan Y. Argument ini digunakan untuk memanggil data
yang akan di input pada data frame.head digunakan untuk membuat data
frame. Argument yang diisikan dalam function
adalah Y dan Y. Argument ini digunakan untuk memanggil data
yang akan di input pada data frame.> #Analisis Regresi Logistik
> regresi_logistik <- glm(Y~X, family=binomial, data=data)
> summary(regresi_logistik)
Call:
glm(formula = Y ~ X, family = binomial, data = data)
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -2.01671 0.94613 -2.132 0.03305 *
X 0.06541 0.02511 2.605 0.00918 **
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 46.180 on 34 degrees of freedom
Residual deviance: 34.468 on 33 degrees of freedom
AIC: 38.468
Number of Fisher Scoring iterations: 5
Function glm digunakan untuk melakukan regresi linear
umum pada data. - Argument yang diisikan dalam
function glm adalah Y~X .
Argument ini digunakan untuk menentukan bahwa variabel dependen
adalah ‘Y’ dan variabel indipenden adalah ‘X’ - Argument yang
diisikan dalam function glm adalah
family=binomial Argument ini digunakan untuk
menentukan model regresi logistik yaitu binomial. - Argument
yang diisikan dalam function glm adalah
data=data Argument ini digunakan untuk menentukan
data yang akan digunakan berasal dari mana. Function
summary digunakan untuk menampilkan ringkasan model
regresi. Argument yang diisikan dalam function
digunakan untuk menampilkan nilai yang ingin dimunculkan.
> #Asumsi Linieritas pada Logit
> long_x <- log(X)
> long_x
[1] 3.806662 2.708050 3.688879 4.418841 4.499810 3.218876 3.555348 4.174387
[9] 4.553877 3.555348 4.317488 3.806662 3.912023 4.317488 3.401197 3.218876
[17] 2.995732 4.094345 4.248495 3.401197 4.094345 4.110874 4.174387 2.708050
[25] 2.995732 3.806662 2.708050 3.218876 2.708050 2.995732 3.688879 2.708050
[33] 4.905275 2.995732 3.688879
> interaction <- long_x*X
> model<- glm(Y~X + interaction, family = binomial, data=data)
> summary(model)
Call:
glm(formula = Y ~ X + interaction, family = binomial, data = data)
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -4.11235 2.78589 -1.476 0.140
X 0.33502 0.32049 1.045 0.296
interaction -0.05706 0.06632 -0.860 0.390
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 46.180 on 34 degrees of freedom
Residual deviance: 33.913 on 32 degrees of freedom
AIC: 39.913
Number of Fisher Scoring iterations: 5
long_x <- log(X) merupakan hasil dari
menghitung logaritma natural dari variabel Xinteraction <- X*long_x merupakan hasil
dari menghitung hasil perrkalian antara variabel X dan
logaritmanya.> #Uji Kelayakan Model
> logitgof(Y,fitted(regresi_logistik))
Hosmer and Lemeshow test (binary model)
data: Y, fitted(regresi_logistik)
X-squared = 9.1722, df = 7, p-value = 0.2405
logitgof digunakan untuk mengubah
long-odds ke oods. Argument yang diisikan
dalam function adalah (regresi_logistik) digunakan
untuk mengevaluasi apakah model regresi logistik yang dihasilkan
memiliki kesesuaian yang baik dengan data.> #Uji Signifikansi Keseluruhan Model
> pR2(regresi_logistik)
fitting null model for pseudo-r2
llh llhNull G2 McFadden r2ML r2CU
-17.2339498 -23.0899065 11.7119135 0.2536154 0.2843944 0.3881402
> qchisq(0.95,34)
[1] 48.60237
pR2 digunakan untuk menguji
signifikasi dari keseluruhan model regresi logistik. Argument
yang diisikan dalam function adalah
(regresi_logistik) digunakan untuk menampilkan data yang
akan digunakan pada function ini.qchisq digunakan untuk menampilkan
chi-square tabel. Argument yang diisikan dalam
function adalah 0,95 dan 34 digunakan
untuk menyebutkan taraf signifikan dan df yang akan digunakan.> #Uji Parsial Parameter Model
> summary(regresi_logistik)
Call:
glm(formula = Y ~ X, family = binomial, data = data)
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -2.01671 0.94613 -2.132 0.03305 *
X 0.06541 0.02511 2.605 0.00918 **
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 46.180 on 34 degrees of freedom
Residual deviance: 34.468 on 33 degrees of freedom
AIC: 38.468
Number of Fisher Scoring iterations: 5
> #R-Square
> summary(regresi_logistik)
Call:
glm(formula = Y ~ X, family = binomial, data = data)
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -2.01671 0.94613 -2.132 0.03305 *
X 0.06541 0.02511 2.605 0.00918 **
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 46.180 on 34 degrees of freedom
Residual deviance: 34.468 on 33 degrees of freedom
AIC: 38.468
Number of Fisher Scoring iterations: 5
> R2 <- 1 -(34.468/46.180)
> R2
[1] 0.2536163
Argument R2 <- 1 -(34.468/46.180) digunakan
untuk menghitung nilai R-Squared. Dimana R-Squared diperoleh
dari 1 - (Residual Deviace/Null Deviace). Nilai
Residual dan Null deviace diperoleh dari
function summary(regresi_logistik).
> #Odds Ratio
> beta <-(coef(regresi_logistik))
> beta
(Intercept) X
-2.01670655 0.06540861
>
> OR_beta <-exp(beta)
> OR_beta
(Intercept) X
0.1330931 1.0675952
>
> sk_OR_beta <- exp(confint(regresi_logistik))
> sk_OR_beta
2.5 % 97.5 %
(Intercept) 0.01641163 0.7298772
X 1.02397186 1.1323864
>
> cbind(beta,OR_beta)
beta OR_beta
(Intercept) -2.01670655 0.1330931
X 0.06540861 1.0675952
coef digunakan untuk mengambil
estimasi parameter(koefiensi) dari model regresi logistik.
Argument yang diisikan dalam function adalah
(regresi_logistik) digunakan untuk menampilkan data yang
akan digunakan pada function ini.exp digunakan untuk mengubah
long-odds ke oods. Argument yang diisikan
dalam function adalah (regresi_logistik) digunakan
untuk menampilkan data yang akan digunakan pada function
ini.exp digunakan untuk mengubah
long-odds ke oods. Function
confint digunakan untuk menghitung interval kepercayaan
untuk koefisien. Argument yang diisikan dalam function
adalah (regresi_logistik) digunakan untuk menampilkan data
yang akan digunakan pada function ini.cbind digunakan untuk menggabungkan
hasil ke dalam satu tabel. Argument yang diisikan dalam
function adalah beta, odds ratio dan selang
kepercayaan.> #Membentuk klasifikasi
> yp_hat <- fitted(regresi_logistik)
> kelas <- table(Y,yp_hat >0.5)
> kelas
Y FALSE TRUE
0 9 4
1 5 17
fitted digunakan untuk mendapatkan
nilai yang diperediksi dari model regresi logistik. Argument
yang diisikan dalam function adalah
(regresi_logistik) digunakan untuk menampilkan data yang
akan digunakan pada function ini.table digunakan untuk mengubah
long-odds ke oods. Argument yang diisikan
dalam function digunakan untuk membandingkan nilai aktual
Y dengan nilai prediksi dari yp_hat.> summary(regresi_logistik)
Call:
glm(formula = Y ~ X, family = binomial, data = data)
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -2.01671 0.94613 -2.132 0.03305 *
X 0.06541 0.02511 2.605 0.00918 **
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 46.180 on 34 degrees of freedom
Residual deviance: 34.468 on 33 degrees of freedom
AIC: 38.468
Number of Fisher Scoring iterations: 5
Berdasarkan perhitungan didapatkan, nilai \(\beta_{0}= -2,01671\) dan \(\beta_{1}= 0,06541\). Sehingga model regresi logistik untuk kasus tersebut sebagai berikut:
\[g(x)=ln (\frac{\pi(x)}{1-\pi(x)})=-2,01671+06541x\]
Interpretasi:
Nilai long-odds bagi kejadian positif sakit tenggorokan atau (Y=1) bagi durasi operasi ketika durasi nol menit atau (X=0) sebesar -2,01671. Mungkin secara klinis hal ini tidak masuk akal tetapi ini merupakan titik referensi untuk model.
Koefisiensi untuk menunjukkan perubahan long-odds untuk setiap tambahan satu menit dalam durasi operasi sebesar 0,06541. Ini menunjukkan bahwa setiap tambahan satu menit dalam durasi operasi maka akan meningkatkan long-odds dari positif sakit tenggorokan (Y=1) sebesar 0,06541.
> #Asumsi Linieritas pada Logit
> summary(model)
Call:
glm(formula = Y ~ X + interaction, family = binomial, data = data)
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -4.11235 2.78589 -1.476 0.140
X 0.33502 0.32049 1.045 0.296
interaction -0.05706 0.06632 -0.860 0.390
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 46.180 on 34 degrees of freedom
Residual deviance: 33.913 on 32 degrees of freedom
AIC: 39.913
Number of Fisher Scoring iterations: 5
Interpretasi:
Berdasarkan perhitungan di atas didapatkan nilai p-value ‘interaction’ sebesar 0,390 lebih besar dari α(0,05), sehingga memberikan keputusan tolak \(H_0\). Maka dari itu dapat diambil kesimpulan bahwa terdapat hubungan linier antara durasi operasi dan logit dari sakit tenggorokan.
> #Uji Kelayakan Model
> logitgof(Y,fitted(regresi_logistik))
Hosmer and Lemeshow test (binary model)
data: Y, fitted(regresi_logistik)
X-squared = 9.1722, df = 7, p-value = 0.2405
Interpretasi:
Berdasarkan output diatas dapat dilihat bahwa variabel \(X\) (Durasi Operasi) memiliki p-value sebesar 0,2405 atau lebih besar dari \(\alpha\) (0,05), sehingga memberikan keputusan tolak \(H_0\). Maka dari itu dapat diambil kesimpulan bahwa durasi operasi berpengaruh signifikan terhadap terjadinya sakit tenggorokan.
> pR2(regresi_logistik)
fitting null model for pseudo-r2
llh llhNull G2 McFadden r2ML r2CU
-17.2339498 -23.0899065 11.7119135 0.2536154 0.2843944 0.3881402
> qchisq(0.95,33)
[1] 47.39988
Interpretasi:
Berdasarkan perhitungan di atas dapat dilihat nilai \(G^2\) sebesar 11,7119 lebih besar dari \(\chi^2\) sebesar 15,50731, sehingga memberikan keputusan tolak \(H_0\). Maka dari itu dapat diambil kesimpulan bahwa model signifikan.
> #Uji Parsial Parameter Model
> summary(regresi_logistik)
Call:
glm(formula = Y ~ X, family = binomial, data = data)
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -2.01671 0.94613 -2.132 0.03305 *
X 0.06541 0.02511 2.605 0.00918 **
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 46.180 on 34 degrees of freedom
Residual deviance: 34.468 on 33 degrees of freedom
AIC: 38.468
Number of Fisher Scoring iterations: 5
Interpretasi:
Berdasarkan output diatas dapat dilihat bahwa variabel X (Durasi Operasi) memiliki p-value sebesar 0,00918 atau lebih besar dari \(\alpha\) (0,05), sehingga memberikan keputusan tolak \(H_{0}\) . Maka dari itu dapat diambil kesimpulan bahwa durasi operasi berpengaruh signifikan terhadap terjadinya sakit tenggorokan.
> #Koefisien Determinasi(R Squared)
> R2
[1] 0.2536163
Interpretasi:
Durasi operasi dapat menjelaskan sakit tenggorokan sebesar 25,3%.
> #Odds Ratio
> OR_beta
(Intercept) X
0.1330931 1.0675952
Interpretasi:
Apabila terjadi peningkatan satu menit pada durasi operasi, maka kecenderungan seseorang positif sakit tenggorokan atau Y=1 meningkat sebesar 1,330931 kali lipat daripada negatif sakit tenggorokan atau Y=0. Ini menunjukkan bahwa durasi operasi memiliki dampak signifikan terhadap kemungkinan pasien mengalami positif sakit tenggorokan setelah operasi.
> #Membentuk klasifikasi
> kelas
Y FALSE TRUE
0 9 4
1 5 17
Interpretasi:
Dari 13 amatan Y=0 yang dihasilkan, hanya 4 amatan yang terklasifikasi sebagai benar.
Dari 22 amatan Y=1 yang dihasilkan, terdapat 17 amatan yang terklasifikasi sebagai benar.
Dari hasil perhitungan analisis regresi yang sudah dilakukan maka dapat disimpulkan bahwa prediktor (Jenis Perangkat) cukup berpengaruh terhadap variabel respons (Sakit Tenggorokan) yang berarti bahwa pasien harus memilih jenis perangkat untuk operasi yaitu Laryngeal Mask Aiway atau (X=1) untuk meminimalisir terjadinya sakit tenggorokan setelah operasi.
Willey.(1998).Encylopedia of Biostatistic. New York
Enddy Roffin, Freza Riana, Ensiwin Munarsih, Pariyana, Iche Liberty.(2023) Regresi Logistik Biner dan Multinomial. NEM
Ghozali, I. (2016) Aplikasi Analisis Multivariete Dengan Program IBM SPSS 23. Edisi 8. Semarang: Badan Penerbit Universitas Diponegoro.
Hosmer, D. W. and Lemeshow, S. (2000). Applied Logistic Regression. John Wiley and Sons, Inc. USA.
Suhermin Ari Pujianti. 2002. Perbandingan Metode Klasifikasi Analisis Deskrriminan, Regresi Logistik dan Jaringan Saraf Tiruan Pada Kasus Pengelompokan Bunga. Pasca Sarjana Jurusan
Ayungtyas, Deisi Antika (2017) Klasifikasi Menggunakan Metode Regresi Logistik Dan Support Vector Machine. Sarjana thesis, Universitas Brawijaya.