Perbandingan Regresi Logistik Biner dengan Logistik Multinomial
Analisis dan Prediksi Model
1.Regresi Logistik Biner
Regresi logistik biner adalah cara untuk menebak kemungkinan terjadinya sesuatu yang hasilnya cuma punya dua pilihan. Jadi, bukan buat mencari angka pasti kayak “berapa nilainya”, tapi buat tahu seberapa besar kemungkinan sesuatu akan terjadi. Tujuannya Untuk memprediksi peluang (probabilitas) dari suatu kejadian berdasarkan data yang kita punya.
Rumus
Rumus utamanya pakai bentuk seperti ini:
\[ P(Y=1|X) = \frac{1}{1 + e^{-(\beta_0 + \beta_1 X)}} \]
Artinya:
- \(P(Y=1|X)\) → peluang terjadinya suatu hal (misal sukses penjualan)
- \(\beta_0\) → nilai awal (konstanta)
- \(\beta_1\) → seberapa besar pengaruh variabel X
- \(X\) → data yang kita pakai (contohnya jumlah iklan, kepuasan pelanggan, dll)
- \(e\) → angka tetap (sekitar 2.718)
Catatan
- Kalau \(\beta_1\) positif, berarti makin besar nilai X → peluang “ya/sukses” juga makin besar.
- Kalau \(\beta_1\) negatif, berarti makin besar nilai X → peluang “ya/sukses” makin kecil.
1.1 Model
##
## Call:
## glm(formula = Kesuksesan ~ Periklanan + Tenaga.penjualan + Kepuasan +
## Kompetisi, family = binomial, data = dataset)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -6.01352 1.89719 -3.170 0.001526 **
## Periklanan 0.19448 0.05866 3.315 0.000916 ***
## Tenaga.penjualan 0.28322 0.08019 3.532 0.000413 ***
## Kepuasan 0.42218 0.14105 2.993 0.002762 **
## Kompetisi -0.27119 0.14914 -1.818 0.069007 .
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 111.508 on 199 degrees of freedom
## Residual deviance: 63.617 on 195 degrees of freedom
## AIC: 73.617
##
## Number of Fisher Scoring iterations: 7
Hasil
Model Regresi Logistik digunakan untuk memperkirakan kemungkinan keberhasilan berdasarkan faktor-faktor pemasaran:
- Iklan (Advertising): Koefisien positif berarti semakin besar biaya iklan, semakin tinggi peluang untuk berhasil.
- Tenaga Penjualan (Salespeople): Semakin banyak tenaga penjualan, semakin besar kemungkinan keberhasilan karena jangkauan penjualan meningkat.
- Kepuasan (Satisfaction): Semakin tinggi kepuasan pelanggan, semakin besar peluang keberhasilan, terutama jika sebelumnya tingkat kepuasannya rendah.
- Persaingan (Competition): Koefisien negatif menunjukkan bahwa semakin tinggi tingkat persaingan, semakin kecil peluang keberhasilan, sesuai dengan dinamika pasar.
- Kinerja Model (Model Performance): Kinerja model dapat diukur menggunakan metrik seperti akurasi, confusion matrix, dan AUC. Nilai probabilitas yang diprediksi juga dapat divisualisasikan untuk memahami pengaruh masing-masing faktor.
2. Regresi Logistik Multinomial
Regresi logistik multinomial adalah cara untuk memprediksi kemungkinan sebuah hal terjadi kalau hasil akhirnya punya lebih dari dua pilihan kategori.
Kalau regresi logistik biasa cuma bisa menebak sesuatu yang dua kemungkinan aja (misalnya “ya” atau “tidak”, “sukses” atau “gagal”), maka regresi logistik multinomial bisa menebak hal yang punya tiga atau lebih kategori, misalnya:
- Tingkat kesuksesan penjualan: rendah, sedang, tinggi
- Kepuasan pelanggan: tidak puas, netral, puas
2.1 Rumus
Rumus umum dari regresi logistik multinomial adalah:
\[ \ln\left(\frac{P(Y = j)}{P(Y = \text{dasar})}\right) = \beta_{0j} + \beta_{1j}X_1 + \beta_{2j}X_2 + \beta_{3j}X_3 + \beta_{4j}X_4 \]
Keterangan:
- \(P(Y = j)\): peluang data masuk ke kategori ( j ) (misalnya “tinggi”)
- \(P(Y = \text{dasar})\) : peluang data masuk ke kategori dasar (misalnya “rendah”)
- \(\beta_{0j}\) : konstanta (nilai awal untuk kategori ( j ))
- \(\beta_{1j}, \beta_{2j}, \ldots\) : koefisien yang menunjukkan seberapa besar pengaruh masing-masing variabel ( X ) terhadap peluang kategori itu
- \(X_1, X_2, X_3, X_4\) : variabel bebas atau faktor yang mempengaruhi hasil
Catatan
Bagian sebelah kiri, \(\ln\left(\frac{P(Y = j)}{P(Y = \text{dasar})}\right)\), disebut log odds — artinya perbandingan peluang suatu kategori ( j ) dibandingkan kategori dasar (misal “tinggi” dibanding “rendah”).
Bagian kanan berisi kombinasi variabel \(X\) yang dikalikan dengan bobot (koefisien) \(\beta\). Nilai koefisien ini nunjukin arah dan besar pengaruh tiap variabel.
Kalau \(\beta_{ij}\) positif, maka kenaikan \(X_i\) akan meningkatkan peluang masuk ke kategori ( j ) dibanding kategori dasar.
Kalau \(\beta_{ij}\) negatif, maka kenaikan \(X_i\) akan menurunkan peluang masuk ke kategori ( j ).
Model ini cocok buat kasus dengan hasil yang lebih dari dua kategori, tapi tidak punya urutan jelas antar kategorinya.
2.2 Model
## # weights: 18 (10 variable)
## initial value 219.722458
## iter 10 value 117.482737
## iter 20 value 5.495434
## iter 30 value 1.979746
## iter 40 value 1.843022
## iter 50 value 1.370297
## iter 60 value 1.058963
## iter 70 value 0.979582
## iter 80 value 0.754776
## iter 90 value 0.674786
## iter 100 value 0.597930
## final value 0.597930
## stopped after 100 iterations
##
## Summary Model:
## Call:
## multinom(formula = Sukses_Penjualan ~ Periklanan + Tenaga.penjualan +
## Kepuasan + Kompetisi, data = data)
##
## Coefficients:
## (Intercept) Periklanan Tenaga.penjualan Kepuasan Kompetisi
## Mungkin -242.0095 6.558456 6.53966 7.162678 -5.773119
## Sangat_Mungkin -725.3307 18.411197 17.41562 16.284069 -18.720020
##
## Std. Errors:
## (Intercept) Periklanan Tenaga.penjualan Kepuasan Kompetisi
## Mungkin 122.2076 3.4219396 3.3526893 3.608800 3.332004
## Sangat_Mungkin 19.3409 0.9450857 0.3578669 2.245381 1.879922
##
## Residual Deviance: 1.19586
## AIC: 21.19586
Hasil Model
- Kategori “Mungkin” (dibanding “Tidak Mungkin”)
- Periklanan (6.55) → pengaruhnya positif, artinya makin besar biaya atau intensitas iklan, makin besar juga peluang penjualan bisa “mungkin” berhasil.
- Tenaga penjualan (6.53) → pengaruhnya positif, jadi makin banyak tenaga penjualan, makin besar peluang “mungkin berhasil”.
- Kepuasan (7.16) → pengaruhnya positif dan signifikan, pelanggan yang puas bikin peluang “mungkin berhasil” makin besar.
- Kompetisi (-5.77) → pengaruhnya negatif, artinya kalau pesaing banyak, peluang keberhasilan menurun.
Untuk kategori “Mungkin”, faktor yang paling kuat pengaruhnya adalah kepuasan pelanggan, disusul periklanan dan tenaga penjualan.
- Kategori “Sangat Mungkin” (dibanding “Tidak Mungkin”)
- Periklanan (18.41) → pengaruh sangat kuat dan signifikan. Iklan yang efektif bikin peluang “sangat mungkin berhasil” naik tinggi banget.
- Tenaga penjualan (17.41) → juga sangat kuat, tenaga penjualan yang banyak dan aktif bikin hasil makin bagus.
- Kepuasan (16.28) → pelanggan yang puas banget bikin penjualan jadi sangat mungkin sukses.
- Kompetisi (-18.72) → makin tinggi kompetisi, makin kecil peluang jadi “sangat mungkin berhasil”.
Untuk kategori “Sangat Mungkin”, semua faktor punya pengaruh besar, terutama periklanan dan tenaga penjualan. Tapi kompetisi justru mengurangi peluang keberhasilan.
Kinerja Model:
Model ini punya nilai deviance 1.19 dan AIC 21.20, yang menunjukkan hasil model cukup baik dalam memprediksi. Untuk menilai seberapa akurat model ini, bisa dilihat juga dari akurasi prediksi, confusion matrix, atau kurva AUC.
2.3 Visualisasi
## # weights: 18 (10 variable)
## initial value 219.722458
## iter 10 value 117.482737
## iter 20 value 5.495434
## iter 30 value 1.979746
## iter 40 value 1.843022
## iter 50 value 1.370297
## iter 60 value 1.058963
## iter 70 value 0.979582
## iter 80 value 0.754776
## iter 90 value 0.674786
## iter 100 value 0.597930
## final value 0.597930
## stopped after 100 iterations
Grafik ini nunjukin hasil dari model regresi logistik multinomial, yang intinya berusaha memprediksi seberapa besar kemungkinan suatu hal berhasil berdasarkan seberapa besar biaya atau usaha periklanan yang dilakukan (Advertising).
Ketika iklan masih sedikit (sekitar 10–13):
- Titik dan garis hijau (Tidak_Mungkin) ada di atas. Artinya, kalau iklannya masih sedikit, peluang sukses juga kecil.
- Garis merah (Sangat_Mungkin) dan biru (Mungkin) masih rendah banget.
Ketika iklan mulai meningkat (sekitar 14–18):
- Garis hijau mulai turun → artinya peluang gagal makin kecil.
- Garis merah (Sangat_Mungkin) mulai naik tajam → peluang sukses makin besar.
- Garis biru (Mungkin) ada di tengah-tengah, berarti kondisinya belum jelas — bisa berhasil, bisa juga enggak.
Jika iklannya udah banyak (sekitar 19–25):
- Garis merah (Sangat_Mungkin) paling tinggi → makin banyak iklan, makin besar peluang berhasil.
- Garis hijau (Tidak_Mungkin) paling rendah → gagal hampir nggak mungkin.
- Garis biru (Mungkin) tetap di tengah, artinya masih tetep keberhasilannya standar.
Semakin besar usaha atau biaya periklanan, semakin tinggi kemungkinan keberhasilan. Kalau periklanan rendah → kemungkinan gagal besar. Kalau periklanan tinggi → kemungkinan sukses besar. Jadi, iklan punya pengaruh kuat terhadap tingkat keberhasilan.
3. Perbandingan
- Model Regresi Logistik Multinomial
Model ini digunakan kalau variabel dependen (Y) punya lebih dari dua kategori Jadi model ini membandingkan kemungkinan tiap kategori terhadap kategori dasar.
Hasil Utama:
- Untuk kategori Mungkin, koefisien positif pada variabel Periklanan, Tenaga Penjualan, dan Kepuasan menunjukkan bahwa semakin besar nilai faktor-faktor ini, semakin tinggi peluang masuk ke kategori Mungkin Sukses dibanding Tidakmungkin Sukses.
- Sedangkan Kompetisi bernilai negatif, artinya semakin tinggi kompetisi, semakin kecil kemungkinan menjadi Mungkin Sukses.
- Pola yang sama terlihat pada kategori Sangat Mungkin, tapi dengan nilai koefisien yang lebih besar — artinya pengaruh faktor-faktor tersebut lebih kuat untuk mencapai tingkat kesuksesan tertinggi.
Ringkasan:
- Model ini cocok untuk memprediksi beberapa level keberhasilan.
- Hasil menunjukkan faktor Periklanan, Tenaga Penjualan, dan Kepuasan paling berperan besar meningkatkan peluang sukses.
- Model Regresi Logistik Biner
Model ini digunakan kalau variabel Y hanya punya dua kategori, misalnya:
- 0 = Gagal
- 1 = Sukses
Hasil Utama:
Semua variabel kecuali Kompetisi berpengaruh positif dan signifikan terhadap kesuksesan.
- Periklanan (p < 0.001) → makin tinggi biaya iklan, makin besar peluang sukses.
- Tenaga Penjualan (p < 0.001) → makin banyak tenaga penjualan, makin besar peluang sukses.
- Kepuasan (p = 0.002) → makin puas pelanggan, makin tinggi kemungkinan sukses.
- Kompetisi (p = 0.069) → pengaruh negatif, tapi tidak signifikan, jadi belum cukup bukti bahwa kompetisi benar-benar menurunkan kesuksesan.
Ringkasan:
- Model ini lebih sederhana — hanya membedakan antara sukses dan tidak sukses.
- AIC = 73.6 menunjukkan model cukup baik (semakin kecil AIC, semakin bagus).
- Perbandingan Umum antara Keduanya
| Aspek | Regresi Logistik Biner | Regresi Logistik Multinomial |
|---|---|---|
| Jenis variabel Y | Dua kategori (misal sukses vs gagal) | Lebih dari dua kategori (misal tidak, mungkin, sangat) |
| Tujuan | Mengukur peluang satu hasil “ya/tidak” | Mengukur peluang beberapa tingkat hasil |
| Interpretasi | Lebih sederhana, mudah dibaca | Lebih kompleks, tapi lebih detail |
| Koefisien | Menunjukkan arah dan kekuatan pengaruh ke “sukses” | Menunjukkan pengaruh untuk tiap kategori dibanding kategori dasar |
| Hasil | Periklanan, tenaga penjualan, dan kepuasan signifikan positif | Faktor yang sama juga positif, tapi berbeda kekuatan antar kategori |
| Kompetisi | Negatif dan tidak signifikan | Negatif dan juga menunjukkan tren menurunkan peluang sukses |
Kesimpulan
Secara umum, kedua model menunjukkan hasil yang konsisten:
- Periklanan, tenaga penjualan, dan kepuasan → meningkatkan peluang sukses.
- Kompetisi → cenderung menurunkan peluang sukses.
Perbedaannya hanya di cara melihat kesuksesan:
- Model biner: melihat sukses sebagai “ya atau tidak”.
- Model multinomial: melihat sukses dalam beberapa tingkat (misalnya mungkin atau sangat mungkin sukses), sehingga memberikan gambaran yang lebih rinci.
Referensi
Berikut dua referensi dalam format IEEE:
[1] UCLA OARC. “Multinomial Logistic Regression | Stata Data Analysis Examples.” [Online]. Available: https://stats.oarc.ucla.edu/stata/dae/multinomiallogistic-regression/. [Accessed: Oct. 24, 2025].
[2] A. (“Author Unknown”). “Regression Models – Analysis and Predictive Modeling.” [Online]. Available: https://bookdown.org/content/a142b172-69b2-436d-bdb0-9da6d046a0f9/02-Regression_Model.html#logistics-regression. [Accessed: Oct. 24, 2025].