
Regresi Logistik Multinomial
1. Konsep Dasar
1.1 Pengertian Regresi Logistik Multinomial
Regresi Logistik Multinomial adalah salah satu
metode analisis statistik yang digunakan untuk memprediksi
kemungkinan (peluang) dari suatu kejadian yang memiliki
lebih dari dua hasil atau kategori.
Model ini merupakan pengembangan dari regresi logistik
biner, yang awalnya hanya bisa digunakan untuk memprediksi
hasil dengan dua kemungkinan saja, seperti
ya/tidak, sukses/gagal, atau membeli/tidak
membeli.
Dalam regresi logistik multinomial, hasil yang ingin diprediksi bisa
memiliki tiga atau lebih pilihan, contohnya:
- Tingkat kesuksesan bisnis: rendah, sedang, atau
tinggi
- Kepuasan pelanggan: kurang puas, puas, atau
sangat puas
- Keputusan konsumen: tidak membeli, menimbang, atau
membeli
Tujuan utama dari model ini adalah untuk mengetahui
faktor-faktor mana yang paling berpengaruh terhadap peluang
terjadinya suatu kategori hasil tertentu. Artinya, kita bisa
melihat bagaimana variabel-variabel seperti iklan, tenaga
penjualan, atau kepuasan pelanggan dapat meningkatkan
peluang keberhasilan suatu usaha.
Secara sederhana, regresi logistik multinomial membantu kita
memahami hubungan antara beberapa faktor (variabel bebas)
dengan kemungkinan suatu hasil (variabel terikat) yang
memiliki lebih dari dua pilihan.
Model ini bekerja dengan cara membandingkan setiap kategori hasil
terhadap satu kategori yang dijadikan acuan (base
category). Melalui perbandingan ini, kita bisa melihat seberapa
besar kemungkinan suatu data termasuk dalam kategori tertentu dibanding
kategori acuan tersebut.
Dengan kata lain, regresi logistik multinomial memungkinkan kita
untuk:
- Memprediksi peluang terjadinya berbagai tingkat
hasil
- Mengetahui pengaruh masing-masing faktor terhadap setiap
tingkat hasil
- Membantu pengambilan keputusan berdasarkan data dan
analisis probabilitas
1.2 Penjelasan Rumus Regresi Logistik
Multinomial
Rumus umum regresi logistik multinomial dapat dituliskan sebagai
berikut:
\[
\ln\left(\frac{P(Y = j)}{P(Y = \text{dasar})}\right)
= \beta_{0j} + \beta_{1j}X_1 + \beta_{2j}X_2 + \beta_{3j}X_3 +
\beta_{4j}X_4
\]
dengan:
- ( \(P(Y = j)\) ) : peluang bahwa
suatu observasi (misalnya perusahaan) termasuk dalam kategori j
(misalnya “Sedang” atau “Tinggi”),
- ( \(P(Y = \text{dasar})\) ) :
peluang observasi termasuk kategori dasar (misalnya “Rendah”),
- ( \(\beta_{0j}\) ) : konstanta
(nilai dasar tanpa pengaruh variabel lain),
- ( \(\beta_{1j}, \beta_{2j}, \beta_{3j},
\beta_{4j}\) ) : koefisien yang menunjukkan besar dan arah
pengaruh dari masing-masing variabel,
- ( \(X_1, X_2, X_3, X_4\) ) :
variabel bebas yang memengaruhi hasil.
1.2.1 Contoh Penerapan pada Dataset Tingkat Kesuksesan
Penjualan Berdasarkan Berbagai Faktor
Dalam penelitian ini, variabel bebas yang digunakan terdiri dari:
| ( \(X_1\) ) |
Periklanan |
Jumlah dana yang digunakan untuk promosi |
| ( \(X_2\) ) |
Tenaga Penjualan |
Jumlah karyawan bagian penjualan |
| ( \(X_3\) ) |
Kepuasan |
Tingkat kepuasan pelanggan |
| ( \(X_4\) ) |
Persaingan |
Tingkat persaingan antar perusahaan |
| ( \(Y\) ) |
Tingkat Kesuksesan |
Kategori: Rendah, Sedang, atau Tinggi |
Karena variabel terikat (Tingkat Kesuksesan)
memiliki tiga kategori, maka model akan membentuk
dua persamaan logit, dengan kategori dasar (pembanding)
adalah “Rendah”.
Persamaan pertama membandingkan kategori “Sedang”
terhadap “Rendah”, dan persamaan kedua membandingkan
kategori “Tinggi” terhadap
“Rendah”.
1⃣ Persamaan untuk kategori “Sedang” dibanding “Rendah”
\[
\ln\left(\frac{P(Y = \text{Sedang})}{P(Y = \text{Rendah})}\right)
= \beta_{0,sed} + \beta_{1,sed}(Periklanan) + \beta_{2,sed}(Tenaga\
Penjualan) + \beta_{3,sed}(Kepuasan) + \beta_{4,sed}(Persaingan)
\]
Artinya: persamaan ini menggambarkan seberapa besar
kemungkinan perusahaan memiliki tingkat kesuksesan “Sedang” dibanding
“Rendah”, berdasarkan empat faktor di atas.
2⃣ Persamaan untuk kategori “Tinggi” dibanding “Rendah”
\[
\ln\left(\frac{P(Y = \text{Tinggi})}{P(Y = \text{Rendah})}\right)
= \beta_{0,ting} + \beta_{1,ting}(Periklanan) + \beta_{2,ting}(Tenaga\
Penjualan) + \beta_{3,ting}(Kepuasan) + \beta_{4,ting}(Persaingan)
\]
Artinya: persamaan ini menunjukkan kemungkinan perusahaan
mencapai kesuksesan “Tinggi” dibanding “Rendah”, tergantung
dari seberapa besar nilai iklan, tenaga penjualan, kepuasan, dan
persaingan yang dimilikinya.
1.2.2 Makna Rumus dalam Konteks Data
Secara sederhana, rumus tersebut berfungsi untuk menghitung
peluang suatu perusahaan masuk dalam kategori
kesuksesan tertentu berdasarkan nilai dari variabel-variabelnya.
Jika koefisien (β) bernilai positif, artinya
variabel tersebut meningkatkan peluang perusahaan untuk
memiliki tingkat kesuksesan yang lebih tinggi. Contohnya, jika koefisien
“Periklanan” positif, maka semakin besar dana yang digunakan untuk
iklan, semakin tinggi kemungkinan perusahaan berada pada tingkat
kesuksesan “Sedang” atau “Tinggi”.
Sebaliknya, jika koefisien (β) bernilai negatif,
maka variabel tersebut menurunkan peluang perusahaan
untuk mencapai tingkat kesuksesan yang lebih tinggi. Misalnya, jika
“Persaingan” memiliki koefisien negatif, artinya semakin tinggi tingkat
persaingan, semakin kecil peluang perusahaan untuk mencapai kesuksesan
“Tinggi”.
2.Penerapan Regresi Logistik Multinomial
Dalam tugas kali ini, digunakan analisis regresi logistik
multinomial untuk mengetahui faktor-faktor yang
memengaruhi tingkat kesuksesan suatu usaha atau perusahaan.
Data yang digunakan berisi beberapa variabel yang dianggap dapat
memengaruhi hasil akhir (tingkat kesuksesan), yaitu:
- Periklanan → seberapa besar upaya promosi yang
dilakukan,
- Tenaga Penjualan → seberapa banyak tenaga yang
terlibat dalam proses penjualan(sales-nya),
- Kepuasan → seberapa puas pelanggan terhadap produk
atau layanan,
- Persaingan → seberapa besar tekanan dari pesaing di
pasar.
Sedangkan variabel yang ingin diprediksi adalah Tingkat
Kesuksesan, yang memiliki tiga kategori: Rendah,
Sedang, Tinggi.
Dengan menggunakan regresi logistik multinomial, analisis ini
bertujuan untuk:
- Mengetahui pengaruh masing-masing faktor terhadap
peluang suatu usaha berada pada tingkat kesuksesan tertentu.
- Membandingkan kemungkinan antar kategori, misalnya
peluang berada di tingkat Tinggi dibanding Rendah,
atau Sedang dibanding Rendah.
- Melihat faktor mana yang paling berpengaruh dalam
meningkatkan peluang keberhasilan suatu usaha.
2.1 Menampilkan Data Regresi Logisti Multinomial (Pengaruh
Faktor dalam Penjualan Penjualan terhadap Kesuksesan)
2.2 Pembangunan Model Regresi Logistik
Multinomial
2.2.1. Menampilkan Kode untuk Model Regresi Logistik
Multinomial
# 1. Panggil library yang dibutuhkan
library(nnet) # untuk fungsi multinom()
library(dplyr) # untuk olah data
# 2. Baca file CSV
data <- read.csv("data multinomial logistics regression 2.csv",
stringsAsFactors = FALSE,
colClasses = "character",
check.names = FALSE)
# 3. Ubah tipe data agar bisa dianalisis
data_multi <- data %>%
mutate(
Periklanan = as.numeric(gsub("\\.", "", Periklanan)),
`Tenaga Penjualan` = as.numeric(gsub("\\.", "", `Tenaga Penjualan`)),
Kepuasan = as.numeric(gsub("\\.", "", Kepuasan)),
Persaingan = as.numeric(gsub("\\.", "", Persaingan)),
`Tingkat Kesuksesan` = factor(`Tingkat Kesuksesan`,
levels = c("Rendah", "Sedang", "Tinggi"))
)
# 4. Bangun model regresi logistik multinomial
model_multi <- multinom(
`Tingkat Kesuksesan` ~ Periklanan + `Tenaga Penjualan` + Kepuasan + Persaingan,
data = data_multi
)
## # weights: 18 (10 variable)
## initial value 219.722458
## final value 219.722458
## converged
# 5. Tampilkan ringkasan model
summary(model_multi)
## Call:
## multinom(formula = `Tingkat Kesuksesan` ~ Periklanan + `Tenaga Penjualan` +
## Kepuasan + Persaingan, data = data_multi)
##
## Coefficients:
## (Intercept) Periklanan `Tenaga Penjualan` Kepuasan
## Sedang -4.691250e-33 -1.824321e-17 -1.026521e-17 -5.885049e-17
## Tinggi 9.382499e-33 -1.670891e-16 2.442452e-16 1.676947e-16
## Persaingan
## Sedang 1.024808e-16
## Tinggi -1.912334e-16
##
## Std. Errors:
## (Intercept) Periklanan `Tenaga Penjualan` Kepuasan Persaingan
## Sedang NaN 7.482794e-17 1.424806e-16 5.808512e-17 5.590177e-17
## Tinggi NaN 8.683027e-17 1.501287e-16 5.901390e-17 6.282393e-17
##
## Residual Deviance: 439.4449
## AIC: 459.4449
# 6. Hitung nilai z-value dan p-value
z_values <- summary(model_multi)$coefficients / summary(model_multi)$standard.errors
p_values <- 2 * (1 - pnorm(abs(z_values)))
hasil_model <- cbind(
"z-value" = round(z_values, 3),
"p-value" = round(p_values, 4)
)
# 7. Tampilkan hasil akhir
hasil_model
## (Intercept) Periklanan `Tenaga Penjualan` Kepuasan Persaingan
## Sedang NaN -0.244 -0.072 -1.013 1.833
## Tinggi NaN -1.924 1.627 2.842 -3.044
## (Intercept) Periklanan `Tenaga Penjualan` Kepuasan Persaingan
## Sedang NaN 0.8074 0.9426 0.3110 0.0668
## Tinggi NaN 0.0543 0.1038 0.0045 0.0023
2.2.2 Interpretasi Output Model
Model yang dijalankan sudah berhasil (converged),
artinya programnya bisa selesai menghitung. Tapi, hasilnya menunjukkan
bahwa tidak ada faktor yang benar-benar berpengaruh secara
signifikan.
Mari lihat satu per satu hasilnya :
a.Tabel Koefisien
| Sedang |
Periklanan |
-0.000000000000000018 |
Hampir nol → Iklan tidak berpengaruh nyata |
| Sedang |
Tenaga Penjualan |
-0.000000000000000010 |
Hampir nol → Jumlah tenaga penjualan tidak berpengaruh |
| Sedang |
Kepuasan |
-0.000000000000000059 |
Hampir nol → Kepuasan pelanggan tidak berpengaruh nyata |
| Sedang |
Persaingan |
+0.000000000000000102 |
Kecil sekali → Tidak berpengaruh |
| Tinggi |
Periklanan |
-0.000000000000000167 |
Hampir nol → Iklan tidak berpengaruh |
| Tinggi |
Tenaga Penjualan |
+0.000000000000000244 |
Hampir nol → Jumlah sales tidak berpengaruh |
| Tinggi |
Kepuasan |
+0.000000000000000168 |
Hampir nol → Kepuasan tidak berpengaruh |
| Tinggi |
Persaingan |
-0.000000000000000191 |
Hampir nol → Persaingan tidak berpengaruh |
Semua angka ini sangat-sangat kecil (mendekati nol),
artinya tidak ada hubungan nyata antara
variabel-variabel tersebut dengan “Tingkat Kesuksesan”.
b. Standard Error
Hasilnya seperti ini:
| Sedang |
Periklanan |
0.000000000000000074 |
| Sedang |
Tenaga Penjualan |
0.000000000000000142 |
| Sedang |
Kepuasan |
0.000000000000000058 |
| Sedang |
Persaingan |
0.000000000000000055 |
| Tinggi |
Periklanan |
0.000000000000000086 |
| Tinggi |
Tenaga Penjualan |
0.000000000000000150 |
| Tinggi |
Kepuasan |
0.000000000000000059 |
| Tinggi |
Persaingan |
0.000000000000000062 |
Ada juga beberapa NaN (Not a Number) di bagian
intercept, artinya:
Model tidak bisa menghitung karena datanya terlalu
mirip antar kategori (Rendah–Sedang–Tinggi).
yang artinya:
Data terlalu “seragam” — sehingga model bingung membedakan mana usaha
yang benar-benar rendah, sedang, atau tinggi.
c.Residual Deviance dan AIC
| Residual Deviance |
439.44 |
Semakin kecil nilainya semakin baik. Nilai ini masih cukup besar →
model belum cocok dengan data. |
| AIC |
459.44 |
Digunakan untuk membandingkan model. Nilai besar berarti modelnya
belum bagus. |
Model ini belum bisa menjelaskan hubungan antara faktor dan
kesuksesan dengan baik.
d.Nilai z-value dan p-value
Ini digunakan untuk melihat apakah pengaruh tiap variabel
signifikan atau tidak.
Contoh hasilnya:
| Sedang |
Periklanan |
-0.244 |
0.8074 |
| Sedang |
Tenaga Penjualan |
-0.072 |
0.9426 |
| Sedang |
Kepuasan |
-1.013 |
0.3110 |
| Sedang |
Persaingan |
1.833 |
0.0668 |
| Tinggi |
Periklanan |
-1.924 |
0.0543 |
| Tinggi |
Tenaga Penjualan |
1.627 |
0.1038 |
| Tinggi |
Kepuasan |
2.842 |
0.0045 |
| Tinggi |
Persaingan |
-3.044 |
0.0023 |
Aturan sederhananya:
- Jika p-value < 0.05, berarti signifikan
(berpengaruh nyata)
- Jika p-value > 0.05, berarti tidak
signifikan
Dari hasil di atas:
- Untuk kategori Sedang, semua p-value >
0.05 → tidak ada pengaruh signifikan.
- Untuk kategori Tinggi, hanya Kepuasan
(0.0045) dan Persaingan (0.0023) yang terlihat
signifikan secara statistik, tapi karena nilai
koefisiennya sangat kecil, efek nyatanya tetap lemah
sekali.
Kesimpulan Akhir
Peneliti membangun model multinomial logistic regression untuk
memprediksi tingkat kesuksesan berdasarkan faktor periklanan, tenaga
penjualan, kepuasan pelanggan, dan persaingan. Model telah berhasil
dijalankan (ditandai dengan status converged), namun hasilnya
menunjukkan bahwa:
Nilai koefisien semua variabel sangat kecil.
Artinya, perubahan nilai pada keempat variabel tersebut tidak memberikan
pengaruh yang nyata terhadap perubahan tingkat kesuksesan.
Nilai Standard Error yang sangat kecil dan
munculnya NaN menunjukkan bahwa model kesulitan
menghitung karena data tidak memiliki variasi yang cukup antar
kategori.
Nilai Residual Deviance sebesar 439.44 dan
AIC sebesar 459.44 menunjukkan bahwa tingkat kesalahan
model masih tinggi. Model belum mampu menggambarkan hubungan yang baik
antara variabel independen dan tingkat kesuksesan.
Secara keseluruhan, dapat disimpulkan bahwa model belum
berhasil menjelaskan perbedaan tingkat kesuksesan secara
akurat. Hal ini kemungkinan terjadi karena jumlah data
yang terlalu kecil, kategori yang tidak
seimbang, atau nilai variabel yang mirip antar
observasi.
2.3. Visualisasi Hasil

2.3.1 Penjelasan Tentang Visualisasi
Grafik ini menampilkan hubungan antara empat variabel
prediktor (Periklanan, Tenaga Penjualan, Kepuasan, dan
Persaingan) dengan kategori Tingkat Kesuksesan
(Rendah, Sedang, Tinggi).
Sumbu X (horizontal) → nilai dari tiap variabel
prediktor.
Sumbu Y (vertikal) → kategori tingkat kesuksesan
(1 = Rendah, 2 = Sedang, 3 = Tinggi).
Titik warna → masing-masing observasi (data
perusahaan).
- Ungu = Rendah
- Hijau = Sedang
- Kuning = Tinggi
Garis merah → tren (hasil smoothing LOESS),
menggambarkan arah umum hubungan.
a.Kepuasan
Terlihat semakin tinggi nilai Kepuasan,
titik-titik kuning (Tinggi) makin banyak di bagian atas
grafik.
Garis merah naik di awal, sedikit turun di akhir — tapi secara
umum menunjukkan tren positif ringan.
Ini berarti:
Semakin tinggi tingkat kepuasan pelanggan, semakin besar peluang
perusahaan berada pada tingkat kesuksesan Sedang atau
Tinggi.
Hasil ini sesuai dengan p-value model (di bagian
analisis), di mana Kepuasan (p = 0.0045) termasuk
signifikan untuk kategori “Tinggi”.
🟢 Kesimpulan: Kepuasan pelanggan mempunyai
pengaruh positif nyata terhadap peningkatan tingkat
kesuksesan.
b. Periklanan
- Polanya juga menunjukkan garis merah cenderung naik ke
kanan.
- Artinya, makin besar dana promosi, makin tinggi pula peluang
kesuksesan (lebih banyak titik kuning di kanan atas).
- Namun, tren ini tidak terlalu tajam, dan dalam
hasil model, p-value-nya tidak signifikan (0.0543 →
sedikit di atas 0.05).
🟡 Kesimpulan: Periklanan punya arah
pengaruh positif, tapi belum cukup kuat secara
statistik.
c. Persaingan
- Garis merah justru sedikit turun ketika nilai
Persaingan meningkat.
- Ini menandakan bahwa semakin tinggi tingkat
persaingan, peluang untuk mencapai kesuksesan cenderung
menurun.
- Dalam hasil regresi, variabel ini juga signifikan (p =
0.0023) untuk kategori “Tinggi”, dan koefisiennya
negatif.
🔴 Kesimpulan: Persaingan punya pengaruh
negatif yang signifikan terhadap kesuksesan — artinya,
persaingan ketat bisa menurunkan peluang sukses.
d. Tenaga Penjualan
- Garis merah naik perlahan seiring meningkatnya jumlah tenaga
penjualan.
- Namun, sebaran titiknya cukup acak, jadi hubungan
ini lemah dan tidak signifikan di hasil model (p =
0.1038).
- Jadi meskipun arahnya positif, efeknya kecil banget.
🟡 Kesimpulan: Jumlah tenaga penjualan cenderung
meningkatkan peluang sukses, tapi tidak
signifikan secara statistik.
Kesimpulan Umum dari Visualisasi
Dari empat grafik tersebut bisa disimpulkan:
| Kepuasan |
Positif |
✅ Signifikan |
Kepuasan tinggi → peluang sukses meningkat |
| Periklanan |
Positif |
⚠️ Hampir signifikan |
Iklan lebih banyak → sedikit menaikkan peluang sukses |
| Persaingan |
Negatif |
✅ Signifikan |
Persaingan tinggi → peluang sukses menurun |
| Tenaga Penjualan |
Positif lemah |
❌ Tidak signifikan |
Jumlah sales lebih banyak → pengaruh kecil |
3.Kesimpulan Keseluruhan Regresi Logistik
Multinomial
Secara keseluruhan, Regresi Logistik Multinomial
merupakan salah satu metode statistik yang digunakan untuk memprediksi
variabel dependen bersifat kategorik dengan lebih dari dua
kelas, berdasarkan beberapa variabel independen yang bersifat
numerik atau kategorik. Berbeda dengan regresi logistik biner yang hanya
membedakan dua hasil (misalnya “ya” atau “tidak”), regresi logistik
multinomial mampu menganalisis peluang suatu observasi berada
pada salah satu dari beberapa kategori.
Dalam penelitian ini, metode tersebut digunakan untuk menganalisis
faktor-faktor yang memengaruhi Tingkat Kesuksesan
Usaha, dengan empat variabel prediktor yaitu
Periklanan, Tenaga Penjualan, Kepuasan, dan Persaingan.
Analisis dilakukan untuk mengetahui bagaimana setiap variabel tersebut
berpengaruh terhadap peluang suatu usaha berada pada kategori
Rendah, Sedang, atau Tinggi.
Hasil pemodelan menunjukkan bahwa:
- Model telah berhasil dijalankan dan konvergen,
namun nilai AIC dan deviance yang tinggi menandakan
bahwa model belum sepenuhnya menggambarkan hubungan data secara
optimal.
- Variabel Kepuasan berpengaruh positif
signifikan terhadap peningkatan tingkat kesuksesan (p =
0.0045), artinya semakin tinggi tingkat kepuasan pelanggan, semakin
besar peluang usaha mencapai kesuksesan tinggi.
- Variabel Persaingan menunjukkan pengaruh
negatif signifikan (p = 0.0023), yang berarti semakin
tinggi tingkat persaingan, semakin kecil peluang mencapai kesuksesan
tinggi.
- Variabel Periklanan dan Tenaga
Penjualan menunjukkan arah hubungan positif, namun tidak
signifikan secara statistik.
- Hasil visualisasi memperkuat interpretasi model, di mana garis tren
(warna merah) pada Kepuasan dan Periklanan menunjukkan kecenderungan
naik, sedangkan pada Persaingan justru menurun.
Dengan demikian, dapat disimpulkan bahwa:
Regresi Logistik Multinomial efektif digunakan untuk
memodelkan hubungan antara beberapa variabel independen dengan variabel
dependen yang memiliki tiga atau lebih kategori. Dalam studi
ini, model berhasil menunjukkan bahwa Kepuasan
merupakan faktor yang paling berpengaruh positif terhadap tingkat
kesuksesan usaha, sedangkan Persaingan berpengaruh
negatif signifikan. Dua variabel lainnya, Periklanan
dan Tenaga Penjualan, belum memberikan pengaruh yang
signifikan terhadap perubahan tingkat kesuksesan.
Sebagai saran, model ini dapat ditingkatkan dengan:
- Menambah jumlah dan variasi data agar model lebih stabil,
- Melakukan uji lanjutan seperti analisis interaksi antar
variabel, dan
- Mencoba pendekatan klasifikasi lain (seperti
random forest atau ordinal regression) untuk melihat
perbandingan performa model.
4. Perbandingan antara Regresi Logistik Biner dan Regresi
Logistik Mutinomial
4.1 Perbedaan Konsep Dasar
| Jumlah Kategori Variabel Dependen
(Y) |
2 kategori (contoh: Ya/Tidak,
Sukses/Gagal) |
≥ 3 kategori (contoh: Rendah, Sedang,
Tinggi) |
| Jenis Analisis |
Menghitung peluang terjadinya salah satu dari dua
hasil |
Menghitung peluang observasi masuk ke salah satu dari
beberapa kategori |
| Persamaan Logit |
Hanya 1 persamaan logit |
Membentuk beberapa persamaan logit (sebanyak kategori -
1) |
| Kategori Pembanding (Base) |
Salah satu kategori dianggap sebagai pembanding
(biasanya “0”) |
Salah satu kategori dianggap dasar, dan setiap kategori
lain dibandingkan dengan dasar tersebut |
| Tujuan Analisis |
Mengetahui faktor-faktor yang memengaruhi dua
kemungkinan hasil |
Mengetahui faktor-faktor yang memengaruhi hasil dengan
banyak tingkatan |
| Contoh Kasus |
Apakah seseorang membeli produk (Ya/Tidak) |
Tingkat kepuasan pelanggan (Rendah, Sedang,
Tinggi) |
4.2 Perbandingan Berdasarkan Output Model
| Koefisien (β) |
Menunjukkan seberapa besar pengaruh tiap variabel
terhadap peluang hasil “1” (misalnya sukses). |
Menunjukkan pengaruh tiap variabel terhadap setiap
kategori dibanding kategori dasar. |
| Interpretasi Koefisien |
Jika β positif → meningkatkan peluang sukses. Jika
negatif → menurunkan peluang. |
Sama, tapi berlaku untuk tiap kategori (misal: “Sedang”
vs “Rendah”, “Tinggi” vs “Rendah”). |
| Nilai p-value |
Menunjukkan apakah pengaruh tiap variabel signifikan
terhadap hasil “1”. |
Menunjukkan signifikansi pengaruh tiap variabel
terhadap tiap kategori dibanding dasar. |
| Output Utama di R |
Coefficients, Std. Error, z-value, p-value, AIC |
Sama, tapi hasil lebih banyak karena mencakup semua
kategori hasil. |
| Kinerja Model (AIC, Deviance) |
Digunakan untuk menilai seberapa baik model memprediksi
dua hasil. |
Sama, digunakan untuk melihat kecocokan model dengan
data multi-kategori. |
4.3 Perbandingan Berdasarkan Hasil Output dari
Tugas
| Kategori Hasil (Y) |
Tingkat Kesuksesan memiliki 2 kategori:
Rendah dan Tinggi |
Tingkat Kesuksesan memiliki 3 kategori:
Rendah, Sedang, dan Tinggi |
| Jumlah Persamaan Logit |
1 persamaan (perbandingan antara Tinggi vs
Rendah) |
2 persamaan (perbandingan Sedang vs
Rendah dan Tinggi vs Rendah) |
| Variabel Signifikan |
Hanya Kepuasan yang paling berpengaruh
signifikan terhadap kesuksesan |
Kepuasan dan
Persaingan berpengaruh signifikan pada kategori
Tinggi |
| Arah Pengaruh |
Kepuasan → berpengaruh
positif terhadap peluang kesuksesan |
Kepuasan → berpengaruh
positif, sedangkan Persaingan →
negatif |
| Nilai AIC (Kecocokan Model) |
Lebih kecil, menandakan model sederhana dan
efisien |
Lebih besar karena model lebih kompleks dengan banyak
kategori |
| Kestabilan Model |
Cenderung lebih stabil karena hanya dua kategori
hasil |
Lebih bervariasi karena tiap kategori memiliki hubungan
yang berbeda-beda |
4.4 Kesimpulan Umum Perbandingan
Dari perbandingan di atas dapat disimpulkan bahwa:
- Regresi logistik biner cocok untuk analisis
sederhana dengan dua hasil, menghasilkan model yang lebih stabil dan
mudah diinterpretasikan.
- Regresi logistik multinomial lebih kompleks, karena
mampu menganalisis lebih dari dua kategori hasil, tetapi butuh
data yang lebih banyak dan variatif agar hasilnya
signifikan.
- Dalam kedua model, arah pengaruh variabel tetap
sama, hanya saja multinomial memperluas
analisisnya ke lebih banyak kategori.
- Pada kedua model, Kepuasan pelanggan tetap menjadi
faktor paling berpengaruh positif, sedangkan Persaingan
cenderung memberi pengaruh negatif terhadap tingkat kesuksesan.
🟢 Garis besar:
Regresi logistik biner lebih efisien untuk kasus sederhana, sedangkan
regresi logistik multinomial memberikan pemahaman yang lebih mendalam
tentang bagaimana variabel memengaruhi berbagai tingkatan hasil.
