Regresi logistik multinomial merupakan pengembangan dari regresi
logistik biner yang digunakan ketika variabel dependen memiliki lebih
dari dua kategori dan bersifat nominal (tidak berurutan). Model ini
bertujuan untuk memperkirakan peluang suatu observasi masuk ke salah
satu kategori berdasarkan sejumlah variabel independen, baik numerik
maupun kategorikal.
Prinsip dasarnya adalah membandingkan peluang (odds) setiap kategori
terhadap kategori acuan (reference category), kemudian
mengekspresikannya dalam bentuk hubungan linier dengan variabel-variabel
prediktor.
2 Rumus Regresi Logistik
Multinomial
Secara umum, persamaan model regresi logistik multinomial untuk
kategori j (j = 1, 2, …, k-1) adalah:
dengan arti:
- P(Y=j) sebagai probabilitas bahwa Y berada pada kategori j
- P(Y=base) sebagai probabilitas kategori referensi (misal “Low”)
- β0j, β1j, …, βpj sebagai parameter model untuk kategori j
Dengan demikian, model akan menghasilkan (k-1) set koefisien.
## Advertising Salespeople Satisfaction
## Min. :1.667e+13 Min. :1.599e+12 Min. :9.721e+13
## 1st Qu.:1.329e+15 1st Qu.:1.263e+15 1st Qu.:2.352e+15
## Median :1.975e+15 Median :1.991e+15 Median :4.640e+15
## Mean :2.522e+15 Mean :1.950e+15 Mean :4.872e+15
## 3rd Qu.:2.710e+15 3rd Qu.:2.812e+15 3rd Qu.:7.364e+15
## Max. :9.692e+15 Max. :3.478e+15 Max. :9.970e+15
## Competition Success_Level
## Min. :2.485e+13 Low :66
## 1st Qu.:2.315e+15 Medium:66
## Median :4.764e+15 High :68
## Mean :4.807e+15
## 3rd Qu.:7.419e+15
## Max. :9.930e+15
yang mana artinya:
Dataset yang digunakan berisi variabel prediktor numerik
seperti:
Advertising → jumlah pengeluaran iklan,
Salespeople → jumlah tenaga penjualan,
Satisfaction → tingkat kepuasan pelanggan,
Competition → tingkat persaingan pasar.
Semua variabel ini telah dikonversi ke format numerik agar dapat
dianalisis dengan benar oleh model regresi.
Variabel target (Success_Level) memiliki tiga kategori bertingkat
(Low, Medium, High) yang merepresentasikan tingkat keberhasilan suatu
cabang, produk, atau strategi pemasaran.
3.Berdasarkan statistik deskriptif, dapat diamati apakah:
terdapat variasi cukup besar antar observasi,
-distribusi antar kategori Success_Level relatif seimbang atau tidak.
Jika salah satu kategori jauh lebih banyak, hal ini perlu diperhatikan
karena dapat memengaruhi akurasi model (class imbalance).
Kesimpulan Awal: Data sudah bersih dan siap untuk digunakan dalam
proses pemodelan regresi logistik multinomial. Tahap eksplorasi ini
penting agar analisis yang dilakukan pada langkah berikutnya
(pembangunan model) memiliki dasar data yang valid dan konsisten.
3.2 Pembangunan Model
Regresi Logistik Multinomial
## # weights: 18 (10 variable)
## initial value 219.722458
## final value 219.722458
## converged
Tabel 3. Odds Ratio dari Model Regresi Logistik
Multinomial
(Intercept)
Advertising
Salespeople
Satisfaction
Competition
Medium
1
1
1
1
1
High
1
1
1
1
1
##
## Interpretasi Umum:
## - Nilai exp(koefisien) > 1 menunjukkan peningkatan peluang masuk ke kategori tersebut dibanding kategori referensi (Low).
## - Nilai exp(koefisien) < 1 menunjukkan penurunan peluang relatif terhadap kategori referensi.
3.4 Evaluasi Model
Tabel 4. Matriks Kebingungan Model Multinomial Logistic
Regression
Low
Medium
High
Low
35
23
22
Medium
0
0
0
High
31
43
46
##
## Akurasi Model: 40.5 %
3.5 Visualisasi
Hasil
3.6 Kesimpulan
Model regresi logistik multinomial menunjukkan hubungan antara
faktor-faktor seperti Advertising, Salespeople, Satisfaction, dan
Competition terhadap peluang keberhasilan perusahaan.
Model ini dapat memprediksi probabilitas masing-masing kategori
keberhasilan (Low, Medium, High) dan memberikan insight mengenai
pengaruh setiap faktor terhadap keberhasilan bisnis.
Secara umum: - Peningkatan nilai Advertising dan Satisfaction
cenderung meningkatkan peluang masuk ke kategori Medium dan High. -
Faktor Competition yang terlalu tinggi dapat menurunkan peluang
keberhasilan. - Model memberikan gambaran probabilistik, bukan hasil
pasti, sehingga berguna untuk pengambilan keputusan berbasis data.
4 Referensi
Liang, J., Bi, G., & Zhan, C. (2019). Multinomial and ordinal
logistic regression analyses with multi-categorical variables using R.
Frontiers in Public Health.
Pate, A., Riley, R.D., Collins, G.S., van Smeden, M., Ensor, J.,
& Martin, G.P. (2022). Minimum sample size for developing a
multivariable prediction model using multinomial logistic regression.
arXiv preprint.