Regresi Logistik Multinomial
Analisis dan Model Prediksi
—- Regresi Logistik Multinomial —-
Pengertian Regresi Logistik Multinomial
Regresi logistik multinomial digunakan ketika variabel dependen (Y) memiliki lebih dari dua kategori dan tidak memiliki urutan alami (non-ordinal). Model ini merupakan perluasan dari regresi logistik biner.
Contoh: Dalam dataset ini, variabel dependen adalah “Success_Level”
(Low, Medium, High) yang ingin diprediksi berdasarkan faktor
Advertising, Salespeople, Satisfaction, dan Competition.
Model ini memprediksi peluang suatu observasi termasuk ke dalam
masing-masing kategori tersebut.
Rumus Regresi Logistik Multinomial
Secara umum, rumus regresi logistik multinomial untuk kategori j (j = 1, 2, …, k-1) adalah:
\[log( \frac{P(Y=j)}{P(Y=base)} ) = β0j + β1jX1 + β2jX2 + ... + βpjXp\]
di mana:
- P(Y=j) adalah probabilitas bahwa Y berada pada kategori j
- P(Y=base) adalah probabilitas kategori referensi (misal “Low”)
- β0j, β1j, …, βpj adalah parameter model untuk kategori j
Dengan demikian, model akan menghasilkan (k-1) set koefisien.
Kegunaan Regresi Logistik Multinomial
- Memprediksi kategori hasil dengan lebih dari dua kelas.
- Menganalisis pengaruh variabel independen terhadap peluang masuk ke
kategori tertentu.
- Contoh: prediksi tingkat kesuksesan, preferensi produk, status pekerjaan, dsb.
Import dan Eksplorasi Dataset
## Struktur Dataset:
## tibble [200 × 5] (S3: tbl_df/tbl/data.frame)
## $ Advertising : num [1:200] 1.22e+15 2.47e+15 1.52e+14 2.71e+15 2.85e+15 ...
## $ Salespeople : num [1:200] 1.60e+15 3.41e+15 2.50e+15 2.29e+15 2.01e+15 ...
## $ Satisfaction : num [1:200] 9.87e+15 2.23e+15 9.15e+15 6.19e+15 4.56e+15 ...
## $ Competition : num [1:200] 3.14e+15 7.18e+15 3.03e+15 3.87e+15 2.57e+14 ...
## $ Success_Level: Factor w/ 3 levels "Low","Medium",..: 1 3 2 3 3 1 2 2 1 1 ...
##
## Ringkasan Statistik Dataset:
## Advertising Salespeople Satisfaction
## Min. :1.667e+13 Min. :1.599e+12 Min. :9.721e+13
## 1st Qu.:1.329e+15 1st Qu.:1.263e+15 1st Qu.:2.352e+15
## Median :1.975e+15 Median :1.991e+15 Median :4.640e+15
## Mean :2.522e+15 Mean :1.950e+15 Mean :4.872e+15
## 3rd Qu.:2.710e+15 3rd Qu.:2.812e+15 3rd Qu.:7.364e+15
## Max. :9.692e+15 Max. :3.478e+15 Max. :9.970e+15
## Competition Success_Level
## Min. :2.485e+13 Low :66
## 1st Qu.:2.315e+15 Medium:66
## Median :4.764e+15 High :68
## Mean :4.807e+15
## 3rd Qu.:7.419e+15
## Max. :9.930e+15
| Advertising | Salespeople | Satisfaction | Competition | Success_Level |
|---|---|---|---|---|
| 1.218944e+15 | 1.596815e+15 | 9.874489e+15 | 3.135067e+15 | Low |
| 2.470763e+15 | 3.405897e+15 | 2.233607e+15 | 7.178413e+15 | High |
| 1.522442e+14 | 2.503414e+15 | 9.147786e+15 | 3.032366e+15 | Medium |
| 2.707544e+15 | 2.287574e+15 | 6.186717e+15 | 3.866451e+15 | High |
| 2.851168e+15 | 2.006433e+15 | 4.559040e+15 | 2.565854e+14 | High |
| 6.138912e+15 | 3.200616e+14 | 5.048222e+15 | 8.212866e+15 | Low |
| 1.820264e+15 | 1.910230e+15 | 7.358517e+15 | 2.316539e+15 | Medium |
| 2.731048e+15 | 1.720598e+15 | 1.742525e+15 | 8.404457e+15 | Medium |
| 1.878588e+15 | 1.426613e+15 | 4.053813e+15 | 3.978980e+15 | Low |
| 1.641537e+15 | 1.430429e+15 | 7.127088e+14 | 4.367524e+15 | Low |
Pembangunan Model Regresi Logistik Multinomial
## # weights: 18 (10 variable)
## initial value 219.722458
## final value 219.722458
## converged
## Call:
## multinom(formula = Success_Level ~ Advertising + Salespeople +
## Satisfaction + Competition, data = data_multinomial)
##
## Coefficients:
## (Intercept) Advertising Salespeople Satisfaction Competition
## Medium -2.345625e-32 -6.294079e-16 2.166003e-16 -5.775766e-16 -1.128020e-16
## High 4.691250e-32 -7.918943e-16 8.561553e-16 4.864593e-16 -3.219946e-16
##
## Std. Errors:
## (Intercept) Advertising Salespeople Satisfaction Competition
## Medium NaN 4.226550e-16 4.748291e-16 3.951824e-16 1.757905e-16
## High 1.273623e-31 1.316661e-16 1.807983e-16 8.430739e-17 6.919014e-17
##
## Residual Deviance: 439.4449
## AIC: 459.4449
Interpretasi Koefisien
| (Intercept) | Advertising | Salespeople | Satisfaction | Competition | |
|---|---|---|---|---|---|
| Medium | 1 | 1 | 1 | 1 | 1 |
| High | 1 | 1 | 1 | 1 | 1 |
Interpretasi Umum:
- Nilai exp(koefisien) > 1 menunjukkan peningkatan peluang masuk ke
kategori tersebut dibanding kategori referensi (Low).
- Nilai exp(koefisien) < 1 menunjukkan penurunan peluang relatif
terhadap kategori referensi.
Evaluasi Model
| Low | Medium | High | |
|---|---|---|---|
| Low | 35 | 23 | 22 |
| Medium | 0 | 0 | 0 |
| High | 31 | 43 | 46 |
##
## Akurasi Model: 40.5 %
Visualisasi Hasil
Visualisasi Hubungan antara Advertising Budget dan Probabilitas Success_Level
Interpretasi:
1. Ketika nilai Advertising rendah, sebagian besar probabilitas berada
di kategori Low — artinya perusahaan dengan biaya promosi kecil
cenderung memiliki tingkat keberhasilan rendah.
2. Saat Advertising meningkat ke level menengah, probabilitas kategori
Medium mulai naik — menggambarkan transisi bahwa peningkatan promosi
bisa meningkatkan peluang keberhasilan sedang.
3. Pada nilai Advertising yang sangat tinggi, probabilitas kategori High
menjadi dominan — artinya semakin besar dana promosi, semakin tinggi
kemungkinan keberhasilan perusahaan.
4. Garis tren yang halus memperlihatkan bahwa hubungan antar kategori
tidak linear sempurna, ada variasi antar titik (noise), tetapi pola
umumnya tetap konsisten.
Visualisasi Hubungan antara Salespeople dan Probabilitas Success_Level
Interpretasi:
1. Ketika jumlah Salespeople (tenaga penjualan) masih sedikit,
probabilitas kategori Low cenderung paling tinggi — menunjukkan
keterbatasan tenaga kerja memengaruhi performa perusahaan.
2. Saat jumlah Salespeople naik ke tingkat menengah, kategori Medium
mulai meningkat — mengindikasikan penguatan penjualan berdampak positif
pada hasil.
3. Pada jumlah tenaga penjualan yang besar, kategori High menjadi
dominan — banyaknya tim penjualan mampu meningkatkan keberhasilan
perusahaan secara signifikan.
4. Garis tren menunjukkan peningkatan yang stabil, menandakan hubungan
positif yang cukup kuat antara jumlah tenaga penjualan dan tingkat
keberhasilan.
Visualisasi Hubungan antara Satisfaction dan Probabilitas Success_Level
Interpretasi:
1. Ketika tingkat Satisfaction (kepuasan pelanggan) rendah, probabilitas
kategori Low sangat tinggi — artinya perusahaan dengan pelanggan tidak
puas cenderung gagal mencapai keberhasilan.
2. Pada tingkat kepuasan menengah, kategori Medium mulai meningkat —
menunjukkan efek positif dari peningkatan kepuasan terhadap kinerja
perusahaan.
3. Saat tingkat kepuasan tinggi, probabilitas kategori High mendominasi
— pelanggan yang puas kuat kaitannya dengan keberhasilan tinggi.
4. Tren keseluruhan memperlihatkan hubungan positif yang sangat jelas:
semakin tinggi kepuasan pelanggan, semakin tinggi kemungkinan
sukses.
Visualisasi Hubungan antara Competition dan Probabilitas Success_Level
Interpretasi:
1. Ketika tingkat Competition rendah, probabilitas kategori High lebih
tinggi — artinya perusahaan lebih mudah sukses ketika pesaing
sedikit.
2. Pada tingkat kompetisi menengah, kategori Medium cenderung meningkat
— menandakan persaingan moderat masih bisa dihadapi dengan strategi yang
baik.
3. Ketika tingkat kompetisi sangat tinggi, kategori Low menjadi dominan
— semakin ketat persaingan, semakin sulit perusahaan mencapai
keberhasilan tinggi.
4. Garis tren memperlihatkan arah negatif yang jelas: meningkatnya
kompetisi menurunkan peluang keberhasilan perusahaan.
Kesimpulan Umum
- Advertising, Salespeople, dan Satisfaction memiliki pengaruh positif
terhadap keberhasilan.
- Competition memiliki pengaruh negatif terhadap keberhasilan.
- Pola hubungan antar variabel tidak selalu linear sempurna, namun
tren keseluruhannya konsisten.
- Strategi terbaik perusahaan adalah meningkatkan promosi, memperkuat tim penjualan, menjaga kepuasan pelanggan, dan beradaptasi dalam pasar yang kompetitif.
Pembangunan Model Regresi Logistik Multinomial
Model regresi logistik multinomial menunjukkan hubungan antara faktor-faktor seperti Advertising, Salespeople, Satisfaction, dan Competition terhadap peluang keberhasilan perusahaan. Model ini dapat memprediksi probabilitas masing-masing kategori keberhasilan (Low, Medium, High) dan memberikan insight mengenai pengaruh setiap faktor terhadap keberhasilan bisnis.