Regresi Logistik Multinomial

Analisis dan Model Prediksi

—- Regresi Logistik Multinomial —-

Pengertian Regresi Logistik Multinomial

Regresi logistik multinomial digunakan ketika variabel dependen (Y) memiliki lebih dari dua kategori dan tidak memiliki urutan alami (non-ordinal). Model ini merupakan perluasan dari regresi logistik biner.

Contoh: Dalam dataset ini, variabel dependen adalah “Success_Level” (Low, Medium, High) yang ingin diprediksi berdasarkan faktor Advertising, Salespeople, Satisfaction, dan Competition.
Model ini memprediksi peluang suatu observasi termasuk ke dalam masing-masing kategori tersebut.

Rumus Regresi Logistik Multinomial

Secara umum, rumus regresi logistik multinomial untuk kategori j (j = 1, 2, …, k-1) adalah:

\[log( \frac{P(Y=j)}{P(Y=base)} ) = β0j + β1jX1 + β2jX2 + ... + βpjXp\]

di mana:
- P(Y=j) adalah probabilitas bahwa Y berada pada kategori j
- P(Y=base) adalah probabilitas kategori referensi (misal “Low”)
- β0j, β1j, …, βpj adalah parameter model untuk kategori j

Dengan demikian, model akan menghasilkan (k-1) set koefisien.

Kegunaan Regresi Logistik Multinomial

  • Memprediksi kategori hasil dengan lebih dari dua kelas.
  • Menganalisis pengaruh variabel independen terhadap peluang masuk ke kategori tertentu.
  • Contoh: prediksi tingkat kesuksesan, preferensi produk, status pekerjaan, dsb.

Import dan Eksplorasi Dataset

## Struktur Dataset:
## tibble [200 × 5] (S3: tbl_df/tbl/data.frame)
##  $ Advertising  : num [1:200] 1.22e+15 2.47e+15 1.52e+14 2.71e+15 2.85e+15 ...
##  $ Salespeople  : num [1:200] 1.60e+15 3.41e+15 2.50e+15 2.29e+15 2.01e+15 ...
##  $ Satisfaction : num [1:200] 9.87e+15 2.23e+15 9.15e+15 6.19e+15 4.56e+15 ...
##  $ Competition  : num [1:200] 3.14e+15 7.18e+15 3.03e+15 3.87e+15 2.57e+14 ...
##  $ Success_Level: Factor w/ 3 levels "Low","Medium",..: 1 3 2 3 3 1 2 2 1 1 ...
## 
## Ringkasan Statistik Dataset:
##   Advertising         Salespeople         Satisfaction      
##  Min.   :1.667e+13   Min.   :1.599e+12   Min.   :9.721e+13  
##  1st Qu.:1.329e+15   1st Qu.:1.263e+15   1st Qu.:2.352e+15  
##  Median :1.975e+15   Median :1.991e+15   Median :4.640e+15  
##  Mean   :2.522e+15   Mean   :1.950e+15   Mean   :4.872e+15  
##  3rd Qu.:2.710e+15   3rd Qu.:2.812e+15   3rd Qu.:7.364e+15  
##  Max.   :9.692e+15   Max.   :3.478e+15   Max.   :9.970e+15  
##   Competition        Success_Level
##  Min.   :2.485e+13   Low   :66    
##  1st Qu.:2.315e+15   Medium:66    
##  Median :4.764e+15   High  :68    
##  Mean   :4.807e+15                
##  3rd Qu.:7.419e+15                
##  Max.   :9.930e+15
Tabel 1. Tabel Dataset Regresi Logistik Multinomial
Advertising Salespeople Satisfaction Competition Success_Level
1.218944e+15 1.596815e+15 9.874489e+15 3.135067e+15 Low
2.470763e+15 3.405897e+15 2.233607e+15 7.178413e+15 High
1.522442e+14 2.503414e+15 9.147786e+15 3.032366e+15 Medium
2.707544e+15 2.287574e+15 6.186717e+15 3.866451e+15 High
2.851168e+15 2.006433e+15 4.559040e+15 2.565854e+14 High
6.138912e+15 3.200616e+14 5.048222e+15 8.212866e+15 Low
1.820264e+15 1.910230e+15 7.358517e+15 2.316539e+15 Medium
2.731048e+15 1.720598e+15 1.742525e+15 8.404457e+15 Medium
1.878588e+15 1.426613e+15 4.053813e+15 3.978980e+15 Low
1.641537e+15 1.430429e+15 7.127088e+14 4.367524e+15 Low

Pembangunan Model Regresi Logistik Multinomial

## # weights:  18 (10 variable)
## initial  value 219.722458 
## final  value 219.722458 
## converged
## Call:
## multinom(formula = Success_Level ~ Advertising + Salespeople + 
##     Satisfaction + Competition, data = data_multinomial)
## 
## Coefficients:
##          (Intercept)   Advertising  Salespeople  Satisfaction   Competition
## Medium -2.345625e-32 -6.294079e-16 2.166003e-16 -5.775766e-16 -1.128020e-16
## High    4.691250e-32 -7.918943e-16 8.561553e-16  4.864593e-16 -3.219946e-16
## 
## Std. Errors:
##         (Intercept)  Advertising  Salespeople Satisfaction  Competition
## Medium          NaN 4.226550e-16 4.748291e-16 3.951824e-16 1.757905e-16
## High   1.273623e-31 1.316661e-16 1.807983e-16 8.430739e-17 6.919014e-17
## 
## Residual Deviance: 439.4449 
## AIC: 459.4449

Interpretasi Koefisien

Tabel 3. Odds Ratio dari Model Regresi Logistik Multinomial
(Intercept) Advertising Salespeople Satisfaction Competition
Medium 1 1 1 1 1
High 1 1 1 1 1

Interpretasi Umum:
- Nilai exp(koefisien) > 1 menunjukkan peningkatan peluang masuk ke kategori tersebut dibanding kategori referensi (Low).
- Nilai exp(koefisien) < 1 menunjukkan penurunan peluang relatif terhadap kategori referensi.

Evaluasi Model

Tabel 4. Matriks Kebingungan Model Multinomial Logistic Regression
Low Medium High
Low 35 23 22
Medium 0 0 0
High 31 43 46
## 
## Akurasi Model: 40.5 %

Visualisasi Hasil

Visualisasi Hubungan antara Advertising Budget dan Probabilitas Success_Level

Interpretasi:
1. Ketika nilai Advertising rendah, sebagian besar probabilitas berada di kategori Low — artinya perusahaan dengan biaya promosi kecil cenderung memiliki tingkat keberhasilan rendah.
2. Saat Advertising meningkat ke level menengah, probabilitas kategori Medium mulai naik — menggambarkan transisi bahwa peningkatan promosi bisa meningkatkan peluang keberhasilan sedang.
3. Pada nilai Advertising yang sangat tinggi, probabilitas kategori High menjadi dominan — artinya semakin besar dana promosi, semakin tinggi kemungkinan keberhasilan perusahaan.
4. Garis tren yang halus memperlihatkan bahwa hubungan antar kategori tidak linear sempurna, ada variasi antar titik (noise), tetapi pola umumnya tetap konsisten.

Visualisasi Hubungan antara Salespeople dan Probabilitas Success_Level

Interpretasi:
1. Ketika jumlah Salespeople (tenaga penjualan) masih sedikit, probabilitas kategori Low cenderung paling tinggi — menunjukkan keterbatasan tenaga kerja memengaruhi performa perusahaan.
2. Saat jumlah Salespeople naik ke tingkat menengah, kategori Medium mulai meningkat — mengindikasikan penguatan penjualan berdampak positif pada hasil.
3. Pada jumlah tenaga penjualan yang besar, kategori High menjadi dominan — banyaknya tim penjualan mampu meningkatkan keberhasilan perusahaan secara signifikan.
4. Garis tren menunjukkan peningkatan yang stabil, menandakan hubungan positif yang cukup kuat antara jumlah tenaga penjualan dan tingkat keberhasilan.

Visualisasi Hubungan antara Satisfaction dan Probabilitas Success_Level

Interpretasi:
1. Ketika tingkat Satisfaction (kepuasan pelanggan) rendah, probabilitas kategori Low sangat tinggi — artinya perusahaan dengan pelanggan tidak puas cenderung gagal mencapai keberhasilan.
2. Pada tingkat kepuasan menengah, kategori Medium mulai meningkat — menunjukkan efek positif dari peningkatan kepuasan terhadap kinerja perusahaan.
3. Saat tingkat kepuasan tinggi, probabilitas kategori High mendominasi — pelanggan yang puas kuat kaitannya dengan keberhasilan tinggi.
4. Tren keseluruhan memperlihatkan hubungan positif yang sangat jelas: semakin tinggi kepuasan pelanggan, semakin tinggi kemungkinan sukses.

Visualisasi Hubungan antara Competition dan Probabilitas Success_Level

Interpretasi:
1. Ketika tingkat Competition rendah, probabilitas kategori High lebih tinggi — artinya perusahaan lebih mudah sukses ketika pesaing sedikit.
2. Pada tingkat kompetisi menengah, kategori Medium cenderung meningkat — menandakan persaingan moderat masih bisa dihadapi dengan strategi yang baik.
3. Ketika tingkat kompetisi sangat tinggi, kategori Low menjadi dominan — semakin ketat persaingan, semakin sulit perusahaan mencapai keberhasilan tinggi.
4. Garis tren memperlihatkan arah negatif yang jelas: meningkatnya kompetisi menurunkan peluang keberhasilan perusahaan.

Kesimpulan Umum

  1. Advertising, Salespeople, dan Satisfaction memiliki pengaruh positif terhadap keberhasilan.
  2. Competition memiliki pengaruh negatif terhadap keberhasilan.
  3. Pola hubungan antar variabel tidak selalu linear sempurna, namun tren keseluruhannya konsisten.
  4. Strategi terbaik perusahaan adalah meningkatkan promosi, memperkuat tim penjualan, menjaga kepuasan pelanggan, dan beradaptasi dalam pasar yang kompetitif.

Pembangunan Model Regresi Logistik Multinomial

Model regresi logistik multinomial menunjukkan hubungan antara faktor-faktor seperti Advertising, Salespeople, Satisfaction, dan Competition terhadap peluang keberhasilan perusahaan. Model ini dapat memprediksi probabilitas masing-masing kategori keberhasilan (Low, Medium, High) dan memberikan insight mengenai pengaruh setiap faktor terhadap keberhasilan bisnis.