Tugas Individu

Regresi Logistik Multinomial

Foto Diri


Regresi Logistik Multinomial

1. Konsep Dasar

1.1 Pengertian Regresi Logistik Multinomial

Regresi Logistik Multinomial adalah salah satu metode analisis statistik yang digunakan untuk memprediksi kemungkinan (peluang) dari suatu kejadian yang memiliki lebih dari dua hasil atau kategori.

Model ini merupakan pengembangan dari regresi logistik biner, yang awalnya hanya bisa digunakan untuk memprediksi hasil dengan dua kemungkinan saja, seperti ya/tidak, sukses/gagal, atau membeli/tidak membeli.

Dalam regresi logistik multinomial, hasil yang ingin diprediksi bisa memiliki tiga atau lebih pilihan, contohnya:

  • Tingkat kesuksesan bisnis: rendah, sedang, atau tinggi
  • Kepuasan pelanggan: kurang puas, puas, atau sangat puas
  • Keputusan konsumen: tidak membeli, menimbang, atau membeli

Tujuan utama dari model ini adalah untuk mengetahui faktor-faktor mana yang paling berpengaruh terhadap peluang terjadinya suatu kategori hasil tertentu. Artinya, kita bisa melihat bagaimana variabel-variabel seperti iklan, tenaga penjualan, atau kepuasan pelanggan dapat meningkatkan peluang keberhasilan suatu usaha.

Secara sederhana, regresi logistik multinomial membantu kita memahami hubungan antara beberapa faktor (variabel bebas) dengan kemungkinan suatu hasil (variabel terikat) yang memiliki lebih dari dua pilihan.

Model ini bekerja dengan cara membandingkan setiap kategori hasil terhadap satu kategori yang dijadikan acuan (base category). Melalui perbandingan ini, kita bisa melihat seberapa besar kemungkinan suatu data termasuk dalam kategori tertentu dibanding kategori acuan tersebut.

Dengan kata lain, regresi logistik multinomial memungkinkan kita untuk:

  • Memprediksi peluang terjadinya berbagai tingkat hasil
  • Mengetahui pengaruh masing-masing faktor terhadap setiap tingkat hasil
  • Membantu pengambilan keputusan berdasarkan data dan analisis probabilitas

1.2 Penjelasan Rumus Regresi Logistik Multinomial

Rumus umum regresi logistik multinomial dapat dituliskan sebagai berikut:

\[ \ln\left(\frac{P(Y = j)}{P(Y = \text{dasar})}\right) = \beta_{0j} + \beta_{1j}X_1 + \beta_{2j}X_2 + \beta_{3j}X_3 + \beta_{4j}X_4 \]

dengan:

  • ( \(P(Y = j)\) ) : peluang bahwa suatu observasi (misalnya perusahaan) termasuk dalam kategori j (misalnya “Sedang” atau “Tinggi”),
  • ( \(P(Y = \text{dasar})\) ) : peluang observasi termasuk kategori dasar (misalnya “Rendah”),
  • ( \(\beta_{0j}\) ) : konstanta (nilai dasar tanpa pengaruh variabel lain),
  • ( \(\beta_{1j}, \beta_{2j}, \beta_{3j}, \beta_{4j}\) ) : koefisien yang menunjukkan besar dan arah pengaruh dari masing-masing variabel,
  • ( \(X_1, X_2, X_3, X_4\) ) : variabel bebas yang memengaruhi hasil.

1.2.1 Contoh Penerapan pada Dataset Tingkat Kesuksesan Penjualan Berdasarkan Berbagai Faktor

Dalam penelitian ini, variabel bebas yang digunakan terdiri dari:

Simbol Variabel Keterangan
( \(X_1\) ) Periklanan Jumlah dana yang digunakan untuk promosi
( \(X_2\) ) Tenaga Penjualan Jumlah karyawan bagian penjualan
( \(X_3\) ) Kepuasan Tingkat kepuasan pelanggan
( \(X_4\) ) Persaingan Tingkat persaingan antar perusahaan
( \(Y\) ) Tingkat Kesuksesan Kategori: Rendah, Sedang, atau Tinggi

Karena variabel terikat (Tingkat Kesuksesan) memiliki tiga kategori, maka model akan membentuk dua persamaan logit, dengan kategori dasar (pembanding) adalah “Rendah”.

Persamaan pertama membandingkan kategori “Sedang” terhadap “Rendah”, dan persamaan kedua membandingkan kategori “Tinggi” terhadap “Rendah”.

1⃣ Persamaan untuk kategori “Sedang” dibanding “Rendah”

\[ \ln\left(\frac{P(Y = \text{Sedang})}{P(Y = \text{Rendah})}\right) = \beta_{0,sed} + \beta_{1,sed}(Periklanan) + \beta_{2,sed}(Tenaga\ Penjualan) + \beta_{3,sed}(Kepuasan) + \beta_{4,sed}(Persaingan) \]

Artinya: persamaan ini menggambarkan seberapa besar kemungkinan perusahaan memiliki tingkat kesuksesan “Sedang” dibanding “Rendah”, berdasarkan empat faktor di atas.

2⃣ Persamaan untuk kategori “Tinggi” dibanding “Rendah”

\[ \ln\left(\frac{P(Y = \text{Tinggi})}{P(Y = \text{Rendah})}\right) = \beta_{0,ting} + \beta_{1,ting}(Periklanan) + \beta_{2,ting}(Tenaga\ Penjualan) + \beta_{3,ting}(Kepuasan) + \beta_{4,ting}(Persaingan) \]

Artinya: persamaan ini menunjukkan kemungkinan perusahaan mencapai kesuksesan “Tinggi” dibanding “Rendah”, tergantung dari seberapa besar nilai iklan, tenaga penjualan, kepuasan, dan persaingan yang dimilikinya.

1.2.2 Makna Rumus dalam Konteks Data

Secara sederhana, rumus tersebut berfungsi untuk menghitung peluang suatu perusahaan masuk dalam kategori kesuksesan tertentu berdasarkan nilai dari variabel-variabelnya.

  • Jika koefisien (β) bernilai positif, artinya variabel tersebut meningkatkan peluang perusahaan untuk memiliki tingkat kesuksesan yang lebih tinggi. Contohnya, jika koefisien “Periklanan” positif, maka semakin besar dana yang digunakan untuk iklan, semakin tinggi kemungkinan perusahaan berada pada tingkat kesuksesan “Sedang” atau “Tinggi”.

  • Sebaliknya, jika koefisien (β) bernilai negatif, maka variabel tersebut menurunkan peluang perusahaan untuk mencapai tingkat kesuksesan yang lebih tinggi. Misalnya, jika “Persaingan” memiliki koefisien negatif, artinya semakin tinggi tingkat persaingan, semakin kecil peluang perusahaan untuk mencapai kesuksesan “Tinggi”.


2.Penerapan Regresi Logistik Multinomial

Dalam tugas kali ini, digunakan analisis regresi logistik multinomial untuk mengetahui faktor-faktor yang memengaruhi tingkat kesuksesan suatu usaha atau perusahaan. Data yang digunakan berisi beberapa variabel yang dianggap dapat memengaruhi hasil akhir (tingkat kesuksesan), yaitu:

  • Periklanan → seberapa besar upaya promosi yang dilakukan,
  • Tenaga Penjualan → seberapa banyak tenaga yang terlibat dalam proses penjualan(sales-nya),
  • Kepuasan → seberapa puas pelanggan terhadap produk atau layanan,
  • Persaingan → seberapa besar tekanan dari pesaing di pasar.

Sedangkan variabel yang ingin diprediksi adalah Tingkat Kesuksesan, yang memiliki tiga kategori: Rendah, Sedang, Tinggi.

Dengan menggunakan regresi logistik multinomial, analisis ini bertujuan untuk:

  1. Mengetahui pengaruh masing-masing faktor terhadap peluang suatu usaha berada pada tingkat kesuksesan tertentu.
  2. Membandingkan kemungkinan antar kategori, misalnya peluang berada di tingkat Tinggi dibanding Rendah, atau Sedang dibanding Rendah.
  3. Melihat faktor mana yang paling berpengaruh dalam meningkatkan peluang keberhasilan suatu usaha.

2.1 Menampilkan Data Regresi Logisti Multinomial (Pengaruh Faktor dalam Penjualan Penjualan terhadap Kesuksesan)

2.2 Pembangunan Model Regresi Logistik Multinomial

2.2.1. Menampilkan Kode untuk Model Regresi Logistik Multinomial

# 1. Panggil library yang dibutuhkan
library(nnet)    # untuk fungsi multinom()
library(dplyr)   # untuk olah data

# 2. Baca file CSV
data <- read.csv("data multinomial logistics regression 2.csv",
                 stringsAsFactors = FALSE,
                 colClasses = "character",
                 check.names = FALSE)

# 3. Ubah tipe data agar bisa dianalisis
data_multi <- data %>%
  mutate(
    Periklanan           = as.numeric(gsub("\\.", "", Periklanan)),
    `Tenaga Penjualan`   = as.numeric(gsub("\\.", "", `Tenaga Penjualan`)),
    Kepuasan             = as.numeric(gsub("\\.", "", Kepuasan)),
    Persaingan           = as.numeric(gsub("\\.", "", Persaingan)),
    `Tingkat Kesuksesan` = factor(`Tingkat Kesuksesan`,
                                  levels = c("Rendah", "Sedang", "Tinggi"))
  )

# 4. Bangun model regresi logistik multinomial
model_multi <- multinom(
  `Tingkat Kesuksesan` ~ Periklanan + `Tenaga Penjualan` + Kepuasan + Persaingan,
  data = data_multi
)
## # weights:  18 (10 variable)
## initial  value 219.722458 
## final  value 219.722458 
## converged
# 5. Tampilkan ringkasan model
summary(model_multi)
## Call:
## multinom(formula = `Tingkat Kesuksesan` ~ Periklanan + `Tenaga Penjualan` + 
##     Kepuasan + Persaingan, data = data_multi)
## 
## Coefficients:
##          (Intercept)    Periklanan `Tenaga Penjualan`      Kepuasan
## Sedang -4.691250e-33 -1.824321e-17      -1.026521e-17 -5.885049e-17
## Tinggi  9.382499e-33 -1.670891e-16       2.442452e-16  1.676947e-16
##           Persaingan
## Sedang  1.024808e-16
## Tinggi -1.912334e-16
## 
## Std. Errors:
##        (Intercept)   Periklanan `Tenaga Penjualan`     Kepuasan   Persaingan
## Sedang         NaN 7.482794e-17       1.424806e-16 5.808512e-17 5.590177e-17
## Tinggi         NaN 8.683027e-17       1.501287e-16 5.901390e-17 6.282393e-17
## 
## Residual Deviance: 439.4449 
## AIC: 459.4449
# 6. Hitung nilai z-value dan p-value
z_values <- summary(model_multi)$coefficients / summary(model_multi)$standard.errors
p_values <- 2 * (1 - pnorm(abs(z_values)))

hasil_model <- cbind(
  "z-value" = round(z_values, 3),
  "p-value" = round(p_values, 4)
)

# 7. Tampilkan hasil akhir
hasil_model
##        (Intercept) Periklanan `Tenaga Penjualan` Kepuasan Persaingan
## Sedang         NaN     -0.244             -0.072   -1.013      1.833
## Tinggi         NaN     -1.924              1.627    2.842     -3.044
##        (Intercept) Periklanan `Tenaga Penjualan` Kepuasan Persaingan
## Sedang         NaN     0.8074             0.9426   0.3110     0.0668
## Tinggi         NaN     0.0543             0.1038   0.0045     0.0023

2.2.2 Interpretasi Output Model

Model yang dijalankan sudah berhasil (converged), artinya programnya bisa selesai menghitung. Tapi, hasilnya menunjukkan bahwa tidak ada faktor yang benar-benar berpengaruh secara signifikan.

Mari lihat satu per satu hasilnya :

a.Tabel Koefisien

Kategori Variabel Nilai Koefisien Arti Singkat
Sedang Periklanan -0.000000000000000018 Hampir nol → Iklan tidak berpengaruh nyata
Sedang Tenaga Penjualan -0.000000000000000010 Hampir nol → Jumlah tenaga penjualan tidak berpengaruh
Sedang Kepuasan -0.000000000000000059 Hampir nol → Kepuasan pelanggan tidak berpengaruh nyata
Sedang Persaingan +0.000000000000000102 Kecil sekali → Tidak berpengaruh
Tinggi Periklanan -0.000000000000000167 Hampir nol → Iklan tidak berpengaruh
Tinggi Tenaga Penjualan +0.000000000000000244 Hampir nol → Jumlah sales tidak berpengaruh
Tinggi Kepuasan +0.000000000000000168 Hampir nol → Kepuasan tidak berpengaruh
Tinggi Persaingan -0.000000000000000191 Hampir nol → Persaingan tidak berpengaruh

Semua angka ini sangat-sangat kecil (mendekati nol), artinya tidak ada hubungan nyata antara variabel-variabel tersebut dengan “Tingkat Kesuksesan”.

b. Standard Error

Hasilnya seperti ini:

Kategori Variabel Standard Error
Sedang Periklanan 0.000000000000000074
Sedang Tenaga Penjualan 0.000000000000000142
Sedang Kepuasan 0.000000000000000058
Sedang Persaingan 0.000000000000000055
Tinggi Periklanan 0.000000000000000086
Tinggi Tenaga Penjualan 0.000000000000000150
Tinggi Kepuasan 0.000000000000000059
Tinggi Persaingan 0.000000000000000062

Ada juga beberapa NaN (Not a Number) di bagian intercept, artinya:

Model tidak bisa menghitung karena datanya terlalu mirip antar kategori (Rendah–Sedang–Tinggi).

yang artinya:

Data terlalu “seragam” — sehingga model bingung membedakan mana usaha yang benar-benar rendah, sedang, atau tinggi.

c.Residual Deviance dan AIC

Istilah Nilai Arti Sederhana
Residual Deviance 439.44 Semakin kecil nilainya semakin baik. Nilai ini masih cukup besar → model belum cocok dengan data.
AIC 459.44 Digunakan untuk membandingkan model. Nilai besar berarti modelnya belum bagus.

Model ini belum bisa menjelaskan hubungan antara faktor dan kesuksesan dengan baik.

d.Nilai z-value dan p-value

Ini digunakan untuk melihat apakah pengaruh tiap variabel signifikan atau tidak.

Contoh hasilnya:

Kategori Variabel z-value p-value
Sedang Periklanan -0.244 0.8074
Sedang Tenaga Penjualan -0.072 0.9426
Sedang Kepuasan -1.013 0.3110
Sedang Persaingan 1.833 0.0668
Tinggi Periklanan -1.924 0.0543
Tinggi Tenaga Penjualan 1.627 0.1038
Tinggi Kepuasan 2.842 0.0045
Tinggi Persaingan -3.044 0.0023

Aturan sederhananya:

  • Jika p-value < 0.05, berarti signifikan (berpengaruh nyata)
  • Jika p-value > 0.05, berarti tidak signifikan

Dari hasil di atas:

  • Untuk kategori Sedang, semua p-value > 0.05 → tidak ada pengaruh signifikan.
  • Untuk kategori Tinggi, hanya Kepuasan (0.0045) dan Persaingan (0.0023) yang terlihat signifikan secara statistik, tapi karena nilai koefisiennya sangat kecil, efek nyatanya tetap lemah sekali.

Kesimpulan Akhir

Peneliti membangun model multinomial logistic regression untuk memprediksi tingkat kesuksesan berdasarkan faktor periklanan, tenaga penjualan, kepuasan pelanggan, dan persaingan. Model telah berhasil dijalankan (ditandai dengan status converged), namun hasilnya menunjukkan bahwa:

  1. Nilai koefisien semua variabel sangat kecil. Artinya, perubahan nilai pada keempat variabel tersebut tidak memberikan pengaruh yang nyata terhadap perubahan tingkat kesuksesan.

  2. Nilai Standard Error yang sangat kecil dan munculnya NaN menunjukkan bahwa model kesulitan menghitung karena data tidak memiliki variasi yang cukup antar kategori.

  3. Nilai Residual Deviance sebesar 439.44 dan AIC sebesar 459.44 menunjukkan bahwa tingkat kesalahan model masih tinggi. Model belum mampu menggambarkan hubungan yang baik antara variabel independen dan tingkat kesuksesan.

Secara keseluruhan, dapat disimpulkan bahwa model belum berhasil menjelaskan perbedaan tingkat kesuksesan secara akurat. Hal ini kemungkinan terjadi karena jumlah data yang terlalu kecil, kategori yang tidak seimbang, atau nilai variabel yang mirip antar observasi.

2.3. Visualisasi Hasil

2.3.1 Penjelasan Tentang Visualisasi

Grafik ini menampilkan hubungan antara empat variabel prediktor (Periklanan, Tenaga Penjualan, Kepuasan, dan Persaingan) dengan kategori Tingkat Kesuksesan (Rendah, Sedang, Tinggi).

  • Sumbu X (horizontal) → nilai dari tiap variabel prediktor.

  • Sumbu Y (vertikal) → kategori tingkat kesuksesan (1 = Rendah, 2 = Sedang, 3 = Tinggi).

  • Titik warna → masing-masing observasi (data perusahaan).

    • Ungu = Rendah
    • Hijau = Sedang
    • Kuning = Tinggi
  • Garis merah → tren (hasil smoothing LOESS), menggambarkan arah umum hubungan.

a.Kepuasan

  • Terlihat semakin tinggi nilai Kepuasan, titik-titik kuning (Tinggi) makin banyak di bagian atas grafik.

  • Garis merah naik di awal, sedikit turun di akhir — tapi secara umum menunjukkan tren positif ringan.

  • Ini berarti:

    Semakin tinggi tingkat kepuasan pelanggan, semakin besar peluang perusahaan berada pada tingkat kesuksesan Sedang atau Tinggi.

  • Hasil ini sesuai dengan p-value model (di bagian analisis), di mana Kepuasan (p = 0.0045) termasuk signifikan untuk kategori “Tinggi”.

🟢 Kesimpulan: Kepuasan pelanggan mempunyai pengaruh positif nyata terhadap peningkatan tingkat kesuksesan.

b. Periklanan

  • Polanya juga menunjukkan garis merah cenderung naik ke kanan.
  • Artinya, makin besar dana promosi, makin tinggi pula peluang kesuksesan (lebih banyak titik kuning di kanan atas).
  • Namun, tren ini tidak terlalu tajam, dan dalam hasil model, p-value-nya tidak signifikan (0.0543 → sedikit di atas 0.05).

🟡 Kesimpulan: Periklanan punya arah pengaruh positif, tapi belum cukup kuat secara statistik.

c. Persaingan

  • Garis merah justru sedikit turun ketika nilai Persaingan meningkat.
  • Ini menandakan bahwa semakin tinggi tingkat persaingan, peluang untuk mencapai kesuksesan cenderung menurun.
  • Dalam hasil regresi, variabel ini juga signifikan (p = 0.0023) untuk kategori “Tinggi”, dan koefisiennya negatif.

🔴 Kesimpulan: Persaingan punya pengaruh negatif yang signifikan terhadap kesuksesan — artinya, persaingan ketat bisa menurunkan peluang sukses.

d. Tenaga Penjualan

  • Garis merah naik perlahan seiring meningkatnya jumlah tenaga penjualan.
  • Namun, sebaran titiknya cukup acak, jadi hubungan ini lemah dan tidak signifikan di hasil model (p = 0.1038).
  • Jadi meskipun arahnya positif, efeknya kecil banget.

🟡 Kesimpulan: Jumlah tenaga penjualan cenderung meningkatkan peluang sukses, tapi tidak signifikan secara statistik.

Kesimpulan Umum dari Visualisasi

Dari empat grafik tersebut bisa disimpulkan:

Variabel Arah Hubungan Signifikansi Arti Visualisasi
Kepuasan Positif ✅ Signifikan Kepuasan tinggi → peluang sukses meningkat
Periklanan Positif ⚠️ Hampir signifikan Iklan lebih banyak → sedikit menaikkan peluang sukses
Persaingan Negatif ✅ Signifikan Persaingan tinggi → peluang sukses menurun
Tenaga Penjualan Positif lemah ❌ Tidak signifikan Jumlah sales lebih banyak → pengaruh kecil

3.Kesimpulan Keseluruhan Regresi Logistik Multinomial

Secara keseluruhan, Regresi Logistik Multinomial merupakan salah satu metode statistik yang digunakan untuk memprediksi variabel dependen bersifat kategorik dengan lebih dari dua kelas, berdasarkan beberapa variabel independen yang bersifat numerik atau kategorik. Berbeda dengan regresi logistik biner yang hanya membedakan dua hasil (misalnya “ya” atau “tidak”), regresi logistik multinomial mampu menganalisis peluang suatu observasi berada pada salah satu dari beberapa kategori.

Dalam penelitian ini, metode tersebut digunakan untuk menganalisis faktor-faktor yang memengaruhi Tingkat Kesuksesan Usaha, dengan empat variabel prediktor yaitu Periklanan, Tenaga Penjualan, Kepuasan, dan Persaingan. Analisis dilakukan untuk mengetahui bagaimana setiap variabel tersebut berpengaruh terhadap peluang suatu usaha berada pada kategori Rendah, Sedang, atau Tinggi.

Hasil pemodelan menunjukkan bahwa:

  1. Model telah berhasil dijalankan dan konvergen, namun nilai AIC dan deviance yang tinggi menandakan bahwa model belum sepenuhnya menggambarkan hubungan data secara optimal.
  2. Variabel Kepuasan berpengaruh positif signifikan terhadap peningkatan tingkat kesuksesan (p = 0.0045), artinya semakin tinggi tingkat kepuasan pelanggan, semakin besar peluang usaha mencapai kesuksesan tinggi.
  3. Variabel Persaingan menunjukkan pengaruh negatif signifikan (p = 0.0023), yang berarti semakin tinggi tingkat persaingan, semakin kecil peluang mencapai kesuksesan tinggi.
  4. Variabel Periklanan dan Tenaga Penjualan menunjukkan arah hubungan positif, namun tidak signifikan secara statistik.
  5. Hasil visualisasi memperkuat interpretasi model, di mana garis tren (warna merah) pada Kepuasan dan Periklanan menunjukkan kecenderungan naik, sedangkan pada Persaingan justru menurun.

Dengan demikian, dapat disimpulkan bahwa:

Regresi Logistik Multinomial efektif digunakan untuk memodelkan hubungan antara beberapa variabel independen dengan variabel dependen yang memiliki tiga atau lebih kategori. Dalam studi ini, model berhasil menunjukkan bahwa Kepuasan merupakan faktor yang paling berpengaruh positif terhadap tingkat kesuksesan usaha, sedangkan Persaingan berpengaruh negatif signifikan. Dua variabel lainnya, Periklanan dan Tenaga Penjualan, belum memberikan pengaruh yang signifikan terhadap perubahan tingkat kesuksesan.

Sebagai saran, model ini dapat ditingkatkan dengan:

  • Menambah jumlah dan variasi data agar model lebih stabil,
  • Melakukan uji lanjutan seperti analisis interaksi antar variabel, dan
  • Mencoba pendekatan klasifikasi lain (seperti random forest atau ordinal regression) untuk melihat perbandingan performa model.

4. Perbandingan antara Regresi Logistik Biner dan Regresi Logistik Mutinomial

4.1 Perbedaan Konsep Dasar

Aspek Regresi Logistik Biner Regresi Logistik Multinomial
Jumlah Kategori Variabel Dependen (Y) 2 kategori (contoh: Ya/Tidak, Sukses/Gagal) ≥ 3 kategori (contoh: Rendah, Sedang, Tinggi)
Jenis Analisis Menghitung peluang terjadinya salah satu dari dua hasil Menghitung peluang observasi masuk ke salah satu dari beberapa kategori
Persamaan Logit Hanya 1 persamaan logit Membentuk beberapa persamaan logit (sebanyak kategori - 1)
Kategori Pembanding (Base) Salah satu kategori dianggap sebagai pembanding (biasanya “0”) Salah satu kategori dianggap dasar, dan setiap kategori lain dibandingkan dengan dasar tersebut
Tujuan Analisis Mengetahui faktor-faktor yang memengaruhi dua kemungkinan hasil Mengetahui faktor-faktor yang memengaruhi hasil dengan banyak tingkatan
Contoh Kasus Apakah seseorang membeli produk (Ya/Tidak) Tingkat kepuasan pelanggan (Rendah, Sedang, Tinggi)

4.2 Perbandingan Berdasarkan Output Model

Aspek Binary Logistic Regression Multinomial Logistic Regression
Koefisien (β) Menunjukkan seberapa besar pengaruh tiap variabel terhadap peluang hasil “1” (misalnya sukses). Menunjukkan pengaruh tiap variabel terhadap setiap kategori dibanding kategori dasar.
Interpretasi Koefisien Jika β positif → meningkatkan peluang sukses. Jika negatif → menurunkan peluang. Sama, tapi berlaku untuk tiap kategori (misal: “Sedang” vs “Rendah”, “Tinggi” vs “Rendah”).
Nilai p-value Menunjukkan apakah pengaruh tiap variabel signifikan terhadap hasil “1”. Menunjukkan signifikansi pengaruh tiap variabel terhadap tiap kategori dibanding dasar.
Output Utama di R Coefficients, Std. Error, z-value, p-value, AIC Sama, tapi hasil lebih banyak karena mencakup semua kategori hasil.
Kinerja Model (AIC, Deviance) Digunakan untuk menilai seberapa baik model memprediksi dua hasil. Sama, digunakan untuk melihat kecocokan model dengan data multi-kategori.

4.3 Perbandingan Berdasarkan Hasil Output dari Tugas

Aspek Regresi Logistik Biner (Bookdown) Regresi Logistik Multinomial (Tugas Ini)
Kategori Hasil (Y) Tingkat Kesuksesan memiliki 2 kategori: Rendah dan Tinggi Tingkat Kesuksesan memiliki 3 kategori: Rendah, Sedang, dan Tinggi
Jumlah Persamaan Logit 1 persamaan (perbandingan antara Tinggi vs Rendah) 2 persamaan (perbandingan Sedang vs Rendah dan Tinggi vs Rendah)
Variabel Signifikan Hanya Kepuasan yang paling berpengaruh signifikan terhadap kesuksesan Kepuasan dan Persaingan berpengaruh signifikan pada kategori Tinggi
Arah Pengaruh Kepuasan → berpengaruh positif terhadap peluang kesuksesan Kepuasan → berpengaruh positif, sedangkan Persaingannegatif
Nilai AIC (Kecocokan Model) Lebih kecil, menandakan model sederhana dan efisien Lebih besar karena model lebih kompleks dengan banyak kategori
Kestabilan Model Cenderung lebih stabil karena hanya dua kategori hasil Lebih bervariasi karena tiap kategori memiliki hubungan yang berbeda-beda

4.4 Kesimpulan Umum Perbandingan

Dari perbandingan di atas dapat disimpulkan bahwa:

  1. Regresi logistik biner cocok untuk analisis sederhana dengan dua hasil, menghasilkan model yang lebih stabil dan mudah diinterpretasikan.
  2. Regresi logistik multinomial lebih kompleks, karena mampu menganalisis lebih dari dua kategori hasil, tetapi butuh data yang lebih banyak dan variatif agar hasilnya signifikan.
  3. Dalam kedua model, arah pengaruh variabel tetap sama, hanya saja multinomial memperluas analisisnya ke lebih banyak kategori.
  4. Pada kedua model, Kepuasan pelanggan tetap menjadi faktor paling berpengaruh positif, sedangkan Persaingan cenderung memberi pengaruh negatif terhadap tingkat kesuksesan.

🟢 Garis besar:

Regresi logistik biner lebih efisien untuk kasus sederhana, sedangkan regresi logistik multinomial memberikan pemahaman yang lebih mendalam tentang bagaimana variabel memengaruhi berbagai tingkatan hasil.

Referensi

Siregar, B. (2025). Regression Models – Analysis and Predictive Modeling [Bagian 2: Regression Models]. Diambil dari https://bookdown.org/content/a142b172-69b2-436d-bdb0-9da6d046a0f9/02-Regression_Model.html

Tibrani Education. (2023). Regresi Logistik Multinomial SPSS II Lengkap dengan penjelasannya [Video]. YouTube. https://youtu.be/ljAMTBFlFAI?si=hLQXuAiVaKe8NApo

