1 PENDAHULUAN

1.1 Latar Belakang

Statistika merupakan suatu cabang dari ilmu matematika di mana ilmu tersebut dapat membantu banyak manusia di dalam kehidupannya. Dalam ilmu statistika ditemukan banyak permasalahan dalam berbagai kasus baik itu dalam bidang bisnis, pendidikan, perdagangan, dan dalam bidang politik. Dari permasalahan-permasalahan tersebut, statistika sangat berperan penting dalam menentukan keputusan yang akan diambil (Dina, 2008).

Regresi Logistik adalah suatu metode dari analisis regresi dengan variabel respon yang merupakan variabel berupa variabel biner atau kategorik. Variabel respon yang bersifat biner atau dikotomus dan terdiri dari dua kategori yang dimisalkan sebagai 0 dan 1 (Hosmer, 2013). Variabel respon 0 merupakan unsur “gagal” dan variabel respon 1 merupakan unsur “sukses”.

Pada bidang perdagangan dilakukan suatu survey untuk mengukur kualitas penjualan. Dalam suatu survey yang dilakukan pada sebuah toko yaitu dengan melakukan survey kualitas pelayanan melalui pelanggan. Kualitas pelayanan merupakan suatu hal yang difokuskan untuk memenuhi kebutuhan dan kualifikasi untuk persyaratan serta pada ketepatan waktu untuk memenuhi kebutuhan dan harapan dari pelanggan. Kualitas pelayanan ini berlaku untuk semua jenis pelayanan yang dilakukan pada aktivitas penjualan dan pembelian yang ada pada suatu instansi untuk menjadi tolak ukur tujuan dari instansi tersebut. Faktor-faktor yang mempengaruhi kualitas pelayanan yaitu pada aspek kesederhanaan, aspek kejelasan, aspek akurasi, aspek keamanan, dan aspek kemudahan akses bagi para pelanggan.

2 TINJAUAN PUSTAKA

2.1 Statistika Deskriptif

Statistika deskriptif merupakan suatu bentuk analisis yang dilakukan untuk menganalisis data pada suatu kasus penelitian untuk menguji generalisasi pada suatu hasil penelitian yang didasarkan pada sampel (Hasan, 2004). Analisis deskriptif dilakukan melalui pengujian hipotesis deskriptif. Hasil dari analisis deskriptif jika diperoleh hipotesis nol ($H_{0}$) maka diterima yang artinya hasil penelitian tersebut dapat digeneralisasikan. Jika hasil yang diperoleh adalah hipotesis satu ($H_{1}$) maka keputusannya adalah ditolak yang artinya hasil penelitian tersebut tidak dapat digeneralisasikan. Penarikan kesimpulan pada statistik deskriptif dapat ditujukan pada suatu kumpulan data yang ada dan didasarkan pada ruang lingkup bahasannya statistik deskriptif mencakup grafik berupa histogram, poligon, frekuensi, dan grafik lainnya, ukuran nilai pusat ukuran dispersi, dan kemencengan serta keruncingan pada kurva.

2.2 Regresi Logistik

Regresi logistik merupakan suatu metode analisis staistika untuk mendekskripsikan hubungan antara variabel terikat yang memiliki dua kategori atau lebih dengan satu atau lebih peubah bebas dengan menggunakan skala kategori atau kontinu (Hosmer, 2000). Regresi logistik terbagi menjadi tiga yaitu regresi logistik biner,regresi logistik multinomial, dan regresi logistik ordinal.

Dalam kasus ini digunakan regresi logistik biner yang digunakan untuk menganalisis hubungan antara satu variabel respon dan beberapa variabel prediktor. Model regresi logistik biner digunakan jika variabel respnnya menghasilkan dua kategori bernilai 0 (gagal) dan 1 (gagal). Diperoleh dengan mengikuti distribusi Bernoulli sebagai berikut: \[ f(y_{i})= {\pi(x_{i})^{y_{i}}} (1-\pi(x_{i}))^{1-y_{i}},y_{i}=0,1 \]

Misalkan peluang variabel respon untuk suatu nilai x, dilambangkan dengan $\pi(x)$. Persamaan umum $\pi(x)$ dilambangkan sebagai berikut: \[ \pi_{i}(x)=\frac{exp(\beta_{0}+\beta_{1}x_{1i}+\beta_{2}x_{2i}+...+\beta_{p}x_{pi})}{1+exp(\beta_{0}+\beta_{1}x_{1i}+\beta_{2}x_{2i}+...+\beta_{p}x_{pi})} \] di mana:

$\pi(xi)$= peluang terjadinya kategori variabel respon

$x_{ji}$= variabel prediktor ke-j

p = banyaknya variabel prediktor

$\beta_{0}$= intercept

$\beta_{0},\beta_{1},...,\beta_{p}$= koefisien regresi untuk setiap variabel prediktor

Untuk mempermudah menaksir parameter pada regresi, maka ditransformasi dengan bentuk logit regresi logistik, sebagai berikut: \[ g(x)=ln[\frac{\pi(x)}{1-\pi(x)}] \]

2.3 Studi Kasus

Dalam kasus ini diperoleh contoh kasus di bidang perdagangan yaitu ketika penjual ingin mengetahui kualitas dari pelayanan yang dilakukan dalam melakukan aktivitas penjualan dan pembelian dengan total 25 data. Kualitas pelayanan didapatkan dari 4 variabel, yaitu:

X1 = empati (Jumlah pelanggan yang memiliki empati)
X2 = daya tanggap(0 = tidak memiliki daya tanggap dan 1 = memiliki daya tanggap)
X3 = jaminan(0 = tidak memiliki jaminan dan 1 = memiliki jaminan)
Y = kepuasan pelanggan (0 = Tidak puas dan 1 = Puas)

3 SOURCE CODE

3.1 Library

> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")
> library(readr)
> library(pscl)
> library(generalhoslem)

3.2 Import Data dan Membuat Data Frame

> data = read.csv("C:/Users/hp/OneDrive/Dokumen/Komstat Project/kualitaspelayanan.csv", header = TRUE, sep = ",")
> X1=as.numeric(data$empati)
> X2=as.factor(data$daya_tanggap)
> X3=as.factor(data$jaminan)
> Y=as.factor(data$kepuasan_pelanggan)
> data1=data.frame(X1,X2,X3,Y)
> str(data1)

Sebelum melakukan pengujian terhadap data, import data yang telah diamati kedalam Software R. Lalu, buatlah data frame dari variabel prediktor dan variabel respons pada data yang telah dibuat di mana X1, X2, dan X3 adalah variabel prediktor serta Y adalah variabel respons.

3.3 Analisis Regresi Logistik

> reglog<-glm(Y~X1+X2+X3,family=binomial,data=data1)
> reglog

Untuk membuat model analisis regresi logistik biner dapat dilakukan dengan menggunakan perintah pada Software R, yaitu dengan rumus glm() yang didefinisikan sebagai reglog.

3.4 Asumsi Nonmultikolinieritas

> library(pscl)
> reg1 <- lm(X1~X2+X3, data=data1)
> summary(reg1)
> R2_1 <- 1/(1-0.0604)
> R2_1
> 
> reglog2 <- glm(X2~X1+X3, family = binomial, data =data1)
> summary(reglog2)
> pR2(reglog2)
> R2_2 <- 1/(1-0.6047638)
> R2_2
> 
> reglog3 <- glm(X3~X1+X2, family = binomial, data =data1)
> summary(reglog3)
> pR2(reglog3)
> R2_3 <- 1/(1-0.6157476)
> R2_3

Untuk mengetahui asumsi nonmultikolinieritas dapat dilakukan dengan cara mencari regresi logistik dari masing-masing variabel prediktor dengan variabel prediktor lainnya. Lalu, lakukan pemanggilan dengan cara memasukkan syntax library(pscl). Setelah itu, carilah $R^2$ atau Residual Standard Error dengan rumus $R^2=\frac{1}{1-R}$ dan lakukan pemanggilan terhadap $R^2$ untuk memunculkan output.

3.5 Uji Signifikansi Keseluruhan Model

> pR2(reglog)
> qchisq(0.95,2)

Untuk melakukan uji signifikansi keseluruhan model lakukan perintah pada Software R dengan memasukkan rumus pR2(). Setelah itu, carilah nilai chi-square dengan alpha 0,95 dan df sebesar 2.

3.6 Uji Parsial Parameter Model

> summary(reglog)

Untuk membuat kesimpulan berupa ringkasan dapat dilakukan dengan rumus summary().

3.7 R square

> Rsq<-1-(9.7315/33.6506)
> Rsq

Untuk mencari R-Squared dapat digunakan rumus $R square=-1-\frac{Residual deviance}{Nulldeviance}$. Lalu, lakukan pemanggilan terhadap Rsq untuk memunculkan output.

3.8 Odds ratio

> beta=coef(reglog)
> beta
> OR=exp(beta)
> OR
> cbind(beta,OR)

Untuk mencari Odds Ratio dapat dilakukan dengan mencari beta dengan rumus coef(reglog) dan Odds Ratio dari beta dengan rumus exp(beta). Selanjutnya untuk memunculkan hasil dari Odds Ratio, yaitu dengan rumus cbind(beta, OR)

3.9 Membentuk klasifikasi

> yp_hat<-fitted(reglog)
> data1$yp_hat<-yp_hat
> data1
> class<-table(data1$Y,data1$yp_hat>0.5)
> class

Untuk membentuk klasifikasi dari regresi logistik dapat dilakukan dengan mendefinisikan yp_hat sebagai fitted(reglog). Setelah itu, definisikan yp_hat sebagai data1$yp_hat dan bentuklah tabel dari variabel Y dan yp_hat yang nilainya lebih dari 0.5 dengan mendefinisikannya sebagai class.

3.10 Uji Kelayakan Model

> library(generalhoslem)
> logitgof(data1$Y,fitted(reglog))

Selanjutnya, untuk menguji kelayakan model lakukan pemanggilan library(generalhoslem) agar dapat menggunakan rumus yang dicari. Setelah itu, masukkan rumus logitgof dengan menginput dari dari variabel Y dan hasil dari regresi logistik yang telah dicari.

4 HASIL DAN PEMBAHASAN

4.1 Import Data dan Membuat Data Frame

Import Data dan pembuatan data frame menghasilkan output sebagai berikut:

'data.frame':   25 obs. of  4 variables:
 $ X1: num  21 17 15 33 21 39 24 17 31 19 ...
 $ X2: Factor w/ 2 levels "0","1": 2 2 1 1 2 2 1 2 1 1 ...
 $ X3: Factor w/ 2 levels "0","1": 2 2 1 1 2 2 1 2 1 2 ...
 $ Y : Factor w/ 2 levels "0","1": 1 1 2 2 2 1 2 2 2 2 ...

Interpretasi: Pada saat membuat data frame didapatkan hasil struktur data variabel X1 merupakan numerik dan variabel X2,X3, dan Y adalah factor karena terdapat 2 pilihan yaitu 0 dan 1.

4.2 Analisis Regresi Logistik Biner

Pemodelan analisis regresi logistik biner didapatkan output sebagai berikut:


Call:  glm(formula = Y ~ X1 + X2 + X3, family = binomial, data = data1)

Coefficients:
(Intercept)           X1          X21          X31  
    28.4019      -0.2352     -21.7703      -2.9671  

Degrees of Freedom: 24 Total (i.e. Null);  21 Residual
Null Deviance:      33.65 
Residual Deviance: 9.731    AIC: 17.73

Interpretasi: Dari hasil di atas dapat dilihat bahwa variabel X1 memiliki koefisien bernilai -0.2352, variabel X21 memiliki koefisien bernilai -21.7703, dan koefisien 31 memiliki koefisien bernilai -2.9671.

4.3 Uji Signifikansi Keseluruhan Model

Pada uji signifikansi keseluruhan model didapatkan output sebagai berikut:

fitting null model for pseudo-r2
        llh     llhNull          G2    McFadden        r2ML        r2CU 
 -4.8657498 -16.8252917  23.9190838   0.7108074   0.6158658   0.8325585 
[1] 5.991465

Interpretasi: Pada output di atas diperoleh nilai $G^2$ sebesar 23.9190838 dengan nilai chi-squarenya adalah 5.991465. Dapat dilihat bahwa nilai dari $G^2$ lebih besar daripada nilai chi-squarenya, maka keputusannya adalah tolak $H_{0}$. Sehingga, dapat disimpulkan model signifikan atau minimal terdapat stau variabel yang berpengaruh terhadap kepuasan pelanggan.

4.4 Uji Parsial Parameter Model

Pada uji parsial parameter model didapatkan output sebagai berikut:


Call:
glm(formula = Y ~ X1 + X2 + X3, family = binomial, data = data1)

Deviance Residuals: 
     Min        1Q    Median        3Q       Max  
-1.44358  -0.28879   0.00001   0.00005   1.74425  

Coefficients:
              Estimate Std. Error z value Pr(>|z|)
(Intercept)    28.4019  4694.1244   0.006    0.995
X1             -0.2352     0.1474  -1.595    0.111
X21           -21.7703 12450.2931  -0.002    0.999
X31            -2.9671 13305.8099   0.000    1.000

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 33.6506  on 24  degrees of freedom
Residual deviance:  9.7315  on 21  degrees of freedom
AIC: 17.731

Number of Fisher Scoring iterations: 19

Interpetasi: Berdasarkan output di atas dapat dilihat bahwa seluruh variabel prediktor memiliki p-value yang nilainya lebih dari alpha (0,05), maka terima H0 pada semua variabel prediktor.

4.5 R square

Pada R Square didapatkan output sebagai berikut:

[1] 0.7108075

Interpretasi: Dari hasil uji parsial parameter model didapatkan output Residual deviance sebesar 9.7315 dan Null deviance: 33.6506. Lalu, masukkan kedua output tersebut untuk mencari R Square dan didapatkan hasil 0.7108075. Dari hasil R Square dapat diketahui bahwa variabel independen (X1,X2,X3) dapat menjelaskan 71.08% potensi kepuasan pelanggan atau ketidakpuasan pelanggan pada aktivitas penjualan dan pembelian.

4.6 Odds ratio

Pada Odds Ratio didapatkan output sebagai berikut:

(Intercept)          X1         X21         X31 
 28.4019466  -0.2352047 -21.7702529  -2.9671169 
 (Intercept)           X1          X21          X31 
2.161766e+12 7.904090e-01 3.509937e-10 5.145144e-02 
                   beta           OR
(Intercept)  28.4019466 2.161766e+12
X1           -0.2352047 7.904090e-01
X21         -21.7702529 3.509937e-10
X31          -2.9671169 5.145144e-02

Interpretasi: Pada variabel X1 yang merupakan variabel empati apabila empati yang dimiliki oleh pelanggan bertambah 1 maka kecenderungan pelanggan memilih untuk puas terhadap kualitas pelayanan meningkat 0.790409 kali lipat. Artinya apabila empati yang dimiliki oleh pelanggan semakin banyak, maka potensi pelanggan memilih untuk puas terhadap kualitas pelayanan semakin meningkat pula. Selanjutnya, pada variabel X2 yang merupakan variabel daya tanggap pelanggan memiliki peluang kecenderungan pelanggan memilih untuk puas terhadap kualitas pelayanan sebesar 3.509937x$10^{-10}$ kali lipat dibandingkan dengan pelanggan yang tidak memilih daya tanggap. Lalu, pada variabel X3 yang merupakan variabel jaminan pelanggan memiliki peluang kecenderungan pelanggan memilih untuk puas terhadap kualitas pelayanan sebesar 0.0514514 kali daripada pelanggan yang tidak memilih jaminan.

4.7 Membentuk klasifikasi

Untuk membentuk klasifikasi didapatkan output sebagai berikut:

   X1 X2 X3 Y      yp_hat
1  21  1  1 0 0.218449892
2  17  1  1 0 0.417291104
3  15  0  0 1 1.000000000
4  33  0  0 1 0.999999999
5  21  1  1 1 0.218449892
6  39  1  1 0 0.004036198
7  24  0  0 1 1.000000000
8  17  1  1 1 0.417291104
9  31  0  0 1 0.999999999
10 19  0  1 1 0.999999999
11 29  1  1 0 0.040841388
12 13  1  1 0 0.647236811
13 26  1  1 0 0.079383993
14 13  0  0 1 1.000000000
15 30  1  1 0 0.032560115
16 43  0  0 1 0.999999989
17 22  0  1 1 0.999999998
18 11  1  1 1 0.745987380
19 27  0  0 1 1.000000000
20 33  1  1 0 0.016347794
21 18  0  0 1 1.000000000
22 24  1  1 0 0.121282939
23 29  1  1 0 0.040841388
24 36  0  0 1 0.999999998
25 32  0  0 1 0.999999999
   
    FALSE TRUE
  0     9    1
  1     2   13

Interpretasi: Dari hasil di atas diperoleh bahwa dari 15 amatan dengan Y=0, hanya 13 yang diklasifikasikan dengan benar. Lalu, dari 10 amatan dengan Y=1, terdapat 1 diantaranya diklasifikasikan dengan benar dan tingkat akurasi model sebesar $(\frac{9+13}{25})*100$= 88%.

4.8 Uji Kelayakan Model

Pada uji kelayakan model didapatkan output sebagai berikut:


    Hosmer and Lemeshow test (binary model)

data:  data1$Y, fitted(reglog)
X-squared = 0.80623, df = 8, p-value = 0.9992

Interpretasi: Berdasarkan hasil di atas diperoleh nilai p sebesar 0.9992 yang nilainya lebih besar dari alpha (0,05). Keputusan yang diperoleh adalah tolak $H_{0}$. Sehingga, dapat disimpulkan bahwa model yang terbentuk layak untuk digunakan.

5 KESIMPULAN

Dari hasil perhitungan dengan menggunakan Software R di atas adalah didapatkan hasil bahwa model dari data tersebut layak untuk digunakan. Dengan menggunakan analisis regresi Logistik didapatkan model dengan klasifikasi sebesar 88% pada aktivitas jual dan beli.

6 DAFTAR PUSTAKA

Andayanti, Dina. 2008. Peran Statistik Dalam Pengambilan Keputusan. Seminar Nasional Aplikasi Sains dan Teknologi 2008 – IST AKPRIND Yogyakarta.

Hasan, Iqbal. 2004. Analisa Data Penelitian dengan Statistik. Jakarta : PT Bumi Aksara.

Hosmer, D.W., dan S. Lemeshow. 2000. Applied Logistic Regression. Edisi ke-2. John Wiley and Sons,Inc.Canada.

Hosmer, D.W., S. Lemeshow dan R. X. Sturdivant. 2013. Applied Logistic Regression. Edisi ke-3. John Wiley and Sons,Inc.Canada.

Penggunaan Analisis Regresi Logistik Biner Pada Kasus Kualitas Pelayanan dalam Aktivitas Jual dan Beli

Nindya Meiannur Shahnaz Purnomo

5/29/2023