1 PENDAHULUAN
1.1 Latar Belakang
Statistika merupakan salah satu disiplin ilmu yang penerapannya hampir di semua aspek kehidupan. Hal ini menunjukkan bahwa peranan statistika sangat diperlukan dalam kehidupan sehari-hari. Begitu pula dalam penelitian ilmiah, statistika merupakan alat yang berguna bagi perencanaan dan evaluasi hasil penelitian, sehingga dapat dilakukan perbaikan dan penyempurnaan terhadap hasil penemuan (Gunardi, 1999). Sebagai salah satu disiplin ilmu, statistika berperan untuk mengumpulkan, menyajikan dan menganalisis data. Apabila terbatas pada tiga peran tersebut maka dinamakan statistika deskriptif.
Salah satu analisis pada statistika adalah analisis regresi. Analisis regresi merupakan suatu metode yang digunakan untuk menganalisis hubungan antara dua atau lebih variabel. Pada analisis regresi terdapat dua jenis variabel yaitu variabel bebas dan variabel terikat. Berdasarkan pola hubungannya analisis regresi dibagi menjadi dua yaitu analisis regresi linear dan analisis regresi nonlinear. Data hasil penelitian yang berupa data kualitatif dapat dianalisis dengan regresi non-linear. Salah satu model regresi nonlinear adalah regresi logistik. Regresi logistik merupakan sebuah metode analisis statistik untuk menggambarkan hubungan antara variabel terikat dengan variabel bebas yang mempunyai dua atau lebih kategori dengan variabel terikat yang menggunakan skala kategorik maupun interval.
2 TINJAUAN PUSTAKA
2.1 Statistika Deskriptif
Statistika deskriptif adalah metode-metode yang berkaitan dengan pengumpulan, pengolahan, dan penyajian suatu daya sehingga menghasilkan informasi yang bermanfaat. Statistika deskriptif merupakan ilmu statistika yang hanya menolah, menyajikan data tanpa mengambil keputusan untuk populasi. Statistika deskriptif hanya melihat gambaran secara umum dari data yang didapatkan (Walpole, 1997). Statistika deskriptif ditunjukkan melalui ukuran penyebaran data, ukuran pemusatan data, grafik, diagram, histogram, dan lain-lain untuk memberikan informasi yang mudah dipahami.
2.2 Analisis Regresi Logistik Biner
Regresi Logistik adalah suatu metode analisis statistika untuk mendeskripsikan hubungan antara variabel terikat yang memiliki dua kategori atau lebih dengan satu atau lebih peubah bebas berskala kategori atau kontinu. Adapun regresi logistik dapat dibagi menjadi regresi logistik biner, regresi logistik multinomial dan regresi logistik ordinal.
Model regresi logistik biner digunakan untuk menganalisis hubungan antara satu variabel respon dan beberapa variabel prediktor, dengan variabel responnya berupa data kualitatif dikotomi yaitu bernilai 1 untuk menyatakan keberadaan sebuah karakteristik dan bernilai 0 untuk menyatakan ketidakberadaan sebuah karakteristik.
Model regresi logistik biner digunakan jika variabel responnya menghasilkan dua kategori bernilai 0 dan 1, sehingga mengikuti distribusi Bernoulli sebagai berikut:
\[ f(y_{i})= {\pi_{i}^{y_{i}}} (1-\pi_{i})^{1-y_{i}} \] dimana :
\(\pi_{i}\) = peluang kejadian ke-i
\(y_{i}\) = peubah acak ke-i yang terdiri dari 0 dan 1
Bentuk model regresi logistik dengan satu variabel prediktor yaitu: \[ \pi(x)=\frac{exp(\beta_{0}+\beta_{1}x)}{1+exp(\beta_{0}+\beta_{1}x)} \] Transformasi \(\pi(x)\) sehingga menghasilkan bentuk logit regresi logistik yaitu: \[ g(x)=ln[\frac{\pi(x)}{1-\pi(x)}]=\beta_{0}+\beta_{1}x \]
2.3 Pendugaan Parameter
Penyelesaian untuk mengestimasi parameter yang belum diketahui dapat menggunakan metode Maximum Likelihood Estimation (MLE). Pada dasarnya metode maximum likelihood memberikan nilai estimasi \(\beta\) untuk memaksimumkan fungsi likelihood. Secara sistematis, fungsi likelihood untuk model regresi logistik biner adalah sebagai berikut: \[ l(\beta)={\Pi_{i=1}^{n}}\pi(x_i)^{yi}[1-\pi(x_i)]^{1-yi} \] dimana :
\(y_{i}\) = pengamatan pada variabel ke-i
\(\pi(x_i)\) = peluang variabel prediktor ke-i
Untuk memudahkan perhitungan maka dilakukan pendekatan log likelihood, didefinisikan sebagai : \[ L(\beta)={\sum_{i=1}^{n}}\{{y_iln[\pi(x_i)]+(1-y_i)ln[1-\pi(x_i)]}\} \] Untuk mendapatkan nilai penafsiran koefisien regresi logistik dilakukan dengan membuat turunan pertama \(L(\beta)\) terhadap \(\beta\) dan disamakan dengan 0.
2.4 Uji Model Regresi Logistik
Uji model dilakukan untuk memeriksa peranan variabel prediktor terhadap variabel respon secara serentak atau secara keseluruhan. Uji serentak ini disebut juga uji model chi square.
Hipotesis
\(H_0:\beta_1=\beta_2=...=\beta_i=0\)
\(H_1\): paling sedikit ada satu parameter \(\beta_i\neq0\)
Statistik uji Likelihood Ratio Test mengikuti distribusi chi-square, sehingga untuk memperoleh keputusan dilakukan perbandingan dengan nilai \(X^2\) tabel, dengan derajat bebas (db) = k-1, k merupakan banyaknya variabel prediktor. Kriteria penolakan (tolak \(H_0\)) jika nilai \(G>{X_{(db,\alpha)}^{2}}\) atau jika P-value \(<\alpha\).
2.5 Uji Hipotesis Parsial
Pengujian parsial digunakan untuk menguji pengaruh setiap \(\beta_i\) secara individual dalam model yang diperoleh. Hasil pengujian secara parsial/individual akan menunjukkan apakah suatu variabel prediktor layak untuk masuk dalam model atau tidak.
Hipotesis
\(H_0:\beta_i=0\)
\(H_1:\beta_i\neq0\)
Statistik uji Wald(W) \[ W=\frac{\beta_i}{SE(\beta_i)} \]
dan
\[ SE(\beta_i)=\sqrt{\sigma^2(\beta_i)} \]
dimana :
\(SE(\beta_i)\) = dugaan galat baku untuk koefisien \(\beta_i\)
\(\beta_i\) = nilai dugaan untuk parameter(\(\beta_i\))
Rasio yang dihasilkan dari statistik uji dibawah hipotesis \(H_0\) akan mengikuti sebaran normal baku, sehingga untuk memperoleh keputusan dilakukan perbandingan dengan distribusi normal baku (Z). Kriteria penolakan (tolak \(H_0\)) jika nilai \(W>Z_{\alpha/2}\) atau p-value \(<\alpha\).
2.6 Data
Data yang digunakan adalah data sekunder. Data sekunder merupakan sumber data penelitian yang diperoleh peneliti secara tidak langsung melalui media perantara (diperoleh dan dicatat oleh pihak lain) (Indrianto dan Supomo, 2013).
Dalam analisis ini, ingin diketahui bagaimana pengaruh kualitas pelayanan publik terhadap kepuasan pengguna (masyarakat).
X1 = Daya Tanggap
X2 = Empati
Jika responden menjawab puas maka kita beri skor 1 dan jika menjawab tidak puas kita beri skor 0.
3 SOURCE CODE
3.1 Library
> library(car)
> library(plotrix)Library yang digunakan adalah car untuk menghitung VIF masing-masing prediktor dan plotrix sebagai package untuk membentuk pie chart.
3.2 Data
> dt <- read.csv("D:/Regresi Logistik.csv", sep=",")
> head(dt)
X1 X2 Y
1 36 45 1
2 34 39 0
3 30 38 0
4 32 38 1
5 36 45 1
6 33 42 0
> str(dt)
'data.frame': 50 obs. of 3 variables:
$ X1: int 36 34 30 32 36 33 36 36 31 31 ...
$ X2: int 45 39 38 38 45 42 45 45 36 37 ...
$ Y : int 1 0 0 1 1 0 1 1 0 0 ...Data dipanggil menggunakan perintah read.csv() dengan ketentuan setiap kolom dipisahkan dengan tanda koma (,). Menampilkan 6 data teratas menggunakan perintah head(). Gambaran banyaknya observasi dan karakteristik variabel ditampilkan dengan perintah str().
4 HASIL DAN PEMBAHASAN
4.1 Analisis Regresi Logistik Biner
> logit1 <- glm(Y~X1+X2,data=dt,family=binomial(link="logit"))
> summary(logit1)
Call:
glm(formula = Y ~ X1 + X2, family = binomial(link = "logit"),
data = dt)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.8128 -0.6376 -0.2617 0.8956 2.1705
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -31.9723 9.1140 -3.508 0.000451 ***
X1 0.1866 0.3070 0.608 0.543224
X2 0.6249 0.2637 2.369 0.017816 *
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 68.593 on 49 degrees of freedom
Residual deviance: 45.412 on 47 degrees of freedom
AIC: 51.412
Number of Fisher Scoring iterations: 5Pembentukan model regresi logistik dilakukan dengan menggunakan perintah glm() yang nantinya disimpan dengan nama model. Untuk memunculkan ringkasan dari model yang telah dibentuk, digunakan perintah summary().
> beta = coef(logit1)
> OR = exp (beta)
> SK = exp(confint (logit1))
> cbind(beta, OR, SK)
beta OR 2.5 % 97.5 %
(Intercept) -31.9722533 1.302047e-14 1.069622e-23 7.423485e-08
X1 0.1866118 1.205159e+00 6.712628e-01 2.339074e+00
X2 0.6248602 1.867985e+00 1.156908e+00 3.324090e+00koefisien penduga disimpan dalam vektor beta dengan perintah coef(). Setelah itu, menghitung Odds ratio bagi masing-masing penduga parameter dengan menggunakan perhitungan exp() dan menentukan selang kepercayaan bagi Odds ratio menggunakan perintah confint().
Untuk mengetahui nilai VIF bagi masing-masing prediktor, digunakan perintah vif() dari package car seperti di bawah.
> vif(logit1)
X1 X2
1.650709 1.650709 4.2 Uji Hipotesis Parsial
Pengujian parsial digunakan untuk menguji pengaruh setiap \(\beta_i\) secara parsial/individual menggunakan uji Wald.
Hipotesis
\(H_0:\beta_i=0\)
\(H_1:\beta_i\neq0\)
Dari output di atas, diperoleh p-value bagi statistik uji Wald pada penduga intersep, koefisien \(x_1\) lebih besar dari \(\alpha\)(0.05), sehingga keputusannya yaitu terima \(H_0\). Sedangkan penduga koefisien \(x_2\) dan intersep lebih kecil dari \(\alpha\)(0.05). Dengan demikian dapat disimpulkan bahwa hanya penduga koefisien \(x_2\) yang berpengaruh signifikan terhadap perolehan nilai model.
5 DAFTAR PUSTAKA
Indriantoro, Nur dan Bambang Supomo. (2013). Metodologi Penelitian Bisnis Untuk Akuntansi Dan Manajemen. Yogyakarta: BPFE
Walpole, R. (1997). Pengantar Metode Statistik Edisi ke-3. Jakarta: PT Gramedia Pustaka Utama.
Tampil, Komalig dan Langi.(2017).Analisis Regresi Logistik Untuk Menentukan Faktor-Faktor Yang Mempengaruhi Indeks Prestasi Kumulatif (IPK) Mahasiswa FMIPA Universitas Sam Ratulangi Manado.
Sumber data :https://arokhman.blog.unsoed.ac.id/files/2009/06/Regresi-Logistik-for-MAP.pdf