Analisis Regresi Logistik

Nobby Nugraha Prakoso

01-06-2023

1 PENDAHULUAN

1.1 Latar Belakang

Analisis regresi logistik adalah metode statistik yang digunakan untuk mempelajari hubungan antara satu atau lebih variabel independen (variabel prediktor) dengan variabel dependen biner (variabel respon). Tujuan dari analisis regresi logistik adalah untuk memprediksi kemungkinan kejadian atau tidak kejadian suatu peristiwa berdasarkan variabel prediktor yang terkait.

Penelitian menggunakan analisis regresi logistik penting dalam berbagai bidang, termasuk ilmu sosial, kesehatan, ekonomi, pemasaran, dan lainnya. Berikut adalah latar belakang yang dapat menjadi dasar untuk melakukan penelitian menggunakan analisis regresi logistik:

  1. Prediksi Risiko dan Kejadian: Analisis regresi logistik memungkinkan peneliti untuk mengidentifikasi faktor-faktor yang berhubungan dengan risiko atau kemungkinan terjadinya suatu kejadian. Misalnya, dalam penelitian kesehatan, analisis regresi logistik dapat digunakan untuk memprediksi risiko terjadinya penyakit berdasarkan faktor-faktor seperti usia, jenis kelamin, riwayat keluarga, dan gaya hidup.

  2. Faktor Penyebab dan Pengaruh: Dalam penelitian sosial atau ekonomi, analisis regresi logistik dapat membantu mengidentifikasi faktor-faktor yang mempengaruhi keputusan atau perilaku tertentu. Contohnya, dalam penelitian pemasaran, analisis regresi logistik dapat digunakan untuk memahami faktor-faktor yang mempengaruhi keputusan konsumen dalam membeli atau menggunakan suatu produk.

  3. Evaluasi Pengaruh Intervensi atau Perlakuan: Analisis regresi logistik juga dapat digunakan untuk mengevaluasi efektivitas suatu intervensi atau perlakuan. Misalnya, dalam penelitian klinis, analisis regresi logistik dapat digunakan untuk mengevaluasi pengaruh suatu pengobatan terhadap penyembuhan atau pemulihan pasien.

  4. Penyaringan dan Pengklasifikasian: Analisis regresi logistik juga dapat digunakan sebagai alat penyaringan atau pengklasifikasian. Misalnya, dalam penelitian diagnostik medis, analisis regresi logistik dapat membantu mengidentifikasi variabel yang paling berhubungan dengan keberadaan atau ketiadaan suatu penyakit, sehingga dapat digunakan sebagai kriteria diagnostik.

Dalam penelitian menggunakan analisis regresi logistik, penting untuk memperhatikan desain penelitian yang tepat, pemilihan variabel yang relevan, ukuran sampel yang memadai, dan validitas data yang baik. Hasil penelitian ini dapat memberikan wawasan dan pemahaman yang mendalam tentang hubungan antarvariabel dan dapat digunakan untuk mengambil keputusan yang lebih baik di berbagai bidang.

2 TINJAUAN PUSTAKA

2.1 Analisis Regresi

Analisis Regresi merupakan suatu teknik dalam statistika yang berfungsi untuk memeriksa dan memodelkan hubungan antarvariabel. Pada analisis ini terdapat dua komponen yang dihubungkan, yakni variabel respon (Y) atau variabel yang dipengaruhi dan variabel prediktor (X) atau variabel yang memengaruhi. Dalam beberapa sumber variabel respons juga sering dsebut dengan variabel tidak bebas atau dependen, variabel terikat dan banyak yang lainnya, sedangkan variabel prediktor sering disebut sebagai variabel bebas atau independen atau variabel penjelas. Biasanya model dari analisis regresi dituliskan sebagai berikut :

\[ Y = \beta_{0} + \beta_1X_1 + \beta_2X_2+...+\beta_nX_n \]

Keterangan :

\(Y\) = Variabel respons (yang dipengaruhi)

\(X_i\) = Variabel prediktor (yang memengaruhi)

\(\beta_0\) = Intercept

\(\beta_i\) = Koefisien regresi variabel prediktor

2.2 Analisis Regresi Logistik Biner

Regresi Logistik merupakn suatu metode analisis statistika yang berfungsi menjelaskan hubungan antara variabel respons (Y) yang memiliki dua kategori atau lebih dengan satu atau lebih variabel prediktor (X) berskala kategori atau kontinu. Regresi logistik dapat dibagi menjadi regresi logistik biner, regresi logistik multinomial dan regresi logistik ordinal. Model regresi logistik biner berfungsi untuk menganalisis hubungan antara satu variabel respon dan beberapa variabel prediktor, dengan variabel responnya berupa data kualitatif dikotomi yaitu bernilai 1 untuk menyatakan keberadaan sebuah karakteristik dan bernilai 0 untuk menyatakan ketidakberadaan sebuah karakteristik. Model regresi logistik biner digunakan saat variabel responnya menghasilkan dua kategori bernilai 0 dan 1, sehingga mengikuti distribusi Bernoulli sebagai berikut :

\[ f(y_i) = \pi_{i}^{y_i}(1-\pi_i)^{1-y_i} \]

Keterangan :

\(y_i\) = Variabel respons ke-i (dengan nilai 0 atau 1)

\(\pi_i\) = Peluang kejadian ke-i

Jika analisis regresi logistik terdiri hanya dengan satu variabel prediktor maka model yang terbentuk sebagai berikut :

\[ \pi(X) = \frac{exp(\beta_0 + \beta_1X)}{1- exp(\beta_0+\beta_1X)} \]

Keterangan :

\(\pi(X)\) = Peluang sukses sebagai fungsi logistik dari X (berapapun nilai X, fungsi ini akan bernilai 0 sampai 1

Dari model regresi logistik yang diperoleh dapat ditentukan pula Odds Ratio-nya sebagai berikut :

\[ \frac{\pi(X)}{1-\pi(X)} = exp(\beta_0+\beta_1X) \]

Setelah itu bentuk logit regresi logistik didapat dari hasil transformasi dari bentuk Odds Ratio (OR) :

\[ g(X) = ln(\frac{\pi(X)}{1-\pi(X)})=exp(\beta_0 + \beta_1X) \]

3 SOURCE CODE

3.1 Library

> library(knitr)
> library(rmarkdown)
> library(prettydoc)
> library(equatiomatic)
Error in library(equatiomatic): there is no package called 'equatiomatic'

3.2 Data

Berikut merupakan data yang akan digunakan untuk analisis regresi logistik

> Y <- c(0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 0, 1)
> Y
 [1] 0 0 0 0 0 0 0 1 0 0 0 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 0 1 0 1 1 1 1 1
[39] 0 1
> X1 <- c(1, 1, 2, 2, 2, 2, 3, 5, 2, 2, 1, 4, 1, 3, 4, 5, 3, 4, 5, 4, 4, 4, 3, 4, 5, 3, 4, 2, 4, 4, 4, 1, 3, 4, 5, 3, 4, 5, 4, 4)
> X1
 [1] 1 1 2 2 2 2 3 5 2 2 1 4 1 3 4 5 3 4 5 4 4 4 3 4 5 3 4 2 4 4 4 1 3 4 5 3 4 5
[39] 4 4
> data <- data.frame(Y, X1)
> str(data)
'data.frame':   40 obs. of  2 variables:
 $ Y : num  0 0 0 0 0 0 0 1 0 0 ...
 $ X1: num  1 1 2 2 2 2 3 5 2 2 ...
> head(data)
  Y X1
1 0  1
2 0  1
3 0  2
4 0  2
5 0  2
6 0  2

Keterangan :

\(Y\)= Pemberian ASI eksklusif (1 = Iya, 0 = Tidak)

\(X1\) = Pengetahuan Ibu, Jika (1) Tidak Memiliki Pengetahuan; (2) Kurang Memiliki Pengetahuan; (3) Cukup

Memiliki Pengetahuan; (4) Memiliki Pengetahuan yang Baik; (5) Memiliki Pengetahuan Sangat Baik

Sumber : https://repository.dinus.ac.id/docs/ajar/ANALISIS_REGRESI_LOGISTIK.pdf

3.3 Analisis

> reglog <- glm(Y~X1, family = binomial, data = data)
> summary(reglog)

Call:
glm(formula = Y ~ X1, family = binomial, data = data)

Coefficients:
            Estimate Std. Error z value Pr(>|z|)   
(Intercept)  -3.4763     1.2728  -2.731  0.00631 **
X1            1.2859     0.3961   3.246  0.00117 **
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 52.925  on 39  degrees of freedom
Residual deviance: 36.622  on 38  degrees of freedom
AIC: 40.622

Number of Fisher Scoring iterations: 4
> 
> #Hasil R-Squared
> Rsq <- 1 -(36.622/52.925)
> Rsq
[1] 0.3080397
> 
> #Pembetukan tabel berisi penduga parameter
> beta<-coef(reglog)
> OR_beta<-exp(beta)
> sk_OR<-exp(confint(reglog))
> cbind(beta,OR_beta,sk_OR)
                 beta    OR_beta       2.5 %    97.5 %
(Intercept) -3.476253 0.03092305 0.001704892 0.2835909
X1           1.285876 3.61783445 1.823023488 8.9289455
> 
> #Klasifikasi Model
> yp_hat <- fitted(reglog)
> kelas <- table(Y,yp_hat > 0.5)
> kelas
   
Y   FALSE TRUE
  0    10    5
  1     2   23

4 HASIL DAN PEMBAHASAN

4.1 Model Logit

Berdasarkan hasil output di atas model logit yang terbentuk sebagai berikut

\[ Logit[\hat{\pi}(X)] = -3.4763 + 1.2859X_1 \]

Intrepetasi :

Karena \(\beta_1\) bernilai positif, setiap kenaikan 1 kategori pada pengetahuan ibu akan meningkatkan peluang pemberian ASI eksklusif.

4.2 Uji Parsial

Nilai p untuk variabel prediktor \(X_1\) yang diperoleh pada hasil output tersebut :

> 0.00117
[1] 0.00117

Intrepetasi :

Dengan taraf nyata sebesar 5% dapat dibuktikan bahwa pengetahuan ibu memberikan pengaruh yang signifikan terhadap pemberian ASI eksklusif.

4.3 R-Squared

Hasil R-Squared yang didapat :

> Rsq
[1] 0.3080397

Intrepetasi :

Pengetahuan Ibu hanya menjelaskan 30% pemberian ASI eksklusif pada bayi.

4.4 Odds Ratio

Odds Ratio yang dihasilkan oleh output sebagai berikut :

> OR_beta
(Intercept)          X1 
 0.03092305  3.61783445 

Intrepetasi :

Jika pengetahuan seseorang ibu naik 1 kategori, maka kecenderungan seseorang menderita diabetes meningkat 3.61783445 kali. Dengan kata lain, semakin baik pengetahuan seorang ibu maka potensi pemberian ASI eksklusif akan meningkat.

4.5 Klasifikasi Model

Klasifikasi model yang didapatkan pada output sebagai berikut :

> kelas
   
Y   FALSE TRUE
  0    10    5
  1     2   23

Intrepetasi :

  • Dari 15 amatan \(Y = 0\) yang dihasilkan, hanya 5 amatan yang terklasifikasi sebagai benar

  • Dari 25 amatan \(Y = 1\) yang dihasilkan, 23 amatan yang terklasifikasi sebagai benar

5 KESIMPULAN

Dari hasil perhitungan analisis regresi logistik yang sudah lakukan bisa disimpulkan bahwa variabel prediktor (pengetahuan ibu) cukup berpengaruh terhadap variabel respons (pemberian ASI eksklusif) yang berarti bahwa seorang ibu harus memiliki pengetahuan yang mumpuni untuk mengetahui seberapa penting pemberian ASI eksklusif pada bayi.

6 DAFTAR PUSTAKA

Achmad Efendi, Ni Wayan Surya Wardhani, Rahma Fitriani, Eni Sumarminingsih. (2020). Analisis Regresi : Teori dan Aplikasi dalam R. Malang: Universitas Brawijaya Press.

Tampil, Y. A. (2017). Analisis Regresi Logistik Untuk Menentukan Faktor-Faktor Yang Memengaruhi Indeks Prestasi Kumulatif (IPK) Mahasiswa FMIPA Universitas Sam Ratulangi Mando. 57.