Analisis Regresi Logistik

Aura Inka Dheaudi Arditya

2023-06-1

1 PENDAHULUAN

1.1 Latar Belakang

Regresi logistik merupakan teknik analisis data untuk menemukan hubungan antara dua fakktor data dengan tujuan memprediksi nilai dar salah satu faktor berdasarkan faktor lainnya. Regresi Logistik merupakan regresi non linear, digunakan untuk menjelaskan hubungan antara X dan Y yang bersifat tidak linear, ketidaknormalan sebaran Y, keragaman respon tidak konstan yang tidak dapat dijelaskan dengan model regresi linear biasa.

Regresi Logistik dapat digunakan diberbagai bidang mulai dari kesehatan hingga kecerdasan buatan (AI). Pihak perusahaan yang menerapkan wawasan regresii logistik ini untuk analisis prediktif dapat mengurangi biaya operasional, meningkatkan efisiensi, dan menskalakan dengan lebih cepat.

Penulisan ini disusun untuk memenuhi final project praktikum komputasi statistika dengan studi kasus terkait Regresi logistik. Melalui penulisan ini diharapkan dapat menambah wawasan tentang Regresi Logistik dengan software yang terkait.

2 TINJAUAN PUSTAKA

2.1 Regresi Logistik

Regresi Logistik adalah suatu metode analisis statistika untuk mendeskripsikan hubungan antara peubah respon (dependent variable) yang memiliki dua kategori atau lebih dengan satu atau lebih peubah penjelas (independent variable) berskala kategori atau interval.

Deskripsi hubungan peubah respon yang memiliki sifat kualitatif atau kategorik dengan peubah penjelas yang memiliki dua kategori atau lebih tidak dapat diselesaikan dengan model regresi linear biasa menggunakan metode ordinary least square (OLS). Jika metode regresi linear dipaksakan untuk menganalisis data yang peubah responnya memiliki karakteristik seperti disebutkan di atas, akan terjadi pelanggaran asumsi Gauss-Markov (Kutner et al., 2004) dan pelanggaran terhadap batasan dari nilai duga (fitted value) dari peubah respon (Y).

Berdasarkan asumsi Gauss-Markov pelanggaran yang terjadi adalah:

  1. Error model regresi tidak menyebar normal

  2. Ragam (variance) eror tidak homogen (terjadi heteroskedastisitas pada ragam eror). Sedangkan pelanggaran terhadap batasan nilai duga Y (fitted value) adalah adanya nilai duga dari model regresi linier yang bisa melebihi rentang 0 – 1, padahal batasan nilai peubah respon yang bersifat kategorik adalah satu (1) dan nol (0).

2.2 Asumsi-asumsi Regresi Logistik

Beberapa asumsi yang harus dipenuhi untuk menerapkan Regresi Logistik adalah sebagai berikut:

  1. Regresi Logistik tidak membutuhkan hubungan linier antara variabel independen dengan variabel dependen.

  2. Variabel dependen harus bersifat dikotomi (2 kategori: tinggi dan rendah).

  3. Variabel independen tidak harus memiliki keragaman yang sama antar kelompok variabel.

  4. Dapat menyeleksi hubungan karena menggunakan pendekatan non linier log transformasi untuk memprediksi odds ratio. Odd dalam regresi sering dinyatakan sebagai probabilitas.

Jika asumsi-asumsi tersebut tidak terpenuhi, hasil dari analisis Regresi logistik dapat menjadi tidak valid atau tidak akurat. Oleh karena itu, sebelum menerapkan Analisis Regresi logistik, pastikan bahwa asumsi tersebut terpenuhi atau gunakan alternatif metode analisis yang mungkin lebih sesuai untuk digunakan.

3 SOURCE CODE

3.1 Data

Y = Asi Eksklusif (1=diberi, 0=tidak diberi)

X1 = Status pekerjaan (1=bekerja, 0=tidak bekerja)

X2 = Pengetahuan ibu (rasio: 1 sampai 5)

Pada Studi kasus ini ingin mengetahui hubunngan Status pekerjaan dan pengetahuan ibu terhadap pemberian asi eksklusif.

3.2 Input Data

Kita dapat menginput data ke dalam Rstudio dengan perintah berikut:

> # Membuat data contoh
> Y <- c(1,1,1,1,0,0,0,0,0,0)
> X1 <- c(4,1,3,4,5,3,4,5,4,4)
> X2 <- c(0,1,0,1,1,1,1,1,0,1)
> data<- data.frame(Y,X1,X2)

3.3 Menerapkan Regresi Logistik

Selanjutnya, kita dapat melakukan Regresi Logistik di Rstudio dengan perintah berikut:

> reglog<-glm(Y~X1+X2,family=binomial,data=data)

3.4 Menampilkan Hasil Regresi Logistik

Selanjutnya, kita dapat menunjukkan hasil Regresi Logistik di Rstudio dengan perintah berikut:

> summary(reglog)

Call:
glm(formula = Y ~ X1 + X2, family = binomial, data = data)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-1.3115  -0.6137  -0.3162   0.5272   1.8774  

Coefficients:
            Estimate Std. Error z value Pr(>|z|)
(Intercept)    5.895      4.254   1.386    0.166
X1            -1.396      1.071  -1.303    0.192
X2            -1.884      1.694  -1.112    0.266

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 13.4602  on 9  degrees of freedom
Residual deviance:  8.9898  on 7  degrees of freedom
AIC: 14.99

Number of Fisher Scoring iterations: 5

4 HASIL DAN PEMBAHASAN

Pada analisis Regresi Linier yang dilakukan, didapatkan hasil yaitu Y= 5,895 + 1,396X1 - 1,884X2

5 KESIMPULAN

Berdasarkan hasil analisis Regresi Logistik yang dilakukan, dapat disimpulkan bahwa interpretasi sebagai berikut:

  • Seorang ibu bekerja -13,96% kali lebih berpeluang menggunakan asi eksklusif dibandingkan dengan seorang ibu yang tidak bekrja

  • Penambahan rasio pada pengetahuan ibu sebesar 1, maka dapat meningkatkan peluang seorang ibu menggunakan asi eksklusif sebesar -18,84%

6 DAFTAR PUSTAKA