Analisis Faktor-faktor yang Menyebabkan Penyakit Diabetes dengan Regresi Logistik Biner

Carlos Sitanggang

29 Mei 2023

1 PENDAHULUAN

1.1 Latar Belakang

Diabetes melitus (DM) adalah suatu penyakit yang ditandai dengan kadar gula darah yang tinggi disertai gangguan metabolisme karbohidrat, protein, dan lipid yang disebabkan oleh gangguan produksi insulin. Lembaga American Diabetes Association (ADA) melaporkan setiap 21 detik terdapat satu orang yang terkena diabetes. Lebih dari setengah penduduk dunia yang terkena diabetes tinggal di Asia, terutama di negara China, India, Pakistan, dan Indonesia. Diabetes dapat disebabkan karena faktor genetik, gaya hidup, lingkungan sosial, dan ketersediaan layanan kesehatan. Diabetes melitus dapat disebabkan oleh usia, aktivitas fisik, IMB (indeks massa badan), tekanan darah, stress, gaya hidup, faktor keturunan, dan kolestrol. Oleh karena itu, perlu dilakukan untuk mengetahui faktor apa saja yang berpengaruh terhadap penyakit diabetes. Analisis yang digunakan adalah analisis regresi logistik biner.

Dalam penelitian ini, data yang diambil bersumber dari National Institute of Diabetes and Digestive and Kidney Disease. Variabel yang menjadi variabel independen adalah kadar glukosa dalam darah, indeks massa badan (IMB), dan umur. Variabel yang menjadi variabel dependen adalah outcome. Nilai outcome antara lain 0 yang berarti tidak terkena diabetes dan 1 yang berarti terkena diabetes.

2 TINJAUAN PUSTAKA

2.1 Analisis Regresi

Analisis regresi adalah suatu analisis yang digunakan untuk memprediksi hubungan sebab akibat antara variabel bebas (independen) dengan variabel terikat (dependen). Variabel independen adalah variabel yang nilainya dapat ditentukan secara bebas. Variabel dependen adalah variabel yang nilainya bergantung pada variabel independen.

2.2 Analisis Regresi Logistik Biner

Regresi logistik biner adalah suatu analisis untuk memprediksi hubungan antara variabel independen dengan variabel dependen yang bersifat kategori. Variabel dependen hanya memiliki dua nilai, 0 berarti gagal atau 1 berarti sukses. Variabel dependen lebih tepat disebut sebagai variabel indikator dan memenuhi distribusi Bernoulli. Model regresi logistik adalah \[ \ln \frac{\pi(x)}{1-\pi(x)}=\beta_{0}+\beta_{1}X_{1}+\beta_{2}X_{2}+...+\beta_{k}X_{k} \]

3 SOURCE CODE

> library(readxl)
> datalaprak <- read_excel("C:/Users/LENOVO/OneDrive/Documents/laprak2.xlsx")
> datalaprak
# A tibble: 768 x 4
   Glucose   BMI   Age Outcome
     <dbl> <dbl> <dbl>   <dbl>
 1     148  33.6    50       1
 2      85  26.6    31       0
 3     183  23.3    32       1
 4      89  28.1    21       0
 5     137  43.1    33       1
 6     116  25.6    30       0
 7      78  31      26       1
 8     115  35.3    29       0
 9     197  30.5    53       1
10     125   0      54       1
# ... with 758 more rows
> laprak <- datalaprak
> modelreglog <- glm(formula = laprak$Outcome ~ laprak$Glucose + laprak$BMI + laprak$Age, family = binomial(link = "logit"), data=laprak)
> summary(modelreglog)

Call:
glm(formula = laprak$Outcome ~ laprak$Glucose + laprak$BMI + 
    laprak$Age, family = binomial(link = "logit"), data = laprak)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-2.3809  -0.7476  -0.4357   0.7861   2.8263  

Coefficients:
                Estimate Std. Error z value Pr(>|z|)    
(Intercept)    -8.393743   0.666067 -12.602  < 2e-16 ***
laprak$Glucose  0.032512   0.003329   9.767  < 2e-16 ***
laprak$BMI      0.081590   0.013526   6.032 1.62e-09 ***
laprak$Age      0.030157   0.007632   3.951 7.77e-05 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 993.48  on 767  degrees of freedom
Residual deviance: 755.68  on 764  degrees of freedom
AIC: 763.68

Number of Fisher Scoring iterations: 5
> 
> library(generalhoslem)
> logitgof(laprak$Outcome, fitted(modelreglog))

    Hosmer and Lemeshow test (binary model)

data:  laprak$Outcome, fitted(modelreglog)
X-squared = 8.9222, df = 8, p-value = 0.3489

4 HASIL DAN PEMBAHASAN

4.1 Persamaan Model Regresi Logistik

Persamaan regresi logistik berdasarkan hasil analisis yaitu \[ \ln \frac{\pi(x)}{1-\pi(x)}=-8.393+0.033X_{1}+0.082X_{2}+0.030X_{3} \]

dengan X1 = kadar glukosa dalam darah, X2 = indeks massa badan, dan X3 = umur.

4.2 Makna Persamaan Regresi

-Apabila tidak ada pengaruh dari kadar glukosa, indeks massa badan, dan umur, maka risiko terkena diabetes sebesar exp(-8.393). -Apabila kadar glukosa naik satu mg/dL, maka risiko terkena diabetes naik sebesar exp(0.033) kali. -Apabila indeks massa badan naik satu satuan, maka risiko terkena diabetes naik sebesar exp(0.082) kali. -Apabila umur naik satu tahun, maka risiko terkena diabetes naik exp(0.030) kali. -Nilai-p variabel kadar glukosa lebih kecil dari 0.05 berarti kadar glukosa dalam darah berpengaruh signifikan terhadap penyakit diabetes. -Nilai-p variabel indeks massa badan lebih kecil dari 0.05 berarti indeks massa badan berpengaruh signifikan terhadap penyakit diabetes. -Nilai-p variabel umur lebih kecil dari 0.05 berarti umur berpengaruh signifikan terhadap penyakit diabetes.

4.3 Uji Kelayakan Model (Hosmer and Lemeshow test)

Berdasarkan uji Hosmer dan Lemeshow, didapatkan nilai-p sebesar 0.3489. Nilai-p lebih besar dari 0.05 berarti model regresi logistik layak digunakan.

5 KESIMPULAN

Dengan model regresi logistik, dapat disimpulkan bahwa kadar glukosa dalam darah, indeks massa badan, dan umur berpengaruh terhadap penyakit diabetes. Agar risiko terkena penyakit diabetes menurun, sebaiknya kadar glukosa dan indeks massa badan berada di ambang batas normal. Selain itu, seiring bertambahnya umur, perlu dilakukan pengecekan kadar glukosa darah secara berkala. Penelitian lebih lanjut penting dilakukan untuk mengetahui faktor-faktor selain kadar glukosa darah, indeks massa badan, dan umur yang juga berpengaruh terhadap penyakit diabetes.

6 DAFTAR PUSTAKA

Alwi, W., Ernawati, dan Saddam H. 2018. Analisis Regresi Logistik Biner untuk Memprediksi Kepuasan Pengunjung pada Rumah Sakit Umum Daerah Majene. Jurnal Matematika dan Statistika serta Aplikasinya. 1(6):21.

Lestari, Zulkarnain, dan Aisyah S. 2021. Diabetes Melitus: Review Etiologi, Patofisiologi, Gejala, Penyebab, Cara Pemeriksaan, Cara Pengobatan, dan Cara Pencegahan. Prosiding Biologi Achieving the Sustainable Development Goals with Biodiversity in Confronting Climate Change. 1(7):239.

Yosmar, R., Dedy A., dan Fitria R. 2018. Survei Risiko Penyakit Diabetes Melitus terhadap Masyarakat Kota Padang. Jurnal Sains Farmasi & Sains. 2(5):134-135.