1 PENDAHULUAN
1.1 Latar Belakang
Seiring dengan perkembangan zaman dan teknologi, data menjadi bagian besar dari kehidupan manusia yang berperan penting dalam berbagai aspek kehidupan. Peran statistika adalah perangkat untuk mengumpulkan data lalu diolah, dianalisis, dan disajikan agar bisa menghasilkan kesimpulan yang berisi strategi-strategi tertentu maupun saran atas keputusan tersebut sehingga bisa memberi informasi yang optimal juga bisa diketahui resiko atas pengambilan keputusan (Supardi, 2013). Statistika bisa diaplikasikan ke berbagai bidang kehidupan salah satunya di bidang kesehatan. Dalam bidang kesehatan kemajuan besar pada penelitian mengenai metode pengobatan bisa terealisasi. Khususnya pada penyakit-penyakit yang hingga saat ini belum ditemukan obatnya dan sedang dikembangkan seperti, diabetes, HIV/AIDS, autoimune, dan masih banyak lagi.
Sclerosis merupakan gangguan saraf yang disebabkan sistem kekebalan tubuh yang menyerang lapisan lemak pada serabut saraf. Jumlah kasus penyakit multiple sclerosis di dunia secara keseluruhan adalah mendekati angka 1 juta penderita. Saat ini terdapat beberapa treatment untuk terapi penyakit sclerosis namun belum ada yang bisa sembuh hanya meredakan gejala dalam jangka waktu tertentu. EDSS menjadi teknik untuk mengukur skala disabilitas untuk pasien multiple sclerosis. Untuk itu analisis faktor-faktor yang berpengaruh terhadap hasil EDSS diperlukan sehingga harapannya bisa dikaji lebih lanjut untuk pengoptimalan faktor-faktor tersebut untuk mendapatkan penemuan baru mengenai obat permanen sclerosis.
2 TINJAUAN PUSTAKA
2.1 Model regresi logistik
Analisis regresi adalah sebuah metode analisis yang dipakai guna mencari suatu pengaruh variabel terhadap variabel lainnya. Sedangkan regresi logistik merupakan metode analisis statistika untuk mendeskripsikan hubungan antara variabel terikat yang memiliki dua kategori atau lebih dengan satu atau lebih peubah bebas berskala kategori atau kontinu. Regresi logistik dapat dibagi menjadi regresi logistik biner, regresi logistik multinomial dan regresi logistik ordinal. Regresi logistik biner merupakan suatu metode analisis regresi dengan variabel respon merupakan variabel biner atau kategorik, biner artinya variabel dikotomus yang terdiri dari dua kategori yaitu 0 dan 1. Uji model dalam regresi logistik menggunakan variabel prediktor dan variabel respon secara keseluruhan dengan uji model chi square (Tampil et. al., 2017). Sedangkan uji kesesuaian model regresi logistik terdiri dari 3 pengujian yaitu uji Hosmer danLemeshow’s Goodness of Fit Test, Omnibus Test ofModel Coefficientdan -2 log likelihood (Muflihah, 2017).
2.2 Multiple Sclerosis (MS)
Multiple sclerosis meupakan penyakit peradangan kronis yang menyerang sistem saraf pusat. Penyakit ini ditandai dengan terjadinya defisit neurologis kambuhan yang mempengaruhi sistem fungsional yang berbeda dari sistem saraf pusat. Dalam beberapa dekade terakhir, sejumlah instrumen telah dikembangkan yang menggambarkan keparahan klinis dan defisit fungsional pada multiple sclerosis. Instrumen ini adalah semakin banyak digunakan sebagai titik akhir dalam uji klinis untuk menilai efektivitas intervensi terapeutik. Instrumen yang paling populer dan banyak digunakan adalah Skala Status Cacat yang Diperluas (EDSS). EDSS atau Expanded Disability Status Scale adalah skala penilaian yang dikelola dokter untuk mengevaluasi sistem fungsional saraf pusat sistem. EDSS digunakan untuk menggambarkan perkembangan penyakit pada pasien dengan MS dan untuk menilai keefektifannya intervensi terapeutik dalam uji klinis. Terdiri dari sistem peringkat ordinal mulai dari 0 (status neurologis normal) hingga 10 (kematian karena MS) dengan peningkatan 0,5 interval (ketika mencapai EDSS 1) (Moock, et.al., 2014)
2.3 Sumber Data
Data yang digunakan dalam analisis ini adalah data mentah yang diperoleh dari situs kaggle dengan pemilik Des. Dalam dataset ini berisi data tentang Multiple Sclerosis Disease yang diperoleh 19 variabel dan 273 sampel amatan. Pada analisis regresi logistik yang dilakukan hanya diambil 3 variabel independen dan 1 variabel dependen dengan 20 sampel amatan. Diantaranya adalah:
- Y = Final_EDSS
- X1 = Gender
- X2 = Age
- X3 = Schooling
3 SOURCE CODE
3.1 Library yang Dibutuhkan
> # Library
> library(plotrix)
> library(car)library plotrix digunakan untuk membentuk pie chart dan car untuk menghitung VIF masing-masing prediktor.
3.2 Membangkitkan Data
> sclerosis <-read.csv("E:/Semester 4/KOMSTAT SEM 4/laprak rpubs/conversion_predictors_of_clinically_isolated_syndrome_to_multiple_sclerosis.csv")
> str(sclerosis)
'data.frame': 273 obs. of 20 variables:
$ X : int 0 1 2 3 4 5 6 7 8 9 ...
$ Gender : int 1 1 1 2 2 1 2 2 1 2 ...
$ Age : int 34 61 22 41 34 29 53 24 36 28 ...
$ Schooling : int 20 25 20 15 20 22 20 15 15 20 ...
$ Breastfeeding : int 1 3 3 1 2 1 1 1 1 1 ...
$ Varicella : int 1 2 1 1 1 1 1 1 1 1 ...
$ Initial_Symptom : int 2 10 3 7 6 6 14 14 8 8 ...
$ Mono_or_Polysymptomatic: int 1 2 1 2 2 2 2 2 2 2 ...
$ Oligoclonal_Bands : int 0 1 1 1 0 0 0 0 0 0 ...
$ LLSSEP : int 1 1 0 0 1 1 1 1 1 0 ...
$ ULSSEP : int 1 0 0 1 0 0 0 1 1 0 ...
$ VEP : int 0 1 0 1 0 0 1 0 1 0 ...
$ BAEP : int 0 0 0 0 0 0 0 0 0 0 ...
$ Periventricular_MRI : int 0 0 0 1 1 1 1 1 1 1 ...
$ Cortical_MRI : int 1 0 1 1 0 0 1 1 0 0 ...
$ Infratentorial_MRI : int 0 0 0 0 0 1 0 1 0 1 ...
$ Spinal_Cord_MRI : int 1 1 0 0 0 0 1 1 0 0 ...
$ Initial_EDSS : int 1 2 1 1 1 1 1 2 1 1 ...
$ Final_EDSS : int 1 2 1 1 1 1 1 2 1 1 ...
$ group : int 1 1 1 1 1 1 1 1 1 1 ...
> X1 = as.factor(sclerosis$Gender)
> X2 = sclerosis$Age
> X3 = sclerosis$Schooling
> Y = as.factor(sclerosis$Final_EDSS)
> df = data.frame(X1,X2,X3,Y)
> str(df)
'data.frame': 273 obs. of 4 variables:
$ X1: Factor w/ 2 levels "1","2": 1 1 1 2 2 1 2 2 1 2 ...
$ X2: int 34 61 22 41 34 29 53 24 36 28 ...
$ X3: int 20 25 20 15 20 22 20 15 15 20 ...
$ Y : Factor w/ 3 levels "1","2","3": 1 2 1 1 1 1 1 2 1 1 ...Berdasarkan hasil dari data frame diatas terdapat 3 variabel yang saling tidak bebas yaitu x1,x2,x3, dan 1 variabel bebas yaitu, Y.
3.3 Pie Chart Proporsi Penderita Penyakit Jantung
> EDSS = table(df$Y)
> EDSS
1 2 3
80 34 11 > category = c("Sangat Berpengaruh = ","Cukup Berpengaruh = ","Tidak Berpengaruh = ")
> percentage = round(EDSS/sum(EDSS)*100)
> category= paste(category,percentage)
> category= paste(category,'%', sep = '')
> pie(EDSS,labels = category, col = rainbow(length(category)), main ="Persentase Pengaruh Faktor Tehadap Hasil EDSS Pasien Multiple Sclerosis" ) ## Analisis Regresi Logistik
> modelreglog<-glm(Y~X1+X2+X3,family=binomial,data=sclerosis)
> summary(modelreglog)
Call:
glm(formula = Y ~ X1 + X2 + X3, family = binomial, data = sclerosis)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.4205 -0.9246 -0.7693 1.2555 1.7564
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.65645 1.01898 -0.644 0.5194
X12 -0.18866 0.38426 -0.491 0.6235
X2 0.03366 0.01697 1.984 0.0473 *
X3 -0.06411 0.04642 -1.381 0.1673
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 163.35 on 124 degrees of freedom
Residual deviance: 156.61 on 121 degrees of freedom
(148 observations deleted due to missingness)
AIC: 164.61
Number of Fisher Scoring iterations: 4
> vif(modelreglog)
X1 X2 X3
1.004214 1.008307 1.006451 3.4 Uji Signifikansi Keseluruhan Model
> pR2 <- function(modelreglog) {
+ deviance <- sum(modelreglog$deviance)
+ null_deviance <- sum(modelreglog$null.deviance)
+ return(1 - deviance / null_deviance)
+ }
> pR2(modelreglog)
[1] 0.04131024
> qchisq(0.95,2)
[1] 5.9914653.5 R square
> rsq<-pR2(modelreglog)
> rsq
[1] 0.041310243.6 Odds Ratio
> beta<-(coef(modelreglog))
> beta
(Intercept) X12 X2 X3
-0.65645171 -0.18865826 0.03366229 -0.06411205
> OR_beta<-exp(beta)
> OR_beta
(Intercept) X12 X2 X3
0.5186885 0.8280694 1.0342353 0.9378999
> cbind(beta,OR_beta)
beta OR_beta
(Intercept) -0.65645171 0.5186885
X12 -0.18865826 0.8280694
X2 0.03366229 1.0342353
X3 -0.06411205 0.93789993.7 Uji Kelayakan Model
> logitGOF<- glm(Y~1, family = binomial, data = sclerosis)
> 1-as.vector(logLik(modelreglog)/logLik(logitGOF))
[1] 0.041310244 HASIL DAN PEMBAHASAN
4.1 Pie Chart
Berdasarkan pie chart, dapat disimpulkan bahwa faktor-faktor terbukti membawa pengaruh terhadap hasil EDSS pasien Multiple Sclerosis. Pada pie chart terdiri atas kategori sangat berpengaruh, cukup berpengaruh, dan tidak berpengaruh. Adapun persentase kategori faktor faktor didapatkan hasil sangat berpengaruh terhadap EDSS pada pasien Multiple Sclerosis yakni sebesar 64%. Persentase kategori faktor faktor memiliki cukup pengaruh terhadap hasil EDSS pada pasien Multiple Sclerosis yakni sebesar 27%. Sedangkan persentase kategori faktor faktor tidak memiliki pengaruh terhadap hasil EDSS pada pasien Multiple Sclerosis yakni sebesar 9%.
4.2 Analisis Regresi Logistik
Berdasarkan output dari perhitungan analisis regresi logistik didapatkan bahwa x1 dan x3 memiliki p-value lebih dari alpha (0.05) sehingga dapat diputuskan untuk menolak Ho. Sedangkan pada hasil p-value x2 didapatkan bahwa kurang dari alpha (0.05) sehingga disimpulkan untuk terima Ho. Maka dapat disimpulkan bahwa faktor Gender dan Schooling berpengaruh terhadap hasil EDSS pada pasien Multiple Sclerosis. Sedangkan faktor Age tidak berpengaruh secara signifikan terhadap hasil EDSS pada pasien Multiple Sclerosis
4.3 Uji Signifikansi Keseluruhan Model
Berdasarkan output, diperoleh nilai pR2 yang diperoleh adalah sebesar 0.0413 < 5.991465 sehingga belum cukup bukti untuk menolak Ho sehingga diperoleh keputusan terima H0. Maka dengan tingkat kepercayaan 95%, dapat disimpulkan bahwa model tidak berpengaruh secara signifikan terhadap penyakit jantung hasil EDSS pada pasien Multiple Sclerosis atau minimal ada satu variabel yang tidak berpengaruh secara signifikan terhadap hasil EDSS pada pasien Multiple Sclerosis.
4.4 R square
Dengan nilai R-Square sebesar 0.04131, dapat diketahui bahwa variabel independent (X1, X2, X3) dapat menjelaskan 4.1% faktor-faktor yang berpengaruh terhadap hasil EDSS pada pasien Multiple Sclerosis.
4.5 Odds Ratio
Nilai odds ratio pada intercept 0.5186885 menunjukkan bahwa jika faktor lain dianggap konstan, maka diperoleh peluang sebesar 0.5186885 untuk seseorang memperoleh hasil faktor sangat berpengaruh terhadap hasil EDSS pada pasien Multiple Sclerosis,
Berdasarkan hasil nilai odds ratio pada koefisien X1 menunjukkan bahwa risiko bahwa seseorang pasien perempuan memperoleh hasil faktor tidak berpengaruh terhadap hasil EDSS pada penyakit Multiple Sclerosis sebesar 0.8280694 kali lebih besar daripada pasien laki-laki.
Berdasarkan hasil nilai odds ratio pada koefisien X2 menunjukkan bahwa apabila variabel x2 (age) bertambah 1 tahun maka risiko bahwa seseorang pasien memperoleh hasil faktor tidak berpengaruh terhadap hasil EDSS pada penyakit Multiple Sclerosis sebesar 1.0342353 kali lebih besar.
Berdasarkan hasil nilai odds ratio pada koefisien X3 menunjukkan bahwa risiko seseorang pasien apabila masa schooling bertambah 1 tahun membuat risiko perolehan hasil faktor tidak berpengaruh terhadap hasil EDSS pada penyakit Multiple Sclerosis sebesar 0.9378999 kali lebih besar.
4.6 Uji Kelayakan Model
Berdasarkan output, diperoleh nilai signifikansi kesesuaian model 0.04131024 < alpha 0.05 sehingga model disimpulkan kurang sesuai.
5 DAFTAR PUSTAKA
Moock, S., Feng, Y., Maeurer, M., Dippel, F., & Kohlmann, T. (2014). Systematic literature review and validity evaluation of the Expanded Disability Status Scale (EDSS) and the Multiple Sclerosis Functional Composite (MSFC) in patients with multiple sclerosis. BioMed Central, 14(58), 14271-2377.
Muflihah, I. (2017). ANALISIS FINANCIAL DISTRESS PERUSAHAAN MANUFAKTUR DI INDONESIA DENGAN REGRESI LOGISTIK. Majalah Ekonomi, 22(2), 1411-9501.
Supardi U.S. (2013). Aplikasi Statistika Dalam Penelitian Konsep Statistika Yang Lebih Komprehensif. Jakarta: Change Publication.
Tampil, Y. A., Komalig, H., & Langi, Y. (2017). Analisis Regresi Logistik Untuk Menentukan Faktor-Faktor Yang Mempengaruhi Indeks Prestasi Kumulatif (IPK) Mahasiswa FMIPA Universitas Sam Ratulangi Manado. JdC, 6(2), 56-62.