Minggu ke-7 Bagian 3 ini akan membahas mengenai: Penerapan Regresi Logistik Ordinal
Pendahuluan
Regresi logistik ordinal digunakan untuk memodelkan hubungan antara peubah respon lebih dari dua kategori berskala ordinal (ada tingkatan) dengan satu atau lebih peubah penjelas. Peubah penjelasnya bisa berupa data kontinu atau kategorik.
Soal 1
setwd("C:\\Users\\ACER\\Downloads\\")
Jawaban Soal 1
Input Data
dataku<-read.csv("data_mental.csv", sep=";", header=TRUE)
dim(dataku)
## [1] 40 5
head(dataku)
## Mental_Imp degree degree_2 x2 x1
## 1 well 1 4 1 1
## 2 well 1 4 1 9
## 3 well 1 4 1 4
## 4 well 1 4 1 3
## 5 well 1 4 0 2
## 6 well 1 4 1 0
mental.degree<-factor(dataku$degree)
ses<-factor(dataku$x2)
life<-dataku$x1
data.frame(mental.degree,ses,life)
## mental.degree ses life
## 1 1 1 1
## 2 1 1 9
## 3 1 1 4
## 4 1 1 3
## 5 1 0 2
## 6 1 1 0
## 7 1 0 1
## 8 1 1 3
## 9 1 1 3
## 10 1 1 7
## 11 1 0 1
## 12 1 0 2
## 13 2 1 5
## 14 2 0 6
## 15 2 1 3
## 16 2 0 1
## 17 2 1 8
## 18 2 1 2
## 19 2 0 5
## 20 2 1 5
## 21 2 1 9
## 22 2 0 3
## 23 2 1 3
## 24 2 1 1
## 25 3 0 0
## 26 3 1 4
## 27 3 0 3
## 28 3 0 9
## 29 3 1 6
## 30 3 0 4
## 31 3 0 3
## 32 4 1 8
## 33 4 1 2
## 34 4 1 7
## 35 4 0 5
## 36 4 0 4
## 37 4 0 4
## 38 4 1 8
## 39 4 0 8
## 40 4 0 9
Fitting Model
model<-polr(mental.degree~ses+life, method="logistic")
summary(model)
##
## Re-fitting to get Hessian
## Call:
## polr(formula = mental.degree ~ ses + life, method = "logistic")
##
## Coefficients:
## Value Std. Error t value
## ses1 -1.1112 0.6109 -1.819
## life 0.3189 0.1210 2.635
##
## Intercepts:
## Value Std. Error t value
## 1|2 -0.2819 0.6423 -0.4389
## 2|3 1.2128 0.6607 1.8357
## 3|4 2.2094 0.7210 3.0644
##
## Residual Deviance: 99.0979
## AIC: 109.0979
Jawaban Bagian A
coefmodel<-c(-model$coefficients,model$zeta)
data.frame(coefmodel,expcoef=exp(coefmodel))
## coefmodel expcoef
## ses1 1.1112310 3.0380960
## life -0.3188613 0.7269764
## 1|2 -0.2819031 0.7543468
## 2|3 1.2127926 3.3628626
## 3|4 2.2093721 9.1099947
Logit[Peluang MI di bawah atau setara well]
\[logit\left [ P\left ( Y\leq 1 \right ) \right ]=-0.2819-0.3189Life+1.1112ses\]
- $e^{-0.2819}=0.754$ nilai odds
Peluang seseorang yang berasal dari status sosial ekkonomi rendah (\(ses=0\)) dan memiliki life event score = 0 untuk memiliki gangguan mental di bawah atau setara dengan well adalah 0.754 kali dibandingkan peluang orang tersebut memiliki gangguan mental di atas well.
- $e^{-0.3189}=0.726$ nilai odds ratio
Odd bahwa seseorang memiliki gangguan mental di bawah atau setara dengan well (dibanding memiliki gangguan mental di atas well) jika life event score naik 1 satuan adalah 0.726 kali dibandingkan odd yang sama jika life event score tetap dengan asumsi status sosial ekonomi tidak berubah.
- $e^{1.1112}=3.038$ nilai odds ratio
Odd bahwa seseorang memiliki gangguan mental di bawah atau setara dengan well (dibanding memiliki gangguan mental di atas well) jika status sosial ekonomi tinggi adalah 3.038 kali dibandingkan odd yang sama jika status sosial ekonomi rendah dengan asumsi life event score tidak berubah.
Logit[Peluang MI di bawah atau setara mild]
\[logit\left [ P\left ( Y\leq 1 \right ) \right ]=1.2128-0.3189Life+1.1112ses\]
- $e^{1.2128}=3.362$ nilai odds
Peluang seseorang yang berasal dari status sosial ekkonomi rendah (\(ses=0\)) dan memiliki life event score = 0 untuk memiliki gangguan mental di bawah atau setara dengan mild adalah 3.362 kali dibandingkan peluang orang tersebut memiliki gangguan mental di atas mild.
- $e^{-0.3189}=0.726$ nilai odds ratio
Odd bahwa seseorang memiliki gangguan mental di bawah atau setara dengan mild (dibanding memiliki gangguan mental di atas mild) jika life event score naik 1 satuan adalah 0.726 kali dibandingkan odd yang sama jika life event score tetap dengan asumsi status sosial ekonomi tidak berubah.
- $e^{1.1112}=3.038$ nilai odds ratio
Odd bahwa seseorang memiliki gangguan mental di bawah atau setara dengan mild (dibanding memiliki gangguan mental di atas mild) jika status sosial ekonomi tinggi adalah 3.038 kali dibandingkan odd yang sama jika status sosial ekonomi rendah dengan asumsi life event score tidak berubah.
Logit[Peluang MI di bawah atau setara moderate]
\[logit\left [ P\left ( Y\leq 1 \right ) \right ]=2.2094-0.3189Life+1.1112ses\]
- $e^{2.2094}=9.110$ nilai odds
Peluang seseorang yang berasal dari status sosial ekkonomi rendah (\(ses=0\)) dan memiliki life event score = 0 untuk memiliki gangguan mental di bawah atau setara dengan moderate adalah 0.754 kali dibandingkan peluang orang tersebut memiliki gangguan mental di atas moderate.
- $e^{-0.3189}=0.726$ nilai odds ratio
Odd bahwa seseorang memiliki gangguan mental di bawah atau setara dengan moderate (dibanding memiliki gangguan mental di atas moderate) jika life event score naik 1 satuan adalah 0.726 kali dibandingkan odd yang sama jika life event score tetap dengan asumsi status sosial ekonomi tidak berubah.
- $e^{1.1112}=3.038$ nilai odds ratio
Odd bahwa seseorang memiliki gangguan mental di bawah atau setara dengan moderate (dibanding memiliki gangguan mental di atas moderate) jika status sosial ekonomi tinggi adalah 3.038 kali dibandingkan odd yang sama jika status sosial ekonomi rendah dengan asumsi life event score tidak berubah.
Jawaban Bagian B
\[ \frac{P\left ( \widehat{Y}\leq 1 \right )}{1-P\left ( \widehat{Y}\leq 1 \right )}=e^{-0.2819-0.3189Life+1.1112ses}\] Sehingga,
\[ P\left ( \widehat{Y}\leq 1 \right )=\frac{e^{-0.2819-0.3189Life+1.1112ses}}{1+e^{-0.2819-0.3189Life+1.1112ses}}\]
\[ \frac{P\left ( \widehat{Y}\leq 2 \right )}{1-P\left ( \widehat{Y}\leq 2 \right )}=e^{1.2128-0.3189Life+1.1112ses}\] Sehingga,
\[ P\left ( \widehat{Y}\leq 2 \right )=\frac{e^{1.2128-0.3189Life+1.1112ses}}{1+e^{1.2128-0.3189Life+1.1112ses}}\]
\[ \frac{P\left ( \widehat{Y}\leq 3 \right )}{1-P\left ( \widehat{Y}\leq 3 \right )}=e^{2.2094-0.3189Life+1.1112ses}\] Sehingga,
\[ P\left ( \widehat{Y}\leq 3 \right )=\frac{e^{2.2094-0.3189Life+1.1112ses}}{1+e^{2.2094-0.3189Life+1.1112ses}}\]
Jadi,
\[ P\left ( \widehat{Y}= 1 \right )= P\left ( \widehat{Y}\leq 1 \right )=\frac{e^{-0.2819-0.3189Life+1.1112ses}}{1+e^{-0.2819-0.3189Life+1.1112ses}}\] \[ P\left ( \widehat{Y}= 3 \right )= P\left ( \widehat{Y}\leq 3 \right )-P\left ( \widehat{Y}\leq 2 \right )\] \[ P\left ( \widehat{Y}= 3 \right )= \left ( \frac{e^{2.2094-0.3189Life+1.1112ses}}{1+e^{2.2094-0.3189Life+1.1112ses}} \right )-\left ( \frac{e^{1.2128-0.3189Life+1.1112ses}}{1+e^{1.2128-0.3189Life+1.1112ses}} \right )\] \[ P\left ( \widehat{Y}>2 \right )= 1-P\left ( \widehat{Y}\leq 1 \right )=1-\left ( \frac{e^{-0.2819-0.3189Life+1.1112ses}}{1+e^{-0.2819-0.3189Life+1.1112ses}} \right )\] ### Contoh
new<-data.frame(ses=factor(c(1)),life=4)
predik<-predict(model, newdata=new, type="probs") #peluang point
peluang<-data.frame(cumulatif=cumsum(predik),point=predik)
peluang
## cumulatif point
## 1 0.3902843 0.3902843
## 2 0.7405018 0.3502175
## 3 0.8854574 0.1449556
## 4 1.0000000 0.1145426
#peluang p(>2)
1-peluang[1,1]
## [1] 0.6097157
Jawaban Bagian C
Menguji pengaruh interaksi life score dan ses terhadap gangguan mental
model1<-polr(mental.degree~life*ses,method="logistic")
summary(model1)
##
## Re-fitting to get Hessian
## Call:
## polr(formula = mental.degree ~ life * ses, method = "logistic")
##
## Coefficients:
## Value Std. Error t value
## life 0.4204 0.1864 2.2551
## ses1 -0.3709 1.1361 -0.3265
## life:ses1 -0.1813 0.2383 -0.7608
##
## Intercepts:
## Value Std. Error t value
## 1|2 0.0981 0.8195 0.1197
## 2|3 1.5925 0.8396 1.8968
## 3|4 2.6066 0.9035 2.8849
##
## Residual Deviance: 98.50444
## AIC: 110.5044
lrtest(model1,model)#cek interaksi
## Likelihood ratio test
##
## Model 1: mental.degree ~ life * ses
## Model 2: mental.degree ~ ses + life
## #Df LogLik Df Chisq Pr(>Chisq)
## 1 6 -49.252
## 2 5 -49.549 -1 0.5935 0.4411
- Hipotesis:
\(H_0\): \(logit\left [ P\left ( Y\leq j \right ) \right ]=\alpha_j+\beta_1life+\beta_2ses\) interaksi life dan ses tidak berpengaruh nyata terhadap gangguan mental.
\(H_1\): \(logit\left [ P\left ( Y\leq j \right ) \right ]=\alpha_j+\beta_1life+\beta_2ses+\beta_3life\times ses\) interaksi life dan ses berpengaruh nyata terhadap gangguan mental.
- Taraf Signifikan
\(\alpha=5\%\)
- Statistik Uji
\(\bigtriangleup Deviance\)=Deviance model tanpa interaksi-Deviance model dengan interaksi=\(99.0979-98.50444=0.5935\)
\(db\)=parameter model tanpa interaksi-parameter model dengan interaksi=\(6-5=1\)
- RR
Tolak \(H_0\) jika \(\bigtriangleup Deviance > \chi ^{2}_{0.05,4}=3.841\)
- Keputusan
Karena 0.5935<9.49, maka gagal tolak \(H_0\)
- Kesimpulan
Dengan taraf nyata \(5\%\) ada cukup bukti untuk mengatakan bahwa interaksi life dan ses tidak berpengaruh nyata terhadap gangguan mental.
Menguji pengaruh life terhadap gangguan mental
model2<-polr(mental.degree~life,method="logistic")
summary(model2)
##
## Re-fitting to get Hessian
## Call:
## polr(formula = mental.degree ~ life, method = "logistic")
##
## Coefficients:
## Value Std. Error t value
## life 0.2879 0.1175 2.451
##
## Intercepts:
## Value Std. Error t value
## 1|2 0.2614 0.5639 0.4636
## 2|3 1.6563 0.6171 2.6838
## 3|4 2.5876 0.6938 3.7296
##
## Residual Deviance: 102.5271
## AIC: 110.5271
lrtest (model2,model)
## Likelihood ratio test
##
## Model 1: mental.degree ~ life
## Model 2: mental.degree ~ ses + life
## #Df LogLik Df Chisq Pr(>Chisq)
## 1 4 -51.264
## 2 5 -49.549 1 3.4292 0.06405 .
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
- Hipotesis:
\(H_0\): \(\beta_2=0\) life tidak berpengaruh nyata terhadap gangguan mental.
\(H_1\): \(\beta_2 \neq 0\) life berpengaruh nyata terhadap gangguan mental.
- Taraf Signifikan
\(\alpha=5\%\)
- Statistik Uji
\(\bigtriangleup Deviance\)=Deviance model tanpa interaksi-Deviance model dengan interaksi=\(102.5271-99.0979=3.4294\)
\(db\)=parameter model tanpa interaksi-parameter model dengan interaksi=\(5-4=1\)
- RR
Tolak \(H_0\) jika \(\bigtriangleup Deviance > \chi ^{2}_{0.05,4}=3.841\)
- Keputusan
Karena 3.4294<3.841, maka gagal tolak \(H_0\)
- Kesimpulan
Dengan taraf nyata \(5\%\) ada cukup bukti untuk mengatakan bahwa life tidak berpengaruh nyata terhadap gangguan mental.
Menguji pengaruh ses terhadap gangguan mental
model3<-polr(mental.degree~ses,method="logistic")
summary(model3)
##
## Re-fitting to get Hessian
## Call:
## polr(formula = mental.degree ~ ses, method = "logistic")
##
## Coefficients:
## Value Std. Error t value
## ses1 -0.8553 0.5865 -1.458
##
## Intercepts:
## Value Std. Error t value
## 1|2 -1.3638 0.5038 -2.7070
## 2|3 -0.0417 0.4448 -0.0938
## 3|4 0.8306 0.4659 1.7827
##
## Residual Deviance: 106.8744
## AIC: 114.8744
- Hipotesis:
\(H_0\): \(\beta_3=0\) ses tidak berpengaruh nyata terhadap gangguan mental.
\(H_1\): \(\beta_3 \neq 0\) ses berpengaruh nyata terhadap gangguan mental.
- Taraf Signifikan
\(\alpha=5\%\)
- Statistik Uji
\(\bigtriangleup Deviance\)=Deviance model tanpa interaksi-Deviance model dengan interaksi=\(106.8744-99.0979=7.7765\)
\(db\)=parameter model tanpa interaksi-parameter model dengan interaksi=\(5-4=1\)
- RR
Tolak \(H_0\) jika \(\bigtriangleup Deviance > \chi ^{2}_{0.05,4}=3.841\)
- Keputusan
Karena 7.7765>3.841, maka tolak \(H_0\)
- Kesimpulan
Dengan taraf nyata \(5\%\) ada cukup bukti untuk mengatakan bahwa ses berpengaruh nyata terhadap gangguan mental.
Jadi, peubah yang sinifkan memvengaruh gangguan mental adalah ses sehingga model terbaik yang terventuk adalah:
\[logit\left [ P\left ( Y\leq j \right ) \right ]=\alpha_j-0.8553ses; j=1,2,3\]
Model untuk tiap kategori gangguan mental adalah:
- logit[ Peluang MI di bawah atau setara well]
\[logit\left [ P\left ( Y\leq 1 \right ) \right ]=-1.3638-0.8553ses\]
- logit[ Peluang MI di bawah atau setara mild]
\[logit\left [ P\left ( Y\leq 2 \right ) \right ]=-0.0417-0.8553ses\]
- logit[ Peluang MI di bawah atau setara moderate]
\[logit\left [ P\left ( Y\leq 3 \right ) \right ]=0.8306-0.8553ses\]
Jawaban Bagian D
new=data.frame(life=8,ses=as.factor("1"))
predict(model3,newdata=new,"probs")
## 1 2 3 4
## 0.3755634 0.3173147 0.1508126 0.1563094
Berdasarkan hasil output R di atas maka dugaan mental impairment-nya adalah well karena memiliki peluang paling besar