Responsi 7 STA1543-Analisis Data Kategorik

2022-09-22

Minggu ke-7 Bagian 3 ini akan membahas mengenai: Penerapan Regresi Logistik Ordinal

Pendahuluan

Regresi logistik ordinal digunakan untuk memodelkan hubungan antara peubah respon lebih dari dua kategori berskala ordinal (ada tingkatan) dengan satu atau lebih peubah penjelas. Peubah penjelasnya bisa berupa data kontinu atau kategorik.

Soal 1

setwd("C:\\Users\\ACER\\Downloads\\")

Jawaban Soal 1

Input Data

dataku<-read.csv("data_mental.csv", sep=";", header=TRUE)
dim(dataku)
## [1] 40  5
head(dataku)
##   Mental_Imp degree degree_2 x2 x1
## 1       well      1        4  1  1
## 2       well      1        4  1  9
## 3       well      1        4  1  4
## 4       well      1        4  1  3
## 5       well      1        4  0  2
## 6       well      1        4  1  0
mental.degree<-factor(dataku$degree)
ses<-factor(dataku$x2)
life<-dataku$x1
data.frame(mental.degree,ses,life)
##    mental.degree ses life
## 1              1   1    1
## 2              1   1    9
## 3              1   1    4
## 4              1   1    3
## 5              1   0    2
## 6              1   1    0
## 7              1   0    1
## 8              1   1    3
## 9              1   1    3
## 10             1   1    7
## 11             1   0    1
## 12             1   0    2
## 13             2   1    5
## 14             2   0    6
## 15             2   1    3
## 16             2   0    1
## 17             2   1    8
## 18             2   1    2
## 19             2   0    5
## 20             2   1    5
## 21             2   1    9
## 22             2   0    3
## 23             2   1    3
## 24             2   1    1
## 25             3   0    0
## 26             3   1    4
## 27             3   0    3
## 28             3   0    9
## 29             3   1    6
## 30             3   0    4
## 31             3   0    3
## 32             4   1    8
## 33             4   1    2
## 34             4   1    7
## 35             4   0    5
## 36             4   0    4
## 37             4   0    4
## 38             4   1    8
## 39             4   0    8
## 40             4   0    9

Fitting Model

model<-polr(mental.degree~ses+life, method="logistic")
summary(model)
## 
## Re-fitting to get Hessian
## Call:
## polr(formula = mental.degree ~ ses + life, method = "logistic")
## 
## Coefficients:
##        Value Std. Error t value
## ses1 -1.1112     0.6109  -1.819
## life  0.3189     0.1210   2.635
## 
## Intercepts:
##     Value   Std. Error t value
## 1|2 -0.2819  0.6423    -0.4389
## 2|3  1.2128  0.6607     1.8357
## 3|4  2.2094  0.7210     3.0644
## 
## Residual Deviance: 99.0979 
## AIC: 109.0979

Jawaban Bagian A

coefmodel<-c(-model$coefficients,model$zeta)
data.frame(coefmodel,expcoef=exp(coefmodel)) 
##       coefmodel   expcoef
## ses1  1.1112310 3.0380960
## life -0.3188613 0.7269764
## 1|2  -0.2819031 0.7543468
## 2|3   1.2127926 3.3628626
## 3|4   2.2093721 9.1099947

Logit[Peluang MI di bawah atau setara well]

\[logit\left [ P\left ( Y\leq 1 \right ) \right ]=-0.2819-0.3189Life+1.1112ses\]

  1. $e^{-0.2819}=0.754$ nilai odds

Peluang seseorang yang berasal dari status sosial ekkonomi rendah (\(ses=0\)) dan memiliki life event score = 0 untuk memiliki gangguan mental di bawah atau setara dengan well adalah 0.754 kali dibandingkan peluang orang tersebut memiliki gangguan mental di atas well.

  1. $e^{-0.3189}=0.726$ nilai odds ratio

Odd bahwa seseorang memiliki gangguan mental di bawah atau setara dengan well (dibanding memiliki gangguan mental di atas well) jika life event score naik 1 satuan adalah 0.726 kali dibandingkan odd yang sama jika life event score tetap dengan asumsi status sosial ekonomi tidak berubah.

  1. $e^{1.1112}=3.038$ nilai odds ratio

Odd bahwa seseorang memiliki gangguan mental di bawah atau setara dengan well (dibanding memiliki gangguan mental di atas well) jika status sosial ekonomi tinggi adalah 3.038 kali dibandingkan odd yang sama jika status sosial ekonomi rendah dengan asumsi life event score tidak berubah.

Logit[Peluang MI di bawah atau setara mild]

\[logit\left [ P\left ( Y\leq 1 \right ) \right ]=1.2128-0.3189Life+1.1112ses\]

  1. $e^{1.2128}=3.362$ nilai odds

Peluang seseorang yang berasal dari status sosial ekkonomi rendah (\(ses=0\)) dan memiliki life event score = 0 untuk memiliki gangguan mental di bawah atau setara dengan mild adalah 3.362 kali dibandingkan peluang orang tersebut memiliki gangguan mental di atas mild.

  1. $e^{-0.3189}=0.726$ nilai odds ratio

Odd bahwa seseorang memiliki gangguan mental di bawah atau setara dengan mild (dibanding memiliki gangguan mental di atas mild) jika life event score naik 1 satuan adalah 0.726 kali dibandingkan odd yang sama jika life event score tetap dengan asumsi status sosial ekonomi tidak berubah.

  1. $e^{1.1112}=3.038$ nilai odds ratio

Odd bahwa seseorang memiliki gangguan mental di bawah atau setara dengan mild (dibanding memiliki gangguan mental di atas mild) jika status sosial ekonomi tinggi adalah 3.038 kali dibandingkan odd yang sama jika status sosial ekonomi rendah dengan asumsi life event score tidak berubah.

Logit[Peluang MI di bawah atau setara moderate]

\[logit\left [ P\left ( Y\leq 1 \right ) \right ]=2.2094-0.3189Life+1.1112ses\]

  1. $e^{2.2094}=9.110$ nilai odds

Peluang seseorang yang berasal dari status sosial ekkonomi rendah (\(ses=0\)) dan memiliki life event score = 0 untuk memiliki gangguan mental di bawah atau setara dengan moderate adalah 0.754 kali dibandingkan peluang orang tersebut memiliki gangguan mental di atas moderate.

  1. $e^{-0.3189}=0.726$ nilai odds ratio

Odd bahwa seseorang memiliki gangguan mental di bawah atau setara dengan moderate (dibanding memiliki gangguan mental di atas moderate) jika life event score naik 1 satuan adalah 0.726 kali dibandingkan odd yang sama jika life event score tetap dengan asumsi status sosial ekonomi tidak berubah.

  1. $e^{1.1112}=3.038$ nilai odds ratio

Odd bahwa seseorang memiliki gangguan mental di bawah atau setara dengan moderate (dibanding memiliki gangguan mental di atas moderate) jika status sosial ekonomi tinggi adalah 3.038 kali dibandingkan odd yang sama jika status sosial ekonomi rendah dengan asumsi life event score tidak berubah.

Jawaban Bagian B

\[ \frac{P\left ( \widehat{Y}\leq 1 \right )}{1-P\left ( \widehat{Y}\leq 1 \right )}=e^{-0.2819-0.3189Life+1.1112ses}\] Sehingga,

\[ P\left ( \widehat{Y}\leq 1 \right )=\frac{e^{-0.2819-0.3189Life+1.1112ses}}{1+e^{-0.2819-0.3189Life+1.1112ses}}\]

\[ \frac{P\left ( \widehat{Y}\leq 2 \right )}{1-P\left ( \widehat{Y}\leq 2 \right )}=e^{1.2128-0.3189Life+1.1112ses}\] Sehingga,

\[ P\left ( \widehat{Y}\leq 2 \right )=\frac{e^{1.2128-0.3189Life+1.1112ses}}{1+e^{1.2128-0.3189Life+1.1112ses}}\]

\[ \frac{P\left ( \widehat{Y}\leq 3 \right )}{1-P\left ( \widehat{Y}\leq 3 \right )}=e^{2.2094-0.3189Life+1.1112ses}\] Sehingga,

\[ P\left ( \widehat{Y}\leq 3 \right )=\frac{e^{2.2094-0.3189Life+1.1112ses}}{1+e^{2.2094-0.3189Life+1.1112ses}}\]

Jadi,

\[ P\left ( \widehat{Y}= 1 \right )= P\left ( \widehat{Y}\leq 1 \right )=\frac{e^{-0.2819-0.3189Life+1.1112ses}}{1+e^{-0.2819-0.3189Life+1.1112ses}}\] \[ P\left ( \widehat{Y}= 3 \right )= P\left ( \widehat{Y}\leq 3 \right )-P\left ( \widehat{Y}\leq 2 \right )\] \[ P\left ( \widehat{Y}= 3 \right )= \left ( \frac{e^{2.2094-0.3189Life+1.1112ses}}{1+e^{2.2094-0.3189Life+1.1112ses}} \right )-\left ( \frac{e^{1.2128-0.3189Life+1.1112ses}}{1+e^{1.2128-0.3189Life+1.1112ses}} \right )\] \[ P\left ( \widehat{Y}>2 \right )= 1-P\left ( \widehat{Y}\leq 1 \right )=1-\left ( \frac{e^{-0.2819-0.3189Life+1.1112ses}}{1+e^{-0.2819-0.3189Life+1.1112ses}} \right )\] ### Contoh

new<-data.frame(ses=factor(c(1)),life=4) 
predik<-predict(model, newdata=new, type="probs") #peluang point
peluang<-data.frame(cumulatif=cumsum(predik),point=predik) 
peluang
##   cumulatif     point
## 1 0.3902843 0.3902843
## 2 0.7405018 0.3502175
## 3 0.8854574 0.1449556
## 4 1.0000000 0.1145426
#peluang p(>2)
1-peluang[1,1] 
## [1] 0.6097157

Jawaban Bagian C

Menguji pengaruh interaksi life score dan ses terhadap gangguan mental

model1<-polr(mental.degree~life*ses,method="logistic") 
summary(model1)
## 
## Re-fitting to get Hessian
## Call:
## polr(formula = mental.degree ~ life * ses, method = "logistic")
## 
## Coefficients:
##             Value Std. Error t value
## life       0.4204     0.1864  2.2551
## ses1      -0.3709     1.1361 -0.3265
## life:ses1 -0.1813     0.2383 -0.7608
## 
## Intercepts:
##     Value   Std. Error t value
## 1|2  0.0981  0.8195     0.1197
## 2|3  1.5925  0.8396     1.8968
## 3|4  2.6066  0.9035     2.8849
## 
## Residual Deviance: 98.50444 
## AIC: 110.5044
lrtest(model1,model)#cek interaksi
## Likelihood ratio test
## 
## Model 1: mental.degree ~ life * ses
## Model 2: mental.degree ~ ses + life
##   #Df  LogLik Df  Chisq Pr(>Chisq)
## 1   6 -49.252                     
## 2   5 -49.549 -1 0.5935     0.4411
  1. Hipotesis:

\(H_0\): \(logit\left [ P\left ( Y\leq j \right ) \right ]=\alpha_j+\beta_1life+\beta_2ses\) interaksi life dan ses tidak berpengaruh nyata terhadap gangguan mental.

\(H_1\): \(logit\left [ P\left ( Y\leq j \right ) \right ]=\alpha_j+\beta_1life+\beta_2ses+\beta_3life\times ses\) interaksi life dan ses berpengaruh nyata terhadap gangguan mental.

  1. Taraf Signifikan

\(\alpha=5\%\)

  1. Statistik Uji

\(\bigtriangleup Deviance\)=Deviance model tanpa interaksi-Deviance model dengan interaksi=\(99.0979-98.50444=0.5935\)

\(db\)=parameter model tanpa interaksi-parameter model dengan interaksi=\(6-5=1\)

  1. RR

Tolak \(H_0\) jika \(\bigtriangleup Deviance > \chi ^{2}_{0.05,4}=3.841\)

  1. Keputusan

Karena 0.5935<9.49, maka gagal tolak \(H_0\)

  1. Kesimpulan

Dengan taraf nyata \(5\%\) ada cukup bukti untuk mengatakan bahwa interaksi life dan ses tidak berpengaruh nyata terhadap gangguan mental.

Menguji pengaruh life terhadap gangguan mental

model2<-polr(mental.degree~life,method="logistic") 
summary(model2)
## 
## Re-fitting to get Hessian
## Call:
## polr(formula = mental.degree ~ life, method = "logistic")
## 
## Coefficients:
##       Value Std. Error t value
## life 0.2879     0.1175   2.451
## 
## Intercepts:
##     Value  Std. Error t value
## 1|2 0.2614 0.5639     0.4636 
## 2|3 1.6563 0.6171     2.6838 
## 3|4 2.5876 0.6938     3.7296 
## 
## Residual Deviance: 102.5271 
## AIC: 110.5271
lrtest (model2,model)
## Likelihood ratio test
## 
## Model 1: mental.degree ~ life
## Model 2: mental.degree ~ ses + life
##   #Df  LogLik Df  Chisq Pr(>Chisq)  
## 1   4 -51.264                       
## 2   5 -49.549  1 3.4292    0.06405 .
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  1. Hipotesis:

\(H_0\): \(\beta_2=0\) life tidak berpengaruh nyata terhadap gangguan mental.

\(H_1\): \(\beta_2 \neq 0\) life berpengaruh nyata terhadap gangguan mental.

  1. Taraf Signifikan

\(\alpha=5\%\)

  1. Statistik Uji

\(\bigtriangleup Deviance\)=Deviance model tanpa interaksi-Deviance model dengan interaksi=\(102.5271-99.0979=3.4294\)

\(db\)=parameter model tanpa interaksi-parameter model dengan interaksi=\(5-4=1\)

  1. RR

Tolak \(H_0\) jika \(\bigtriangleup Deviance > \chi ^{2}_{0.05,4}=3.841\)

  1. Keputusan

Karena 3.4294<3.841, maka gagal tolak \(H_0\)

  1. Kesimpulan

Dengan taraf nyata \(5\%\) ada cukup bukti untuk mengatakan bahwa life tidak berpengaruh nyata terhadap gangguan mental.

Menguji pengaruh ses terhadap gangguan mental

model3<-polr(mental.degree~ses,method="logistic") 
summary(model3)
## 
## Re-fitting to get Hessian
## Call:
## polr(formula = mental.degree ~ ses, method = "logistic")
## 
## Coefficients:
##        Value Std. Error t value
## ses1 -0.8553     0.5865  -1.458
## 
## Intercepts:
##     Value   Std. Error t value
## 1|2 -1.3638  0.5038    -2.7070
## 2|3 -0.0417  0.4448    -0.0938
## 3|4  0.8306  0.4659     1.7827
## 
## Residual Deviance: 106.8744 
## AIC: 114.8744
  1. Hipotesis:

\(H_0\): \(\beta_3=0\) ses tidak berpengaruh nyata terhadap gangguan mental.

\(H_1\): \(\beta_3 \neq 0\) ses berpengaruh nyata terhadap gangguan mental.

  1. Taraf Signifikan

\(\alpha=5\%\)

  1. Statistik Uji

\(\bigtriangleup Deviance\)=Deviance model tanpa interaksi-Deviance model dengan interaksi=\(106.8744-99.0979=7.7765\)

\(db\)=parameter model tanpa interaksi-parameter model dengan interaksi=\(5-4=1\)

  1. RR

Tolak \(H_0\) jika \(\bigtriangleup Deviance > \chi ^{2}_{0.05,4}=3.841\)

  1. Keputusan

Karena 7.7765>3.841, maka tolak \(H_0\)

  1. Kesimpulan

Dengan taraf nyata \(5\%\) ada cukup bukti untuk mengatakan bahwa ses berpengaruh nyata terhadap gangguan mental.

Jadi, peubah yang sinifkan memvengaruh gangguan mental adalah ses sehingga model terbaik yang terventuk adalah:

\[logit\left [ P\left ( Y\leq j \right ) \right ]=\alpha_j-0.8553ses; j=1,2,3\]

Model untuk tiap kategori gangguan mental adalah:

  1. logit[ Peluang MI di bawah atau setara well]

\[logit\left [ P\left ( Y\leq 1 \right ) \right ]=-1.3638-0.8553ses\]

  1. logit[ Peluang MI di bawah atau setara mild]

\[logit\left [ P\left ( Y\leq 2 \right ) \right ]=-0.0417-0.8553ses\]

  1. logit[ Peluang MI di bawah atau setara moderate]

\[logit\left [ P\left ( Y\leq 3 \right ) \right ]=0.8306-0.8553ses\]

Jawaban Bagian D

new=data.frame(life=8,ses=as.factor("1"))
predict(model3,newdata=new,"probs")
##         1         2         3         4 
## 0.3755634 0.3173147 0.1508126 0.1563094

Berdasarkan hasil output R di atas maka dugaan mental impairment-nya adalah well karena memiliki peluang paling besar