Responsi 6.2 STA1543-Analisis Data Kategorik

2022-09-01

Minggu ke-6 bagian 2 ini akan membahas mengenai: Model Regresi Logit Binomial-II (Peubah Bebasnya Kategorik)

Review

Regresi logistik biner digunakan untuk memodelkan hubungan antara peubah respon yang terdiri dari dua kategori dengan satu atau lebih peubah penjelas. Peubah penjelasanya bisa berupa data kontinu atau kategorik. Sebelumnya kita telah membahas dengan peubah bebasnya kontinu. Sekarang kita akan bahas untuk peubah bebasnya kategorik.

Soal

Jawaban Soal 1

setwd("C:\\Users\\ACER\\Downloads\\")

Input Data

dataku <- read.csv("datacrab.csv",sep=";")
head(dataku)
##   C S    W   Wt Sa
## 1 2 3 28.3 3.05  8
## 2 3 3 26.0 2.60  4
## 3 3 3 25.6 2.15  0
## 4 4 2 21.0 1.85  0
## 5 2 3 29.0 3.00  1
## 6 1 2 25.0 2.30  3
str(dataku)
## 'data.frame':    173 obs. of  5 variables:
##  $ C : int  2 3 3 4 2 1 4 2 2 2 ...
##  $ S : int  3 3 3 2 3 2 3 3 1 3 ...
##  $ W : num  28.3 26 25.6 21 29 25 26.2 24.9 25.7 27.5 ...
##  $ Wt: num  3.05 2.6 2.15 1.85 3 2.3 1.3 2.1 2 3.15 ...
##  $ Sa: int  8 4 0 0 1 3 0 0 8 6 ...

Pendefinisian Peubah

c<- factor(dataku[,1])
s<- factor(dataku[,2])
w<- dataku[,3]
wt<- dataku[,4]
sa<- dataku[,5]
y<- c(1:173)
for (i in 1:length(sa))
{
if(sa[i]>0)(y[i]=1)else(y[i]=0)
}

Menentukan Referensi Peubah Kategorik

color<-relevel(c,ref="4")#menentukan referensi pada peubah warna
spine<-relevel(s,ref="3")#menentukan referensi pada peubah spine
width<-w

Model Regresi Logistik Dengan Peubah Bebas Width Dan Color

head(data.frame(color,width,wt,sa,y))
##   color width   wt sa y
## 1     2  28.3 3.05  8 1
## 2     3  26.0 2.60  4 1
## 3     3  25.6 2.15  0 0
## 4     4  21.0 1.85  0 0
## 5     2  29.0 3.00  1 1
## 6     1  25.0 2.30  3 1
model<-glm(y~color+width, family=binomial("link"=logit))
summary(model)
## 
## Call:
## glm(formula = y ~ color + width, family = binomial(link = logit))
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -2.1124  -0.9848   0.5243   0.8513   2.1413  
## 
## Coefficients:
##             Estimate Std. Error z value Pr(>|z|)    
## (Intercept) -12.7151     2.7617  -4.604 4.14e-06 ***
## color1        1.3299     0.8525   1.560   0.1188    
## color2        1.4023     0.5484   2.557   0.0106 *  
## color3        1.1061     0.5921   1.868   0.0617 .  
## width         0.4680     0.1055   4.434 9.26e-06 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 225.76  on 172  degrees of freedom
## Residual deviance: 187.46  on 168  degrees of freedom
## AIC: 197.46
## 
## Number of Fisher Scoring iterations: 4

Interpretasi Koefisien Regresi

exp(model$coefficients)
##  (Intercept)       color1       color2       color3        width 
## 3.005364e-06 3.780738e+00 4.064684e+00 3.022612e+00 1.596727e+00

Interpretasi dugaan parameter model:

  1. \(exp(b_0)=3.005\)

tanpa memperhatikan lebar cangkang serta warna cangkang, peluang kepiting betina untuk menarik kepiting jantan adalah \(3.005\) kali dibandingkan peluang untuk tidak menarik kepiting jantan

  1. \(exp(b1_1)=3.78\)

Odds kepiting betina yang mampu menarik kepiting jantan jika ia berwarna medium-light color adalah \(3.78\) kali dibandingkan odd yang sama jika kepiting tersebut berwarna dark dengan lebar cangkang kepiting sama.

  1. \(exp(b1_2)=4.06\)

Odds kepiting betina yang mampu menarik kepiting jantan jika ia berwarna medium- color adalah \(4.06\) kali dibandingkan odd yang sama jika kepiting tersebut berwarna dark dengan lebar cangkang kepiting sama.

  1. \(exp(b1_3)=3.02\)

Odds kepiting betina yang mampu menarik kepiting jantan jika ia berwarna medium-dark color adalah \(3.02\) kali dibandingkan odd yang sama jika kepiting tersebut berwarna dark dengan lebar cangkang kepiting sama.

  1. \(exp(b2)=1.59\)

Odds pada kepiting betina yang mampu menarik kepiting jantan akan meningkat sebesar \(1.59\) kali jika lebar cangkang naik sebesar satu satuan dengan warna cangkang kepiting sama.

Model Regresi Logistik Dengan Peubah Bebas Width, Color, Dan Spine (Tanpa Interaksi)

model2<-glm(y~color+width+spine,
family=binomial("link"=logit))
summary(model2)
## 
## Call:
## glm(formula = y ~ color + width + spine, family = binomial(link = logit))
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -2.1206  -0.9724   0.5076   0.8750   2.1158  
## 
## Coefficients:
##             Estimate Std. Error z value Pr(>|z|)    
## (Intercept) -12.3908     2.8193  -4.395 1.11e-05 ***
## color1        1.6683     0.9328   1.788  0.07371 .  
## color2        1.5249     0.5672   2.689  0.00718 ** 
## color3        1.1443     0.5933   1.929  0.05377 .  
## width         0.4562     0.1078   4.233 2.31e-05 ***
## spine1       -0.3770     0.5019  -0.751  0.45254    
## spine2       -0.4348     0.6254  -0.695  0.48687    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 225.76  on 172  degrees of freedom
## Residual deviance: 186.61  on 166  degrees of freedom
## AIC: 200.61
## 
## Number of Fisher Scoring iterations: 4

Uji Deviance Menguji Pengaruh Spine

Hipotesis

  1. \(H_0\) : \(\beta_3=0\) peubah spine tidak berpengaruh terhadap peubah respon

  2. \(H_0\) : \(\beta_3 \neq 0\) peubah spine berpengaruh terhadap peubah respon

Taraf Nyata

\(\alpha=5\%\)

Statistik Uji: LRT

Daerah Penolakan

Tolak \(H_0\) jika \(G^{2}> \chi ^{2}_{0.05, db}\) = \(G^{2}> \chi ^{2}_{0.05, 2}\)

Keputusan

Karena \(0.85 < 5.991\), maka Tidak Cukup Bukti Untuk Tolak \(H_0\)

Kesimpulan

Tidak cukup bukti untuk tolak \(H_0\) pada taraf nyata \(5\%\). Dengan kata lain, peubah spine tidak berpengaruh nyata.

model3<-glm(y~color+width+spine+color*spine,
family=binomial("link"=logit))
summary(model3)
## 
## Call:
## glm(formula = y ~ color + width + spine + color * spine, family = binomial(link = logit))
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -2.1553  -0.8955   0.4833   0.8377   2.0583  
## 
## Coefficients:
##                Estimate Std. Error z value Pr(>|z|)    
## (Intercept)    -11.8084     2.8711  -4.113 3.91e-05 ***
## color1         -17.0159  3956.1804  -0.004  0.99657    
## color2           1.5915     0.5941   2.679  0.00739 ** 
## color3           0.9631     0.6121   1.573  0.11563    
## width            0.4364     0.1097   3.976 7.00e-05 ***
## spine1         -16.8850  3956.1804  -0.004  0.99659    
## spine2         -14.9214  3956.1804  -0.004  0.99699    
## color1:spine1   35.0152  5594.8840   0.006  0.99501    
## color2:spine1   16.2429  3956.1804   0.004  0.99672    
## color3:spine1   33.5071  4539.3953   0.007  0.99411    
## color1:spine2   50.5146  6253.4059   0.008  0.99355    
## color2:spine2   13.9470  3956.1805   0.004  0.99719    
## color3:spine2   14.3689  3956.1806   0.004  0.99710    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 225.76  on 172  degrees of freedom
## Residual deviance: 177.60  on 160  degrees of freedom
## AIC: 203.6
## 
## Number of Fisher Scoring iterations: 16

Uji Deviance Menguji Pengaruh Interaksi Spine*Color

Hipotesis

  1. \(H_0\) : \(\beta_4=0\) interaksi spine dan color tidak berpengaruh terhadap ketertarikan jantan ke betina

  2. \(H_0\) : \(\beta_4 \neq 0\) interaksi spine dan color berpengaruh terhadap ketertarikan jantan ke betina

Taraf Nyata

\(\alpha=5\%\)

Statistik Uji: LRT

Daerah Penolakan

Tolak \(H_0\) jika \(G^{2}> \chi ^{2}_{0.05, db}\) = \(G^{2}> \chi ^{2}_{0.05, 6}\)

Keputusan

Karena \(9.01 < 12.59\), maka Tidak Cukup Bukti Untuk Tolak \(H_0\)

Kesimpulan

Tidak cukup bukti untuk tolak \(H_0\) pada taraf nyata \(5\%\). Dengan kata lain, peubah interaksi spine dan color tidak berpengaruh nyata.

Soal 2

Jawaban Soal 2

setwd("C:\\Users\\ACER\\Downloads\\")

Input Data

z.sex<-as.factor(rep(c("1F","2M"),each=4)) 
x.treat<-as.factor(rep(c("1plac","2treat"),each=2,times=2))
y.impr<-as.factor(rep(c("1no","2yes"),times=4)) 
counts<-c(19,13,6,21,10,1,7,7) 
data<-data.frame(z.sex, x.treat, y.impr, counts)
data
##   z.sex x.treat y.impr counts
## 1    1F   1plac    1no     19
## 2    1F   1plac   2yes     13
## 3    1F  2treat    1no      6
## 4    1F  2treat   2yes     21
## 5    2M   1plac    1no     10
## 6    2M   1plac   2yes      1
## 7    2M  2treat    1no      7
## 8    2M  2treat   2yes      7

Penentuan Kategori Referensi

z.sex<-relevel(z.sex,ref="1F") 
x.treat<-relevel(x.treat,ref="1plac")
y.impr<-relevel(y.impr,ref="1no") 

Soal 2.A

Bentuk model regresi logistik untuk memprediksi improvement dari treatment, sex dan interaksi keduanya.Lakukan uji rasio likelihood dari interaksi antara treatment dan sex. Laporkan dan interpretasikan hasilnya secara menyeluruh dari pandangan subtantive

Data diatas masih berbentuk data agregasi, agar dapat dianalisis menggunakan GLM logit maka data tersebut perlu diubah menjadi data individu terlebih dahulu

data<- data[rep(1:nrow(data),data$counts),-4] 
head(data) 
##     z.sex x.treat y.impr
## 1      1F   1plac    1no
## 1.1    1F   1plac    1no
## 1.2    1F   1plac    1no
## 1.3    1F   1plac    1no
## 1.4    1F   1plac    1no
## 1.5    1F   1plac    1no
dim(data)[1]==sum(counts)
## [1] TRUE

Model Dengan Interaksi

\[log \left ( \frac{\pi }{1-\pi } \right )=\alpha+\beta_1 treatment + \beta_2 sex + \beta_3 treatment sex\] dengan,

modela1<-glm(y.impr~x.treat+z.sex+x.treat*z.sex, data=data, family=binomial("link"=logit)) 
summary(modela1) 
## 
## Call:
## glm(formula = y.impr ~ x.treat + z.sex + x.treat * z.sex, family = binomial(link = logit), 
##     data = data)
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -1.7344  -1.0211   0.1362   0.8261   2.1899  
## 
## Coefficients:
##                       Estimate Std. Error z value Pr(>|z|)   
## (Intercept)            -0.3795     0.3599  -1.054  0.29174   
## x.treat2treat           1.6323     0.5864   2.784  0.00538 **
## z.sex2M                -1.9231     1.1086  -1.735  0.08281 . 
## x.treat2treat:z.sex2M   0.6703     1.3150   0.510  0.61021   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 116.449  on 83  degrees of freedom
## Residual deviance:  97.944  on 80  degrees of freedom
## AIC: 105.94
## 
## Number of Fisher Scoring iterations: 4

Persamaan yang terbentuk adalah

\[log \left ( \frac{\widehat{\pi} }{1-\widehat{\pi} } \right )=-0.3795+1.6323 treatment -1.9231 sex + 0.6703 treatment sex\]

Model Tanpa Interaksi

\[log \left ( \frac{\pi }{1-\pi } \right )=\alpha+\beta_1 treatment + \beta_2 sex\] dengan,

modela2<-glm(y.impr~x.treat+z.sex, data=data, family=binomial("link"=logit)) 
summary(modela2)
## 
## Call:
## glm(formula = y.impr ~ x.treat + z.sex, family = binomial(link = logit), 
##     data = data)
## 
## Deviance Residuals: 
##      Min        1Q    Median        3Q       Max  
## -1.77642  -0.99909   0.07647   0.81742   2.02120  
## 
## Coefficients:
##               Estimate Std. Error z value Pr(>|z|)    
## (Intercept)    -0.4351     0.3452  -1.260 0.207553    
## x.treat2treat   1.7817     0.5187   3.435 0.000593 ***
## z.sex2M        -1.4687     0.5756  -2.551 0.010728 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 116.449  on 83  degrees of freedom
## Residual deviance:  98.222  on 81  degrees of freedom
## AIC: 104.22
## 
## Number of Fisher Scoring iterations: 3

Persamaan yang terbentuk adalah

\[log \left ( \frac{\widehat{\pi} }{1-\widehat{\pi} } \right )=-0.4351+1.7817 treatment -1.4687 sex\]

Uji Rasio Likelihood dari Interaksi antara Treatment dan Sex

Hipotesis

  1. \(H_0\) : \(\beta_3=0\) tidak ada pengaruh interaksi treatment dan jenis kelamin terhadap status perbaikan diabetes

  2. \(H_0\) : \(\beta_3 \neq 0\) ada pengaruh interaksi treatment dan jenis kelamin terhadap status perbaikan diabetes

Taraf Nyata

\(\alpha=5\%\)

Statistik Uji: LRT

Daerah Penolakan

Tolak \(H_0\) jika \(G^{2}> \chi ^{2}_{0.05, db}\) = \(G^{2}> \chi ^{2}_{0.05, 1}\)

Keputusan

Karena \(0.278 < 3.841\), maka Tidak Tolak \(H_0\)

Kesimpulan

Dengan taraf nyata \(5\%\), tidak ada pengaruh anatara ineraksi treatment dan jenis kelamin terhadap status perbaikan diabetes. Dengan kata lain, untuk memprediksi status perbaikan diabetes pasien cukup melalui jenis treatment dan jenis kelamin, tanpa interaksi keduanya.

Soal 2.B

Jika seseorang ingin membentuk model log linier menggunakan ketiga variabel (improvment, treatment dan sex), perbandingan model apa yang sama dengan perbandingan pada bagian (a)? Jelaskan mengapa perbandingan model tersebut sama secara konsep: apa yang ditunjukkan perbandingan model pada setiap kasus (logistic/loglinier)

Model regresi logistik yang hanya memuat variabel prediktor kategorik saling terkait dengan model loglinear jika salah satu variabelnya berbentuk biner. Pada bagian (a) yang diuji adalah pengaruh interaksi treatment dan sex terhadap improvment. Hal ini berarti melihat ada tidaknya interaksi tiga arah antara treatment,sex dan improvment. Untuk menguji interaksi tiga arah pada model log linier, maka dapat dilakukan dengan uji deviance antara model saturated (yang mengandung interaksi 3 arah) dan model homogeneus (hanya ada interaksi 2 arah).

Model Saturated

modelb1<- glm(counts~y.impr+x.treat+z.sex+y.impr*x.treat+y.impr*z.sex+x.treat*z.sex+ y.impr*x.treat*z.sex, family=poisson("link"=log))
summary(modelb1) 
## 
## Call:
## glm(formula = counts ~ y.impr + x.treat + z.sex + y.impr * x.treat + 
##     y.impr * z.sex + x.treat * z.sex + y.impr * x.treat * z.sex, 
##     family = poisson(link = log))
## 
## Deviance Residuals: 
## [1]  0  0  0  0  0  0  0  0
## 
## Coefficients:
##                                  Estimate Std. Error z value Pr(>|z|)    
## (Intercept)                        2.9444     0.2294  12.835  < 2e-16 ***
## y.impr2yes                        -0.3795     0.3599  -1.054  0.29174    
## x.treat2treat                     -1.1527     0.4683  -2.461  0.01384 *  
## z.sex2M                           -0.6419     0.3907  -1.643  0.10040    
## y.impr2yes:x.treat2treat           1.6323     0.5864   2.784  0.00538 ** 
## y.impr2yes:z.sex2M                -1.9231     1.1088  -1.734  0.08286 .  
## x.treat2treat:z.sex2M              0.7960     0.6798   1.171  0.24164    
## y.impr2yes:x.treat2treat:z.sex2M   0.6703     1.3151   0.510  0.61025    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for poisson family taken to be 1)
## 
##     Null deviance: 3.3455e+01  on 7  degrees of freedom
## Residual deviance: 2.8866e-15  on 0  degrees of freedom
## AIC: 47.527
## 
## Number of Fisher Scoring iterations: 3

Model Homogeneous

modelb2<-glm(counts~y.impr+x.treat+z.sex+y.impr*x.treat+y.impr*z.sex+x.treat*z.sex,family=poisson("link"=log))

summary(modelb2) 
## 
## Call:
## glm(formula = counts ~ y.impr + x.treat + z.sex + y.impr * x.treat + 
##     y.impr * z.sex + x.treat * z.sex, family = poisson(link = log))
## 
## Deviance Residuals: 
##        1         2         3         4         5         6         7         8  
## -0.09714   0.11963   0.17846  -0.09246   0.13686  -0.37762  -0.15807   0.16463  
## 
## Coefficients:
##                          Estimate Std. Error z value Pr(>|z|)    
## (Intercept)                2.9666     0.2228  13.314  < 2e-16 ***
## y.impr2yes                -0.4351     0.3452  -1.260 0.207566    
## x.treat2treat             -1.2486     0.4406  -2.834 0.004596 ** 
## z.sex2M                   -0.7077     0.3730  -1.897 0.057826 .  
## y.impr2yes:x.treat2treat   1.7817     0.5188   3.434 0.000594 ***
## y.impr2yes:z.sex2M        -1.4687     0.5757  -2.551 0.010733 *  
## x.treat2treat:z.sex2M      0.9947     0.5635   1.765 0.077550 .  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for poisson family taken to be 1)
## 
##     Null deviance: 33.45456  on 7  degrees of freedom
## Residual deviance:  0.27756  on 1  degrees of freedom
## AIC: 45.804
## 
## Number of Fisher Scoring iterations: 4

Pengujian Ada Tidaknya Interaksi 3 Arah (Saturated Model vs Homogenous Model)

Hipotesis

  1. \(H_0\) : \(\lambda^{XYZ}_{ijk}=0\) tidak ada interaksi tiga arah atau model yang terbentuk adalah model homogenous

  2. \(H_0\) : \(\lambda^{XYZ}_{ijk} \neq 0\) da interaksi tiga arah atau model yang terbentuk adalah model saturated

Taraf Nyata

\(\alpha=5\%\)

Statistik Uji: LRT

Daerah Penolakan

Tolak \(H_0\) jika \(\Delta Deviance> \chi ^{2}_{0.05, db}\) = \(\Delta Deviance> \chi ^{2}_{0.05, 1}\)

Keputusan

Karena \(0.27756 < 3.841\), maka Tidak Tolak \(H_0\)

Kesimpulan

Dengan taraf nyata \(5\%\), belum cukup bukti untuk menolak \(H_0\) atau dapat dikatakan bahwa tidak ada interaksi tiga arah antara improvment, treatment, dan jenis kelamin.

Berdasarkan hasil di atas terlihat bahwa:

  1. Penduga koefisien parameter untuk interaksi tiga arah pada model log linier saturated (\(\lambda^{XYZ}_{ijk}\)) adalah penduga koefisien parameter untuk interaksi treatment dan sex pada model reglog(\(\beta_3\))=\(0.6703\)

  2. Nilai statistik uji pada reglog dan log linier untuk interaksi 3 arah menghasilkan nilai yang sama, yaitu \(0.278\)

  3. Kesimpulan yang dihasilkan oleh reglog dan log linier untuk pengaruh interaksi treatment dan sex terhadap perbaikan status diabetes (ada tidaknya interaksi tiga arah) sama, yaitu tidak tolak Ho yang berarti tidak ada pengaruh interaksi treatment dan sex terhadap perbaikan status diabetes (tidak ada interaksi tiga arah)

2.C

Interpretasikan secara keseluruhan semua penduga parameter pada regresi logistik yang hanya mengandung pengaruh utama treatment dan jenis kelamin.

model regresi logistik yang hanya mengandung pengaruh utama treatmenr dan jenis kelamin:

Persamaan yang terbentuk adalah

\[log \left ( \frac{\widehat{\pi} }{1-\widehat{\pi} } \right )=-0.4351+1.7817 treatment-1.4687sex\] dimana,

data.frame(koef=modela2$coefficients,exp_koef=exp(modela2$coefficients))
##                     koef  exp_koef
## (Intercept)   -0.4350571 0.6472277
## x.treat2treat  1.7816802 5.9398281
## z.sex2M       -1.4686541 0.2302352

Intercept

\(exp(\alpha)=exp(-0.435)=0.6472\)

Interpretasi

Ketika seorang pasien perempuan tidak diberi treatment (diberi placebo), peluang pasien tersebut mengalami perbaikan status diabetes \(0.647\) kali dibandingkan peluang tidak mengalami perbaikan status diabetes atau peluang pasien tersebut tidak mengalami perbaikan status adalah \(1/0.647 = 1.545\) kali peluang mengalami perbaikan status diabetes.

Treatment

\(exp(\widehat{\beta}_1 )=exp(1.7816)=5.9398\)

Interpretasi

Odd pasien untuk megalami perbaikan status diabetes jika ia mendapatkan treatment adalah \(5.9398\) kali dibandingkan odd yang sama jika pasien tersebut tidak mendapat treatment (mendapatkan placebo) dan jenis kelamin sama. Dengan kata lain, pasien yang diberi treatment akan cenderung mengalami perbaikan status diabetes.

Sex

\(exp(\widehat{\beta}_2 )=exp(-1.469)=0.2302\)

Interpretasi

Odd pasien untuk megalami perbaikan status diabetes jika dia laki-laki adalah \(0.2302\) kali dibandingkan odd yang sama jika pasien tersebut perempuan dan diberikan treatment yang sama/tetap. Dengan kata lain, pasien perempuan akan cenderung mengalami perbaikan status diabetes.

2.D

Model loglinier apa yang ekuivalen dengan model regresi logistik pada bagian (C). Bangun loglinier model dan tunjukan mana penduga parameter yang ekuivalent dengan yang diperoleh dari regresi logistik pada bagian (c).

Dari tabel pada slide sebelumnya semua penduga koefisien parameter pada model reglog memiliki padanan pada model log linier, yaitu:

  1. penduga intercept pada reglog ekuivalent dengan penduga \(\lambda^Y_j\), yaitu \(-0.435\). \(exp(\lambda^Y_j)=exp(\alpha)\) menyatakan nilai odd, yaitu perbandingan peluang pasien untuk mengalami perbaikan dengan veluang tidak mengalami perbaikan tanpa memperhatikan jenis kelamin dan jenis treatment yang diperoleh.

  2. \(\widehat{\beta}_1=\widehat{\lambda}^{XY}_{ij}=1.782\). \(exp(\widehat{\beta}_1)= exp(\widehat{\lambda}^{XY}_{ij})\), menyatakan nilai odd, yaitu perbandingan odd pasien mengalami perbaikan status diabetes jika diberi treatment dengan odd yang sama jika diberi placebo.

  3. \(\widehat{\beta}_2=\widehat{\lambda}^{YZ}_{jk}=-1.469\). \(exp(\widehat{\beta}_2)= exp(\widehat{\lambda}^{YZ}_{jk})\), menyatakan nilai odd, yaitu perbandingan odd pasien mengalami perbaikan status diabetes jika pasien tersebut laki-lakidengan odd yang sama jika dia perempuan.

2.E

Berdasarkan model regresi logistik dengan interaksi antara treatment dan jenis kelamin. Apa penduga peluang bahwa seorang pria yang memperoleh treatment akan mengalami perbaikan? Apa penduga peluang dari model tanpa interaksi?

Model Dengan Interaksi

Laki-laki: Sex=1 Memperoleh treatment: treatment=1, sehingga:

\[log \left ( \frac{\widehat{\pi} }{1-\widehat{\pi} } \right )=-0.3795+1.6323 treatment-1.9231sex+0.6703 treatment sex\] \[log \left ( \frac{\widehat{\pi} }{1-\widehat{\pi} } \right )=-0.3795+1.6323 (1)-1.9231(1)+0.6703 (1)(1)\] \[log \left ( \frac{\widehat{\pi} }{1-\widehat{\pi} } \right )=-2.887 \times 10^{-15}\]

sehingga,

\[\frac{\widehat{\pi} }{1-\widehat{\pi} }=exp(-2.887 \times 10^{-15})=1\] \[\widehat{\pi}=\frac{1 }{1+1 }=0.5\]

new=data.frame(x.treat=as.factor("2treat"), z.sex=as.factor("2M"))
#with interaction
predict(modela1,newdata=new,type="response")
##   1 
## 0.5

Dugaan peluang terjadi perbaikan status diabetes untuk pasien pria yang mendapatkan treatment adalah \(0.5\).

Hal ini berarti pasien pria yang mendapatkan treatment memiliki peluang yang sama untuk mengalami perbaikan atau tidak.

Model Tanpa Interaksi

\[log \left ( \frac{\widehat{\pi} }{1-\widehat{\pi} } \right )=-0.4351+1.7817 treatment-1.4687sex\]

\[\widehat{\pi}=\frac{-0.4351+1.7817 treatment-1.4687sex }{1-0.4351+1.7817 treatment-1.4687sex }\]

\[\widehat{\pi}=\frac{-0.4351+1.7817(1)-1.4687(1) }{1-0.4351+1.7817 (1) -1.4687 (1) }\]

\[\widehat{\pi}=exp(0.4695)\]

predict(modela2,newdata=new,type="response") 
##         1 
## 0.4695301

Dugaan peluang terjadi perbaikan status diabetes untuk pasien pria yang mendapatkan treatment adalah \(0.47\).

Dengan menggunakan cutting point \(0.5\) maka pasien tersebut akan di prediksi tidak mengalami perbaikan status.

TERIMAKASIH