Responsi 6 STA543 Analisis Data Kategorik

Model Regresi Logit Binomial-II (Peubah Bebasnya Kategorik)

setwd("D:\\Kuliah S2 IPB\\Bahan Kuliah\\Semester 2 SSD 2020\\STA543 ADK\\Responsi\\R\\UTS\\")

Pendahuluan

Regresi logistik biner digunakan untuk memodelkan hubungan antara peubah respon yang terdiri dari dua kategori dengan satu atau lebih peubah penjelas. Peubah penjelasanya bisa berupa data kontinu atau kategorik. Sebelumnya kita telah membahas dengan peubah bebasnya kontinu. Sekarang kita akan bahas untuk peubah bebasnya kategorik.

Soal 1

Input Data

##=====================## 
# INPUT DATA
##=====================## 
dataku <- read.csv("datacrab.csv",sep=";")
View(dataku)
head(dataku)
##   C S    W   Wt Sa
## 1 2 3 28.3 3.05  8
## 2 3 3 26.0 2.60  4
## 3 3 3 25.6 2.15  0
## 4 4 2 21.0 1.85  0
## 5 2 3 29.0 3.00  1
## 6 1 2 25.0 2.30  3
str(dataku)
## 'data.frame':    173 obs. of  5 variables:
##  $ C : int  2 3 3 4 2 1 4 2 2 2 ...
##  $ S : int  3 3 3 2 3 2 3 3 1 3 ...
##  $ W : num  28.3 26 25.6 21 29 25 26.2 24.9 25.7 27.5 ...
##  $ Wt: num  3.05 2.6 2.15 1.85 3 2.3 1.3 2.1 2 3.15 ...
##  $ Sa: int  8 4 0 0 1 3 0 0 8 6 ...

Pendefinisian Peubah

##=====================## 
# PENDEFINISIAN PEUBAH
##=====================##
c<- factor(dataku[,1])
s<- factor(dataku[,2])
w<- dataku[,3]
wt<- dataku[,4]
sa<- dataku[,5]
y<- c(1:173)
for (i in 1:length(sa))
{
if(sa[i]>0)(y[i]=1)else(y[i]=0)
}

Menentukan Referensi Peubah Kategorik

color<-relevel(c,ref="4")#menentukan referensi pada peubah warna
spine<-relevel(s,ref="3")#menentukan referensi pada peubah spine
width<-w

A. MODEL REGRESI LOGISTIK DENGAN PEUBAH BEBAS WIDTH DAN COLOR

data.frame(color,width,wt,sa,y)
##     color width   wt sa y
## 1       2  28.3 3.05  8 1
## 2       3  26.0 2.60  4 1
## 3       3  25.6 2.15  0 0
## 4       4  21.0 1.85  0 0
## 5       2  29.0 3.00  1 1
## 6       1  25.0 2.30  3 1
## 7       4  26.2 1.30  0 0
## 8       2  24.9 2.10  0 0
## 9       2  25.7 2.00  8 1
## 10      2  27.5 3.15  6 1
## 11      1  26.1 2.80  5 1
## 12      3  28.9 2.80  4 1
## 13      2  30.3 3.60  3 1
## 14      2  22.9 1.60  4 1
## 15      3  26.2 2.30  3 1
## 16      3  24.5 2.05  5 1
## 17      2  30.0 3.05  8 1
## 18      2  26.2 2.40  3 1
## 19      2  25.4 2.25  6 1
## 20      2  25.4 2.25  4 1
## 21      4  27.5 2.90  0 0
## 22      4  27.0 2.25  3 1
## 23      2  24.0 1.70  0 0
## 24      2  28.7 3.20  0 0
## 25      3  26.5 1.97  1 1
## 26      2  24.5 1.60  1 1
## 27      3  27.3 2.90  1 1
## 28      2  26.5 2.30  4 1
## 29      2  25.0 2.10  2 1
## 30      3  22.0 1.40  0 0
## 31      1  30.2 3.28  2 1
## 32      2  25.4 2.30  0 0
## 33      2  24.9 2.30  6 1
## 34      4  25.8 2.25 10 1
## 35      3  27.2 2.40  5 1
## 36      2  30.5 3.32  3 1
## 37      4  25.0 2.10  8 1
## 38      2  30.0 3.00  9 1
## 39      2  22.9 1.60  0 0
## 40      2  23.9 1.85  2 1
## 41      2  26.0 2.28  3 1
## 42      2  25.8 2.20  0 0
## 43      3  29.0 3.28  4 1
## 44      1  26.5 2.35  0 0
## 45      3  22.5 1.55  0 0
## 46      2  23.8 2.10  0 0
## 47      3  24.3 2.15  0 0
## 48      2  26.0 2.30 14 1
## 49      4  24.7 2.20  0 0
## 50      2  22.5 1.60  1 1
## 51      2  28.7 3.15  3 1
## 52      1  29.3 3.20  4 1
## 53      2  26.7 2.70  5 1
## 54      4  23.4 1.90  0 0
## 55      1  27.7 2.50  6 1
## 56      2  28.2 2.60  6 1
## 57      4  24.7 2.10  5 1
## 58      2  25.7 2.00  5 1
## 59      2  27.8 2.75  0 0
## 60      3  27.0 2.45  3 1
## 61      2  29.0 3.20 10 1
## 62      3  25.6 2.80  7 1
## 63      3  24.2 1.90  0 0
## 64      3  25.7 1.20  0 0
## 65      3  23.1 1.65  0 0
## 66      2  28.5 3.05  0 0
## 67      2  29.7 3.85  5 1
## 68      3  23.1 1.55  0 0
## 69      3  24.5 2.20  1 1
## 70      2  27.5 2.55  1 1
## 71      2  26.3 2.40  1 1
## 72      2  27.8 3.25  3 1
## 73      2  31.9 3.33  2 1
## 74      2  25.0 2.40  5 1
## 75      3  26.2 2.22  0 0
## 76      3  28.4 3.20  3 1
## 77      1  24.5 1.95  6 1
## 78      2  27.9 3.05  7 1
## 79      2  25.0 2.25  6 1
## 80      3  29.0 2.92  3 1
## 81      2  31.7 3.73  4 1
## 82      2  27.6 2.85  4 1
## 83      4  24.5 1.90  0 0
## 84      3  23.8 1.80  0 0
## 85      2  28.2 3.05  8 1
## 86      3  24.1 1.80  0 0
## 87      1  28.0 2.62  0 0
## 88      1  26.0 2.30  9 1
## 89      3  24.7 1.90  0 0
## 90      2  25.8 2.65  0 0
## 91      1  27.1 2.95  8 1
## 92      2  27.4 2.70  5 1
## 93      3  26.7 2.60  2 1
## 94      2  26.8 2.70  5 1
## 95      1  25.8 2.60  0 0
## 96      4  23.7 1.85  0 0
## 97      2  27.9 2.80  6 1
## 98      2  30.0 3.30  5 1
## 99      2  25.0 2.10  4 1
## 100     2  27.7 2.90  5 1
## 101     2  28.3 3.00 15 1
## 102     4  25.5 2.25  0 0
## 103     2  26.0 2.15  5 1
## 104     2  26.2 2.40  0 0
## 105     3  23.0 1.65  1 1
## 106     2  22.9 1.60  0 0
## 107     2  25.1 2.10  5 1
## 108     3  25.9 2.55  4 1
## 109     4  25.5 2.75  0 0
## 110     2  26.8 2.55  0 0
## 111     2  29.0 2.80  1 1
## 112     3  28.5 3.00  1 1
## 113     2  24.7 2.55  4 1
## 114     2  29.0 3.10  1 1
## 115     2  27.0 2.50  6 1
## 116     4  23.7 1.80  0 0
## 117     3  27.0 2.50  6 1
## 118     2  24.2 1.65  2 1
## 119     4  22.5 1.47  4 1
## 120     2  25.1 1.80  0 0
## 121     2  24.9 2.20  0 0
## 122     2  27.5 2.63  6 1
## 123     2  24.3 2.00  0 0
## 124     2  29.5 3.02  4 1
## 125     2  26.2 2.30  0 0
## 126     2  24.7 1.95  4 1
## 127     3  29.8 3.50  4 1
## 128     4  25.7 2.15  0 0
## 129     3  26.2 2.17  2 1
## 130     4  27.0 2.63  0 0
## 131     3  24.8 2.10  0 0
## 132     2  23.7 1.95  0 0
## 133     2  28.2 3.05 11 1
## 134     2  25.2 2.00  1 1
## 135     2  23.2 1.95  4 1
## 136     4  25.8 2.00  3 1
## 137     4  27.5 2.60  0 0
## 138     2  25.7 2.00  0 0
## 139     2  26.8 2.65  0 0
## 140     3  27.5 3.10  3 1
## 141     3  28.5 3.25  9 1
## 142     2  28.5 3.00  3 1
## 143     1  27.4 2.70  6 1
## 144     2  27.2 2.70  3 1
## 145     3  27.1 2.55  0 0
## 146     2  28.0 2.80  1 1
## 147     2  26.5 1.30  0 0
## 148     3  23.0 1.80  0 0
## 149     3  26.0 2.20  3 1
## 150     3  24.5 2.25  0 0
## 151     2  25.8 2.30  0 0
## 152     4  23.5 1.90  0 0
## 153     4  26.7 2.45  0 0
## 154     3  25.5 2.25  0 0
## 155     2  28.2 2.87  1 1
## 156     2  25.2 2.00  1 1
## 157     2  25.3 1.90  2 1
## 158     3  25.7 2.10  0 0
## 159     4  29.3 3.23 12 1
## 160     3  23.8 1.80  6 1
## 161     2  27.4 2.90  3 1
## 162     2  26.2 2.02  2 1
## 163     2  28.0 2.90  4 1
## 164     2  28.4 3.10  5 1
## 165     2  33.5 5.20  7 1
## 166     2  25.8 2.40  0 0
## 167     3  24.0 1.90 10 1
## 168     2  23.1 2.00  0 0
## 169     2  28.3 3.20  0 0
## 170     2  26.5 2.35  4 1
## 171     2  26.5 2.75  7 1
## 172     3  26.1 2.75  3 1
## 173     2  24.5 2.00  0 0
model<-glm(y~color+width, family=binomial("link"=logit))
summary(model)
## 
## Call:
## glm(formula = y ~ color + width, family = binomial(link = logit))
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -2.1124  -0.9848   0.5243   0.8513   2.1413  
## 
## Coefficients:
##             Estimate Std. Error z value Pr(>|z|)    
## (Intercept) -12.7151     2.7617  -4.604 4.14e-06 ***
## color1        1.3299     0.8525   1.560   0.1188    
## color2        1.4023     0.5484   2.557   0.0106 *  
## color3        1.1061     0.5921   1.868   0.0617 .  
## width         0.4680     0.1055   4.434 9.26e-06 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 225.76  on 172  degrees of freedom
## Residual deviance: 187.46  on 168  degrees of freedom
## AIC: 197.46
## 
## Number of Fisher Scoring iterations: 4

A. MEMBANDINGKAN OUTPUT R DENGAN OUTPUT SAS

Output SAS:

Hasil pemodelan regresi logistik dengan peubah bebas adalah Width (x) dan Color (c) antara R dan SAS adalah sama.

A. INTERPRETASI KOEFISIEN REGRESI

exp(model$coefficients)
##  (Intercept)       color1       color2       color3        width 
## 3.005364e-06 3.780738e+00 4.064684e+00 3.022612e+00 1.596727e+00

Interpretasi dugaan parameter model:

Exp(b0)=3.005

tanpa memperhatikan lebar cangkang serta warna cangkang, peluang kepiting betina untuk menarik kepiting jantan adalah 3.005 kali dibandingkan peluang untuk tidak menarik kepiting jantan

Exp(b1_1)=3.78

Odds kepiting betina yang mampu menarik kepiting jantan jika ia berwarna medium-light color adalah 3.78 kali dibandingkan odd yang sama jika kepiting tersebut berwarna dark dengan lebar cangkang kepiting sama.

Exp(b1_2)=4.06

Odds kepiting betina yang mampu menarik kepiting jantan jika ia berwarna medium- color adalah 4.06 kali dibandingkan odd yang sama jika kepiting tersebut berwarna dark dengan lebar cangkang kepiting sama.

Exp(b1_3)=3.02

Odds kepiting betina yang mampu menarik kepiting jantan jika ia berwarna medium-dark color adalah 3.02 kali dibandingkan odd yang sama jika kepiting tersebut berwarna dark dengan lebar cangkang kepiting sama.

Exp(b2)=1.59

Odds pada kepiting betina yang mampu menarik kepiting jantan akan meningkat sebesar 1.59 kali jika lebar cangkang naik sebesar satu satuan dengan warna cangkang kepiting sama.

B. MODEL REGRESI LOGISTIK DENGAN PEUBAH BEBAS WIDTH, COLOR, DAN SPINE (TANPA INTERAKSI)

model2<-glm(y~color+width+spine,
family=binomial("link"=logit))
summary(model2)
## 
## Call:
## glm(formula = y ~ color + width + spine, family = binomial(link = logit))
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -2.1206  -0.9724   0.5076   0.8750   2.1158  
## 
## Coefficients:
##             Estimate Std. Error z value Pr(>|z|)    
## (Intercept) -12.3908     2.8193  -4.395 1.11e-05 ***
## color1        1.6683     0.9328   1.788  0.07371 .  
## color2        1.5249     0.5672   2.689  0.00718 ** 
## color3        1.1443     0.5933   1.929  0.05377 .  
## width         0.4562     0.1078   4.233 2.31e-05 ***
## spine1       -0.3770     0.5019  -0.751  0.45254    
## spine2       -0.4348     0.6254  -0.695  0.48687    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 225.76  on 172  degrees of freedom
## Residual deviance: 186.61  on 166  degrees of freedom
## AIC: 200.61
## 
## Number of Fisher Scoring iterations: 4

B. UJI DEVIANCE MENGUJI PENGARUH SPINE

##=====================##
# MODEL REGRESI LOGISTIK DENGAN PEUBAH
#BEBAS WIDTH+COLOR+SPINE+COLOR*SPINE
##=====================##
model3<-glm(y~color+width+spine+color*spine,
family=binomial("link"=logit))
summary(model3)
## 
## Call:
## glm(formula = y ~ color + width + spine + color * spine, family = binomial(link = logit))
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -2.1553  -0.8955   0.4833   0.8377   2.0583  
## 
## Coefficients:
##                Estimate Std. Error z value Pr(>|z|)    
## (Intercept)    -11.8084     2.8711  -4.113 3.91e-05 ***
## color1         -17.0159  3956.1804  -0.004  0.99657    
## color2           1.5915     0.5941   2.679  0.00739 ** 
## color3           0.9631     0.6121   1.573  0.11563    
## width            0.4364     0.1097   3.976 7.00e-05 ***
## spine1         -16.8850  3956.1804  -0.004  0.99659    
## spine2         -14.9214  3956.1804  -0.004  0.99699    
## color1:spine1   35.0152  5594.8840   0.006  0.99501    
## color2:spine1   16.2429  3956.1804   0.004  0.99672    
## color3:spine1   33.5071  4539.3953   0.007  0.99411    
## color1:spine2   50.5146  6253.4059   0.008  0.99355    
## color2:spine2   13.9470  3956.1805   0.004  0.99719    
## color3:spine2   14.3689  3956.1806   0.004  0.99710    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 225.76  on 172  degrees of freedom
## Residual deviance: 177.60  on 160  degrees of freedom
## AIC: 203.6
## 
## Number of Fisher Scoring iterations: 16

C. UJI DEVIANCE MENGUJI PENGARUH INTERAKSI SPINE*COLOR

Soal 2

Input Data

##=====================## 
# INPUT DATA
##=====================## 
z.sex<-as.factor(rep(c("1F","2M"),each=4)) 
x.treat<-as.factor(rep(c("1plac","2treat"),each=2,times=2))
y.impr<-as.factor(rep(c("1no","2yes"),times=4)) 
counts<-c(19,13,6,21,10,1,7,7) 
data<-data.frame(z.sex, x.treat, y.impr, counts)
data
##   z.sex x.treat y.impr counts
## 1    1F   1plac    1no     19
## 2    1F   1plac   2yes     13
## 3    1F  2treat    1no      6
## 4    1F  2treat   2yes     21
## 5    2M   1plac    1no     10
## 6    2M   1plac   2yes      1
## 7    2M  2treat    1no      7
## 8    2M  2treat   2yes      7

Penentuan Kategori Referensi

##=============================## 
# Penentuan kategori reference
##=============================## 
z.sex<-relevel(z.sex,ref="1F") 
x.treat<-relevel(x.treat,ref="1plac")
y.impr<-relevel(y.impr,ref="1no") 

Menentukan kategori referensi peubah kategorik

A. Bentuk model regresi logistik untuk memprediksi improvement dari treatment, sex dan interaksi keduanya.Lakukan uji rasio likelihood dari interaksi antara treatment dan sex. Laporkan dan interpretasikan hasilnya secara menyeluruh dari pandangan subtantive.

Data diatas masih berbentuk data agregasi, agar dapat dianalisis menggunakan GLM logit maka data tersebut perlu diubah menjadi data individu terlebih dahulu

#mengubah count menjadi data individu
data<- data[rep(1:nrow(data),data$counts),-4] 
head(data) 
##     z.sex x.treat y.impr
## 1      1F   1plac    1no
## 1.1    1F   1plac    1no
## 1.2    1F   1plac    1no
## 1.3    1F   1plac    1no
## 1.4    1F   1plac    1no
## 1.5    1F   1plac    1no
dim(data)[1]==sum(counts) #periksa jumlah data
## [1] TRUE

Model Dengan Interaksi

#with interaction 
modela1<-glm(y.impr~x.treat+z.sex+x.treat*z.sex, data=data, family=binomial("link"=logit)) 
summary(modela1) 
## 
## Call:
## glm(formula = y.impr ~ x.treat + z.sex + x.treat * z.sex, family = binomial(link = logit), 
##     data = data)
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -1.7344  -1.0211   0.1362   0.8261   2.1899  
## 
## Coefficients:
##                       Estimate Std. Error z value Pr(>|z|)   
## (Intercept)            -0.3795     0.3599  -1.054  0.29174   
## x.treat2treat           1.6323     0.5864   2.784  0.00538 **
## z.sex2M                -1.9231     1.1086  -1.735  0.08281 . 
## x.treat2treat:z.sex2M   0.6703     1.3150   0.510  0.61021   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 116.449  on 83  degrees of freedom
## Residual deviance:  97.944  on 80  degrees of freedom
## AIC: 105.94
## 
## Number of Fisher Scoring iterations: 4

Persamaan yang terbentuk adalah

Yang selanjutnya digunakan adalah Residual Deviance.

Model Tanpa Interaksi

#tanpa interaction 
modela2<-glm(y.impr~x.treat+z.sex, data=data, family=binomial("link"=logit)) 
summary(modela2)
## 
## Call:
## glm(formula = y.impr ~ x.treat + z.sex, family = binomial(link = logit), 
##     data = data)
## 
## Deviance Residuals: 
##      Min        1Q    Median        3Q       Max  
## -1.77642  -0.99909   0.07647   0.81742   2.02120  
## 
## Coefficients:
##               Estimate Std. Error z value Pr(>|z|)    
## (Intercept)    -0.4351     0.3452  -1.260 0.207553    
## x.treat2treat   1.7817     0.5187   3.435 0.000593 ***
## z.sex2M        -1.4687     0.5756  -2.551 0.010728 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 116.449  on 83  degrees of freedom
## Residual deviance:  98.222  on 81  degrees of freedom
## AIC: 104.22
## 
## Number of Fisher Scoring iterations: 3

Persamaan yang terbentuk

Uji Rasio Likelihood dari Interaksi antara Treatment dan Sex

B. Jika seseorang ingin membentuk model log linier menggunakan ketiga variabel (improvment, treatment dan sex), perbandingan model apa yang sama dengan perbandingan pada bagian (a)? Jelaskan mengapa perbandingan model tersebut sama secara konsep: apa yang ditunjukkan perbandingan model pada setiap kasus (logistic/loglinier).

Model regresi logistik yang hanya memuat variabel prediktor kategorik saling terkait dengan model loglinear jika salah satu variabelnya berbentuk biner. Pada bagian (a) yang diuji adalah pengaruh interaksi treatment dan sex terhadap improvment. Hal ini berarti melihat ada tidaknya interaksi tiga arah antara treatment,sex dan improvment. Untuk menguji interaksi tiga arah pada model log linier, maka dapat dilakukan dengan uji deviance antara model saturated (yang mengandung interaksi 3 arah) dan model homogeneus (hanya ada interaksi 2 arah).

Model Saturated

#saturated
modelb1<- glm(counts~y.impr+x.treat+z.sex+y.impr*x.treat+y.impr*z.sex+x.treat*z.sex+ y.impr*x.treat*z.sex, family=poisson("link"=log))
summary(modelb1) 
## 
## Call:
## glm(formula = counts ~ y.impr + x.treat + z.sex + y.impr * x.treat + 
##     y.impr * z.sex + x.treat * z.sex + y.impr * x.treat * z.sex, 
##     family = poisson(link = log))
## 
## Deviance Residuals: 
## [1]  0  0  0  0  0  0  0  0
## 
## Coefficients:
##                                  Estimate Std. Error z value Pr(>|z|)    
## (Intercept)                        2.9444     0.2294  12.835  < 2e-16 ***
## y.impr2yes                        -0.3795     0.3599  -1.054  0.29174    
## x.treat2treat                     -1.1527     0.4683  -2.461  0.01384 *  
## z.sex2M                           -0.6419     0.3907  -1.643  0.10040    
## y.impr2yes:x.treat2treat           1.6323     0.5864   2.784  0.00538 ** 
## y.impr2yes:z.sex2M                -1.9231     1.1088  -1.734  0.08286 .  
## x.treat2treat:z.sex2M              0.7960     0.6798   1.171  0.24164    
## y.impr2yes:x.treat2treat:z.sex2M   0.6703     1.3151   0.510  0.61025    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for poisson family taken to be 1)
## 
##     Null deviance: 3.3455e+01  on 7  degrees of freedom
## Residual deviance: 2.8866e-15  on 0  degrees of freedom
## AIC: 47.527
## 
## Number of Fisher Scoring iterations: 3

Model Homogeneous

#homogeneous
modelb2<-glm(counts~y.impr+x.treat+z.sex+y.impr*x.treat+y.impr*z.sex+x.treat*z.sex,family=poisson("link"=log))

summary(modelb2) 
## 
## Call:
## glm(formula = counts ~ y.impr + x.treat + z.sex + y.impr * x.treat + 
##     y.impr * z.sex + x.treat * z.sex, family = poisson(link = log))
## 
## Deviance Residuals: 
##        1         2         3         4         5         6         7         8  
## -0.09714   0.11963   0.17846  -0.09246   0.13686  -0.37762  -0.15807   0.16463  
## 
## Coefficients:
##                          Estimate Std. Error z value Pr(>|z|)    
## (Intercept)                2.9666     0.2228  13.314  < 2e-16 ***
## y.impr2yes                -0.4351     0.3452  -1.260 0.207566    
## x.treat2treat             -1.2486     0.4406  -2.834 0.004596 ** 
## z.sex2M                   -0.7077     0.3730  -1.897 0.057826 .  
## y.impr2yes:x.treat2treat   1.7817     0.5188   3.434 0.000594 ***
## y.impr2yes:z.sex2M        -1.4687     0.5757  -2.551 0.010733 *  
## x.treat2treat:z.sex2M      0.9947     0.5635   1.765 0.077550 .  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for poisson family taken to be 1)
## 
##     Null deviance: 33.45456  on 7  degrees of freedom
## Residual deviance:  0.27756  on 1  degrees of freedom
## AIC: 45.804
## 
## Number of Fisher Scoring iterations: 4

Pengujian Ada Tidaknya Interaksi 3 Arah (Saturated Model vs Homogenous Model)

Berdasarkan hasil di atas terlihat bahwa:

  • Penduga koefisien parameter untuk interaksi tiga arah pada model log linier saturated (Lambda_XYZ_ijk) = penduga koefisien parameter untuk interaksi treatment dan sex pada model reglog(Beta_3)=0.6703

  • Nilai statistik uji pada reglog dan log linier untuk interaksi 3 arah menghasilkan nilai yang sama, yaitu 0,278

  • Kesimpulan yang dihasilkan oleh reglog dan log linier untuk pengaruh interaksi treatment dan sex terhadap perbaikan status diabetes (ada tidaknya interaksi tiga arah) sama, yaitu tidak tolak Ho yang berarti tidak ada pengaruh interaksi treatment dan sex terhadap perbaikan status diabetes (tidak ada interaksi tiga arah)

C. Interpretasikan secara keseluruhan semua penduga parameter pada regresi logistik yang hanya mengandung pengaruh utama treatment dan jenis kelamin.

#c. interpretasi reglog
data.frame(koef=modela2$coefficients,exp_koef=exp(modela2$coefficients)) 
##                     koef  exp_koef
## (Intercept)   -0.4350571 0.6472277
## x.treat2treat  1.7816802 5.9398281
## z.sex2M       -1.4686541 0.2302352

Intercept

Interpretasi

Ketika seorang pasien perempuan tidak diberi treatment (diberi placebo), peluang pasien tersebut mengalami perbaikan status diabetes 0,647 kali dibandingkan peluang tidak mengalami perbaikan status diabetes atau peluang pasien tersebut tidak mengalami perbaikan status adala 1/0,647 = 1,545 kali peluang mengalami perbaikan status diabetes.

Treatment

Interpretasi

Odd pasien untuk megalami perbaikan status diabetes jika ia mendapatkan treatment adalah 5,9398 kali dibandingkan odd yang sama jika pasien tersebut tidak mendapat treatment (mendapatkan placebo) dan jenis kelamin sama. Dengan kata lain, pasien yang diberi treatment akan cenderung mengalami perbaikan status diabetes.

Sex

Interpretasi

Odd pasien untuk megalami perbaikan status diabetes jika ia laki-laki adalah 0,2302 kali dibandingkan odd yang sama jika pasien tersebut perempuan dan diberikan treatment yang sama/tetap. Dengan kata lain, pasien perempuan akan cenderung mengalami perbaikan status diabetes.

D. Model loglinier apa yang ekuivalen dengan model regresi logistik pada bagian (C). Bangun loglinier model dan tunjukan mana penduga parameter yang ekuivalent dengan yang diperoleh dari regresi logistik pada bagian (c).

Dari tabel pada slide sebelumnya semua penduga koefisien parameter pada model reglog memiliki padanan pada model log linier, yaitu:

E. Berdasarkan model regresi logistik dengan interaksi antara treatment dan jenis kelamin. Apa penduga peluang bahwa seorang pria yang memperoleh treatment akan mengalami perbaikan? Apa penduga peluang dari model tanpa interaksi?

Model Dengan Interaksi

#e. predict reglog
new=data.frame(x.treat=as.factor("2treat"), z.sex=as.factor("2M"))
#with interaction
predict(modela1,newdata=new,type="response")
##   1 
## 0.5

Dugaan peluang terjadi perbaikan status diabetes untuk pasien pria yang mendapatkan treatment adalah 0,5.

Hal ini berarti pasien pria yang mendapatkan treatment memiliki peluang yang sama untuk mengalami perbaikan atau tidak.

Model Tanpa Interaksi

#without interaction
predict(modela2,newdata=new,type="response") 
##         1 
## 0.4695301

Dugaan peluang terjadi perbaikan status diabetes untuk pasien pria yang mendapatkan treatment adalah 0,47.

Dengan menggunakan cutting point 0,5 maka pasien tersebut akan di prediksi tidak mengalami perbaikan status.


  1. G1501202071, Mahasiswa Pascasarjana Statistika dan Sains Data, IPB University, ↩︎