Responsi 6 STA543 Analisis Data Kategorik
Model Regresi Logit Binomial-II (Peubah Bebasnya Kategorik)
setwd("D:\\Kuliah S2 IPB\\Bahan Kuliah\\Semester 2 SSD 2020\\STA543 ADK\\Responsi\\R\\UTS\\")Pendahuluan
Regresi logistik biner digunakan untuk memodelkan hubungan antara peubah respon yang terdiri dari dua kategori dengan satu atau lebih peubah penjelas. Peubah penjelasanya bisa berupa data kontinu atau kategorik. Sebelumnya kita telah membahas dengan peubah bebasnya kontinu. Sekarang kita akan bahas untuk peubah bebasnya kategorik.
Soal 1
Input Data
##=====================##
# INPUT DATA
##=====================##
dataku <- read.csv("datacrab.csv",sep=";")
View(dataku)
head(dataku)## C S W Wt Sa
## 1 2 3 28.3 3.05 8
## 2 3 3 26.0 2.60 4
## 3 3 3 25.6 2.15 0
## 4 4 2 21.0 1.85 0
## 5 2 3 29.0 3.00 1
## 6 1 2 25.0 2.30 3
str(dataku)## 'data.frame': 173 obs. of 5 variables:
## $ C : int 2 3 3 4 2 1 4 2 2 2 ...
## $ S : int 3 3 3 2 3 2 3 3 1 3 ...
## $ W : num 28.3 26 25.6 21 29 25 26.2 24.9 25.7 27.5 ...
## $ Wt: num 3.05 2.6 2.15 1.85 3 2.3 1.3 2.1 2 3.15 ...
## $ Sa: int 8 4 0 0 1 3 0 0 8 6 ...
Pendefinisian Peubah
##=====================##
# PENDEFINISIAN PEUBAH
##=====================##
c<- factor(dataku[,1])
s<- factor(dataku[,2])
w<- dataku[,3]
wt<- dataku[,4]
sa<- dataku[,5]
y<- c(1:173)
for (i in 1:length(sa))
{
if(sa[i]>0)(y[i]=1)else(y[i]=0)
}Menentukan Referensi Peubah Kategorik
color<-relevel(c,ref="4")#menentukan referensi pada peubah warna
spine<-relevel(s,ref="3")#menentukan referensi pada peubah spine
width<-wA. MODEL REGRESI LOGISTIK DENGAN PEUBAH BEBAS WIDTH DAN COLOR
data.frame(color,width,wt,sa,y)## color width wt sa y
## 1 2 28.3 3.05 8 1
## 2 3 26.0 2.60 4 1
## 3 3 25.6 2.15 0 0
## 4 4 21.0 1.85 0 0
## 5 2 29.0 3.00 1 1
## 6 1 25.0 2.30 3 1
## 7 4 26.2 1.30 0 0
## 8 2 24.9 2.10 0 0
## 9 2 25.7 2.00 8 1
## 10 2 27.5 3.15 6 1
## 11 1 26.1 2.80 5 1
## 12 3 28.9 2.80 4 1
## 13 2 30.3 3.60 3 1
## 14 2 22.9 1.60 4 1
## 15 3 26.2 2.30 3 1
## 16 3 24.5 2.05 5 1
## 17 2 30.0 3.05 8 1
## 18 2 26.2 2.40 3 1
## 19 2 25.4 2.25 6 1
## 20 2 25.4 2.25 4 1
## 21 4 27.5 2.90 0 0
## 22 4 27.0 2.25 3 1
## 23 2 24.0 1.70 0 0
## 24 2 28.7 3.20 0 0
## 25 3 26.5 1.97 1 1
## 26 2 24.5 1.60 1 1
## 27 3 27.3 2.90 1 1
## 28 2 26.5 2.30 4 1
## 29 2 25.0 2.10 2 1
## 30 3 22.0 1.40 0 0
## 31 1 30.2 3.28 2 1
## 32 2 25.4 2.30 0 0
## 33 2 24.9 2.30 6 1
## 34 4 25.8 2.25 10 1
## 35 3 27.2 2.40 5 1
## 36 2 30.5 3.32 3 1
## 37 4 25.0 2.10 8 1
## 38 2 30.0 3.00 9 1
## 39 2 22.9 1.60 0 0
## 40 2 23.9 1.85 2 1
## 41 2 26.0 2.28 3 1
## 42 2 25.8 2.20 0 0
## 43 3 29.0 3.28 4 1
## 44 1 26.5 2.35 0 0
## 45 3 22.5 1.55 0 0
## 46 2 23.8 2.10 0 0
## 47 3 24.3 2.15 0 0
## 48 2 26.0 2.30 14 1
## 49 4 24.7 2.20 0 0
## 50 2 22.5 1.60 1 1
## 51 2 28.7 3.15 3 1
## 52 1 29.3 3.20 4 1
## 53 2 26.7 2.70 5 1
## 54 4 23.4 1.90 0 0
## 55 1 27.7 2.50 6 1
## 56 2 28.2 2.60 6 1
## 57 4 24.7 2.10 5 1
## 58 2 25.7 2.00 5 1
## 59 2 27.8 2.75 0 0
## 60 3 27.0 2.45 3 1
## 61 2 29.0 3.20 10 1
## 62 3 25.6 2.80 7 1
## 63 3 24.2 1.90 0 0
## 64 3 25.7 1.20 0 0
## 65 3 23.1 1.65 0 0
## 66 2 28.5 3.05 0 0
## 67 2 29.7 3.85 5 1
## 68 3 23.1 1.55 0 0
## 69 3 24.5 2.20 1 1
## 70 2 27.5 2.55 1 1
## 71 2 26.3 2.40 1 1
## 72 2 27.8 3.25 3 1
## 73 2 31.9 3.33 2 1
## 74 2 25.0 2.40 5 1
## 75 3 26.2 2.22 0 0
## 76 3 28.4 3.20 3 1
## 77 1 24.5 1.95 6 1
## 78 2 27.9 3.05 7 1
## 79 2 25.0 2.25 6 1
## 80 3 29.0 2.92 3 1
## 81 2 31.7 3.73 4 1
## 82 2 27.6 2.85 4 1
## 83 4 24.5 1.90 0 0
## 84 3 23.8 1.80 0 0
## 85 2 28.2 3.05 8 1
## 86 3 24.1 1.80 0 0
## 87 1 28.0 2.62 0 0
## 88 1 26.0 2.30 9 1
## 89 3 24.7 1.90 0 0
## 90 2 25.8 2.65 0 0
## 91 1 27.1 2.95 8 1
## 92 2 27.4 2.70 5 1
## 93 3 26.7 2.60 2 1
## 94 2 26.8 2.70 5 1
## 95 1 25.8 2.60 0 0
## 96 4 23.7 1.85 0 0
## 97 2 27.9 2.80 6 1
## 98 2 30.0 3.30 5 1
## 99 2 25.0 2.10 4 1
## 100 2 27.7 2.90 5 1
## 101 2 28.3 3.00 15 1
## 102 4 25.5 2.25 0 0
## 103 2 26.0 2.15 5 1
## 104 2 26.2 2.40 0 0
## 105 3 23.0 1.65 1 1
## 106 2 22.9 1.60 0 0
## 107 2 25.1 2.10 5 1
## 108 3 25.9 2.55 4 1
## 109 4 25.5 2.75 0 0
## 110 2 26.8 2.55 0 0
## 111 2 29.0 2.80 1 1
## 112 3 28.5 3.00 1 1
## 113 2 24.7 2.55 4 1
## 114 2 29.0 3.10 1 1
## 115 2 27.0 2.50 6 1
## 116 4 23.7 1.80 0 0
## 117 3 27.0 2.50 6 1
## 118 2 24.2 1.65 2 1
## 119 4 22.5 1.47 4 1
## 120 2 25.1 1.80 0 0
## 121 2 24.9 2.20 0 0
## 122 2 27.5 2.63 6 1
## 123 2 24.3 2.00 0 0
## 124 2 29.5 3.02 4 1
## 125 2 26.2 2.30 0 0
## 126 2 24.7 1.95 4 1
## 127 3 29.8 3.50 4 1
## 128 4 25.7 2.15 0 0
## 129 3 26.2 2.17 2 1
## 130 4 27.0 2.63 0 0
## 131 3 24.8 2.10 0 0
## 132 2 23.7 1.95 0 0
## 133 2 28.2 3.05 11 1
## 134 2 25.2 2.00 1 1
## 135 2 23.2 1.95 4 1
## 136 4 25.8 2.00 3 1
## 137 4 27.5 2.60 0 0
## 138 2 25.7 2.00 0 0
## 139 2 26.8 2.65 0 0
## 140 3 27.5 3.10 3 1
## 141 3 28.5 3.25 9 1
## 142 2 28.5 3.00 3 1
## 143 1 27.4 2.70 6 1
## 144 2 27.2 2.70 3 1
## 145 3 27.1 2.55 0 0
## 146 2 28.0 2.80 1 1
## 147 2 26.5 1.30 0 0
## 148 3 23.0 1.80 0 0
## 149 3 26.0 2.20 3 1
## 150 3 24.5 2.25 0 0
## 151 2 25.8 2.30 0 0
## 152 4 23.5 1.90 0 0
## 153 4 26.7 2.45 0 0
## 154 3 25.5 2.25 0 0
## 155 2 28.2 2.87 1 1
## 156 2 25.2 2.00 1 1
## 157 2 25.3 1.90 2 1
## 158 3 25.7 2.10 0 0
## 159 4 29.3 3.23 12 1
## 160 3 23.8 1.80 6 1
## 161 2 27.4 2.90 3 1
## 162 2 26.2 2.02 2 1
## 163 2 28.0 2.90 4 1
## 164 2 28.4 3.10 5 1
## 165 2 33.5 5.20 7 1
## 166 2 25.8 2.40 0 0
## 167 3 24.0 1.90 10 1
## 168 2 23.1 2.00 0 0
## 169 2 28.3 3.20 0 0
## 170 2 26.5 2.35 4 1
## 171 2 26.5 2.75 7 1
## 172 3 26.1 2.75 3 1
## 173 2 24.5 2.00 0 0
model<-glm(y~color+width, family=binomial("link"=logit))
summary(model)##
## Call:
## glm(formula = y ~ color + width, family = binomial(link = logit))
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -2.1124 -0.9848 0.5243 0.8513 2.1413
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -12.7151 2.7617 -4.604 4.14e-06 ***
## color1 1.3299 0.8525 1.560 0.1188
## color2 1.4023 0.5484 2.557 0.0106 *
## color3 1.1061 0.5921 1.868 0.0617 .
## width 0.4680 0.1055 4.434 9.26e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 225.76 on 172 degrees of freedom
## Residual deviance: 187.46 on 168 degrees of freedom
## AIC: 197.46
##
## Number of Fisher Scoring iterations: 4
A. MEMBANDINGKAN OUTPUT R DENGAN OUTPUT SAS
Output SAS:
Hasil pemodelan regresi logistik dengan peubah bebas adalah Width (x) dan Color (c) antara R dan SAS adalah sama.
A. INTERPRETASI KOEFISIEN REGRESI
exp(model$coefficients)## (Intercept) color1 color2 color3 width
## 3.005364e-06 3.780738e+00 4.064684e+00 3.022612e+00 1.596727e+00
Interpretasi dugaan parameter model:
Exp(b0)=3.005
tanpa memperhatikan lebar cangkang serta warna cangkang, peluang kepiting betina untuk menarik kepiting jantan adalah 3.005 kali dibandingkan peluang untuk tidak menarik kepiting jantan
Exp(b1_1)=3.78
Odds kepiting betina yang mampu menarik kepiting jantan jika ia berwarna medium-light color adalah 3.78 kali dibandingkan odd yang sama jika kepiting tersebut berwarna dark dengan lebar cangkang kepiting sama.
Exp(b1_2)=4.06
Odds kepiting betina yang mampu menarik kepiting jantan jika ia berwarna medium- color adalah 4.06 kali dibandingkan odd yang sama jika kepiting tersebut berwarna dark dengan lebar cangkang kepiting sama.
Exp(b1_3)=3.02
Odds kepiting betina yang mampu menarik kepiting jantan jika ia berwarna medium-dark color adalah 3.02 kali dibandingkan odd yang sama jika kepiting tersebut berwarna dark dengan lebar cangkang kepiting sama.
Exp(b2)=1.59
Odds pada kepiting betina yang mampu menarik kepiting jantan akan meningkat sebesar 1.59 kali jika lebar cangkang naik sebesar satu satuan dengan warna cangkang kepiting sama.
B. MODEL REGRESI LOGISTIK DENGAN PEUBAH BEBAS WIDTH, COLOR, DAN SPINE (TANPA INTERAKSI)
model2<-glm(y~color+width+spine,
family=binomial("link"=logit))
summary(model2)##
## Call:
## glm(formula = y ~ color + width + spine, family = binomial(link = logit))
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -2.1206 -0.9724 0.5076 0.8750 2.1158
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -12.3908 2.8193 -4.395 1.11e-05 ***
## color1 1.6683 0.9328 1.788 0.07371 .
## color2 1.5249 0.5672 2.689 0.00718 **
## color3 1.1443 0.5933 1.929 0.05377 .
## width 0.4562 0.1078 4.233 2.31e-05 ***
## spine1 -0.3770 0.5019 -0.751 0.45254
## spine2 -0.4348 0.6254 -0.695 0.48687
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 225.76 on 172 degrees of freedom
## Residual deviance: 186.61 on 166 degrees of freedom
## AIC: 200.61
##
## Number of Fisher Scoring iterations: 4
B. UJI DEVIANCE MENGUJI PENGARUH SPINE
##=====================##
# MODEL REGRESI LOGISTIK DENGAN PEUBAH
#BEBAS WIDTH+COLOR+SPINE+COLOR*SPINE
##=====================##
model3<-glm(y~color+width+spine+color*spine,
family=binomial("link"=logit))
summary(model3)##
## Call:
## glm(formula = y ~ color + width + spine + color * spine, family = binomial(link = logit))
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -2.1553 -0.8955 0.4833 0.8377 2.0583
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -11.8084 2.8711 -4.113 3.91e-05 ***
## color1 -17.0159 3956.1804 -0.004 0.99657
## color2 1.5915 0.5941 2.679 0.00739 **
## color3 0.9631 0.6121 1.573 0.11563
## width 0.4364 0.1097 3.976 7.00e-05 ***
## spine1 -16.8850 3956.1804 -0.004 0.99659
## spine2 -14.9214 3956.1804 -0.004 0.99699
## color1:spine1 35.0152 5594.8840 0.006 0.99501
## color2:spine1 16.2429 3956.1804 0.004 0.99672
## color3:spine1 33.5071 4539.3953 0.007 0.99411
## color1:spine2 50.5146 6253.4059 0.008 0.99355
## color2:spine2 13.9470 3956.1805 0.004 0.99719
## color3:spine2 14.3689 3956.1806 0.004 0.99710
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 225.76 on 172 degrees of freedom
## Residual deviance: 177.60 on 160 degrees of freedom
## AIC: 203.6
##
## Number of Fisher Scoring iterations: 16
C. UJI DEVIANCE MENGUJI PENGARUH INTERAKSI SPINE*COLOR
Soal 2
Input Data
##=====================##
# INPUT DATA
##=====================##
z.sex<-as.factor(rep(c("1F","2M"),each=4))
x.treat<-as.factor(rep(c("1plac","2treat"),each=2,times=2))
y.impr<-as.factor(rep(c("1no","2yes"),times=4))
counts<-c(19,13,6,21,10,1,7,7)
data<-data.frame(z.sex, x.treat, y.impr, counts)
data## z.sex x.treat y.impr counts
## 1 1F 1plac 1no 19
## 2 1F 1plac 2yes 13
## 3 1F 2treat 1no 6
## 4 1F 2treat 2yes 21
## 5 2M 1plac 1no 10
## 6 2M 1plac 2yes 1
## 7 2M 2treat 1no 7
## 8 2M 2treat 2yes 7
Penentuan Kategori Referensi
##=============================##
# Penentuan kategori reference
##=============================##
z.sex<-relevel(z.sex,ref="1F")
x.treat<-relevel(x.treat,ref="1plac")
y.impr<-relevel(y.impr,ref="1no") Menentukan kategori referensi peubah kategorik
A. Bentuk model regresi logistik untuk memprediksi improvement dari treatment, sex dan interaksi keduanya.Lakukan uji rasio likelihood dari interaksi antara treatment dan sex. Laporkan dan interpretasikan hasilnya secara menyeluruh dari pandangan subtantive.
Data diatas masih berbentuk data agregasi, agar dapat dianalisis menggunakan GLM logit maka data tersebut perlu diubah menjadi data individu terlebih dahulu
#mengubah count menjadi data individu
data<- data[rep(1:nrow(data),data$counts),-4]
head(data) ## z.sex x.treat y.impr
## 1 1F 1plac 1no
## 1.1 1F 1plac 1no
## 1.2 1F 1plac 1no
## 1.3 1F 1plac 1no
## 1.4 1F 1plac 1no
## 1.5 1F 1plac 1no
dim(data)[1]==sum(counts) #periksa jumlah data## [1] TRUE
Model Dengan Interaksi
#with interaction
modela1<-glm(y.impr~x.treat+z.sex+x.treat*z.sex, data=data, family=binomial("link"=logit))
summary(modela1) ##
## Call:
## glm(formula = y.impr ~ x.treat + z.sex + x.treat * z.sex, family = binomial(link = logit),
## data = data)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -1.7344 -1.0211 0.1362 0.8261 2.1899
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -0.3795 0.3599 -1.054 0.29174
## x.treat2treat 1.6323 0.5864 2.784 0.00538 **
## z.sex2M -1.9231 1.1086 -1.735 0.08281 .
## x.treat2treat:z.sex2M 0.6703 1.3150 0.510 0.61021
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 116.449 on 83 degrees of freedom
## Residual deviance: 97.944 on 80 degrees of freedom
## AIC: 105.94
##
## Number of Fisher Scoring iterations: 4
Persamaan yang terbentuk adalah
Yang selanjutnya digunakan adalah Residual Deviance.
Model Tanpa Interaksi
#tanpa interaction
modela2<-glm(y.impr~x.treat+z.sex, data=data, family=binomial("link"=logit))
summary(modela2)##
## Call:
## glm(formula = y.impr ~ x.treat + z.sex, family = binomial(link = logit),
## data = data)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -1.77642 -0.99909 0.07647 0.81742 2.02120
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -0.4351 0.3452 -1.260 0.207553
## x.treat2treat 1.7817 0.5187 3.435 0.000593 ***
## z.sex2M -1.4687 0.5756 -2.551 0.010728 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 116.449 on 83 degrees of freedom
## Residual deviance: 98.222 on 81 degrees of freedom
## AIC: 104.22
##
## Number of Fisher Scoring iterations: 3
Persamaan yang terbentuk
Uji Rasio Likelihood dari Interaksi antara Treatment dan Sex
B. Jika seseorang ingin membentuk model log linier menggunakan ketiga variabel (improvment, treatment dan sex), perbandingan model apa yang sama dengan perbandingan pada bagian (a)? Jelaskan mengapa perbandingan model tersebut sama secara konsep: apa yang ditunjukkan perbandingan model pada setiap kasus (logistic/loglinier).
Model regresi logistik yang hanya memuat variabel prediktor kategorik saling terkait dengan model loglinear jika salah satu variabelnya berbentuk biner. Pada bagian (a) yang diuji adalah pengaruh interaksi treatment dan sex terhadap improvment. Hal ini berarti melihat ada tidaknya interaksi tiga arah antara treatment,sex dan improvment. Untuk menguji interaksi tiga arah pada model log linier, maka dapat dilakukan dengan uji deviance antara model saturated (yang mengandung interaksi 3 arah) dan model homogeneus (hanya ada interaksi 2 arah).
Model Saturated
#saturated
modelb1<- glm(counts~y.impr+x.treat+z.sex+y.impr*x.treat+y.impr*z.sex+x.treat*z.sex+ y.impr*x.treat*z.sex, family=poisson("link"=log))
summary(modelb1) ##
## Call:
## glm(formula = counts ~ y.impr + x.treat + z.sex + y.impr * x.treat +
## y.impr * z.sex + x.treat * z.sex + y.impr * x.treat * z.sex,
## family = poisson(link = log))
##
## Deviance Residuals:
## [1] 0 0 0 0 0 0 0 0
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 2.9444 0.2294 12.835 < 2e-16 ***
## y.impr2yes -0.3795 0.3599 -1.054 0.29174
## x.treat2treat -1.1527 0.4683 -2.461 0.01384 *
## z.sex2M -0.6419 0.3907 -1.643 0.10040
## y.impr2yes:x.treat2treat 1.6323 0.5864 2.784 0.00538 **
## y.impr2yes:z.sex2M -1.9231 1.1088 -1.734 0.08286 .
## x.treat2treat:z.sex2M 0.7960 0.6798 1.171 0.24164
## y.impr2yes:x.treat2treat:z.sex2M 0.6703 1.3151 0.510 0.61025
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for poisson family taken to be 1)
##
## Null deviance: 3.3455e+01 on 7 degrees of freedom
## Residual deviance: 2.8866e-15 on 0 degrees of freedom
## AIC: 47.527
##
## Number of Fisher Scoring iterations: 3
Model Homogeneous
#homogeneous
modelb2<-glm(counts~y.impr+x.treat+z.sex+y.impr*x.treat+y.impr*z.sex+x.treat*z.sex,family=poisson("link"=log))
summary(modelb2) ##
## Call:
## glm(formula = counts ~ y.impr + x.treat + z.sex + y.impr * x.treat +
## y.impr * z.sex + x.treat * z.sex, family = poisson(link = log))
##
## Deviance Residuals:
## 1 2 3 4 5 6 7 8
## -0.09714 0.11963 0.17846 -0.09246 0.13686 -0.37762 -0.15807 0.16463
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 2.9666 0.2228 13.314 < 2e-16 ***
## y.impr2yes -0.4351 0.3452 -1.260 0.207566
## x.treat2treat -1.2486 0.4406 -2.834 0.004596 **
## z.sex2M -0.7077 0.3730 -1.897 0.057826 .
## y.impr2yes:x.treat2treat 1.7817 0.5188 3.434 0.000594 ***
## y.impr2yes:z.sex2M -1.4687 0.5757 -2.551 0.010733 *
## x.treat2treat:z.sex2M 0.9947 0.5635 1.765 0.077550 .
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for poisson family taken to be 1)
##
## Null deviance: 33.45456 on 7 degrees of freedom
## Residual deviance: 0.27756 on 1 degrees of freedom
## AIC: 45.804
##
## Number of Fisher Scoring iterations: 4
Pengujian Ada Tidaknya Interaksi 3 Arah (Saturated Model vs Homogenous Model)
Berdasarkan hasil di atas terlihat bahwa:
Penduga koefisien parameter untuk interaksi tiga arah pada model log linier saturated (Lambda_XYZ_ijk) = penduga koefisien parameter untuk interaksi treatment dan sex pada model reglog(Beta_3)=0.6703
Nilai statistik uji pada reglog dan log linier untuk interaksi 3 arah menghasilkan nilai yang sama, yaitu 0,278
Kesimpulan yang dihasilkan oleh reglog dan log linier untuk pengaruh interaksi treatment dan sex terhadap perbaikan status diabetes (ada tidaknya interaksi tiga arah) sama, yaitu tidak tolak Ho yang berarti tidak ada pengaruh interaksi treatment dan sex terhadap perbaikan status diabetes (tidak ada interaksi tiga arah)
C. Interpretasikan secara keseluruhan semua penduga parameter pada regresi logistik yang hanya mengandung pengaruh utama treatment dan jenis kelamin.
#c. interpretasi reglog
data.frame(koef=modela2$coefficients,exp_koef=exp(modela2$coefficients)) ## koef exp_koef
## (Intercept) -0.4350571 0.6472277
## x.treat2treat 1.7816802 5.9398281
## z.sex2M -1.4686541 0.2302352
Intercept
Interpretasi
Ketika seorang pasien perempuan tidak diberi treatment (diberi placebo), peluang pasien tersebut mengalami perbaikan status diabetes 0,647 kali dibandingkan peluang tidak mengalami perbaikan status diabetes atau peluang pasien tersebut tidak mengalami perbaikan status adala 1/0,647 = 1,545 kali peluang mengalami perbaikan status diabetes.
Treatment
Interpretasi
Odd pasien untuk megalami perbaikan status diabetes jika ia mendapatkan treatment adalah 5,9398 kali dibandingkan odd yang sama jika pasien tersebut tidak mendapat treatment (mendapatkan placebo) dan jenis kelamin sama. Dengan kata lain, pasien yang diberi treatment akan cenderung mengalami perbaikan status diabetes.
Sex
Interpretasi
Odd pasien untuk megalami perbaikan status diabetes jika ia laki-laki adalah 0,2302 kali dibandingkan odd yang sama jika pasien tersebut perempuan dan diberikan treatment yang sama/tetap. Dengan kata lain, pasien perempuan akan cenderung mengalami perbaikan status diabetes.
D. Model loglinier apa yang ekuivalen dengan model regresi logistik pada bagian (C). Bangun loglinier model dan tunjukan mana penduga parameter yang ekuivalent dengan yang diperoleh dari regresi logistik pada bagian (c).
Dari tabel pada slide sebelumnya semua penduga koefisien parameter pada model reglog memiliki padanan pada model log linier, yaitu:
E. Berdasarkan model regresi logistik dengan interaksi antara treatment dan jenis kelamin. Apa penduga peluang bahwa seorang pria yang memperoleh treatment akan mengalami perbaikan? Apa penduga peluang dari model tanpa interaksi?
Model Dengan Interaksi
#e. predict reglog
new=data.frame(x.treat=as.factor("2treat"), z.sex=as.factor("2M"))
#with interaction
predict(modela1,newdata=new,type="response")## 1
## 0.5
Dugaan peluang terjadi perbaikan status diabetes untuk pasien pria yang mendapatkan treatment adalah 0,5.
Hal ini berarti pasien pria yang mendapatkan treatment memiliki peluang yang sama untuk mengalami perbaikan atau tidak.
Model Tanpa Interaksi
#without interaction
predict(modela2,newdata=new,type="response") ## 1
## 0.4695301
Dugaan peluang terjadi perbaikan status diabetes untuk pasien pria yang mendapatkan treatment adalah 0,47.
Dengan menggunakan cutting point 0,5 maka pasien tersebut akan di prediksi tidak mengalami perbaikan status.
G1501202071, Mahasiswa Pascasarjana Statistika dan Sains Data, IPB University, reniamelia@apps.ipb.ac.id↩︎