Minggu ke-6 bagian 2 ini akan membahas mengenai: Model Regresi Logit Binomial-II (Peubah Bebasnya Kategorik)
Review
Regresi logistik biner digunakan untuk memodelkan hubungan antara peubah respon yang terdiri dari dua kategori dengan satu atau lebih peubah penjelas. Peubah penjelasanya bisa berupa data kontinu atau kategorik. Sebelumnya kita telah membahas dengan peubah bebasnya kontinu. Sekarang kita akan bahas untuk peubah bebasnya kategorik.
Soal
Jawaban Soal 1
setwd("C:\\Users\\ACER\\Downloads\\")
Input Data
dataku <- read.csv("datacrab.csv",sep=";")
head(dataku)
## C S W Wt Sa
## 1 2 3 28.3 3.05 8
## 2 3 3 26.0 2.60 4
## 3 3 3 25.6 2.15 0
## 4 4 2 21.0 1.85 0
## 5 2 3 29.0 3.00 1
## 6 1 2 25.0 2.30 3
str(dataku)
## 'data.frame': 173 obs. of 5 variables:
## $ C : int 2 3 3 4 2 1 4 2 2 2 ...
## $ S : int 3 3 3 2 3 2 3 3 1 3 ...
## $ W : num 28.3 26 25.6 21 29 25 26.2 24.9 25.7 27.5 ...
## $ Wt: num 3.05 2.6 2.15 1.85 3 2.3 1.3 2.1 2 3.15 ...
## $ Sa: int 8 4 0 0 1 3 0 0 8 6 ...
Pendefinisian Peubah
c<- factor(dataku[,1])
s<- factor(dataku[,2])
w<- dataku[,3]
wt<- dataku[,4]
sa<- dataku[,5]
y<- c(1:173)
for (i in 1:length(sa))
{
if(sa[i]>0)(y[i]=1)else(y[i]=0)
}
Menentukan Referensi Peubah Kategorik
color<-relevel(c,ref="4")#menentukan referensi pada peubah warna
spine<-relevel(s,ref="3")#menentukan referensi pada peubah spine
width<-w
Model Regresi Logistik Dengan Peubah Bebas Width Dan Color
head(data.frame(color,width,wt,sa,y))
## color width wt sa y
## 1 2 28.3 3.05 8 1
## 2 3 26.0 2.60 4 1
## 3 3 25.6 2.15 0 0
## 4 4 21.0 1.85 0 0
## 5 2 29.0 3.00 1 1
## 6 1 25.0 2.30 3 1
model<-glm(y~color+width, family=binomial("link"=logit))
summary(model)
##
## Call:
## glm(formula = y ~ color + width, family = binomial(link = logit))
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -2.1124 -0.9848 0.5243 0.8513 2.1413
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -12.7151 2.7617 -4.604 4.14e-06 ***
## color1 1.3299 0.8525 1.560 0.1188
## color2 1.4023 0.5484 2.557 0.0106 *
## color3 1.1061 0.5921 1.868 0.0617 .
## width 0.4680 0.1055 4.434 9.26e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 225.76 on 172 degrees of freedom
## Residual deviance: 187.46 on 168 degrees of freedom
## AIC: 197.46
##
## Number of Fisher Scoring iterations: 4
Interpretasi Koefisien Regresi
exp(model$coefficients)
## (Intercept) color1 color2 color3 width
## 3.005364e-06 3.780738e+00 4.064684e+00 3.022612e+00 1.596727e+00
Interpretasi dugaan parameter model:
- \(exp(b_0)=3.005\)
tanpa memperhatikan lebar cangkang serta warna cangkang, peluang kepiting betina untuk menarik kepiting jantan adalah \(3.005\) kali dibandingkan peluang untuk tidak menarik kepiting jantan
- \(exp(b1_1)=3.78\)
Odds kepiting betina yang mampu menarik kepiting jantan jika ia berwarna medium-light color adalah \(3.78\) kali dibandingkan odd yang sama jika kepiting tersebut berwarna dark dengan lebar cangkang kepiting sama.
- \(exp(b1_2)=4.06\)
Odds kepiting betina yang mampu menarik kepiting jantan jika ia berwarna medium- color adalah \(4.06\) kali dibandingkan odd yang sama jika kepiting tersebut berwarna dark dengan lebar cangkang kepiting sama.
- \(exp(b1_3)=3.02\)
Odds kepiting betina yang mampu menarik kepiting jantan jika ia berwarna medium-dark color adalah \(3.02\) kali dibandingkan odd yang sama jika kepiting tersebut berwarna dark dengan lebar cangkang kepiting sama.
- \(exp(b2)=1.59\)
Odds pada kepiting betina yang mampu menarik kepiting jantan akan meningkat sebesar \(1.59\) kali jika lebar cangkang naik sebesar satu satuan dengan warna cangkang kepiting sama.
Model Regresi Logistik Dengan Peubah Bebas Width, Color, Dan Spine (Tanpa Interaksi)
model2<-glm(y~color+width+spine,
family=binomial("link"=logit))
summary(model2)
##
## Call:
## glm(formula = y ~ color + width + spine, family = binomial(link = logit))
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -2.1206 -0.9724 0.5076 0.8750 2.1158
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -12.3908 2.8193 -4.395 1.11e-05 ***
## color1 1.6683 0.9328 1.788 0.07371 .
## color2 1.5249 0.5672 2.689 0.00718 **
## color3 1.1443 0.5933 1.929 0.05377 .
## width 0.4562 0.1078 4.233 2.31e-05 ***
## spine1 -0.3770 0.5019 -0.751 0.45254
## spine2 -0.4348 0.6254 -0.695 0.48687
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 225.76 on 172 degrees of freedom
## Residual deviance: 186.61 on 166 degrees of freedom
## AIC: 200.61
##
## Number of Fisher Scoring iterations: 4
Uji Deviance Menguji Pengaruh Spine
Hipotesis
\(H_0\) : \(\beta_3=0\) peubah spine tidak berpengaruh terhadap peubah respon
\(H_0\) : \(\beta_3 \neq 0\) peubah spine berpengaruh terhadap peubah respon
Taraf Nyata
\(\alpha=5\%\)
Statistik Uji: LRT
Daerah Penolakan
Tolak \(H_0\) jika \(G^{2}> \chi ^{2}_{0.05, db}\) = \(G^{2}> \chi ^{2}_{0.05, 2}\)
Keputusan
Karena \(0.85 < 5.991\), maka Tidak Cukup Bukti Untuk Tolak \(H_0\)
Kesimpulan
Tidak cukup bukti untuk tolak \(H_0\) pada taraf nyata \(5\%\). Dengan kata lain, peubah spine tidak berpengaruh nyata.
model3<-glm(y~color+width+spine+color*spine,
family=binomial("link"=logit))
summary(model3)
##
## Call:
## glm(formula = y ~ color + width + spine + color * spine, family = binomial(link = logit))
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -2.1553 -0.8955 0.4833 0.8377 2.0583
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -11.8084 2.8711 -4.113 3.91e-05 ***
## color1 -17.0159 3956.1804 -0.004 0.99657
## color2 1.5915 0.5941 2.679 0.00739 **
## color3 0.9631 0.6121 1.573 0.11563
## width 0.4364 0.1097 3.976 7.00e-05 ***
## spine1 -16.8850 3956.1804 -0.004 0.99659
## spine2 -14.9214 3956.1804 -0.004 0.99699
## color1:spine1 35.0152 5594.8840 0.006 0.99501
## color2:spine1 16.2429 3956.1804 0.004 0.99672
## color3:spine1 33.5071 4539.3953 0.007 0.99411
## color1:spine2 50.5146 6253.4059 0.008 0.99355
## color2:spine2 13.9470 3956.1805 0.004 0.99719
## color3:spine2 14.3689 3956.1806 0.004 0.99710
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 225.76 on 172 degrees of freedom
## Residual deviance: 177.60 on 160 degrees of freedom
## AIC: 203.6
##
## Number of Fisher Scoring iterations: 16
Uji Deviance Menguji Pengaruh Interaksi Spine*Color
Hipotesis
\(H_0\) : \(\beta_4=0\) interaksi spine dan color tidak berpengaruh terhadap ketertarikan jantan ke betina
\(H_0\) : \(\beta_4 \neq 0\) interaksi spine dan color berpengaruh terhadap ketertarikan jantan ke betina
Taraf Nyata
\(\alpha=5\%\)
Statistik Uji: LRT
Daerah Penolakan
Tolak \(H_0\) jika \(G^{2}> \chi ^{2}_{0.05, db}\) = \(G^{2}> \chi ^{2}_{0.05, 6}\)
Keputusan
Karena \(9.01 < 12.59\), maka Tidak Cukup Bukti Untuk Tolak \(H_0\)
Kesimpulan
Tidak cukup bukti untuk tolak \(H_0\) pada taraf nyata \(5\%\). Dengan kata lain, peubah interaksi spine dan color tidak berpengaruh nyata.
Soal 2
Jawaban Soal 2
setwd("C:\\Users\\ACER\\Downloads\\")
Input Data
z.sex<-as.factor(rep(c("1F","2M"),each=4))
x.treat<-as.factor(rep(c("1plac","2treat"),each=2,times=2))
y.impr<-as.factor(rep(c("1no","2yes"),times=4))
counts<-c(19,13,6,21,10,1,7,7)
data<-data.frame(z.sex, x.treat, y.impr, counts)
data
## z.sex x.treat y.impr counts
## 1 1F 1plac 1no 19
## 2 1F 1plac 2yes 13
## 3 1F 2treat 1no 6
## 4 1F 2treat 2yes 21
## 5 2M 1plac 1no 10
## 6 2M 1plac 2yes 1
## 7 2M 2treat 1no 7
## 8 2M 2treat 2yes 7
Penentuan Kategori Referensi
z.sex<-relevel(z.sex,ref="1F")
x.treat<-relevel(x.treat,ref="1plac")
y.impr<-relevel(y.impr,ref="1no")
Soal 2.A
Bentuk model regresi logistik untuk memprediksi improvement dari treatment, sex dan interaksi keduanya.Lakukan uji rasio likelihood dari interaksi antara treatment dan sex. Laporkan dan interpretasikan hasilnya secara menyeluruh dari pandangan subtantive
Data diatas masih berbentuk data agregasi, agar dapat dianalisis menggunakan GLM logit maka data tersebut perlu diubah menjadi data individu terlebih dahulu
data<- data[rep(1:nrow(data),data$counts),-4]
head(data)
## z.sex x.treat y.impr
## 1 1F 1plac 1no
## 1.1 1F 1plac 1no
## 1.2 1F 1plac 1no
## 1.3 1F 1plac 1no
## 1.4 1F 1plac 1no
## 1.5 1F 1plac 1no
dim(data)[1]==sum(counts)
## [1] TRUE
Model Dengan Interaksi
\[log \left ( \frac{\pi }{1-\pi } \right )=\alpha+\beta_1 treatment + \beta_2 sex + \beta_3 treatment sex\] dengan,
modela1<-glm(y.impr~x.treat+z.sex+x.treat*z.sex, data=data, family=binomial("link"=logit))
summary(modela1)
##
## Call:
## glm(formula = y.impr ~ x.treat + z.sex + x.treat * z.sex, family = binomial(link = logit),
## data = data)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -1.7344 -1.0211 0.1362 0.8261 2.1899
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -0.3795 0.3599 -1.054 0.29174
## x.treat2treat 1.6323 0.5864 2.784 0.00538 **
## z.sex2M -1.9231 1.1086 -1.735 0.08281 .
## x.treat2treat:z.sex2M 0.6703 1.3150 0.510 0.61021
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 116.449 on 83 degrees of freedom
## Residual deviance: 97.944 on 80 degrees of freedom
## AIC: 105.94
##
## Number of Fisher Scoring iterations: 4
Persamaan yang terbentuk adalah
\[log \left ( \frac{\widehat{\pi} }{1-\widehat{\pi} } \right )=-0.3795+1.6323 treatment -1.9231 sex + 0.6703 treatment sex\]
Model Tanpa Interaksi
\[log \left ( \frac{\pi }{1-\pi } \right )=\alpha+\beta_1 treatment + \beta_2 sex\] dengan,
modela2<-glm(y.impr~x.treat+z.sex, data=data, family=binomial("link"=logit))
summary(modela2)
##
## Call:
## glm(formula = y.impr ~ x.treat + z.sex, family = binomial(link = logit),
## data = data)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -1.77642 -0.99909 0.07647 0.81742 2.02120
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -0.4351 0.3452 -1.260 0.207553
## x.treat2treat 1.7817 0.5187 3.435 0.000593 ***
## z.sex2M -1.4687 0.5756 -2.551 0.010728 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 116.449 on 83 degrees of freedom
## Residual deviance: 98.222 on 81 degrees of freedom
## AIC: 104.22
##
## Number of Fisher Scoring iterations: 3
Persamaan yang terbentuk adalah
\[log \left ( \frac{\widehat{\pi} }{1-\widehat{\pi} } \right )=-0.4351+1.7817 treatment -1.4687 sex\]
Uji Rasio Likelihood dari Interaksi antara Treatment dan Sex
Hipotesis
\(H_0\) : \(\beta_3=0\) tidak ada pengaruh interaksi treatment dan jenis kelamin terhadap status perbaikan diabetes
\(H_0\) : \(\beta_3 \neq 0\) ada pengaruh interaksi treatment dan jenis kelamin terhadap status perbaikan diabetes
Taraf Nyata
\(\alpha=5\%\)
Statistik Uji: LRT
Daerah Penolakan
Tolak \(H_0\) jika \(G^{2}> \chi ^{2}_{0.05, db}\) = \(G^{2}> \chi ^{2}_{0.05, 1}\)
Keputusan
Karena \(0.278 < 3.841\), maka Tidak Tolak \(H_0\)
Kesimpulan
Dengan taraf nyata \(5\%\), tidak ada pengaruh anatara ineraksi treatment dan jenis kelamin terhadap status perbaikan diabetes. Dengan kata lain, untuk memprediksi status perbaikan diabetes pasien cukup melalui jenis treatment dan jenis kelamin, tanpa interaksi keduanya.
Soal 2.B
Jika seseorang ingin membentuk model log linier menggunakan ketiga variabel (improvment, treatment dan sex), perbandingan model apa yang sama dengan perbandingan pada bagian (a)? Jelaskan mengapa perbandingan model tersebut sama secara konsep: apa yang ditunjukkan perbandingan model pada setiap kasus (logistic/loglinier)
Model regresi logistik yang hanya memuat variabel prediktor kategorik saling terkait dengan model loglinear jika salah satu variabelnya berbentuk biner. Pada bagian (a) yang diuji adalah pengaruh interaksi treatment dan sex terhadap improvment. Hal ini berarti melihat ada tidaknya interaksi tiga arah antara treatment,sex dan improvment. Untuk menguji interaksi tiga arah pada model log linier, maka dapat dilakukan dengan uji deviance antara model saturated (yang mengandung interaksi 3 arah) dan model homogeneus (hanya ada interaksi 2 arah).
Model Saturated
modelb1<- glm(counts~y.impr+x.treat+z.sex+y.impr*x.treat+y.impr*z.sex+x.treat*z.sex+ y.impr*x.treat*z.sex, family=poisson("link"=log))
summary(modelb1)
##
## Call:
## glm(formula = counts ~ y.impr + x.treat + z.sex + y.impr * x.treat +
## y.impr * z.sex + x.treat * z.sex + y.impr * x.treat * z.sex,
## family = poisson(link = log))
##
## Deviance Residuals:
## [1] 0 0 0 0 0 0 0 0
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 2.9444 0.2294 12.835 < 2e-16 ***
## y.impr2yes -0.3795 0.3599 -1.054 0.29174
## x.treat2treat -1.1527 0.4683 -2.461 0.01384 *
## z.sex2M -0.6419 0.3907 -1.643 0.10040
## y.impr2yes:x.treat2treat 1.6323 0.5864 2.784 0.00538 **
## y.impr2yes:z.sex2M -1.9231 1.1088 -1.734 0.08286 .
## x.treat2treat:z.sex2M 0.7960 0.6798 1.171 0.24164
## y.impr2yes:x.treat2treat:z.sex2M 0.6703 1.3151 0.510 0.61025
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for poisson family taken to be 1)
##
## Null deviance: 3.3455e+01 on 7 degrees of freedom
## Residual deviance: 2.8866e-15 on 0 degrees of freedom
## AIC: 47.527
##
## Number of Fisher Scoring iterations: 3
Model Homogeneous
modelb2<-glm(counts~y.impr+x.treat+z.sex+y.impr*x.treat+y.impr*z.sex+x.treat*z.sex,family=poisson("link"=log))
summary(modelb2)
##
## Call:
## glm(formula = counts ~ y.impr + x.treat + z.sex + y.impr * x.treat +
## y.impr * z.sex + x.treat * z.sex, family = poisson(link = log))
##
## Deviance Residuals:
## 1 2 3 4 5 6 7 8
## -0.09714 0.11963 0.17846 -0.09246 0.13686 -0.37762 -0.15807 0.16463
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 2.9666 0.2228 13.314 < 2e-16 ***
## y.impr2yes -0.4351 0.3452 -1.260 0.207566
## x.treat2treat -1.2486 0.4406 -2.834 0.004596 **
## z.sex2M -0.7077 0.3730 -1.897 0.057826 .
## y.impr2yes:x.treat2treat 1.7817 0.5188 3.434 0.000594 ***
## y.impr2yes:z.sex2M -1.4687 0.5757 -2.551 0.010733 *
## x.treat2treat:z.sex2M 0.9947 0.5635 1.765 0.077550 .
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for poisson family taken to be 1)
##
## Null deviance: 33.45456 on 7 degrees of freedom
## Residual deviance: 0.27756 on 1 degrees of freedom
## AIC: 45.804
##
## Number of Fisher Scoring iterations: 4
Pengujian Ada Tidaknya Interaksi 3 Arah (Saturated Model vs Homogenous Model)
Hipotesis
\(H_0\) : \(\lambda^{XYZ}_{ijk}=0\) tidak ada interaksi tiga arah atau model yang terbentuk adalah model homogenous
\(H_0\) : \(\lambda^{XYZ}_{ijk} \neq 0\) da interaksi tiga arah atau model yang terbentuk adalah model saturated
Taraf Nyata
\(\alpha=5\%\)
Statistik Uji: LRT
Daerah Penolakan
Tolak \(H_0\) jika \(\Delta Deviance> \chi ^{2}_{0.05, db}\) = \(\Delta Deviance> \chi ^{2}_{0.05, 1}\)
Keputusan
Karena \(0.27756 < 3.841\), maka Tidak Tolak \(H_0\)
Kesimpulan
Dengan taraf nyata \(5\%\), belum cukup bukti untuk menolak \(H_0\) atau dapat dikatakan bahwa tidak ada interaksi tiga arah antara improvment, treatment, dan jenis kelamin.
Berdasarkan hasil di atas terlihat bahwa:
Penduga koefisien parameter untuk interaksi tiga arah pada model log linier saturated (\(\lambda^{XYZ}_{ijk}\)) adalah penduga koefisien parameter untuk interaksi treatment dan sex pada model reglog(\(\beta_3\))=\(0.6703\)
Nilai statistik uji pada reglog dan log linier untuk interaksi 3 arah menghasilkan nilai yang sama, yaitu \(0.278\)
Kesimpulan yang dihasilkan oleh reglog dan log linier untuk pengaruh interaksi treatment dan sex terhadap perbaikan status diabetes (ada tidaknya interaksi tiga arah) sama, yaitu tidak tolak Ho yang berarti tidak ada pengaruh interaksi treatment dan sex terhadap perbaikan status diabetes (tidak ada interaksi tiga arah)
2.C
Interpretasikan secara keseluruhan semua penduga parameter pada regresi logistik yang hanya mengandung pengaruh utama treatment dan jenis kelamin.
model regresi logistik yang hanya mengandung pengaruh utama treatmenr dan jenis kelamin:
Persamaan yang terbentuk adalah
\[log \left ( \frac{\widehat{\pi} }{1-\widehat{\pi} } \right )=-0.4351+1.7817 treatment-1.4687sex\] dimana,
data.frame(koef=modela2$coefficients,exp_koef=exp(modela2$coefficients))
## koef exp_koef
## (Intercept) -0.4350571 0.6472277
## x.treat2treat 1.7816802 5.9398281
## z.sex2M -1.4686541 0.2302352
Intercept
\(exp(\alpha)=exp(-0.435)=0.6472\)
Interpretasi
Ketika seorang pasien perempuan tidak diberi treatment (diberi placebo), peluang pasien tersebut mengalami perbaikan status diabetes \(0.647\) kali dibandingkan peluang tidak mengalami perbaikan status diabetes atau peluang pasien tersebut tidak mengalami perbaikan status adalah \(1/0.647 = 1.545\) kali peluang mengalami perbaikan status diabetes.
Treatment
\(exp(\widehat{\beta}_1 )=exp(1.7816)=5.9398\)
Interpretasi
Odd pasien untuk megalami perbaikan status diabetes jika ia mendapatkan treatment adalah \(5.9398\) kali dibandingkan odd yang sama jika pasien tersebut tidak mendapat treatment (mendapatkan placebo) dan jenis kelamin sama. Dengan kata lain, pasien yang diberi treatment akan cenderung mengalami perbaikan status diabetes.
Sex
\(exp(\widehat{\beta}_2 )=exp(-1.469)=0.2302\)
Interpretasi
Odd pasien untuk megalami perbaikan status diabetes jika dia laki-laki adalah \(0.2302\) kali dibandingkan odd yang sama jika pasien tersebut perempuan dan diberikan treatment yang sama/tetap. Dengan kata lain, pasien perempuan akan cenderung mengalami perbaikan status diabetes.
2.D
Model loglinier apa yang ekuivalen dengan model regresi logistik pada bagian (C). Bangun loglinier model dan tunjukan mana penduga parameter yang ekuivalent dengan yang diperoleh dari regresi logistik pada bagian (c).
Dari tabel pada slide sebelumnya semua penduga koefisien parameter pada model reglog memiliki padanan pada model log linier, yaitu:
penduga intercept pada reglog ekuivalent dengan penduga \(\lambda^Y_j\), yaitu \(-0.435\). \(exp(\lambda^Y_j)=exp(\alpha)\) menyatakan nilai odd, yaitu perbandingan peluang pasien untuk mengalami perbaikan dengan veluang tidak mengalami perbaikan tanpa memperhatikan jenis kelamin dan jenis treatment yang diperoleh.
\(\widehat{\beta}_1=\widehat{\lambda}^{XY}_{ij}=1.782\). \(exp(\widehat{\beta}_1)= exp(\widehat{\lambda}^{XY}_{ij})\), menyatakan nilai odd, yaitu perbandingan odd pasien mengalami perbaikan status diabetes jika diberi treatment dengan odd yang sama jika diberi placebo.
\(\widehat{\beta}_2=\widehat{\lambda}^{YZ}_{jk}=-1.469\). \(exp(\widehat{\beta}_2)= exp(\widehat{\lambda}^{YZ}_{jk})\), menyatakan nilai odd, yaitu perbandingan odd pasien mengalami perbaikan status diabetes jika pasien tersebut laki-lakidengan odd yang sama jika dia perempuan.
2.E
Berdasarkan model regresi logistik dengan interaksi antara treatment dan jenis kelamin. Apa penduga peluang bahwa seorang pria yang memperoleh treatment akan mengalami perbaikan? Apa penduga peluang dari model tanpa interaksi?
Model Dengan Interaksi
Laki-laki: Sex=1 Memperoleh treatment: treatment=1, sehingga:
\[log \left ( \frac{\widehat{\pi} }{1-\widehat{\pi} } \right )=-0.3795+1.6323 treatment-1.9231sex+0.6703 treatment sex\] \[log \left ( \frac{\widehat{\pi} }{1-\widehat{\pi} } \right )=-0.3795+1.6323 (1)-1.9231(1)+0.6703 (1)(1)\] \[log \left ( \frac{\widehat{\pi} }{1-\widehat{\pi} } \right )=-2.887 \times 10^{-15}\]
sehingga,
\[\frac{\widehat{\pi} }{1-\widehat{\pi} }=exp(-2.887 \times 10^{-15})=1\] \[\widehat{\pi}=\frac{1 }{1+1 }=0.5\]
new=data.frame(x.treat=as.factor("2treat"), z.sex=as.factor("2M"))
#with interaction
predict(modela1,newdata=new,type="response")
## 1
## 0.5
Dugaan peluang terjadi perbaikan status diabetes untuk pasien pria yang mendapatkan treatment adalah \(0.5\).
Hal ini berarti pasien pria yang mendapatkan treatment memiliki peluang yang sama untuk mengalami perbaikan atau tidak.
Model Tanpa Interaksi
\[log \left ( \frac{\widehat{\pi} }{1-\widehat{\pi} } \right )=-0.4351+1.7817 treatment-1.4687sex\]
\[\widehat{\pi}=\frac{-0.4351+1.7817 treatment-1.4687sex }{1-0.4351+1.7817 treatment-1.4687sex }\]
\[\widehat{\pi}=\frac{-0.4351+1.7817(1)-1.4687(1) }{1-0.4351+1.7817 (1) -1.4687 (1) }\]
\[\widehat{\pi}=exp(0.4695)\]
predict(modela2,newdata=new,type="response")
## 1
## 0.4695301
Dugaan peluang terjadi perbaikan status diabetes untuk pasien pria yang mendapatkan treatment adalah \(0.47\).
Dengan menggunakan cutting point \(0.5\) maka pasien tersebut akan di prediksi tidak mengalami perbaikan status.
TERIMAKASIH