Model loglinier dua arah untuk data yang bersifat kategori dan dapat dibentuk ke dalam suatu tabelkontingensi, dapat dianalisis dengan menggunakan analisis log linier. Model log linier digunakan untuk menganalisis atau mempelajari pola asosiasi antara beberapa variable yang diperhatikan merupakan variabel kategorik, dimana pola hubunganatau asosiasi antar peubahnya dilihat dari interaksi antar peubah itu sendiri.
Variabel respon banyak yang hanya memiliki dua kategori misalnya kelulusan dalam tes(lulus atau tidak), pengobatan penyakit (sembuh atau tidak) dan lain-lain. Secara umum dapat dikatakan bahwa variabel respon Y hanya memiliki dua hasil yang mungkin yaitu “sukses” yang dilambangkan dengan angka satu (1) dan “gagal” yang dilambangkan deng an angka nol (0).Variabel seperti ini disebut sebagai variabel biner. Distribusi dari Y memiliki peluang sukses P(Y= 1) = p dan peluang gagal P(Y = 0) = (1 - p ) dengan ekspektasi E(Y) = p. Untuk sebuah pengamatan Y akan mengikuti distribusi Bernoulli. Dengan demikian untuk n pengamatan yang saling bebas, banyak “sukses” akan memiliki distribusi Binomial dengan parameter p .Dalam bagian ini kita akan membahas GLM dengan respon biner dengan sebuah variabelpenjelas (X) saja meskipun sebenarnya GLM dapat digunakan untuk variabel penjelas lebih darisatu. Perubahan nilai p dipengaruhi oleh perubahan X.
Model log-linear dapat digunakan untuk mengkaji pola asosiasi antarvariabel pada data kategori.Model log-linear merupakan bentuk pemodelan dari data tabel kontingensi, dengan menggunakan model ini memungkinkan untuk melakukan pengujian lebih dari dua variabel dalam tabel kontingensi secara simultan.
Misalkan suatu tabel kontingensi \(I×J\) yang diklasifikasikan dalam n subjek. Jika respon saling bebas statistik, maka peluang cell bersama {\(μ_{ij}\)} ditentukan oleh total marjinal baris dan kolom.
{\(μ_{ij}\)}=\(λ_i\)\(+\)\(λ_j\) ,\(i=1,…,I\), \(j=1,…,J\)
Model loglinear saling bebas untuk tabel dua arah, yaitu:
\(log\) \(μ_{ij}\)\(=\)\(λ\)\(+\)\(λ_{i}^{X}\)\(+\)\(λ_{j}^{Y}\)
Keterangan:
\(λ_{i}^{X}\) =
pengaruh baris
\(λ_{j}^{Y}\) =
pengaruh kolom
Model log-linier adalah suatu pendekatan pemodelan linier terampat yang dapat digunakan untuk data yang menyebar Poisson. Model log-linier digunakan untuk Menguji hubungan antar peubah kategorik yang terdapat pada tabel kontingensi (cell count). Model ini dapat menangani situasi yang kompleks : dapat digunakan untuk menguji hubungan homogen dan menduga rasio odds pada table kontingensi dengan berbagai ukuran (tidak terbatas pada ukuran 2×2).
Pada model log-linear semua peubahnya merupakan peubah respon. Tidak ada yang berperan sebagai peubah penjelas/peubah bebas. Semuanya dianggap sama, yaitu peubah respon. Tujuan utama dari pembuatan model log-linear adalah untuk menduga parameter model yang mendeskripsikan hubungan antar peubah kategorik.
Tahapan dalam analisis log linier 2 peubah kategorik di R
adalah:
1. Input Data.
2. Menentukan Kategori Referensi.
3. Menyusun Model tanpa Interaksi.
4. Menyusun Model dengan
Interaksi.
5. Menginterpretasikan model tanpa interaksi dan dengan
interaksi
6. Menghitung nilai penduga bagi {\(μ_{ij}\)} pada model tanpa interaksi dan
dengan interaksi
7. Menguji hipotesis untuk mengetahui ada/tidak
hubungan antara peubah X dan Y. Biasanya digunakan deviance.
\(H_0\) = tidak ada asosiasi antara
peubah X dan Y
\(H_1\) = ada
asosiasi antara peubah X dan Y
Selisih Deviance = Deviance Model tanpa interaksi - Deviance Model dengan interaksi (saturated)
Tolak \(H_0\) : Jika selisih Deviance \(≥\) Chi Square (α, selisih derajat bebas Deviance)
Contoh kasus adalah kepercayaan orang terhadap kehidupan setelah mati
berdasarkan warna kulit atau ras dengan data sebagai berikut:
Masukkan data di atas pada program R seperti langkah sebelumnya dan
lakukan analisis.
a. Lakukan pemodelan log-linier dengan menjadikan
Yes (percaya) dan kulit putih sebagai pembanding / Refrensi!
b.
Berdasarkan model tersebut, tentukan penduga bagi \(μ_{ij}\) , untuk \(i=1,2,3\) dan \(j=1,2\).
c. Lakukan uji hipotesis
untuk mengetahui ada tidaknya hubungan antara adalah kepercayaan orang
terhadap kehidupan setelah mati dengan warna kulit atau ras menggunakan
model penuh (Saturated Model). Apa kesimpulan?
Ras<-factor(rep(c("White","Black","Other"),each=2))
Belief<-factor(rep(c("Yes","No"),times=3))
count<-c(1339,300,260,55,88,22)
data.frame(Ras,Belief,count)
## Ras Belief count
## 1 White Yes 1339
## 2 White No 300
## 3 Black Yes 260
## 4 Black No 55
## 5 Other Yes 88
## 6 Other No 22
Setelah masukan data tabel kontingensi 2 arah seperti gambar di atas. Lakukan pemodelan logliniernya dengan menjadikan Yes (percaya) dan kulit putih sebagai pembanding / Refrensi.
Ras<-relevel(Ras,ref="White")
Belief<-relevel(Belief,ref="Yes")
modela<-glm(count~Ras+Belief, family=poisson(link="log"))
summary(modela)
##
## Call:
## glm(formula = count ~ Ras + Belief, family = poisson(link = "log"))
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 7.20015 0.02680 268.63 <2e-16 ***
## RasBlack -1.64927 0.06152 -26.81 <2e-16 ***
## RasOther -2.70136 0.09849 -27.43 <2e-16 ***
## BeliefNo -1.49846 0.05697 -26.30 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for poisson family taken to be 1)
##
## Null deviance: 2849.21758 on 5 degrees of freedom
## Residual deviance: 0.35649 on 2 degrees of freedom
## AIC: 49.437
##
## Number of Fisher Scoring iterations: 3
Dari hasil di atas dapat dibentuk model tanpa intraksinya:
Agar interpretasi parameter model lebih mudah dan bermakna, nilai estimasi parameter model tersebut di eksponensialkan terlebih dahulu. Hasil output program R diperoleh sebagai berikut:
exp(modela$coefficients[-1])
## RasBlack RasOther BeliefNo
## 0.19219036 0.06711409 0.22347362
Tanpa memperhatikan Kepercayaa kehidupan setelah mati, peluang
seseorang ras berkulit hitam 0.19219036 kali dibandingkan peluang
seseorang ras berkulit putih atau peluang seseorang untuk seseorang ras
berkulit putih 1/0.19219036 = 5.20317460251 kali dibandingkan peluang
seseorang ras berkulit hitam.
Dst….
modela_sat<-glm(count~Ras+Belief+Ras*Belief, family=poisson(link="log"))
summary(modela_sat)
##
## Call:
## glm(formula = count ~ Ras + Belief + Ras * Belief, family = poisson(link = "log"))
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 7.19968 0.02733 263.453 <2e-16 ***
## RasBlack -1.63900 0.06777 -24.184 <2e-16 ***
## RasOther -2.72234 0.11005 -24.738 <2e-16 ***
## BeliefNo -1.49590 0.06388 -23.419 <2e-16 ***
## RasBlack:BeliefNo -0.05745 0.16158 -0.356 0.722
## RasOther:BeliefNo 0.10960 0.24678 0.444 0.657
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for poisson family taken to be 1)
##
## Null deviance: 2.8492e+03 on 5 degrees of freedom
## Residual deviance: 2.8888e-13 on 0 degrees of freedom
## AIC: 53.081
##
## Number of Fisher Scoring iterations: 3
Dari hasil di atas dapat dibentuk model dengan interaksi (Saturated Model):
Agar interpretasi parameter model lebih mudah dan bermakna, nilai estimasi parameter model tersebut di eksponensialkan terlebih dahulu. Hasil output program R diperoleh sebagai berikut:
exp(modela_sat$coefficients[-1])
## RasBlack RasOther BeliefNo RasBlack:BeliefNo
## 0.19417476 0.06572069 0.22404780 0.94416667
## RasOther:BeliefNo
## 1.11583333
data.frame(Ras,Belief,asli=count,tanpainteraksi=fitted(modela),saturated=fitted(modela_sat))
## Ras Belief asli tanpainteraksi saturated
## 1 White Yes 1339 1339.62839 1339
## 2 White No 300 299.37161 300
## 3 Black Yes 260 257.46366 260
## 4 Black No 55 57.53634 55
## 5 Other Yes 88 89.90795 88
## 6 Other No 22 20.09205 22
Hipotesis:
\(H_0\) = tidak ada
asosiasi antara kepercayaan kehidupan setelah mati dengan ras (warna
kulit)
\(H_1\) = ada asosiasi
antara kepercayaan kehidupan setelah mati dengan ras (warna
kulit)
Statistik Uji :
Deviance.model<- modela$deviance - modela_sat$deviance
Deviance.model
## [1] 0.3564851
Selisih Deviance = Deviance Model tanpa interaksi - Deviance Model dengan interaksi (saturated) = 0.3564851
Chi Square tabel dengan alpa = 0.05
derajat.bebas <- (2 - 0)
Lihat output pada model loglinier bagian yang tertulis Residual deviance: ….. on … degrees of freedom. Residual deviance ini yang kita gunakan, baik nilai deviance nya maupun derajat bebasnya. Dalam kasus ini, tabelnya adalah 3x2 berarti angka 2 adalah derajatbebas model a tanpa interaksi yang diperoleh dari: ((3-1)(2-1)=2x1=2 sedangkan 0 adalah derajat bebas model a dengan interaksi.
derajat.bebas
## [1] 2
Selisih Derajat Bebas = derajat bebas Model tanpa interaksi - derajat bebas Model dengan interaksi (saturated) = 2-0 = 2
chi.tabel <- qchisq((1-0.05), df=derajat.bebas)
chi.tabel
## [1] 5.991465
Chi_Square(α, selisih derajat bebas deviance) = Chi_Square(0.05,2) = 5.991465
Keputusan :
Keputusan <- ifelse(Deviance.model <= chi.tabel,"Terima", "Tolak")
Keputusan
## [1] "Terima"
Terima \(H_0\) : Jika selisih Deviance ≤ Chi Square (α, selisih derajat bebas Deviance) = 0.3564851 ≤ 5.991465
Kesimpulan : Dengan taraf nyata 5% tidak ada asosiasi antara kepercayaan kehidupan setelah mati dengan ras (warna kulit)