MODEL LOGLINIER DUA ARAH

Tujuan

  1. Mempelajari program R untuk model log linier dua arah.
  2. Mengaplikasikan program R untuk menyelesaikan model log linier dua arah.

Pendahuluan

Model loglinier dua arah untuk data yang bersifat kategori dan dapat dibentuk ke dalam suatu tabelkontingensi, dapat dianalisis dengan menggunakan analisis log linier. Model log linier digunakan untuk menganalisis atau mempelajari pola asosiasi antara beberapa variable yang diperhatikan merupakan variabel kategorik, dimana pola hubunganatau asosiasi antar peubahnya dilihat dari interaksi antar peubah itu sendiri.

Variabel respon banyak yang hanya memiliki dua kategori misalnya kelulusan dalam tes(lulus atau tidak), pengobatan penyakit (sembuh atau tidak) dan lain-lain. Secara umum dapat dikatakan bahwa variabel respon Y hanya memiliki dua hasil yang mungkin yaitu “sukses” yang dilambangkan dengan angka satu (1) dan “gagal” yang dilambangkan deng an angka nol (0).Variabel seperti ini disebut sebagai variabel biner. Distribusi dari Y memiliki peluang sukses P(Y= 1) = p dan peluang gagal P(Y = 0) = (1 - p ) dengan ekspektasi E(Y) = p. Untuk sebuah pengamatan Y akan mengikuti distribusi Bernoulli. Dengan demikian untuk n pengamatan yang saling bebas, banyak “sukses” akan memiliki distribusi Binomial dengan parameter p .Dalam bagian ini kita akan membahas GLM dengan respon biner dengan sebuah variabelpenjelas (X) saja meskipun sebenarnya GLM dapat digunakan untuk variabel penjelas lebih darisatu. Perubahan nilai p dipengaruhi oleh perubahan X.

Model log-linear dapat digunakan untuk mengkaji pola asosiasi antarvariabel pada data kategori.Model log-linear merupakan bentuk pemodelan dari data tabel kontingensi, dengan menggunakan model ini memungkinkan untuk melakukan pengujian lebih dari dua variabel dalam tabel kontingensi secara simultan.

Misalkan suatu tabel kontingensi \(I×J\) yang diklasifikasikan dalam n subjek. Jika respon saling bebas statistik, maka peluang cell bersama {\(μ_{ij}\)} ditentukan oleh total marjinal baris dan kolom.

{\(μ_{ij}\)}=\(λ_i\)\(+\)\(λ_j\) ,\(i=1,…,I\), \(j=1,…,J\)

Model loglinear saling bebas untuk tabel dua arah, yaitu:

\(log\) \(⁡μ_{ij}\)\(=\)\(λ\)\(+\)\(λ_{i}^{X}\)\(+\)\(λ_{j}^{Y}\)

Keterangan:
\(λ_{i}^{X}\) = pengaruh baris
\(λ_{j}^{Y}\) = pengaruh kolom

Model log-linier adalah suatu pendekatan pemodelan linier terampat yang dapat digunakan untuk data yang menyebar Poisson. Model log-linier digunakan untuk Menguji hubungan antar peubah kategorik yang terdapat pada tabel kontingensi (cell count). Model ini dapat menangani situasi yang kompleks : dapat digunakan untuk menguji hubungan homogen dan menduga rasio odds pada table kontingensi dengan berbagai ukuran (tidak terbatas pada ukuran 2×2).

Pada model log-linear semua peubahnya merupakan peubah respon. Tidak ada yang berperan sebagai peubah penjelas/peubah bebas. Semuanya dianggap sama, yaitu peubah respon. Tujuan utama dari pembuatan model log-linear adalah untuk menduga parameter model yang mendeskripsikan hubungan antar peubah kategorik.

Tahapan Analisis

Tahapan dalam analisis log linier 2 peubah kategorik di R adalah:
1. Input Data.
2. Menentukan Kategori Referensi.
3. Menyusun Model tanpa Interaksi.
4. Menyusun Model dengan Interaksi.
5. Menginterpretasikan model tanpa interaksi dan dengan interaksi
6. Menghitung nilai penduga bagi {\(μ_{ij}\)} pada model tanpa interaksi dan dengan interaksi
7. Menguji hipotesis untuk mengetahui ada/tidak hubungan antara peubah X dan Y. Biasanya digunakan deviance.

Hipotesis

\(H_0\) = tidak ada asosiasi antara peubah X dan Y
\(H_1\) = ada asosiasi antara peubah X dan Y

Statistik Uji

Selisih Deviance = Deviance Model tanpa interaksi - Deviance Model dengan interaksi (saturated)

Keputusan

Tolak \(H_0\) : Jika selisih Deviance \(≥\) Chi Square (α, selisih derajat bebas Deviance)

Program R

Teladan

Contoh kasus adalah kepercayaan orang terhadap kehidupan setelah mati berdasarkan warna kulit atau ras dengan data sebagai berikut:

Masukkan data di atas pada program R seperti langkah sebelumnya dan lakukan analisis.
a. Lakukan pemodelan log-linier dengan menjadikan Yes (percaya) dan kulit putih sebagai pembanding / Refrensi!
b. Berdasarkan model tersebut, tentukan penduga bagi \(μ_{ij}\) , untuk \(i=1,2,3\) dan \(j=1,2\).
c. Lakukan uji hipotesis untuk mengetahui ada tidaknya hubungan antara adalah kepercayaan orang terhadap kehidupan setelah mati dengan warna kulit atau ras menggunakan model penuh (Saturated Model). Apa kesimpulan?

Tahapan:

Input Data

Ras<-factor(rep(c("White","Black","Other"),each=2))
Belief<-factor(rep(c("Yes","No"),times=3))
count<-c(1339,300,260,55,88,22)
data.frame(Ras,Belief,count)
##     Ras Belief count
## 1 White    Yes  1339
## 2 White     No   300
## 3 Black    Yes   260
## 4 Black     No    55
## 5 Other    Yes    88
## 6 Other     No    22

a. Pemodelan Log-Linear Dengan Yes (percaya) dan Ras kulit putih Sebagai Referensi

Setelah masukan data tabel kontingensi 2 arah seperti gambar di atas. Lakukan pemodelan logliniernya dengan menjadikan Yes (percaya) dan kulit putih sebagai pembanding / Refrensi.

Ras<-relevel(Ras,ref="White")
Belief<-relevel(Belief,ref="Yes") 
Model Tanpa Interaksi
modela<-glm(count~Ras+Belief, family=poisson(link="log")) 
summary(modela)
## 
## Call:
## glm(formula = count ~ Ras + Belief, family = poisson(link = "log"))
## 
## Coefficients:
##             Estimate Std. Error z value Pr(>|z|)    
## (Intercept)  7.20015    0.02680  268.63   <2e-16 ***
## RasBlack    -1.64927    0.06152  -26.81   <2e-16 ***
## RasOther    -2.70136    0.09849  -27.43   <2e-16 ***
## BeliefNo    -1.49846    0.05697  -26.30   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for poisson family taken to be 1)
## 
##     Null deviance: 2849.21758  on 5  degrees of freedom
## Residual deviance:    0.35649  on 2  degrees of freedom
## AIC: 49.437
## 
## Number of Fisher Scoring iterations: 3

Dari hasil di atas dapat dibentuk model tanpa intraksinya:

Interpretasi Model Tanpa Interaksi

Agar interpretasi parameter model lebih mudah dan bermakna, nilai estimasi parameter model tersebut di eksponensialkan terlebih dahulu. Hasil output program R diperoleh sebagai berikut:

exp(modela$coefficients[-1])
##   RasBlack   RasOther   BeliefNo 
## 0.19219036 0.06711409 0.22347362

Tanpa memperhatikan Kepercayaa kehidupan setelah mati, peluang seseorang ras berkulit hitam 0.19219036 kali dibandingkan peluang seseorang ras berkulit putih atau peluang seseorang untuk seseorang ras berkulit putih 1/0.19219036 = 5.20317460251 kali dibandingkan peluang seseorang ras berkulit hitam.
Dst….

Model Dengan Interaksi (Saturated Model)
modela_sat<-glm(count~Ras+Belief+Ras*Belief, family=poisson(link="log"))
summary(modela_sat)
## 
## Call:
## glm(formula = count ~ Ras + Belief + Ras * Belief, family = poisson(link = "log"))
## 
## Coefficients:
##                   Estimate Std. Error z value Pr(>|z|)    
## (Intercept)        7.19968    0.02733 263.453   <2e-16 ***
## RasBlack          -1.63900    0.06777 -24.184   <2e-16 ***
## RasOther          -2.72234    0.11005 -24.738   <2e-16 ***
## BeliefNo          -1.49590    0.06388 -23.419   <2e-16 ***
## RasBlack:BeliefNo -0.05745    0.16158  -0.356    0.722    
## RasOther:BeliefNo  0.10960    0.24678   0.444    0.657    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for poisson family taken to be 1)
## 
##     Null deviance: 2.8492e+03  on 5  degrees of freedom
## Residual deviance: 2.8888e-13  on 0  degrees of freedom
## AIC: 53.081
## 
## Number of Fisher Scoring iterations: 3

Dari hasil di atas dapat dibentuk model dengan interaksi (Saturated Model):

Interpretasi Model Dengan Interaksi (Saturated Model)

Agar interpretasi parameter model lebih mudah dan bermakna, nilai estimasi parameter model tersebut di eksponensialkan terlebih dahulu. Hasil output program R diperoleh sebagai berikut:

exp(modela_sat$coefficients[-1])
##          RasBlack          RasOther          BeliefNo RasBlack:BeliefNo 
##        0.19417476        0.06572069        0.22404780        0.94416667 
## RasOther:BeliefNo 
##        1.11583333

  1. RasBlack 0.1941746
    Tanpa memperhatikan Kepercayaa kehidupan setelah mati, peluang seseorang ras berkulit hitam 0.1941746 kali dibandingkan peluang seseorang ras berkulit putih atau peluang seseorang untuk seseorang ras berkulit putih 1/0.1941746 = 5.20317460251 kali dibandingkan peluang seseorang ras berkulit hitam.
  2. RasOther…

  3. BeliefNo…

  4. RasBlack : BeliefNo 0.9441667
    Jika seseorang tidak memiliki kepercayaan kehidupan setelah mati, odds untuk seseorang ras kulit hitam (dibandingkan kulit putih) adalah 0.9441667 kali dibandingkan odds yang sama jika seseorang memiliki kepercayaan kehidupan setelah mati.
  5. Dts…

b. Mentukan penduga bagi \(μ_{ij}\) , untuk \(i=1,2,3\) dan \(j=1,2\).

data.frame(Ras,Belief,asli=count,tanpainteraksi=fitted(modela),saturated=fitted(modela_sat))
##     Ras Belief asli tanpainteraksi saturated
## 1 White    Yes 1339     1339.62839      1339
## 2 White     No  300      299.37161       300
## 3 Black    Yes  260      257.46366       260
## 4 Black     No   55       57.53634        55
## 5 Other    Yes   88       89.90795        88
## 6 Other     No   22       20.09205        22

c. Lakukan uji hipotesis

Hipotesis:
\(H_0\) = tidak ada asosiasi antara kepercayaan kehidupan setelah mati dengan ras (warna kulit)
\(H_1\) = ada asosiasi antara kepercayaan kehidupan setelah mati dengan ras (warna kulit)

Statistik Uji :

Deviance.model<- modela$deviance - modela_sat$deviance
Deviance.model
## [1] 0.3564851

Selisih Deviance = Deviance Model tanpa interaksi - Deviance Model dengan interaksi (saturated) = 0.3564851

Chi Square tabel dengan alpa = 0.05

derajat.bebas <- (2 - 0) 

Lihat output pada model loglinier bagian yang tertulis Residual deviance: ….. on … degrees of freedom. Residual deviance ini yang kita gunakan, baik nilai deviance nya maupun derajat bebasnya. Dalam kasus ini, tabelnya adalah 3x2 berarti angka 2 adalah derajatbebas model a tanpa interaksi yang diperoleh dari: ((3-1)(2-1)=2x1=2 sedangkan 0 adalah derajat bebas model a dengan interaksi.

derajat.bebas
## [1] 2

Selisih Derajat Bebas = derajat bebas Model tanpa interaksi - derajat bebas Model dengan interaksi (saturated) = 2-0 = 2

chi.tabel <- qchisq((1-0.05), df=derajat.bebas) 
chi.tabel
## [1] 5.991465

Chi_Square(α, selisih derajat bebas deviance) = Chi_Square(0.05,2) = 5.991465

Keputusan :

Keputusan <- ifelse(Deviance.model <= chi.tabel,"Terima", "Tolak")
Keputusan
## [1] "Terima"

Terima \(H_0\) : Jika selisih Deviance ≤ Chi Square (α, selisih derajat bebas Deviance) = 0.3564851 ≤ 5.991465

Kesimpulan : Dengan taraf nyata 5% tidak ada asosiasi antara kepercayaan kehidupan setelah mati dengan ras (warna kulit)

Untuk Latihan silahkan gunakan yang ada pada modul kawan-kawan yaaa