Responsi 3 STA543 Analisis Data Kategorik

Asosiasi Antara Tiga Peubah Kategorik

setwd("D:\\Kuliah S2 IPB\\Bahan Kuliah\\Semester 2 SSD 2020\\STA543 ADK\\Responsi\\R\\UTS\\")

Pendahuluan

Struktur Tabel Kontingensi untuk Tiga Peubah Kategorik (X,Y,Z)

Tabel 1 Contoh Struktur Tabel Kontingensi Tiga Peubah Kategorik 2x2x3

Asosiasi Pada Tabel Kontingensi Tiga Arah

Tabel Parsial/Conditional

Tabel parsial adalah tabel yang lebih sederhana yang diperoleh dengan hanya melihat salah satu kategori dari peubah Z

Dari Tabel 1 yang berukuran 2x2x3 dapat dibentuk 3 buah tabel parsial/conditional sebagai berikut:

Pengujian hipotesis tentang ada/tidaknya hubungan antar peubah kategorik dapat dilakukan pada tabel parsial dengan menggunakan uji chi-square.

Hipotesis:

H0: Tidak ada hubungan antara peubah X dan Y untuk tiap kategori peubah Z

H1: Ada hubungan antara peubah X dan Y paling tidak untuk salah satu kategori peubah Z

Asosiasi pada tabel parsial disebut dengan conditional association. Ukuran asosiasi yang digunakan biasanya adalah: odds ratio, relative risk atau koefisien gamma.

Tabel Marjinal

Tabel marjinal adalah tabel yang lebih sederhana yang diperoleh tanpa melihat pengelompokan kategori pada peubah Z.

Dari Tabel 1 yang berukuran 2x2x3 dapat dibentuk tabel marjinal sebagai berikut:

Pengujian hipotesis tentang ada/tidaknya hubungan antar variabel kategorik dapat dilakukan pada tabel marginal dengan menggunakan uji chi-square.

Hipotesis:

H0: Tidak ada hubungan antara peubah X dan Y

H1: Ada hubungan antara peubah X dan Y

Asosiasi pada tabel marginal disebut dengan marjinal association. Ukuran asosiasi yang digunakan biasanya adalah: odds ratio, relative risk atau koefisien gamma

Uji Breslow-Day

Uji Breslow-Day digunakan untuk menguji ada/tidaknya hubungan yang homogen antar 3 variabel pada tabel 3 arah.

Uji ini hanya bisa digunakan pada tabel 2x2xK.

Uji ini valid jika ukuran sampelnya relative besar pada setiap strata, minimal 80% dari nilai harapan pada masing-masing sel harus lebih besar dari 5.

Hipotesis:

𝐻0: terdapat asosiasi homogen (tidak ada interaksi 3 arah)

𝐻1: tidak terdapat asosiasi homogen (ada interaksi 3 arah)

Homogen yang dimaksud di sini adalah homogen pada nilai rasio odds nya. Jika tolak Ho, maka tidak terdapat asosiasi homogen. Jika terima H0 atau tidak tolak H0, maka terdapat asosiasi homogen. Jika terdapat asosiasi homogen, kita bisa lanjutkan ke uji Cochran-Mantel-Henszel (CMH) untuk melihat apakah semua conditional odds ratio bernilai 1 atau tidak.

Uji Cochran-Mantel-Henszel (CMH)

Digunakan untuk menguji ada/tidaknya conditional association pada tabel 3 arah (apakah terjadi interaksi dua arah atau tidak).

Uji ini dilakukan jika hasil pada pengujian Breslow-Day tidak tolak 𝐻0 atau terdapat asosiasi homogen.

Hipotesis:

𝐻0: semua contional odds ratio bernilai 1 (Tidak terdapat asosiasi bersyarat)

𝐻1: minimal ada satu conditional odds ratio bernilai tidak sama dengan 1 (Terdapat asosiasi bersyarat)

Tolak 𝐻0 artinya terjadi/terdapat partial/conditional association.

Contoh Kasus

Lakukan uji asosiasi parsial/conditional, asosiasi marjinal,Uji Breslow-Day, dan CMH (Jika Uji Breslow-Day tidak tolak H0)

Package yang digunakan

#Jika belum ada packagenya, install dahulu: install.packages("NAMA PACKAGE")

library("epitools")
library("DescTools")
library("lawstat")

Input Data

R.Korban<- matrix(c(45,20,15,29),nrow=2,byrow=TRUE,
 dimnames = list("Penyebab" = c("Bunuh Diri","Kecelakaan"),
 "Luka" = c("Ya","Tidak")))
print(R.Korban)
##             Luka
## Penyebab     Ya Tidak
##   Bunuh Diri 45    20
##   Kecelakaan 15    29
R.Kerabat<- matrix(c(13,12,14,27),nrow=2,byrow=TRUE,
 dimnames = list("Penyebab" = c("Bunuh Diri","Kecelakaan"),
 "Luka" = c("Ya","Tidak")))
print(R.Kerabat)
##             Luka
## Penyebab     Ya Tidak
##   Bunuh Diri 13    12
##   Kecelakaan 14    27
Lainnya<- matrix(c(18,11,11,29),nrow=2,byrow=TRUE,
 dimnames = list("Penyebab" = c("Bunuh Diri","Kecelakaan"),
 "Luka" = c("Ya","Tidak")))
print(Lainnya)
##             Luka
## Penyebab     Ya Tidak
##   Bunuh Diri 18    11
##   Kecelakaan 11    29
myarray <- array(c(R.Korban,R.Kerabat,Lainnya),dim=c(2,2,3),
      dimnames = list("Penyebab" = c("Bunuh Diri","Kecelakaan"),
          "Luka" = c("Ya","Tidak"),
          "Lokasi" = c("R.Korban","R.Kerabat","Lainnya")))
myarray
## , , Lokasi = R.Korban
## 
##             Luka
## Penyebab     Ya Tidak
##   Bunuh Diri 45    20
##   Kecelakaan 15    29
## 
## , , Lokasi = R.Kerabat
## 
##             Luka
## Penyebab     Ya Tidak
##   Bunuh Diri 13    12
##   Kecelakaan 14    27
## 
## , , Lokasi = Lainnya
## 
##             Luka
## Penyebab     Ya Tidak
##   Bunuh Diri 18    11
##   Kecelakaan 11    29

Asosiasi

Asosiasi Parsial/Conditional

H0: Tidak ada asosiasi antara penyebab cedera dan kondisi luka yang tempat kejadiannya pada rumah korban

H1: Ada asosiasi antara penyebab cedera dan kondisi luka yang tempat kejadiannya pada rumah korban

or.rkorban <- oddsratio.wald(R.Korban,rev="b")
or.rkorban$measure
##             odds ratio with 95% C.I.
## Penyebab     estimate    lower    upper
##   Kecelakaan     1.00       NA       NA
##   Bunuh Diri     4.35 1.923387 9.838115
chisq.test(R.Korban,correct=FALSE)
## 
##  Pearson's Chi-squared test
## 
## data:  R.Korban
## X-squared = 13.093, df = 1, p-value = 0.0002964

Dari selang kepercayaan rasio odds terlihat bahwa angkanya tidak melewati nilai 1 sehingga dapat disimpulkan bahwa ada asosiasi antara penyebab cedera dan kondisi luka yang tempat kejadiannya pada rumah korban.

Hasil ini diperkuat dengan uji hipotesis menggunakan Chi-Square yang memberikan kesimpulan: Karena p_value < alpha=0.05, maka TOLAK HO berarti pada taraf alpha 5% dapat disimpulkan bahwa ada asosiasi antara penyebab cedera dan kondisi luka yang tempat kejadiannya pada rumah korban.

H0: Tidak ada asosiasi antara penyebab cedera dan kondisi luka yang tempat kejadiannya pada rumah kerabat

H1: Ada asosiasi antara penyebab cedera dan kondisi luka yang tempat kejadiannya pada rumah kerabat

or.rkerabat <- oddsratio.wald(R.Kerabat, rev="b")
or.rkerabat$measure
##             odds ratio with 95% C.I.
## Penyebab     estimate     lower    upper
##   Kecelakaan 1.000000        NA       NA
##   Bunuh Diri 2.089286 0.7563948 5.770948
chisq.test(R.Kerabat,correct=FALSE)
## 
##  Pearson's Chi-squared test
## 
## data:  R.Kerabat
## X-squared = 2.0478, df = 1, p-value = 0.1524

Dari selang kepercayaan rasio odds terlihat bahwa angkanya melewati nilai 1 sehingga dapat disimpulkan bahwa tidak ada asosiasi antara penyebab cedera dan kondisi luka yang tempat kejadiannya pada rumah kerabat.

Hasil ini diperkuat dengan uji hipotesis menggunakan Chi-Square yang memberikan kesimpulan: Karena p_value > alpha=0.05, maka TIDAK TOLAK HO berarti pada taraf alpha 5% dapat disimpulkan bahwa tidak ada cukup bukti untuk menyatakan ada asosiasi antara penyebab cedera dan kondisi luka yang tempat kejadiannya pada rumah kerabat.

H0: Tidak ada asosiasi antara penyebab cedera dan kondisi luka yang tempat kejadiannya selain di rumah korban dan rumah kerabat

H1: Ada asosiasi antara penyebab cedera dan kondisi luka yang tempat kejadiannya selain di rumah korban dan rumah kerabat

or.Lainnya <- oddsratio.wald(Lainnya, rev="b")
or.Lainnya$measure
##             odds ratio with 95% C.I.
## Penyebab     estimate    lower    upper
##   Kecelakaan  1.00000       NA       NA
##   Bunuh Diri  4.31405 1.552637 11.98672
chisq.test(Lainnya,correct=FALSE)
## 
##  Pearson's Chi-squared test
## 
## data:  Lainnya
## X-squared = 8.2456, df = 1, p-value = 0.004085

Dari selang kepercayaan rasio odds terlihat bahwa angkanya tidak melewati nilai 1 sehingga dapat disimpulkan bahwa ada asosiasi antara penyebab cedera dan kondisi luka yang tempat kejadiannya selain di rumah korban dan rumah kerabat.

Hasil ini diperkuat dengan uji hipotesis menggunakan Chi-Square yang memberikan kesimpulan: Karena p_value < alpha=0.05, maka TOLAK HO berarti pada taraf alpha 5% dapat disimpulkan bahwa ada asosiasi antara penyebab cedera dan kondisi luka yang tempat kejadiannya selain di rumah korban dan rumah kerabat.

Asosiasi Marjinal

H0: Tidak ada asosiasi antara penyebab cedera dan kondisi luka tanpa memperhatikan tempat kejadiannya

H1: Ada asosiasi antara penyebab cedera dan kondisi luka tanpa memperhatikan tempat kejadiannya

R.marjinal<- matrix(c(76,43,40,85),nrow=2,byrow=TRUE,
 dimnames = list("Penyebab" = c("Bunuh Diri","Kecelakaan"),
 "Luka" = c("Ya","Tidak")))
print(R.marjinal)
##             Luka
## Penyebab     Ya Tidak
##   Bunuh Diri 76    43
##   Kecelakaan 40    85
or.marjinal<- oddsratio.wald(R.marjinal, rev="b")
or.marjinal$measure
##             odds ratio with 95% C.I.
## Penyebab     estimate    lower    upper
##   Kecelakaan 1.000000       NA       NA
##   Bunuh Diri 3.755814 2.210249 6.382149
chisq.test(R.marjinal,correct=FALSE)
## 
##  Pearson's Chi-squared test
## 
## data:  R.marjinal
## X-squared = 24.821, df = 1, p-value = 6.29e-07

Dari selang kepercayaan rasio odds terlihat bahwa angkanya tidak melewati nilai 1 sehingga dapat disimpulkan bahwa ada asosiasi antara penyebab cedera dan kondisi luka tanpa melihat tempat kejadiannya.

Hasil ini diperkuat dengan uji hipotesis menggunakan Chi-Square yang memberikan kesimpulan: Karena p_value < alpha=0.05, maka TOLAK HO berarti pada taraf alpha 5% dapat disimpulkan bahwa ada asosiasi antara penyebab cedera dan kondisi luka tanpa memperhatikan tempat kejadiannya.

Uji Breslow-Day

Hipotesis dan Statistik Uji:

Keputusan: Tolak Ho jika Statistik Uji Breslow-Day > Chi_Square_tabel(alpha, K-1) atau P_Value < alpha.

H0: Terdapat asosiasi homogen

H1: Tidak terdapat asosiasi homogen

BreslowDayTest(myarray, OR = NA, correct = FALSE)
## 
##  Breslow-Day test on Homogeneity of Odds Ratios
## 
## data:  myarray
## X-squared = 1.4302, df = 2, p-value = 0.4891

Kesimpulan: Karena p_value > alpha=0.05, maka TIDAK TOLAK HO berarti pada taraf alpha 5% dapat disimpulkan bahwa tidak ada cukup bukti untuk menyatakan tidak terdapat asosiasi homogen.

Karena hasil uji Breslow-Day Terdapat asosiasi homogen,kita bisa lanjutkan ke uji Cochran-Mantel-Henszel (CMH) untuk melihat apakah semua conditional odds ratio bernilai 1 atau tidak.

Uji Cochran-Mantel-Henszel (CMH)

Hipotesis:

Statistik Uji:

Keputusan: Tolak Ho jika Chi_Square_hitung > Chi_Square_tabel(alpha, 1) atau P_Value < alpha

𝐻0: semua conditional odds ratio bernilai 1 (Tidak terdapat asosiasi bersyarat)

𝐻1: minimal ada satu conditional odds ratio bernilai tidak sama dengan 1 (Terdapat asosiasi bersyarat)

mantelhaen.test(myarray, correct = F)
## 
##  Mantel-Haenszel chi-squared test without continuity correction
## 
## data:  myarray
## Mantel-Haenszel X-squared = 21.83, df = 1, p-value = 2.979e-06
## alternative hypothesis: true common odds ratio is not equal to 1
## 95 percent confidence interval:
##  2.061472 6.027449
## sample estimates:
## common odds ratio 
##          3.524971

Kesimpulan: Karena p_value < alpha=0.05, maka TOLAK HO berarti pada taraf alpha 5% dapat disimpulkan bahwa terjadi/terdapat partial/conditional association.


  1. Mahasiswa Pascasarjana Statistika dan Sains Data, IPB University, ↩︎