Responsi 3 STA543 Analisis Data Kategorik
Asosiasi Antara Tiga Peubah Kategorik
setwd("D:\\Kuliah S2 IPB\\Bahan Kuliah\\Semester 2 SSD 2020\\STA543 ADK\\Responsi\\R\\UTS\\")
Pendahuluan
Struktur Tabel Kontingensi untuk Tiga Peubah Kategorik (X,Y,Z)
Tabel 1 Contoh Struktur Tabel Kontingensi Tiga Peubah Kategorik 2x2x3
Asosiasi Pada Tabel Kontingensi Tiga Arah
Tabel Parsial/Conditional
Tabel parsial adalah tabel yang lebih sederhana yang diperoleh dengan hanya melihat salah satu kategori dari peubah Z
Dari Tabel 1 yang berukuran 2x2x3 dapat dibentuk 3 buah tabel parsial/conditional sebagai berikut:
Pengujian hipotesis tentang ada/tidaknya hubungan antar peubah kategorik dapat dilakukan pada tabel parsial dengan menggunakan uji chi-square.
Hipotesis:
H0: Tidak ada hubungan antara peubah X dan Y untuk tiap kategori peubah Z
H1: Ada hubungan antara peubah X dan Y paling tidak untuk salah satu kategori peubah Z
Asosiasi pada tabel parsial disebut dengan conditional association. Ukuran asosiasi yang digunakan biasanya adalah: odds ratio, relative risk atau koefisien gamma.
Tabel Marjinal
Tabel marjinal adalah tabel yang lebih sederhana yang diperoleh tanpa melihat pengelompokan kategori pada peubah Z.
Dari Tabel 1 yang berukuran 2x2x3 dapat dibentuk tabel marjinal sebagai berikut:
Pengujian hipotesis tentang ada/tidaknya hubungan antar variabel kategorik dapat dilakukan pada tabel marginal dengan menggunakan uji chi-square.
Hipotesis:
H0: Tidak ada hubungan antara peubah X dan Y
H1: Ada hubungan antara peubah X dan Y
Asosiasi pada tabel marginal disebut dengan marjinal association. Ukuran asosiasi yang digunakan biasanya adalah: odds ratio, relative risk atau koefisien gamma
Uji Breslow-Day
Uji Breslow-Day digunakan untuk menguji ada/tidaknya hubungan yang homogen antar 3 variabel pada tabel 3 arah.
Uji ini hanya bisa digunakan pada tabel 2x2xK.
Uji ini valid jika ukuran sampelnya relative besar pada setiap strata, minimal 80% dari nilai harapan pada masing-masing sel harus lebih besar dari 5.
Hipotesis:
𝐻0: terdapat asosiasi homogen (tidak ada interaksi 3 arah)
𝐻1: tidak terdapat asosiasi homogen (ada interaksi 3 arah)
Homogen yang dimaksud di sini adalah homogen pada nilai rasio odds nya. Jika tolak Ho, maka tidak terdapat asosiasi homogen. Jika terima H0 atau tidak tolak H0, maka terdapat asosiasi homogen. Jika terdapat asosiasi homogen, kita bisa lanjutkan ke uji Cochran-Mantel-Henszel (CMH) untuk melihat apakah semua conditional odds ratio bernilai 1 atau tidak.
Uji Cochran-Mantel-Henszel (CMH)
Digunakan untuk menguji ada/tidaknya conditional association pada tabel 3 arah (apakah terjadi interaksi dua arah atau tidak).
Uji ini dilakukan jika hasil pada pengujian Breslow-Day tidak tolak 𝐻0 atau terdapat asosiasi homogen.
Hipotesis:
𝐻0: semua contional odds ratio bernilai 1 (Tidak terdapat asosiasi bersyarat)
𝐻1: minimal ada satu conditional odds ratio bernilai tidak sama dengan 1 (Terdapat asosiasi bersyarat)
Tolak 𝐻0 artinya terjadi/terdapat partial/conditional association.
Contoh Kasus
Lakukan uji asosiasi parsial/conditional, asosiasi marjinal,Uji Breslow-Day, dan CMH (Jika Uji Breslow-Day tidak tolak H0)
Package yang digunakan
#Jika belum ada packagenya, install dahulu: install.packages("NAMA PACKAGE")
library("epitools")
library("DescTools")
library("lawstat")
Input Data
<- matrix(c(45,20,15,29),nrow=2,byrow=TRUE,
R.Korbandimnames = list("Penyebab" = c("Bunuh Diri","Kecelakaan"),
"Luka" = c("Ya","Tidak")))
print(R.Korban)
## Luka
## Penyebab Ya Tidak
## Bunuh Diri 45 20
## Kecelakaan 15 29
<- matrix(c(13,12,14,27),nrow=2,byrow=TRUE,
R.Kerabatdimnames = list("Penyebab" = c("Bunuh Diri","Kecelakaan"),
"Luka" = c("Ya","Tidak")))
print(R.Kerabat)
## Luka
## Penyebab Ya Tidak
## Bunuh Diri 13 12
## Kecelakaan 14 27
<- matrix(c(18,11,11,29),nrow=2,byrow=TRUE,
Lainnyadimnames = list("Penyebab" = c("Bunuh Diri","Kecelakaan"),
"Luka" = c("Ya","Tidak")))
print(Lainnya)
## Luka
## Penyebab Ya Tidak
## Bunuh Diri 18 11
## Kecelakaan 11 29
<- array(c(R.Korban,R.Kerabat,Lainnya),dim=c(2,2,3),
myarray dimnames = list("Penyebab" = c("Bunuh Diri","Kecelakaan"),
"Luka" = c("Ya","Tidak"),
"Lokasi" = c("R.Korban","R.Kerabat","Lainnya")))
myarray
## , , Lokasi = R.Korban
##
## Luka
## Penyebab Ya Tidak
## Bunuh Diri 45 20
## Kecelakaan 15 29
##
## , , Lokasi = R.Kerabat
##
## Luka
## Penyebab Ya Tidak
## Bunuh Diri 13 12
## Kecelakaan 14 27
##
## , , Lokasi = Lainnya
##
## Luka
## Penyebab Ya Tidak
## Bunuh Diri 18 11
## Kecelakaan 11 29
Asosiasi
Asosiasi Parsial/Conditional
H0: Tidak ada asosiasi antara penyebab cedera dan kondisi luka yang tempat kejadiannya pada rumah korban
H1: Ada asosiasi antara penyebab cedera dan kondisi luka yang tempat kejadiannya pada rumah korban
<- oddsratio.wald(R.Korban,rev="b")
or.rkorban $measure or.rkorban
## odds ratio with 95% C.I.
## Penyebab estimate lower upper
## Kecelakaan 1.00 NA NA
## Bunuh Diri 4.35 1.923387 9.838115
chisq.test(R.Korban,correct=FALSE)
##
## Pearson's Chi-squared test
##
## data: R.Korban
## X-squared = 13.093, df = 1, p-value = 0.0002964
Dari selang kepercayaan rasio odds terlihat bahwa angkanya tidak melewati nilai 1 sehingga dapat disimpulkan bahwa ada asosiasi antara penyebab cedera dan kondisi luka yang tempat kejadiannya pada rumah korban.
Hasil ini diperkuat dengan uji hipotesis menggunakan Chi-Square yang memberikan kesimpulan: Karena p_value < alpha=0.05, maka TOLAK HO berarti pada taraf alpha 5% dapat disimpulkan bahwa ada asosiasi antara penyebab cedera dan kondisi luka yang tempat kejadiannya pada rumah korban.
H0: Tidak ada asosiasi antara penyebab cedera dan kondisi luka yang tempat kejadiannya pada rumah kerabat
H1: Ada asosiasi antara penyebab cedera dan kondisi luka yang tempat kejadiannya pada rumah kerabat
<- oddsratio.wald(R.Kerabat, rev="b")
or.rkerabat $measure or.rkerabat
## odds ratio with 95% C.I.
## Penyebab estimate lower upper
## Kecelakaan 1.000000 NA NA
## Bunuh Diri 2.089286 0.7563948 5.770948
chisq.test(R.Kerabat,correct=FALSE)
##
## Pearson's Chi-squared test
##
## data: R.Kerabat
## X-squared = 2.0478, df = 1, p-value = 0.1524
Dari selang kepercayaan rasio odds terlihat bahwa angkanya melewati nilai 1 sehingga dapat disimpulkan bahwa tidak ada asosiasi antara penyebab cedera dan kondisi luka yang tempat kejadiannya pada rumah kerabat.
Hasil ini diperkuat dengan uji hipotesis menggunakan Chi-Square yang memberikan kesimpulan: Karena p_value > alpha=0.05, maka TIDAK TOLAK HO berarti pada taraf alpha 5% dapat disimpulkan bahwa tidak ada cukup bukti untuk menyatakan ada asosiasi antara penyebab cedera dan kondisi luka yang tempat kejadiannya pada rumah kerabat.
H0: Tidak ada asosiasi antara penyebab cedera dan kondisi luka yang tempat kejadiannya selain di rumah korban dan rumah kerabat
H1: Ada asosiasi antara penyebab cedera dan kondisi luka yang tempat kejadiannya selain di rumah korban dan rumah kerabat
<- oddsratio.wald(Lainnya, rev="b")
or.Lainnya $measure or.Lainnya
## odds ratio with 95% C.I.
## Penyebab estimate lower upper
## Kecelakaan 1.00000 NA NA
## Bunuh Diri 4.31405 1.552637 11.98672
chisq.test(Lainnya,correct=FALSE)
##
## Pearson's Chi-squared test
##
## data: Lainnya
## X-squared = 8.2456, df = 1, p-value = 0.004085
Dari selang kepercayaan rasio odds terlihat bahwa angkanya tidak melewati nilai 1 sehingga dapat disimpulkan bahwa ada asosiasi antara penyebab cedera dan kondisi luka yang tempat kejadiannya selain di rumah korban dan rumah kerabat.
Hasil ini diperkuat dengan uji hipotesis menggunakan Chi-Square yang memberikan kesimpulan: Karena p_value < alpha=0.05, maka TOLAK HO berarti pada taraf alpha 5% dapat disimpulkan bahwa ada asosiasi antara penyebab cedera dan kondisi luka yang tempat kejadiannya selain di rumah korban dan rumah kerabat.
Asosiasi Marjinal
H0: Tidak ada asosiasi antara penyebab cedera dan kondisi luka tanpa memperhatikan tempat kejadiannya
H1: Ada asosiasi antara penyebab cedera dan kondisi luka tanpa memperhatikan tempat kejadiannya
<- matrix(c(76,43,40,85),nrow=2,byrow=TRUE,
R.marjinaldimnames = list("Penyebab" = c("Bunuh Diri","Kecelakaan"),
"Luka" = c("Ya","Tidak")))
print(R.marjinal)
## Luka
## Penyebab Ya Tidak
## Bunuh Diri 76 43
## Kecelakaan 40 85
<- oddsratio.wald(R.marjinal, rev="b")
or.marjinal$measure or.marjinal
## odds ratio with 95% C.I.
## Penyebab estimate lower upper
## Kecelakaan 1.000000 NA NA
## Bunuh Diri 3.755814 2.210249 6.382149
chisq.test(R.marjinal,correct=FALSE)
##
## Pearson's Chi-squared test
##
## data: R.marjinal
## X-squared = 24.821, df = 1, p-value = 6.29e-07
Dari selang kepercayaan rasio odds terlihat bahwa angkanya tidak melewati nilai 1 sehingga dapat disimpulkan bahwa ada asosiasi antara penyebab cedera dan kondisi luka tanpa melihat tempat kejadiannya.
Hasil ini diperkuat dengan uji hipotesis menggunakan Chi-Square yang memberikan kesimpulan: Karena p_value < alpha=0.05, maka TOLAK HO berarti pada taraf alpha 5% dapat disimpulkan bahwa ada asosiasi antara penyebab cedera dan kondisi luka tanpa memperhatikan tempat kejadiannya.
Uji Breslow-Day
Hipotesis dan Statistik Uji:
Keputusan: Tolak Ho jika Statistik Uji Breslow-Day > Chi_Square_tabel(alpha, K-1) atau P_Value < alpha.
H0: Terdapat asosiasi homogen
H1: Tidak terdapat asosiasi homogen
BreslowDayTest(myarray, OR = NA, correct = FALSE)
##
## Breslow-Day test on Homogeneity of Odds Ratios
##
## data: myarray
## X-squared = 1.4302, df = 2, p-value = 0.4891
Kesimpulan: Karena p_value > alpha=0.05, maka TIDAK TOLAK HO berarti pada taraf alpha 5% dapat disimpulkan bahwa tidak ada cukup bukti untuk menyatakan tidak terdapat asosiasi homogen.
Karena hasil uji Breslow-Day Terdapat asosiasi homogen,kita bisa lanjutkan ke uji Cochran-Mantel-Henszel (CMH) untuk melihat apakah semua conditional odds ratio bernilai 1 atau tidak.
Uji Cochran-Mantel-Henszel (CMH)
Hipotesis:
Statistik Uji:
Keputusan: Tolak Ho jika Chi_Square_hitung > Chi_Square_tabel(alpha, 1) atau P_Value < alpha
𝐻0: semua conditional odds ratio bernilai 1 (Tidak terdapat asosiasi bersyarat)
𝐻1: minimal ada satu conditional odds ratio bernilai tidak sama dengan 1 (Terdapat asosiasi bersyarat)
mantelhaen.test(myarray, correct = F)
##
## Mantel-Haenszel chi-squared test without continuity correction
##
## data: myarray
## Mantel-Haenszel X-squared = 21.83, df = 1, p-value = 2.979e-06
## alternative hypothesis: true common odds ratio is not equal to 1
## 95 percent confidence interval:
## 2.061472 6.027449
## sample estimates:
## common odds ratio
## 3.524971
Kesimpulan: Karena p_value < alpha=0.05, maka TOLAK HO berarti pada taraf alpha 5% dapat disimpulkan bahwa terjadi/terdapat partial/conditional association.
Mahasiswa Pascasarjana Statistika dan Sains Data, IPB University, reniamelia@apps.ipb.ac.id↩︎