Responsi 3 STA1543-Analisis Data Kategorik

Khusnia Nurul Khikmah (G1501211049)

8/20/2022

setwd("D:/S2/IPB/BAHAN AJAR STA1543/Minggu 3")

Struktur Tabel Kontingensi untuk Tiga Peubah Kategorik (X,Y,Z)

Tabel 1 Contoh Struktur Tabel Kontingensi Tiga Peubah Kategorik \(2\times 2 \times 3\)

Asosiasi Pada Tabel Kontingensi Tiga Arah

Tabel Parsial/Conditional

Tabel parsial adalah tabel yang lebih sederhana yang diperoleh dengan hanya melihat salah satu kategori dari peubah Z

Dari Tabel 1 yang berukuran \(2\times 2 \times 3\) dapat dibentuk 3 buah tabel parsial/conditional sebagai berikut:

Catatan: Pengujian hipotesis tentang ada/tidaknya hubungan antar peubah kategorik dapat dilakukan pada tabel parsial dengan menggunakan uji chi-square.

Hipotesis:

\(H_0\): Tidak ada hubungan antara peubah X dan Y untuk tiap kategori peubah Z

\(H_1\): Ada hubungan antara peubah X dan Y paling tidak untuk salah satu kategori peubah Z

Asosiasi pada tabel parsial disebut dengan conditional association.

Ukuran asosiasi yang digunakan biasanya adalah: odds ratio, relative risk atau koefisien gamma.

Tabel Marjinal

Tabel marjinal adalah tabel yang lebih sederhana yang diperoleh tanpa melihat pengelompokan kategori pada peubah Z.

Dari Tabel 1 yang berukuran \(2\times 2 \times 3\) dapat dibentuk tabel marjinal sebagai berikut:

Catatan: Pengujian hipotesis tentang ada/tidaknya hubungan antar variabel kategorik dapat dilakukan pada tabel marginal dengan menggunakan uji chi-square.

Hipotesis:

\(H_0\): Tidak ada hubungan antara peubah X dan Y

\(H_1\): Ada hubungan antara peubah X dan Y

Asosiasi pada tabel marginal disebut dengan marjinal association. Ukuran asosiasi yang digunakan biasanya adalah: odds ratio, relative risk atau koefisien gamma.

Uji Breslow-Day

Uji Breslow-Day digunakan untuk menguji ada/tidaknya hubungan yang homogen antar 3 variabel pada tabel 3 arah.

Uji ini hanya bisa digunakan pada tabel \(2 \times 2 \times K\).

Uji ini valid jika ukuran sampelnya relative besar pada setiap strata, minimal 80% dari nilai harapan pada masing-masing sel harus lebih besar dari 5.

Hipotesis:

\(H_0\): terdapat asosiasi homogen (tidak ada interaksi 3 arah)

\(H_1\): tidak terdapat asosiasi homogen (ada interaksi 3 arah)

Homogen yang dimaksud di sini adalah homogen pada nilai rasio odds nya. Jika tolak \(H_0\), maka tidak terdapat asosiasi homogen. Jika terima \(H_0\) atau tidak tolak \(H_0\), maka terdapat asosiasi homogen. Jika terdapat asosiasi homogen, kita bisa lanjutkan ke uji Cochran-Mantel-Henszel (CMH) untuk melihat apakah semua conditional odds ratio bernilai 1 atau tidak.

Uji Cochran-Mantel-Henszel (CMH)

Digunakan untuk menguji ada/tidaknya conditional association pada tabel 3 arah (apakah terjadi interaksi dua arah atau tidak).

Uji ini dilakukan jika hasil pada pengujian Breslow-Day tidak tolak \(H_0\) atau terdapat asosiasi homogen.

Hipotesis:

\(H_0\): semua contional odds ratio bernilai 1 (Tidak terdapat asosiasi bersyarat)

\(H_1\): minimal ada satu conditional odds ratio bernilai tidak sama dengan 1 (Terdapat asosiasi bersyarat)

Tolak \(H_0\) artinya terjadi atau terdapat partial atau conditional association.

Contoh Soal 1

Lakukan uji asosiasi parsial/conditional, asosiasi marjinal, Uji Breslow-Day, dan CMH (Jika Uji Breslow-Day tidak tolak \(H_0\))!

Jawaban Contoh Soal 1

Package yang digunakan

#Jika belum ada packagenya, install dahulu: install.packages("NAMA PACKAGE")

library("epitools")
library("DescTools")
library("lawstat")

Input Data

R.Korban<- matrix(c(45,20,15,29),nrow=2,byrow=TRUE,
 dimnames = list("Penyebab" = c("Bunuh Diri","Kecelakaan"),
 "Luka" = c("Ya","Tidak")))
print(R.Korban)
##             Luka
## Penyebab     Ya Tidak
##   Bunuh Diri 45    20
##   Kecelakaan 15    29
R.Kerabat<- matrix(c(13,12,14,27),nrow=2,byrow=TRUE,
 dimnames = list("Penyebab" = c("Bunuh Diri","Kecelakaan"),
 "Luka" = c("Ya","Tidak")))
print(R.Kerabat)
##             Luka
## Penyebab     Ya Tidak
##   Bunuh Diri 13    12
##   Kecelakaan 14    27
Lainnya<- matrix(c(18,11,11,29),nrow=2,byrow=TRUE,
 dimnames = list("Penyebab" = c("Bunuh Diri","Kecelakaan"),
 "Luka" = c("Ya","Tidak")))
print(Lainnya)
##             Luka
## Penyebab     Ya Tidak
##   Bunuh Diri 18    11
##   Kecelakaan 11    29
myarray <- array(c(R.Korban,R.Kerabat,Lainnya),dim=c(2,2,3),
      dimnames = list("Penyebab" = c("Bunuh Diri","Kecelakaan"),
          "Luka" = c("Ya","Tidak"),
          "Lokasi" = c("R.Korban","R.Kerabat","Lainnya")))
myarray
## , , Lokasi = R.Korban
## 
##             Luka
## Penyebab     Ya Tidak
##   Bunuh Diri 45    20
##   Kecelakaan 15    29
## 
## , , Lokasi = R.Kerabat
## 
##             Luka
## Penyebab     Ya Tidak
##   Bunuh Diri 13    12
##   Kecelakaan 14    27
## 
## , , Lokasi = Lainnya
## 
##             Luka
## Penyebab     Ya Tidak
##   Bunuh Diri 18    11
##   Kecelakaan 11    29

Asosiasi

Asosiasi Parsial/Conditional

\(H_0\): Tidak ada asosiasi antara penyebab cedera dan kondisi luka yang tempat kejadiannya pada rumah korban

\(H_1\): Ada asosiasi antara penyebab cedera dan kondisi luka yang tempat kejadiannya pada rumah korban

or.rkorban <- oddsratio.wald(R.Korban,rev="b")
or.rkorban$measure
##             odds ratio with 95% C.I.
## Penyebab     estimate    lower    upper
##   Kecelakaan     1.00       NA       NA
##   Bunuh Diri     4.35 1.923387 9.838115
chisq.test(R.Korban,correct=FALSE)
## 
##  Pearson's Chi-squared test
## 
## data:  R.Korban
## X-squared = 13.093, df = 1, p-value = 0.0002964

Dari selang kepercayaan rasio odds terlihat bahwa angkanya tidak melewati nilai 1 sehingga dapat disimpulkan bahwa ada asosiasi antara penyebab cedera dan kondisi luka yang tempat kejadiannya pada rumah korban.

Hasil ini diperkuat dengan uji hipotesis menggunakan Chi-Square yang memberikan kesimpulan: Karena \(p_{value} < \alpha=0.05\), maka TOLAK \(H_0\) berarti pada taraf \(\alpha 5%\) dapat disimpulkan bahwa ada asosiasi antara penyebab cedera dan kondisi luka yang tempat kejadiannya pada rumah korban.

\(H_0\): Tidak ada asosiasi antara penyebab cedera dan kondisi luka yang tempat kejadiannya pada rumah kerabat

\(H_1\): Ada asosiasi antara penyebab cedera dan kondisi luka yang tempat kejadiannya pada rumah kerabat

or.rkerabat <- oddsratio.wald(R.Kerabat, rev="b")
or.rkerabat$measure
##             odds ratio with 95% C.I.
## Penyebab     estimate     lower    upper
##   Kecelakaan 1.000000        NA       NA
##   Bunuh Diri 2.089286 0.7563948 5.770948
chisq.test(R.Kerabat,correct=FALSE)
## 
##  Pearson's Chi-squared test
## 
## data:  R.Kerabat
## X-squared = 2.0478, df = 1, p-value = 0.1524

Dari selang kepercayaan rasio odds terlihat bahwa angkanya melewati nilai 1 sehingga dapat disimpulkan bahwa tidak ada asosiasi antara penyebab cedera dan kondisi luka yang tempat kejadiannya pada rumah kerabat.

Hasil ini diperkuat dengan uji hipotesis menggunakan Chi-Square yang memberikan kesimpulan: Karena \(p_{value} > \alpha=0.05\), maka TIDAK TOLAK \(H_0\) berarti pada taraf \(\alpha 5%\) dapat disimpulkan bahwa tidak ada cukup bukti untuk menyatakan ada asosiasi antara penyebab cedera dan kondisi luka yang tempat kejadiannya pada rumah kerabat.

\(H_0\): Tidak ada asosiasi antara penyebab cedera dan kondisi luka yang tempat kejadiannya selain di rumah korban dan rumah kerabat

\(H_1\): Ada asosiasi antara penyebab cedera dan kondisi luka yang tempat kejadiannya selain di rumah korban dan rumah kerabat

or.Lainnya <- oddsratio.wald(Lainnya, rev="b")
or.Lainnya$measure
##             odds ratio with 95% C.I.
## Penyebab     estimate    lower    upper
##   Kecelakaan  1.00000       NA       NA
##   Bunuh Diri  4.31405 1.552637 11.98672
chisq.test(Lainnya,correct=FALSE)
## 
##  Pearson's Chi-squared test
## 
## data:  Lainnya
## X-squared = 8.2456, df = 1, p-value = 0.004085

Dari selang kepercayaan rasio odds terlihat bahwa angkanya tidak melewati nilai 1 sehingga dapat disimpulkan bahwa ada asosiasi antara penyebab cedera dan kondisi luka yang tempat kejadiannya selain di rumah korban dan rumah kerabat.

Hasil ini diperkuat dengan uji hipotesis menggunakan Chi-Square yang memberikan kesimpulan: Karena \(p_{value} < \alpha=0.05\), maka TOLAK \(H_0\) berarti pada taraf \(\alpha 5%\) dapat disimpulkan bahwa ada asosiasi antara penyebab cedera dan kondisi luka yang tempat kejadiannya selain di rumah korban dan rumah kerabat.

sosiasi Marjinal

\(H_0\): Tidak ada asosiasi antara penyebab cedera dan kondisi luka tanpa memperhatikan tempat kejadiannya

\(H_1\): Ada asosiasi antara penyebab cedera dan kondisi luka tanpa memperhatikan tempat kejadiannya

R.marjinal<- matrix(c(76,43,40,85),nrow=2,byrow=TRUE,
 dimnames = list("Penyebab" = c("Bunuh Diri","Kecelakaan"),
 "Luka" = c("Ya","Tidak")))
print(R.marjinal)
##             Luka
## Penyebab     Ya Tidak
##   Bunuh Diri 76    43
##   Kecelakaan 40    85
or.marjinal<- oddsratio.wald(R.marjinal, rev="b")
or.marjinal$measure
##             odds ratio with 95% C.I.
## Penyebab     estimate    lower    upper
##   Kecelakaan 1.000000       NA       NA
##   Bunuh Diri 3.755814 2.210249 6.382149
chisq.test(R.marjinal,correct=FALSE)
## 
##  Pearson's Chi-squared test
## 
## data:  R.marjinal
## X-squared = 24.821, df = 1, p-value = 6.29e-07

Dari selang kepercayaan rasio odds terlihat bahwa angkanya tidak melewati nilai 1 sehingga dapat disimpulkan bahwa ada asosiasi antara penyebab cedera dan kondisi luka tanpa melihat tempat kejadiannya.

Hasil ini diperkuat dengan uji hipotesis menggunakan Chi-Square yang memberikan kesimpulan: Karena \(p_{value} < \alpha=0.05\), maka **TOLAK \(H_0\) berarti pada taraf \(\alpha 5%\) dapat disimpulkan bahwa ada asosiasi antara penyebab cedera dan kondisi luka tanpa memperhatikan tempat kejadiannya.

Uji Breslow-Day

Hipotesis:

\(H_0\): Terdapat asosiasi homogen

\(H_1\): Tidak terdapat asosiasi homogen

Statistik Uji

Keputusan: Tolak \(H_0\) jika \(Statistik Uji Breslow-Day > Chi_Square_tabel(\alpha, K-1)\) atau \(P_{Value} < \alpha\).

BreslowDayTest(myarray, OR = NA, correct = FALSE)
## 
##  Breslow-Day test on Homogeneity of Odds Ratios
## 
## data:  myarray
## X-squared = 1.4302, df = 2, p-value = 0.4891

Kesimpulan: Karena \(p_{value} > \alpha=0.05\), maka TIDAK TOLAK \(H_0\) berarti pada taraf \(\alpha 5%\) dapat disimpulkan bahwa tidak ada cukup bukti untuk menyatakan tidak terdapat asosiasi homogen.

Karena hasil uji Breslow-Day Terdapat asosiasi homogen,kita bisa lanjutkan ke uji Cochran-Mantel-Henszel (CMH) untuk melihat apakah semua conditional odds ratio bernilai 1 atau tidak.

Uji Cochran-Mantel-Henszel (CMH)

Hipotesis:

Statistik Uji:

Keputusan: Tolak \(H_0\) jika \(Chi_Square_hitung > Chi_Square_tabel(\alpha, 1)\) atau \(P_{Value} < \alpha\)

\(H_0\): semua conditional odds ratio bernilai 1 (Tidak terdapat asosiasi bersyarat)

\(H_1\): minimal ada satu conditional odds ratio bernilai tidak sama dengan 1 (Terdapat asosiasi bersyarat)

mantelhaen.test(myarray, correct = F)
## 
##  Mantel-Haenszel chi-squared test without continuity correction
## 
## data:  myarray
## Mantel-Haenszel X-squared = 21.83, df = 1, p-value = 2.979e-06
## alternative hypothesis: true common odds ratio is not equal to 1
## 95 percent confidence interval:
##  2.061472 6.027449
## sample estimates:
## common odds ratio 
##          3.524971

Kesimpulan: Karena \(p_{value} < \alpha=0.05\), maka TOLAK \(H_0\) berarti pada taraf \(\alpha 5%\) dapat disimpulkan bahwa terjadi atau terdapat partial atau conditional association.