UJI INDEPENDENSI TABEL KONTINGENSI DUA ARAH

Tujuan

  1. Mempelajari program R untuk menguji independensi dua variable.
  2. Mengaplikasikan program R untuk menguji independensi dua variable

Pendahuluan

Tabel kontingensi merupakan bentuk yang mudah untuk menguji data apakah memiliki dependensi/asosiasi dengan data lainnya. Jika baris yang berbeda mewakili data dari populasi yang berbeda, sedangkan kolom-kolom merepresentasikan kategori lainnya, maka dependensi baris-kolom dapat diperoleh dengan table kontingensi.

Misalkan ada dua variable kategori \(X\) dan \(Y\). \(I\) menyatakan banyaknya kategori dari \(X\) dan \(J\) menyatakan banyaknya kategori dari \(Y\). Suatu tabel yang terdiri dari \(I\) barus untuk kategori \(X\) dan \(J\) kolom untuk kategori \(Y\) sehingga memungkinkan tabel tersebut menampilkan kombinasi dari \(IJ\). Tabel ini disebut Tabel Kontingensi. Statistik uji yang digunakan dalam tabel kontingensi I×J diperoleh.
Menghitung Frekuensi Ekspektasi

\(E_{ij}\)\(=\) \(\frac {((total baris i)(total kolom j))}{(total keseluruhan data)}\)

\(E_ij\) = adalah frekuensi ekpektasi pada sel baris \(i\), kolom \(j\)

Menghitung Nilai Chi-Square

\(O_{ij}\) = adalah frekuensi yang diamati pada sel baris \(i\), kolom \(j\)
\(E_{ij}\) = adalah frekuensi ekpektasi pada sel baris \(i\), kolom \(j\)

Hipotesis:
\(H_0\) = Tidak ada hubungan (independensi) antara kedua variable
\(H_1\) = ada hubungan (dependensi) antara kedua variable

Dimana tolak \(H_0\) apabila \(p-value < a\)
Statistik ini dipakai sebagai ukuran dependensi dengan filosofi bahwa “jika baik digunakan untuk menguji dependesi, tentu baik untuk mengukur dependensi”.

Program R

Contoh Kasus :
Data yang digunakan adalah studi mengenai Kesehatan psikologis pasien yang telah diberikan obat. Diantara pasien yang diberi obat ini, terdapat beberapa pasien yang terkena serangan jantung.

Dengan menggunakan tabel kontingensi 2x2 akan dilakukan pengolahan data untuk pengujian independensi dua variable dengan menggunakan R.
Sintak R

#### membuat tabel kontingensi 2 arah
# Membuat tabel kontingensi
data_matrix <- matrix(c(189, 10845, 104, 10933), nrow = 2, byrow = TRUE)

# Menambahkan nama baris dan kolom
rownames(data_matrix) <- c("Placebo", "Aspirin")
colnames(data_matrix) <- c("Yes", "No")
  1. Bentuk Tabel Kontingensi dua arah di R
# Menampilkan tabel
print(data_matrix)
##         Yes    No
## Placebo 189 10845
## Aspirin 104 10933
  1. Plot Mosaik
# plot mosaik
mosaicplot(data_matrix, color = c("darkred", "gold"),
           xlab ="Group", ylab = "Myocardial Infraction")

Plot mosaic adalah salah satu cara untuk melihat data mana yang lebih mayoritas atau lebih banyak dari tabel kontingensi 2 arah. Dimana pada data bisa dilihat data yang tidak diberikan obat lebih besar dibandingkan yang diberikan obat.
3. Pengujian Chi-Square

# Uji Chi-Square
chi_test <- chisq.test(data_matrix)
chi_test
## 
##  Pearson's Chi-squared test with Yates' continuity correction
## 
## data:  data_matrix
## X-squared = 24.429, df = 1, p-value = 7.71e-07

Pada pengujian Chi-Square didapatkan hasil \(X-Squared = 24.429\) dan nilai \(p-value 7.71e-07\). Dimana pada pegujian chi square
\(H_0\) = Tidak ada hubungan (independensi) antara kedua variable
\(H_1\) = ada hubungan (dependensi) antara kedua variable
Sehingga kesimpulannya dikarenakan nilai \(p-value < a\) atau \(7.71e-07 < 0.05\) maka \(H_0\) ditolak sehingga ada hubungan antara obat dengan pasien terkena serangan jantung.

Untuk Latihan silahkan gunakan yang ada pada modul kawan-kawan yaaa