Analisis data kategori merupakan bagian penting dalam statistika inferensial yang digunakan untuk menganalisis variabel-variabel yang berbentuk kategori atau kualitatif. Salah satu bentuk penyajian data kategori yang paling umum digunakan adalah tabel kontingensi. Dalam buku ini akan dibahas secara mendalam mengenai tabel kontingensi 2 x 2 serta ukuran asosiasi yang dapat dihitung darinya, yaitu beda peluang (risk difference), relative risk, dan odds ratio.
Buku ini dirancang untuk memberikan pemahaman konseptual, matematis, serta implementasi menggunakan perangkat lunak R.
Tabel kontingensi adalah tabel yang digunakan untuk menyajikan distribusi frekuensi gabungan dari dua atau lebih variabel kategori. Pada kasus dua variabel dengan masing-masing dua kategori, maka tabel yang terbentuk disebut tabel kontingensi 2 x 2.
Secara umum, struktur tabel kontingensi 2 x 2 dapat dituliskan sebagai berikut:
| Outcome (+) | Outcome (-) | Total | |
|---|---|---|---|
| Exposure (+) | a | b | a+b |
| Exposure (-) | c | d | c+d |
| Total | a+c | b+d | n |
Dengan: - a = jumlah individu dengan paparan dan outcome - b = jumlah individu dengan paparan tanpa outcome - c = jumlah individu tanpa paparan dengan outcome - d = jumlah individu tanpa paparan tanpa outcome - n = total pengamatan
Misalkan:
\[ n = a + b + c + d \]
Peluang outcome pada kelompok terpapar:
\[ P_1 = \frac{a}{a+b} \]
Peluang outcome pada kelompok tidak terpapar:
\[ P_0 = \frac{c}{c+d} \]
Misalkan dilakukan penelitian mengenai hubungan antara kebiasaan merokok dan kejadian penyakit paru.
| Penyakit (+) | Penyakit (-) | Total | |
|---|---|---|---|
| Merokok | 40 | 60 | 100 |
| Tidak Merokok | 20 | 80 | 100 |
| Total | 60 | 140 | 200 |
Sehingga: - a = 40 - b = 60 - c = 20 - d = 80
Beda peluang didefinisikan sebagai:
\[ RD = P_1 - P_0 \]
dengan:
\[ P_1 = \frac{a}{a+b} \]
\[ P_0 = \frac{c}{c+d} \]
\[ P_1 = \frac{40}{100} = 0.4 \]
\[ P_0 = \frac{20}{100} = 0.2 \]
\[ RD = 0.4 - 0.2 = 0.2 \]
Artinya, terdapat peningkatan risiko sebesar 20% pada kelompok perokok.
Relative Risk didefinisikan sebagai:
\[ RR = \frac{P_1}{P_0} \]
\[ RR = \frac{0.4}{0.2} = 2 \]
Artinya risiko penyakit pada perokok dua kali lebih besar dibandingkan yang tidak merokok.
Odds pada kelompok terpapar:
\[ Odds_1 = \frac{a}{b} \]
Odds pada kelompok tidak terpapar:
\[ Odds_0 = \frac{c}{d} \]
Odds Ratio:
\[ OR = \frac{a/b}{c/d} \]
Secara aljabar dapat disederhanakan menjadi:
\[ OR = \frac{ad}{bc} \]
\[ OR = \frac{40 \times 80}{60 \times 20} \]
\[ OR = \frac{3200}{1200} = 2.67 \]
Interpretasi: Odds terkena penyakit pada perokok sekitar 2.67 kali dibandingkan yang tidak merokok.
Beda peluang memberikan ukuran absolut, relative risk memberikan ukuran perbandingan risiko, sedangkan odds ratio memberikan perbandingan peluang (odds). Pada studi kohort, relative risk lebih mudah diinterpretasikan. Pada studi kasus-kontrol, odds ratio lebih umum digunakan.
Tabel kontingensi 2 x 2 merupakan alat penting dalam analisis data kategori. Ukuran asosiasi seperti beda peluang, relative risk, dan odds ratio memberikan informasi kuantitatif mengenai hubungan antara dua variabel kategori.
Dengan memahami konsep matematis dan implementasi menggunakan R, peneliti dapat melakukan analisis data kategori secara sistematis dan profesional.