Arindy Hanum D’Coen
140610240041
Dalam berbagai bidang penelitian seperti kesehatan, ekonomi, dan ilmu sosial, peneliti sering menghadapi data yang berbentuk kategori. Data kategori merupakan data yang nilainya berupa label atau kelompok tertentu dan bukan nilai numerik kontinu. Contoh variabel kategori antara lain jenis kelamin, status merokok, status penyakit, tingkat pendidikan, dan status pekerjaan.
Analisis data kategori bertujuan untuk memahami hubungan antara variabel kategorikal. Salah satu metode paling umum yang digunakan adalah tabel kontingensi. Tabel ini menyajikan frekuensi gabungan dari dua atau lebih variabel kategori sehingga memungkinkan peneliti untuk mempelajari hubungan atau asosiasi antar variabel tersebut.
Tabel kontingensi adalah tabel yang menyajikan frekuensi gabungan dari dua atau lebih variabel kategori. Tabel ini digunakan untuk menggambarkan distribusi data dan mempelajari hubungan antara variabel kategorikal.
Secara umum tabel kontingensi digunakan untuk:
Jika terdapat dua variabel kategori masing-masing dengan dua kategori maka tabel yang dihasilkan disebut tabel kontingensi 2×2.
Misalkan dilakukan simulasi penelitian mengenai hubungan antara status merokok dan kanker paru.
| Status Merokok | Kanker | Tidak Kanker | Total |
|---|---|---|---|
| Merokok | 60 | 40 | 100 |
| Tidak Merokok | 20 | 80 | 100 |
| Total | 80 | 120 | 200 |
Struktur umum tabel kontingensi 2×2 dapat dituliskan sebagai berikut:
| Y = 1 | Y = 0 | Total | |
|---|---|---|---|
| X = 1 | \(a\) | \(b\) | \(a+b\) |
| X = 0 | \(c\) | \(d\) | \(c+d\) |
| Total | \(a+c\) | \(b+d\) | \(n\) |
Total observasi:
\[ n = a + b + c + d \]
Ukuran asosiasi digunakan untuk mengukur kekuatan hubungan antara dua variabel kategori.
Odds merupakan rasio antara peluang kejadian dengan peluang tidak terjadinya kejadian.
\[ Odds = \frac{P}{1-P} \]
Dalam tabel kontingensi:
\[ Odds_1 = \frac{a}{b} \]
\[ Odds_0 = \frac{c}{d} \]
Odds Ratio membandingkan odds antara dua kelompok.
\[ OR = \frac{Odds_1}{Odds_0} \]
Substitusi menghasilkan:
\[ OR = \frac{a/b}{c/d} \]
Sehingga diperoleh:
\[ OR = \frac{ad}{bc} \]
Interpretasi:
Relative Risk membandingkan probabilitas kejadian pada dua kelompok.
\[ RR = \frac{P(Y=1|X=1)}{P(Y=1|X=0)} \]
Substitusi probabilitas:
\[ RR = \frac{\frac{a}{a+b}}{\frac{c}{c+d}} \]
Jika nilai RR lebih besar dari 1 maka kelompok pertama memiliki risiko lebih tinggi.
Gunakan data simulasi berikut:
| Kanker | Tidak Kanker | |
|---|---|---|
| Merokok | 60 | 40 |
| Tidak Merokok | 20 | 80 |
Total sampel:
\[ n = 60 + 40 + 20 + 80 = 200 \]
\[ P(Kanker|Merokok)=\frac{60}{60+40}=0.6 \]
\[ P(Kanker|TidakMerokok)=\frac{20}{20+80}=0.2 \]
\[ Odds_1=\frac{60}{40}=1.5 \]
\[ Odds_0=\frac{20}{80}=0.25 \]
\[ OR=\frac{60\times80}{40\times20} \]
\[ OR=\frac{4800}{800}=6 \]
Interpretasi:
Nilai Odds Ratio sebesar 6 menunjukkan bahwa individu yang merokok memiliki peluang enam kali lebih besar mengalami kanker paru dibandingkan individu yang tidak merokok.
data <- matrix(c(60,40,20,80),
nrow = 2,
byrow = TRUE)
rownames(data) <- c("Merokok","Tidak Merokok")
colnames(data) <- c("Kanker","Tidak Kanker")
data
## Kanker Tidak Kanker
## Merokok 60 40
## Tidak Merokok 20 80