E-Book ini disusun untuk memenuhi tugas mata kuliah Analisis Data Kategorik Kelas C.
Dalam banyak penelitian, peneliti ingin mengetahui apakah terdapat hubungan antara dua variabel kategori. Salah satu alat yang paling umum digunakan untuk mempelajari hubungan tersebut adalah tabel kontingensi. Bentuk paling sederhana dan paling sering dijumpai adalah tabel kontingensi 2 × 2, yang memuat dua variabel kategori dengan masing-masing dua kategori.
Chapter ini membahas konsep tabel kontingensi 2 × 2 beserta tiga ukuran asosiasi utama: Risk Difference, Relative Risk, dan Odds Ratio.
Tabel kontingensi adalah tabel yang digunakan untuk menampilkan distribusi frekuensi dari dua atau lebih variabel kategori secara simultan. Tabel ini membantu peneliti memahami hubungan antar variabel dengan cara melihat bagaimana frekuensi observasi tersebar di antara kombinasi kategori.
Tabel kontingensi 2 × 2 terdiri dari dua baris dan dua kolom. Dalam konteks penelitian kesehatan misalnya, baris merepresentasikan status paparan dan kolom merepresentasikan status penyakit.
| Penyakit (+) | Penyakit (−) | Total | |
|---|---|---|---|
| Terpapar | \(a\) | \(b\) | \(a+b\) |
| Tidak Terpapar | \(c\) | \(d\) | \(c+d\) |
| Total | \(a+c\) | \(b+d\) | \(n\) |
Keterangan:
Berikut adalah data penelitian yang menginvestigasi hubungan antara merokok dan penyakit paru-paru pada 200 responden.
| Penyakit Paru (+) | Penyakit Paru (−) | Total | |
|---|---|---|---|
| Perokok | 40 | 60 | 100 |
| Non-Perokok | 10 | 90 | 100 |
| Total | 50 | 150 | 200 |
Dari tabel tersebut: \(a = 40\), \(b = 60\), \(c = 10\), \(d = 90\), \(n = 200\).
data <- matrix(c(40, 60, 10, 90),
nrow = 2, byrow = TRUE,
dimnames = list(
c("Perokok", "Non-Perokok"),
c("Penyakit (+)", "Penyakit (-)")
))
addmargins(data)#> Penyakit (+) Penyakit (-) Sum
#> Perokok 40 60 100
#> Non-Perokok 10 90 100
#> Sum 50 150 200
Ukuran asosiasi digunakan untuk mengukur kekuatan hubungan antara dua variabel kategori dalam tabel kontingensi.
Sebelum menghitung ukuran asosiasi, perlu didefinisikan terlebih dahulu:
Risk Difference (RD) adalah selisih antara peluang kejadian pada kelompok terpapar dan kelompok tidak terpapar. Ukuran ini menunjukkan besarnya perbedaan risiko secara absolut.
\[RD = p_1 - p_0 = \frac{a}{a+b} - \frac{c}{c+d}\]
Interpretasi: RD = 0 berarti tidak ada perbedaan risiko. RD > 0 berarti kelompok terpapar memiliki risiko lebih tinggi, sedangkan RD < 0 berarti paparan bersifat protektif.
Perhitungan manual:
\[p_1 = \frac{40}{100} = 0.4 \qquad p_0 = \frac{10}{100} = 0.1\]
\[RD = 0.4 - 0.1 = 0.3\]
✅ RD = 0.3 — Perokok memiliki peluang terkena penyakit paru 30% lebih tinggi dibandingkan non-perokok.
a <- 40; b <- 60; c <- 10; d <- 90
p1 <- a / (a + b)
p0 <- c / (c + d)
RD <- p1 - p0
cat("Risk Difference (RD) =", RD)#> Risk Difference (RD) = 0.3
Relative Risk (RR) adalah rasio antara peluang kejadian pada kelompok terpapar dibandingkan kelompok tidak terpapar. Ukuran ini menunjukkan berapa kali lebih besar risiko pada kelompok terpapar.
\[RR = \frac{p_1}{p_0} = \frac{a/(a+b)}{c/(c+d)}\]
Interpretasi: RR = 1 berarti tidak ada hubungan. RR > 1 berarti paparan meningkatkan risiko, RR < 1 berarti paparan bersifat protektif.
Perhitungan manual:
\[RR = \frac{0.4}{0.1} = 4\]
✅ RR = 4 — Perokok memiliki risiko terkena penyakit paru 4 kali lebih besar dibandingkan non-perokok.
#> Relative Risk (RR) = 4
Odds Ratio (OR) membandingkan odds kejadian antara dua kelompok. Odds didefinisikan sebagai rasio peluang kejadian terhadap peluang tidak terjadi.
\[Odds_1 = \frac{a}{b} \qquad Odds_0 = \frac{c}{d}\]
\[OR = \frac{Odds_1}{Odds_0} = \frac{a/b}{c/d} = \frac{ad}{bc}\]
Interpretasi: OR = 1 berarti tidak ada asosiasi. OR > 1 berarti paparan meningkatkan odds kejadian, OR < 1 berarti paparan menurunkan odds kejadian. OR sering digunakan dalam studi kasus-kontrol karena tetap valid meskipun proporsi kasus ditentukan oleh peneliti.
Perhitungan manual:
\[OR = \frac{40 \times 90}{60 \times 10} = \frac{3600}{600} = 6\]
✅ OR = 6 — Odds terkena penyakit paru pada perokok adalah 6 kali lebih besar dibandingkan non-perokok.
#> Odds Ratio (OR) = 6
hasil <- data.frame(
"Ukuran Asosiasi" = c("Risk Difference (RD)", "Relative Risk (RR)", "Odds Ratio (OR)"),
"Nilai" = c(RD, RR, OR),
"Interpretasi" = c(
"Risiko 30% lebih tinggi (absolut)",
"4× lebih berisiko",
"Odds 6× lebih besar"
)
)
knitr::kable(hasil, align = c("l", "c", "l"), col.names = c("Ukuran Asosiasi", "Nilai", "Interpretasi"))| Ukuran Asosiasi | Nilai | Interpretasi |
|---|---|---|
| Risk Difference (RD) | 0.3 | Risiko 30% lebih tinggi (absolut) |
| Relative Risk (RR) | 4.0 | 4× lebih berisiko |
| Odds Ratio (OR) | 6.0 | Odds 6× lebih besar |
Ketiga ukuran asosiasi secara konsisten menunjukkan bahwa terdapat hubungan positif antara merokok dan penyakit paru-paru. RD memberikan gambaran besaran risiko secara absolut, RR membandingkan risiko secara relatif, dan OR membandingkan odds antar kelompok. Pemilihan ukuran yang tepat bergantung pada desain penelitian yang digunakan.
📘 Chapter ini adalah bagian dari Tugas Analisis Data Kategori