Tabel kontingensi adalah tabel yang digunakan untuk menyajikan distribusi frekuensi dari dua variabel kategorik secara bersamaan. Tabel ini memperlihatkan hubungan antara dua variabel diskrit dalam bentuk tabulasi silang (cross-tabulation).
Pada kasus paling sederhana, tabel kontingensi berukuran 2×2, artinya terdapat dua kategori pada variabel pertama dan dua kategori pada variabel kedua. Tabel ini sering digunakan dalam analisis asosiasi, uji chi-square, odds ratio, relative risk, dan berbagai analisis inferensial lainnya.
Secara umum, bentuk tabel kontingensi 2×2 adalah:
| Y = 1 | Y = 0 | Total | |
|---|---|---|---|
| X = 1 | a | b | a+b |
| X = 0 | c | d | c+d |
| Total | a+c | b+d | n |
Dengan: - a, b, c, d = frekuensi masing-masing sel - n = total pengamatan
Tabel ini memungkinkan kita menghitung distribusi peluang bersama (joint probability), peluang marginal, dan peluang kondisional.
Misalkan kita melakukan simulasi terhadap 200 individu untuk melihat hubungan antara:
Misalkan diperoleh data sebagai berikut:
| Penyakit (Ya) | Penyakit (Tidak) | Total | |
|---|---|---|---|
| Merokok (Ya) | 40 | 60 | 100 |
| Merokok (Tidak) | 20 | 80 | 100 |
| Total | 60 | 140 | 200 |
Interpretasi: - 40 orang merokok dan memiliki penyakit paru. - 20 orang tidak merokok tetapi memiliki penyakit paru.
Misalkan total n = 200.
P(X=1, Y=1) = 40/200 = 0.20
P(X=1, Y=0) = 60/200 = 0.30
P(X=0, Y=1) = 20/200 = 0.10
P(X=0, Y=0) = 80/200 = 0.40
Distribusi joint menunjukkan peluang kejadian dua variabel secara bersamaan.
P(X=1) = 100/200 = 0.50
P(X=0) = 100/200 = 0.50
P(Y=1) = 60/200 = 0.30
P(Y=0) = 140/200 = 0.70
Distribusi marginal diperoleh dari penjumlahan baris atau kolom.
P(Y=1 | X=1) = 40/100 = 0.40
P(Y=1 | X=0) = 20/100 = 0.20
P(X=1 | Y=1) = 40/60 = 0.667
Distribusi conditional menunjukkan peluang suatu kejadian dengan syarat kejadian lain telah terjadi.
Misalkan kita ingin menghitung:
\[ P(X=1, Y=1) = \frac{40}{200} = 0.20 \]
\[ P(X=1) = \frac{100}{200} = 0.50 \]
\[ P(Y=1 | X=1) = \frac{P(X=1,Y=1)}{P(X=1)} = \frac{40/200}{100/200} = \frac{40}{100} = 0.40 \]
Berikut contoh simulasi data dan pembentukan tabel kontingensi menggunakan R.
set.seed(123)
# Simulasi 200 data
n <- 200
merokok <- sample(c("Ya","Tidak"), n, replace=TRUE)
penyakit <- ifelse(merokok=="Ya",
sample(c("Ya","Tidak"), n, replace=TRUE, prob=c(0.4,0.6)),
sample(c("Ya","Tidak"), n, replace=TRUE, prob=c(0.2,0.8)))
# Membuat tabel kontingensi
tabel <- table(merokok, penyakit)
tabel
## penyakit
## merokok Tidak Ya
## Tidak 74 23
## Ya 65 38
prop.table(tabel)
## penyakit
## merokok Tidak Ya
## Tidak 0.370 0.115
## Ya 0.325 0.190
prop.table(tabel, margin=1) # Conditional baris
## penyakit
## merokok Tidak Ya
## Tidak 0.7628866 0.2371134
## Ya 0.6310680 0.3689320
prop.table(tabel, margin=2) # Conditional kolom
## penyakit
## merokok Tidak Ya
## Tidak 0.5323741 0.3770492
## Ya 0.4676259 0.6229508
Jika peluang conditional berbeda secara signifikan, maka terdapat indikasi hubungan antara kedua variabel.
Dalam contoh ini:
Tabel kontingensi 2×2 merupakan dasar penting dalam statistika inferensial, terutama untuk uji chi-square dan analisis risiko seperti odds ratio dan relative risk.
Tabel kontingensi 2×2 adalah alat penting dalam analisis dua variabel kategorik. Melalui tabel ini kita dapat:
Pendekatan ini sangat relevan dalam bidang kesehatan, sosial, ekonomi, dan penelitian eksperimental.