Analisis data kategori adalah cabang statistika yang mempelajari data yang nilainya berupa kategori atau kelompok, bukan angka kontinu. Analisis ini digunakan untuk mengetahui hubungan (asosiasi) antar variabel kategori, bukan untuk mengukur besar-kecilnya nilai seperti pada data numerik.
Karakteristik variabel kategori:
Contoh penerapan dalam penelitian:
Referensi: Agresti, A. (2019). An Introduction to Categorical Data Analysis. Wiley.
Tabel kontingensi adalah tabel yang menyajikan frekuensi hasil silang (cross-tabulation) dari dua variabel kategori atau lebih, digunakan untuk melihat pola hubungan antar variabel tersebut.
Struktur tabel kontingensi 2×2:
| Infeksi (+) | Infeksi (−) | Total | |
|---|---|---|---|
| Divaksin | a | b | a + b |
| Tidak Divaksin | c | d | c + d |
| Total | a + c | b + d | n |
Joint distribution adalah peluang gabungan dua kejadian terjadi bersamaan, misalnya \(P(\text{Divaksin}, \text{Infeksi}) = \dfrac{a}{n}\).
Marginal distribution adalah peluang satu variabel saja, diperoleh dari menjumlahkan baris/kolom, misalnya \(P(\text{Divaksin}) = \dfrac{a+b}{n}\).
Conditional probability adalah peluang satu variabel dengan syarat variabel lain diketahui, misalnya peluang infeksi jika sudah divaksin: \[ P(\text{Infeksi} \mid \text{Divaksin}) = \frac{a}{a+b} \]
Odds adalah perbandingan peluang suatu kejadian terjadi terhadap peluang tidak terjadi: \[ \text{Odds} = \frac{p}{1-p} \]
Pada kelompok divaksin: \(\text{Odds}_{\text{divaksin}} = \dfrac{a}{b}\), dan kelompok tidak divaksin: \(\text{Odds}_{\text{tidak divaksin}} = \dfrac{c}{d}\).
Odds Ratio (OR) adalah perbandingan odds antara dua kelompok: \[ OR = \frac{a/b}{c/d} = \frac{ad}{bc} \]
Interpretasi: OR = 1 berarti tidak ada asosiasi; OR > 1 berarti kelompok pertama (divaksin) memiliki odds infeksi lebih tinggi; OR < 1 berarti odds infeksi lebih rendah (efek proteksi).
Relative Risk (RR) adalah perbandingan risiko (proporsi) kejadian antara dua kelompok: \[ RR = \frac{a/(a+b)}{c/(c+d)} \]
Interpretasi: RR = 1 berarti risiko sama pada kedua kelompok; RR > 1 berarti risiko pada kelompok divaksin lebih tinggi; RR < 1 berarti risiko lebih rendah dibanding kelompok tidak divaksin.
Kasus: Vaksin vs Infeksi
Data hipotetis dari 200 orang:
| Infeksi (+) | Infeksi (−) | Total | |
|---|---|---|---|
| Divaksin | 20 | 80 | 100 |
| Tidak Divaksin | 50 | 50 | 100 |
| Total | 70 | 130 | 200 |
Sehingga \(a=20,\ b=80,\ c=50,\ d=50\).
1. Peluang bersyarat \[ P(\text{Infeksi} \mid \text{Divaksin}) = \frac{20}{100} = 0.20 \] \[ P(\text{Infeksi} \mid \text{Tidak Divaksin}) = \frac{50}{100} = 0.50 \]
2. Odds \[ \text{Odds}_{\text{divaksin}} = \frac{20}{80} = 0.25 \] \[ \text{Odds}_{\text{tidak divaksin}} = \frac{50}{50} = 1.00 \]
3. Odds Ratio \[ OR = \frac{ad}{bc} = \frac{20 \times 50}{80 \times 50} = \frac{1000}{4000} = 0.25 \]
4. Relative Risk \[ RR = \frac{20/100}{50/100} = \frac{0.20}{0.50} = 0.40 \]
Artinya, orang yang divaksin memiliki odds terinfeksi 0.25 kali odds pada yang tidak divaksin, dan risiko terinfeksi hanya 0.4 kali dibanding yang tidak divaksin — menunjukkan efek protektif vaksin.
# Membuat tabel kontingensi
data <- matrix(c(20, 80, 50, 50),
nrow = 2,
byrow = TRUE)
rownames(data) <- c("Divaksin", "Tidak Divaksin")
colnames(data) <- c("Infeksi", "Tidak Infeksi")
data
## Infeksi Tidak Infeksi
## Divaksin 20 80
## Tidak Divaksin 50 50
# Menghitung odds ratio secara manual
a <- data[1,1]; b <- data[1,2]; c <- data[2,1]; d <- data[2,2]
OR <- (a*d)/(b*c)
OR
## [1] 0.25
# Menghitung relative risk
RR <- (a/(a+b)) / (c/(c+d))
RR
## [1] 0.4
# Uji chi-square
chisq.test(data)
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: data
## X-squared = 18.484, df = 1, p-value = 1.714e-05
Interpretasi statistik: Nilai OR = 0.25 dan RR = 0.40 menunjukkan asosiasi negatif antara vaksinasi dan kejadian infeksi (odds dan risiko infeksi lebih rendah pada kelompok divaksin). Hasil uji chi-square menghasilkan p-value < 0.05, sehingga terdapat hubungan yang signifikan secara statistik antara status vaksinasi dan status infeksi (menolak H0 independensi).
Interpretasi substantif: Dalam konteks kasus ini, vaksinasi terbukti memberikan efek protektif — individu yang divaksin memiliki peluang lebih kecil untuk terinfeksi dibandingkan yang tidak divaksin. Temuan ini konsisten dengan tujuan program vaksinasi dalam menurunkan risiko penularan penyakit.
Catatan: Data pada tugas ini bersifat hipotetis/ilustratif untuk keperluan pembelajaran metode analisis data kategori.