Analisis data kategori adalah metode statistika yang digunakan untuk menganalisis data yang berbentuk kelompok atau kategori, bukan angka kontinu.
Variabel kategori punya ciri-ciri seperti berikut:
Tabel kontingensi adalah tabel yang menyusun frekuensi dari dua variabel kategori secara silang, sehingga kita dapat mempelajari hubungan antara dua variabel tersebut.
Berikut contoh data 200 orang terkait status merokok dan kanker paru:
| Kanker | Tidak Kanker | Total | |
|---|---|---|---|
| Merokok | 60 | 40 | 100 |
| Tidak Merokok | 20 | 80 | 100 |
| Total | 80 | 120 | 200 |
Peluang dua kejadian terjadi bersamaan:
\[P(\text{Merokok} \cap \text{Kanker}) = \frac{60}{200} = 0.30\]
Peluang satu variabel tanpa memperhatikan variabel lain:
\[P(\text{Merokok}) = \frac{100}{200} = 0.50\]
\[P(\text{Kanker}) = \frac{80}{200} = 0.40\]
Peluang suatu kejadian dengan syarat kejadian lain telah diketahui:
\[P(\text{Kanker} \mid \text{Merokok}) = \frac{60}{100} = 0.60\]
\[P(\text{Kanker} \mid \text{Tidak Merokok}) = \frac{20}{100} = 0.20\]
Terlihat bahwa peluang kanker pada perokok (0.60) jauh lebih tinggi dibanding non-perokok (0.20), mengindikasikan adanya asosiasi.
Ukuran asosiasi digunakan untuk mengukur kekuatan hubungan antara dua variabel kategori dalam tabel kontingensi.
Struktur tabel kontingensi 2x2:
| Kanker (Ya) | Kanker (Tidak) | |
|---|---|---|
| Merokok | a | b |
| Tidak Merokok | c | d |
Odds adalah perbandingan peluang suatu kejadian terjadi dibanding tidak terjadi.
\[\text{Odds} = \frac{p}{1-p}\]
Odds kanker pada perokok:
\[\text{Odds}_{\text{Merokok}} = \frac{a}{b} = \frac{60}{40} = 1.5\]
Odds kanker pada non-perokok:
\[\text{Odds}_{\text{Tidak Merokok}} = \frac{c}{d} = \frac{20}{80} = 0.25\]
Interpretasi: Pada perokok, kejadian kanker 1.5 kali lebih mungkin terjadi dibanding tidak terjadi.
Odds Ratio adalah perbandingan odds antara dua kelompok.
\[OR = \frac{ad}{bc}\]
Interpretasi OR:
Relative Risk adalah perbandingan peluang kejadian antara dua kelompok secara langsung.
\[RR = \frac{a/(a+b)}{c/(c+d)}\]
Interpretasi RR:
Sebuah studi dilakukan terhadap 200 orang untuk mengetahui hubungan antara kebiasaan merokok dan kejadian kanker paru.
| Kanker | Tidak Kanker | Total | |
|---|---|---|---|
| Merokok | 60 | 40 | 100 |
| Tidak Merokok | 20 | 80 | 100 |
| Total | 80 | 120 | 200 |
Keterangan:
\[P(\text{Kanker} \mid \text{Merokok}) = \frac{a}{a+b} = \frac{60}{100} = 0.60\]
\[P(\text{Kanker} \mid \text{Tidak Merokok}) = \frac{c}{c+d} = \frac{20}{100} = 0.20\]
\[\text{Odds}_{\text{Merokok}} = \frac{a}{b} = \frac{60}{40} = 1.5\]
\[\text{Odds}_{\text{Tidak Merokok}} = \frac{c}{d} = \frac{20}{80} = 0.25\]
\[OR = \frac{ad}{bc} = \frac{60 \times 80}{40 \times 20} = \frac{4800}{800} = 6\]
\[RR = \frac{a/(a+b)}{c/(c+d)} = \frac{60/100}{20/100} = \frac{0.60}{0.20} = 3\]
# Membuat matrix data
data <- matrix(c(60, 40, 20, 80),
nrow = 2,
byrow = TRUE)
# Memberi nama baris dan kolom
rownames(data) <- c("Merokok", "Tidak Merokok")
colnames(data) <- c("Kanker", "Tidak Kanker")
# Tampilkan tabel
data
## Kanker Tidak Kanker
## Merokok 60 40
## Tidak Merokok 20 80
# Ambil nilai sel tabel
a <- data[1,1]
b <- data[1,2]
c <- data[2,1]
d <- data[2,2]
# Hitung Odds Ratio
OR <- (a * d) / (b * c)
cat("Odds Ratio:", OR)
## Odds Ratio: 6
# Hitung Relative Risk
RR <- (a / (a+b)) / (c / (c+d))
cat("\nRelative Risk:", RR)
##
## Relative Risk: 3
# Melakukan uji chi-square
hasil_chi <- chisq.test(data)
hasil_chi
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: data
## X-squared = 31.688, df = 1, p-value = 1.811e-08
Berdasarkan hasil analisis diperoleh:
Odds Ratio (OR) = 6: odds terkena kanker paru pada kelompok perokok 6 kali lebih besar dibandingkan kelompok non-perokok.
Relative Risk (RR) = 3: peluang terkena kanker paru pada kelompok perokok 3 kali lebih besar dibandingkan non-perokok.
Uji Chi-Square: nilai p-value < 0.0001, lebih kecil dari \(\alpha = 0.05\), sehingga H0 ditolak. Terdapat hubungan yang signifikan secara statistik antara status merokok dan kejadian kanker paru.
Hasil analisis menunjukkan bahwa kebiasaan merokok berasosiasi kuat dengan kejadian kanker paru. Seseorang yang merokok memiliki risiko 3 kali lebih besar untuk terkena kanker paru dibandingkan dengan yang tidak merokok (RR = 3).
Temuan ini konsisten dengan berbagai penelitian epidemiologi yang menyatakan bahwa rokok merupakan faktor risiko utama kanker paru. Oleh karena itu, upaya pencegahan seperti kampanye anti-rokok dan kebijakan pembatasan rokok sangat relevan untuk menurunkan angka kejadian kanker paru di masyarakat.