rm(list = ls())
Analisis data kategori adalah metode statistik yang digunakan untuk menganalisis variabel-variabel yang bersifat kategorikal, yaitu data yang dapat dikelompokkan ke dalam kategori-kategori tertentu berdasarkan karakteristik kualitatif. Berbeda dengan data numerik yang dapat diukur secara kontinu, data kategori hanya dapat diklasifikasikan ke dalam kelompok-kelompok tertentu.
Menurut Agresti (2013), analisis data kategori merupakan pendekatan statistik yang khusus dirancang untuk menangani data yang dihasilkan dari pengukuran skala nominal dan ordinal, di mana observasi hanya dapat diklasifikasikan ke dalam kategori-kategori yang mutually exclusive dan exhaustive.
| Jenis | Deskripsi | Contoh |
|---|---|---|
| Nominal | Kategori tanpa tingkatan | Jenis kelamin, status vaksinasi, golongan darah |
| Ordinal | Kategori dengan tingkatan | Tingkat keparahan (ringan-sedang-berat), pendidikan (SD-SMP-SMA-PT) |
| Dikotomus | Hanya dua kategori | Sakit/sehat, hidup/mati, ya/tidak |
| Bidang | Contoh Penelitian | Variabel Kategori |
|---|---|---|
| Kesehatan | Efektivitas vaksin terhadap infeksi COVID-19 | Status vaksin (divaksin/tidak), status infeksi (terinfeksi/tidak) |
| Kesehatan | Hubungan jenis vaksin dengan efek samping | Jenis vaksin (A/B/C), efek samping (ada/tidak) |
| Epidemiologi | Faktor risiko penularan penyakit | Kontak erat (ya/tidak), status sakit (sakit/sehat) |
| Klinis | Hubungan komorbiditas dengan mortalitas | Komorbiditas (ada/tidak), outcome (sembuh/meninggal) |
Sumber: - Agresti, A. (2013). Categorical Data Analysis (3rd ed.). John Wiley & Sons. - Woodward, M. (2013). Epidemiology: Study Design and Data Analysis (3rd ed.). CRC Press.
Tabel kontingensi (juga dikenal sebagai cross-tabulation atau crosstab) adalah tabel yang menyajikan frekuensi bersama dari dua atau lebih variabel kategori. Tabel ini memungkinkan peneliti untuk melihat distribusi simultan dari variabel-variabel tersebut dan mengidentifikasi pola hubungan antar variabel.
Tabel kontingensi 2×2 merupakan bentuk paling sederhana dengan dua baris dan dua kolom:
| Kolom 1 | Kolom 2 | Total Baris | |
|---|---|---|---|
| Baris 1 | \(n_{11}\) | \(n_{12}\) | \(n_{1+}\) |
| Baris 2 | \(n_{21}\) | \(n_{22}\) | \(n_{2+}\) |
| Total Kolom | \(n_{+1}\) | \(n_{+2}\) | \(n\) |
Dimana:
Joint distribution menunjukkan probabilitas suatu observasi berada pada kategori baris ke-i dan kolom ke-j secara bersamaan:
\[P(\text{Baris} = i, \text{Kolom} = j) = \frac{n_{ij}}{n}\]
Distribusi marginal adalah distribusi dari satu variabel saja, mengabaikan variabel lainnya:
\[P(\text{Baris} = i) = \frac{n_{i+}}{n}\]
\[P(\text{Kolom} = j) = \frac{n_{+j}}{n}\]
Probabilitas bersyarat adalah probabilitas suatu kejadian dengan syarat kejadian lain telah terjadi:
\[P(\text{Kolom} = j | \text{Baris} = i) = \frac{n_{ij}}{n_{i+}}\]
\[P(\text{Baris} = i | \text{Kolom} = j) = \frac{n_{ij}}{n_{+j}}\]
Tabel 2.1: Hubungan Status Vaksinasi dengan Kejadian Infeksi COVID-19
| Terinfeksi | Tidak Terinfeksi | Total | |
|---|---|---|---|
| Divaksin | 15 | 185 | 200 |
| Tidak Divaksin | 45 | 55 | 100 |
| Total | 60 | 240 | 300 |
\[P(\text{Divaksin}, \text{Terinfeksi}) = \frac{15}{300} = 0,05 = 5\%\]
\[P(\text{Divaksin}, \text{Tidak Terinfeksi}) = \frac{185}{300} = 0,617 = 61,7\%\]
\[P(\text{Tidak Divaksin}, \text{Terinfeksi}) = \frac{45}{300} = 0,15 = 15\%\]
\[P(\text{Tidak Divaksin}, \text{Tidak Terinfeksi}) = \frac{55}{300} = 0,183 = 18,3\%\]
\[P(\text{Divaksin}) = \frac{200}{300} = 0,667 = 66,7\%\]
\[P(\text{Tidak Divaksin}) = \frac{100}{300} = 0,333 = 33,3\%\]
\[P(\text{Terinfeksi}) = \frac{60}{300} = 0,20 = 20\%\]
\[P(\text{Tidak Terinfeksi}) = \frac{240}{300} = 0,80 = 80\%\]
\[P(\text{Terinfeksi} | \text{Divaksin}) = \frac{15}{200} = 0,075 = 7,5\%\]
\[P(\text{Terinfeksi} | \text{Tidak Divaksin}) = \frac{45}{100} = 0,45 = 45\%\]
\[P(\text{Divaksin} | \text{Terinfeksi}) = \frac{15}{60} = 0,25 = 25\%\]
\[P(\text{Divaksin} | \text{Tidak Terinfeksi}) = \frac{185}{240} = 0,771 = 77,1\%\]
Odds adalah perbandingan antara probabilitas suatu kejadian terjadi dengan probabilitas kejadian tersebut tidak terjadi.
Rumus Odds:
\[Odds = \frac{p}{1-p}\]
Dimana \(p\) adalah probabilitas kejadian.
Perhitungan Odds dari contoh:
\[Odds_{\text{divaksin}} = \frac{P(\text{Terinfeksi}|\text{Divaksin})}{P(\text{Tidak Terinfeksi}|\text{Divaksin})} = \frac{\frac{15}{200}}{\frac{185}{200}} = \frac{0,075}{0,925} = 0,081\]
\[Odds_{\text{tidak divaksin}} = \frac{P(\text{Terinfeksi}|\text{Tidak Divaksin})}{P(\text{Tidak Terinfeksi}|\text{Tidak Divaksin})} = \frac{\frac{45}{100}}{\frac{55}{100}} = \frac{0,45}{0,55} = 0,818\]
Interpretasi: - Pada kelompok divaksin, odds terinfeksi adalah 0,081, artinya peluang terinfeksi hanya 0,081 kali peluang tidak terinfeksi. - Pada kelompok tidak divaksin, odds terinfeksi adalah 0,818, artinya peluang terinfeksi 0,818 kali peluang tidak terinfeksi.
Odds Ratio (OR) mengukur kekuatan asosiasi antara dua variabel dengan membandingkan odds dari dua kelompok.
Rumus Odds Ratio:
\[OR = \frac{Odds_{\text{divaksin}}}{Odds_{\text{tidak divaksin}}} = \frac{\frac{a}{b}}{\frac{c}{d}} = \frac{a \times d}{b \times c}\]
Dari tabel 2.1: - \(a = 15\) (divaksin dan terinfeksi) - \(b = 185\) (divaksin dan tidak terinfeksi) - \(c = 45\) (tidak divaksin dan terinfeksi) - \(d = 55\) (tidak divaksin dan tidak terinfeksi)
\[OR = \frac{15 \times 55}{185 \times 45} = \frac{825}{8325} = 0,099\]
Interpretasi Odds Ratio:
| Nilai OR | Interpretasi |
|---|---|
| OR = 1 | Tidak ada asosiasi antara vaksinasi dan infeksi |
| OR > 1 | Vaksinasi meningkatkan risiko infeksi (vaksin tidak efektif) |
| OR < 1 | Vaksinasi menurunkan risiko infeksi (vaksin efektif) |
Dengan OR = 0,099 (< 1), menunjukkan bahwa vaksinasi bersifat protektif. Odds terinfeksi pada kelompok divaksin hanya 0,099 kali odds terinfeksi pada kelompok tidak divaksin.
Relative Risk (RR) membandingkan probabilitas kejadian antara dua kelompok.
Rumus Relative Risk:
\[RR = \frac{P(\text{Terinfeksi}|\text{Divaksin})}{P(\text{Terinfeksi}|\text{Tidak Divaksin})} = \frac{\frac{a}{a+b}}{\frac{c}{c+d}}\]
\[RR = \frac{\frac{15}{200}}{\frac{45}{100}} = \frac{0,075}{0,45} = 0,167\]
Interpretasi Relative Risk:
| Nilai RR | Interpretasi |
|---|---|
| RR = 1 | Tidak ada perbedaan risiko antara kedua kelompok |
| RR > 1 | Vaksinasi meningkatkan risiko infeksi |
| RR < 1 | Vaksinasi menurunkan risiko infeksi |
RR = 0,167 berarti risiko terinfeksi pada kelompok divaksin hanya 16,7% dari risiko pada kelompok tidak divaksin.
Efektivitas vaksin dapat dihitung dari Relative Risk:
\[\text{Efektivitas Vaksin} = (1 - RR) \times 100\%\]
\[\text{Efektivitas Vaksin} = (1 - 0,167) \times 100\% = 83,3\%\]
Artinya, vaksinasi menurunkan risiko infeksi sebesar 83,3% dibandingkan dengan tidak divaksinasi.
Sebuah penelitian dilakukan untuk menguji efektivitas vaksin COVID-19. Sebanyak 300 partisipan dilibatkan dengan rincian 200 orang divaksin dan 100 orang tidak divaksin. Selama periode pengamatan, tercatat jumlah yang terinfeksi COVID-19.
| Terinfeksi | Tidak Terinfeksi | Total | |
|---|---|---|---|
| Divaksin | 15 | 185 | 200 |
| Tidak Divaksin | 45 | 55 | 100 |
| Total | 60 | 240 | 300 |
\[P(\text{Terinfeksi} | \text{Divaksin}) = \frac{15}{200} = 0,075\]
\[P(\text{Terinfeksi} | \text{Tidak Divaksin}) = \frac{45}{100} = 0,45\]
\[P(\text{Tidak Terinfeksi} | \text{Divaksin}) = \frac{185}{200} = 0,925\]
\[P(\text{Tidak Terinfeksi} | \text{Tidak Divaksin}) = \frac{55}{100} = 0,55\]
\[Odds_{\text{divaksin}} = \frac{0,075}{0,925} = 0,081\]
\[Odds_{\text{tidak divaksin}} = \frac{0,45}{0,55} = 0,818\]
\[OR = \frac{Odds_{\text{divaksin}}}{Odds_{\text{tidak divaksin}}} = \frac{0,081}{0,818} = 0,099\]
Atau menggunakan rumus langsung dari tabel:
\[OR = \frac{15 \times 55}{185 \times 45} = \frac{825}{8325} = 0,099\]
\[RR = \frac{P(\text{Terinfeksi}|\text{Divaksin})}{P(\text{Terinfeksi}|\text{Tidak Divaksin})} = \frac{0,075}{0,45} = 0,167\]
\[\text{Efektivitas Vaksin} = (1 - 0,167) \times 100\% = 83,3\%\]
# Membuat data tabel kontingensi
data_vaksin <- matrix(c(15, 185, 45, 55),
nrow = 2,
byrow = TRUE)
# Memberikan nama baris dan kolom
rownames(data_vaksin) <- c("Divaksin", "Tidak Divaksin")
colnames(data_vaksin) <- c("Terinfeksi", "Tidak Terinfeksi")
# Menampilkan tabel kontingensi
data_vaksin
## Terinfeksi Tidak Terinfeksi
## Divaksin 15 185
## Tidak Divaksin 45 55
# Menghitung probabilitas bersyarat
prob_divaksin_terinfeksi <- data_vaksin[1,1] / sum(data_vaksin[1,])
prob_divaksin_tidak <- data_vaksin[1,2] / sum(data_vaksin[1,])
prob_tidak_divaksin_terinfeksi <- data_vaksin[2,1] / sum(data_vaksin[2,])
prob_tidak_divaksin_tidak <- data_vaksin[2,2] / sum(data_vaksin[2,])
# Menampilkan probabilitas bersyarat
prob_divaksin_terinfeksi
## [1] 0.075
prob_divaksin_tidak
## [1] 0.925
prob_tidak_divaksin_terinfeksi
## [1] 0.45
prob_tidak_divaksin_tidak
## [1] 0.55
# Menghitung Odds
odds_divaksin <- prob_divaksin_terinfeksi / prob_divaksin_tidak
odds_tidak_divaksin <- prob_tidak_divaksin_terinfeksi / prob_tidak_divaksin_tidak
# Menampilkan Odds
odds_divaksin
## [1] 0.08108108
odds_tidak_divaksin
## [1] 0.8181818
# Menghitung Odds Ratio
odds_ratio <- (data_vaksin[1,1] * data_vaksin[2,2]) / (data_vaksin[1,2] * data_vaksin[2,1])
odds_ratio
## [1] 0.0990991
# Menghitung Relative Risk
relative_risk <- prob_divaksin_terinfeksi / prob_tidak_divaksin_terinfeksi
relative_risk
## [1] 0.1666667
# Menghitung Efektivitas Vaksin
efektivitas_vaksin <- (1 - relative_risk) * 100
efektivitas_vaksin
## [1] 83.33333
# Uji Chi-Square
chisq.test(data_vaksin, correct = FALSE)
##
## Pearson's Chi-squared test
##
## data: data_vaksin
## X-squared = 58.594, df = 1, p-value = 1.938e-14
# Visualisasi dengan dua plot terpisah
par(mfrow = c(1,2))
# Mosaic plot
mosaicplot(data_vaksin,
main = "Mosaic Plot: Vaksin vs Infeksi",
xlab = "Status Vaksinasi",
ylab = "Status Infeksi",
color = c("lightcoral", "lightblue"))
# Bar plot proporsi
barplot(c(prob_divaksin_terinfeksi, prob_tidak_divaksin_terinfeksi),
names.arg = c("Divaksin", "Tidak Divaksin"),
col = c("#3498db", "#e74c3c"),
main = "Proporsi Terinfeksi",
ylab = "Proporsi",
ylim = c(0, 0.5))
Berdasarkan analisis data penelitian tentang efektivitas vaksin COVID-19 dengan 300 partisipan, diperoleh hasil sebagai berikut:
Uji Chi-Square:
Hasil ini menunjukkan bahwa terdapat hubungan yang signifikan secara statistik antara status vaksinasi dengan kejadian infeksi COVID-19. Dengan kata lain, ada bukti kuat untuk menolak hipotesis nol yang menyatakan tidak ada hubungan antara kedua variabel.
Odds Ratio (OR = 0,099):
Relative Risk (RR = 0,167):
Dalam konteks kesehatan masyarakat dan epidemiologi, hasil analisis ini memiliki implikasi penting:
Efektivitas Vaksin:
Perbandingan Risiko:
Number Needed to Treat (NNT): \[NNT = \frac{1}{\text{Risiko kelompok kontrol} - \text{Risiko kelompok perlakuan}} = \frac{1}{0,45 - 0,075} = \frac{1}{0,375} = 2,67\]
Artinya, diperlukan vaksinasi pada sekitar 3 orang untuk mencegah 1 kasus infeksi COVID-19. Ini menunjukkan efikasi vaksin yang sangat baik.
Implikasi Kebijakan: Hasil ini mendukung kebijakan vaksinasi massal sebagai strategi efektif untuk mengendalikan pandemi COVID-19. Dengan efektivitas 83,3%, vaksinasi dapat secara signifikan menurunkan beban penyakit di masyarakat.
Berdasarkan analisis data kategori pada studi vaksin COVID-19, dapat disimpulkan bahwa:
Terdapat hubungan yang signifikan secara statistik antara status vaksinasi dan kejadian infeksi COVID-19 (p < 0,001).
Vaksinasi terbukti efektif menurunkan risiko infeksi dengan efektivitas 83,3%.
Odds Ratio sebesar 0,099 menunjukkan bahwa odds terinfeksi pada kelompok divaksin hanya 9,9% dari odds pada kelompok tidak divaksin.
Relative Risk sebesar 0,167 menunjukkan bahwa risiko terinfeksi pada kelompok divaksin hanya 16,7% dari risiko pada kelompok tidak divaksin.
Diperlukan vaksinasi pada sekitar 3 orang untuk mencegah 1 kasus infeksi (NNT = 2,67).
Agresti, A. (2013). Categorical Data Analysis (3rd ed.). John Wiley & Sons.
Agresti, A. (2019). An Introduction to Categorical Data Analysis (3rd ed.). Wiley.
Fleiss, J. L., Levin, B., & Paik, M. C. (2013). Statistical Methods for Rates and Proportions (3rd ed.). John Wiley & Sons.
Woodward, M. (2013). Epidemiology: Study Design and Data Analysis (3rd ed.). CRC Press.
World Health Organization. (2021). Vaccine efficacy, effectiveness and protection. WHO.