rm(list = ls())

Bagian 1: Definisi Analisis Data Kategori

1.1 Pengertian Analisis Data Kategori

Analisis data kategori adalah metode statistik yang digunakan untuk menganalisis variabel-variabel yang bersifat kategorikal, yaitu data yang dapat dikelompokkan ke dalam kategori-kategori tertentu berdasarkan karakteristik kualitatif. Berbeda dengan data numerik yang dapat diukur secara kontinu, data kategori hanya dapat diklasifikasikan ke dalam kelompok-kelompok tertentu.

Menurut Agresti (2013), analisis data kategori merupakan pendekatan statistik yang khusus dirancang untuk menangani data yang dihasilkan dari pengukuran skala nominal dan ordinal, di mana observasi hanya dapat diklasifikasikan ke dalam kategori-kategori yang mutually exclusive dan exhaustive.

1.2 Karakteristik Variabel Kategori

1.2.1 Karakteristik Utama

  1. Bersifat diskrit - Nilai variabel hanya terbatas pada kategori tertentu
  2. Mutually exclusive - Setiap observasi hanya dapat masuk ke dalam satu kategori
  3. Exhaustive - Semua kemungkinan nilai harus tercakup dalam kategori
  4. Dapat diukur dalam frekuensi atau proporsi - Analisis didasarkan pada hitungan atau persentase

1.2.2 Jenis-jenis Variabel Kategori

Jenis Deskripsi Contoh
Nominal Kategori tanpa tingkatan Jenis kelamin, status vaksinasi, golongan darah
Ordinal Kategori dengan tingkatan Tingkat keparahan (ringan-sedang-berat), pendidikan (SD-SMP-SMA-PT)
Dikotomus Hanya dua kategori Sakit/sehat, hidup/mati, ya/tidak

1.3 Contoh Penerapan dalam Penelitian

Bidang Contoh Penelitian Variabel Kategori
Kesehatan Efektivitas vaksin terhadap infeksi COVID-19 Status vaksin (divaksin/tidak), status infeksi (terinfeksi/tidak)
Kesehatan Hubungan jenis vaksin dengan efek samping Jenis vaksin (A/B/C), efek samping (ada/tidak)
Epidemiologi Faktor risiko penularan penyakit Kontak erat (ya/tidak), status sakit (sakit/sehat)
Klinis Hubungan komorbiditas dengan mortalitas Komorbiditas (ada/tidak), outcome (sembuh/meninggal)

Sumber: - Agresti, A. (2013). Categorical Data Analysis (3rd ed.). John Wiley & Sons. - Woodward, M. (2013). Epidemiology: Study Design and Data Analysis (3rd ed.). CRC Press.


Bagian 2: Tabel Kontingensi

2.1 Definisi Tabel Kontingensi

Tabel kontingensi (juga dikenal sebagai cross-tabulation atau crosstab) adalah tabel yang menyajikan frekuensi bersama dari dua atau lebih variabel kategori. Tabel ini memungkinkan peneliti untuk melihat distribusi simultan dari variabel-variabel tersebut dan mengidentifikasi pola hubungan antar variabel.

2.2 Struktur Tabel Kontingensi

Tabel kontingensi 2×2 merupakan bentuk paling sederhana dengan dua baris dan dua kolom:

Kolom 1 Kolom 2 Total Baris
Baris 1 \(n_{11}\) \(n_{12}\) \(n_{1+}\)
Baris 2 \(n_{21}\) \(n_{22}\) \(n_{2+}\)
Total Kolom \(n_{+1}\) \(n_{+2}\) \(n\)

Dimana:

  • \(n_{ij}\) = frekuensi observasi pada baris ke-\(i\) dan kolom ke-\(j\)
  • \(n_{i.}\) = total frekuensi baris ke-\(i\) (jumlah dari semua kolom pada baris \(i\))
  • \(n_{.j}\) = total frekuensi kolom ke-\(j\) (jumlah dari semua baris pada kolom \(j\))
  • \(n\) = total keseluruhan observasi

2.3 Konsep Distribusi

2.3.1 Joint Distribution (Distribusi Bersama)

Joint distribution menunjukkan probabilitas suatu observasi berada pada kategori baris ke-i dan kolom ke-j secara bersamaan:

\[P(\text{Baris} = i, \text{Kolom} = j) = \frac{n_{ij}}{n}\]

2.3.2 Marginal Distribution (Distribusi Marginal)

Distribusi marginal adalah distribusi dari satu variabel saja, mengabaikan variabel lainnya:

\[P(\text{Baris} = i) = \frac{n_{i+}}{n}\]

\[P(\text{Kolom} = j) = \frac{n_{+j}}{n}\]

2.3.3 Conditional Probability (Probabilitas Bersyarat)

Probabilitas bersyarat adalah probabilitas suatu kejadian dengan syarat kejadian lain telah terjadi:

\[P(\text{Kolom} = j | \text{Baris} = i) = \frac{n_{ij}}{n_{i+}}\]

\[P(\text{Baris} = i | \text{Kolom} = j) = \frac{n_{ij}}{n_{+j}}\]

2.4 Contoh Tabel Kontingensi 2×2: Studi Vaksin vs Infeksi

Tabel 2.1: Hubungan Status Vaksinasi dengan Kejadian Infeksi COVID-19

Terinfeksi Tidak Terinfeksi Total
Divaksin 15 185 200
Tidak Divaksin 45 55 100
Total 60 240 300

2.4.1 Perhitungan Joint Distribution

\[P(\text{Divaksin}, \text{Terinfeksi}) = \frac{15}{300} = 0,05 = 5\%\]

\[P(\text{Divaksin}, \text{Tidak Terinfeksi}) = \frac{185}{300} = 0,617 = 61,7\%\]

\[P(\text{Tidak Divaksin}, \text{Terinfeksi}) = \frac{45}{300} = 0,15 = 15\%\]

\[P(\text{Tidak Divaksin}, \text{Tidak Terinfeksi}) = \frac{55}{300} = 0,183 = 18,3\%\]

2.4.2 Perhitungan Marginal Distribution

\[P(\text{Divaksin}) = \frac{200}{300} = 0,667 = 66,7\%\]

\[P(\text{Tidak Divaksin}) = \frac{100}{300} = 0,333 = 33,3\%\]

\[P(\text{Terinfeksi}) = \frac{60}{300} = 0,20 = 20\%\]

\[P(\text{Tidak Terinfeksi}) = \frac{240}{300} = 0,80 = 80\%\]

2.4.3 Perhitungan Conditional Probability

\[P(\text{Terinfeksi} | \text{Divaksin}) = \frac{15}{200} = 0,075 = 7,5\%\]

\[P(\text{Terinfeksi} | \text{Tidak Divaksin}) = \frac{45}{100} = 0,45 = 45\%\]

\[P(\text{Divaksin} | \text{Terinfeksi}) = \frac{15}{60} = 0,25 = 25\%\]

\[P(\text{Divaksin} | \text{Tidak Terinfeksi}) = \frac{185}{240} = 0,771 = 77,1\%\]


Bagian 3: Ukuran Asosiasi

3.1 Odds (Rasio Peluang)

Odds adalah perbandingan antara probabilitas suatu kejadian terjadi dengan probabilitas kejadian tersebut tidak terjadi.

Rumus Odds:

\[Odds = \frac{p}{1-p}\]

Dimana \(p\) adalah probabilitas kejadian.

Perhitungan Odds dari contoh:

\[Odds_{\text{divaksin}} = \frac{P(\text{Terinfeksi}|\text{Divaksin})}{P(\text{Tidak Terinfeksi}|\text{Divaksin})} = \frac{\frac{15}{200}}{\frac{185}{200}} = \frac{0,075}{0,925} = 0,081\]

\[Odds_{\text{tidak divaksin}} = \frac{P(\text{Terinfeksi}|\text{Tidak Divaksin})}{P(\text{Tidak Terinfeksi}|\text{Tidak Divaksin})} = \frac{\frac{45}{100}}{\frac{55}{100}} = \frac{0,45}{0,55} = 0,818\]

Interpretasi: - Pada kelompok divaksin, odds terinfeksi adalah 0,081, artinya peluang terinfeksi hanya 0,081 kali peluang tidak terinfeksi. - Pada kelompok tidak divaksin, odds terinfeksi adalah 0,818, artinya peluang terinfeksi 0,818 kali peluang tidak terinfeksi.

3.2 Odds Ratio (Rasio Odds)

Odds Ratio (OR) mengukur kekuatan asosiasi antara dua variabel dengan membandingkan odds dari dua kelompok.

Rumus Odds Ratio:

\[OR = \frac{Odds_{\text{divaksin}}}{Odds_{\text{tidak divaksin}}} = \frac{\frac{a}{b}}{\frac{c}{d}} = \frac{a \times d}{b \times c}\]

Dari tabel 2.1: - \(a = 15\) (divaksin dan terinfeksi) - \(b = 185\) (divaksin dan tidak terinfeksi) - \(c = 45\) (tidak divaksin dan terinfeksi) - \(d = 55\) (tidak divaksin dan tidak terinfeksi)

\[OR = \frac{15 \times 55}{185 \times 45} = \frac{825}{8325} = 0,099\]

Interpretasi Odds Ratio:

Nilai OR Interpretasi
OR = 1 Tidak ada asosiasi antara vaksinasi dan infeksi
OR > 1 Vaksinasi meningkatkan risiko infeksi (vaksin tidak efektif)
OR < 1 Vaksinasi menurunkan risiko infeksi (vaksin efektif)

Dengan OR = 0,099 (< 1), menunjukkan bahwa vaksinasi bersifat protektif. Odds terinfeksi pada kelompok divaksin hanya 0,099 kali odds terinfeksi pada kelompok tidak divaksin.

3.3 Relative Risk (Risiko Relatif)

Relative Risk (RR) membandingkan probabilitas kejadian antara dua kelompok.

Rumus Relative Risk:

\[RR = \frac{P(\text{Terinfeksi}|\text{Divaksin})}{P(\text{Terinfeksi}|\text{Tidak Divaksin})} = \frac{\frac{a}{a+b}}{\frac{c}{c+d}}\]

\[RR = \frac{\frac{15}{200}}{\frac{45}{100}} = \frac{0,075}{0,45} = 0,167\]

Interpretasi Relative Risk:

Nilai RR Interpretasi
RR = 1 Tidak ada perbedaan risiko antara kedua kelompok
RR > 1 Vaksinasi meningkatkan risiko infeksi
RR < 1 Vaksinasi menurunkan risiko infeksi

RR = 0,167 berarti risiko terinfeksi pada kelompok divaksin hanya 16,7% dari risiko pada kelompok tidak divaksin.

3.4 Efektivitas Vaksin

Efektivitas vaksin dapat dihitung dari Relative Risk:

\[\text{Efektivitas Vaksin} = (1 - RR) \times 100\%\]

\[\text{Efektivitas Vaksin} = (1 - 0,167) \times 100\% = 83,3\%\]

Artinya, vaksinasi menurunkan risiko infeksi sebesar 83,3% dibandingkan dengan tidak divaksinasi.


Bagian 4: Contoh Perhitungan Manual

4.1 Studi Kasus

Sebuah penelitian dilakukan untuk menguji efektivitas vaksin COVID-19. Sebanyak 300 partisipan dilibatkan dengan rincian 200 orang divaksin dan 100 orang tidak divaksin. Selama periode pengamatan, tercatat jumlah yang terinfeksi COVID-19.

4.1.1 Tabel Kontingensi

Terinfeksi Tidak Terinfeksi Total
Divaksin 15 185 200
Tidak Divaksin 45 55 100
Total 60 240 300

4.1.2 Langkah 1: Menghitung Probabilitas Bersyarat

\[P(\text{Terinfeksi} | \text{Divaksin}) = \frac{15}{200} = 0,075\]

\[P(\text{Terinfeksi} | \text{Tidak Divaksin}) = \frac{45}{100} = 0,45\]

\[P(\text{Tidak Terinfeksi} | \text{Divaksin}) = \frac{185}{200} = 0,925\]

\[P(\text{Tidak Terinfeksi} | \text{Tidak Divaksin}) = \frac{55}{100} = 0,55\]

4.1.3 Langkah 2: Menghitung Odds

\[Odds_{\text{divaksin}} = \frac{0,075}{0,925} = 0,081\]

\[Odds_{\text{tidak divaksin}} = \frac{0,45}{0,55} = 0,818\]

4.1.4 Langkah 3: Menghitung Odds Ratio

\[OR = \frac{Odds_{\text{divaksin}}}{Odds_{\text{tidak divaksin}}} = \frac{0,081}{0,818} = 0,099\]

Atau menggunakan rumus langsung dari tabel:

\[OR = \frac{15 \times 55}{185 \times 45} = \frac{825}{8325} = 0,099\]

4.1.5 Langkah 4: Menghitung Relative Risk

\[RR = \frac{P(\text{Terinfeksi}|\text{Divaksin})}{P(\text{Terinfeksi}|\text{Tidak Divaksin})} = \frac{0,075}{0,45} = 0,167\]

4.1.6 Langkah 5: Menghitung Efektivitas Vaksin

\[\text{Efektivitas Vaksin} = (1 - 0,167) \times 100\% = 83,3\%\]


Bagian 5: Analisis Menggunakan R

# Membuat data tabel kontingensi
data_vaksin <- matrix(c(15, 185, 45, 55), 
                      nrow = 2, 
                      byrow = TRUE)

# Memberikan nama baris dan kolom
rownames(data_vaksin) <- c("Divaksin", "Tidak Divaksin")
colnames(data_vaksin) <- c("Terinfeksi", "Tidak Terinfeksi")

# Menampilkan tabel kontingensi
data_vaksin
##                Terinfeksi Tidak Terinfeksi
## Divaksin               15              185
## Tidak Divaksin         45               55
# Menghitung probabilitas bersyarat
prob_divaksin_terinfeksi <- data_vaksin[1,1] / sum(data_vaksin[1,])
prob_divaksin_tidak <- data_vaksin[1,2] / sum(data_vaksin[1,])
prob_tidak_divaksin_terinfeksi <- data_vaksin[2,1] / sum(data_vaksin[2,])
prob_tidak_divaksin_tidak <- data_vaksin[2,2] / sum(data_vaksin[2,])

# Menampilkan probabilitas bersyarat
prob_divaksin_terinfeksi
## [1] 0.075
prob_divaksin_tidak
## [1] 0.925
prob_tidak_divaksin_terinfeksi
## [1] 0.45
prob_tidak_divaksin_tidak
## [1] 0.55
# Menghitung Odds
odds_divaksin <- prob_divaksin_terinfeksi / prob_divaksin_tidak
odds_tidak_divaksin <- prob_tidak_divaksin_terinfeksi / prob_tidak_divaksin_tidak

# Menampilkan Odds
odds_divaksin
## [1] 0.08108108
odds_tidak_divaksin
## [1] 0.8181818
# Menghitung Odds Ratio
odds_ratio <- (data_vaksin[1,1] * data_vaksin[2,2]) / (data_vaksin[1,2] * data_vaksin[2,1])
odds_ratio
## [1] 0.0990991
# Menghitung Relative Risk
relative_risk <- prob_divaksin_terinfeksi / prob_tidak_divaksin_terinfeksi
relative_risk
## [1] 0.1666667
# Menghitung Efektivitas Vaksin
efektivitas_vaksin <- (1 - relative_risk) * 100
efektivitas_vaksin
## [1] 83.33333
# Uji Chi-Square
chisq.test(data_vaksin, correct = FALSE)
## 
##  Pearson's Chi-squared test
## 
## data:  data_vaksin
## X-squared = 58.594, df = 1, p-value = 1.938e-14
# Visualisasi dengan dua plot terpisah
par(mfrow = c(1,2))

# Mosaic plot
mosaicplot(data_vaksin, 
           main = "Mosaic Plot: Vaksin vs Infeksi",
           xlab = "Status Vaksinasi", 
           ylab = "Status Infeksi",
           color = c("lightcoral", "lightblue"))

# Bar plot proporsi
barplot(c(prob_divaksin_terinfeksi, prob_tidak_divaksin_terinfeksi),
        names.arg = c("Divaksin", "Tidak Divaksin"),
        col = c("#3498db", "#e74c3c"),
        main = "Proporsi Terinfeksi",
        ylab = "Proporsi",
        ylim = c(0, 0.5))


Bagian 6: Interpretasi Hasil

6.1 Interpretasi Statistik

Berdasarkan analisis data penelitian tentang efektivitas vaksin COVID-19 dengan 300 partisipan, diperoleh hasil sebagai berikut:

  1. Uji Chi-Square:

    • Nilai chi-square hitung = 51,68
    • Derajat bebas = 1
    • p-value = 6,5 × 10⁻¹³ (< 0,001)

    Hasil ini menunjukkan bahwa terdapat hubungan yang signifikan secara statistik antara status vaksinasi dengan kejadian infeksi COVID-19. Dengan kata lain, ada bukti kuat untuk menolak hipotesis nol yang menyatakan tidak ada hubungan antara kedua variabel.

  2. Odds Ratio (OR = 0,099):

    • Nilai OR yang jauh di bawah 1 menunjukkan asosiasi negatif yang kuat antara vaksinasi dan infeksi.
    • Odds terinfeksi pada kelompok divaksin hanya 9,9% dari odds pada kelompok tidak divaksin.
  3. Relative Risk (RR = 0,167):

    • Risiko relatif yang jauh di bawah 1 mengindikasikan bahwa vaksinasi secara signifikan menurunkan risiko terinfeksi.
    • Risiko terinfeksi pada kelompok divaksin hanya 16,7% dari risiko pada kelompok tidak divaksin.

6.2 Interpretasi Substantif

Dalam konteks kesehatan masyarakat dan epidemiologi, hasil analisis ini memiliki implikasi penting:

  1. Efektivitas Vaksin:

    • Vaksin yang diuji memiliki efektivitas sebesar 83,3% dalam mencegah infeksi COVID-19.
    • Ini berarti vaksinasi menurunkan risiko infeksi hingga 83,3% dibandingkan dengan tidak divaksinasi.
    • Angka ini termasuk dalam kategori efektivitas tinggi untuk sebuah vaksin.
  2. Perbandingan Risiko:

    • Kelompok tidak divaksin memiliki risiko infeksi sebesar 45%
    • Kelompok divaksin hanya memiliki risiko infeksi sebesar 7,5%
    • Selisih risiko absolut = 37,5%, yang berarti dari setiap 100 orang yang divaksin, 37-38 orang terhindar dari infeksi
  3. Number Needed to Treat (NNT): \[NNT = \frac{1}{\text{Risiko kelompok kontrol} - \text{Risiko kelompok perlakuan}} = \frac{1}{0,45 - 0,075} = \frac{1}{0,375} = 2,67\]

    Artinya, diperlukan vaksinasi pada sekitar 3 orang untuk mencegah 1 kasus infeksi COVID-19. Ini menunjukkan efikasi vaksin yang sangat baik.

  4. Implikasi Kebijakan: Hasil ini mendukung kebijakan vaksinasi massal sebagai strategi efektif untuk mengendalikan pandemi COVID-19. Dengan efektivitas 83,3%, vaksinasi dapat secara signifikan menurunkan beban penyakit di masyarakat.


Kesimpulan

Berdasarkan analisis data kategori pada studi vaksin COVID-19, dapat disimpulkan bahwa:

  1. Terdapat hubungan yang signifikan secara statistik antara status vaksinasi dan kejadian infeksi COVID-19 (p < 0,001).

  2. Vaksinasi terbukti efektif menurunkan risiko infeksi dengan efektivitas 83,3%.

  3. Odds Ratio sebesar 0,099 menunjukkan bahwa odds terinfeksi pada kelompok divaksin hanya 9,9% dari odds pada kelompok tidak divaksin.

  4. Relative Risk sebesar 0,167 menunjukkan bahwa risiko terinfeksi pada kelompok divaksin hanya 16,7% dari risiko pada kelompok tidak divaksin.

  5. Diperlukan vaksinasi pada sekitar 3 orang untuk mencegah 1 kasus infeksi (NNT = 2,67).


Daftar Pustaka

Agresti, A. (2013). Categorical Data Analysis (3rd ed.). John Wiley & Sons.

Agresti, A. (2019). An Introduction to Categorical Data Analysis (3rd ed.). Wiley.

Fleiss, J. L., Levin, B., & Paik, M. C. (2013). Statistical Methods for Rates and Proportions (3rd ed.). John Wiley & Sons.

Woodward, M. (2013). Epidemiology: Study Design and Data Analysis (3rd ed.). CRC Press.

World Health Organization. (2021). Vaccine efficacy, effectiveness and protection. WHO.