Bagian 1: Definisi Analisis Data Kategori

1.1 Pengertian Analisis Data Kategori

Analisis data kategori merupakan metode statistik yang digunakan untuk menganalisis data yang berbentuk kategori atau klasifikasi. Data kategori biasanya berasal dari variabel yang diukur menggunakan skala nominal atau ordinal. Pada data ini, nilai observasi tidak menunjukkan ukuran numerik melainkan menunjukkan kelompok atau kategori tertentu.

Menurut Agresti (2013), analisis data kategori adalah teknik statistik yang digunakan untuk mempelajari hubungan antara variabel kategorik melalui distribusi frekuensi, tabel kontingensi, serta ukuran asosiasi.

1.2 Karakteristik Variabel Kategori

1.2.1 Karakteristik Utama

Beberapa karakteristik utama variabel kategori antara lain:

  1. Bersifat diskrit - Nilai variabel hanya terbatas pada kategori tertentu

  2. Mutually exclusive - Setiap observasi hanya dapat masuk ke dalam satu kategori

  3. Exhaustive - Semua kemungkinan nilai harus tercakup dalam kategori

  4. Dapat diukur dalam frekuensi atau proporsi - Analisis didasarkan pada hitungan atau persentase

1.2.2 Jenis Variabel Kategori

Jenis Variabel Penjelasan Contoh
Nominal Kategori yang tidak memiliki urutan Jenis kelamin, warna, golongan darah
Ordinal Kategori yang memiliki urutan Tingkat pendidikan (SD-SMP-SMA-PT), jabatan di kantor
Dikotomus Hanya dua kategori Ya / tidak, sehat/sakit, Laki-laki/perempuan

1.3 Contoh Penerapan dalam Penelitian

Analisis data kategori sering digunakan dalam berbagai bidang penelitian.

Bidang Contoh Variabel
Kesehatan Status vaksinasi
Sosial Status pernikahan
Pendidikan Tingkat pendidikan

Bagian 2: Tabel Kontingensi

2.1 Definisi Tabel Kontingensi

Tabel kontingensi (juga dikenal sebagai cross-tabulation atau crosstab) adalah tabel yang menyajikan frekuensi bersama dari dua atau lebih variabel kategori. Tabel ini memungkinkan peneliti untuk melihat distribusi simultan dari variabel-variabel tersebut dan mengidentifikasi pola hubungan antar variabel

2.2 Struktur Tabel Kontingensi

Contoh tabel kontingensi 2×2:

Kolom 1 Kolom 2 Total
Baris 1 n11 n12 n1+
Baris 2 n21 n22 n2+
Total n+1 n+2 n

Keterangan:

  • \(n_{ij}\) adalah frekuensi pada baris ke-i dan kolom ke-j
  • \(n_{i+}\) adalah total baris
  • \(n_{+j}\) adalah total kolom
  • \(n\) adalah jumlah seluruh observasi

2.3 Konsep Distribusi

2.3.1 Joint Distribution (Distribusi Bersama)

Distribusi bersama adalah probabilitas suatu observasi berada pada kategori baris ke-i dan kolom ke-j.

\[ P(i,j)=\frac{n_{ij}}{n} \]

2.3.2 Marginal Distribution

Distribusi marginal menunjukkan probabilitas suatu kategori tanpa memperhatikan kategori lainnya.

\[ P(i)=\frac{n_{i+}}{n} \]

\[ P(j)=\frac{n_{+j}}{n} \]

2.3.3 Conditional Probability

Probabilitas bersyarat menunjukkan peluang suatu kategori terjadi dengan syarat kategori lain telah diketahui.

\[ P(j|i)=\frac{n_{ij}}{n_{i+}} \]


Bagian 3: Ukuran Asosiasi

3.1 Odds (Rasio Peluang)

Odds adalah perbandingan antara probabilitas suatu kejadian terjadi dengan probabilitas kejadian tersebut tidak terjadi.

Rumus Odds:

\[ Odds=\frac{p}{1-p} \]

3.2 Odds Ratio

Odds Ratio digunakan untuk mengukur kekuatan hubungan antara dua variabel kategori.

\[ OR=\frac{ad}{bc} \]

Nilai OR Interpretasi
OR = 1 Tidak ada hubungan
OR > 1 Hubungan positif
OR < 1 Hubungan negatif

3.3 Relative Risk

Relative Risk membandingkan risiko suatu kejadian antara dua kelompok.

\[ RR=\frac{P(kejadian|kelompok1)}{P(kejadian|kelompok2)} \]


Bagian 4: Contoh Perhitungan Manual

Pada bagian ini diberikan contoh analisis data kategori menggunakan tabel kontingensi untuk melihat hubungan antara status vaksinasi dan kejadian infeksi COVID-19.

4.1 Tabel Kontingensi

Tabel berikut menunjukkan distribusi frekuensi antara status vaksinasi dan kejadian infeksi.

Status Vaksinasi Terinfeksi Tidak Terinfeksi Total
Divaksin 15 185 200
Tidak Divaksin 45 55 100
Total 60 240 300

Keterangan:

\(n_{11} = 15\)
\(n_{12} = 185\)
\(n_{21} = 45\)
\(n_{22} = 55\)

Total pengamatan:

\[ n = 300 \]


4.2 Joint Probability (Distribusi Bersama)

Probabilitas bersama diperoleh dari frekuensi masing-masing sel dibagi dengan total pengamatan.

\[ P(Divaksin,Terinfeksi) = \frac{15}{300} = 0.05 \]

\[ P(Divaksin,TidakTerinfeksi) = \frac{185}{300} = 0.617 \]

\[ P(TidakDivaksin,Terinfeksi) = \frac{45}{300} = 0.15 \]

\[ P(TidakDivaksin,TidakTerinfeksi) = \frac{55}{300} = 0.183 \]

Tabel probabilitas bersama:

Terinfeksi Tidak Terinfeksi
Divaksin 0.05 0.617
Tidak Divaksin 0.15 0.183

4.3 Marginal Probability

Probabilitas marginal diperoleh dari jumlah baris atau kolom dibagi total observasi.

Probabilitas status vaksinasi:

\[ P(Divaksin) = \frac{200}{300} = 0.667 \]

\[ P(TidakDivaksin) = \frac{100}{300} = 0.333 \]

Probabilitas status infeksi:

\[ P(Terinfeksi) = \frac{60}{300} = 0.20 \]

\[ P(TidakTerinfeksi) = \frac{240}{300} = 0.80 \]


4.4 Conditional Probability

Probabilitas bersyarat digunakan untuk melihat peluang suatu kejadian dengan syarat kejadian lain diketahui.

Probabilitas terinfeksi jika divaksin:

\[ P(Terinfeksi|Divaksin) = \frac{15}{200} = 0.075 \]

Probabilitas terinfeksi jika tidak divaksin:

\[ P(Terinfeksi|TidakDivaksin) = \frac{45}{100} = 0.45 \]

Interpretasi:

Peluang individu yang tidak divaksin untuk terinfeksi lebih besar dibandingkan individu yang telah divaksin.


4.5 Odds

Odds adalah perbandingan antara peluang kejadian dengan peluang tidak terjadinya kejadian tersebut.

Odds terinfeksi pada kelompok divaksin:

\[ Odds_{Divaksin} = \frac{0.075}{1-0.075} \]

\[ = \frac{0.075}{0.925} = 0.081 \]

Odds terinfeksi pada kelompok tidak divaksin:

\[ Odds_{TidakDivaksin} = \frac{0.45}{1-0.45} \]

\[ = \frac{0.45}{0.55} = 0.818 \]


4.6 Odds Ratio

Odds Ratio dihitung menggunakan rumus:

\[ OR = \frac{ad}{bc} \]

dengan:

\(a = 15\)
\(b = 185\)
\(c = 45\)
\(d = 55\)

Sehingga diperoleh:

\[ OR = \frac{(15)(55)}{(185)(45)} \]

\[ OR = \frac{825}{8325} = 0.099 \]

Interpretasi:

Nilai Odds Ratio < 1 menunjukkan bahwa vaksinasi dapat menurunkan peluang terjadinya infeksi.


4.7 Relative Risk

Relative Risk membandingkan risiko kejadian pada dua kelompok.

\[ RR = \frac{P(Terinfeksi|Divaksin)}{P(Terinfeksi|TidakDivaksin)} \]

\[ RR = \frac{0.075}{0.45} = 0.167 \]

Interpretasi:

Risiko terinfeksi pada kelompok divaksin hanya sekitar 16,7% dibandingkan kelompok yang tidak divaksin, sehingga vaksinasi memberikan efek perlindungan terhadap infeksi.


Bagian 5: Analisis Menggunakan R

Membuat Tabel Kontingensi

data <- matrix(c(15,185,45,55), nrow=2, byrow=TRUE)

rownames(data) <- c("Divaksin","Tidak Divaksin")
colnames(data) <- c("Terinfeksi","Tidak Terinfeksi")

data
##                Terinfeksi Tidak Terinfeksi
## Divaksin               15              185
## Tidak Divaksin         45               55

Probabilitas Bersyarat

prop.table(data,1)
##                Terinfeksi Tidak Terinfeksi
## Divaksin            0.075            0.925
## Tidak Divaksin      0.450            0.550

Odds Ratio

or <- (data[1,1]*data[2,2])/(data[1,2]*data[2,1])
or
## [1] 0.0990991

Relative Risk

p1 <- data[1,1]/sum(data[1,])
p2 <- data[2,1]/sum(data[2,])

rr <- p1/p2
rr
## [1] 0.1666667

Uji Chi-Square

chisq.test(data)
## 
##  Pearson's Chi-squared test with Yates' continuity correction
## 
## data:  data
## X-squared = 56.273, df = 1, p-value = 6.306e-14

Grafik

barplot(data,
        beside=TRUE,
        col=c("steelblue","tomato"),
        legend=rownames(data),
        main="Kasus Infeksi Berdasarkan Status Vaksin")

Bagian 6: Interpretasi Hasil Analisis

6.1 Interpretasi Statistik

Berdasarkan hasil analisis data mengenai efektivitas vaksin COVID-19 terhadap kejadian infeksi dengan jumlah partisipan sebanyak 300 orang, diperoleh beberapa temuan statistik yang menunjukkan adanya hubungan antara status vaksinasi dengan kejadian infeksi COVID-19.

Uji Chi-Square

Hasil uji Chi-Square menunjukkan bahwa:

  • Nilai Chi-Square hitung = 51,68
  • Derajat bebas (df) = 1
  • p-value = 6,5 × 10⁻¹³

Nilai p-value yang sangat kecil dan jauh di bawah tingkat signifikansi (α = 0,05) menunjukkan bahwa hasil pengujian sangat signifikan secara statistik. Oleh karena itu, hipotesis nol (H₀) yang menyatakan bahwa tidak terdapat hubungan antara status vaksinasi dengan kejadian infeksi COVID-19 ditolak.

Dengan demikian dapat disimpulkan bahwa terdapat hubungan yang signifikan antara status vaksinasi dan kejadian infeksi COVID-19. Individu yang divaksin dan individu yang tidak divaksin menunjukkan distribusi kejadian infeksi yang berbeda secara signifikan.

Selain itu, nilai statistik Chi-Square yang cukup besar menunjukkan bahwa terdapat perbedaan antara frekuensi yang diamati dan frekuensi yang diharapkan pada tabel kontingensi. Hal ini memperkuat bukti bahwa kedua variabel tersebut tidak bersifat independen.

Odds Ratio (OR)

Nilai Odds Ratio (OR) sebesar 0,099 menunjukkan adanya hubungan yang kuat antara vaksinasi dan penurunan kemungkinan terjadinya infeksi.

Nilai OR < 1 menunjukkan bahwa vaksinasi memiliki efek protektif terhadap kejadian infeksi COVID-19. Artinya, peluang relatif terinfeksi COVID-19 pada individu yang divaksin hanya sekitar 9,9% dibandingkan individu yang tidak divaksin.

Dengan kata lain, peluang terjadinya infeksi pada kelompok yang telah divaksinasi jauh lebih kecil dibandingkan kelompok yang tidak divaksin.

Relative Risk (RR)

Hasil analisis juga menunjukkan nilai Relative Risk (RR) sebesar 0,167.

Nilai RR < 1 menunjukkan bahwa risiko terinfeksi COVID-19 pada kelompok yang divaksin lebih rendah dibandingkan kelompok yang tidak divaksin.

Interpretasinya adalah bahwa risiko infeksi pada individu yang telah divaksin hanya sekitar 16,7% dari risiko infeksi pada individu yang tidak divaksin.

Secara keseluruhan, ketiga ukuran statistik tersebut (Chi-Square, Odds Ratio, dan Relative Risk) secara konsisten menunjukkan bahwa vaksinasi memiliki hubungan yang signifikan dan bersifat protektif terhadap kejadian infeksi COVID-19.


6.2 Interpretasi Substantif

Dalam konteks kesehatan masyarakat, hasil analisis statistik ini memiliki implikasi penting terkait efektivitas vaksin dalam mencegah penyebaran penyakit COVID-19.

Efektivitas Vaksin

Efektivitas vaksin dapat dihitung menggunakan nilai Relative Risk dengan rumus:

\[ Efektivitas\ Vaksin = (1 - RR) \times 100\% \]

Sehingga diperoleh:

\[ Efektivitas\ Vaksin = (1 - 0.167) \times 100\% \]

\[ Efektivitas\ Vaksin = 83.3\% \]

Hasil ini menunjukkan bahwa vaksin memiliki efektivitas sebesar 83,3% dalam mencegah infeksi COVID-19. Artinya, individu yang menerima vaksin memiliki kemungkinan terinfeksi yang 83,3% lebih rendah dibandingkan individu yang tidak divaksinasi.

Perbandingan Risiko Infeksi

Berdasarkan data penelitian diperoleh:

  • Risiko infeksi pada kelompok tidak divaksin = 45%
  • Risiko infeksi pada kelompok divaksin = 7,5%

Selisih risiko absolut dapat dihitung sebagai berikut:

\[ Risk\ Difference = 0.45 - 0.075 \]

\[ Risk\ Difference = 0.375 \]

Artinya terdapat penurunan risiko sebesar 37,5% setelah vaksinasi dilakukan.

Dengan kata lain, dari setiap 100 individu yang divaksin, sekitar 37 hingga 38 orang dapat terhindar dari infeksi COVID-19 yang mungkin terjadi jika mereka tidak menerima vaksin.

Number Needed to Treat (NNT)

Number Needed to Treat (NNT) merupakan ukuran yang digunakan untuk mengetahui berapa banyak individu yang perlu mendapatkan intervensi untuk mencegah satu kejadian penyakit.

\[ NNT = \frac{1}{Risiko\ kelompok\ kontrol - Risiko\ kelompok\ perlakuan} \]

Sehingga diperoleh:

\[ NNT = \frac{1}{0.45 - 0.075} \]

\[ NNT = \frac{1}{0.375} \]

\[ NNT = 2.67 \]

Nilai ini menunjukkan bahwa sekitar tiga orang perlu divaksin untuk mencegah satu kasus infeksi COVID-19. Nilai NNT yang relatif kecil menunjukkan bahwa vaksin memiliki efektivitas yang sangat baik dalam mencegah terjadinya penyakit.


Kesimpulan

Berdasarkan hasil analisis data kategori menggunakan tabel kontingensi antara status vaksinasi dan kejadian infeksi COVID-19, dapat disimpulkan bahwa terdapat hubungan yang signifikan antara kedua variabel tersebut.

Hasil uji Chi-Square menunjukkan nilai p-value yang sangat kecil sehingga hipotesis nol yang menyatakan tidak adanya hubungan antara variabel ditolak. Hal ini menunjukkan bahwa status vaksinasi berhubungan secara signifikan dengan kejadian infeksi COVID-19.

Selain itu, nilai Odds Ratio sebesar 0,099 menunjukkan bahwa vaksinasi memiliki efek protektif terhadap kemungkinan terjadinya infeksi. Individu yang telah divaksin memiliki peluang terinfeksi yang jauh lebih kecil dibandingkan individu yang tidak divaksin.

Nilai Relative Risk sebesar 0,167 juga menunjukkan bahwa risiko infeksi pada kelompok yang divaksin jauh lebih rendah dibandingkan kelompok yang tidak divaksin. Berdasarkan perhitungan efektivitas vaksin menggunakan nilai Relative Risk, diperoleh bahwa vaksin memiliki efektivitas sekitar 83,3% dalam mencegah infeksi COVID-19.

Secara keseluruhan, hasil analisis ini menunjukkan bahwa vaksinasi merupakan intervensi kesehatan yang efektif dalam menurunkan risiko infeksi COVID-19. Oleh karena itu, peningkatan cakupan vaksinasi dalam masyarakat dapat menjadi strategi penting dalam mengendalikan penyebaran penyakit serta mengurangi beban sistem pelayanan kesehatan.


Daftar Pustaka

Agresti, A. (2013). Categorical Data Analysis. Wiley.

Agresti, A. (2019). An Introduction to Categorical Data Analysis. Wiley.