1 Pendahuluan

Dalam berbagai bidang penelitian seperti kesehatan, ekonomi, dan ilmu sosial, sering ditemukan data yang berbentuk kategori (categorical data). Data kategori merupakan data yang menggambarkan kelompok atau klasifikasi tertentu, misalnya jenis kelamin, status penyakit, kebiasaan merokok, atau tingkat pendidikan.

Salah satu metode utama dalam menganalisis data kategori adalah analisis tabel kontingensi. Tabel kontingensi digunakan untuk mempelajari hubungan antara dua atau lebih variabel kategori dengan melihat distribusi frekuensi dari setiap kombinasi kategori.

Melalui tabel kontingensi kita dapat menghitung berbagai ukuran asosiasi yang menggambarkan kekuatan hubungan antar variabel kategori.

2 1 Definisi Analisis Data Kategori

2.1 1.1 Pengertian

Analisis data kategori adalah metode statistika yang digunakan untuk menganalisis data yang berbentuk kategori atau klasifikasi. Data ini biasanya tidak berupa angka kontinu, tetapi berupa label atau kelompok.

Contoh variabel kategori:

jenis kelamin (laki-laki / perempuan)
status merokok (merokok / tidak merokok)
status penyakit (sakit / sehat)

Menurut Agresti (2013), analisis data kategori digunakan untuk memahami hubungan antar variabel kategori melalui distribusi frekuensi dan probabilitas.

2.2 1.2 Karakteristik Variabel Kategori

Beberapa karakteristik variabel kategori adalah:

Nilai variabel berupa kategori atau label
Tidak memiliki makna numerik secara langsung
Biasanya dianalisis menggunakan frekuensi atau proporsi
Hubungan antar variabel sering dianalisis menggunakan tabel kontingensi

2.3 1.3 Contoh Penerapan

Analisis data kategori banyak digunakan dalam berbagai penelitian, misalnya:

hubungan merokok dengan kanker paru
hubungan vaksinasi dengan infeksi penyakit
hubungan olahraga dengan penyakit jantung

3 2 Tabel Kontingensi

3.1 2.1 Definisi

Tabel kontingensi adalah tabel yang digunakan untuk menampilkan frekuensi gabungan dari dua atau lebih variabel kategori.

Bentuk paling sederhana adalah tabel kontingensi 2×2, yaitu tabel dengan dua baris dan dua kolom.

3.2 2.2 Struktur Tabel Kontingensi

	Penyakit	Tidak Penyakit	Total
Merokok	a	b	a+b
Tidak Merokok	c	d	c+d
Total	a+c	b+d	n

Total keseluruhan data:

\[ n = a+b+c+d \]

3.3 2.3 Joint Distribution

Joint distribution adalah probabilitas dua kejadian terjadi secara bersamaan.

\[ P(A_i,B_j)=\frac{n_{ij}}{n} \]

Contoh:

\[ P(Merokok, Penyakit)=\frac{a}{n} \]

3.4 2.4 Marginal Distribution

Marginal distribution adalah probabilitas suatu kejadian tanpa memperhatikan variabel lain.

Probabilitas marginal baris:

\[ P(A_i)=\frac{n_{i.}}{n} \]

Probabilitas marginal kolom:

\[ P(B_j)=\frac{n_{.j}}{n} \]

3.5 2.5 Conditional Probability

Conditional probability adalah probabilitas suatu kejadian jika diketahui kejadian lain telah terjadi.

\[ P(B_j|A_i)=\frac{n_{ij}}{n_{i.}} \]

Contoh:

\[ P(Penyakit | Merokok)=\frac{a}{a+b} \]

4 3 Ukuran Asosiasi

Ukuran asosiasi digunakan untuk mengetahui seberapa kuat hubungan antara dua variabel kategori.

4.1 3.1 Odds

Odds adalah perbandingan antara peluang kejadian dan peluang tidak terjadi.

\[ Odds = \frac{P}{1-P} \]

Dalam tabel kontingensi:

\[ Odds = \frac{a}{b} \]

4.2 3.2 Odds Ratio

Odds Ratio membandingkan odds antara dua kelompok.

\[ OR = \frac{ad}{bc} \]

Interpretasi:

OR > 1 → hubungan positif
OR < 1 → hubungan negatif
OR = 1 → tidak ada hubungan

4.3 3.3 Relative Risk

Relative Risk mengukur perbandingan risiko antara dua kelompok.

\[ RR=\frac{a/(a+b)}{c/(c+d)} \]

Interpretasi:

RR > 1 → kelompok pertama memiliki risiko lebih tinggi
RR < 1 → kelompok kedua memiliki risiko lebih tinggi

5 4 Contoh Perhitungan Manual

Misalkan dilakukan penelitian tentang hubungan merokok dengan kanker paru.

Data yang diperoleh:

	Kanker	Tidak Kanker
Merokok	60	40
Tidak Merokok	20	80

5.1 4.1 Peluang Bersyarat

Peluang kanker pada perokok:

\[ P(Kanker|Merokok)=\frac{60}{60+40}=0.6 \]

Peluang kanker pada tidak merokok:

\[ P(Kanker|Tidak Merokok)=\frac{20}{20+80}=0.2 \]

5.2 4.2 Odds

Odds kanker pada perokok:

\[ Odds=\frac{60}{40}=1.5 \]

Odds kanker pada tidak merokok:

\[ Odds=\frac{20}{80}=0.25 \]

5.3 4.3 Odds Ratio

\[ OR=\frac{60\times80}{40\times20} \]

\[ OR=6 \]

Artinya peluang kanker paru pada perokok sekitar 6 kali lebih besar dibandingkan bukan perokok.

6 5 Analisis Menggunakan R

6.1 Membuat Tabel Kontingensi

data <- matrix(c(60,40,20,80), nrow=2, byrow=TRUE)

rownames(data) <- c("Merokok","Tidak_Merokok")
colnames(data) <- c("Kanker","Tidak_Kanker")

data

##               Kanker Tidak_Kanker
## Merokok           60           40
## Tidak_Merokok     20           80

Analisis Data Kategori: Tabel Kontingensi 2×2

Nana Puspita Huwaina

2026-03-09