Pendahuluan

Analisis data kategori merupakan bagian dari statistika yang digunakan untuk menganalisis data berbentuk kategori atau kelompok. Salah satu metode yang umum digunakan adalah tabel kontingensi, dalam laporan ini akan dibahas tabel kontingensi 2 × 2 yang sering digunakan untuk menganalisis hubungan antara dua variabel kategorik biner (hanya memiliki dua kategori).


1. Definisi Analisis Data Kategori

a. Pengertian Analisis Data Kategori

Analisis data kategori adalah metode statistika yang digunakan untuk menganalisis data dengan variabel berbentuk kategori atau kelompok. Variabel kategori biasanya tidak memiliki makna numerik langsung atau bukan angka yang memiliki nilai kontinu, tetapi data kategori merepresentasikan kelas atau label tertentu.

Analisis ini bertujuan untuk:

  • Mengidentifikasi Pola dan Tren
  • Menganalisis Hubungan Antar Variabel Kategori
  • Membantu dalam Pengambilan Keputusan
  • Mengembangkan Model Prediktif

b. Karakteristik Variabel Kategori

Variabel kategori memiliki beberapa karakteristik sebagai berikut:

  1. Nilai variabel berupa kategori, contoh umum dari data kategori yaitu jenis kelamin (laki-laki/perempuan)
  2. Tidak memiliki makna numerik secara langsung
  3. Biasanya disajikan dalam bentuk frekuensi atau proporsi
  4. Data kategori dapat bersifat:
    • Nominal : Tidak memiliki urutan (misalnya: jenis kelamin, agama, warna)
    • Ordinal : Memiliki urutan (misalnya: tingkat pendidikan, tingkat kepuasan pelanggan)

c. Contoh Penerapan Analisis Data Kategori dalam Penelitian

Beberapa contoh penerapan analisis data kategori dalam penelitian meliputi:

  1. Penelitian dalam ilmu kesehatan
    • Hubungan antara olahraga dan obesitas
  2. Penelitian dalam pendidikan
    • Hubungan antara metode pembelajaran dan kelulusan
  3. Penelitian sosial
    • Hubungan antara tingkat pendidikan dan status pekerjaan

2. Tabel Kontingensi

a. Definisi Tabel Kontingensi

Tabel kontingensi adalah tabel klasifikasi silang dari variabel-variabel yang bersifat kategori. Tabel kontingensi digunakan untuk menyajikan distribusi frekuensi bersama (joint distribution) dari dua atau lebih variabel kategori.

Tabel ini memungkinkan peneliti untuk melihat hubungan atau asosiasi antara variabel kategori.

b. Struktur Tabel Kontingensi

Berikut merupakan struktur tabel kontingensi 2 × 2:

Kategori 1 Kategori 2 Total
Kelompok 1 a b a+b
Kelompok 2 c d c+d
Total a+c b+d n

Contoh tabel kontingensi 2 × 2:

Obesitas Tidak Obesitas Total
Konsumsi Fast Food a b a+b
Tidak Konsumsi c d c+d
Total a+c b+d n

Contoh kasus diatas berkaitan dengan apakah olahraga berkaitan dengan risiko obesitas. ## c. Joint Distribution

Joint distribution atau peluang bersama menunjukkan peluang terjadinya dua kejadian secara bersamaan dalam suatu sel tabel kontingensi.

Secara matematis:

\[ P(X = i, Y = j) = \frac{n_{ij}}{n} \]

Contoh:

\[ P(\text{Konsumsi Fast Food dan Obesitas}) = \frac{a}{n} \]

d. Marginal Distribution

Marginal distribution atau peluang marginal adalah peluang suatu variabel tanpa memperhatikan variabel lain.

Peluang marginal baris secara matematis:

\[ P(X=i) = \frac{n_{i.}}{n} \] Peluang marginal kolom secara matematis:

\[ P(Y=j) = \frac{n_{.j}}{n} \] Contoh:

Peluang seseorang mengonsumsi fast food:

\[ P(\text{Konsumsi Fast Food}) = \frac{a+b}{n} \]

Peluang seseorang menderita obesitas:

\[ P(\text{Obesitas}) = \frac{a+c}{n} \]

e. Conditional Distribution

Conditional distribution atau peluang bersyarat adalah peluang suatu kejadian dengan syarat kejadian lain terjadi.

Secara matematis:

\[ P(Y=j \mid X=i) = \frac{n_{ij}}{n_{i.}} \] Contoh:

Peluang obesitas jika seseorang konsumsi fast food:

\[ P(\text{Obesitas}|\text{Konsumsi Fast Food}) = \frac{a}{a+b} \]


3. Ukuran Asosiasi

a. Penjelasan Ukuran Asosiasi

Ukuran asosiasi digunakan untuk mengukur kekuatan hubungan antara dua variabel kategori pada tabel kontingensi. Pada tabel 2 × 2, ukuran yang akan dibahas dalam laporan ini adalah:

  • Odds
  • Odds Ratio
  • Relative Risk

b. Rumus Matematis

Misalkan tabel kontingensi:

Outcome 1 Outcome 2
Faktor 1 a b
Faktor 2 c d

i. Odds

Odds adalah perbandingan antara peluang terjadinya suatu kejadian dengan peluang tidak terjadinya kejadian tersebut.

Secara matematis:

\[ Odds = \frac{P}{1-P} \]

Contoh pada tabel kontingensi 2 × 2 diatas:

\[ Odds_1 = \frac{a}{b} \]

\[ Odds_2 = \frac{c}{d} \]

ii. Odds Ratio

Odds Ratio adalah ukuran asosiasi yang menunjukkan perbandingan odds kejadian antar dua kelompok.

Secara matematis: \[ OR = \frac{Odds_1}{Odds_0} \] Atau dapat dituliskan juga:

\[ OR = \frac{a/b}{c/d} \]

atau

\[ OR = \frac{ad}{bc} \]

Terdapat kriteria interpretasi untuk Odds Ratio:

Nilai Odds Ratio Interpretasi
OR = 1 Tidak terdapat hubungan antara variabel faktor dan outcome
OR > 1 Faktor meningkatkan peluang terjadinya outcome
OR < 1 Faktor menurunkan peluang outcome

iii. Relative Risk

Relative Risk atau Risiko Relatif adalah ukuran yang digunakan dalam epidemiologi untuk membandingkan risiko kejadian (misal peristiwa penyakit atau kondisi tertentu) antara kelompok yang terpapar dan tidak terpapar.

Secara matematis: \[ RR = \frac{a/(a+b)}{c/(c+d)} \]

Terdapat kriteria interpretasi untuk Relative Risk sebagai berikut:

Nilai Relative Risk Interpretasi
RR = 1 Tidak terdapat hubungan antara variabel faktor dan outcome
RR > 1 Faktor meningkatkan risiko terjadinya outcome
RR < 1 Faktor bersifat protektif atau menurunkan risiko outcome

4. Contoh Perhitungan Tabel Kontingensi 2 × 2 Secara Manual

Misalkan diperoleh data kaitan olahraga dengan obesitas sebagai berikut:

Obesitas Tidak Obesitas Total
Konsumsi Fast Food 40 60 100
Tidak Konsumsi Fast Food 20 80 100

Sehingga:

\[ a = 40,\quad b = 60,\quad c = 20,\quad d = 80 \]

a. Peluang Bersyarat

Peluang obesitas pada orang yang konsumsi fast food:

\[ P(\text{Obesitas}|\text{Konsumsi Fast Food}) = \frac{40}{100} = 0.4 \]

Peluang obesitas pada orang yang tidak konsumsi fast food:

\[ P(\text{Obesitas}|\text{Tidak Olahraga}) = \frac{20}{100} = 0.2 \]

b. Odds

Odds obesitas pada orang yang konsumsi fast food:

\[ Odds_1 = \frac{40}{60} = 0.667 \]

Odds obesitas pada orang yang tidak konsumsi fast food:

\[ Odds_2 = \frac{20}{80} = 0.25 \]

c. Odds Ratio

Rumus matematis:

\[ OR = \frac{ad}{bc} \] Odds ratio pada kasus keterkaitan obesitas dan konsumsi fast food: \[ OR = \frac{40 \times 80}{60 \times 20} \]

\[ OR = \frac{3200}{1200} \]

\[ OR = 2.67 \]


5. Contoh Perhitungan Menggunakan R

# Membuat tabel kontingensi

data <- matrix(c(40,60,20,80),
               nrow = 2,
               byrow = TRUE)

colnames(data) <- c("Obesitas","Tidak_Obesitas")
rownames(data) <- c("Konsumsi_Fast_Food","Tidak_Konsumsi")

data
##                    Obesitas Tidak_Obesitas
## Konsumsi_Fast_Food       40             60
## Tidak_Konsumsi           20             80
# Menghitung Odds Ratio

(a <- data[1,1])
## [1] 40
(b <- data[1,2])
## [1] 60
(c <- data[2,1])
## [1] 20
(d <- data[2,2])
## [1] 80
OR <- (a*d)/(b*c)
OR
## [1] 2.666667
# Uji Chi-Square

chisq.test(data)
## 
##  Pearson's Chi-squared test with Yates' continuity correction
## 
## data:  data
## X-squared = 8.5952, df = 1, p-value = 0.00337

6. Interpretasi Hasil

Interpretasi Statistik

Hasil perhitungan menunjukkan bahwa nilai Odds Ratio sebesar 2.67. Nilai ini lebih besar dari 1, sehingga menunjukkan adanya hubungan positif antara konsumsi fast food dan obesitas.

Uji chi-square digunakan untuk menguji apakah hubungan tersebut signifikan secara statistik.

Jika nilai p-value < 0.05, maka hubungan antara kedua variabel dianggap signifikan.

Dan pada contoh kasus ini diperoleh nilai p-value = 0.00337, maka dapat disimpulkan bahwa hubungan antara konsumsi fast food (makanan cepat saji) dengan obesitas signifikan.

Interpretasi Substansif

Secara substansif, hasil ini menunjukkan bahwa orang yang mengonsumsi fast food atau makanan cepat saji memiliki peluang sekitar 2.67 kali lebih besar untuk mengalami obesitas dibandingkan dengan orang yang tidak mengonsumsi fast food.


Referensi

Agresti, A. (2013). Categorical Data Analysis. Wiley.