Analisis data kategori merupakan bagian dari statistika yang digunakan untuk menganalisis data berbentuk kategori atau kelompok. Salah satu metode yang umum digunakan adalah tabel kontingensi, dalam laporan ini akan dibahas tabel kontingensi 2 × 2 yang sering digunakan untuk menganalisis hubungan antara dua variabel kategorik biner (hanya memiliki dua kategori).
Analisis data kategori adalah metode statistika yang digunakan untuk menganalisis data dengan variabel berbentuk kategori atau kelompok. Variabel kategori biasanya tidak memiliki makna numerik langsung atau bukan angka yang memiliki nilai kontinu, tetapi data kategori merepresentasikan kelas atau label tertentu.
Analisis ini bertujuan untuk:
Variabel kategori memiliki beberapa karakteristik sebagai berikut:
Beberapa contoh penerapan analisis data kategori dalam penelitian meliputi:
Tabel kontingensi adalah tabel klasifikasi silang dari variabel-variabel yang bersifat kategori. Tabel kontingensi digunakan untuk menyajikan distribusi frekuensi bersama (joint distribution) dari dua atau lebih variabel kategori.
Tabel ini memungkinkan peneliti untuk melihat hubungan atau asosiasi antara variabel kategori.
Berikut merupakan struktur tabel kontingensi 2 × 2:
| Kategori 1 | Kategori 2 | Total | |
|---|---|---|---|
| Kelompok 1 | a | b | a+b |
| Kelompok 2 | c | d | c+d |
| Total | a+c | b+d | n |
Contoh tabel kontingensi 2 × 2:
| Obesitas | Tidak Obesitas | Total | |
|---|---|---|---|
| Konsumsi Fast Food | a | b | a+b |
| Tidak Konsumsi | c | d | c+d |
| Total | a+c | b+d | n |
Contoh kasus diatas berkaitan dengan apakah olahraga berkaitan dengan risiko obesitas. ## c. Joint Distribution
Joint distribution atau peluang bersama menunjukkan peluang terjadinya dua kejadian secara bersamaan dalam suatu sel tabel kontingensi.
Secara matematis:
\[ P(X = i, Y = j) = \frac{n_{ij}}{n} \]
Contoh:
\[ P(\text{Konsumsi Fast Food dan Obesitas}) = \frac{a}{n} \]
Marginal distribution atau peluang marginal adalah peluang suatu variabel tanpa memperhatikan variabel lain.
Peluang marginal baris secara matematis:
\[ P(X=i) = \frac{n_{i.}}{n} \] Peluang marginal kolom secara matematis:
\[ P(Y=j) = \frac{n_{.j}}{n} \] Contoh:
Peluang seseorang mengonsumsi fast food:
\[ P(\text{Konsumsi Fast Food}) = \frac{a+b}{n} \]
Peluang seseorang menderita obesitas:
\[ P(\text{Obesitas}) = \frac{a+c}{n} \]
Conditional distribution atau peluang bersyarat adalah peluang suatu kejadian dengan syarat kejadian lain terjadi.
Secara matematis:
\[ P(Y=j \mid X=i) = \frac{n_{ij}}{n_{i.}} \] Contoh:
Peluang obesitas jika seseorang konsumsi fast food:
\[ P(\text{Obesitas}|\text{Konsumsi Fast Food}) = \frac{a}{a+b} \]
Ukuran asosiasi digunakan untuk mengukur kekuatan hubungan antara dua variabel kategori pada tabel kontingensi. Pada tabel 2 × 2, ukuran yang akan dibahas dalam laporan ini adalah:
Misalkan tabel kontingensi:
| Outcome 1 | Outcome 2 | |
|---|---|---|
| Faktor 1 | a | b |
| Faktor 2 | c | d |
Odds adalah perbandingan antara peluang terjadinya suatu kejadian dengan peluang tidak terjadinya kejadian tersebut.
Secara matematis:
\[ Odds = \frac{P}{1-P} \]
Contoh pada tabel kontingensi 2 × 2 diatas:
\[ Odds_1 = \frac{a}{b} \]
\[ Odds_2 = \frac{c}{d} \]
Odds Ratio adalah ukuran asosiasi yang menunjukkan perbandingan odds kejadian antar dua kelompok.
Secara matematis: \[ OR = \frac{Odds_1}{Odds_0} \] Atau dapat dituliskan juga:
\[ OR = \frac{a/b}{c/d} \]
atau
\[ OR = \frac{ad}{bc} \]
Terdapat kriteria interpretasi untuk Odds Ratio:
| Nilai Odds Ratio | Interpretasi |
|---|---|
| OR = 1 | Tidak terdapat hubungan antara variabel faktor dan outcome |
| OR > 1 | Faktor meningkatkan peluang terjadinya outcome |
| OR < 1 | Faktor menurunkan peluang outcome |
Relative Risk atau Risiko Relatif adalah ukuran yang digunakan dalam epidemiologi untuk membandingkan risiko kejadian (misal peristiwa penyakit atau kondisi tertentu) antara kelompok yang terpapar dan tidak terpapar.
Secara matematis: \[ RR = \frac{a/(a+b)}{c/(c+d)} \]
Terdapat kriteria interpretasi untuk Relative Risk sebagai berikut:
| Nilai Relative Risk | Interpretasi |
|---|---|
| RR = 1 | Tidak terdapat hubungan antara variabel faktor dan outcome |
| RR > 1 | Faktor meningkatkan risiko terjadinya outcome |
| RR < 1 | Faktor bersifat protektif atau menurunkan risiko outcome |
Misalkan diperoleh data kaitan olahraga dengan obesitas sebagai berikut:
| Obesitas | Tidak Obesitas | Total | |
|---|---|---|---|
| Konsumsi Fast Food | 40 | 60 | 100 |
| Tidak Konsumsi Fast Food | 20 | 80 | 100 |
Sehingga:
\[ a = 40,\quad b = 60,\quad c = 20,\quad d = 80 \]
Peluang obesitas pada orang yang konsumsi fast food:
\[ P(\text{Obesitas}|\text{Konsumsi Fast Food}) = \frac{40}{100} = 0.4 \]
Peluang obesitas pada orang yang tidak konsumsi fast food:
\[ P(\text{Obesitas}|\text{Tidak Olahraga}) = \frac{20}{100} = 0.2 \]
Odds obesitas pada orang yang konsumsi fast food:
\[ Odds_1 = \frac{40}{60} = 0.667 \]
Odds obesitas pada orang yang tidak konsumsi fast food:
\[ Odds_2 = \frac{20}{80} = 0.25 \]
Rumus matematis:
\[ OR = \frac{ad}{bc} \] Odds ratio pada kasus keterkaitan obesitas dan konsumsi fast food: \[ OR = \frac{40 \times 80}{60 \times 20} \]
\[ OR = \frac{3200}{1200} \]
\[ OR = 2.67 \]
# Membuat tabel kontingensi
data <- matrix(c(40,60,20,80),
nrow = 2,
byrow = TRUE)
colnames(data) <- c("Obesitas","Tidak_Obesitas")
rownames(data) <- c("Konsumsi_Fast_Food","Tidak_Konsumsi")
data## Obesitas Tidak_Obesitas
## Konsumsi_Fast_Food 40 60
## Tidak_Konsumsi 20 80
## [1] 40
## [1] 60
## [1] 20
## [1] 80
## [1] 2.666667
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: data
## X-squared = 8.5952, df = 1, p-value = 0.00337
Hasil perhitungan menunjukkan bahwa nilai Odds Ratio sebesar 2.67. Nilai ini lebih besar dari 1, sehingga menunjukkan adanya hubungan positif antara konsumsi fast food dan obesitas.
Uji chi-square digunakan untuk menguji apakah hubungan tersebut signifikan secara statistik.
Jika nilai p-value < 0.05, maka hubungan antara kedua variabel dianggap signifikan.
Dan pada contoh kasus ini diperoleh nilai p-value = 0.00337, maka dapat disimpulkan bahwa hubungan antara konsumsi fast food (makanan cepat saji) dengan obesitas signifikan.
Secara substansif, hasil ini menunjukkan bahwa orang yang mengonsumsi fast food atau makanan cepat saji memiliki peluang sekitar 2.67 kali lebih besar untuk mengalami obesitas dibandingkan dengan orang yang tidak mengonsumsi fast food.
Agresti, A. (2013). Categorical Data Analysis. Wiley.