Tabel kontingensi merupakan tabel yang digunakan untuk menyajikan distribusi frekuensi dari dua atau lebih variabel kategorik secara bersamaan. Tabel ini memungkinkan peneliti untuk melihat hubungan atau keterkaitan antara variabel-variabel tersebut. Dalam statistika, tabel kontingensi sering digunakan dalam analisis data kategorik karena dapat menampilkan jumlah observasi untuk setiap kombinasi kategori dari variabel yang dianalisis.
Secara umum, tabel kontingensi disusun dalam bentuk baris dan kolom. Baris biasanya merepresentasikan kategori dari satu variabel, sedangkan kolom merepresentasikan kategori dari variabel lainnya. Nilai yang terdapat pada setiap sel tabel merupakan jumlah observasi yang termasuk dalam kombinasi kategori tersebut.
Tabel kontingensi banyak digunakan dalam berbagai bidang penelitian seperti kesehatan, ekonomi, pendidikan, dan ilmu sosial. Misalnya, dalam penelitian kesehatan, tabel kontingensi dapat digunakan untuk melihat hubungan antara kebiasaan merokok dan kejadian penyakit tertentu. Dengan menggunakan tabel ini, peneliti dapat mengetahui apakah terdapat indikasi hubungan antara kedua variabel tersebut.
Selain itu, tabel kontingensi juga menjadi dasar bagi berbagai metode analisis statistika seperti uji chi-square, perhitungan odds ratio, serta berbagai ukuran asosiasi lainnya. Oleh karena itu, pemahaman mengenai tabel kontingensi menjadi hal yang penting dalam analisis data kategorik.
Sebagai contoh sederhana, misalkan dilakukan survei terhadap 200 mahasiswa mengenai jenis kelamin dan olahraga favorit mereka. Variabel pertama adalah jenis kelamin dengan kategori “Laki-laki” dan “Perempuan”, sedangkan variabel kedua adalah olahraga favorit dengan kategori “Basket” dan “Sepak Bola”.
Berikut adalah contoh tabel kontingensi 2x2:
| Basket | Sepak Bola | Total | |
|---|---|---|---|
| Laki-laki | 40 | 60 | 100 |
| Perempuan | 50 | 50 | 100 |
| Total | 90 | 110 | 200 |
Tabel tersebut menunjukkan jumlah mahasiswa untuk setiap kombinasi kategori. Misalnya, terdapat 40 mahasiswa laki-laki yang menyukai basket dan 60 mahasiswa laki-laki yang menyukai sepak bola.
Contoh ini menunjukkan bagaimana tabel kontingensi dapat memberikan gambaran awal mengenai distribusi data serta potensi hubungan antara variabel yang diteliti.
Dalam analisis tabel kontingensi, distribusi peluang dapat dihitung berdasarkan frekuensi yang terdapat pada tabel. Tiga jenis distribusi peluang yang sering digunakan adalah distribusi joint, marginal, dan conditional.
Distribusi joint menunjukkan peluang terjadinya dua kejadian secara bersamaan. Jika \(n_{ij}\) merupakan frekuensi pada baris ke-i dan kolom ke-j, serta \(n\) adalah total observasi, maka peluang joint dapat dihitung sebagai:
\[ P(X=i, Y=j) = \frac{n_{ij}}{n} \]
Distribusi marginal merupakan peluang dari satu variabel tanpa memperhatikan variabel lainnya. Peluang marginal untuk variabel \(X\) dapat dihitung dengan menjumlahkan seluruh peluang joint pada baris yang sama.
\[ P(X=i) = \sum_{j} P(X=i, Y=j) \]
Demikian pula untuk variabel \(Y\):
\[ P(Y=j) = \sum_{i} P(X=i, Y=j) \]
Distribusi conditional menunjukkan peluang suatu kejadian dengan syarat kejadian lain telah terjadi. Misalnya peluang \(Y=j\) dengan syarat \(X=i\) adalah:
\[ P(Y=j|X=i) = \frac{P(X=i, Y=j)}{P(X=i)} \]
Distribusi conditional sering digunakan untuk melihat bagaimana distribusi suatu variabel berubah ketika kondisi tertentu dipenuhi.
Selain melihat distribusi peluang, hubungan antara dua variabel kategorik juga dapat diukur menggunakan ukuran asosiasi. Untuk tabel kontingensi 2x2, salah satu ukuran asosiasi yang sering digunakan adalah Odds Ratio.
Misalkan tabel kontingensi dinyatakan sebagai berikut:
| Y=1 | Y=0 | |
|---|---|---|
| X=1 | a | b |
| X=0 | c | d |
Odds untuk kejadian \(Y=1\) pada kelompok \(X=1\) adalah:
\[ Odds_1 = \frac{a}{b} \]
Sedangkan odds pada kelompok \(X=0\) adalah:
\[ Odds_0 = \frac{c}{d} \]
Odds Ratio (OR) kemudian dihitung sebagai:
\[ OR = \frac{a/b}{c/d} = \frac{ad}{bc} \]
Nilai OR lebih dari 1 menunjukkan adanya hubungan positif antara kedua variabel, sedangkan nilai kurang dari 1 menunjukkan hubungan negatif.
Selain odds ratio, ukuran asosiasi lain yang sering digunakan adalah koefisien Phi dan Cramer’s V, yang juga digunakan untuk mengukur kekuatan hubungan antara variabel kategorik.
Berikut contoh simulasi data menggunakan R.
set.seed(123)
gender <- sample(c("Male","Female"), 200, replace = TRUE)
sport <- sample(c("Basketball","Football"), 200, replace = TRUE)
data_sim <- data.frame(gender, sport)
head(data_sim)
## gender sport
## 1 Male Football
## 2 Male Football
## 3 Male Football
## 4 Female Basketball
## 5 Male Football
## 6 Female Football