Tabel kontingensi merupakan salah satu alat penting dalam statistika yang digunakan untuk menyajikan dan menganalisis hubungan antara dua atau lebih variabel kategorik. Tabel ini menampilkan frekuensi kemunculan kombinasi kategori dari variabel-variabel tersebut dalam bentuk baris dan kolom. Dengan menggunakan tabel kontingensi, peneliti dapat melihat pola hubungan antar variabel secara lebih jelas.
Secara umum, tabel kontingensi disebut juga cross tabulation atau crosstab. Misalnya, seorang peneliti ingin mengetahui hubungan antara jenis kelamin mahasiswa dengan preferensi metode pembelajaran (online atau tatap muka). Data tersebut dapat disajikan dalam tabel kontingensi yang menunjukkan jumlah mahasiswa pada setiap kombinasi kategori.
Tabel kontingensi biasanya dinotasikan sebagai tabel berukuran ( r c ), di mana:
Jika ( n_{ij} ) menyatakan banyaknya observasi pada baris ke-( i ) dan kolom ke-( j ), maka total seluruh observasi dinotasikan sebagai:
\[\begin{equation} N = \sum_{i=1}^{r} \sum_{j=1}^{c} n_{ij} \end{equation}\]
Tabel kontingensi tidak hanya berfungsi untuk menampilkan data, tetapi juga digunakan untuk analisis statistika seperti uji independensi chi-square dan pengukuran kekuatan asosiasi antar variabel.
Misalkan dilakukan survei terhadap 100 mahasiswa mengenai jenis kelamin dan preferensi metode belajar. Hasil survei tersebut dapat disajikan sebagai berikut.
| Jenis Kelamin | Online | Tatap Muka | Total |
|---|---|---|---|
| Laki-laki | 30 | 20 | 50 |
| Perempuan | 25 | 25 | 50 |
| Total | 55 | 45 | 100 |
Pada tabel di atas:
Dari tabel tersebut kita dapat memperoleh berbagai informasi statistik seperti distribusi peluang bersama, peluang marginal, maupun peluang bersyarat.
Dalam analisis tabel kontingensi, frekuensi pada tabel dapat diubah menjadi peluang dengan membagi setiap sel dengan total observasi ( N ).
Peluang gabungan (joint probability) menunjukkan peluang dua kejadian terjadi secara bersamaan.
\[\begin{equation} P(X=i, Y=j) = \frac{n_{ij}}{N} \end{equation}\]
Sebagai contoh:
\[\begin{equation} P(\text{Laki-laki dan Online}) = \frac{30}{100} = 0.30 \end{equation}\]
Artinya, peluang seorang mahasiswa yang dipilih secara acak adalah laki-laki dan memilih pembelajaran online sebesar 0.30.
Peluang marginal diperoleh dari total baris atau total kolom.
\[\begin{equation} P(X=i) = \frac{n_{i.}}{N} \end{equation}\]
\[\begin{equation} P(Y=j) = \frac{n_{.j}}{N} \end{equation}\]
Sebagai contoh:
\[\begin{equation} P(\text{Online}) = \frac{55}{100} = 0.55 \end{equation}\]
\[\begin{equation} P(\text{Laki-laki}) = \frac{50}{100} = 0.50 \end{equation}\]
Peluang bersyarat menunjukkan peluang suatu kejadian dengan syarat kejadian lain telah terjadi.
\[\begin{equation} P(Y=j|X=i) = \frac{n_{ij}}{n_{i.}} \end{equation}\]
Contoh:
\[\begin{equation} P(\text{Online | Laki-laki}) = \frac{30}{50} = 0.60 \end{equation}\]
Artinya, jika diketahui mahasiswa tersebut laki-laki, maka peluang ia memilih pembelajaran online adalah 0.60.
Tabel kontingensi tidak hanya digunakan untuk melihat distribusi peluang tetapi juga untuk mengukur kekuatan hubungan antar variabel kategorik.
Beberapa ukuran asosiasi yang sering digunakan antara lain:
Statistik chi-square digunakan untuk menguji apakah dua variabel kategorik saling independen.
\[\begin{equation} \chi^2 = \sum_{i=1}^{r} \sum_{j=1}^{c} \frac{(O_{ij} - E_{ij})^2}{E_{ij}} \end{equation}\]
di mana:
Frekuensi harapan dihitung sebagai:
\[\begin{equation} E_{ij} = \frac{n_{i.}n_{.j}}{N} \end{equation}\]
Jika nilai ( ^2 ) besar, maka ada indikasi bahwa kedua variabel tidak independen.
Koefisien kontingensi digunakan untuk mengukur kekuatan hubungan antar variabel.
\[\begin{equation} C = \sqrt{\frac{\chi^2}{\chi^2 + N}} \end{equation}\]
Nilai ( C ) berada antara 0 dan 1. Semakin mendekati 1, semakin kuat hubungan antar variabel.
Misalkan digunakan data berikut.
| Online | Tatap Muka | Total | |
|---|---|---|---|
| Laki | 30 | 20 | 50 |
| Perempuan | 25 | 25 | 50 |
| Total | 55 | 45 | 100 |
Hitung frekuensi harapan untuk sel pertama.
\[\begin{equation} E_{11} = \frac{(50)(55)}{100} = 27.5 \end{equation}\]
Kemudian komponen chi-square:
\[\begin{equation} \frac{(30 - 27.5)^2}{27.5} = 0.227 \end{equation}\]
Perhitungan yang sama dilakukan pada seluruh sel tabel kemudian dijumlahkan untuk memperoleh nilai ( ^2 ).
Berikut contoh analisis tabel kontingensi menggunakan data simulasi dalam R.
# Simulasi data set.seed(123)
gender <- sample(c("Laki-laki","Perempuan"),100,replace=TRUE)
metode <- sample(c("Online","TatapMuka"),100,replace=TRUE)
data <- data.frame(gender,metode)
# Membuat tabel kontingensi
tab <- table(data$gender, data$metode)
tab
##
## Online TatapMuka
## Laki-laki 28 22
## Perempuan 23 27
Menghitung proporsi joint, marginal, dan conditional.
# Joint probability
prop.table(tab)
##
## Online TatapMuka
## Laki-laki 0.28 0.22
## Perempuan 0.23 0.27
# Marginal probability
prop.table(tab,1) # berdasarkan baris
##
## Online TatapMuka
## Laki-laki 0.56 0.44
## Perempuan 0.46 0.54
prop.table(tab,2) # berdasarkan kolom
##
## Online TatapMuka
## Laki-laki 0.5490196 0.4489796
## Perempuan 0.4509804 0.5510204
Uji chi-square untuk melihat hubungan antar variabel.
chisq.test(tab)
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: tab
## X-squared = 0.64026, df = 1, p-value = 0.4236
Output dari fungsi tersebut akan memberikan nilai statistik chi-square, derajat bebas, serta p-value yang digunakan untuk menentukan apakah terdapat hubungan signifikan antara kedua variabel.
Tabel kontingensi merupakan alat penting dalam analisis data kategorik. Melalui tabel ini, peneliti dapat melihat distribusi frekuensi antar kategori serta menghitung berbagai jenis peluang seperti joint, marginal, dan conditional probability. Selain itu, tabel kontingensi juga digunakan untuk menguji hubungan antar variabel menggunakan statistik chi-square dan mengukur kekuatan asosiasi menggunakan koefisien kontingensi. Dengan bantuan perangkat lunak seperti R, analisis tabel kontingensi dapat dilakukan dengan lebih cepat dan akurat.