1 Pendahuluan

Analisis data kategori merupakan salah satu cabang penting dalam statistika inferensial yang digunakan untuk menganalisis variabel yang berbentuk kategori atau kualitatif. Variabel kategori biasanya merepresentasikan klasifikasi tertentu seperti jenis kelamin, status penyakit, kebiasaan merokok, atau tingkat pendidikan.

Dalam banyak penelitian di bidang kesehatan, ekonomi, pendidikan, dan ilmu sosial, data kategori sering digunakan untuk memahami hubungan antara dua variabel atau lebih. Salah satu alat utama yang digunakan dalam analisis data kategori adalah tabel kontingensi.

Melalui tabel kontingensi, peneliti dapat melihat distribusi frekuensi gabungan dari dua variabel kategori serta menghitung ukuran asosiasi untuk mengetahui kekuatan hubungan antara variabel tersebut.


2 Bab 1: Analisis Data Kategori

2.1 Pengertian Analisis Data Kategori

Analisis data kategori adalah metode statistik yang digunakan untuk menganalisis data yang berbentuk kategori atau kelompok. Data kategori tidak memiliki nilai numerik yang bermakna secara langsung, tetapi digunakan untuk mengklasifikasikan objek atau individu ke dalam kelompok tertentu.

Contoh variabel kategori:

  • Jenis kelamin (laki-laki atau perempuan)
  • Status penyakit (sakit atau tidak sakit)
  • Tingkat kepuasaan (tidak puas, puas, atau sangat puas)
  • Konsumsi makanan cepat saji (sering atau tidak sering)
  • Tingkat pendidikan (SD, SMP, SMA, atau Perguruan Tinggi)

Tujuan analisis ini antara lain:

  1. Mengetahui distribusi data kategori
  2. Mengetahui hubungan antar variabel kategori
  3. Mengukur kekuatan asosiasi antar variabel

2.2 Karakteristik Variabel Kategori

Beberapa karakteristik utama variabel kategori:

  1. Tidak memiliki nilai numerik intrinsik
  2. Digunakan untuk mengelompokkan atau mengklasifikasikan objek
  3. Tidak dapat dilakukan operasi matematika langsung

2.3 Jenis Variabel Kategori

2.3.1 Variabel Nominal

Variabel kategori yang tidak memiliki urutan.

Contoh:

  • jenis kelamin
  • golongan darah

2.3.2 Variabel Ordinal

Variabel kategori yang memiliki urutan tetapi jarak antar kategori tidak pasti.

Contoh:

  • tingkat pendidikan
  • tingkat kepuasan

2.4 Contoh Penerapan Analisis Data Kategori

Analisis data kategori banyak digunakan dalam berbagai bidang penelitian karena banyak variabel yang bersifat kualitatif atau berbentuk kategori. Melalui analisis ini, peneliti dapat mengetahui apakah terdapat hubungan atau asosiasi antara dua variabel kategori. Beberapa contoh penerapan analisis data kategori adalah sebagai berikut.

1. Bidang Kesehatan

Dalam bidang kesehatan, analisis data kategori sering digunakan untuk mengetahui hubungan antara faktor risiko dengan kejadian suatu penyakit. Sebagai contoh, penelitian dapat dilakukan untuk mengetahui hubungan antara kebiasaan mengonsumsi junk food dengan kejadian kolesterol tinggi pada orang dewasa. Variabel yang digunakan biasanya berupa kategori seperti “sering” dan “jarang” untuk kebiasaan konsumsi, serta “kolesterol tinggi” dan “kolesterol normal” untuk status kesehatan. Dengan menggunakan tabel kontingensi dan ukuran asosiasi seperti odds ratio atau relative risk, peneliti dapat mengetahui apakah kebiasaan tersebut berhubungan dengan peningkatan risiko kolesterol tinggi.

2. Bidang Pendidikan

Dalam bidang pendidikan, analisis data kategori dapat digunakan untuk menilai efektivitas metode pembelajaran. Misalnya, peneliti ingin mengetahui hubungan antara metode belajar yang digunakan siswa dengan tingkat kelulusan dalam suatu mata pelajaran. Metode belajar dapat dikategorikan menjadi beberapa kelompok seperti belajar mandiri, belajar kelompok, atau mengikuti bimbingan belajar. Sementara itu, hasil belajar dapat dikategorikan menjadi lulus dan tidak lulus. Melalui analisis data kategori, peneliti dapat mengetahui apakah terdapat hubungan antara metode belajar tertentu dengan keberhasilan siswa dalam mencapai kelulusan.

3. Bidang Sosial

Dalam bidang sosial, analisis data kategori juga banyak digunakan untuk memahami fenomena sosial di masyarakat. Salah satu contohnya adalah penelitian mengenai hubungan antara tingkat pendidikan dengan status pekerjaan seseorang. Tingkat pendidikan dapat dikategorikan menjadi SMA, Diploma, dan Sarjana, sedangkan status pekerjaan dapat dikategorikan menjadi bekerja atau tidak bekerja. Dengan menggunakan analisis data kategori, peneliti dapat melihat apakah tingkat pendidikan memiliki hubungan dengan peluang seseorang untuk mendapatkan pekerjaan.

3 Bab 2: Tabel Kontingensi

3.1 Definisi Tabel Kontingensi

Tabel kontingensi adalah tabel yang menyajikan frekuensi gabungan dari dua variabel kategori.

Tabel ini sangat penting dalam analisis data kategori karena dapat digunakan untuk:

  • Melihat pola hubungan antar variabel
  • Menghitung probabilitas
  • Menghitung ukuran asosiasi

3.2 Struktur Tabel Kontingensi 2 × 2

Struktur umum tabel kontingensi 2 × 2 adalah sebagai berikut:

Outcome (+) Outcome (-) Total
Exposure (+) a b a+b
Exposure (-) c d c+d
Total a+c b+d n

Total pengamatan:

\[ n = a + b + c + d \]

3.3 Joint Distribution

Joint distribution merupakan peluang gabungan dari dua variabel kategori.

Misalnya:

\[ P(Exposure+, Outcome+) = \frac{a}{n} \]

\[ P(Exposure+, Outcome-) = \frac{b}{n} \]

\[ P(Exposure-, Outcome+) = \frac{c}{n} \]

\[ P(Exposure-, Outcome-) = \frac{d}{n} \]

3.4 Marginal Distribution

Marginal distribution merupakan peluang dari satu variabel tanpa memperhatikan variabel lainnya.

Peluang exposure:

\[ P(Exposure+) = \frac{a+b}{n} \] \[ P(Exposure-) = \frac{c+d}{n} \]

Peluang outcome: \[ P(Outcome+) = \frac{a+c}{n} \]

\[ P(Outcome-) = \frac{b+d}{n} \]

3.5 Conditional Probability

Conditional probability adalah peluang terjadinya suatu kejadian dengan syarat bahwa kejadian lain telah terjadi terlebih dahulu. Dalam konteks tabel kontingensi, peluang bersyarat dapat digunakan untuk mengetahui peluang suatu outcome pada kelompok dengan kondisi exposure tertentu.

Peluang terjadinya outcome positif pada kelompok dengan exposure positif adalah:

\[ P(Outcome^+ \mid Exposure^+) = \frac{a}{a+b} \]

Peluang terjadinya outcome negatif pada kelompok dengan exposure positif adalah:

\[ P(Outcome^- \mid Exposure^+) = \frac{b}{a+b} \]

Peluang terjadinya outcome positif pada kelompok dengan exposure negatif adalah:

\[ P(Outcome^+ \mid Exposure^-) = \frac{c}{c+d} \]

Peluang terjadinya outcome negatif pada kelompok dengan exposure negatif adalah:

\[ P(Outcome^- \mid Exposure^-) = \frac{d}{c+d} \]

Dengan demikian, conditional probability memberikan informasi mengenai kemungkinan terjadinya suatu outcome pada kelompok dengan kondisi exposure tertentu.

4 Bab 3: Ukuran Asosiasi

4.1 Odds

Odds adalah perbandingan antara peluang suatu kejadian terjadi dengan peluang kejadian tersebut tidak terjadi. Dalam konteks tabel kontingensi, odds dapat dihitung untuk kelompok dengan exposure dan tanpa exposure.

Odds pada kelompok exposure positif adalah:

\[ Odds_1 = \frac{P_1}{1-P_1} \]

dengan

\[ P_1 = P(Outcome^+ \mid Exposure^+) = \frac{a}{a+b} \]

Sehingga diperoleh:

\[ Odds_1 = \frac{a}{b} \]

Odds pada kelompok exposure negatif adalah:

\[ Odds_0 = \frac{P_0}{1-P_0} \]

dengan

\[ P_0 = P(Outcome^+ \mid Exposure^-) = \frac{c}{c+d} \]

Sehingga diperoleh:

\[ Odds_0 = \frac{c}{d} \]

4.2 Odds Ratio

Odds Ratio merupakan rasio antara odds pada kelompok exposure dan kelompok non-exposure. Ukuran ini sering digunakan untuk mengukur kekuatan hubungan antara dua variabel kategori.

\[ OR = \frac{Odds_1}{Odds_0} \]

Substitusi nilai odds menghasilkan:

\[ OR = \frac{a/b}{c/d} \]

yang dapat disederhanakan menjadi:

\[ OR = \frac{ad}{bc} \]

Interpretasi nilai Odds Ratio adalah sebagai berikut:

  • OR = 1 → tidak terdapat hubungan antara exposure dan outcome
  • OR > 1exposure meningkatkan peluang terjadinya outcome
  • OR < 1exposure bersifat protektif terhadap outcome

4.3 Relative Risk

Relative Risk merupakan perbandingan antara peluang terjadinya outcome pada kelompok exposure dan kelompok non-exposure.

\[ RR = \frac{P_1}{P_0} \]

dengan

\[ P_1 = P(Outcome^+ \mid Exposure^+) = \frac{a}{a+b} \]

dan

\[ P_0 = P(Outcome^+ \mid Exposure^-) = \frac{c}{c+d} \]

Nilai Relative Risk menunjukkan seberapa besar risiko terjadinya outcome pada kelompok dengan exposure dibandingkan dengan kelompok tanpa exposure.

5 Bab 4: Contoh Perhitungan Manual

5.1 Kasus:

Sebuah penelitian dilakukan untuk mengetahui hubungan antara frekuensi konsumsi fast food dengan kejadian kolesterol tinggi pada orang dewasa. Sebanyak 200 responden diamati dan diperoleh data sebagai berikut.

Konsumsi Fast Food Kolesterol Tinggi Kolesterol Normal Total
Sering 48 52 100
Jarang 25 75 100
Total 73 127 200

Sehingga diperoleh notasi: \[ a = 48 \]

\[ b = 52 \]

\[ c = 25 \]

\[ d = 75 \]

\[ n = a + b + c + d = 200 \]

5.2 Menghitung Peluang Bersyarat

Peluang kolesterol tinggi pada kelompok yang sering mengonsumsi junk food:

\[ P_1 = \frac{a}{a+b} \]

\[ P_1 = \frac{40}{100} = 0.4 \]

Peluang kolesterol tinggi pada kelompok yang jarang mengonsumsi junk food:

\[ P_0 = \frac{c}{c+d} \]

\[ P_0 = \frac{20}{100} = 0.2 \]

5.3 Menghitung Odds

Odds kolesterol tinggi pada kelompok yang sering mengonsumsi junk food:

\[ Odds_1 = \frac{a}{b} \]

\[ Odds_1 = \frac{40}{60} = 0.667 \]

Odds kolesterol tinggi pada kelompok yang jarang mengonsumsi junk food:

\[ Odds_0 = \frac{c}{d} \]

\[ Odds_0 = \frac{20}{80} = 0.25 \]

5.4 Menghitung Odds Ratio

Odds Ratio dihitung dengan rumus: \[ OR = \frac{ad}{bc} \]

Substitusi nilai: \[ OR = \frac{(48)(75)}{(52)(25)} \]

\[ OR = \frac{3600}{1300} \]

\[ OR = 2.77 \]

Interpretasi: Odds seseorang mengalami kolesterol tinggi pada kelompok yang sering mengonsumsi junk food sekitar 2.77 kali lebih besar dibandingkan kelompok yang jarang mengonsumsi junk food. —

6 Bab 5: Analisis Menggunakan R

6.1 Membuat Tabel Kontingensi

data <- matrix(c(48,52,25,75),
               nrow=2,
               byrow=TRUE)

rownames(data) <- c("Sering Junk Food","Jarang Junk Food")
colnames(data) <- c("Kolesterol Tinggi","Kolesterol Normal")

data
##                  Kolesterol Tinggi Kolesterol Normal
## Sering Junk Food                48                52
## Jarang Junk Food                25                75

6.2 Menghitung Odds Ratio

a <- 48
b <- 52
c <- 25
d <- 75

OR <- (a*d)/(b*c)
OR
## [1] 2.769231

6.3 Uji Chi-Square

chisq.test(data)
## 
##  Pearson's Chi-squared test with Yates' continuity correction
## 
## data:  data
## X-squared = 10.441, df = 1, p-value = 0.001232

7 Bab 6: Interpretasi Hasil

7.1 Interpretasi Statistik Nilai Odds Ratio yang diperoleh adalah:

\[ OR = 2.67 \]

Hal ini menunjukkan bahwa odds kejadian kolesterol tinggi pada individu yang sering mengonsumsi junk food sekitar 2.77 kali lebih besar dibandingkan individu yang jarang mengonsumsi junk food.

Jika hasil uji chi-square menghasilkan nilai p-value < 0.05, maka dapat disimpulkan bahwa terdapat hubungan yang signifikan secara statistik antara konsumsi junk food dan kejadian kolesterol tinggi.

7.2 Interpretasi Substantif

Dalam konteks kesehatan masyarakat, hasil ini menunjukkan bahwa konsumsi junk food yang sering berhubungan dengan peningkatan risiko kolesterol tinggi. Oleh karena itu, pengurangan konsumsi makanan tinggi lemak jenuh dan makanan cepat saji dapat menjadi salah satu langkah pencegahan untuk menurunkan risiko kolesterol tinggi di masyarakat.

8 Kesimpulan

Tabel kontingensi merupakan alat penting dalam analisis data kategori untuk mempelajari hubungan antara dua variabel kategorikal. Dalam contoh kasus ini, diperoleh bahwa konsumsi junk food memiliki hubungan dengan kejadian kolesterol tinggi. Melalui ukuran asosiasi seperti odds dan odds ratio, peneliti dapat mengetahui seberapa besar kekuatan hubungan antara faktor risiko dan suatu kejadian.