Analisis data kategori adalah metode statistika yang digunakan untuk menganalisis data yang berbentuk kelompok atau kategori, bukan angka kontinu.
Variabel kategori punya ciri-ciri seperti berikut:
Tabel kontingensi adalah tabel yang menyusun frekuensi dari dua variabel kategori secara silang, sehingga kita dapat mempelajari hubungan antara dua variabel tersebut.
Berikut contoh data 200 orang terkait status menikah dan kerja:
| Menikah | Tidak menikah | Total | |
|---|---|---|---|
| Peerja | 60 | 40 | 100 |
| Bukan Pekerja | 20 | 80 | 100 |
| Total | 80 | 120 | 200 |
Peluang dua kejadian terjadi bersamaan:
\[P(\text{Menikah} \cap \text{Pekerja}) = \frac{60}{200} = 0.30\]
Peluang satu variabel tanpa memperhatikan variabel lain:
\[P(\text{Pekerja}) = \frac{100}{200} = 0.50\]
\[P(\text{Menikah}) = \frac{80}{200} = 0.40\]
Peluang suatu kejadian dengan syarat kejadian lain telah diketahui:
\[P(\text{Pekerja} \mid \text{Menikah}) = \frac{60}{100} = 0.60\]
\[P(\text{Bukan Pekerja} \mid \text{Menikah}) = \frac{20}{100} = 0.20\]
Terlihat bahwa peluang Orang yang menikah adalah pekerja (0.60) jauh lebih tinggi dibanding non-pekerja (0.20), mengindikasikan adanya asosiasi.
Ukuran asosiasi digunakan untuk mengukur kekuatan hubungan antara dua variabel kategori dalam tabel kontingensi.
Struktur tabel kontingensi 2x2:
| Menikah (Ya) | Menikah (Tidak) | |
|---|---|---|
| Pekerja | a | b |
| Bukan Pekerja | c | d |
Odds adalah perbandingan peluang suatu kejadian terjadi dibanding tidak terjadi.
\[\text{Odds} = \frac{p}{1-p}\]
Odds Orang yang menikah adalah pekerja:
\[\text{Odds}_{\text{Kerja}} = \frac{a}{b} = \frac{60}{40} = 1.5\]
Odds Orang yang menikah adalah nonpekerja:
\[\text{Odds}_{\text{Tidak Kerja}} = \frac{c}{d} = \frac{20}{80} = 0.25\]
Interpretasi: Diantara orang-orang yang sudah menikah, 1,5 kali lebih mungkin merupakan pekerja daripada bukan pekerja.
Odds Ratio adalah perbandingan odds antara dua kelompok.
\[OR = \frac{ad}{bc}\]
Interpretasi OR:
Relative Risk adalah perbandingan peluang kejadian antara dua kelompok secara langsung.
\[RR = \frac{a/(a+b)}{c/(c+d)}\]
Interpretasi RR:
Sebuah studi dilakukan terhadap 200 orang untuk mengetahui hubungan antara Status kerja dan Pernikahan seseorang.
| Menikah | Tidak Menikah | Total | |
|---|---|---|---|
| Pekerja | 60 | 40 | 100 |
| Bukan Pekerja | 20 | 80 | 100 |
| Total | 80 | 120 | 200 |
Keterangan:
\[P(\text{Menikah} \mid \text{Pekerja}) = \frac{a}{a+b} = \frac{60}{100} = 0.60\]
\[P(\text{Menikah} \mid \text{Bukan Pekerja}) = \frac{c}{c+d} = \frac{20}{100} = 0.20\]
\[\text{Odds}_{\text{Pekerja}} = \frac{a}{b} = \frac{60}{40} = 1.5\]
\[\text{Odds}_{\text{Bukan Pekerja}} = \frac{c}{d} = \frac{20}{80} = 0.25\]
\[OR = \frac{ad}{bc} = \frac{60 \times 80}{40 \times 20} = \frac{4800}{800} = 6\]
\[RR = \frac{a/(a+b)}{c/(c+d)} = \frac{60/100}{20/100} = \frac{0.60}{0.20} = 3\]
# Membuat matrix data
data <- matrix(c(60, 40, 20, 80),
nrow = 2,
byrow = TRUE)
# Memberi nama baris dan kolom
rownames(data) <- c("Pekerja", "Bukan Pekerja")
colnames(data) <- c("Menikah", "Tidak Menikah")
# Tampilkan tabel
data
## Menikah Tidak Menikah
## Pekerja 60 40
## Bukan Pekerja 20 80
# Ambil nilai sel tabel
a <- data[1,1]
b <- data[1,2]
c <- data[2,1]
d <- data[2,2]
# Hitung Odds Ratio
OR <- (a * d) / (b * c)
cat("Odds Ratio:", OR)
## Odds Ratio: 6
# Hitung Relative Risk
RR <- (a / (a+b)) / (c / (c+d))
cat("\nRelative Risk:", RR)
##
## Relative Risk: 3
# Melakukan uji chi-square
hasil_chi <- chisq.test(data)
hasil_chi
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: data
## X-squared = 31.688, df = 1, p-value = 1.811e-08
Berdasarkan hasil analisis diperoleh:
Odds Ratio (OR) = 6: odds orang yang menikah adalah seorang pekerja 6 kali lebih besar dibandingkan kelompok bukan pekerja.
Relative Risk (RR) = 3: peluang orang yang menikah adalah seorang pekerja 3 kali lebih besar dibandingkan kelompok bukan pekerja.
Uji Chi-Square: nilai p-value < 0.0001, lebih kecil dari \(\alpha = 0.05\), sehingga H0 ditolak. Terdapat hubungan yang signifikan secara statistik antara status kerja dan status pernikahan.
Hasil analisis menunjukkan bahwa status kerja berasosiasi kuat dengan status pernikahan seseorang. Seseorang yang bekerja memiliki peluang 3 kali lebih besar untuk terkena menikah dibandingkan dengan yang bukan pekerja (RR = 3).
Temuan ini konsisten dengan fakta umum bahwa banyak orang yang memutuskan untuk menikah ketika telah memiliki sumber penghasilan yang cukup