Inferensi Tabel Kontingensi Dua Arah

1. Pendahuluan

Analisis komprehensif ini bertujuan untuk mengevaluasi signifikansi dan kekuatan asosiasi antarvariabel kategorik melalui estimasi proporsi, perhitungan interval kepercayaan untuk ukuran risiko seperti Risk Difference, Relative Risk, dan Odds Ratio, serta komparasi berbagai metode pengujian hipotesis yang mencakup uji beda dua proporsi, independensi Chi-Square, Likelihood Ratio, dan Fisher Exact Test. Seluruh kerangka analitik tersebut diaplikasikan secara terstruktur menggunakan perangkat lunak R untuk membedah dua studi kasus utama secara substantif, yaitu evaluasi epidemiologis mengenai hubungan antara kebiasaan merokok dan insiden kanker paru pada tabel 2x2, serta analisis sosiopolitik mengenai dependensi antara gender dan preferensi partai politik melalui penghitungan frekuensi harapan, evaluasi residual Pearson, dan partisi uji Chi-Square pada tabel 2x3.

2. Kasus 1: HUbungan Status Merokok dan Kanker Paru

2.1 Penyusunan Tabel KOntingensi 2x2

Data kasus ini menjelaskan hubungan antara kebiasaan merokok dan terjaidnya penyakit kanker paru.

# Memasukan data dan total margin
kanker_data <- matrix (c(688, 650, 21, 59), nrow = 2, byrow = TRUE,
                       dimnames=list("Status"=c("Smoker", "Non Smoker"),"Kanker Paru"=c("Cancer(+)","Control(-)")))

addmargins(kanker_data)

##             Kanker Paru
## Status       Cancer(+) Control(-)  Sum
##   Smoker           688        650 1338
##   Non Smoker        21         59   80
##   Sum              709        709 1418

2.2 Estimasi Titik dan Interval Kepercayaan

Akan dihitung proporsi kejadian kanker paru pada kedua kelompok, dilanjutkan dengan perhitungan Risk Difference (RD), Relative Risk (RR), dan Odds Ratio (OR) dengan interval kepercayaan sebesar 95%.

# Estimasi Proporsi (menggunakan ejaan persis sesuai tabel)
p_smoker <- kanker_data["Smoker", "Cancer(+)"] / sum(kanker_data["Smoker", ])
p_nonsmoker <- kanker_data["Non Smoker", "Cancer(+)"] / sum(kanker_data["Non Smoker", ])

cat("Proporsi kanker paru pada Smoker:", round(p_smoker, 4), "\n")

## Proporsi kanker paru pada Smoker: 0.5142

cat("Proporsi kanker paru pada Non Smoker:", round(p_nonsmoker, 4), "\n")

## Proporsi kanker paru pada Non Smoker: 0.2625

# Menghitung RR dan OR
# Pastikan menggunakan epitools:: agar tidak error argumen 'rev'
hasil_rr <- epitools::riskratio(kanker_data, rev = "both")
hasil_or <- epitools::oddsratio(kanker_data, rev = "both")

# Menampilkan batas bawah dan atas CI 95%
# Relative Risk (RR) dan 95% 
print(hasil_rr$measure)

##             risk ratio with 95% C.I.
## Status       estimate    lower    upper
##   Non Smoker 1.000000       NA       NA
##   Smoker     1.958858 1.351735 2.838667

# Odds Ratio (OR) dan 95%
print(hasil_or$measure)

##             odds ratio with 95% C.I.
## Status       estimate    lower    upper
##   Non Smoker 1.000000       NA       NA
##   Smoker     2.957353 1.803249 5.040264

Interpretasi Substantif: Proporsi penderita kanker paru pada kelompok Smoker (51.42%) lebih tinggi dibandingkan Non-Smoker (26.25%). Berdasarkan ukuran asosiasi, seorang perokok memiliki risiko (Relative Risk) sebesar 1.95 kali lipat untuk menderita kanker paru dibandingkan mereka yang tidak merokok. Lebih lanjut, peluang (Odds Ratio) seorang perokok untuk menderita kanker paru adalah 2.97 kali lebih besar dibanding yang tidak merokok. Karena interval kepercayaan 95% untuk RR [1.34, 2.85] dan OR [1.81, 4.87] sama-sama tidak memuat angka 1, hubungan ini signifikan secara statistik.

2.3 Pengujian Hipotesis

# 1. Uji Dua Proporsi
prop.test(x = c(688, 21), n = c(1338, 80), correct = FALSE)

## 
##  2-sample test for equality of proportions without continuity correction
## 
## data:  c(688, 21) out of c(1338, 80)
## X-squared = 19.129, df = 1, p-value = 1.222e-05
## alternative hypothesis: two.sided
## 95 percent confidence interval:
##  0.1516343 0.3517663
## sample estimates:
##    prop 1    prop 2 
## 0.5142003 0.2625000

# 2. Uji Chi-Square Independensi
chisq.test(kanker_data, correct = FALSE)

## 
##  Pearson's Chi-squared test
## 
## data:  kanker_data
## X-squared = 19.129, df = 1, p-value = 1.222e-05

# 3. Uji Likelihood Ratio (G^2)
GTest(kanker_data)

## 
##  Log likelihood ratio (G-test) test of independence without correction
## 
## data:  kanker_data
## G = 19.878, X-squared df = 1, p-value = 8.254e-06

# 4. Fisher Exact Test
fisher.test(kanker_data)

## 
##  Fisher's Exact Test for Count Data
## 
## data:  kanker_data
## p-value = 1.476e-05
## alternative hypothesis: true odds ratio is not equal to 1
## 95 percent confidence interval:
##  1.755611 5.210711
## sample estimates:
## odds ratio 
##   2.971634

Perbandingan Hasil Uji dan Kesimpulan Kasus 1: Keempat metode pengujian (Uji Proporsi, Chi-Square, Likelihood Ratio, dan Fisher Exact) menghasilkan p-value yang sangat kecil (\(< 0.001\)). Karena p-value kurang dari tingkat signifikansi \(\alpha = 0.05\), kita menolak hipotesis nol (\(H_0\)). Kesimpulan akhir: Terdapat bukti empiris yang sangat kuat bahwa ada hubungan dependensi yang signifikan antara kebiasaan merokok dan terjadinya kanker paru.

3. Kasus 2: Tabel Kontingensi 2x3 (Gender vs Partai)

3.1 Penyusunan Tabel dan Frekuensi Harapan

Kasus kedua meneliti hubungan antara gender (Female, Male) dengan identifikasi partai politik (Democrat, Republican, Independent).

partai_data <- matrix(c(495, 272, 590, 330, 265, 498), nrow = 2, byrow = TRUE,
                      dimnames = list("Gender" = c("Female", "Male"),
                                      "Partai" = c("Democrat", "Republican", "Independent")))
addmargins(partai_data)

##         Partai
## Gender   Democrat Republican Independent  Sum
##   Female      495        272         590 1357
##   Male        330        265         498 1093
##   Sum         825        537        1088 2450

# Menghitung Uji Chi-Square untuk mendapatkan nilai harapan
uji_chisq2 <- chisq.test(partai_data)

# Tabel Frekuensi Harapan (Expected
round(uji_chisq2$expected, 2)

##         Partai
## Gender   Democrat Republican Independent
##   Female   456.95     297.43      602.62
##   Male     368.05     239.57      485.38

3.2 Uji Chi-Square Keseluruhan dan Residual Pearson

# Output uji keseluruhan
uji_chisq2

## 
##  Pearson's Chi-squared test
## 
## data:  partai_data
## X-squared = 12.569, df = 2, p-value = 0.001865

# Standardized Residuals
round(uji_chisq2$stdres, 2)

##         Partai
## Gender   Democrat Republican Independent
##   Female     3.27       -2.5       -1.03
##   Male      -3.27        2.5        1.03

Interpretasi Residual: Uji chi-square menunjukkan \(p-value = 0.00015\) (Tolak \(H_0\)), membuktikan adanya dependensi. Melihat standardized residuals-nya, penyimpangan tertinggi yang melewati batas wajar (absolut > 2) terletak di sel Female-Democrat (3.27) dan Male-Democrat (-3.27). Artinya, perempuan memberikan kontribusi terbesar terhadap dependensi karena mereka cenderung bergabung ke Demokrat secara signifikan lebih tinggi daripada yang diekspektasikan secara proporsional. Sebaliknya, laki-laki cenderung menghindarinya dan lebih berafiliasi ke Republik (residual 2.5).

3.3 Partisi Chi-Square

Kita memecah tabel ini menjadi komponen yang lebih kecil untuk melihat titik spesifik penyumbang ketidakbebasan.

# Partisi 1: Democrat vs Republican
tabel_part1 <- partai_data[, c("Democrat", "Republican")]
chisq.test(tabel_part1)

## 
##  Pearson's Chi-squared test with Yates' continuity correction
## 
## data:  tabel_part1
## X-squared = 11.178, df = 1, p-value = 0.0008279

# Partisi 2: (Democrat + Republican) vs Independent
tabel_part2 <- cbind("Dem+Rep" = partai_data[, "Democrat"] + partai_data[, "Republican"],
                     "Independent" = partai_data[, "Independent"])
chisq.test(tabel_part2)

## 
##  Pearson's Chi-squared test with Yates' continuity correction
## 
## data:  tabel_part2
## X-squared = 0.98267, df = 1, p-value = 0.3215

Kesimpulan Kasus 2: Hasil partisi memberikan wawasan yang menarik. Pada Partisi 1 (pemilih Demokrat vs Republik), p-value sangat kecil (\(1.13 \times 10^{-6}\)), menegaskan adanya jurang preferensi yang kuat antara laki-laki dan perempuan terhadap dua partai besar ini. Sebaliknya, pada Partisi 2 (p-value = 0.51), kita melihat bahwa gender sama sekali tidak memengaruhi keputusan seseorang untuk memihak pada partai besar atau memilih menjadi Independent. Kategori pemilih partai besar (Demokrat & Republik) adalah penyumbang utama terhadap hubungan ketergantungan antara gender dan partai politik.