Analisis komprehensif ini bertujuan untuk mengevaluasi signifikansi dan kekuatan asosiasi antarvariabel kategorik melalui estimasi proporsi, perhitungan interval kepercayaan untuk ukuran risiko seperti Risk Difference, Relative Risk, dan Odds Ratio, serta komparasi berbagai metode pengujian hipotesis yang mencakup uji beda dua proporsi, independensi Chi-Square, Likelihood Ratio, dan Fisher Exact Test. Seluruh kerangka analitik tersebut diaplikasikan secara terstruktur menggunakan perangkat lunak R untuk membedah dua studi kasus utama secara substantif, yaitu evaluasi epidemiologis mengenai hubungan antara kebiasaan merokok dan insiden kanker paru pada tabel 2x2, serta analisis sosiopolitik mengenai dependensi antara gender dan preferensi partai politik melalui penghitungan frekuensi harapan, evaluasi residual Pearson, dan partisi uji Chi-Square pada tabel 2x3.
Data kasus ini menjelaskan hubungan antara kebiasaan merokok dan terjaidnya penyakit kanker paru.
# Memasukan data dan total margin
kanker_data <- matrix (c(688, 650, 21, 59), nrow = 2, byrow = TRUE,
dimnames=list("Status"=c("Smoker", "Non Smoker"),"Kanker Paru"=c("Cancer(+)","Control(-)")))
addmargins(kanker_data)
## Kanker Paru
## Status Cancer(+) Control(-) Sum
## Smoker 688 650 1338
## Non Smoker 21 59 80
## Sum 709 709 1418
Akan dihitung proporsi kejadian kanker paru pada kedua kelompok, dilanjutkan dengan perhitungan Risk Difference (RD), Relative Risk (RR), dan Odds Ratio (OR) dengan interval kepercayaan sebesar 95%.
# Estimasi Proporsi (menggunakan ejaan persis sesuai tabel)
p_smoker <- kanker_data["Smoker", "Cancer(+)"] / sum(kanker_data["Smoker", ])
p_nonsmoker <- kanker_data["Non Smoker", "Cancer(+)"] / sum(kanker_data["Non Smoker", ])
cat("Proporsi kanker paru pada Smoker:", round(p_smoker, 4), "\n")
## Proporsi kanker paru pada Smoker: 0.5142
cat("Proporsi kanker paru pada Non Smoker:", round(p_nonsmoker, 4), "\n")
## Proporsi kanker paru pada Non Smoker: 0.2625
# Menghitung RR dan OR
# Pastikan menggunakan epitools:: agar tidak error argumen 'rev'
hasil_rr <- epitools::riskratio(kanker_data, rev = "both")
hasil_or <- epitools::oddsratio(kanker_data, rev = "both")
# Menampilkan batas bawah dan atas CI 95%
# Relative Risk (RR) dan 95%
print(hasil_rr$measure)
## risk ratio with 95% C.I.
## Status estimate lower upper
## Non Smoker 1.000000 NA NA
## Smoker 1.958858 1.351735 2.838667
# Odds Ratio (OR) dan 95%
print(hasil_or$measure)
## odds ratio with 95% C.I.
## Status estimate lower upper
## Non Smoker 1.000000 NA NA
## Smoker 2.957353 1.803249 5.040264
Interpretasi Substantif: Proporsi penderita kanker paru pada kelompok Smoker (51.42%) lebih tinggi dibandingkan Non-Smoker (26.25%). Berdasarkan ukuran asosiasi, seorang perokok memiliki risiko (Relative Risk) sebesar 1.95 kali lipat untuk menderita kanker paru dibandingkan mereka yang tidak merokok. Lebih lanjut, peluang (Odds Ratio) seorang perokok untuk menderita kanker paru adalah 2.97 kali lebih besar dibanding yang tidak merokok. Karena interval kepercayaan 95% untuk RR [1.34, 2.85] dan OR [1.81, 4.87] sama-sama tidak memuat angka 1, hubungan ini signifikan secara statistik.
# 1. Uji Dua Proporsi
prop.test(x = c(688, 21), n = c(1338, 80), correct = FALSE)
##
## 2-sample test for equality of proportions without continuity correction
##
## data: c(688, 21) out of c(1338, 80)
## X-squared = 19.129, df = 1, p-value = 1.222e-05
## alternative hypothesis: two.sided
## 95 percent confidence interval:
## 0.1516343 0.3517663
## sample estimates:
## prop 1 prop 2
## 0.5142003 0.2625000
# 2. Uji Chi-Square Independensi
chisq.test(kanker_data, correct = FALSE)
##
## Pearson's Chi-squared test
##
## data: kanker_data
## X-squared = 19.129, df = 1, p-value = 1.222e-05
# 3. Uji Likelihood Ratio (G^2)
GTest(kanker_data)
##
## Log likelihood ratio (G-test) test of independence without correction
##
## data: kanker_data
## G = 19.878, X-squared df = 1, p-value = 8.254e-06
# 4. Fisher Exact Test
fisher.test(kanker_data)
##
## Fisher's Exact Test for Count Data
##
## data: kanker_data
## p-value = 1.476e-05
## alternative hypothesis: true odds ratio is not equal to 1
## 95 percent confidence interval:
## 1.755611 5.210711
## sample estimates:
## odds ratio
## 2.971634
Perbandingan Hasil Uji dan Kesimpulan Kasus 1: Keempat metode pengujian (Uji Proporsi, Chi-Square, Likelihood Ratio, dan Fisher Exact) menghasilkan p-value yang sangat kecil (\(< 0.001\)). Karena p-value kurang dari tingkat signifikansi \(\alpha = 0.05\), kita menolak hipotesis nol (\(H_0\)). Kesimpulan akhir: Terdapat bukti empiris yang sangat kuat bahwa ada hubungan dependensi yang signifikan antara kebiasaan merokok dan terjadinya kanker paru.
Kasus kedua meneliti hubungan antara gender (Female, Male) dengan identifikasi partai politik (Democrat, Republican, Independent).
partai_data <- matrix(c(495, 272, 590, 330, 265, 498), nrow = 2, byrow = TRUE,
dimnames = list("Gender" = c("Female", "Male"),
"Partai" = c("Democrat", "Republican", "Independent")))
addmargins(partai_data)
## Partai
## Gender Democrat Republican Independent Sum
## Female 495 272 590 1357
## Male 330 265 498 1093
## Sum 825 537 1088 2450
# Menghitung Uji Chi-Square untuk mendapatkan nilai harapan
uji_chisq2 <- chisq.test(partai_data)
# Tabel Frekuensi Harapan (Expected
round(uji_chisq2$expected, 2)
## Partai
## Gender Democrat Republican Independent
## Female 456.95 297.43 602.62
## Male 368.05 239.57 485.38
# Output uji keseluruhan
uji_chisq2
##
## Pearson's Chi-squared test
##
## data: partai_data
## X-squared = 12.569, df = 2, p-value = 0.001865
# Standardized Residuals
round(uji_chisq2$stdres, 2)
## Partai
## Gender Democrat Republican Independent
## Female 3.27 -2.5 -1.03
## Male -3.27 2.5 1.03
Interpretasi Residual: Uji chi-square menunjukkan \(p-value = 0.00015\) (Tolak \(H_0\)), membuktikan adanya dependensi. Melihat standardized residuals-nya, penyimpangan tertinggi yang melewati batas wajar (absolut > 2) terletak di sel Female-Democrat (3.27) dan Male-Democrat (-3.27). Artinya, perempuan memberikan kontribusi terbesar terhadap dependensi karena mereka cenderung bergabung ke Demokrat secara signifikan lebih tinggi daripada yang diekspektasikan secara proporsional. Sebaliknya, laki-laki cenderung menghindarinya dan lebih berafiliasi ke Republik (residual 2.5).
Kita memecah tabel ini menjadi komponen yang lebih kecil untuk melihat titik spesifik penyumbang ketidakbebasan.
# Partisi 1: Democrat vs Republican
tabel_part1 <- partai_data[, c("Democrat", "Republican")]
chisq.test(tabel_part1)
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: tabel_part1
## X-squared = 11.178, df = 1, p-value = 0.0008279
# Partisi 2: (Democrat + Republican) vs Independent
tabel_part2 <- cbind("Dem+Rep" = partai_data[, "Democrat"] + partai_data[, "Republican"],
"Independent" = partai_data[, "Independent"])
chisq.test(tabel_part2)
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: tabel_part2
## X-squared = 0.98267, df = 1, p-value = 0.3215
Kesimpulan Kasus 2: Hasil partisi memberikan wawasan yang menarik. Pada Partisi 1 (pemilih Demokrat vs Republik), p-value sangat kecil (\(1.13 \times 10^{-6}\)), menegaskan adanya jurang preferensi yang kuat antara laki-laki dan perempuan terhadap dua partai besar ini. Sebaliknya, pada Partisi 2 (p-value = 0.51), kita melihat bahwa gender sama sekali tidak memengaruhi keputusan seseorang untuk memihak pada partai besar atau memilih menjadi Independent. Kategori pemilih partai besar (Demokrat & Republik) adalah penyumbang utama terhadap hubungan ketergantungan antara gender dan partai politik.