Inferensi pada tabel kontingensi dua arah digunakan untuk mengetahui apakah terdapat hubungan antara dua variabel kategorik. Pengujian ini umumnya menggunakan uji Chi-Square (\(\chi^2\)) untuk menilai apakah distribusi data yang diamati berbeda secara signifikan dari kondisi yang diharapkan jika kedua variabel saling independen. Hasil pengujian digunakan sebagai dasar untuk menyimpulkan ada atau tidaknya hubungan antara kedua variabel tersebut.
Penyusunan Manual
Berdasarkan data pada kasus 1, tabel kontingensi 2×2 antara status merokok dan kejadian kanker paru dapat disusun sebagai berikut:
| Status Merokok | Kanker (Ya) | Kanker (Tidak) | Total |
|---|---|---|---|
| Smoker | 688 | 650 | 1338 |
| Non-Smoker | 21 | 59 | 80 |
| Total | 709 | 709 | 1418 |
Penyusunan Menggunakan R
set.seed(123)
data<- matrix(c(688, 650, 21, 59), nrow = 2, byrow = TRUE)
dimnames(data) <- list("Status Merokok" = c("Smoker", "Non-Smoker"), "Cancer" = c("Ya", "Tidak"))
addmargins(data, FUN = list(Total = sum))
## Margins computed over dimensions
## in the following order:
## 1: Status Merokok
## 2: Cancer
## Cancer
## Status Merokok Ya Tidak Total
## Smoker 688 650 1338
## Non-Smoker 21 59 80
## Total 709 709 1418
Perhitungan Manual
Estimasi titik digunakan untuk menghitung proporsi kejadian kanker paru pada masing-masing kelompok. Berdasarkan data yang diperoleh, estimasi proporsi kejadian kanker paru pada masing-masing kelompok adalah sebagai berikut:
Untuk kelompok Smoker:
\[ \hat{p}_1 = \frac{\text{jumlah smoker kanker}}{\text{total smoker}} = \frac{688}{1338} \approx 0.5142 \]
Untuk kelompok Non-Smoker:
\[ \hat{p}_2 = \frac{\text{jumlah non-smoker kanker}}{\text{total non-smoker}} = \frac{21}{80} \approx 0.2625 \]
Hasil tersebut menunjukkan bahwa proporsi kejadian kanker paru pada kelompok Smoker lebih tinggi dibandingkan dengan kelompok Non-Smoker.
Perhitungan Menggunakan R
prop_test <- prop.test(x = c(data[1,1], data[2,1]),
n = c(sum(data[1,]), sum(data[2,])))
print(prop_test)
##
## 2-sample test for equality of proportions with continuity correction
##
## data: c(data[1, 1], data[2, 1]) out of c(sum(data[1, ]), sum(data[2, ]))
## X-squared = 18.136, df = 1, p-value = 2.057e-05
## alternative hypothesis: two.sided
## 95 percent confidence interval:
## 0.1450106 0.3583900
## sample estimates:
## prop 1 prop 2
## 0.5142003 0.2625000
Interpretasi
Berdasarkan hasil uji dua proporsi diperoleh bahwa estimasi proporsi kejadian kanker paru pada kelompok Smoker sebesar 0,5142, sedangkan pada kelompok Non-Smoker sebesar 0,2625. Hal ini menunjukkan bahwa proporsi penderita kanker paru pada kelompok Smoker lebih tinggi dibandingkan Non-Smoker.
Hasil uji hipotesis menunjukkan nilai statistik uji sebesar \(\chi^2\) = 18,136 dengan p-value = 2,057 × 10^{-5}, yang lebih kecil dari tingkat signifikansi \(\alpha\) = 0,05. Oleh karena itu, \(H_0\) ditolak, sehingga dapat disimpulkan bahwa terdapat perbedaan yang signifikan antara proporsi kejadian kanker paru pada kelompok Smoker dan Non-Smoker.
Perhitungan Manual
Interval kepercayaan 95% untuk selisih proporsi dihitung menggunakan rumus sebagai berikut:
\[ (\hat{p}_1 - \hat{p}_2) \pm Z_{\alpha/2} \sqrt{ \frac{\hat{p}_1(1-\hat{p}_1)}{n_1} + \frac{\hat{p}_2(1-\hat{p}_2)}{n_2} } \] Berdasarkan perhitungan sebelumnya diperoleh selisih proporsi sebesar:
\[ \hat{p}_1 - \hat{p}_2 = 0.2517 \]
dan standar error sebesar 0.05105. Dengan menggunakan nilai \(Z_{0.025} = 1.96\), maka interval kepercayaan dihitung sebagai berikut:
\[ 0.2517 \pm 1.96 \times 0.05105 \]
Sehingga diperoleh interval kepercayaan 95% untuk selisih proporsi yaitu:
\[ CI = (0.1516 ; 0.3518) \]
Perhitungan Menggunakan R
prop_test <- prop.test(x = c(data[1,1], data[2,1]),
n = c(sum(data[1,]), sum(data[2,])))
print(prop_test)
##
## 2-sample test for equality of proportions with continuity correction
##
## data: c(data[1, 1], data[2, 1]) out of c(sum(data[1, ]), sum(data[2, ]))
## X-squared = 18.136, df = 1, p-value = 2.057e-05
## alternative hypothesis: two.sided
## 95 percent confidence interval:
## 0.1450106 0.3583900
## sample estimates:
## prop 1 prop 2
## 0.5142003 0.2625000
n11 <- 688; n12 <- 650; n21 <- 21; n22 <- 59
n1. <- n11 + n12; n2. <- n21 + n22
# Risk Difference
p1<-(n11/n1.)
p2<-(n21/n2.)
rd <- p1 - p2
se_rd <- sqrt((p1 * (1 - p1) / n1.) + p2*((1 - p2) / n2.))
z_rd <- rd / se_rd
# Relative Risk
rr <- (n11/n1.) / (n21/n2.)
se_ln_rr <- sqrt((1/n11) - (1/n1.) + (1/n21) - (1/n2.))
z_rr <- log(rr) / se_ln_rr
# Odds Ratio
or <- (n11 * n22) / (n12 * n21)
se_ln_or <- sqrt((1/n11) + (1/n12) + (1/n21) + (1/n22))
z_or <- log(or) / se_ln_or
# Hasil
list(RD = rd, SE_RD = se_rd, Z_RD = z_rd, RR = rr, SE_Ln_RR = se_ln_rr, Z_RR = z_rr, OR = or, SE_Ln_OR = se_ln_or, Z_OR = z_or)
## $RD
## [1] 0.2517003
##
## $SE_RD
## [1] 0.05105504
##
## $Z_RD
## [1] 4.929979
##
## $RR
## [1] 1.958858
##
## $SE_Ln_RR
## [1] 0.1892753
##
## $Z_RR
## [1] 3.552295
##
## $OR
## [1] 2.973773
##
## $SE_Ln_OR
## [1] 0.2599234
##
## $Z_OR
## [1] 4.192896
Interpretasi
Interval kepercayaan 95% untuk selisih proporsi berada pada rentang (0,1450 ; 0,3584). Smoker punya kemungkinan kena kanker paru lebih tinggi sekitar 14%–36% dibanding Non-Smoker. Sehingga dapat disimpulkan bahwa terdapat perbedaan proporsi yang signifikan antara kedua kelompok.
Nilai Risk Difference (RD) sebesar 0.2517 menunjukkan bahwa proporsi kejadian kanker paru pada kelompok Smoker lebih tinggi sekitar 25,17% dibandingkan Non-Smoker. Nilai statistik uji sebesar \(Z = 4.93\) menunjukkan perbedaan tersebut signifikan.
Nilai Risk Ratio (RR) sebesar 1.9589 menunjukkan bahwa kelompok Smoker memiliki risiko terkena kanker paru sekitar 1,96 kali lebih besar dibandingkan kelompok Non-Smoker. Nilai \(Z = 3.55\) menunjukkan bahwa risiko tersebut signifikan.
Nilai Odds Ratio (OR) sebesar 2.9738 menunjukkan bahwa peluang (odds) terkena kanker paru pada kelompok Smoker sekitar 2,97 kali dibandingkan Non-Smoker. Nilai \(Z = 4.19\) menunjukkan bahwa perbedaan tersebut juga signifikan.
Perhitungan Manual
Uji dua proporsi digunakan untuk mengetahui apakah terdapat perbedaan proporsi kejadian antara dua kelompok independen. Dalam kasus ini, uji dua proporsi digunakan untuk membandingkan proporsi kejadian kanker paru pada kelompok Smoker dan Non-Smoker.
Hipotesis yang digunakan adalah:
\(H_0\): \(p_1 = p_2\) (tidak terdapat perbedaan proporsi kejadian kanker paru antara kedua kelompok)
\(H_1\): \(p_1 \neq p_2\) (terdapat perbedaan proporsi kejadian kanker paru antara kedua kelompok)
Perhitungan Menggunakan R
prop_test <- prop.test(x = c(data[1,1], data[2,1]),
n = c(sum(data[1,]), sum(data[2,])))
print(prop_test)
##
## 2-sample test for equality of proportions with continuity correction
##
## data: c(data[1, 1], data[2, 1]) out of c(sum(data[1, ]), sum(data[2, ]))
## X-squared = 18.136, df = 1, p-value = 2.057e-05
## alternative hypothesis: two.sided
## 95 percent confidence interval:
## 0.1450106 0.3583900
## sample estimates:
## prop 1 prop 2
## 0.5142003 0.2625000
Interpretasi
Hasil uji hipotesis menunjukkan nilai statistik uji sebesar \(\chi^2\) = 18,136 dengan p-value = 2,057 × 10^{-5} yang lebih kecil dari tingkat signifikansi \(\alpha\) = 0,05. Sehingga \(H_0\) ditolak dan dapat disimpulkan bahwa terdapat perbedaan yang signifikan antara proporsi kejadian kanker paru pada kelompok Smoker dan Non-Smoker.
Konsep dan Hipotesis
Uji Chi-Square independensi digunakan untuk mengetahui apakah terdapat hubungan antara dua variabel kategorik. Dalam kasus ini, uji ini digunakan untuk menguji hubungan antara status merokok dan kejadian kanker paru.
Hipotesis yang digunakan adalah:
\(H_0\): Status merokok dan kejadian kanker paru saling independen (tidak berhubungan)
\(H_1\): Status merokok dan kejadian kanker paru tidak independen (berhubungan)
Perhitungan Menggunakan R
chisq_test <- chisq.test(data)
chisq_test
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: data
## X-squared = 18.136, df = 1, p-value = 2.057e-05
Interpretasi
Berdasarkan hasil uji Chi-Square independensi diperoleh nilai statistik uji sebesar \(\chi^2\) = 18,136 dengan derajat bebas (df = 1) dan *p-value = 2,057 × 10^{-5}**. Nilai p-value tersebut lebih kecil dari tingkat signifikansi \(\alpha\) = 0,05. Sehingga \(H_0\) ditolak yang artinya terdapat hubungan yang signifikan antara status merokok dan kejadian kanker paru.
Konsep dan Hipotesis
Uji Likelihood Ratio (\(G^2\)) digunakan untuk menguji apakah terdapat hubungan antara dua variabel kategorik berdasarkan pendekatan likelihood. Uji ini merupakan alternatif dari uji Chi-Square dan sering digunakan untuk membandingkan frekuensi observasi dengan frekuensi harapan dalam tabel kontingensi.
Dalam kasus ini, uji Likelihood Ratio digunakan untuk mengetahui apakah terdapat hubungan antara status merokok dan kejadian kanker paru.
Hipotesis yang digunakan adalah:
\(H_0\): Status merokok dan kejadian kanker paru saling independen (tidak berhubungan)
\(H_1\): Status merokok dan kejadian kanker paru tidak independen (berhubungan)
Perhitungan Menggunakan R
# Hitung Frekuensi Ekspektasi
data_expected <- chisq.test(data)$expected
# Hitung Statistik G²
G2 <- 2 * sum(data * log(data / data_expected))
# Nilai kritis chi-square untuk df = 1 dan alpha = 0.05
critical_value <- qchisq(0.95, df = 1)
# Hasil
list(G2 = G2, Critical_Value = critical_value, Decision = ifelse(G2 > critical_value, "Reject H0", "Fail to Reject H0"))
## $G2
## [1] 19.87802
##
## $Critical_Value
## [1] 3.841459
##
## $Decision
## [1] "Reject H0"
Interpretasi
Uji Likelihood Ratio(\(G^2\)) digunakan sebgaia alternatif dari uji Chi-Square untuk menguji independensi dalam tabel kontingensi. Jika \(G^2\) lebih besar dari nilai kritis \(\chi^2\), maka \(H_0\) ditolak yang artinya terdapat hubungan antara dua variabel.
Dari hasil tersebut didapatkan \(G^2\) = 19.87802 yang lebih besar dari nilai kritis yaitu 3.841, sehingga dapat disimpulkan bahwa terdapat hubungan yang isgnifikan antara status merokok dan kejadian kanker paru.
Konsep dan Hipotesis
Fisher Exact Test digunakan untuk menguji hubungan antara dua variabel kategorik dalam tabel kontingensi terutama ketika ukuran sampel kecil atau terdapat frekuensi harapan yang kurang dari 5. Uji ini tidak menggunakan pendekatan aproksimasi seperti uji Chi-Square melainkan menggunakan perhitungan probabilitas secara eksak.
Dalam kasus ini, Fisher Exact Test digunakan untuk mengetahui apakah terdapat hubungan antara status merokok dan kejadian kanker paru.
Hipotesis yang digunakan adalah:
\(H_0\): Status merokok dan kejadian kanker paru saling independen (tidak berhubungan)
\(H_1\): Status merokok dan kejadian kanker paru tidak independen (berhubungan)
Perhitungan Mengguakan R
fisher.test(data)
##
## Fisher's Exact Test for Count Data
##
## data: data
## p-value = 1.476e-05
## alternative hypothesis: true odds ratio is not equal to 1
## 95 percent confidence interval:
## 1.755611 5.210711
## sample estimates:
## odds ratio
## 2.971634
Interpretasi
Berdasarkan hasil Fisher Exact Test diperoleh p-value = 1,476 × 10^{-5} yang lebih kecil dari tingkat signifikansi \(\alpha = 0,05\). Sehingga hipotesis nol (\(H_0\)) ditolak dan dapat disimpulkan bahwa terdapat hubungan yang signifikan antara status merokok dan kejadian kanker paru.
Nilai odds ratio sebesar 2,9716 menunjukkan bahwa peluang (odds) terkena kanker paru pada kelompok Smoker sekitar 2,97 kali lebih besar dibandingkan dengan kelompok Non-Smoker.
Interval kepercayaan 95% untuk odds ratio berada pada rentang (1,7556 ; 5,2107). Karena interval tersebut tidak mencakup nilai 1, maka hasil ini menunjukkan bahwa perbedaan tersebut signifikan.
Untuk melihat perbandingan hasil uji diatas, berikut adalah perbandingan hasil uji dua proporsi, uji Chi-Square independensi, uji Likelihood Ratio (G²), dan Fisher Exact Test.
| Metode Uji | Hipotesis | Statistik Uji | P-value | Keputusan |
|---|---|---|---|---|
| Uji Dua Proporsi | \(p_1 = p_2\) | \(Z\) atau \(\chi^2\) | \(2.057 \times 10^{-5}\) | Tolak \(H_0\) |
| Chi-Square | Independen | \(\chi^2 = 18.136\) | \(2.057 \times 10^{-5}\) | Tolak \(H_0\) |
| Likelihood Ratio (G²) | Independen | \(G^2 = 19.878\) | < 0.05 | Tolak \(H_0\) |
| Fisher Exact Test | Independen | OR ≈ 2.97 | \(1.48 \times 10^{-5}\) | Tolak \(H_0\) |
Berdasarkan seluruh analisis yang telah dilakukan, diperoleh bahwa proporsi kejadian kanker paru pada kelompok Smoker lebih tinggi dibandingkan dengan kelompok Non-Smoker. Hasil estimasi menunjukkan bahwa proporsi pada kelompok Smoker mencapai sekitar 51,42%, sedangkan pada Non-Smoker sebesar 26,25%.
Interval kepercayaan 95% untuk selisih proporsi menunjukkan bahwa perbedaan tersebut berada pada rentang sekitar 15% hingga 35%, yang tidak mencakup nol, sehingga mengindikasikan adanya perbedaan yang signifikan.
Selain itu, hasil pengujian statistik menggunakan uji dua proporsi, uji Chi-Square independensi, uji Likelihood Ratio (G²), dan Fisher Exact Test secara konsisten menghasilkan p-value yang lebih kecil dari 0,05, sehingga hipotesis nol (\(H_0\)) ditolak pada semua metode. Hal ini menunjukkan bahwa terdapat hubungan yang signifikan antara status merokok dan kejadian kanker paru.
Ukuran asosiasi yang diperoleh, yaitu Risk Difference (RD \(\approx\) 0,25), Risk Ratio (RR \(\approx\) 1,96), dan Odds Ratio (OR \(\approx\) 2,97), semakin memperkuat bahwa kelompok Smoker memiliki risiko dan peluang yang lebih tinggi untuk mengalami kanker paru dibandingkan kelompok Non-Smoker.
Dengan demikian, dapat disimpulkan bahwa status merokok memiliki hubungan yang signifikan dan berpengaruh terhadap peningkatan kejadian kanker paru.
Penyusunan Manual
Berdasarkan data pada kasus 2, tabel kontingensi 2×3 antara gender dan identifikasi partai politik dapat disusun sebagai berikut:
| Gender | Democrat | Republican | Independent | Total |
|---|---|---|---|---|
| Female | 495 | 272 | 590 | 1357 |
| Male | 330 | 265 | 498 | 1093 |
| Total | 825 | 537 | 1088 | 2450 |
Penyusunan Menggunakan R
set.seed(123)
data2<- matrix(c(495, 272, 590, 330, 265, 498), nrow = 2, byrow = TRUE)
dimnames(data2) <- list("Gender" = c("Female", "Male"), "Partai Politik" = c("Democrat", "Republican", "Independent"))
addmargins(data, FUN = list(Total = sum))
## Margins computed over dimensions
## in the following order:
## 1: Status Merokok
## 2: Cancer
## Cancer
## Status Merokok Ya Tidak Total
## Smoker 688 650 1338
## Non-Smoker 21 59 80
## Total 709 709 1418
mosaicplot(data2,
col = c("#e6f2ff", "#b3d9ff", "#80bfff"),
main = "Mosaic Plot: Gender vs Partai Politik",
xlab = "Gender",
ylab = "Partai Politik")
Mosaic plot tersebut menggambarkan hubungan antara gender (Female dan Male) dengan partai politik (Democrat, Republican, dan Independent) berdasarkan proporsi luas masing-masing kotak. Dari plot terlihat bahwa secara keseluruhan proporsi perempuan (Female) lebih besar dibandingkan laki-laki (Male), yang menunjukkan bahwa jumlah responden perempuan dalam data ini lebih banyak.
Jika dilihat berdasarkan pilihan partai politik, baik pada kelompok perempuan maupun laki-laki, kategori Independent memiliki proporsi paling besar. Hal ini menunjukkan bahwa mayoritas responden cenderung tidak berafiliasi dengan partai politik utama.
Selain itu, terdapat kecenderungan bahwa pada kategori Democrat, proporsi perempuan lebih besar dibandingkan laki-laki, yang mengindikasikan bahwa perempuan relatif lebih banyak memilih atau berafiliasi dengan partai tersebut. Sebaliknya, pada kategori Republican, proporsi laki-laki terlihat sedikit lebih besar dibandingkan perempuan, sehingga dapat dikatakan bahwa laki-laki cenderung lebih banyak berada pada kelompok ini.
Meskipun terdapat perbedaan pola antara gender dan pilihan partai politik, perbedaannya tidak terlalu mencolok. Oleh karena itu, dapat disimpulkan bahwa ada indikasi hubungan antara gender dan partai politik, namun hubungan tersebut tidak terlalu kuat secara visual dan masih perlu dikonfirmasi lebih lanjut dengan uji statistik seperti uji chi-square.
Perhitungan Manual
Frekuensi harapan (expected frequency) digunakan dalam uji Chi-Square untuk mengetahui nilai yang diharapkan jika tidak terdapat hubungan antara kedua variabel.
Frekuensi harapan dihitung dengan rumus:
\[ E_{ij} = \frac{(\text{Total baris ke-i}) \times (\text{Total kolom ke-j})}{\text{Total keseluruhan}} \]
Berdasarkan tabel kontingensi yang diberikan, total keseluruhan data adalah 2450.
Sebagai contoh, untuk sel (Female, Democrat):
\[ E_{11} = \frac{1357 \times 825}{2450} = 456.97 \]
Untuk sel (Female, Republican):
\[ E_{12} = \frac{1357 \times 537}{2450} = 297.36 \]
Untuk sel (Female, Independent):
\[ E_{13} = \frac{1357 \times 1088}{2450} = 602.67 \]
Untuk sel (Male, Democrat):
\[ E_{21} = \frac{1093 \times 825}{2450} = 368.03 \]
Untuk sel (Male, Republican):
\[ E_{22} = \frac{1093 \times 537}{2450} = 239.64 \]
Untuk sel (Male, Independent):
\[ E_{23} = \frac{1093 \times 1088}{2450} = 485.33 \]
Perhitungan Menggunakan R
expected <- chisq.test(data2)$expected; expected
## Partai Politik
## Gender Democrat Republican Independent
## Female 456.949 297.4322 602.6188
## Male 368.051 239.5678 485.3812
Intrepretasi
Berdasarkan hasil perhitungan frekuensi harapan, diperoleh nilai expected untuk setiap sel pada tabel kontingensi dengan asumsi bahwa tidak terdapat hubungan antara variabel Gender dan Partai Politik.
Sebagai contoh, jumlah individu Female yang diharapkan memilih Democrat adalah sekitar 456.95, sedangkan yang diamati sebesar 495. Hal ini menunjukkan bahwa jumlah observasi lebih besar dari yang diharapkan.
Sebaliknya, pada kategori Male–Democrat frekuensi yang diharapkan sebesar 368.05, sedangkan yang diamati hanya 330, sehingga lebih kecil dari nilai harapannya.
Secara umum, terdapat perbedaan antara frekuensi observasi dan frekuensi harapan pada beberapa sel. Hal ini mengindikasikan adanya kemungkinan hubungan antara Gender dan Partai Politik yang selanjutnya dapat diuji menggunakan uji Chi-Square.
Konsep dan Hipotesis
Uji Chi-Square independensi digunakan untuk mengetahui apakah terdapat hubungan antara dua variabel kategorik. Uji ini membandingkan frekuensi observasi dengan frekuensi harapan yang diperoleh jika kedua variabel saling independen.
Dalam kasus ini, uji Chi-Square digunakan untuk menguji apakah terdapat hubungan antara Gender dan Partai Politik.
Hipotesis yang digunakan adalah:
\(H_0\): Gender dan Partai Politik saling independen (tidak terdapat hubungan)
\(H_1\): Gender dan Partai Politik tidak independen (terdapat hubungan)
Perhitungan Menggunakan R
# Uji Chi-Square
chi_test <- chisq.test(data2)
# Hasil
list(Chi_Square = chi_test$statistic, P_Value = chi_test$p.value, Decision = ifelse(chi_test$p.value < 0.05, "Reject H0", "Fail to Reject H0"))
## $Chi_Square
## X-squared
## 12.56926
##
## $P_Value
## [1] 0.00186475
##
## $Decision
## [1] "Reject H0"
Intrepretasi
Berdasarkan hasil uji Chi-Square diperoleh nilai statistik uji sebesar \(\chi^2\) = 12.57 dengan p-value = 0.0019. Karena nilai p-value lebih kecil dari tingkat signifikansi \(\alpha = 0.05\), maka hipotesis nol (\(H_0\)) ditolak. Sehinggadapat disimpulkan bahwa terdapat hubungan yang signifikan antara Gender dan Partai Politik. Dengan kata lain, preferensi partai politik tidak independen terhadap gender.
Konsep
Residual Pearson digunakan untuk mengidentifikasi sel mana dalam tabel kontingensi yang memberikan kontribusi terbesar terhadap nilai statistik Chi-Square. Residual ini mengukur selisih antara frekuensi observasi dan frekuensi harapan yang telah dinormalisasi.
Residual Pearson dihitung dengan rumus:
\[ r_{ij} = \frac{O_{ij} - E_{ij}}{\sqrt{E_{ij}}} \]
dengan:
\(O_{ij}\) adalah frekuensi observasi
\(E_{ij}\) adalah frekuensi harapan.
Interpretasi residual:
\(|r_{ij}| > 2\) → sel memberikan kontribusi besar (signifikan)
\(|r_{ij}| \leq 2\) → kontribusi kecil
Nilai residual positif menunjukkan bahwa frekuensi observasi lebih besar dari yang diharapkan, sedangkan nilai negatif menunjukkan bahwa frekuensi observasi lebih kecil dari yang diharapkan.
Perhitungan Menggunakan R
# Residual Pearson
residual <- chisq.test(data2)$residuals; residual
## Partai Politik
## Gender Democrat Republican Independent
## Female 1.780051 -1.474656 -0.5140388
## Male -1.983409 1.643125 0.5727640
Intrepretasi
Nilai residual terbesar (dalam nilai absolut) terdapat pada kategori Male–Democrat sebesar -1.98 dan Female–Democrat sebesar 1.78. Hal ini menunjukkan bahwa pada kelompok Female, jumlah yang memilih Democrat lebih besar dari yang diharapkan. Sedangkan pada kelompok Male, jumlahnya lebih kecil dari yang diharapkan.
Pada kategori Republican, kelompok Male memiliki residual positif (1.64) yang menunjukkan jumlah observasi lebih besar dari yang diharapkan, sedangkan Female lebih kecil dari yang diharapkan.
Sementara itu, kategori Independent memiliki nilai residual yang relatif kecil (kurang dari 2), sehingga kontribusinya terhadap hubungan secara keseluruhan tidak terlalu besar.
Secara umum, meskipun tidak ada nilai residual yang melebihi batas ±2, kategori Democrat dan Republican memberikan kontribusi terbesar terhadap hubungan antara Gender dan Partai Politik.
Konsep
Partisi Chi-Square digunakan untuk membagi nilai Chi-Square total menjadi beberapa bagian untuk mengetahui kategori mana yang paling berkontribusi terhadap hubungan antar variabel.
Pada kasus ini, partisi dilakukan menjadi dua bagian:
Perbandingan antara Democrat dan Republican
Perbandingan antara (democrat + Republican) dan independent
Partisi 1: Democrat vs Republican
# Democrat vs Republican
partisi1 <- data2[, c("Democrat", "Republican")]; partisi1
## Partai Politik
## Gender Democrat Republican
## Female 495 272
## Male 330 265
uji_partisi1 <- chisq.test(partisi1, correct = FALSE); uji_partisi1
##
## Pearson's Chi-squared test
##
## data: partisi1
## X-squared = 11.555, df = 1, p-value = 0.0006758
Partisi 2: (Democrat + Republican) vs Independent
# Gabungkan Democrat + Republican
gabungan <- data2[, "Democrat"] + data2[, "Republican"]
# Buat tabel partisi 2
partisi2 <- cbind("Dem+Rep" = gabungan,
"Independent" = data2[, "Independent"]); partisi2
## Dem+Rep Independent
## Female 767 590
## Male 595 498
uji_partisi2 <- chisq.test(partisi2, correct = FALSE); uji_partisi2
##
## Pearson's Chi-squared test
##
## data: partisi2
## X-squared = 1.0654, df = 1, p-value = 0.302
Intrepretasi
Berdasarkan hasil uji Chi-Square pada partisi Democrat vs Republican, diperoleh nilai \(\chi^2\) = 11.555 dengan p-value = 0.00068. Karena p-value < 0.05, maka hipotesis nol (\(H_0\)) ditolak. Sehingga dapat disimpulkan bahwa terdapat perbedaan yang signifikan antara Gender dalam memilih partai Democrat dan Republican. Dengan kata lain, preferensi terhadap kedua partai tersebut dipengaruhi oleh gender.
Berdasarkan hasil uji Chi-Square pada partisi (Democrat + Republican) vs Independent, diperoleh nilai \(\chi^2\) = 1.065 dengan p-value = 0.302. Karena p-value > 0.05, maka hipotesis nol (\(H_0\)) gagal ditolak. Sehingga dapat dsimpulkan bahwa tidak terdapat perbedaan yang signifikan antara Gender dalam memilih kelompok (Democrat + Republican) dibandingkan dengan Independent. Dengan kata lain, preferensi terhadap kategori ini tidak dipengaruhi oleh gender.
Berdasarkan uji Chi-Square keseluruhan diperoleh nilai \(\chi^2\) = 12.57 dengan p-value = 0.0019, yang menunjukkan adanya hubungan signifikan antara Gender dan Partai Politik. Hasil partisi menunjukkan bahwa signifikansi tersebut terutama berasal dari perbandingan Democrat vs Republican (p-value = 0.00068), sedangkan partisi (Democrat + Republican) vs Independent tidak signifikan (p-value = 0.302). Hal ini mengindikasikan bahwa kategori Independent tidak berperan besar dalam hubungan yang terdeteksi pada uji keseluruhan.
Berdasarkan analisis residual Pearson, kontribusi terbesar terhadap hubungan Gender dan Partai Politik berasal dari kategori Democrat dan Republican, yang ditunjukkan oleh nilai residual yang relatif besar pada beberapa kombinasi gender, terutama Female–Democrat dan Male–Democrat. Sementara itu, kategori Independent memiliki residual yang kecil sehingga kontribusinya terhadap pola hubungan secara keseluruhan relatif rendah.