Pendahuluan

Inferensi pada tabel kontingensi dua arah digunakan untuk mengetahui apakah terdapat hubungan antara dua variabel kategorik. Pengujian ini umumnya menggunakan uji Chi-Square (\(\chi^2\)) untuk menilai apakah distribusi data yang diamati berbeda secara signifikan dari kondisi yang diharapkan jika kedua variabel saling independen. Hasil pengujian digunakan sebagai dasar untuk menyimpulkan ada atau tidaknya hubungan antara kedua variabel tersebut.

Kasus 1

1. Tabel Kontingensi

Penyusunan Manual

Berdasarkan data pada kasus 1, tabel kontingensi 2×2 antara status merokok dan kejadian kanker paru dapat disusun sebagai berikut:

Status Merokok	Kanker (Ya)	Kanker (Tidak)	Total
Smoker	688	650	1338
Non-Smoker	21	59	80
Total	709	709	1418

Penyusunan Menggunakan R

set.seed(123)
data<- matrix(c(688, 650, 21, 59), nrow = 2, byrow = TRUE)
dimnames(data) <- list("Status Merokok" = c("Smoker", "Non-Smoker"), "Cancer" = c("Ya", "Tidak"))
addmargins(data, FUN = list(Total = sum))

## Margins computed over dimensions
## in the following order:
## 1: Status Merokok
## 2: Cancer

##               Cancer
## Status Merokok  Ya Tidak Total
##     Smoker     688   650  1338
##     Non-Smoker  21    59    80
##     Total      709   709  1418

2. Estimasi Titik Proporsi

Perhitungan Manual

Estimasi titik digunakan untuk menghitung proporsi kejadian kanker paru pada masing-masing kelompok. Berdasarkan data yang diperoleh, estimasi proporsi kejadian kanker paru pada masing-masing kelompok adalah sebagai berikut:

Untuk kelompok Smoker:

\[ \hat{p}_1 = \frac{\text{jumlah smoker kanker}}{\text{total smoker}} = \frac{688}{1338} \approx 0.5142 \]

Untuk kelompok Non-Smoker:

\[ \hat{p}_2 = \frac{\text{jumlah non-smoker kanker}}{\text{total non-smoker}} = \frac{21}{80} \approx 0.2625 \]

Hasil tersebut menunjukkan bahwa proporsi kejadian kanker paru pada kelompok Smoker lebih tinggi dibandingkan dengan kelompok Non-Smoker.

Perhitungan Menggunakan R

prop_test <- prop.test(x = c(data[1,1], data[2,1]),
                       n = c(sum(data[1,]), sum(data[2,])))
print(prop_test)

## 
##  2-sample test for equality of proportions with continuity correction
## 
## data:  c(data[1, 1], data[2, 1]) out of c(sum(data[1, ]), sum(data[2, ]))
## X-squared = 18.136, df = 1, p-value = 2.057e-05
## alternative hypothesis: two.sided
## 95 percent confidence interval:
##  0.1450106 0.3583900
## sample estimates:
##    prop 1    prop 2 
## 0.5142003 0.2625000

Interpretasi

Berdasarkan hasil uji dua proporsi diperoleh bahwa estimasi proporsi kejadian kanker paru pada kelompok Smoker sebesar 0,5142, sedangkan pada kelompok Non-Smoker sebesar 0,2625. Hal ini menunjukkan bahwa proporsi penderita kanker paru pada kelompok Smoker lebih tinggi dibandingkan Non-Smoker.

Hasil uji hipotesis menunjukkan nilai statistik uji sebesar \(\chi^2\) = 18,136 dengan p-value = 2,057 × 10^{-5}, yang lebih kecil dari tingkat signifikansi \(\alpha\) = 0,05. Oleh karena itu, \(H_0\) ditolak, sehingga dapat disimpulkan bahwa terdapat perbedaan yang signifikan antara proporsi kejadian kanker paru pada kelompok Smoker dan Non-Smoker.

3. Interval Kepercayaan

Perhitungan Manual

Interval kepercayaan 95% untuk selisih proporsi dihitung menggunakan rumus sebagai berikut:

\[ (\hat{p}_1 - \hat{p}_2) \pm Z_{\alpha/2} \sqrt{ \frac{\hat{p}_1(1-\hat{p}_1)}{n_1} + \frac{\hat{p}_2(1-\hat{p}_2)}{n_2} } \] Berdasarkan perhitungan sebelumnya diperoleh selisih proporsi sebesar:

\[ \hat{p}_1 - \hat{p}_2 = 0.2517 \]

dan standar error sebesar 0.05105. Dengan menggunakan nilai \(Z_{0.025} = 1.96\), maka interval kepercayaan dihitung sebagai berikut:

\[ 0.2517 \pm 1.96 \times 0.05105 \]

Sehingga diperoleh interval kepercayaan 95% untuk selisih proporsi yaitu:

\[ CI = (0.1516 ; 0.3518) \]

Perhitungan Menggunakan R

prop_test <- prop.test(x = c(data[1,1], data[2,1]),
                       n = c(sum(data[1,]), sum(data[2,])))
print(prop_test)

## 
##  2-sample test for equality of proportions with continuity correction
## 
## data:  c(data[1, 1], data[2, 1]) out of c(sum(data[1, ]), sum(data[2, ]))
## X-squared = 18.136, df = 1, p-value = 2.057e-05
## alternative hypothesis: two.sided
## 95 percent confidence interval:
##  0.1450106 0.3583900
## sample estimates:
##    prop 1    prop 2 
## 0.5142003 0.2625000

n11 <- 688; n12 <- 650; n21 <- 21; n22 <- 59
n1. <- n11 + n12; n2. <- n21 + n22
# Risk Difference
p1<-(n11/n1.)
p2<-(n21/n2.)
rd <- p1 - p2
se_rd <- sqrt((p1 * (1 - p1) / n1.) + p2*((1 - p2) / n2.))
z_rd <- rd / se_rd

# Relative Risk
rr <- (n11/n1.) / (n21/n2.)
se_ln_rr <- sqrt((1/n11) - (1/n1.) + (1/n21) - (1/n2.))
z_rr <- log(rr) / se_ln_rr

# Odds Ratio
or <- (n11 * n22) / (n12 * n21)
se_ln_or <- sqrt((1/n11) + (1/n12) + (1/n21) + (1/n22))
z_or <- log(or) / se_ln_or

# Hasil
list(RD = rd, SE_RD = se_rd, Z_RD = z_rd, RR = rr, SE_Ln_RR = se_ln_rr, Z_RR = z_rr, OR = or, SE_Ln_OR = se_ln_or, Z_OR = z_or)

## $RD
## [1] 0.2517003
## 
## $SE_RD
## [1] 0.05105504
## 
## $Z_RD
## [1] 4.929979
## 
## $RR
## [1] 1.958858
## 
## $SE_Ln_RR
## [1] 0.1892753
## 
## $Z_RR
## [1] 3.552295
## 
## $OR
## [1] 2.973773
## 
## $SE_Ln_OR
## [1] 0.2599234
## 
## $Z_OR
## [1] 4.192896

Interpretasi

Interval kepercayaan 95% untuk selisih proporsi berada pada rentang (0,1450 ; 0,3584). Smoker punya kemungkinan kena kanker paru lebih tinggi sekitar 14%–36% dibanding Non-Smoker. Sehingga dapat disimpulkan bahwa terdapat perbedaan proporsi yang signifikan antara kedua kelompok.

Nilai Risk Difference (RD) sebesar 0.2517 menunjukkan bahwa proporsi kejadian kanker paru pada kelompok Smoker lebih tinggi sekitar 25,17% dibandingkan Non-Smoker. Nilai statistik uji sebesar \(Z = 4.93\) menunjukkan perbedaan tersebut signifikan.

Nilai Risk Ratio (RR) sebesar 1.9589 menunjukkan bahwa kelompok Smoker memiliki risiko terkena kanker paru sekitar 1,96 kali lebih besar dibandingkan kelompok Non-Smoker. Nilai \(Z = 3.55\) menunjukkan bahwa risiko tersebut signifikan.

Nilai Odds Ratio (OR) sebesar 2.9738 menunjukkan bahwa peluang (odds) terkena kanker paru pada kelompok Smoker sekitar 2,97 kali dibandingkan Non-Smoker. Nilai \(Z = 4.19\) menunjukkan bahwa perbedaan tersebut juga signifikan.

4. Uji Dua Proporsi

Perhitungan Manual

Uji dua proporsi digunakan untuk mengetahui apakah terdapat perbedaan proporsi kejadian antara dua kelompok independen. Dalam kasus ini, uji dua proporsi digunakan untuk membandingkan proporsi kejadian kanker paru pada kelompok Smoker dan Non-Smoker.

Hipotesis yang digunakan adalah:

\(H_0\): \(p_1 = p_2\) (tidak terdapat perbedaan proporsi kejadian kanker paru antara kedua kelompok)
\(H_1\): \(p_1 \neq p_2\) (terdapat perbedaan proporsi kejadian kanker paru antara kedua kelompok)

Perhitungan Menggunakan R

prop_test <- prop.test(x = c(data[1,1], data[2,1]),
                       n = c(sum(data[1,]), sum(data[2,])))
print(prop_test)

## 
##  2-sample test for equality of proportions with continuity correction
## 
## data:  c(data[1, 1], data[2, 1]) out of c(sum(data[1, ]), sum(data[2, ]))
## X-squared = 18.136, df = 1, p-value = 2.057e-05
## alternative hypothesis: two.sided
## 95 percent confidence interval:
##  0.1450106 0.3583900
## sample estimates:
##    prop 1    prop 2 
## 0.5142003 0.2625000

Interpretasi

Hasil uji hipotesis menunjukkan nilai statistik uji sebesar \(\chi^2\) = 18,136 dengan p-value = 2,057 × 10^{-5} yang lebih kecil dari tingkat signifikansi \(\alpha\) = 0,05. Sehingga \(H_0\) ditolak dan dapat disimpulkan bahwa terdapat perbedaan yang signifikan antara proporsi kejadian kanker paru pada kelompok Smoker dan Non-Smoker.

5. Uji Chi-Square Independensi

Konsep dan Hipotesis

Uji Chi-Square independensi digunakan untuk mengetahui apakah terdapat hubungan antara dua variabel kategorik. Dalam kasus ini, uji ini digunakan untuk menguji hubungan antara status merokok dan kejadian kanker paru.

Hipotesis yang digunakan adalah:

\(H_0\): Status merokok dan kejadian kanker paru saling independen (tidak berhubungan)
\(H_1\): Status merokok dan kejadian kanker paru tidak independen (berhubungan)

Perhitungan Menggunakan R

chisq_test <- chisq.test(data)
chisq_test

## 
##  Pearson's Chi-squared test with Yates' continuity correction
## 
## data:  data
## X-squared = 18.136, df = 1, p-value = 2.057e-05

Interpretasi

Berdasarkan hasil uji Chi-Square independensi diperoleh nilai statistik uji sebesar \(\chi^2\) = 18,136 dengan derajat bebas (df = 1) dan *p-value = 2,057 × 10^{-5}**. Nilai p-value tersebut lebih kecil dari tingkat signifikansi \(\alpha\) = 0,05. Sehingga \(H_0\) ditolak yang artinya terdapat hubungan yang signifikan antara status merokok dan kejadian kanker paru.

6. Uji Likelihood Ratio

Konsep dan Hipotesis

Uji Likelihood Ratio (\(G^2\)) digunakan untuk menguji apakah terdapat hubungan antara dua variabel kategorik berdasarkan pendekatan likelihood. Uji ini merupakan alternatif dari uji Chi-Square dan sering digunakan untuk membandingkan frekuensi observasi dengan frekuensi harapan dalam tabel kontingensi.

Dalam kasus ini, uji Likelihood Ratio digunakan untuk mengetahui apakah terdapat hubungan antara status merokok dan kejadian kanker paru.

Hipotesis yang digunakan adalah:

\(H_0\): Status merokok dan kejadian kanker paru saling independen (tidak berhubungan)
\(H_1\): Status merokok dan kejadian kanker paru tidak independen (berhubungan)

Perhitungan Menggunakan R

# Hitung Frekuensi Ekspektasi
data_expected <- chisq.test(data)$expected

# Hitung Statistik G²
G2 <- 2 * sum(data * log(data / data_expected))

# Nilai kritis chi-square untuk df = 1 dan alpha = 0.05
critical_value <- qchisq(0.95, df = 1)

# Hasil
list(G2 = G2, Critical_Value = critical_value, Decision = ifelse(G2 > critical_value, "Reject H0", "Fail to Reject H0"))

## $G2
## [1] 19.87802
## 
## $Critical_Value
## [1] 3.841459
## 
## $Decision
## [1] "Reject H0"

Interpretasi

Uji Likelihood Ratio(\(G^2\)) digunakan sebgaia alternatif dari uji Chi-Square untuk menguji independensi dalam tabel kontingensi. Jika \(G^2\) lebih besar dari nilai kritis \(\chi^2\), maka \(H_0\) ditolak yang artinya terdapat hubungan antara dua variabel.

Dari hasil tersebut didapatkan \(G^2\) = 19.87802 yang lebih besar dari nilai kritis yaitu 3.841, sehingga dapat disimpulkan bahwa terdapat hubungan yang isgnifikan antara status merokok dan kejadian kanker paru.

7. Fisher Exact Test

Konsep dan Hipotesis

Fisher Exact Test digunakan untuk menguji hubungan antara dua variabel kategorik dalam tabel kontingensi terutama ketika ukuran sampel kecil atau terdapat frekuensi harapan yang kurang dari 5. Uji ini tidak menggunakan pendekatan aproksimasi seperti uji Chi-Square melainkan menggunakan perhitungan probabilitas secara eksak.

Dalam kasus ini, Fisher Exact Test digunakan untuk mengetahui apakah terdapat hubungan antara status merokok dan kejadian kanker paru.

Hipotesis yang digunakan adalah:

\(H_0\): Status merokok dan kejadian kanker paru saling independen (tidak berhubungan)
\(H_1\): Status merokok dan kejadian kanker paru tidak independen (berhubungan)

Perhitungan Mengguakan R

fisher.test(data)

## 
##  Fisher's Exact Test for Count Data
## 
## data:  data
## p-value = 1.476e-05
## alternative hypothesis: true odds ratio is not equal to 1
## 95 percent confidence interval:
##  1.755611 5.210711
## sample estimates:
## odds ratio 
##   2.971634

Interpretasi

Berdasarkan hasil Fisher Exact Test diperoleh p-value = 1,476 × 10^{-5} yang lebih kecil dari tingkat signifikansi \(\alpha = 0,05\). Sehingga hipotesis nol (\(H_0\)) ditolak dan dapat disimpulkan bahwa terdapat hubungan yang signifikan antara status merokok dan kejadian kanker paru.

Nilai odds ratio sebesar 2,9716 menunjukkan bahwa peluang (odds) terkena kanker paru pada kelompok Smoker sekitar 2,97 kali lebih besar dibandingkan dengan kelompok Non-Smoker.

Interval kepercayaan 95% untuk odds ratio berada pada rentang (1,7556 ; 5,2107). Karena interval tersebut tidak mencakup nilai 1, maka hasil ini menunjukkan bahwa perbedaan tersebut signifikan.

8. Perbandingan Hasil Uji

Untuk melihat perbandingan hasil uji diatas, berikut adalah perbandingan hasil uji dua proporsi, uji Chi-Square independensi, uji Likelihood Ratio (G²), dan Fisher Exact Test.

Metode Uji	Hipotesis	Statistik Uji	P-value	Keputusan
Uji Dua Proporsi	\(p_1 = p_2\)	\(Z\) atau \(\chi^2\)	\(2.057 \times 10^{-5}\)	Tolak \(H_0\)
Chi-Square	Independen	\(\chi^2 = 18.136\)	\(2.057 \times 10^{-5}\)	Tolak \(H_0\)
Likelihood Ratio (G²)	Independen	\(G^2 = 19.878\)	< 0.05	Tolak \(H_0\)
Fisher Exact Test	Independen	OR ≈ 2.97	\(1.48 \times 10^{-5}\)	Tolak \(H_0\)

9. Kesimpulan

Berdasarkan seluruh analisis yang telah dilakukan, diperoleh bahwa proporsi kejadian kanker paru pada kelompok Smoker lebih tinggi dibandingkan dengan kelompok Non-Smoker. Hasil estimasi menunjukkan bahwa proporsi pada kelompok Smoker mencapai sekitar 51,42%, sedangkan pada Non-Smoker sebesar 26,25%.

Interval kepercayaan 95% untuk selisih proporsi menunjukkan bahwa perbedaan tersebut berada pada rentang sekitar 15% hingga 35%, yang tidak mencakup nol, sehingga mengindikasikan adanya perbedaan yang signifikan.

Selain itu, hasil pengujian statistik menggunakan uji dua proporsi, uji Chi-Square independensi, uji Likelihood Ratio (G²), dan Fisher Exact Test secara konsisten menghasilkan p-value yang lebih kecil dari 0,05, sehingga hipotesis nol (\(H_0\)) ditolak pada semua metode. Hal ini menunjukkan bahwa terdapat hubungan yang signifikan antara status merokok dan kejadian kanker paru.

Ukuran asosiasi yang diperoleh, yaitu Risk Difference (RD \(\approx\) 0,25), Risk Ratio (RR \(\approx\) 1,96), dan Odds Ratio (OR \(\approx\) 2,97), semakin memperkuat bahwa kelompok Smoker memiliki risiko dan peluang yang lebih tinggi untuk mengalami kanker paru dibandingkan kelompok Non-Smoker.

Dengan demikian, dapat disimpulkan bahwa status merokok memiliki hubungan yang signifikan dan berpengaruh terhadap peningkatan kejadian kanker paru.

Kasus 2

1. Tabel Kontingensi

Penyusunan Manual

Berdasarkan data pada kasus 2, tabel kontingensi 2×3 antara gender dan identifikasi partai politik dapat disusun sebagai berikut:

Gender	Democrat	Republican	Independent	Total
Female	495	272	590	1357
Male	330	265	498	1093
Total	825	537	1088	2450

Penyusunan Menggunakan R

set.seed(123)
data2<- matrix(c(495, 272, 590, 330, 265, 498), nrow = 2, byrow = TRUE)
dimnames(data2) <- list("Gender" = c("Female", "Male"), "Partai Politik" = c("Democrat", "Republican", "Independent"))
addmargins(data, FUN = list(Total = sum))

## Margins computed over dimensions
## in the following order:
## 1: Status Merokok
## 2: Cancer

##               Cancer
## Status Merokok  Ya Tidak Total
##     Smoker     688   650  1338
##     Non-Smoker  21    59    80
##     Total      709   709  1418

2. Visualisasi

mosaicplot(data2,
           col = c("#e6f2ff", "#b3d9ff", "#80bfff"),
           main = "Mosaic Plot: Gender vs Partai Politik",
           xlab = "Gender",
           ylab = "Partai Politik")

Mosaic plot tersebut menggambarkan hubungan antara gender (Female dan Male) dengan partai politik (Democrat, Republican, dan Independent) berdasarkan proporsi luas masing-masing kotak. Dari plot terlihat bahwa secara keseluruhan proporsi perempuan (Female) lebih besar dibandingkan laki-laki (Male), yang menunjukkan bahwa jumlah responden perempuan dalam data ini lebih banyak.

Jika dilihat berdasarkan pilihan partai politik, baik pada kelompok perempuan maupun laki-laki, kategori Independent memiliki proporsi paling besar. Hal ini menunjukkan bahwa mayoritas responden cenderung tidak berafiliasi dengan partai politik utama.

Selain itu, terdapat kecenderungan bahwa pada kategori Democrat, proporsi perempuan lebih besar dibandingkan laki-laki, yang mengindikasikan bahwa perempuan relatif lebih banyak memilih atau berafiliasi dengan partai tersebut. Sebaliknya, pada kategori Republican, proporsi laki-laki terlihat sedikit lebih besar dibandingkan perempuan, sehingga dapat dikatakan bahwa laki-laki cenderung lebih banyak berada pada kelompok ini.

Meskipun terdapat perbedaan pola antara gender dan pilihan partai politik, perbedaannya tidak terlalu mencolok. Oleh karena itu, dapat disimpulkan bahwa ada indikasi hubungan antara gender dan partai politik, namun hubungan tersebut tidak terlalu kuat secara visual dan masih perlu dikonfirmasi lebih lanjut dengan uji statistik seperti uji chi-square.

3. Frekuensi Harapan

Perhitungan Manual

Frekuensi harapan (expected frequency) digunakan dalam uji Chi-Square untuk mengetahui nilai yang diharapkan jika tidak terdapat hubungan antara kedua variabel.

Frekuensi harapan dihitung dengan rumus:

\[ E_{ij} = \frac{(\text{Total baris ke-i}) \times (\text{Total kolom ke-j})}{\text{Total keseluruhan}} \]

Berdasarkan tabel kontingensi yang diberikan, total keseluruhan data adalah 2450.

Sebagai contoh, untuk sel (Female, Democrat):

\[ E_{11} = \frac{1357 \times 825}{2450} = 456.97 \]

Untuk sel (Female, Republican):

\[ E_{12} = \frac{1357 \times 537}{2450} = 297.36 \]

Untuk sel (Female, Independent):

\[ E_{13} = \frac{1357 \times 1088}{2450} = 602.67 \]

Untuk sel (Male, Democrat):

\[ E_{21} = \frac{1093 \times 825}{2450} = 368.03 \]

Untuk sel (Male, Republican):

\[ E_{22} = \frac{1093 \times 537}{2450} = 239.64 \]

Untuk sel (Male, Independent):

\[ E_{23} = \frac{1093 \times 1088}{2450} = 485.33 \]

Perhitungan Menggunakan R

expected <- chisq.test(data2)$expected; expected

##         Partai Politik
## Gender   Democrat Republican Independent
##   Female  456.949   297.4322    602.6188
##   Male    368.051   239.5678    485.3812

Intrepretasi

Berdasarkan hasil perhitungan frekuensi harapan, diperoleh nilai expected untuk setiap sel pada tabel kontingensi dengan asumsi bahwa tidak terdapat hubungan antara variabel Gender dan Partai Politik.

Sebagai contoh, jumlah individu Female yang diharapkan memilih Democrat adalah sekitar 456.95, sedangkan yang diamati sebesar 495. Hal ini menunjukkan bahwa jumlah observasi lebih besar dari yang diharapkan.

Sebaliknya, pada kategori Male–Democrat frekuensi yang diharapkan sebesar 368.05, sedangkan yang diamati hanya 330, sehingga lebih kecil dari nilai harapannya.

Secara umum, terdapat perbedaan antara frekuensi observasi dan frekuensi harapan pada beberapa sel. Hal ini mengindikasikan adanya kemungkinan hubungan antara Gender dan Partai Politik yang selanjutnya dapat diuji menggunakan uji Chi-Square.

4. Uji Chi-Square Independensi

Konsep dan Hipotesis

Uji Chi-Square independensi digunakan untuk mengetahui apakah terdapat hubungan antara dua variabel kategorik. Uji ini membandingkan frekuensi observasi dengan frekuensi harapan yang diperoleh jika kedua variabel saling independen.

Dalam kasus ini, uji Chi-Square digunakan untuk menguji apakah terdapat hubungan antara Gender dan Partai Politik.

Hipotesis yang digunakan adalah:

\(H_0\): Gender dan Partai Politik saling independen (tidak terdapat hubungan)
\(H_1\): Gender dan Partai Politik tidak independen (terdapat hubungan)

Perhitungan Menggunakan R

# Uji Chi-Square
chi_test <- chisq.test(data2)

# Hasil
list(Chi_Square = chi_test$statistic, P_Value = chi_test$p.value, Decision = ifelse(chi_test$p.value < 0.05, "Reject H0", "Fail to Reject H0"))

## $Chi_Square
## X-squared 
##  12.56926 
## 
## $P_Value
## [1] 0.00186475
## 
## $Decision
## [1] "Reject H0"

Intrepretasi

Berdasarkan hasil uji Chi-Square diperoleh nilai statistik uji sebesar \(\chi^2\) = 12.57 dengan p-value = 0.0019. Karena nilai p-value lebih kecil dari tingkat signifikansi \(\alpha = 0.05\), maka hipotesis nol (\(H_0\)) ditolak. Sehinggadapat disimpulkan bahwa terdapat hubungan yang signifikan antara Gender dan Partai Politik. Dengan kata lain, preferensi partai politik tidak independen terhadap gender.

5. Residual Pearson

Konsep

Residual Pearson digunakan untuk mengidentifikasi sel mana dalam tabel kontingensi yang memberikan kontribusi terbesar terhadap nilai statistik Chi-Square. Residual ini mengukur selisih antara frekuensi observasi dan frekuensi harapan yang telah dinormalisasi.

Residual Pearson dihitung dengan rumus:

\[ r_{ij} = \frac{O_{ij} - E_{ij}}{\sqrt{E_{ij}}} \]

dengan:

\(O_{ij}\) adalah frekuensi observasi
\(E_{ij}\) adalah frekuensi harapan.

Interpretasi residual:

\(|r_{ij}| > 2\) → sel memberikan kontribusi besar (signifikan)
\(|r_{ij}| \leq 2\) → kontribusi kecil

Nilai residual positif menunjukkan bahwa frekuensi observasi lebih besar dari yang diharapkan, sedangkan nilai negatif menunjukkan bahwa frekuensi observasi lebih kecil dari yang diharapkan.

Perhitungan Menggunakan R

# Residual Pearson
residual <- chisq.test(data2)$residuals; residual

##         Partai Politik
## Gender    Democrat Republican Independent
##   Female  1.780051  -1.474656  -0.5140388
##   Male   -1.983409   1.643125   0.5727640

Intrepretasi

Nilai residual terbesar (dalam nilai absolut) terdapat pada kategori Male–Democrat sebesar -1.98 dan Female–Democrat sebesar 1.78. Hal ini menunjukkan bahwa pada kelompok Female, jumlah yang memilih Democrat lebih besar dari yang diharapkan. Sedangkan pada kelompok Male, jumlahnya lebih kecil dari yang diharapkan.

Pada kategori Republican, kelompok Male memiliki residual positif (1.64) yang menunjukkan jumlah observasi lebih besar dari yang diharapkan, sedangkan Female lebih kecil dari yang diharapkan.

Sementara itu, kategori Independent memiliki nilai residual yang relatif kecil (kurang dari 2), sehingga kontribusinya terhadap hubungan secara keseluruhan tidak terlalu besar.

Secara umum, meskipun tidak ada nilai residual yang melebihi batas ±2, kategori Democrat dan Republican memberikan kontribusi terbesar terhadap hubungan antara Gender dan Partai Politik.

6. Partisi Chi-Square

Konsep

Partisi Chi-Square digunakan untuk membagi nilai Chi-Square total menjadi beberapa bagian untuk mengetahui kategori mana yang paling berkontribusi terhadap hubungan antar variabel.

Pada kasus ini, partisi dilakukan menjadi dua bagian:

Perbandingan antara Democrat dan Republican
Perbandingan antara (democrat + Republican) dan independent

Partisi 1: Democrat vs Republican

# Democrat vs Republican
partisi1 <- data2[, c("Democrat", "Republican")]; partisi1

##         Partai Politik
## Gender   Democrat Republican
##   Female      495        272
##   Male        330        265

uji_partisi1 <- chisq.test(partisi1, correct = FALSE); uji_partisi1

## 
##  Pearson's Chi-squared test
## 
## data:  partisi1
## X-squared = 11.555, df = 1, p-value = 0.0006758

Partisi 2: (Democrat + Republican) vs Independent

# Gabungkan Democrat + Republican
gabungan <- data2[, "Democrat"] + data2[, "Republican"]

# Buat tabel partisi 2
partisi2 <- cbind("Dem+Rep" = gabungan,
                  "Independent" = data2[, "Independent"]); partisi2

##        Dem+Rep Independent
## Female     767         590
## Male       595         498

uji_partisi2 <- chisq.test(partisi2, correct = FALSE); uji_partisi2

## 
##  Pearson's Chi-squared test
## 
## data:  partisi2
## X-squared = 1.0654, df = 1, p-value = 0.302

Intrepretasi

Berdasarkan hasil uji Chi-Square pada partisi Democrat vs Republican, diperoleh nilai \(\chi^2\) = 11.555 dengan p-value = 0.00068. Karena p-value < 0.05, maka hipotesis nol (\(H_0\)) ditolak. Sehingga dapat disimpulkan bahwa terdapat perbedaan yang signifikan antara Gender dalam memilih partai Democrat dan Republican. Dengan kata lain, preferensi terhadap kedua partai tersebut dipengaruhi oleh gender.

Berdasarkan hasil uji Chi-Square pada partisi (Democrat + Republican) vs Independent, diperoleh nilai \(\chi^2\) = 1.065 dengan p-value = 0.302. Karena p-value > 0.05, maka hipotesis nol (\(H_0\)) gagal ditolak. Sehingga dapat dsimpulkan bahwa tidak terdapat perbedaan yang signifikan antara Gender dalam memilih kelompok (Democrat + Republican) dibandingkan dengan Independent. Dengan kata lain, preferensi terhadap kategori ini tidak dipengaruhi oleh gender.

7. Perbandingan Hasil Partisi dan Uji Keseluruhan

Berdasarkan uji Chi-Square keseluruhan diperoleh nilai \(\chi^2\) = 12.57 dengan p-value = 0.0019, yang menunjukkan adanya hubungan signifikan antara Gender dan Partai Politik. Hasil partisi menunjukkan bahwa signifikansi tersebut terutama berasal dari perbandingan Democrat vs Republican (p-value = 0.00068), sedangkan partisi (Democrat + Republican) vs Independent tidak signifikan (p-value = 0.302). Hal ini mengindikasikan bahwa kategori Independent tidak berperan besar dalam hubungan yang terdeteksi pada uji keseluruhan.

8. Interpretasi Kontribusi Kategori

Berdasarkan analisis residual Pearson, kontribusi terbesar terhadap hubungan Gender dan Partai Politik berasal dari kategori Democrat dan Republican, yang ditunjukkan oleh nilai residual yang relatif besar pada beberapa kombinasi gender, terutama Female–Democrat dan Male–Democrat. Sementara itu, kategori Independent memiliki residual yang kecil sehingga kontribusinya terhadap pola hubungan secara keseluruhan relatif rendah.

Tugas 2 ADK : Inferensi Tabel Kontingensi Dua Arah

Fathiya Syakira

2026-04-10

Pendahuluan

Kasus 1

1. Tabel Kontingensi

2. Estimasi Titik Proporsi

3. Interval Kepercayaan

4. Uji Dua Proporsi

5. Uji Chi-Square Independensi

6. Uji Likelihood Ratio

7. Fisher Exact Test

8. Perbandingan Hasil Uji

9. Kesimpulan

Kasus 2

1. Tabel Kontingensi

2. Visualisasi

3. Frekuensi Harapan

4. Uji Chi-Square Independensi

5. Residual Pearson

6. Partisi Chi-Square

7. Perbandingan Hasil Partisi dan Uji Keseluruhan

8. Interpretasi Kontribusi Kategori