1 Definisi Analisis Data Kategori

1.1 Apa yang Dimaksud dengan Analisis Data Kategori?

Analisis Data Kategori (Categorical Data Analysis) adalah sekumpulan metode statistik yang dirancang khusus untuk menganalisis data yang diukur pada skala nominal atau ordinal, di mana setiap observasi dikelompokkan ke dalam kategori-kategori yang bersifat diskret dan tidak kontinu.

Berbeda dengan analisis data kontinu yang menggunakan mean, variansi, atau distribusi normal, analisis data kategori menggunakan frekuensi, proporsi, dan probabilitas sebagai dasar inferensi statistik. Metode-metode utama dalam analisis data kategori meliputi:

Tabel Kontingensi (Contingency Table): Menyusun data dua variabel kategori atau lebih secara bersama.
Uji Chi-Square: Menguji independensi antar variabel kategori.
Ukuran Asosiasi: Odds Ratio, Relative Risk, Phi Coefficient.
Regresi Logistik: Memodelkan peluang kejadian pada variabel respons biner.
Model Log-Linear: Menganalisis struktur dependensi pada tabel multidimensi.

1.2 Karakteristik Variabel Kategori

Variabel kategori memiliki karakteristik yang membedakannya dari variabel kontinu:

Karakteristik	Penjelasan
Diskret	Nilai hanya berupa kategori tertentu, tidak ada nilai di antara dua kategori
Tidak Terukur Secara Numerik	Nilai tidak memiliki jarak (interval) yang bermakna secara matematis
Skala Nominal	Kategori tidak memiliki urutan alami (contoh: jenis kelamin, agama)
Skala Ordinal	Kategori memiliki urutan alami, tetapi jarak antar kategori tidak sama (contoh: tingkat pendidikan, tingkat kepuasan)
Ringkasan dengan Frekuensi	Dideskripsikan dengan frekuensi dan proporsi, bukan rata-rata

1.3 Contoh Penerapan Analisis Data Kategori dalam Penelitian

Analisis data kategori digunakan secara luas di berbagai bidang keilmuan:

1. Bidang Kesehatan Masyarakat Meneliti apakah ada hubungan antara kebiasaan konsumsi gula berlebih (ya/tidak) dengan kejadian diabetes tipe 2 (ya/tidak) pada populasi dewasa.

2. Bidang Pendidikan Menganalisis apakah metode pembelajaran (daring/luring/hybrid) berpengaruh terhadap kelulusan tepat waktu (lulus tepat waktu/tidak) mahasiswa.

3. Bidang Sosiologi Menguji apakah terdapat hubungan antara tingkat pendidikan ibu (SD/SMP/SMA/Perguruan Tinggi) dengan status gizi balita (normal/stunting/wasting).

4. Bidang Ekonomi Memeriksa asosiasi antara kepemilikan kartu kredit (ya/tidak) dengan keputusan membeli secara impulsif (ya/tidak) pada konsumen ritel.

2 Tabel Kontingensi

2.1 Definisi Tabel Kontingensi

Tabel Kontingensi (Contingency Table atau Cross-tabulation Table) adalah suatu tabel yang merangkum distribusi frekuensi bersama dari dua atau lebih variabel kategori secara simultan. Tabel ini memperlihatkan bagaimana observasi tersebar di setiap kombinasi kategori dari variabel-variabel yang diamati.

Tabel kontingensi yang melibatkan dua variabel dengan masing-masing \(r\) baris dan \(c\) kolom disebut tabel kontingensi \(r \times c\). Kasus paling sederhana adalah tabel \(2 \times 2\) yang melibatkan dua variabel biner.

2.2 Struktur Tabel Kontingensi

Secara umum, struktur tabel kontingensi \(r \times c\) adalah sebagai berikut:

	\(Y = 1\)	\(Y = 2\)	\(\cdots\)	\(Y = c\)	Total Baris
\(X = 1\)	\(n_{11}\)	\(n_{12}\)	\(\cdots\)	\(n_{1c}\)	\(n_{1\bullet}\)
\(X = 2\)	\(n_{21}\)	\(n_{22}\)	\(\cdots\)	\(n_{2c}\)	\(n_{2\bullet}\)
\(\vdots\)	\(\vdots\)	\(\vdots\)	\(\ddots\)	\(\vdots\)	\(\vdots\)
\(X = r\)	\(n_{r1}\)	\(n_{r2}\)	\(\cdots\)	\(n_{rc}\)	\(n_{r\bullet}\)
Total Kolom	\(n_{\bullet 1}\)	\(n_{\bullet 2}\)	\(\cdots\)	\(n_{\bullet c}\)	\(n\)

Keterangan:

\(n_{ij}\): frekuensi observasi pada baris ke-\(i\) dan kolom ke-\(j\)
\(n_{i\bullet} = \sum_j n_{ij}\): total marginal baris ke-\(i\)
\(n_{\bullet j} = \sum_i n_{ij}\): total marginal kolom ke-\(j\)
\(n = \sum_i \sum_j n_{ij}\): total keseluruhan observasi

2.3 Konsep Joint Distribution

Distribusi Bersama (Joint Distribution) menggambarkan probabilitas bahwa dua variabel secara bersamaan mengambil nilai-nilai tertentu.

Secara formal, joint probability didefinisikan sebagai:

\[\pi_{ij} = P(X = i, Y = j)\]

Ditaksir dari data sampel sebagai:

\[\hat{\pi}_{ij} = \frac{n_{ij}}{n}\]

dengan syarat:

\[\sum_{i=1}^{r} \sum_{j=1}^{c} \pi_{ij} = 1\]

Joint distribution memberikan gambaran lengkap tentang sebaran bersama dua variabel kategori dalam suatu populasi.

2.4 Konsep Marginal Distribution

Distribusi Marginal (Marginal Distribution) adalah distribusi probabilitas untuk satu variabel, diperoleh dengan menjumlahkan (memarjinalkan) probabilitas bersama atas semua nilai variabel lainnya.

Marginal distribution untuk baris (variabel X):

\[\pi_{i\bullet} = P(X = i) = \sum_{j=1}^{c} \pi_{ij}\]

Marginal distribution untuk kolom (variabel Y):

\[\pi_{\bullet j} = P(Y = j) = \sum_{i=1}^{r} \pi_{ij}\]

Distribusi marginal memberikan informasi tentang distribusi masing-masing variabel secara terpisah, tanpa memperhatikan variabel lainnya.

2.5 Konsep Conditional Probability

Probabilitas Bersyarat (Conditional Probability) adalah probabilitas suatu kejadian terjadi, dengan syarat bahwa kejadian lain telah diketahui terjadi.

Probabilitas bersyarat Y = j diberikan X = i:

\[P(Y = j \mid X = i) = \frac{P(X = i, Y = j)}{P(X = i)} = \frac{\pi_{ij}}{\pi_{i\bullet}}\]

Probabilitas bersyarat X = i diberikan Y = j:

\[P(X = i \mid Y = j) = \frac{\pi_{ij}}{\pi_{\bullet j}}\]

Jika \(P(Y = j \mid X = i) = P(Y = j)\) untuk semua \(i\) dan \(j\), maka variabel \(X\) dan \(Y\) dikatakan independen (saling bebas).

2.6 Contoh Tabel Kontingensi 2×2

Misalkan sebuah penelitian mengamati hubungan antara kebiasaan membaca buku (Rutin/Tidak Rutin) dan kemampuan berpikir kritis (Tinggi/Rendah) pada 200 mahasiswa:

# Membuat tabel kontingensi 2x2
tabel_buku <- matrix(c(80, 20, 40, 60),
                     nrow = 2, byrow = TRUE)
rownames(tabel_buku) <- c("Rutin Membaca", "Tidak Rutin")
colnames(tabel_buku) <- c("Berpikir Kritis Tinggi", "Berpikir Kritis Rendah")

# Tampilkan tabel frekuensi
cat("=== Tabel Kontingensi: Kebiasaan Membaca vs Berpikir Kritis ===\n\n")

#> === Tabel Kontingensi: Kebiasaan Membaca vs Berpikir Kritis ===

print(addmargins(tabel_buku))

#>               Berpikir Kritis Tinggi Berpikir Kritis Rendah Sum
#> Rutin Membaca                     80                     20 100
#> Tidak Rutin                       40                     60 100
#> Sum                              120                     80 200

Interpretasi distribusi:

n_total <- sum(tabel_buku)

cat("=== Joint Distribution (Proporsi Bersama) ===\n")

#> === Joint Distribution (Proporsi Bersama) ===

joint <- round(tabel_buku / n_total, 4)
print(addmargins(joint))

#>               Berpikir Kritis Tinggi Berpikir Kritis Rendah Sum
#> Rutin Membaca                    0.4                    0.1 0.5
#> Tidak Rutin                      0.2                    0.3 0.5
#> Sum                              0.6                    0.4 1.0

cat("\n=== Marginal Distribution Baris (P(X=i)) ===\n")

#> 
#> === Marginal Distribution Baris (P(X=i)) ===

marg_baris <- rowSums(tabel_buku) / n_total
print(round(marg_baris, 4))

#> Rutin Membaca   Tidak Rutin 
#>           0.5           0.5

cat("\n=== Marginal Distribution Kolom (P(Y=j)) ===\n")

#> 
#> === Marginal Distribution Kolom (P(Y=j)) ===

marg_kolom <- colSums(tabel_buku) / n_total
print(round(marg_kolom, 4))

#> Berpikir Kritis Tinggi Berpikir Kritis Rendah 
#>                    0.6                    0.4

cat("\n=== Conditional Probability P(Y | X) ===\n")

#> 
#> === Conditional Probability P(Y | X) ===

cond_prob <- round(prop.table(tabel_buku, margin = 1), 4)
print(cond_prob)

#>               Berpikir Kritis Tinggi Berpikir Kritis Rendah
#> Rutin Membaca                    0.8                    0.2
#> Tidak Rutin                      0.4                    0.6

3 Ukuran Asosiasi

3.1 Penjelasan Ukuran Asosiasi pada Tabel Kontingensi

Ukuran Asosiasi (Measures of Association) adalah statistik yang mengukur kekuatan dan arah hubungan antara dua variabel kategori. Ukuran ini sangat penting dalam epidemiologi, ilmu kesehatan, dan ilmu sosial untuk menginterpretasikan besarnya hubungan antar variabel.

Pada tabel kontingensi \(2 \times 2\), notasi sel adalah sebagai berikut:

	Outcome (+)	Outcome (−)	Total
Exposed (+)	\(a\)	\(b\)	\(a + b\)
Not Exposed (−)	\(c\)	\(d\)	\(c + d\)
Total	\(a + c\)	\(b + d\)	\(n\)

3.2 Rumus Matematis Ukuran Asosiasi

3.2.1 Odds

Odds adalah rasio antara peluang suatu kejadian terjadi dengan peluang kejadian tersebut tidak terjadi.

Odds untuk kelompok Exposed: \[\text{Odds}_{\text{exposed}} = \frac{a / (a+b)}{b / (a+b)} = \frac{a}{b}\]

Odds untuk kelompok Not Exposed: \[\text{Odds}_{\text{unexposed}} = \frac{c / (c+d)}{d / (c+d)} = \frac{c}{d}\]

Interpretasi: Odds = 3 berarti kejadian 3 kali lebih mungkin terjadi dibandingkan tidak terjadi.

3.2.2 Odds Ratio (OR)

Odds Ratio adalah rasio antara odds pada kelompok terpapar (exposed) dibandingkan dengan odds pada kelompok tidak terpapar (unexposed).

\[\text{OR} = \frac{\text{Odds}_{\text{exposed}}}{\text{Odds}_{\text{unexposed}}} = \frac{a/b}{c/d} = \frac{ad}{bc}\]

Interpretasi: - \(\text{OR} = 1\): Tidak ada asosiasi antara paparan dan outcome - \(\text{OR} > 1\): Paparan meningkatkan risiko outcome (faktor risiko) - \(\text{OR} < 1\): Paparan menurunkan risiko outcome (faktor protektif)

3.2.3 Relative Risk (RR)

Relative Risk (atau Risk Ratio) adalah rasio antara risiko (probabilitas) terjadinya outcome pada kelompok terpapar dibandingkan pada kelompok tidak terpapar.

\[\text{RR} = \frac{P(\text{Outcome} \mid \text{Exposed})}{P(\text{Outcome} \mid \text{Not Exposed})} = \frac{a/(a+b)}{c/(c+d)}\]

Interpretasi: - \(\text{RR} = 1\): Risiko sama di kedua kelompok - \(\text{RR} > 1\): Kelompok terpapar memiliki risiko lebih tinggi - \(\text{RR} < 1\): Kelompok terpapar memiliki risiko lebih rendah

Catatan: RR hanya dapat dihitung pada studi kohort atau cross-sectional. Pada studi case-control, gunakan OR sebagai pendekatan.

4 Contoh Perhitungan Manual

4.1 Studi Kasus: Paparan Polusi Udara dan Kejadian Asma pada Anak

Latar Belakang: Penelitian ini menginvestigasi apakah anak-anak yang tinggal di dekat kawasan industri (paparan polusi udara tinggi) memiliki risiko kejadian asma yang lebih besar dibandingkan anak-anak yang tinggal di kawasan perumahan (paparan rendah).

Desain: Studi kohort prospektif, n = 300 anak usia 6–12 tahun, observasi selama 2 tahun.

4.2 Membuat Tabel Kontingensi

Data yang diperoleh dari penelitian adalah sebagai berikut:

	Asma (+)	Asma (−)	Total
Dekat Industri	75	75	150
Jauh dari Industri	30	120	150
Total	105	195	300

Sehingga: \(a = 75\), \(b = 75\), \(c = 30\), \(d = 120\), \(n = 300\)

4.3 Menghitung Peluang Bersyarat

Peluang Asma pada anak dekat industri:

\[P(\text{Asma} \mid \text{Dekat Industri}) = \frac{a}{a + b} = \frac{75}{75 + 75} = \frac{75}{150} = 0{,}50\]

Peluang Asma pada anak jauh dari industri:

\[P(\text{Asma} \mid \text{Jauh dari Industri}) = \frac{c}{c + d} = \frac{30}{30 + 120} = \frac{30}{150} = 0{,}20\]

4.4 Menghitung Odds

Odds Asma pada kelompok Dekat Industri:

\[\text{Odds}_{\text{dekat}} = \frac{a}{b} = \frac{75}{75} = 1{,}00\]

Artinya: Anak di dekat industri memiliki peluang asma sama besar dengan peluang tidak asma (1:1).

Odds Asma pada kelompok Jauh dari Industri:

\[\text{Odds}_{\text{jauh}} = \frac{c}{d} = \frac{30}{120} = 0{,}25\]

Artinya: Anak jauh dari industri, peluang asma 4 kali lebih kecil dari peluang tidak asma.

4.5 Menghitung Odds Ratio

\[\text{OR} = \frac{\text{Odds}_{\text{dekat}}}{\text{Odds}_{\text{jauh}}} = \frac{a/b}{c/d} = \frac{ad}{bc} = \frac{75 \times 120}{75 \times 30} = \frac{9000}{2250} = 4{,}00\]

Menghitung Relative Risk:

\[\text{RR} = \frac{a/(a+b)}{c/(c+d)} = \frac{75/150}{30/150} = \frac{0{,}50}{0{,}20} = 2{,}50\]

Kesimpulan Perhitungan Manual:

Peluang bersyarat: Anak dekat industri memiliki peluang asma 50%, sementara anak jauh dari industri hanya 20%.
Odds Ratio = 4,00: Anak yang tinggal dekat kawasan industri memiliki odds terkena asma 4 kali lebih besar dibandingkan anak yang jauh dari industri.
Relative Risk = 2,50: Risiko asma pada anak dekat industri 2,5 kali lebih tinggi dibandingkan anak jauh dari industri.

5 Analisis Menggunakan R

5.1 Membuat Tabel Kontingensi

# ============================================================
# DATA: Paparan Polusi Udara vs Kejadian Asma pada Anak
# ============================================================
data_asma <- matrix(c(75, 75, 30, 120),
                    nrow = 2,
                    byrow = TRUE)

rownames(data_asma) <- c("Dekat Industri", "Jauh dari Industri")
colnames(data_asma) <- c("Asma (+)", "Asma (-)")

cat("=== Tabel Kontingensi: Paparan Polusi vs Asma ===\n\n")

#> === Tabel Kontingensi: Paparan Polusi vs Asma ===

print(addmargins(data_asma))

#>                    Asma (+) Asma (-) Sum
#> Dekat Industri           75       75 150
#> Jauh dari Industri       30      120 150
#> Sum                     105      195 300

5.2 Menghitung Odds Ratio

# ----- Menghitung Odds -----
a <- data_asma[1, 1]  # Dekat Industri & Asma
b <- data_asma[1, 2]  # Dekat Industri & Tidak Asma
c_val <- data_asma[2, 1]  # Jauh dari Industri & Asma
d <- data_asma[2, 2]  # Jauh dari Industri & Tidak Asma

odds_dekat <- a / b
odds_jauh  <- c_val / d
OR_manual  <- (a * d) / (b * c_val)
RR_manual  <- (a / (a + b)) / (c_val / (c_val + d))

cat("=== Hasil Perhitungan Ukuran Asosiasi ===\n\n")

#> === Hasil Perhitungan Ukuran Asosiasi ===

cat(sprintf("Odds (Dekat Industri)      : %.4f\n", odds_dekat))

#> Odds (Dekat Industri)      : 1.0000

cat(sprintf("Odds (Jauh dari Industri)  : %.4f\n", odds_jauh))

#> Odds (Jauh dari Industri)  : 0.2500

cat(sprintf("Odds Ratio (OR)            : %.4f\n", OR_manual))

#> Odds Ratio (OR)            : 4.0000

cat(sprintf("Relative Risk (RR)         : %.4f\n", RR_manual))

#> Relative Risk (RR)         : 2.5000

# ----- Menggunakan fungsi fisher.test untuk OR & CI -----
cat("\n=== Odds Ratio dengan Confidence Interval (Fisher's Exact Test) ===\n\n")

#> 
#> === Odds Ratio dengan Confidence Interval (Fisher's Exact Test) ===

hasil_fisher <- fisher.test(data_asma)
print(hasil_fisher)

#> 
#>  Fisher's Exact Test for Count Data
#> 
#> data:  data_asma
#> p-value = 7.201e-08
#> alternative hypothesis: true odds ratio is not equal to 1
#> 95 percent confidence interval:
#>  2.329297 6.928419
#> sample estimates:
#> odds ratio 
#>   3.980505

5.3 Melakukan Uji Chi-Square

# ----- Uji Chi-Square -----
cat("=== Uji Chi-Square: Independensi Paparan Polusi vs Asma ===\n\n")

#> === Uji Chi-Square: Independensi Paparan Polusi vs Asma ===

hasil_chisq <- chisq.test(data_asma)
print(hasil_chisq)

#> 
#>  Pearson's Chi-squared test with Yates' continuity correction
#> 
#> data:  data_asma
#> X-squared = 28.366, df = 1, p-value = 1.004e-07

# ----- Frekuensi Harapan -----
cat("\n=== Frekuensi Harapan (Expected Frequencies) ===\n\n")

#> 
#> === Frekuensi Harapan (Expected Frequencies) ===

print(round(hasil_chisq$expected, 2))

#>                    Asma (+) Asma (-)
#> Dekat Industri         52.5     97.5
#> Jauh dari Industri     52.5     97.5

5.4 Visualisasi Data

par(mfrow = c(1, 2), mar = c(5, 4, 4, 2) + 0.1)

# --- Plot 1: Grouped Bar Chart ---
barplot(t(prop.table(data_asma, margin = 1)),
        beside = FALSE,
        col = c("#2e86c1", "#aed6f1"),
        main = "Proporsi Kejadian Asma\nBerdasarkan Kelompok Paparan",
        ylab = "Proporsi",
        ylim = c(0, 1.1),
        legend.text = colnames(data_asma),
        args.legend = list(x = "topright", bty = "n", cex = 0.9),
        border = "white")
box()

# --- Plot 2: Odds Ratio Plot ---
or_val <- OR_manual
ci_lower <- exp(log(or_val) - 1.96 * sqrt(1/a + 1/b + 1/c_val + 1/d))
ci_upper <- exp(log(or_val) + 1.96 * sqrt(1/a + 1/b + 1/c_val + 1/d))

plot(1, or_val,
     xlim = c(0.5, 1.5),
     ylim = c(0, 8),
     xaxt = "n",
     xlab = "",
     ylab = "Odds Ratio",
     main = "Odds Ratio dengan\n95% Confidence Interval",
     pch = 18, cex = 2.5, col = "#1a5276")

abline(h = 1, lty = 2, col = "red", lwd = 2)
segments(1, ci_lower, 1, ci_upper, col = "#1a5276", lwd = 2)
segments(0.95, ci_lower, 1.05, ci_lower, col = "#1a5276", lwd = 2)
segments(0.95, ci_upper, 1.05, ci_upper, col = "#1a5276", lwd = 2)

text(1, or_val + 0.4,
     labels = sprintf("OR = %.2f\n95%% CI: [%.2f, %.2f]", or_val, ci_lower, ci_upper),
     cex = 0.9, col = "#1a5276", font = 2)

par(mfrow = c(1, 1))

5.5 Ringkasan Output R

cat("============================================================\n")

#> ============================================================

cat("       RINGKASAN HASIL ANALISIS DATA KATEGORI\n")

#>        RINGKASAN HASIL ANALISIS DATA KATEGORI

cat("       Studi: Paparan Polusi Udara vs Asma Anak\n")

#>        Studi: Paparan Polusi Udara vs Asma Anak

cat("============================================================\n\n")

#> ============================================================

cat(sprintf("Jumlah Sampel Total         : %d anak\n", sum(data_asma)))

#> Jumlah Sampel Total         : 300 anak

cat(sprintf("Prevalensi Asma (Overall)   : %.1f%%\n",
            100 * sum(data_asma[, 1]) / sum(data_asma)))

#> Prevalensi Asma (Overall)   : 35.0%

cat(sprintf("Prevalensi - Dekat Industri : %.1f%%\n", 100 * a/(a+b)))

#> Prevalensi - Dekat Industri : 50.0%

cat(sprintf("Prevalensi - Jauh Industri  : %.1f%%\n\n", 100 * c_val/(c_val+d)))

#> Prevalensi - Jauh Industri  : 20.0%

cat(sprintf("Odds Ratio (OR)             : %.4f\n", OR_manual))

#> Odds Ratio (OR)             : 4.0000

cat(sprintf("95%% CI untuk OR             : [%.4f, %.4f]\n", ci_lower, ci_upper))

#> 95% CI untuk OR             : [2.3963, 6.6769]

cat(sprintf("Relative Risk (RR)          : %.4f\n\n", RR_manual))

#> Relative Risk (RR)          : 2.5000

cat(sprintf("Chi-Square Statistic (X²)   : %.4f\n", hasil_chisq$statistic))

#> Chi-Square Statistic (X²)   : 28.3663

cat(sprintf("Derajat Kebebasan (df)       : %d\n", hasil_chisq$parameter))

#> Derajat Kebebasan (df)       : 1

cat(sprintf("p-value                     : %.6f\n\n", hasil_chisq$p.value))

#> p-value                     : 0.000000

cat("============================================================\n")

#> ============================================================

6 Interpretasi Hasil

6.1 Interpretasi Statistik Deskriptif

Dari 300 anak yang diamati, terdapat 105 anak (35%) yang didiagnosis menderita asma. Proporsi asma pada anak yang tinggal dekat kawasan industri adalah 50% (75 dari 150 anak), jauh lebih tinggi dibandingkan anak yang tinggal jauh dari industri sebesar 20% (30 dari 150 anak).

6.2 Interpretasi Peluang Bersyarat

Probabilitas bersyarat menunjukkan bahwa:

\(P(\text{Asma} \mid \text{Dekat Industri}) = 0{,}50\): Setiap anak yang tinggal dekat kawasan industri memiliki peluang 50% untuk menderita asma.
\(P(\text{Asma} \mid \text{Jauh dari Industri}) = 0{,}20\): Setiap anak yang tinggal jauh dari kawasan industri hanya memiliki peluang 20% untuk menderita asma.

Perbedaan substansial ini mengindikasikan adanya hubungan antara paparan polusi dan kejadian asma.

6.3 Interpretasi Odds dan Odds Ratio

Odds (Dekat Industri) = 1,00: Pada kelompok ini, kemungkinan asma sama besar dengan kemungkinan tidak asma (perbandingan 1:1).
Odds (Jauh dari Industri) = 0,25: Pada kelompok ini, kemungkinan asma hanya seperempat dari kemungkinan tidak asma.
Odds Ratio = 4,00: Anak yang tinggal dekat kawasan industri memiliki odds terkena asma 4 kali lebih besar dibandingkan anak yang tinggal jauh dari industri. Karena OR > 1, maka paparan polusi merupakan faktor risiko kejadian asma.

6.4 Interpretasi Relative Risk

Relative Risk = 2,50: Risiko terkena asma pada anak dekat kawasan industri adalah 2,5 kali lebih tinggi dibandingkan anak jauh dari industri. Ini berarti paparan polusi udara secara substansial meningkatkan risiko asma pada anak.

6.5 Interpretasi Uji Chi-Square

Berdasarkan hasil uji chi-square:

Nilai statistik \(\chi^2\) yang besar dan nilai \(p\)-value \(< 0{,}05\) menunjukkan bahwa kita menolak hipotesis nol (\(H_0\): paparan polusi dan kejadian asma saling independen).
Terdapat bukti statistik yang kuat bahwa terdapat hubungan yang signifikan antara paparan polusi udara (tinggal dekat industri) dan kejadian asma pada anak.
Seluruh frekuensi harapan (expected frequencies) bernilai > 5, sehingga asumsi uji chi-square terpenuhi dan hasilnya dapat dipercaya.

6.6 Implikasi Praktis

Temuan	Nilai	Makna Praktis
Prevalensi asma - dekat industri	50%	Sangat tinggi, perlu intervensi segera
Prevalensi asma - jauh industri	20%	Referensi baseline populasi sehat
Odds Ratio	4,00	Paparan polusi merupakan faktor risiko kuat
Relative Risk	2,50	Risiko meningkat 2,5 kali lipat akibat paparan
p-value	< 0,05	Hubungan signifikan secara statistik

Kesimpulan Akhir:

Hasil analisis data kategori dengan tabel kontingensi \(2 \times 2\) secara konsisten menunjukkan bahwa paparan polusi udara dari kawasan industri memiliki asosiasi positif yang signifikan dengan kejadian asma pada anak. Nilai OR = 4,00 dan RR = 2,50, dikonfirmasi oleh uji chi-square yang signifikan (\(p < 0{,}05\)), mengindikasikan bahwa anak-anak yang tinggal dekat kawasan industri berisiko jauh lebih tinggi untuk menderita asma.

Temuan ini memiliki implikasi penting bagi kebijakan kesehatan lingkungan, khususnya dalam pengaturan zonasi pemukiman di sekitar kawasan industri dan program pengendalian polusi udara untuk melindungi kesehatan anak.

Laporan ini dibuat menggunakan R Markdown. Seluruh perhitungan dan visualisasi dihasilkan secara reproducible menggunakan R.

#> Dibuat dengan R versi: R version 4.5.1 (2025-06-13 ucrt)

#> Tanggal render: 11 March 2026

Tugas 1 Analisis Data Kategori

Fathia Salwadifina (140610240046)

Disusun untuk Memenuhi Tugas Mata Kuliah Analisis Data Kategori Kelas B

11 March 2026