BAB 1: Definisi dan Ruang Lingkup Analisis Data Kategorikal

1.1 Pengantar Analisis Data Kategorikal

Ilmu statistika pada dasarnya dibagi menjadi berbagai cabang metodologi berdasarkan sifat dan skala pengukuran data yang dianalisis. Analisis data kategorikal adalah sebuah metodologi statistika yang dirancang secara khusus untuk menangani, memodelkan, dan menginterpretasikan variabel respon yang memiliki skala pengukuran diskrit. Dalam literatur statistika klasik maupun modern, data jenis ini sering pula direferensikan sebagai count data (data cacah) atau qualitative data (data kualitatif).

Pentingnya disiplin ini muncul karena sebagian besar fenomena di dunia nyata—terutama dalam ranah ilmu sosial, kedokteran, epidemiologi, dan psikologi perilaku—tidak dapat direpresentasikan secara kontinu dengan presisi desimal yang tak terbatas. Menurut Agresti (2013) dalam karya seminalnya Categorical Data Analysis, letak perbedaan paling fundamental antara metodologi analisis data kontinu (seperti regresi linear berganda atau Analysis of Variance) dan analisis data kategorikal terletak pada asumsi distribusi probabilitas yang mendasarinya. Jika data kontinu klasik sering dan secara ketat diasumsikan mengikuti distribusi Normal (Gaussian) dengan bentuk kurva simetris berbentuk lonceng, data kategorikal umumnya mengikuti distribusi asimetris dan diskrit seperti distribusi Binomial, distribusi Multinomial, ataupun distribusi Poisson. Memaksakan penggunaan alat parametrik klasik pada data kategorikal dapat menghasilkan bias estimasi yang parah, standard error yang tidak valid, dan prediksi probabilitas matematis yang irasional (misalnya, probabilitas bernilai negatif atau lebih dari satu).

1.2 Karakteristik Variabel Kategorikal

Untuk dapat melakukan inferensi statistik yang sahih, seorang peneliti harus memahami karakteristik mendalam dari variabel yang dihadapinya. Variabel kategori memiliki ruang sampel yang bersifat finite (terbatas) dan countable (dapat dihitung). Karakteristik aksiomatis dari variabel kategori mencakup:

Eksklusivitas Mutual (Mutually Exclusive): Setiap entitas pengamatan atau observasi dalam penelitian hanya diperkenankan untuk diklasifikasikan ke dalam satu dan hanya satu kategori. Tidak boleh terdapat tumpang tindih (overlapping) definisi antar kelas.
Kolektif Lengkap (Collectively Exhaustive): Himpunan kategori yang diformulasikan harus mencakup seluruh probabilitas hasil yang mungkin terjadi, sedemikian rupa sehingga total kumulatif probabilitas pembagian kelompok tersebut bernilai persis 1.

Secara hierarkis, variabel kategorikal diklasifikasikan ke dalam dua skala pengukuran utama: * Variabel Nominal: Ini merupakan bentuk paling dasar dari pengukuran kategorikal di mana kelas-kelas yang ada tidak memiliki urutan, hierarki, atau nilai intrinsik satu sama lain. Representasi numerik pada variabel nominal (misalnya menetapkan angka 1 untuk Pria dan 2 untuk Wanita) hanyalah sekadar label pengenal (dummy coding) dan sama sekali tidak merepresentasikan besaran matematis. Operasi aritmatika seperti penjumlahan atau rata-rata sangat tidak bermakna pada skala ini. Contoh klasik meliputi: golongan darah (A, B, AB, O), afiliasi partai politik, status pernikahan, dan jenis penyakit. * Variabel Ordinal: Skala ini setingkat lebih tinggi dibandingkan nominal. Kategori pada variabel ordinal memiliki urutan, tingkatan, atau hierarki yang logis dan disepakati, namun interval atau jarak antar tingkat tersebut tidak dapat dikuantifikasi secara presisi atau diasumsikan sama. Sebagai contoh, dalam kuesioner psikometri yang menggunakan Skala Likert (Sangat Tidak Setuju, Tidak Setuju, Netral, Setuju, Sangat Setuju), kita mengetahui secara pasti bahwa “Setuju” lebih positif daripada “Tidak Setuju”. Akan tetapi, kita tidak dapat mengklaim secara matematis bahwa jarak psikologis antara “Netral” dan “Setuju” sama persis dengan jarak antara “Setuju” dan “Sangat Setuju”. Variabel ordinal menuntut pendekatan analisis yang spesifik (seperti Ordinal Logistic Regression atau Cumulative Link Models) yang mampu memanfaatkan informasi hierarkis untuk meningkatkan statistical power.

1.3 Contoh Penerapan dalam Penelitian Berbasis Bukti (Evidence-Based Research)

Fleksibilitas dari analisis data kategorikal menjadikannya instrumen esensial lintas disiplin keilmuan: * Epidemiologi dan Kesehatan Masyarakat: Meneliti efektivitas klinis dari sebuah vaksin baru. Variabel respon bersifat biner: Terinfeksi vs. Tidak Terinfeksi. Variabel prediktornya adalah: Diberi Vaksin vs. Diberi Placebo. Analisis ini melahirkan rasio ukuran efek (seperti Relative Risk dan Odds Ratio) yang menjadi dasar pengambilan kebijakan kesehatan global. * Sosiologi dan Kriminologi: Memodelkan faktor-faktor yang mempengaruhi tingkat residivisme (pengulangan tindak pidana). Respon: Kembali ke penjara dalam 2 tahun (Ya/Tidak). Prediktor: Tingkat pendidikan, status pekerjaan, dan usia. * Ekonomi dan Pemasaran: Analisis perilaku konsumen dalam memilih moda transportasi komuter (Bus, Kereta Api, Kendaraan Pribadi, Sepeda). Karena terdapat lebih dari dua pilihan yang tidak berurutan, peneliti akan mengimplementasikan model Multinomial Logistic Regression.

BAB 2: Paradigma dan Konsep Dasar Tabel Kontingensi

2.1 Definisi dan Histori Tabel Kontingensi

Tabel kontingensi, yang dalam terminologi praktis sering disebut sebagai cross-tabulation atau tabulasi silang, adalah suatu matriks atau struktur grid dua dimensi yang digunakan untuk menyajikan distribusi frekuensi bersama (ko-okurensi) dari dua atau lebih variabel kategorikal secara simultan. Konsep ini pertama kali diperkenalkan secara sistematis oleh bapak statistika modern, Karl Pearson, pada awal abad ke-20 sebagai sarana untuk mengevaluasi derajat asosiasi antara variabel diskrit.

2.2 Struktur Tabulasi dan Notasi Matematis

Misalkan kita mempertimbangkan sebuah desain penelitian silang (cross-sectional) di mana kita mengukur dua variabel acak kategorikal. Misalkan \(X\) adalah variabel independen (penjelas) yang bertindak sebagai indeks baris dengan jumlah kategori sebanyak \(I\), dan \(Y\) adalah variabel dependen (respon) yang bertindak sebagai indeks kolom dengan jumlah kategori sebanyak \(J\).

Tabel yang dihasilkan dari persilangan ini dinamakan tabel kontingensi \(I \times J\). Jika setiap sel di dalam tabel, yang merupakan perpotongan antara baris \(i\) dan kolom \(j\), berisi jumlah frekuensi observasi, kita melambangkannya dengan notasi \(n_{ij}\). Total seluruh sampel dalam penelitian direpresentasikan sebagai \(N\), di mana \(N = \sum_{i=1}^{I} \sum_{j=1}^{J} n_{ij}\).

Untuk kemudahan pemahaman, mari kita tinjau kerangka dasar tabel kontingensi berukuran paling fundamental, yaitu \(2 \times 2\):

Variabel \(X\)	Kategori \(Y=1\)	Kategori \(Y=2\)	Total Marginal Baris
Kategori \(X=1\)	\(n_{11}\)	\(n_{12}\)	\(n_{1+}\)
Kategori \(X=2\)	\(n_{21}\)	\(n_{22}\)	\(n_{2+}\)
Total Marginal Kolom	\(n_{+1}\)	\(n_{+2}\)	\(N\)

Dalam notasi standar, tanda plus (\(+\)) pada subskrip mengindikasikan bahwa penjumlahan telah dilakukan melintasi indeks yang digantikan oleh tanda tersebut. Sehingga, \(n_{1+}\) merupakan jumlah total subjek pada kategori baris pertama tanpa menghiraukan klasifikasi kolom mereka.

2.3 Konsep Distribusi Probabilitas dalam Tabel

Beralih dari ranah frekuensi absolut menuju inferensi probabilitas, kita membagi setiap frekuensi sel dengan total pengamatan sampel (\(N\)). Operasi ini melahirkan distribusi probabilitas empiris yang terbagi ke dalam tiga konsep fundamental:

2.3.1 Joint Distribution (Distribusi Bersama)

Distribusi bersama, dinotasikan sebagai \(\pi_{ij}\), merepresentasikan probabilitas eksak bahwa sebuah observasi yang ditarik secara acak dari populasi akan secara simultan berada pada kategori baris \(i\) dan kategori kolom \(j\). \[\pi_{ij} = P(X = i \cap Y = j) = \frac{n_{ij}}{N}\] Berdasarkan aksioma probabilitas Kolmogorov, jumlah total dari semua sel probabilitas bersama harus sama dengan satu: \[\sum_{i=1}^{I} \sum_{j=1}^{J} \pi_{ij} = 1\]

2.3.2 Marginal Distribution (Distribusi Marginal)

Distribusi marginal adalah probabilitas dari satu variabel secara terisolasi, yang dihitung dengan cara menjumlahkan seluruh probabilitas bersama di sepanjang dimensi variabel lainnya. Konsep ini seolah-olah “meminggirkan” atau mengabaikan salah satu variabel.

Probabilitas marginal untuk baris ke-\(i\) (hanya melihat variabel \(X\)): \[\pi_{i+} = \sum_{j=1}^{J} \pi_{ij} = P(X = i) = \frac{n_{i+}}{N}\]

Probabilitas marginal untuk kolom ke-\(j\) (hanya melihat variabel \(Y\)): \[\pi_{+j} = \sum_{i=1}^{I} \pi_{ij} = P(Y = j) = \frac{n_{+j}}{N}\]

2.3.3 Conditional Probability (Probabilitas Bersyarat)

Probabilitas bersyarat adalah konsep yang paling krusial dalam mengevaluasi hubungan sebab-akibat atau asosiasi direksional. Probabilitas bersyarat menjawab pertanyaan: “Jika kita telah mengetahui secara pasti bahwa observasi berada pada kelompok baris \(i\), berapakah peluang observasi tersebut akan merespon pada kolom \(j\)?”

Notasi matematis untuk probabilitas bersyarat observasi jatuh pada kolom \(j\) dengan syarat (given) observasi tersebut berasal dari baris \(i\) diformulasikan menggunakan Teorema Bayes dasar sebagai berikut: \[\pi_{j|i} = P(Y=j \mid X=i) = \frac{P(X=i \cap Y=j)}{P(X=i)} = \frac{\pi_{ij}}{\pi_{i+}} = \frac{n_{ij}}{n_{i+}}\]

Jika variabel \(X\) dan \(Y\) adalah dua entitas yang benar-benar independen (tidak memiliki hubungan sama sekali), maka probabilitas bersyarat akan sama persis dengan probabilitas marginalnya (\(\pi_{j|i} = \pi_{+j}\)). Jika kesamaan ini dilanggar, maka kita berhadapan dengan situasi di mana ada ketergantungan atau asosiasi statistik antar variabel.

BAB 3: Matriks Ukuran Asosiasi - Odds, Odds Ratio, dan Relative Risk

Dalam eksplorasi data kategorikal, membuktikan adanya hubungan (melalui uji p-value) belumlah cukup. Peneliti diwajibkan untuk mengukur “seberapa kuat” atau magnitud dari hubungan tersebut. Untuk tabel \(2 \times 2\), tiga parameter metrik efek ukuran yang paling lazim digunakan adalah Odds, Odds Ratio, dan Relative Risk.

3.1 Konsep Odds (Rasio Peluang)

Di dalam percakapan sehari-hari, masyarakat awam sering menyamakan “Odds” dengan “Probabilitas”, namun secara matematis keduanya sangat berbeda. Probabilitas (\(\pi\)) adalah proporsi kejadian sukses terhadap keseluruhan kemungkinan kejadian. Rentangnya terbatas antara \(0 \leq \pi \leq 1\).

Sebaliknya, Odds mendefinisikan rasio probabilitas terjadinya suatu kejadian “sukses” dibandingkan dengan probabilitas “kegagalan” kejadian tersebut. Rentang nilai odds membentang dari nol hingga tak terhingga (\(0 \leq \text{Odds} < \infty\)). Transformasi probabilitas menjadi odds dituliskan dengan persamaan matematis berikut:

\[\text{Odds} = \Omega = \frac{\pi}{1 - \pi}\]

Sebagai perbandingan intuitif: Jika probabilitas seorang kandidat lulus ujian adalah \(\pi = 0.80\) (atau 80%), maka probabilitas dia gagal adalah \(0.20\). Odds kandidat tersebut untuk lulus adalah \(\Omega = \frac{0.80}{0.20} = 4\). Interpretasinya: Untuk setiap 1 kemungkinan kandidat itu gagal, terdapat 4 kemungkinan ia akan berhasil lulus (rasio sukses terhadap gagal adalah 4 banding 1).

3.2 Relative Risk (RR) / Risk Ratio

Relative risk atau rasio risiko adalah metrik yang intuitif, yang secara langsung membandingkan probabilitas kejadian (risiko) antara dua kelompok yang terpisah. Metrik ini sangat populer dalam desain studi prospektif atau studi kohort, di mana peneliti mengikuti subjek dari paparan hingga outcome.

Jika kita membandingkan kelompok terpapar (\(X=1\)) dengan kelompok tidak terpapar (\(X=2\)), formulasi Relative Risk adalah:

\[RR = \frac{P(Y=1 \mid X=1)}{P(Y=1 \mid X=2)} = \frac{\pi_{1|1}}{\pi_{1|2}}\]

Jika \(RR = 1\), maka risiko pada kedua kelompok adalah setara. Jika \(RR = 3\), maka kelompok terpapar memiliki risiko menderita outcome 3 kali lipat lebih besar dibandingkan kelompok yang tidak terpapar. Keterbatasan utama dari RR adalah ia tidak dapat diaplikasikan pada desain penelitian case-control (kasus-kontrol) retrospektif, karena pada studi jenis itu probabilitas marginal baris ditentukan secara artifisial oleh desain peneliti.

3.3 Odds Ratio (OR) / Rasio Odds

Untuk mengatasi keterbatasan RR, para ahli statistik mempopulerkan penggunaan Odds Ratio (OR). Sesuai dengan namanya, OR adalah rasio komparatif yang membandingkan dua odds yang berbeda dari dua kelompok pengamatan. OR memiliki sifat matematis yang tangguh: nilainya tetap valid baik penelitian dilakukan secara prospektif (cohort) maupun retrospektif (case-control), dan nilainya simetris terlepas dari variabel mana yang ditetapkan sebagai prediktor maupun respon.

Formulasi utama Odds Ratio (sering disimbolkan dengan theta, \(\theta\)) adalah:

\[\theta = \frac{\text{Odds}_1}{\text{Odds}_2} = \frac{\frac{\pi_{1|1}}{1 - \pi_{1|1}}}{\frac{\pi_{1|2}}{1 - \pi_{1|2}}}\]

Ketika kita menggunakan data frekuensi dari tabel kontingensi \(2 \times 2\), persamaan yang kompleks di atas dapat disederhanakan dengan sangat elegan menjadi perkalian silang (cross-product ratio):

\[\theta = \frac{n_{11} / n_{12}}{n_{21} / n_{22}} = \frac{n_{11} \times n_{22}}{n_{12} \times n_{21}}\]

Interpretasi Statistik dan Substantif dari Parameter OR: * Jika \(\theta = 1\): Variabel baris dan kolom berstatus independen murni. Odds untuk terjadinya \(Y=1\) sama saja pada kelompok \(X=1\) maupun \(X=2\). * Jika \(\theta > 1\): Terdapat asosiasi positif. Kondisi ini mengisyaratkan bahwa terjadinya keberhasilan atau munculnya atribut pada kolom pertama memiliki kecenderungan lebih tinggi pada kelompok baris pertama. * Jika \(\theta < 1\): Terdapat asosiasi negatif (efek protektif). Terjadinya outcome lebih tidak mungkin terjadi pada kelompok baris pertama dibandingkan baris kedua.

Nilai Odds Ratio adalah batu pijakan utama (building block) yang akan mengantarkan pemahaman peneliti menuju arsitektur Logistic Regression (Regresi Logistik), di mana koefisien eksponensial dari regresi tersebut tak lain adalah representasi langsung dari Odds Ratio.

BAB 4: Studi Kasus Praktis - Intervensi Olfaktori (Parfum) dan Dampaknya Terhadap Kepercayaan Diri Diri (Self-Efficacy)

Untuk membumikan abstraksi matematis yang telah diuraikan pada bab sebelumnya, kita akan menyusun sebuah studi kasus psikometri eksperimental hipotetis.

Skenario Eksperimen: Sekelompok peneliti psikologi sosial ingin menginvestigasi secara empiris hipotesis yang menyatakan bahwa stimulasi saraf olfaktori (indra penciuman) melalui wewangian atau parfum di pagi hari dapat berfungsi sebagai katalisator eksternal yang secara signifikan mendongkrak tingkat kepercayaan diri subjek ketika berbicara di hadapan publik (public speaking). Sebanyak 100 partisipan direkrut dan dibagi ke dalam dua lengan eksperimen secara acak (randomisasi): 1. Grup Perlakuan (Intervensi): 50 partisipan diinstruksikan untuk menyemprotkan parfum spesifik 15 menit sebelum memberikan presentasi. 2. Grup Kontrol: 50 partisipan dilarang menggunakan wewangian apapun sebelum presentasi.

Setelah presentasi usai, panel penilai independen dibantu dengan self-reporting questionnaire mengklasifikasikan tingkat kepercayaan diri partisipan menjadi dua kategori diskrit: Tinggi atau Rendah.

4.1 Konstruksi Tabel Kontingensi Observasional

Data tabulasi silang yang berhasil dihimpun dari 100 subjek adalah sebagai berikut:

Status Intervensi (Prediktor)	Kepercayaan Diri Tinggi	Kepercayaan Diri Rendah	Total Marginal Baris
Menggunakan Parfum	40 (\(n_{11}\))	10 (\(n_{12}\))	50
Tidak Menggunakan Parfum	20 (\(n_{21}\))	30 (\(n_{22}\))	50
Total Marginal Kolom	60	40	100 (\(N\))

4.2 Perhitungan Manual Probabilitas Bersyarat

Langkah investigasi pertama adalah mengurai probabilitas bersyarat. Kita ingin menjawab: Seberapa besar peluang seseorang berkinerja dengan “Percaya Diri Tinggi” jika kita mengetahui status paparannya?

Probabilitas bersyarat untuk kelompok intervensi parfum (\(X = \text{Parfum}\)): \[P(\text{Tinggi} \mid \text{Parfum}) = \frac{n_{11}}{n_{1+}} = \frac{40}{50} = 0.80 \quad \text{(atau 80\%)}\]

Probabilitas bersyarat untuk kelompok kontrol/tanpa parfum (\(X = \text{Tanpa Parfum}\)): \[P(\text{Tinggi} \mid \text{Tanpa Parfum}) = \frac{n_{21}}{n_{2+}} = \frac{20}{50} = 0.40 \quad \text{(atau 40\%)}\]

Dari metrik mentah ini saja, kita telah mendeteksi Risk Difference (Selisih Risiko) sebesar \(0.80 - 0.40 = 0.40\). Ada disparitas mutlak sebesar 40% poin.

4.3 Estimasi Nilai Odds per Kelompok

Kita mentransformasikan probabilitas bersyarat tersebut menjadi satuan Odds.

Odds keberhasilan (kepercayaan diri tinggi) untuk Grup Parfum: \[\text{Odds}_{1} = \frac{P(\text{Tinggi} \mid \text{Parfum})}{P(\text{Rendah} \mid \text{Parfum})} = \frac{0.80}{1 - 0.80} = \frac{0.80}{0.20} = 4.0\] (Interpretasi sub-tahap: Pada grup parfum, rasio peserta yang memiliki percaya diri tinggi berbanding yang rendah adalah 4 melawan 1).

Odds keberhasilan (kepercayaan diri tinggi) untuk Grup Tanpa Parfum: \[\text{Odds}_{2} = \frac{P(\text{Tinggi} \mid \text{Tanpa Parfum})}{P(\text{Rendah} \mid \text{Tanpa Parfum})} = \frac{0.40}{1 - 0.40} = \frac{0.40}{0.60} \approx 0.667\] (Interpretasi sub-tahap: Pada grup tanpa parfum, kecenderungannya terbalik. Setiap 2 orang yang percaya diri, ada 3 orang yang tidak).

4.4 Perhitungan Komprehensif Odds Ratio (OR)

Puncak dari perhitungan ini adalah mengomparasi kedua odds tersebut menjadi sebuah parameter tunggal yang absolut:

\[OR = \theta = \frac{\text{Odds}_{1}}{\text{Odds}_{2}} = \frac{4.0}{0.667} \approx 5.997 \approx 6.0\]

Untuk memvalidasi ketepatan, kita dapat mengaplikasikan rumus kilat komputasi perkalian silang (cross-product ratio): \[OR = \frac{n_{11} \times n_{22}}{n_{12} \times n_{21}} = \frac{40 \times 30}{10 \times 20} = \frac{1200}{200} = 6.0\]

Hasil perhitungan manual menghasilkan konfirmasi ganda yang solid. Nilai OR sebesar 6 ini akan diinterpretasikan secara tajam pada Bab 6 setelah kita melakukan uji signifikansi komputasional.

BAB 5: Komputasi Analitis Menggunakan Bahasa Pemrograman R

Proses kalkulasi manual memberikan pemahaman fundamental mengenai asal-usul angka. Akan tetapi, dalam riset empiris sesungguhnya dengan dataset masif berskala besar, proses analitis selalu dieksekusi menggunakan perangkat lunak saintifik. R (R Core Team) adalah salah satu perangkat lunak statistik berbasis perintah silang pelantar terkuat (open source) di dunia.

Pada bab ini, kita mereplikasikan kalkulasi hipotetis pada Bab 4 ke dalam algoritma operasional lingkungan R.

# =========================================================================
# SCRIPT ANALISIS DATA KATEGORIKAL: KASUS PARFUM VS KEPERCAYAAN DIRI
# =========================================================================

# Tahap 1: Inisiasi dan Konstruksi Matriks Data (Tabel Kontingensi)
# Fungsi matrix() digunakan untuk mengisi frekuensi data ke dalam ruang sel.
# Argumen byrow = TRUE memaksa pengisian data dilakukan secara lateral (baris demi baris)
frekuensi_observasi <- matrix(c(40, 10, 
                                20, 30), 
                              nrow = 2, 
                              byrow = TRUE)

# Tahap 2: Pemberian Identitas Dimensi (Naming Margins)
rownames(frekuensi_observasi) <- c("Intervensi_Parfum", "Kontrol_TanpaParfum")
colnames(frekuensi_observasi) <- c("Konfidensi_Tinggi", "Konfidensi_Rendah")

# Tahap 3: Inspeksi Visual Matriks Data
cat("\n--- TABEL KONTINGENSI FREKUENSI ABSOLUT ---\n")

## 
## --- TABEL KONTINGENSI FREKUENSI ABSOLUT ---

print(frekuensi_observasi)

##                     Konfidensi_Tinggi Konfidensi_Rendah
## Intervensi_Parfum                  40                10
## Kontrol_TanpaParfum                20                30

# Tahap 4: Generasi Tabel Probabilitas Bersyarat (Conditional Prop Tables)
# Fungsi prop.table dengan argumen margin = 1 menghitung proporsi 
# berdasarkan jumlah baris (row-wise proportion)
tabel_prob_bersyarat <- prop.table(frekuensi_observasi, margin = 1)
cat("\n--- TABEL PROBABILITAS BERSYARAT (MARGIN = BARIS) ---\n")

## 
## --- TABEL PROBABILITAS BERSYARAT (MARGIN = BARIS) ---

print(round(tabel_prob_bersyarat, 3))

##                     Konfidensi_Tinggi Konfidensi_Rendah
## Intervensi_Parfum                 0.8               0.2
## Kontrol_TanpaParfum               0.4               0.6

# Tahap 5: Eksekusi Matematis untuk Odds Ratio (Algoritma Perkalian Silang)
sel_a <- frekuensi_observasi[1, 1] # Sel 1,1 (Parfum, Tinggi) = 40
sel_b <- frekuensi_observasi[1, 2] # Sel 1,2 (Parfum, Rendah) = 10
sel_c <- frekuensi_observasi[2, 1] # Sel 2,1 (Tanpa Parfum, Tinggi) = 20
sel_d <- frekuensi_observasi[2, 2] # Sel 2,2 (Tanpa Parfum, Rendah) = 30

nilai_odds_ratio <- (sel_a * sel_d) / (sel_b * sel_c)
cat("\n--- ESTIMASI TITIK ODDS RATIO (POINT ESTIMATION) ---\n")

## 
## --- ESTIMASI TITIK ODDS RATIO (POINT ESTIMATION) ---

cat("Besaran Odds Ratio (OR) adalah:", nilai_odds_ratio, "\n")

## Besaran Odds Ratio (OR) adalah: 6

# Tahap 6: Uji Signifikansi Independensi Chi-Square (Pearson's Chi-squared test)
# H0: Independen (Peluang Konfidensi Tinggi sama di antara kedua grup)
# H1: Dependen (Ada asosiasi signifikan antara Parfum dan Konfidensi)
# correct = FALSE digunakan untuk menonaktifkan Koreksi Kontinuitas Yates
# karena ukuran sampel (N=100) dan sel ekspektasi relatif memadai (>5).
uji_hipotesis_chi2 <- chisq.test(frekuensi_observasi, correct = FALSE)

cat("\n--- HASIL UJI SIGNIFIKANSI STATISTIK CHI-SQUARE ---\n")

## 
## --- HASIL UJI SIGNIFIKANSI STATISTIK CHI-SQUARE ---

print(uji_hipotesis_chi2)

## 
##  Pearson's Chi-squared test
## 
## data:  frekuensi_observasi
## X-squared = 16.667, df = 1, p-value = 4.456e-05

# Ekstraksi komponen statistik dari objek hasil Chi-Square
chisq_stat <- round(uji_hipotesis_chi2$statistic, 3)
chisq_pval <- format.pval(uji_hipotesis_chi2$p.value, eps = 0.001)
chisq_df   <- uji_hipotesis_chi2$parameter

BAB 6: Ekstraksi Makna - Interpretasi Menyeluruh Terhadap Temuan Analitis

Analisis kuantitatif mendapati esensinya bukan sekadar pada kalkulasi angka, melainkan pada kemampuan sang peneliti dalam melakukan ekstraksi kesimpulan logis (inferensi) dari komputasi yang berbelit-belit. Bagian ini mensintesis temuan R menjadi narasi akademik yang tajam, dibagi menjadi dua spektrum: Validasi paramater analitis (Interpretasi Statistik) dan Terjemahan ranah realitas (Interpretasi Substantif).

6.1 Interpretasi Statistik (Statistical and Inferential Interpretation)

Eksaminasi yang paling mendasar dilakukan melalui instrumen Uji Chi-Square Independensi Pearson. Hipotesis Nol (\(H_0\)) dalam pengujian ini mendikte ketiadaan asosiasi: yakni bahwa proporsi populasi yang merasa percaya diri tinggi adalah identik (homogeneous), terlepas dari apakah subjek menerima paparan parfum atau tidak.

Hasil luaran program komputasi R mendemonstrasikan perolehan Nilai Statistik Uji Chi-Square (\(\chi^2\)) absolut sebesar 16.667 dengan derajat kebebasan (degrees of freedom) konstan sebesar \(df = 1\). Melalui kurva distribusi teoritis Chi-Square, nilai statistik tersebut merujuk pada probabilitas tingkat kesalahan tipe-I empiris (p-value) sebesar < 0.001.

Merujuk pada protokol statistika konvensional, nilai probabilitas di bawah alpha 0.05 (\(p < 0.05\)) memberikan dasar legitimasi empiris bagi peneliti untuk menolak Hipotesis Nol dengan penuh keyakinan (Confidence Level 95%). Signifikansi statistik ini bukan kebetulan (random chance). Ini menyimpulkan bahwa secara struktural di dalam populasi asal spesimen penelitian ini ditarik, terdapat asosiasi dan korelasi matematis yang terbukti (statistically significant association) antara determinan intervensi olfaktori (parfum) dengan manifestasi tingkatan performa (self-confidence).

Lebih lanjut, besaran efek atau effect size ditangkap melalui metrik Odds Ratio yang telah dikonfirmasi bernilai tepat 6.0. Nilai ini berada terlampau jauh menjauhi nilai ekuilibrium null (\(\theta = 1\)), mempertegas bahwa asosisasi yang dideteksi oleh Chi-Square bukan sekadar “ada”, melainkan hadir dengan magnitudo relasional yang teramat kuat secara statistika.

6.2 Interpretasi Substantif dalam Domain Kasus Psikologi (Substantive Interpretation)

Analisis kuantitatif menjadi tumpul jika tidak direfleksikan dalam dunia praksis. Secara substantif-klinis, hasil parameter Uji Odds Ratio sebesar 6 memformulasikan postulat bahwa subjek penelitian yang mengenakan semprotan wewangian parfum berpotensi mengalami lipatan kecenderungan—atau odds—sebesar 6 kali lipat lebih intens untuk mewujudkan perasaan percaya diri (high self-efficacy) di atas podium presentasi, manakala dikomparasikan dengan entitas subjek yang dieliminasi aksesnya terhadap produk wewangian tersebut.

Konteks komparatif absolut juga tersaji cerlang dari perbedaan probabilitas Conditional (80% versus 40%). Pengenaan parfum menyuntikkan diferensial kenaikan keyakinan sebanyak dua kali lipat dalam ranah peluang absolut. Dari kacamata Olfactory Psychology atau psikologi sensorik, sintesis analitik ini membenarkan kerangka teoritis sentral bahwa paparan aromaterapeutik sintetik (parfum) sukses menstimulasi dan mengaktivasi reseptor pada korteks limbik—sebuah zona otak otonom yang memegang kendali atas struktur emosi, persepsi diri yang meresahkan (anxiety), dan modikasi regulasi afektif. Manifestasi biokimia ini, ketika dikonversikan menjadi perilaku psikomotorik sosial (dalam hal ini presentasi publik), mengkristal sebagai proyeksi kompetensi dan jaminan diri yang melesat.

Catatan Kritis Keterbatasan Riset: Meskipun nilai OR sangat dramatis, penting bagi akademisi untuk menahan diri dari menyimpulkan kausalitas buta (absolute causation). Penelitian masa depan patut mengendalikan atau me-regress konfonding faktorial sekunder, contohnya: genetika bawaan neurotisisme pelakon, rutinitas presentasi bulanan, maupun preferensi subjektif partisipan atas bau (aroma preference), yang berpotensi menjadi variabel perancu dalam desain observasional murni.

Daftar Pustaka dan Rujukan Referensi Ilmiah

Buku ini disusun dengan berlandaskan pada prinsip-prinsip epistemologi yang diajarkan dalam kurikulum statistika modern dari berbagai sumber primer:

Agresti, A. (2013). Categorical Data Analysis (3rd ed.). Hoboken, NJ: John Wiley & Sons.
Agresti, A. (2018). An Introduction to Categorical Data Analysis (3rd ed.). Wiley-Interscience.
Field, A., Miles, J., & Field, Z. (2012). Discovering Statistics Using R. London: SAGE Publications.
Fleiss, J. L., Levin, B., & Paik, M. C. (2003). Statistical Methods for Rates and Proportions (3rd ed.). John Wiley & Sons.
Hosmer, D. W., Lemeshow, S., & Sturdivant, R. X. (2013). Applied Logistic Regression (3rd ed.). Wiley Series in Probability and Statistics.
Wickham, H., & Grolemund, G. (2017). R for Data Science: Import, Tidy, Transform, Visualize, and Model Data. O’Reilly Media.

Prinsip dan Aplikasi Analisis Data Kategori: Fondasi Teoretis, Formulasi Matematis, dan Implementasi Komputasional Tabel Kontingensi

Program Studi S1 Statistika FMIPA Universitas Padjadjaran

Zhafran Fakhry Sani

11 March 2026