Package

Paket yang digunakan

pkgs <- c("dplyr", "tidyr", "ggplot2", "vcd", "knitr", "kableExtra", "broom", "scales", "plotly")
installed <- rownames(installed.packages())
for(p in pkgs) if(!p %in% installed) install.packages(p, dependencies = TRUE)
library(dplyr)
library(tidyr)
library(ggplot2)
library(vcd)        
library(knitr)
library(kableExtra)
library(broom)
library(scales)
library(plotly)

Pendahuluan

Seleksi penerimaan mahasiswa merupakan proses penting dalam institusi pendidikan tinggi. Analisis ini bertujuan untuk mengevaluasi apakah terdapat hubungan antara gender dan status penerimaan mahasiswa. Penelitian ini merumuskan masalah terkait eksistensi hubungan antara gender dan status penerimaan mahasiswa Universitas California Berkeley

Penelitian ini bertujuan menguji apakah ada hubungan antara gender dan status penerimaan mahasiswa menggunakan dataset UCBAdmissions

Metodologi

Data

Data berikut menunjukkan jumlah mahasiswa yang admitted(diterima) dan rejected (ditolak) di masing-masing departemen (A–F), dibedakan berdasarkan gender male (pria) dan female (wanita). Data ini berasal dari dataset UCBAdmissions yang telah diubah menjadi format tabel agregat agar mudah dibaca. Tabel ini menampilkan frekuensi penerimaan dan penolakan untuk setiap kombinasi gender dan departemen:

# Load Dataset
as.data.frame(UCBAdmissions)
##       Admit Gender Dept Freq
## 1  Admitted   Male    A  512
## 2  Rejected   Male    A  313
## 3  Admitted Female    A   89
## 4  Rejected Female    A   19
## 5  Admitted   Male    B  353
## 6  Rejected   Male    B  207
## 7  Admitted Female    B   17
## 8  Rejected Female    B    8
## 9  Admitted   Male    C  120
## 10 Rejected   Male    C  205
## 11 Admitted Female    C  202
## 12 Rejected Female    C  391
## 13 Admitted   Male    D  138
## 14 Rejected   Male    D  279
## 15 Admitted Female    D  131
## 16 Rejected Female    D  244
## 17 Admitted   Male    E   53
## 18 Rejected   Male    E  138
## 19 Admitted Female    E   94
## 20 Rejected Female    E  299
## 21 Admitted   Male    F   22
## 22 Rejected   Male    F  351
## 23 Admitted Female    F   24
## 24 Rejected Female    F  317
df <- as.data.frame(UCBAdmissions)

df_wide <- df %>%
  pivot_wider(names_from = Dept, values_from = Freq) %>%
  arrange(Admit, Gender)

df_wide
## # A tibble: 4 × 8
##   Admit    Gender     A     B     C     D     E     F
##   <fct>    <fct>  <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 Admitted Male     512   353   120   138    53    22
## 2 Admitted Female    89    17   202   131    94    24
## 3 Rejected Male     313   207   205   279   138   351
## 4 Rejected Female    19     8   391   244   299   317

Variabel Penelitian

Penelitian ini menggunakan tiga variabel utama:

  1. Gender
    • Male (laki-laki)
    • Female (perempuan)
  2. Status Penerimaan
    • Admitted (diterima)
    • Rejected (ditolak)
  3. Departemen
    • A, B, C, D, E, F

Metode Chi Square

Analisis menggunakan uji Chi-Square independensi pada tabel kontingensi dua arah.

Statistik Uji

\[ \chi^2 = \sum \frac{(O - E)^2}{E} \]

dengan:

\[ \begin{aligned} O &: \text{frekuensi observasi} \\ E &: \text{frekuensi harapan} \end{aligned} \]

Taraf Signifikansi:

\[ \alpha = 0.05 \]

Hipotesis:

\[ \begin{aligned} H_0 &: \text{Tidak ada hubungan antara gender dan status penerimaan} \\ H_1 &: \text{Terdapat hubungan antara gender dan status penerimaan} \end{aligned} \]

Analisis Dan Pembahasan

Statistik Deskriptif

Tabel Frekuensi Agregat

# Tabel agregat Gender x Admit

tab <- margin.table(UCBAdmissions, c(2,1))
kable(tab, caption = "Tabel Agregat Penerimaan Mahasiswa Berdasarkan Gender")
Tabel Agregat Penerimaan Mahasiswa Berdasarkan Gender
Admitted Rejected
Male 1198 1493
Female 557 1278

Penerimaan Per Gender

prop.table(tab, margin = 1)
##         Admit
## Gender    Admitted  Rejected
##   Male   0.4451877 0.5548123
##   Female 0.3035422 0.6964578

Berdasarkan tabel agregat penerimaan mahasiswa, terlihat bahwa jumlah pelamar laki-laki yang diterima adalah sebanyak 1.198 orang, sedangkan yang ditolak sebanyak 1.493 orang. Sementara itu, jumlah pelamar perempuan yang diterima adalah 557 orang, dan yang ditolak sebanyak 1.278 orang.

Secara total, jumlah pelamar laki-laki (2.691 orang) lebih banyak dibandingkan pelamar perempuan (1.835 orang). Jika dihitung tingkat penerimaannya, sekitar 44,5% pelamar laki-laki diterima, sedangkan tingkat penerimaan pelamar perempuan sekitar 30,4%.

Secara agregat, data ini menunjukkan bahwa tingkat penerimaan laki-laki lebih tinggi dibandingkan perempuan. Namun, karena data ini masih bersifat keseluruhan (belum dipisahkan berdasarkan departemen), kesimpulan ini belum tentu mencerminkan adanya bias gender secara langsung. Analisis lebih lanjut per departemen diperlukan untuk memahami pola yang sebenarnya.

Penerimaan Per Departemen

Berbeda dengan tabel agregat sebelumnya, grafik di atas menunjukkan tingkat penerimaan mahasiswa yang dipisahkan berdasarkan masing-masing departemen (A–F). Hasilnya memperlihatkan pola yang lebih kompleks dibandingkan analisis keseluruhan.

Pada Departemen A, tingkat penerimaan perempuan (82,4%) lebih tinggi dibandingkan laki-laki (62,1%). Hal serupa juga terlihat pada Departemen B, di mana perempuan memiliki tingkat penerimaan sebesar 68,0% dibandingkan laki-laki sebesar 63,0%.

Sebaliknya, pada Departemen C, laki-laki memiliki tingkat penerimaan sedikit lebih tinggi (36,9%) dibandingkan perempuan (34,1%). Pada Departemen D, tingkat penerimaan relatif hampir seimbang, dengan perempuan sedikit lebih tinggi (34,9%) dibandingkan laki-laki (33,1%).

Pada Departemen E, laki-laki memiliki tingkat penerimaan lebih tinggi (27,7%) dibandingkan perempuan (23,9%). Sementara itu, pada Departemen F, tingkat penerimaan perempuan (7,0%) sedikit lebih tinggi dibandingkan laki-laki (5,9%), meskipun keduanya relatif rendah.

Temuan ini menunjukkan bahwa perbedaan pada data agregat sebelumnya kemungkinan dipengaruhi oleh distribusi pelamar ke masing-masing departemen. Dengan kata lain, perbedaan tingkat penerimaan secara keseluruhan dapat dijelaskan oleh variasi tingkat selektivitas antar departemen serta pola pilihan jurusan pelamar. Fenomena ini merupakan contoh klasik dari Simpson’s Paradox, di mana tren pada data agregat dapat berbeda atau bahkan berlawanan dengan tren pada data yang telah dipisahkan ke dalam kelompok-kelompok tertentu.

Statistik Inferensial

ChiSquare Global

# Uji Chi-square pada tabel agregat
uji_global <- chisq.test(tab, correct = FALSE)  
uji_global
## 
##  Pearson's Chi-squared test
## 
## data:  tab
## X-squared = 92.205, df = 1, p-value < 2.2e-16
## Hasil uji Chi-square global (Gender vs Status Penerimaan):
## X-squared = 92.205 , df = 1 , n = 4526 , p-value = 7.814e-22
## Effect size (Phi/Cramer's V) = 0.143
## Keputusan: Tolak H0 (α = 0.05). Gender dan status penerimaan tidak independen pada data agregat.
## 
## Expected counts (frekuensi harapan):
##         Admit
## Gender   Admitted Rejected
##   Male    1043.46  1647.54
##   Female   711.54  1123.46
## 
## Catatan: Semua expected count ≥ 5, asumsi uji Chi-square terpenuhi.

ChiSquare per Departemen

dept_list <- dimnames(UCBAdmissions)$Dept

for(d in dept_list){
  
  tab_dept <- UCBAdmissions[,,d]
  
  test <- chisq.test(tab_dept, correct = FALSE)
  
  cat("\n==========================\n")
  cat("Department:", d, "\n")
  print(test)
}
Departemen \[ \chi^2 \] df p-value Keputusan
A 17.24800 1 3.28e-05 Tolak H0
B 0.25372 1 0.6145 Gagal tolak H0
C 0.75354 1 0.3854 Gagal tolak H0
D 0.29798 1 0.5852 Gagal tolak H0
E 1.00110 1 0.3171 Gagal tolak H0
F 0.38409 1 0.5354 Gagal tolak H0

Kesimpulan

Uji Chi-square global menunjukkan hasil signifikan (χ² = 92,205; p-value < 0,05) sehingga pada data agregat terdapat hubungan antara gender dan status penerimaan. Namun, ketika uji dilakukan per departemen, hanya Departemen A yang signifikan (p-value = 3,28×10⁻⁵), sementara departemen lain tidak signifikan (p-value > 0,05).

Perbedaan antara hasil agregat dan hasil terstratifikasi ini mengindikasikan bahwa Departemen berperan sebagai variabel pengelompokan penting dan mendukung fenomena Simpson’s Paradox.

Temuan analisis menunjukkan Departemen sebagai faktor pengelompokan penting yang memengaruhi interpretasi. Temuan ini selaras dengan Simpson’s Paradox, dimana ketika pola pada data gabungan dapat berbeda dibandingkan pola setelah data dikelompokkan. Oleh karena itu, kesimpulan mengenai hubungan gender dan penerimaan mahasiswa sebaiknya tidak hanya didasarkan pada data agregat, melainkan juga mempertimbangkan tiap kelompok atau departemen.