Paket yang digunakan
pkgs <- c("dplyr", "tidyr", "ggplot2", "vcd", "knitr", "kableExtra", "broom", "scales", "plotly")
installed <- rownames(installed.packages())
for(p in pkgs) if(!p %in% installed) install.packages(p, dependencies = TRUE)
library(dplyr)
library(tidyr)
library(ggplot2)
library(vcd)
library(knitr)
library(kableExtra)
library(broom)
library(scales)
library(plotly)Seleksi penerimaan mahasiswa merupakan proses penting dalam institusi pendidikan tinggi. Analisis ini bertujuan untuk mengevaluasi apakah terdapat hubungan antara gender dan status penerimaan mahasiswa. Penelitian ini merumuskan masalah terkait eksistensi hubungan antara gender dan status penerimaan mahasiswa Universitas California Berkeley
Penelitian ini bertujuan menguji apakah ada hubungan antara gender
dan status penerimaan mahasiswa menggunakan dataset
UCBAdmissions
Data berikut menunjukkan jumlah mahasiswa yang
admitted(diterima) dan
rejected (ditolak) di masing-masing departemen
(A–F), dibedakan berdasarkan gender male
(pria) dan female (wanita). Data
ini berasal dari dataset UCBAdmissions yang telah diubah
menjadi format tabel agregat agar mudah dibaca. Tabel ini menampilkan
frekuensi penerimaan dan penolakan untuk setiap kombinasi gender dan
departemen:
## Admit Gender Dept Freq
## 1 Admitted Male A 512
## 2 Rejected Male A 313
## 3 Admitted Female A 89
## 4 Rejected Female A 19
## 5 Admitted Male B 353
## 6 Rejected Male B 207
## 7 Admitted Female B 17
## 8 Rejected Female B 8
## 9 Admitted Male C 120
## 10 Rejected Male C 205
## 11 Admitted Female C 202
## 12 Rejected Female C 391
## 13 Admitted Male D 138
## 14 Rejected Male D 279
## 15 Admitted Female D 131
## 16 Rejected Female D 244
## 17 Admitted Male E 53
## 18 Rejected Male E 138
## 19 Admitted Female E 94
## 20 Rejected Female E 299
## 21 Admitted Male F 22
## 22 Rejected Male F 351
## 23 Admitted Female F 24
## 24 Rejected Female F 317
df <- as.data.frame(UCBAdmissions)
df_wide <- df %>%
pivot_wider(names_from = Dept, values_from = Freq) %>%
arrange(Admit, Gender)
df_wide## # A tibble: 4 × 8
## Admit Gender A B C D E F
## <fct> <fct> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 Admitted Male 512 353 120 138 53 22
## 2 Admitted Female 89 17 202 131 94 24
## 3 Rejected Male 313 207 205 279 138 351
## 4 Rejected Female 19 8 391 244 299 317
Penelitian ini menggunakan tiga variabel utama:
Analisis menggunakan uji Chi-Square independensi pada tabel kontingensi dua arah.
Statistik Uji
\[ \chi^2 = \sum \frac{(O - E)^2}{E} \]
dengan:
\[ \begin{aligned} O &: \text{frekuensi observasi} \\ E &: \text{frekuensi harapan} \end{aligned} \]
Taraf Signifikansi:
\[ \alpha = 0.05 \]
Hipotesis:
\[ \begin{aligned} H_0 &: \text{Tidak ada hubungan antara gender dan status penerimaan} \\ H_1 &: \text{Terdapat hubungan antara gender dan status penerimaan} \end{aligned} \]
# Tabel agregat Gender x Admit
tab <- margin.table(UCBAdmissions, c(2,1))
kable(tab, caption = "Tabel Agregat Penerimaan Mahasiswa Berdasarkan Gender")| Admitted | Rejected | |
|---|---|---|
| Male | 1198 | 1493 |
| Female | 557 | 1278 |
## Admit
## Gender Admitted Rejected
## Male 0.4451877 0.5548123
## Female 0.3035422 0.6964578
Berdasarkan tabel agregat penerimaan mahasiswa, terlihat bahwa jumlah pelamar laki-laki yang diterima adalah sebanyak 1.198 orang, sedangkan yang ditolak sebanyak 1.493 orang. Sementara itu, jumlah pelamar perempuan yang diterima adalah 557 orang, dan yang ditolak sebanyak 1.278 orang.
Secara total, jumlah pelamar laki-laki (2.691 orang) lebih banyak dibandingkan pelamar perempuan (1.835 orang). Jika dihitung tingkat penerimaannya, sekitar 44,5% pelamar laki-laki diterima, sedangkan tingkat penerimaan pelamar perempuan sekitar 30,4%.
Secara agregat, data ini menunjukkan bahwa tingkat penerimaan laki-laki lebih tinggi dibandingkan perempuan. Namun, karena data ini masih bersifat keseluruhan (belum dipisahkan berdasarkan departemen), kesimpulan ini belum tentu mencerminkan adanya bias gender secara langsung. Analisis lebih lanjut per departemen diperlukan untuk memahami pola yang sebenarnya.
Berbeda dengan tabel agregat sebelumnya, grafik di atas menunjukkan tingkat penerimaan mahasiswa yang dipisahkan berdasarkan masing-masing departemen (A–F). Hasilnya memperlihatkan pola yang lebih kompleks dibandingkan analisis keseluruhan.
Pada Departemen A, tingkat penerimaan perempuan (82,4%) lebih tinggi dibandingkan laki-laki (62,1%). Hal serupa juga terlihat pada Departemen B, di mana perempuan memiliki tingkat penerimaan sebesar 68,0% dibandingkan laki-laki sebesar 63,0%.
Sebaliknya, pada Departemen C, laki-laki memiliki tingkat penerimaan sedikit lebih tinggi (36,9%) dibandingkan perempuan (34,1%). Pada Departemen D, tingkat penerimaan relatif hampir seimbang, dengan perempuan sedikit lebih tinggi (34,9%) dibandingkan laki-laki (33,1%).
Pada Departemen E, laki-laki memiliki tingkat penerimaan lebih tinggi (27,7%) dibandingkan perempuan (23,9%). Sementara itu, pada Departemen F, tingkat penerimaan perempuan (7,0%) sedikit lebih tinggi dibandingkan laki-laki (5,9%), meskipun keduanya relatif rendah.
Temuan ini menunjukkan bahwa perbedaan pada data agregat sebelumnya kemungkinan dipengaruhi oleh distribusi pelamar ke masing-masing departemen. Dengan kata lain, perbedaan tingkat penerimaan secara keseluruhan dapat dijelaskan oleh variasi tingkat selektivitas antar departemen serta pola pilihan jurusan pelamar. Fenomena ini merupakan contoh klasik dari Simpson’s Paradox, di mana tren pada data agregat dapat berbeda atau bahkan berlawanan dengan tren pada data yang telah dipisahkan ke dalam kelompok-kelompok tertentu.
##
## Pearson's Chi-squared test
##
## data: tab
## X-squared = 92.205, df = 1, p-value < 2.2e-16
## Hasil uji Chi-square global (Gender vs Status Penerimaan):
## X-squared = 92.205 , df = 1 , n = 4526 , p-value = 7.814e-22
## Effect size (Phi/Cramer's V) = 0.143
## Keputusan: Tolak H0 (α = 0.05). Gender dan status penerimaan tidak independen pada data agregat.
##
## Expected counts (frekuensi harapan):
## Admit
## Gender Admitted Rejected
## Male 1043.46 1647.54
## Female 711.54 1123.46
##
## Catatan: Semua expected count ≥ 5, asumsi uji Chi-square terpenuhi.
dept_list <- dimnames(UCBAdmissions)$Dept
for(d in dept_list){
tab_dept <- UCBAdmissions[,,d]
test <- chisq.test(tab_dept, correct = FALSE)
cat("\n==========================\n")
cat("Department:", d, "\n")
print(test)
}| Departemen | \[ \chi^2 \] | df | p-value | Keputusan |
|---|---|---|---|---|
| A | 17.24800 | 1 | 3.28e-05 | Tolak H0 |
| B | 0.25372 | 1 | 0.6145 | Gagal tolak H0 |
| C | 0.75354 | 1 | 0.3854 | Gagal tolak H0 |
| D | 0.29798 | 1 | 0.5852 | Gagal tolak H0 |
| E | 1.00110 | 1 | 0.3171 | Gagal tolak H0 |
| F | 0.38409 | 1 | 0.5354 | Gagal tolak H0 |
Uji Chi-square global menunjukkan hasil signifikan (χ² = 92,205; p-value < 0,05) sehingga pada data agregat terdapat hubungan antara gender dan status penerimaan. Namun, ketika uji dilakukan per departemen, hanya Departemen A yang signifikan (p-value = 3,28×10⁻⁵), sementara departemen lain tidak signifikan (p-value > 0,05).
Perbedaan antara hasil agregat dan hasil terstratifikasi ini mengindikasikan bahwa Departemen berperan sebagai variabel pengelompokan penting dan mendukung fenomena Simpson’s Paradox.
Temuan analisis menunjukkan Departemen sebagai faktor pengelompokan penting yang memengaruhi interpretasi. Temuan ini selaras dengan Simpson’s Paradox, dimana ketika pola pada data gabungan dapat berbeda dibandingkan pola setelah data dikelompokkan. Oleh karena itu, kesimpulan mengenai hubungan gender dan penerimaan mahasiswa sebaiknya tidak hanya didasarkan pada data agregat, melainkan juga mempertimbangkan tiap kelompok atau departemen.