Dalam studi ini, kita akan membandingkan metode Probability Sampling dan Non-Probability Sampling dalam memperkirakan Margin of Error (MoE) terkait pengeluaran bulanan mahasiswa untuk makanan.
Tujuan dari penelitian ini adalah:
π¨ Menjelaskan metode sampling yang digunakan dalam mengestimasi pengeluaran mahasiswa.
π Menghitung Margin of Error (MoE) untuk mengukur ketepatan estimasi dari sampel terhadap populasi.
π Menganalisis bias dalam metode Non-Probability Sampling.
π Menentukan jumlah sampel minimum yang diperlukan agar hasil estimasi memiliki MoE yang kecil.
Metode sampling yang digunakan meliputi:
πProbability Sampling: Memastikan setiap individu memiliki peluang yang sama untuk dipilih.
πNon-Probability Sampling: Pemilihan sampel dilakukan tanpa metode acak.
Dataset ini mencakup 100 mahasiswa dengan atribut:
πID Mahasiswa: Nomor unik setiap mahasiswa.
πTahun Akademik: Tahun studi mahasiswa (1-4).
π½οΈLokasi Makan Utama: Tempat makan utama mahasiswa.
π°Pengeluaran Bulanan: Jumlah pengeluaran dalam IDR.
Pengerjaan Manual:
π’ Tentukan jumlah total mahasiswa (100 orang).
π Kelompokkan mahasiswa berdasarkan tahun akademik.
π° Tentukan pengeluaran rata-rata mahasiswa.
π¨ Acak lokasi makan utama mahasiswa.
Implementasi di R:
num_students <- 100
student_ids <- 1:num_students
years <- sample(c("Tahun 1", "Tahun 2", "Tahun 3", "Tahun 4"), num_students, replace = TRUE)
lokasi_makan <- sample(c("Kantin", "Warteg", "Restoran", "Masak Sendiri"), num_students, replace = TRUE)
pengeluaran <- round(rnorm(num_students, mean = 1200000, sd = 300000))
data <- data.frame(
"ID_Mahasiswa" = student_ids,
"Tahun_Akademik" = years,
"Lokasi_Makan_Utama" = lokasi_makan,
"Pengeluaran_Bulanan" = pengeluaran
)
head(data)## ID_Mahasiswa Tahun_Akademik Lokasi_Makan_Utama Pengeluaran_Bulanan
## 1 1 Tahun 1 Warteg 1560290
## 2 2 Tahun 1 Masak Sendiri 1513425
## 3 3 Tahun 1 Kantin 899037
## 4 4 Tahun 1 Warteg 1754545
## 5 5 Tahun 2 Kantin 999968
## 6 6 Tahun 4 Warteg 1231654
Stratified Sampling membagi populasi berdasarkan kelompok tertentu, dalam hal ini Tahun Akademik.
Pengerjaan Manual:
π Bagi mahasiswa ke dalam 4 strata berdasarkan tahun akademik.
β Pilih 5 mahasiswa secara acak dari masing-masing strata.
Implementasi di R:
## # A tibble: 20 Γ 4
## # Groups: Tahun_Akademik [4]
## ID_Mahasiswa Tahun_Akademik Lokasi_Makan_Utama Pengeluaran_Bulanan
## <int> <chr> <chr> <dbl>
## 1 60 Tahun 1 Masak Sendiri 1586303
## 2 4 Tahun 1 Warteg 1754545
## 3 85 Tahun 1 Warteg 1116222
## 4 79 Tahun 1 Warteg 1344958
## 5 91 Tahun 1 Restoran 1261488
## 6 20 Tahun 2 Warteg 1241177
## 7 65 Tahun 2 Warteg 1377004
## 8 66 Tahun 2 Masak Sendiri 1629727
## 9 99 Tahun 2 Warteg 1744569
## 10 43 Tahun 2 Warteg 1066595
## 11 57 Tahun 3 Kantin 1197671
## 12 11 Tahun 3 Masak Sendiri 1192472
## 13 59 Tahun 3 Restoran 1039952
## 14 68 Tahun 3 Restoran 1336395
## 15 89 Tahun 3 Warteg 949108
## 16 14 Tahun 4 Restoran 1048735
## 17 47 Tahun 4 Masak Sendiri 1055702
## 18 26 Tahun 4 Kantin 1071522
## 19 87 Tahun 4 Masak Sendiri 1410225
## 20 46 Tahun 4 Restoran 1534016
| ID Mahasiswa | Tahun Akademik | Lokasi Makan Utama | Pengeluaran Bulanan (IDR) |
|---|---|---|---|
| 60 | Tahun 1 | Masak Sendiri | 1.586.303 |
| 4 | Tahun 1 | Warteg | 1.754.545 |
| 85 | Tahun 1 | Warteg | 1.116.222 |
| 79 | Tahun 1 | Warteg | 1.344.958 |
| 91 | Tahun 1 | Restoran | 1.261.488 |
| 20 | Tahun 2 | Warteg | 1.241.177 |
| 65 | Tahun 2 | Warteg | 1.377.004 |
| 8 | Tahun 2 | Masak Sendiri | 1.629.727 |
| 9 | Tahun 2 | Warteg | 1.744.569 |
| 43 | Tahun 2 | Warteg | 1.066.595 |
| 57 | Tahun 3 | Kantin | 1.197.671 |
| 11 | Tahun 3 | Masak Sendiri | 1.192.472 |
| 3 | Tahun 3 | Restoran | 1.039.952 |
| 68 | Tahun 3 | Restoran | 1.336.395 |
| 89 | Tahun 3 | Warteg | 949.108 |
| 14 | Tahun 4 | Restoran | 1.048.735 |
| 47 | Tahun 4 | Masak Sendiri | 1.055.702 |
| 48 | Tahun 4 | Kantin | 1.071.522 |
| 87 | Tahun 4 | Masak Sendiri | 1.410.225 |
| 46 | Tahun 4 | Restoran | 1.534.016 |
Data dikumpulkan dengan langkah-langkah berikut:
πMenentukan Metode Sampling: Menggunakan Stratified Sampling dengan membagi mahasiswa berdasarkan tahun akademik.
π Mengumpulkan Data Pengeluaran: Setiap mahasiswa dalam sampel mencatat pengeluaran makanan mereka dalam sebulan.
3.πMenyimpan Data: Data dikumpulkan dalam bentuk tabel dan disimpan dalam spreadsheet atau database untuk analisis lebih lanjut.
Implementasi di R:
# Simpan data hasil stratified sampling ke dalam dataframe baru
collected_data <- stratified_sample
# Cek apakah ada data yang hilang
missing_values <- sum(is.na(collected_data$Pengeluaran_Bulanan))
# Jika ada data yang hilang, isi dengan median
if (missing_values > 0) {
collected_data$Pengeluaran_Bulanan[is.na(collected_data$Pengeluaran_Bulanan)] <- median(collected_data$Pengeluaran_Bulanan, na.rm = TRUE)
}
# Simpan data ke file CSV untuk keperluan lebih lanjut
write.csv(collected_data, "pengeluaran_mahasiswa_sample.csv", row.names = FALSE)
# Tampilkan hasil akhir setelah pengumpulan dan pembersihan data
print(collected_data)## # A tibble: 20 Γ 4
## # Groups: Tahun_Akademik [4]
## ID_Mahasiswa Tahun_Akademik Lokasi_Makan_Utama Pengeluaran_Bulanan
## <int> <chr> <chr> <dbl>
## 1 60 Tahun 1 Masak Sendiri 1586303
## 2 4 Tahun 1 Warteg 1754545
## 3 85 Tahun 1 Warteg 1116222
## 4 79 Tahun 1 Warteg 1344958
## 5 91 Tahun 1 Restoran 1261488
## 6 20 Tahun 2 Warteg 1241177
## 7 65 Tahun 2 Warteg 1377004
## 8 66 Tahun 2 Masak Sendiri 1629727
## 9 99 Tahun 2 Warteg 1744569
## 10 43 Tahun 2 Warteg 1066595
## 11 57 Tahun 3 Kantin 1197671
## 12 11 Tahun 3 Masak Sendiri 1192472
## 13 59 Tahun 3 Restoran 1039952
## 14 68 Tahun 3 Restoran 1336395
## 15 89 Tahun 3 Warteg 949108
## 16 14 Tahun 4 Restoran 1048735
## 17 47 Tahun 4 Masak Sendiri 1055702
## 18 26 Tahun 4 Kantin 1071522
## 19 87 Tahun 4 Masak Sendiri 1410225
## 20 46 Tahun 4 Restoran 1534016
Setelah data dikumpulkan dan disiapkan, maka dapat digunakan untuk menghitung Margin of Error (MoE) dan melakukan analisis lebih lanjut.
Data dikumpulkan dengan langkah-langkah berikut:
Menentukan Metode Sampling: Menggunakan Stratified Sampling dengan membagi mahasiswa berdasarkan tahun akademik.
Mengumpulkan Data Pengeluaran: Setiap mahasiswa dalam sampel mencatat pengeluaran makanan mereka dalam sebulan.
Menyimpan Data: Data dikumpulkan dalam bentuk tabel dan disimpan dalam spreadsheet atau database untuk analisis lebih lanjut.
Membersihkan Data: Memastikan tidak ada nilai yang hilang atau tidak masuk akal (misalnya pengeluaran negatif).
Setelah data dikumpulkan dan disiapkan, maka dapat digunakan untuk menghitung Margin of Error (MoE) dan melakukan analisis lebih lanjut.
Data pengeluaran bulanan mahasiswa yang telah dipilih dalam proses sampling digunakan untuk analisis lebih lanjut.
MoE dihitung menggunakan rumus: \[ MoE = z * \frac{\sigma}{\sqrt{n}} \]
Pengerjaan Manual:
Tentukan tingkat kepercayaan 95% β Z = 1.96.
Hitung standar deviasi dari data sampel (Ο).
Hitung jumlah sampel (n).
Masukkan nilai ke dalam rumus untuk mendapatkan MoE.
Implementasi di R:
z <- 1.96 # 95% confidence level
sigma <- sd(stratified_sample$Pengeluaran_Bulanan)
n <- nrow(stratified_sample)
MoE <- z * (sigma / sqrt(n))
print(MoE)## [1] 107919.1
Makna hasil: MoE menunjukkan seberapa besar kemungkinan hasil estimasi akan menyimpang dari nilai sebenarnya di populasi.
Bias dalam Non-Probability Sampling terjadi karena pemilihan sampel tidak dilakukan secara acak.
πConvenience Sampling: Sampel diambil berdasarkan kemudahan akses, misalnya hanya mahasiswa yang berada di kantin.
πJudgemental Sampling: Sampel dipilih berdasarkan opini subjektif peneliti, sehingga tidak selalu representatif.
Untuk MoE di bawah 5%, gunakan rumus: \[ n = \left( \frac{z \times \sigma}{MoE} \right)^2 \]
Pengerjaan Manual:
Tentukan target MoE β 5% dari rata-rata pengeluaran mahasiswa.
Masukkan nilai standar deviasi populasi.
Hitung jumlah sampel yang diperlukan.
Implementasi di R:
MoE_target <- 0.05 * mean(data$Pengeluaran_Bulanan)
n_required <- (z * sd(data$Pengeluaran_Bulanan) / MoE_target) ^ 2
n_required <- ceiling(n_required)
print(n_required)## [1] 83
Hasil ini menunjukkan jumlah minimum sampel yang harus diambil agar hasil estimasi memiliki tingkat keakuratan yang diinginkan.
Dari hasil penelitian, kita dapat menyimpulkan bahwa:
πStratified Sampling lebih akurat dibandingkan metode Non-Probability Sampling karena memastikan keterwakilan setiap strata.
π’Margin of Error (MoE) dihitung untuk mengukur ketepatan estimasi.
π οΈUntuk mengurangi MoE, diperlukan jumlah sampel yang lebih besar.
π Gunakan ukuran sampel yang lebih besar untuk hasil yang lebih akurat.
π¬Bandingkan metode Probability Sampling lainnya seperti Simple Random Sampling atau Cluster Sampling.
π«Hindari bias dalam Non-Probability Sampling dengan memastikan keterwakilan populasi secara lebih luas.