Margin of Error

1.Pendahuluan

Dalam studi ini, kita akan membandingkan metode Probability Sampling dan Non-Probability Sampling dalam memperkirakan Margin of Error (MoE) terkait pengeluaran bulanan mahasiswa untuk makanan.

🔬 Tujuan Penelitian

Tujuan dari penelitian ini adalah:

🎨 Menjelaskan metode sampling yang digunakan dalam mengestimasi pengeluaran mahasiswa.
📊 Menghitung Margin of Error (MoE) untuk mengukur ketepatan estimasi dari sampel terhadap populasi.
🛠 Menganalisis bias dalam metode Non-Probability Sampling.
📊 Menentukan jumlah sampel minimum yang diperlukan agar hasil estimasi memiliki MoE yang kecil.

Metode sampling yang digunakan meliputi:

🔄Probability Sampling: Memastikan setiap individu memiliki peluang yang sama untuk dipilih.
🔄Non-Probability Sampling: Pemilihan sampel dilakukan tanpa metode acak.

2.Pembuatan Dataset

Dataset ini mencakup 100 mahasiswa dengan atribut:

🎓ID Mahasiswa: Nomor unik setiap mahasiswa.
📚Tahun Akademik: Tahun studi mahasiswa (1-4).
🍽️Lokasi Makan Utama: Tempat makan utama mahasiswa.
💰Pengeluaran Bulanan: Jumlah pengeluaran dalam IDR.

Pengerjaan Manual:

🔢 Tentukan jumlah total mahasiswa (100 orang).
🎓 Kelompokkan mahasiswa berdasarkan tahun akademik.
💰 Tentukan pengeluaran rata-rata mahasiswa.
🎨 Acak lokasi makan utama mahasiswa.

Implementasi di R:

num_students <- 100
student_ids <- 1:num_students
years <- sample(c("Tahun 1", "Tahun 2", "Tahun 3", "Tahun 4"), num_students, replace = TRUE)
lokasi_makan <- sample(c("Kantin", "Warteg", "Restoran", "Masak Sendiri"), num_students, replace = TRUE)
pengeluaran <- round(rnorm(num_students, mean = 1200000, sd = 300000))

data <- data.frame(
  "ID_Mahasiswa" = student_ids,
  "Tahun_Akademik" = years,
  "Lokasi_Makan_Utama" = lokasi_makan,
  "Pengeluaran_Bulanan" = pengeluaran
)

head(data)

##   ID_Mahasiswa Tahun_Akademik Lokasi_Makan_Utama Pengeluaran_Bulanan
## 1            1        Tahun 1             Warteg             1560290
## 2            2        Tahun 1      Masak Sendiri             1513425
## 3            3        Tahun 1             Kantin              899037
## 4            4        Tahun 1             Warteg             1754545
## 5            5        Tahun 2             Kantin              999968
## 6            6        Tahun 4             Warteg             1231654

3.Metode Sampling

3.1 🌟 Probability Sampling: Stratified Sampling

Stratified Sampling membagi populasi berdasarkan kelompok tertentu, dalam hal ini Tahun Akademik.

Pengerjaan Manual:

🏆 Bagi mahasiswa ke dalam 4 strata berdasarkan tahun akademik.
✅ Pilih 5 mahasiswa secara acak dari masing-masing strata.

Implementasi di R:

stratified_sample <- data %>% group_by(Tahun_Akademik) %>% sample_n(5)
print(stratified_sample)

## # A tibble: 20 × 4
## # Groups:   Tahun_Akademik [4]
##    ID_Mahasiswa Tahun_Akademik Lokasi_Makan_Utama Pengeluaran_Bulanan
##           <int> <chr>          <chr>                            <dbl>
##  1           60 Tahun 1        Masak Sendiri                  1586303
##  2            4 Tahun 1        Warteg                         1754545
##  3           85 Tahun 1        Warteg                         1116222
##  4           79 Tahun 1        Warteg                         1344958
##  5           91 Tahun 1        Restoran                       1261488
##  6           20 Tahun 2        Warteg                         1241177
##  7           65 Tahun 2        Warteg                         1377004
##  8           66 Tahun 2        Masak Sendiri                  1629727
##  9           99 Tahun 2        Warteg                         1744569
## 10           43 Tahun 2        Warteg                         1066595
## 11           57 Tahun 3        Kantin                         1197671
## 12           11 Tahun 3        Masak Sendiri                  1192472
## 13           59 Tahun 3        Restoran                       1039952
## 14           68 Tahun 3        Restoran                       1336395
## 15           89 Tahun 3        Warteg                          949108
## 16           14 Tahun 4        Restoran                       1048735
## 17           47 Tahun 4        Masak Sendiri                  1055702
## 18           26 Tahun 4        Kantin                         1071522
## 19           87 Tahun 4        Masak Sendiri                  1410225
## 20           46 Tahun 4        Restoran                       1534016

ID Mahasiswa	Tahun Akademik	Lokasi Makan Utama	Pengeluaran Bulanan (IDR)
60	Tahun 1	Masak Sendiri	1.586.303
4	Tahun 1	Warteg	1.754.545
85	Tahun 1	Warteg	1.116.222
79	Tahun 1	Warteg	1.344.958
91	Tahun 1	Restoran	1.261.488
20	Tahun 2	Warteg	1.241.177
65	Tahun 2	Warteg	1.377.004
8	Tahun 2	Masak Sendiri	1.629.727
9	Tahun 2	Warteg	1.744.569
43	Tahun 2	Warteg	1.066.595
57	Tahun 3	Kantin	1.197.671
11	Tahun 3	Masak Sendiri	1.192.472
3	Tahun 3	Restoran	1.039.952
68	Tahun 3	Restoran	1.336.395
89	Tahun 3	Warteg	949.108
14	Tahun 4	Restoran	1.048.735
47	Tahun 4	Masak Sendiri	1.055.702
48	Tahun 4	Kantin	1.071.522
87	Tahun 4	Masak Sendiri	1.410.225
46	Tahun 4	Restoran	1.534.016

4.Pengumpulan Data

Data dikumpulkan dengan langkah-langkah berikut:

🔄Menentukan Metode Sampling: Menggunakan Stratified Sampling dengan membagi mahasiswa berdasarkan tahun akademik.
📅Mengumpulkan Data Pengeluaran: Setiap mahasiswa dalam sampel mencatat pengeluaran makanan mereka dalam sebulan.

3.📂Menyimpan Data: Data dikumpulkan dalam bentuk tabel dan disimpan dalam spreadsheet atau database untuk analisis lebih lanjut.

🛠️Membersihkan Data: Memastikan tidak ada nilai yang hilang atau tidak masuk akal (misalnya pengeluaran negatif).

Implementasi di R:

# Simpan data hasil stratified sampling ke dalam dataframe baru
collected_data <- stratified_sample

# Cek apakah ada data yang hilang
missing_values <- sum(is.na(collected_data$Pengeluaran_Bulanan))

# Jika ada data yang hilang, isi dengan median
if (missing_values > 0) {
  collected_data$Pengeluaran_Bulanan[is.na(collected_data$Pengeluaran_Bulanan)] <- median(collected_data$Pengeluaran_Bulanan, na.rm = TRUE)
}

# Simpan data ke file CSV untuk keperluan lebih lanjut
write.csv(collected_data, "pengeluaran_mahasiswa_sample.csv", row.names = FALSE)

# Tampilkan hasil akhir setelah pengumpulan dan pembersihan data
print(collected_data)

## # A tibble: 20 × 4
## # Groups:   Tahun_Akademik [4]
##    ID_Mahasiswa Tahun_Akademik Lokasi_Makan_Utama Pengeluaran_Bulanan
##           <int> <chr>          <chr>                            <dbl>
##  1           60 Tahun 1        Masak Sendiri                  1586303
##  2            4 Tahun 1        Warteg                         1754545
##  3           85 Tahun 1        Warteg                         1116222
##  4           79 Tahun 1        Warteg                         1344958
##  5           91 Tahun 1        Restoran                       1261488
##  6           20 Tahun 2        Warteg                         1241177
##  7           65 Tahun 2        Warteg                         1377004
##  8           66 Tahun 2        Masak Sendiri                  1629727
##  9           99 Tahun 2        Warteg                         1744569
## 10           43 Tahun 2        Warteg                         1066595
## 11           57 Tahun 3        Kantin                         1197671
## 12           11 Tahun 3        Masak Sendiri                  1192472
## 13           59 Tahun 3        Restoran                       1039952
## 14           68 Tahun 3        Restoran                       1336395
## 15           89 Tahun 3        Warteg                          949108
## 16           14 Tahun 4        Restoran                       1048735
## 17           47 Tahun 4        Masak Sendiri                  1055702
## 18           26 Tahun 4        Kantin                         1071522
## 19           87 Tahun 4        Masak Sendiri                  1410225
## 20           46 Tahun 4        Restoran                       1534016

Setelah data dikumpulkan dan disiapkan, maka dapat digunakan untuk menghitung Margin of Error (MoE) dan melakukan analisis lebih lanjut.

Data dikumpulkan dengan langkah-langkah berikut:

Menentukan Metode Sampling: Menggunakan Stratified Sampling dengan membagi mahasiswa berdasarkan tahun akademik.
Mengumpulkan Data Pengeluaran: Setiap mahasiswa dalam sampel mencatat pengeluaran makanan mereka dalam sebulan.
Menyimpan Data: Data dikumpulkan dalam bentuk tabel dan disimpan dalam spreadsheet atau database untuk analisis lebih lanjut.
Membersihkan Data: Memastikan tidak ada nilai yang hilang atau tidak masuk akal (misalnya pengeluaran negatif).

Setelah data dikumpulkan dan disiapkan, maka dapat digunakan untuk menghitung Margin of Error (MoE) dan melakukan analisis lebih lanjut.

Data pengeluaran bulanan mahasiswa yang telah dipilih dalam proses sampling digunakan untuk analisis lebih lanjut.

5.Menghitung Margin of Error (MoE)

MoE dihitung menggunakan rumus: \[ MoE = z * \frac{\sigma}{\sqrt{n}} \]

Pengerjaan Manual:

Tentukan tingkat kepercayaan 95% → Z = 1.96.
Hitung standar deviasi dari data sampel (σ).
Hitung jumlah sampel (n).
Masukkan nilai ke dalam rumus untuk mendapatkan MoE.

Implementasi di R:

z <- 1.96  # 95% confidence level
sigma <- sd(stratified_sample$Pengeluaran_Bulanan)
n <- nrow(stratified_sample)
MoE <- z * (sigma / sqrt(n))

print(MoE)

## [1] 107919.1

Makna hasil: MoE menunjukkan seberapa besar kemungkinan hasil estimasi akan menyimpang dari nilai sebenarnya di populasi.

6. Analisis Bias

Bias dalam Non-Probability Sampling terjadi karena pemilihan sampel tidak dilakukan secara acak.

🌚Convenience Sampling: Sampel diambil berdasarkan kemudahan akses, misalnya hanya mahasiswa yang berada di kantin.
🌟Judgemental Sampling: Sampel dipilih berdasarkan opini subjektif peneliti, sehingga tidak selalu representatif.

7. Menentukan Ukuran Sampel Minimum

Untuk MoE di bawah 5%, gunakan rumus: \[ n = \left( \frac{z \times \sigma}{MoE} \right)^2 \]

Pengerjaan Manual:

Tentukan target MoE → 5% dari rata-rata pengeluaran mahasiswa.
Masukkan nilai standar deviasi populasi.
Hitung jumlah sampel yang diperlukan.

Implementasi di R:

MoE_target <- 0.05 * mean(data$Pengeluaran_Bulanan)
n_required <- (z * sd(data$Pengeluaran_Bulanan) / MoE_target) ^ 2
n_required <- ceiling(n_required)

print(n_required)

## [1] 83

Hasil ini menunjukkan jumlah minimum sampel yang harus diambil agar hasil estimasi memiliki tingkat keakuratan yang diinginkan.

8.VISUALISASI DATA DENGAN BOXPLOT

9. Kesimpulan dan Rekomendasi

Dari hasil penelitian, kita dapat menyimpulkan bahwa:

🌟Stratified Sampling lebih akurat dibandingkan metode Non-Probability Sampling karena memastikan keterwakilan setiap strata.
🔢Margin of Error (MoE) dihitung untuk mengukur ketepatan estimasi.
🛠️Untuk mengurangi MoE, diperlukan jumlah sampel yang lebih besar.

📈 Rekomendasi:

🔄 Gunakan ukuran sampel yang lebih besar untuk hasil yang lebih akurat.
🔬Bandingkan metode Probability Sampling lainnya seperti Simple Random Sampling atau Cluster Sampling.
🚫Hindari bias dalam Non-Probability Sampling dengan memastikan keterwakilan populasi secara lebih luas.

📚 Referensi

No	Penulis	Judul	Sumber	Tautan
1	Bakti Siregar, M.Sc., CD	Margin of Error	Bookdown	🔗 Link
2	Pengambilan Sampel & Survei	Survey Margin of Error (Video)	YouTube	🎥 Link

📖 Semoga bermanfaat! 🚀

T.Pengambilan Sampel & Survei

Luthfi.A.Hasibuan (52240014)

Maret 23, 2025

Margin of Error

1.Pendahuluan

🔬 Tujuan Penelitian

2.Pembuatan Dataset

3.Metode Sampling

3.1 🌟 Probability Sampling: Stratified Sampling

4.Pengumpulan Data

5.Menghitung Margin of Error (MoE)

6. Analisis Bias

7. Menentukan Ukuran Sampel Minimum

8.VISUALISASI DATA DENGAN BOXPLOT

9. Kesimpulan dan Rekomendasi

📈 Rekomendasi:

📚 Referensi