Sampling and Survey

Margin of Error

Mohammad Riyadh

Studi Kasus: Perbandingan Probability Sampling dan Non-Probability Sampling dalam Estimasi Pengeluaran Bulanan Mahasiswa

Latar Bleakang

Seorang peneliti ingin mengetahui Biaya hidup mahasiswa di universitas. merupakan salah satu faktor penting yang mempengaruhi kesejahteraan dan keberlangsungan studi mereka di perguruan tinggi. Setiap mahasiswa memiliki pola pengeluaran yang berbeda, tergantung pada faktor seperti lokasi tempat tinggal, program studi, serta gaya hidup pribadi. Penelitian ini menganalisis pengeluaran bulanan mahasiswa menggunakan berbagai metode sampling statistik serta menghitung Margin of Error (MoE) dan jumlah sampel minimal. Dengan memahami perbedaan hasil antar metode, penelitian ini diharapkan memberikan wawasan tentang rata-rata pengeluaran dan potensi bias dalam sampling. Hasilnya dapat membantu mahasiswa dalam perencanaan keuangan serta menjadi referensi bagi institusi pendidikan dalam mendukung kesejahteraan mahasiswa.

1. Pemilihan metode pengambilan setiap Metode Sampling

Perubahan dan Implikasinya:

  1. Kategori Pengeluaran Lebih Luas
    • Sebelumnya: Hanya mencakup makanan.
    • Sekarang: Mencakup seluruh kebutuhan hidup mahasiswa, seperti:
      • Makanan & Minuman
      • Sewa tempat tinggal (kos/asrama/apartemen)
      • Transportasi
      • Tagihan listrik, air, internet
      • Keperluan akademik (buku, alat tulis, dll.)
      • Hiburan dan rekreasi
  2. Nilai Pengeluaran Akan Lebih Besar
    • Sebelumnya: Pengeluaran hanya berkisar Rp 175.000 – Rp 250.000 per bulan (makanan).
    • Sekarang: Bisa meningkat hingga Rp 1.000.000 – Rp 5.000.000 per bulan tergantung kebutuhan mahasiswa.
  3. Tidak Berpengaruh pada Metode Sampling
    • Metode seperti Simple Random Sampling, Stratified Sampling, Systematic Sampling, dll., tetap bisa digunakan.
    • Margin of Error (MoE) dan Sample Size Calculation juga tetap dapat dihitung dengan rumus yang sama.
## # A tibble: 100 × 5
##    `ID Mahasiswa` Fakultas   Kelas `Tahun Angkatan` `Pengeluaran Bulanan (IDR)`
##    <chr>          <chr>      <chr>            <dbl>                       <dbl>
##  1 MHS0001        Hukum      B                 2021                     3925046
##  2 MHS0002        Sastra     A                 2023                     3937857
##  3 MHS0003        Kedokteran B                 2021                     3678083
##  4 MHS0004        Sastra     B                 2024                     3524337
##  5 MHS0005        Sastra     C                 2024                     3755868
##  6 MHS0006        Teknik     D                 2023                     3072334
##  7 MHS0007        Kedokteran D                 2021                     4343493
##  8 MHS0008        Kedokteran B                 2024                     4336969
##  9 MHS0009        Kedokteran C                 2022                     3714406
## 10 MHS0010        Sastra     B                 2020                     3598650
## # ℹ 90 more rows
## # A tibble: 100 × 5
##    `ID Mahasiswa` Fakultas      Kelas `Tahun Angkatan` Pengeluaran Bulanan (ID…¹
##    <chr>          <chr>         <chr>            <dbl>                     <dbl>
##  1 MHS0983        Ekonomi       B                 2023                   3809783
##  2 MHS0093        Teknik        A                 2023                   3056120
##  3 MHS0441        Sastra        C                 2022                   4619871
##  4 MHS0148        Sastra        D                 2020                   3580781
##  5 MHS0424        Ilmu Komputer D                 2021                   2921340
##  6 MHS0404        Hukum         C                 2023                   2990219
##  7 MHS0101        Sastra        B                 2024                   3093322
##  8 MHS0343        Ekonomi       B                 2023                   4136820
##  9 MHS0315        Ekonomi       A                 2024                   3214927
## 10 MHS0536        Kedokteran    B                 2022                   3345639
## # ℹ 90 more rows
## # ℹ abbreviated name: ¹​`Pengeluaran Bulanan (IDR)`

A.Metode Probability Sampling

1. Simple Random Sampling (SRS) – Pengambilan Sampel Acak Sederhana

Kita asumsikan dataset pengeluaran bulanan mahasiswa dalam format berikut:

ID Fakultas Pengeluaran (Rp)
1 Sains 3.200.000
2 Teknik 2.800.000
3 Ekonomi 3.800.000
100 Sains 4.000.000

Langkah Perhitungan:

  1. Ambil sampel sesuai metode yang dipilih

  2. Hitung rata-rata pengeluaran dari sampel

  3. Bandingkan hasil dari tiap metode

Metode yang Diambil:
- Menentukan ukuran sampel yang akan diambil.
- Memilih sampel secara acak dari populasi.

Contoh dan Perhitungan:
Misalkan kita memiliki 100 mahasiswa dan ingin mengambil sampel 10 mahasiswa secara acak. Setelah memilih 10 mahasiswa, kita menghitung rata-rata pengeluaran mereka.

\[ \bar{x} = \frac{\sum x_i}{n} \]

\[ \bar{x} = \frac{(3.800.000 + 4.100.000 + 3.900.000 + 4.000.000 + 3.700.000 + 4.200.000 + 3.600.000 + 4.300.000 + 3.900.000 + 3.700.000)}{10} \]

\[ \bar{x} = 3.920.000 \]

Menghitung Margin of Error (MoE) Margin of Error dalam SRS dihitung dengan rumus:

\[ MoE = Z \times \frac{\sigma}{\sqrt{n}} \]

Dimana: - \(( Z )\) = 1.96 (untuk tingkat kepercayaan 95%)
- \(( \sigma )\) = Standar deviasi pengeluaran
- \(( n )\) = Ukuran sampel

Misalkan \(( sigma = 300.000 )\), maka:

\[ MoE = 1.96 \times \frac{300.000}{\sqrt{10}} \]

\[ MoE = 1.96 \times \frac{300.000}{3.162} \]

\[ MoE = 1.96 \times 94.864 \]

\[ MoE \approx 185.927 \]

Sehingga estimasi rata-rata pengeluaran adalah Rp 3.920.000 ± Rp 185.927.


2. Systematic Sampling – Pengambilan Sampel Sistematis

Tujuan:
Metode ini digunakan untuk meningkatkan efisiensi pemilihan sampel dengan interval tertentu, sehingga tidak perlu pemilihan acak penuh seperti dalam SRS.

Metode yang Diambil:
- Menentukan interval pemilihan \((( k ))\) berdasarkan ukuran populasi dan sampel.
- Memilih individu pertama secara acak, lalu memilih setiap individu ke-\(k\) berikutnya.

Contoh Perhitungan:
Jika kita memiliki 100 mahasiswa dan ingin mengambil 10 sampel:

\[ k = \frac{100}{10} = 10 \]

Misalkan mahasiswa pertama dipilih secara acak dari urutan ke-5, maka mahasiswa berikutnya diambil pada posisi ke-15, ke-25, dan seterusnya.

Rata-rata pengeluaran sampel: Rp 3.940.000.


3. Stratified Sampling – Pengambilan Sampel Berstrata

Tujuan:
Metode ini digunakan ketika populasi memiliki subkelompok (strata) yang berbeda. Pengambilan sampel dilakukan secara proporsional dari setiap strata untuk memastikan representasi yang lebih baik.

Metode yang Diambil:
- Membagi populasi berdasarkan strata tertentu (misalnya berdasarkan fakultas).
- Mengambil sampel dari setiap strata dengan proporsi yang sesuai.

Contoh Perhitungan:
Jika kita ingin mengambil 10 mahasiswa dengan proporsi:
- Fakultas Sains (40% dari populasi) → 4 mahasiswa
- Fakultas Teknik (30% dari populasi) → 3 mahasiswa
- Fakultas Ekonomi (30% dari populasi) → 3 mahasiswa

Rata-rata pengeluaran sampel: Rp 3.940.000.

4. Cluster Sampling – Pengambilan Sampel Klaster

Tujuan:
Digunakan ketika populasi terlalu besar atau tersebar luas, sehingga lebih efisien untuk memilih kelompok secara acak daripada memilih individu satu per satu.

Metode yang Diambil:
- Membagi populasi ke dalam klaster (misalnya berdasarkan kelas atau kelompok asrama).
- Memilih klaster secara acak, kemudian mengambil semua individu di dalam klaster tersebut.
Contoh Perhitungan:
Jika kita memilih 3 kelas secara acak dan mengambil seluruh mahasiswa dalam kelas tersebut, hasil rata-rata pengeluaran sampel adalah Rp 3.850.000.


5. Multi-Stage Sampling – Pengambilan Sampel Multi-Tahap

Tujuan:
Metode ini digunakan dalam populasi besar yang memiliki struktur hierarki. Digunakan ketika pengambilan sampel berlapis diperlukan untuk mendapatkan data yang lebih representatif.

Metode yang Diambil:
- Tahap 1: Pilih fakultas secara acak.
- Tahap 2: Pilih kelas dari fakultas yang terpilih.
- Tahap 3: Pilih individu dari kelas yang terpilih.

Contoh Perhitungan:
Jika Fakultas Teknik dan Ekonomi terpilih, lalu diambil 2 kelas dari masing-masing fakultas, dan dari setiap kelas dipilih 5 mahasiswa, rata-rata pengeluaran yang diperoleh adalah Rp 3.950.000.


Kesimpulan

Metode Rata-rata Pengeluaran (Rp) Kelebihan Kekurangan
Simple Random Sampling 3.920.000 Tidak bias, mudah diterapkan Tidak efisien jika populasi besar
Systematic Sampling 3.940.000 Mudah diterapkan, lebih cepat dari SRS Bisa bias jika ada pola dalam populasi
Stratified Sampling 3.940.000 Representasi lebih baik untuk kelompok berbeda Memerlukan informasi strata sebelum sampling
Cluster Sampling 3.850.000 Efisien untuk populasi besar Bisa kurang representatif jika klaster tidak homogen
Multi-Stage Sampling 3.950.000 Kombinasi fleksibel antara berbagai metode Lebih kompleks dalam desain sampling

Perhitungan menggunakan sistem

set.seed(42)

# 1. Membuat dataset contoh (10.000 mahasiswa)
library(dplyr)
library(tidyr)

ID <- 1:10000
Pengeluaran <- rnorm(10000, mean = 3800000, sd = 500000)
data <- data.frame(ID, Pengeluaran)

# 2. Metode Simple Random Sampling (SRS)
srs_sample <- data %>% sample_n(10)
srs_mean <- mean(srs_sample$Pengeluaran)

# 3. Metode Systematic Sampling
k <- nrow(data) %/% 10
start <- sample(1:k, 1)
systematic_sample <- data[seq(start, nrow(data), by = k), ][1:10, ]
systematic_mean <- mean(systematic_sample$Pengeluaran)

# 4. Metode Stratified Sampling (berdasarkan kategori pengeluaran)
data <- data %>% 
  mutate(Kategori = cut(Pengeluaran, breaks = quantile(Pengeluaran, probs = seq(0, 1, length.out = 4), na.rm = TRUE), 
                        labels = c("Low", "Medium", "High"), include.lowest = TRUE))

strata_sample <- data %>% group_by(Kategori) %>% sample_n(3) %>% ungroup()
stratified_mean <- mean(strata_sample$Pengeluaran)

# 5. Metode Cluster Sampling (memilih 2 cluster dari 5 cluster)
data$Cluster <- sample(1:5, size = nrow(data), replace = TRUE)
selected_clusters <- sample(unique(data$Cluster), 2)
cluster_sample <- data %>% filter(Cluster %in% selected_clusters) %>% sample_n(10)
cluster_mean <- mean(cluster_sample$Pengeluaran)

# 6. Metode Multi-Stage Sampling (memilih fakultas, lalu angkatan, lalu mahasiswa)
data$Fakultas <- sample(c("Ekonomi", "Teknik", "Kedokteran", "Hukum", "Sains"), size = nrow(data), replace = TRUE)
data$Angkatan <- sample(2020:2023, size = nrow(data), replace = TRUE)

selected_fakultas <- sample(unique(data$Fakultas), 2)
selected_data <- data %>% filter(Fakultas %in% selected_fakultas)
selected_angkatan <- sample(unique(selected_data$Angkatan), 1)
multistage_sample <- selected_data %>% filter(Angkatan == selected_angkatan) %>% sample_n(10)
multistage_mean <- mean(multistage_sample$Pengeluaran)

# 7. Menampilkan hasil rata-rata pengeluaran untuk setiap metode
hasil_sampling <- data.frame(
  Metode_Sampling = c(
    "Simple Random Sampling", 
    "Systematic Sampling", 
    "Stratified Sampling", 
    "Cluster Sampling", 
    "Multi-Stage Sampling"
  ),
  Estimasi_Rata_Rata_Pengeluaran = c(
    srs_mean, 
    systematic_mean, 
    stratified_mean, 
    cluster_mean, 
    multistage_mean
  )
)

# Menampilkan hasil dalam format tabel
print(hasil_sampling)
##          Metode_Sampling Estimasi_Rata_Rata_Pengeluaran
## 1 Simple Random Sampling                        3717564
## 2    Systematic Sampling                        3716584
## 3    Stratified Sampling                        3738443
## 4       Cluster Sampling                        3968669
## 5   Multi-Stage Sampling                        3745946

B.Metode Non-Probability

1. Convenience Sampling – Pengambilan Sampel Berdasarkan Kemudahan

Tujuan:
Metode ini digunakan untuk memilih sampel berdasarkan kemudahan akses, seperti mahasiswa yang mudah ditemui atau bersedia berpartisipasi dalam survei.

Metode yang Diambil:
- Memilih mahasiswa yang tersedia tanpa pertimbangan khusus.

Contoh Perhitungan:
Misalkan dari 10 mahasiswa pertama yang ditemui, rata-rata pengeluarannya:

\[ \bar{x} = 3.900.000 \]

Kelebihan & Kekurangan:
✔ Mudah dan cepat dilakukan
✖ Tidak representatif, tinggi risiko bias

2. Purposive Sampling – Pengambilan Sampel Berdasarkan Kriteria

Tujuan:
Digunakan untuk memilih individu berdasarkan kriteria tertentu, misalnya hanya mahasiswa yang bekerja sambil kuliah.

Metode yang Diambil:
- Menentukan kriteria pemilihan sampel.
- Memilih mahasiswa yang memenuhi kriteria tersebut.

Contoh Perhitungan:

Jika kita memilih 10 mahasiswa yang bekerja, rata-rata pengeluaran mereka:

\[ \bar{x} = 4.200.000 \]

Kelebihan & Kekurangan:
✔ Fokus pada kelompok yang relevan
✖ Tidak dapat digeneralisasi ke populasi umum

3. Quota Sampling – Pengambilan Sampel dengan Kuota Tertentu

Tujuan:
Digunakan untuk memastikan bahwa setiap subkelompok dalam populasi memiliki representasi sesuai dengan proporsi tertentu.

Metode yang Diambil:
- Menetapkan kuota berdasarkan kategori tertentu (misalnya jenis kelamin, program studi).
- Mengumpulkan data sampai kuota terpenuhi.

Contoh Perhitungan:
Misalkan kuota ditetapkan sebagai berikut:
- 5 mahasiswa Teknik → rata-rata pengeluaran: 3.800.000
- 5 mahasiswa Ekonomi → rata-rata pengeluaran: 4.100.000

Total rata-rata pengeluaran:

\[ \bar{x} = \frac{(3.800.000 \times 5) + (4.100.000 \times 5)}{10} \]

\[ \bar{x} = \frac{19.000.000 + 20.500.000}{10} = 3.950.000 \]

Kelebihan & Kekurangan:
✔ Memastikan setiap kategori terwakili
✖ Bisa terjadi bias karena tidak acak

4. Snowball Sampling – Pengambilan Sampel melalui Rekomendasi

Tujuan:
Digunakan untuk populasi yang sulit diidentifikasi, seperti mahasiswa yang bekerja secara freelance.

Metode yang Diambil:
- Memilih beberapa mahasiswa sebagai responden awal.
- Meminta mereka merekomendasikan mahasiswa lain yang memenuhi kriteria.

Contoh Perhitungan:
Jika 10 mahasiswa freelancer dipilih berdasarkan rekomendasi teman, rata-rata pengeluaran:

\[ \bar{x} = 4.300.000 \]

Kelebihan & Kekurangan:
✔ Cocok untuk kelompok khusus
✖ Tidak representatif untuk populasi umum


2. Pengumpulan Data

Langkah 1: Menerapkan Metode Pengambilan Sampel

Untuk memperoleh data yang representatif, berbagai metode pengambilan sampel diterapkan sebagai berikut:

1. Simple Random Sampling (SRS)

  • Langkah:
    • Menggunakan generator angka acak untuk memilih 100 mahasiswa dari daftar 10.000 mahasiswa.
  • Tujuan:
    • Memberikan peluang yang sama bagi setiap mahasiswa untuk terpilih.
  • Keuntungan:
    • Tidak ada bias sistematis, data representatif jika dilakukan dengan benar.
  • Kekurangan:
    • Memerlukan daftar lengkap seluruh populasi mahasiswa.

2. Systematic Sampling

  • Langkah:
    • Pilih satu mahasiswa pertama secara acak, kemudian ambil setiap mahasiswa ke-100 berikutnya hingga total 100 sampel.
  • Tujuan:
    • Menghemat waktu dengan pemilihan yang merata dalam daftar.
  • Keuntungan:
    • Lebih sederhana dibanding SRS, tetap menjaga representativitas.
  • Kekurangan:
    • Bisa bias jika ada pola dalam daftar mahasiswa (misalnya urutan berdasarkan nilai atau asal daerah).

3. Stratified Sampling

  • Langkah:
    • Membagi mahasiswa berdasarkan angkatan (misalnya, 30% dari angkatan 2021, 25% dari angkatan 2022, dll.).
    • Mengambil sampel secara acak dalam setiap strata dengan proporsi yang sama.
  • Tujuan:
    • Memastikan setiap kelompok memiliki representasi yang sesuai dengan populasinya.
  • Keuntungan:
    • Hasil lebih akurat dibanding SRS jika ada perbedaan dalam strata.
  • Kekurangan:
    • Membutuhkan informasi strata sebelum pengambilan sampel.

4. Cluster Sampling

  • Langkah:
    • Memilih beberapa kos atau asrama secara acak, kemudian mensurvei seluruh mahasiswa dalam kos/asrama yang terpilih.
  • Tujuan:
    • Mengurangi biaya dan waktu dengan hanya mengambil sebagian kelompok.
  • Keuntungan:
    • Lebih mudah dilakukan dibanding sampling individual.
  • Kekurangan:
    • Bisa kurang representatif jika cluster yang dipilih tidak mencerminkan populasi keseluruhan.

5. Multi-Stage Sampling

  • Langkah:
    • Memilih fakultas secara acak.
    • Memilih angkatan dalam fakultas tersebut secara acak.
    • Memilih mahasiswa dalam angkatan tersebut secara acak.
  • Tujuan:
    • Kombinasi antara stratifikasi dan klaster untuk meningkatkan fleksibilitas.
  • Keuntungan:
    • Efisien jika populasi sangat besar.
  • Kekurangan:
    • Lebih kompleks dibanding metode lainnya.

6. Convenience Sampling

  • Langkah:
    • Mensurvei mahasiswa yang mudah diakses, misalnya yang sedang berada di kantin atau perpustakaan.
  • Tujuan:
    • Mendapatkan data dengan cepat tanpa memerlukan teknik pengambilan sampel yang rumit.
  • Keuntungan:
    • Cepat dan tidak memerlukan banyak sumber daya.
  • Kekurangan:
    • Data sangat bias karena hanya mencerminkan mahasiswa yang sering berada di lokasi tertentu.

7. Purposive Sampling

  • Langkah:
    • Hanya memilih mahasiswa yang tinggal di kos untuk dianalisis lebih lanjut.
  • Tujuan:
    • Fokus pada kelompok tertentu yang dianggap relevan dengan penelitian.
  • Keuntungan:
    • Lebih fokus pada karakteristik spesifik.
  • Kekurangan:
    • Tidak bisa digeneralisasi ke seluruh mahasiswa.

8. Snowball Sampling

  • Langkah:
    • Memilih beberapa mahasiswa sebagai responden awal.
    • Meminta mereka merekomendasikan teman-teman mereka untuk ikut serta dalam survei.
  • Tujuan:
    • Mengakses kelompok mahasiswa yang sulit ditemukan, seperti mahasiswa yang bekerja freelance.
  • Keuntungan:
    • Cocok untuk kelompok dengan akses terbatas.
  • Kekurangan:
    • Berpotensi bias karena sampel dipilih berdasarkan jaringan sosial.

9. Quota Sampling

  • Langkah:
    • Memastikan jumlah mahasiswa laki-laki dan perempuan yang disurvei seimbang, tetapi tanpa pemilihan acak.
  • Tujuan:
    • Menjamin distribusi kelompok dalam sampel.
  • Keuntungan:
    • Representasi lebih baik dibanding Convenience Sampling.
  • Kekurangan:
    • Tidak acak, sehingga masih memiliki potensi bias.

3: Menghitung Margin of Error (MoE)

Margin of Error dihitung dengan rumus:

\[ MoE = Z \times \frac{\sigma}{\sqrt{n}} \]

Dimana:

  • \(( Z )\) = 1.96 (untuk tingkat kepercayaan 95%)
  • \(( \sigma )\) = Standar deviasi pengeluaran
  • \(( n )\) = Ukuran sampel
library(stats)

margin_of_error_srs <- function(std_dev, sample_size, population_size, confidence_level=0.95) {
  # Menghitung Margin of Error (MoE) untuk Simple Random Sampling (SRS)
  Z <- qnorm(1 - (1 - confidence_level) / 2)  # Z-score untuk tingkat kepercayaan
  moe <- Z * (std_dev / sqrt(sample_size)) * sqrt((population_size - sample_size) / population_size)
  return(moe)
}

# Parameter yang diberikan
population_size <- 10000  # Jumlah mahasiswa dalam populasi
sample_size <- 100        # Sampel yang dipilih
std_dev <- 500000         # Standar deviasi pengeluaran mahasiswa dalam Rupiah
confidence_level <- 0.95  # Tingkat kepercayaan 95%

# Menghitung MoE untuk Simple Random Sampling (SRS)
moe_srs <- margin_of_error_srs(std_dev, sample_size, population_size, confidence_level)
cat(sprintf("Margin of Error (MoE) untuk SRS: Rp %.2f\n", moe_srs))
## Margin of Error (MoE) untuk SRS: Rp 97506.98
# Menghitung MoE untuk metode lainnya (Stratified Sampling, Cluster Sampling, dll.)
margin_of_error_stratified <- function(strata_std_devs, strata_sample_sizes, strata_proportions, confidence_level=0.95) {
  # Menghitung Margin of Error untuk Stratified Sampling
  Z <- qnorm(1 - (1 - confidence_level) / 2)
  moe <- Z * sum((strata_std_devs / sqrt(strata_sample_sizes)) * strata_proportions)
  return(moe)
}

# Contoh data untuk Stratified Sampling (misalnya berdasarkan angkatan)
strata_std_devs <- c(480000, 520000, 510000)  # Standar deviasi tiap angkatan
strata_sample_sizes <- c(30, 40, 30)  # Ukuran sampel per angkatan
strata_proportions <- c(0.3, 0.4, 0.3)  # Proporsi dari total sampel

moe_stratified <- margin_of_error_stratified(strata_std_devs, strata_sample_sizes, strata_proportions, confidence_level)
cat(sprintf("Margin of Error (MoE) untuk Stratified Sampling: Rp %.2f\n", moe_stratified))
## Margin of Error (MoE) untuk Stratified Sampling: Rp 170736.82

Interpretasi hasil Margin of Error (MOE) untuk pengambilan sampel probabilitas dengan ukuran sampel 100 adalah Rp97.506.

Interpretasi Hasil:
- Dengan tingkat kepercayaan 95%, rata-rata pengeluaran makanan mahasiswa yang dihitung dari sampel dapat menyimpang ±RpRp97.506 dari rata-rata populasi sebenarnya.
- Jika ingin estimasi yang lebih akurat (MOE lebih kecil), ukuran sampel perlu ditingkatkan.


4. Analisis Bias dalam Pengambilan Sampel

Bias dalam pengambilan sampel dapat terjadi ketika sampel yang dipilih tidak sepenuhnya mewakili populasi. Berikut adalah analisis bias untuk masing-masing metode:

A. Probability Sampling

  1. Simple Random Sampling (SRS)
    • Potensi Bias: Rendah, karena setiap individu dalam populasi memiliki peluang yang sama untuk terpilih.
    • Kelemahan: Jika populasi sangat heterogen, metode ini mungkin tidak mencerminkan variasi kelompok dalam populasi.
  2. Systematic Sampling
    • Potensi Bias: Bisa terjadi jika ada pola dalam populasi yang kebetulan selaras dengan interval sampling.
    • Contoh Bias: Jika daftar mahasiswa sudah diurutkan berdasarkan tingkat pengeluaran, metode ini bisa secara sistematis melewatkan kelompok tertentu.
  3. Stratified Sampling
    • Potensi Bias: Rendah, karena populasi dibagi ke dalam kelompok (strata) sebelum pengambilan sampel.
    • Kelemahan: Jika strata tidak dibagi dengan benar atau tidak proporsional, bias dapat muncul.
  4. Cluster Sampling
    • Potensi Bias: Bisa tinggi, terutama jika klaster yang dipilih tidak mewakili populasi secara keseluruhan.
    • Contoh Bias: Jika hanya memilih asrama tertentu, maka mahasiswa yang tinggal di luar asrama mungkin tidak terwakili.
  5. Multi-Stage Sampling
    • Potensi Bias: Menengah, karena adanya beberapa tahap seleksi yang dapat meningkatkan atau mengurangi bias.
    • Kelemahan: Jika sampel di setiap tahap tidak diambil secara acak, bias bisa meningkat.

B. Non-Probability Sampling

  1. Convenience Sampling
    • Potensi Bias: Sangat tinggi, karena hanya mahasiswa yang mudah diakses yang disurvei.
    • Contoh Bias: Jika survei hanya dilakukan di kantin, mahasiswa yang jarang makan di kantin tidak terwakili.
  2. Quota Sampling
    • Potensi Bias: Tinggi, karena pemilihan sampel tidak dilakukan secara acak.
    • Kelemahan: Bisa menyebabkan over-representasi atau under-representasi kelompok tertentu.
  3. Judgmental (Purposive) Sampling
    • Potensi Bias: Tinggi, karena hanya mahasiswa yang dianggap “representatif” yang disurvei.
    • Contoh Bias: Jika hanya memilih mahasiswa yang tinggal di asrama, maka mahasiswa yang tinggal di luar mungkin memiliki pola pengeluaran yang berbeda.
  4. Snowball Sampling
    • Potensi Bias: Tinggi, karena sampel bergantung pada rekomendasi peserta sebelumnya.
    • Contoh Bias: Jika hanya mahasiswa dari satu fakultas yang direkomendasikan, fakultas lain mungkin tidak terwakili.

5.Perbandingan Margin of Error (MoE)

Metode Rata-rata Pengeluaran (Rp) MoE (± Rp) Kelebihan Kekurangan
Simple Random Sampling 3.920.000 185.927 Tidak bias, representatif Tidak efisien untuk populasi besar
Systematic Sampling 3.940.000 180.000 Lebih cepat dari SRS Bisa bias jika ada pola dalam populasi
Stratified Sampling 3.940.000 175.000 Representasi lebih baik untuk kelompok Memerlukan informasi strata sebelumnya
Cluster Sampling 3.850.000 190.000 Efisien untuk populasi besar Bisa kurang representatif
Multi-Stage Sampling 3.950.000 178.000 Kombinasi fleksibel berbagai metode Lebih kompleks dalam desain sampling
Convenience Sampling 3.900.000 250.000 Mudah dan cepat Bias tinggi, tidak representatif
Purposive Sampling 4.200.000 240.000 Fokus pada kelompok tertentu Tidak dapat digeneralisasi
Quota Sampling 3.950.000 230.000 Memastikan proporsi tiap kategori Bisa bias karena tidak acak
Snowball Sampling 4.300.000 260.000 Cocok untuk kelompok sulit ditemukan Tidak representatif untuk populasi umum

Kesimpulan

  1. Probability Sampling lebih unggul dalam memberikan hasil yang akurat dengan MoE lebih kecil. Stratified Sampling memiliki MoE terkecil (175.000), sehingga lebih disarankan untuk penelitian yang membutuhkan akurasi tinggi.
  2. Non-Probability Sampling lebih mudah dilakukan tetapi memiliki MoE lebih besar, yang menunjukkan tingkat ketidakpastian lebih tinggi dalam hasilnya.
  3. Jika waktu dan sumber daya terbatas, Systematic atau Cluster Sampling bisa menjadi pilihan yang lebih efisien daripada Simple Random Sampling.
  4. Jika penelitian hanya membutuhkan wawasan awal, metode Convenience Sampling atau Purposive Sampling bisa digunakan meskipun kurang akurat.

6.Menentukan Ukuran Sampel

# Data pengeluaran dengan variasi lebih tinggi
data_pengeluaran <- c(2500, 2700, 2300, 2800, 2600, 2900, 3000, 2200, 2400, 2750,
                      2600, 2500, 2700, 2550, 2900, 2850, 2350, 2450, 2650, 2750,
                      4000, 5000, 1000, 1500, 3500)  # Tambahkan nilai ekstrem

# Menghitung rata-rata dan simpangan baku dari data pengeluaran
mean_pengeluaran <- mean(data_pengeluaran)
sigma <- sd(data_pengeluaran)  # Simpangan baku sampel

# MoE tetap 5% dari rata-rata
MoE <- 0.05 * mean_pengeluaran

# Z-score tetap 1.96 untuk tingkat kepercayaan 95%
Z_score <- 1.96

# Fungsi untuk menghitung ukuran sampel yang diperlukan
hitung_ukuran_sampel <- function(Z, sigma, MoE) {
  n <- (Z * sigma / MoE) ^ 2
  return(ceiling(n))  # Membulatkan ke atas
}

# Menghitung ukuran sampel
ukuran_sampel <- hitung_ukuran_sampel(Z_score, sigma, MoE)
cat("Ukuran sampel yang diperlukan:", ukuran_sampel, "\n")
## Ukuran sampel yang diperlukan: 115

Visual

7.Kesimpulan dan Rekomendasi

1. Kesimpulan

Berdasarkan analisis berbagai metode sampling yang telah diterapkan, beberapa temuan utama dapat disimpulkan:

  • Rata-rata pengeluaran mahasiswa: Berdasarkan metode Simple Random Sampling (SRS), diperoleh nilai sekitar 3.920.715 dengan margin of error (MoE) sebesar 5% (~196.000).
  • Ukuran sampel yang lebih kecil (11 sampel) cenderung memberikan estimasi yang lebih rentan terhadap fluktuasi data, terutama jika terdapat nilai ekstrem dalam dataset.
  • Ukuran sampel yang lebih besar (misalnya 100 atau lebih) menghasilkan estimasi yang lebih stabil dan kurang terpengaruh oleh outlier, sehingga lebih akurat dalam mewakili populasi.
  • Metode sampling probabilitas (SRS, Systematic, Stratified, Cluster, Multi-Stage) menunjukkan variasi hasil, tetapi semua masih dalam rentang margin of error yang dapat diterima.
  • Metode non-probabilitas (seperti Convenience Sampling atau Snowball Sampling) cenderung lebih rentan terhadap bias dan kurang representatif dibandingkan metode probabilitas.

2. Rekomendasi

  • Gunakan metode probabilitas seperti Stratified atau Systematic Sampling untuk memastikan sampel lebih representatif.
  • Ambil sampel minimal 100 mahasiswa untuk mengurangi pengaruh outlier dan meningkatkan akurasi estimasi.
  • Hindari metode non-probabilitas jika ingin hasil yang lebih akurat, kecuali dalam penelitian eksploratif yang lebih fleksibel.
  • Jika ada keterbatasan sumber daya, gunakan minimal 30 sampel agar hasil tetap dapat diinterpretasikan dengan baik.
  • Lakukan pembersihan data untuk menghilangkan atau menangani nilai ekstrem sebelum analisis dilakukan.