Sampling and Survey
Margin of Error
Studi Kasus: Perbandingan Probability Sampling dan Non-Probability Sampling dalam Estimasi Pengeluaran Bulanan Mahasiswa
Latar Bleakang
Seorang peneliti ingin mengetahui Biaya hidup mahasiswa di universitas. merupakan salah satu faktor penting yang mempengaruhi kesejahteraan dan keberlangsungan studi mereka di perguruan tinggi. Setiap mahasiswa memiliki pola pengeluaran yang berbeda, tergantung pada faktor seperti lokasi tempat tinggal, program studi, serta gaya hidup pribadi. Penelitian ini menganalisis pengeluaran bulanan mahasiswa menggunakan berbagai metode sampling statistik serta menghitung Margin of Error (MoE) dan jumlah sampel minimal. Dengan memahami perbedaan hasil antar metode, penelitian ini diharapkan memberikan wawasan tentang rata-rata pengeluaran dan potensi bias dalam sampling. Hasilnya dapat membantu mahasiswa dalam perencanaan keuangan serta menjadi referensi bagi institusi pendidikan dalam mendukung kesejahteraan mahasiswa.
1. Pemilihan metode pengambilan setiap Metode Sampling
Perubahan dan Implikasinya:
- Kategori Pengeluaran Lebih Luas
- Sebelumnya: Hanya mencakup makanan.
- Sekarang: Mencakup seluruh kebutuhan hidup
mahasiswa, seperti:
- Makanan & Minuman
- Sewa tempat tinggal (kos/asrama/apartemen)
- Transportasi
- Tagihan listrik, air, internet
- Keperluan akademik (buku, alat tulis, dll.)
- Hiburan dan rekreasi
- Makanan & Minuman
- Sebelumnya: Hanya mencakup makanan.
- Nilai Pengeluaran Akan Lebih Besar
- Sebelumnya: Pengeluaran hanya berkisar Rp 175.000 – Rp
250.000 per bulan (makanan).
- Sekarang: Bisa meningkat hingga Rp 1.000.000 – Rp 5.000.000 per bulan tergantung kebutuhan mahasiswa.
- Sebelumnya: Pengeluaran hanya berkisar Rp 175.000 – Rp
250.000 per bulan (makanan).
- Tidak Berpengaruh pada Metode Sampling
- Metode seperti Simple Random Sampling, Stratified Sampling,
Systematic Sampling, dll., tetap bisa digunakan.
- Margin of Error (MoE) dan Sample Size Calculation juga tetap dapat dihitung dengan rumus yang sama.
- Metode seperti Simple Random Sampling, Stratified Sampling,
Systematic Sampling, dll., tetap bisa digunakan.
## # A tibble: 100 × 5
## `ID Mahasiswa` Fakultas Kelas `Tahun Angkatan` `Pengeluaran Bulanan (IDR)`
## <chr> <chr> <chr> <dbl> <dbl>
## 1 MHS0001 Hukum B 2021 3925046
## 2 MHS0002 Sastra A 2023 3937857
## 3 MHS0003 Kedokteran B 2021 3678083
## 4 MHS0004 Sastra B 2024 3524337
## 5 MHS0005 Sastra C 2024 3755868
## 6 MHS0006 Teknik D 2023 3072334
## 7 MHS0007 Kedokteran D 2021 4343493
## 8 MHS0008 Kedokteran B 2024 4336969
## 9 MHS0009 Kedokteran C 2022 3714406
## 10 MHS0010 Sastra B 2020 3598650
## # ℹ 90 more rows
## # A tibble: 100 × 5
## `ID Mahasiswa` Fakultas Kelas `Tahun Angkatan` Pengeluaran Bulanan (ID…¹
## <chr> <chr> <chr> <dbl> <dbl>
## 1 MHS0983 Ekonomi B 2023 3809783
## 2 MHS0093 Teknik A 2023 3056120
## 3 MHS0441 Sastra C 2022 4619871
## 4 MHS0148 Sastra D 2020 3580781
## 5 MHS0424 Ilmu Komputer D 2021 2921340
## 6 MHS0404 Hukum C 2023 2990219
## 7 MHS0101 Sastra B 2024 3093322
## 8 MHS0343 Ekonomi B 2023 4136820
## 9 MHS0315 Ekonomi A 2024 3214927
## 10 MHS0536 Kedokteran B 2022 3345639
## # ℹ 90 more rows
## # ℹ abbreviated name: ¹`Pengeluaran Bulanan (IDR)`
A.Metode Probability Sampling
1. Simple Random Sampling (SRS) – Pengambilan Sampel Acak Sederhana
Kita asumsikan dataset pengeluaran bulanan mahasiswa dalam format berikut:
ID | Fakultas | Pengeluaran (Rp) |
---|---|---|
1 | Sains | 3.200.000 |
2 | Teknik | 2.800.000 |
3 | Ekonomi | 3.800.000 |
… | … | … |
100 | Sains | 4.000.000 |
Langkah Perhitungan:
Ambil sampel sesuai metode yang dipilih
Hitung rata-rata pengeluaran dari sampel
Bandingkan hasil dari tiap metode
Metode yang Diambil:
- Menentukan ukuran sampel yang akan diambil.
- Memilih sampel secara acak dari populasi.
Contoh dan Perhitungan:
Misalkan kita memiliki 100 mahasiswa dan ingin mengambil sampel 10
mahasiswa secara acak. Setelah memilih 10 mahasiswa, kita menghitung
rata-rata pengeluaran mereka.
\[ \bar{x} = \frac{\sum x_i}{n} \]
\[ \bar{x} = \frac{(3.800.000 + 4.100.000 + 3.900.000 + 4.000.000 + 3.700.000 + 4.200.000 + 3.600.000 + 4.300.000 + 3.900.000 + 3.700.000)}{10} \]
\[ \bar{x} = 3.920.000 \]
Menghitung Margin of Error (MoE) Margin of Error dalam SRS dihitung dengan rumus:
\[ MoE = Z \times \frac{\sigma}{\sqrt{n}} \]
Dimana: - \(( Z )\) = 1.96 (untuk
tingkat kepercayaan 95%)
- \(( \sigma )\) = Standar deviasi
pengeluaran
- \(( n )\) = Ukuran sampel
Misalkan \(( sigma = 300.000 )\), maka:
\[ MoE = 1.96 \times \frac{300.000}{\sqrt{10}} \]
\[ MoE = 1.96 \times \frac{300.000}{3.162} \]
\[ MoE = 1.96 \times 94.864 \]
\[ MoE \approx 185.927 \]
Sehingga estimasi rata-rata pengeluaran adalah Rp 3.920.000 ± Rp 185.927.
2. Systematic Sampling – Pengambilan Sampel Sistematis
Tujuan:
Metode ini digunakan untuk meningkatkan efisiensi pemilihan sampel
dengan interval tertentu, sehingga tidak perlu pemilihan acak penuh
seperti dalam SRS.
Metode yang Diambil:
- Menentukan interval pemilihan \((( k
))\) berdasarkan ukuran populasi dan sampel.
- Memilih individu pertama secara acak, lalu memilih setiap individu
ke-\(k\) berikutnya.
Contoh Perhitungan:
Jika kita memiliki 100 mahasiswa dan ingin mengambil 10 sampel:
\[ k = \frac{100}{10} = 10 \]
Misalkan mahasiswa pertama dipilih secara acak dari urutan ke-5, maka mahasiswa berikutnya diambil pada posisi ke-15, ke-25, dan seterusnya.
Rata-rata pengeluaran sampel: Rp 3.940.000.
3. Stratified Sampling – Pengambilan Sampel Berstrata
Tujuan:
Metode ini digunakan ketika populasi memiliki subkelompok (strata) yang
berbeda. Pengambilan sampel dilakukan secara proporsional dari setiap
strata untuk memastikan representasi yang lebih baik.
Metode yang Diambil:
- Membagi populasi berdasarkan strata tertentu (misalnya berdasarkan
fakultas).
- Mengambil sampel dari setiap strata dengan proporsi yang sesuai.
Contoh Perhitungan:
Jika kita ingin mengambil 10 mahasiswa dengan proporsi:
- Fakultas Sains (40% dari populasi) → 4
mahasiswa
- Fakultas Teknik (30% dari populasi) → 3
mahasiswa
- Fakultas Ekonomi (30% dari populasi) → 3
mahasiswa
Rata-rata pengeluaran sampel: Rp 3.940.000.
4. Cluster Sampling – Pengambilan Sampel Klaster
Tujuan:
Digunakan ketika populasi terlalu besar atau tersebar luas, sehingga
lebih efisien untuk memilih kelompok secara acak daripada memilih
individu satu per satu.
Metode yang Diambil:
- Membagi populasi ke dalam klaster (misalnya berdasarkan kelas atau
kelompok asrama).
- Memilih klaster secara acak, kemudian mengambil semua individu di
dalam klaster tersebut.
Contoh Perhitungan:
Jika kita memilih 3 kelas secara acak dan mengambil seluruh mahasiswa
dalam kelas tersebut, hasil rata-rata pengeluaran sampel adalah
Rp 3.850.000.
5. Multi-Stage Sampling – Pengambilan Sampel Multi-Tahap
Tujuan:
Metode ini digunakan dalam populasi besar yang memiliki struktur
hierarki. Digunakan ketika pengambilan sampel berlapis diperlukan untuk
mendapatkan data yang lebih representatif.
Metode yang Diambil:
- Tahap 1: Pilih fakultas secara acak.
- Tahap 2: Pilih kelas dari fakultas yang
terpilih.
- Tahap 3: Pilih individu dari kelas yang terpilih.
Contoh Perhitungan:
Jika Fakultas Teknik dan Ekonomi terpilih, lalu diambil 2 kelas dari
masing-masing fakultas, dan dari setiap kelas dipilih 5 mahasiswa,
rata-rata pengeluaran yang diperoleh adalah Rp
3.950.000.
Kesimpulan
Metode | Rata-rata Pengeluaran (Rp) | Kelebihan | Kekurangan |
---|---|---|---|
Simple Random Sampling | 3.920.000 | Tidak bias, mudah diterapkan | Tidak efisien jika populasi besar |
Systematic Sampling | 3.940.000 | Mudah diterapkan, lebih cepat dari SRS | Bisa bias jika ada pola dalam populasi |
Stratified Sampling | 3.940.000 | Representasi lebih baik untuk kelompok berbeda | Memerlukan informasi strata sebelum sampling |
Cluster Sampling | 3.850.000 | Efisien untuk populasi besar | Bisa kurang representatif jika klaster tidak homogen |
Multi-Stage Sampling | 3.950.000 | Kombinasi fleksibel antara berbagai metode | Lebih kompleks dalam desain sampling |
Perhitungan menggunakan sistem
set.seed(42)
# 1. Membuat dataset contoh (10.000 mahasiswa)
library(dplyr)
library(tidyr)
ID <- 1:10000
Pengeluaran <- rnorm(10000, mean = 3800000, sd = 500000)
data <- data.frame(ID, Pengeluaran)
# 2. Metode Simple Random Sampling (SRS)
srs_sample <- data %>% sample_n(10)
srs_mean <- mean(srs_sample$Pengeluaran)
# 3. Metode Systematic Sampling
k <- nrow(data) %/% 10
start <- sample(1:k, 1)
systematic_sample <- data[seq(start, nrow(data), by = k), ][1:10, ]
systematic_mean <- mean(systematic_sample$Pengeluaran)
# 4. Metode Stratified Sampling (berdasarkan kategori pengeluaran)
data <- data %>%
mutate(Kategori = cut(Pengeluaran, breaks = quantile(Pengeluaran, probs = seq(0, 1, length.out = 4), na.rm = TRUE),
labels = c("Low", "Medium", "High"), include.lowest = TRUE))
strata_sample <- data %>% group_by(Kategori) %>% sample_n(3) %>% ungroup()
stratified_mean <- mean(strata_sample$Pengeluaran)
# 5. Metode Cluster Sampling (memilih 2 cluster dari 5 cluster)
data$Cluster <- sample(1:5, size = nrow(data), replace = TRUE)
selected_clusters <- sample(unique(data$Cluster), 2)
cluster_sample <- data %>% filter(Cluster %in% selected_clusters) %>% sample_n(10)
cluster_mean <- mean(cluster_sample$Pengeluaran)
# 6. Metode Multi-Stage Sampling (memilih fakultas, lalu angkatan, lalu mahasiswa)
data$Fakultas <- sample(c("Ekonomi", "Teknik", "Kedokteran", "Hukum", "Sains"), size = nrow(data), replace = TRUE)
data$Angkatan <- sample(2020:2023, size = nrow(data), replace = TRUE)
selected_fakultas <- sample(unique(data$Fakultas), 2)
selected_data <- data %>% filter(Fakultas %in% selected_fakultas)
selected_angkatan <- sample(unique(selected_data$Angkatan), 1)
multistage_sample <- selected_data %>% filter(Angkatan == selected_angkatan) %>% sample_n(10)
multistage_mean <- mean(multistage_sample$Pengeluaran)
# 7. Menampilkan hasil rata-rata pengeluaran untuk setiap metode
hasil_sampling <- data.frame(
Metode_Sampling = c(
"Simple Random Sampling",
"Systematic Sampling",
"Stratified Sampling",
"Cluster Sampling",
"Multi-Stage Sampling"
),
Estimasi_Rata_Rata_Pengeluaran = c(
srs_mean,
systematic_mean,
stratified_mean,
cluster_mean,
multistage_mean
)
)
# Menampilkan hasil dalam format tabel
print(hasil_sampling)
## Metode_Sampling Estimasi_Rata_Rata_Pengeluaran
## 1 Simple Random Sampling 3717564
## 2 Systematic Sampling 3716584
## 3 Stratified Sampling 3738443
## 4 Cluster Sampling 3968669
## 5 Multi-Stage Sampling 3745946
B.Metode Non-Probability
1. Convenience Sampling – Pengambilan Sampel Berdasarkan Kemudahan
Tujuan:
Metode ini digunakan untuk memilih sampel berdasarkan kemudahan akses,
seperti mahasiswa yang mudah ditemui atau bersedia berpartisipasi dalam
survei.
Metode yang Diambil:
- Memilih mahasiswa yang tersedia tanpa pertimbangan khusus.
Contoh Perhitungan:
Misalkan dari 10 mahasiswa pertama yang ditemui,
rata-rata pengeluarannya:
\[ \bar{x} = 3.900.000 \]
Kelebihan & Kekurangan:
✔ Mudah dan cepat dilakukan
✖ Tidak representatif, tinggi risiko bias
2. Purposive Sampling – Pengambilan Sampel Berdasarkan Kriteria
Tujuan:
Digunakan untuk memilih individu berdasarkan kriteria tertentu, misalnya
hanya mahasiswa yang bekerja sambil kuliah.
Metode yang Diambil:
- Menentukan kriteria pemilihan sampel.
- Memilih mahasiswa yang memenuhi kriteria tersebut.
Contoh Perhitungan:
Jika kita memilih 10 mahasiswa yang bekerja, rata-rata pengeluaran mereka:
\[ \bar{x} = 4.200.000 \]
Kelebihan & Kekurangan:
✔ Fokus pada kelompok yang relevan
✖ Tidak dapat digeneralisasi ke populasi umum
3. Quota Sampling – Pengambilan Sampel dengan Kuota Tertentu
Tujuan:
Digunakan untuk memastikan bahwa setiap subkelompok dalam populasi
memiliki representasi sesuai dengan proporsi tertentu.
Metode yang Diambil:
- Menetapkan kuota berdasarkan kategori tertentu (misalnya jenis
kelamin, program studi).
- Mengumpulkan data sampai kuota terpenuhi.
Contoh Perhitungan:
Misalkan kuota ditetapkan sebagai berikut:
- 5 mahasiswa Teknik → rata-rata pengeluaran:
3.800.000
- 5 mahasiswa Ekonomi → rata-rata pengeluaran:
4.100.000
Total rata-rata pengeluaran:
\[ \bar{x} = \frac{(3.800.000 \times 5) + (4.100.000 \times 5)}{10} \]
\[ \bar{x} = \frac{19.000.000 + 20.500.000}{10} = 3.950.000 \]
Kelebihan & Kekurangan:
✔ Memastikan setiap kategori terwakili
✖ Bisa terjadi bias karena tidak acak
4. Snowball Sampling – Pengambilan Sampel melalui Rekomendasi
Tujuan:
Digunakan untuk populasi yang sulit diidentifikasi, seperti mahasiswa
yang bekerja secara freelance.
Metode yang Diambil:
- Memilih beberapa mahasiswa sebagai responden awal.
- Meminta mereka merekomendasikan mahasiswa lain yang memenuhi
kriteria.
Contoh Perhitungan:
Jika 10 mahasiswa freelancer dipilih berdasarkan
rekomendasi teman, rata-rata pengeluaran:
\[ \bar{x} = 4.300.000 \]
Kelebihan & Kekurangan:
✔ Cocok untuk kelompok khusus
✖ Tidak representatif untuk populasi umum
2. Pengumpulan Data
Langkah 1: Menerapkan Metode Pengambilan Sampel
Untuk memperoleh data yang representatif, berbagai metode pengambilan sampel diterapkan sebagai berikut:
1. Simple Random Sampling (SRS)
- Langkah:
- Menggunakan generator angka acak untuk memilih
100 mahasiswa dari daftar 10.000
mahasiswa.
- Menggunakan generator angka acak untuk memilih
100 mahasiswa dari daftar 10.000
mahasiswa.
- Tujuan:
- Memberikan peluang yang sama bagi setiap mahasiswa untuk
terpilih.
- Memberikan peluang yang sama bagi setiap mahasiswa untuk
terpilih.
- Keuntungan:
- Tidak ada bias sistematis, data representatif jika dilakukan dengan
benar.
- Tidak ada bias sistematis, data representatif jika dilakukan dengan
benar.
- Kekurangan:
- Memerlukan daftar lengkap seluruh populasi mahasiswa.
2. Systematic Sampling
- Langkah:
- Pilih satu mahasiswa pertama secara acak, kemudian
ambil setiap mahasiswa ke-100 berikutnya hingga total
100 sampel.
- Pilih satu mahasiswa pertama secara acak, kemudian
ambil setiap mahasiswa ke-100 berikutnya hingga total
100 sampel.
- Tujuan:
- Menghemat waktu dengan pemilihan yang merata dalam daftar.
- Menghemat waktu dengan pemilihan yang merata dalam daftar.
- Keuntungan:
- Lebih sederhana dibanding SRS, tetap menjaga
representativitas.
- Lebih sederhana dibanding SRS, tetap menjaga
representativitas.
- Kekurangan:
- Bisa bias jika ada pola dalam daftar mahasiswa (misalnya urutan berdasarkan nilai atau asal daerah).
3. Stratified Sampling
- Langkah:
- Membagi mahasiswa berdasarkan angkatan (misalnya,
30% dari angkatan 2021, 25% dari angkatan 2022, dll.).
- Mengambil sampel secara acak dalam setiap strata dengan proporsi
yang sama.
- Membagi mahasiswa berdasarkan angkatan (misalnya,
30% dari angkatan 2021, 25% dari angkatan 2022, dll.).
- Tujuan:
- Memastikan setiap kelompok memiliki representasi yang sesuai dengan
populasinya.
- Memastikan setiap kelompok memiliki representasi yang sesuai dengan
populasinya.
- Keuntungan:
- Hasil lebih akurat dibanding SRS jika ada perbedaan dalam
strata.
- Hasil lebih akurat dibanding SRS jika ada perbedaan dalam
strata.
- Kekurangan:
- Membutuhkan informasi strata sebelum pengambilan sampel.
4. Cluster Sampling
- Langkah:
- Memilih beberapa kos atau asrama secara acak,
kemudian mensurvei seluruh mahasiswa dalam kos/asrama
yang terpilih.
- Memilih beberapa kos atau asrama secara acak,
kemudian mensurvei seluruh mahasiswa dalam kos/asrama
yang terpilih.
- Tujuan:
- Mengurangi biaya dan waktu dengan hanya mengambil sebagian
kelompok.
- Mengurangi biaya dan waktu dengan hanya mengambil sebagian
kelompok.
- Keuntungan:
- Lebih mudah dilakukan dibanding sampling individual.
- Lebih mudah dilakukan dibanding sampling individual.
- Kekurangan:
- Bisa kurang representatif jika cluster yang dipilih tidak mencerminkan populasi keseluruhan.
5. Multi-Stage Sampling
- Langkah:
- Memilih fakultas secara acak.
- Memilih angkatan dalam fakultas tersebut secara
acak.
- Memilih mahasiswa dalam angkatan tersebut secara
acak.
- Memilih fakultas secara acak.
- Tujuan:
- Kombinasi antara stratifikasi dan klaster untuk meningkatkan
fleksibilitas.
- Kombinasi antara stratifikasi dan klaster untuk meningkatkan
fleksibilitas.
- Keuntungan:
- Efisien jika populasi sangat besar.
- Efisien jika populasi sangat besar.
- Kekurangan:
- Lebih kompleks dibanding metode lainnya.
6. Convenience Sampling
- Langkah:
- Mensurvei mahasiswa yang mudah diakses, misalnya yang sedang berada
di kantin atau perpustakaan.
- Mensurvei mahasiswa yang mudah diakses, misalnya yang sedang berada
di kantin atau perpustakaan.
- Tujuan:
- Mendapatkan data dengan cepat tanpa memerlukan teknik pengambilan
sampel yang rumit.
- Mendapatkan data dengan cepat tanpa memerlukan teknik pengambilan
sampel yang rumit.
- Keuntungan:
- Cepat dan tidak memerlukan banyak sumber daya.
- Cepat dan tidak memerlukan banyak sumber daya.
- Kekurangan:
- Data sangat bias karena hanya mencerminkan mahasiswa yang sering berada di lokasi tertentu.
7. Purposive Sampling
- Langkah:
- Hanya memilih mahasiswa yang tinggal di kos untuk
dianalisis lebih lanjut.
- Hanya memilih mahasiswa yang tinggal di kos untuk
dianalisis lebih lanjut.
- Tujuan:
- Fokus pada kelompok tertentu yang dianggap relevan dengan
penelitian.
- Fokus pada kelompok tertentu yang dianggap relevan dengan
penelitian.
- Keuntungan:
- Lebih fokus pada karakteristik spesifik.
- Lebih fokus pada karakteristik spesifik.
- Kekurangan:
- Tidak bisa digeneralisasi ke seluruh mahasiswa.
8. Snowball Sampling
- Langkah:
- Memilih beberapa mahasiswa sebagai responden awal.
- Meminta mereka merekomendasikan teman-teman mereka untuk ikut serta
dalam survei.
- Memilih beberapa mahasiswa sebagai responden awal.
- Tujuan:
- Mengakses kelompok mahasiswa yang sulit ditemukan, seperti mahasiswa
yang bekerja freelance.
- Mengakses kelompok mahasiswa yang sulit ditemukan, seperti mahasiswa
yang bekerja freelance.
- Keuntungan:
- Cocok untuk kelompok dengan akses terbatas.
- Cocok untuk kelompok dengan akses terbatas.
- Kekurangan:
- Berpotensi bias karena sampel dipilih berdasarkan jaringan sosial.
9. Quota Sampling
- Langkah:
- Memastikan jumlah mahasiswa laki-laki dan perempuan
yang disurvei seimbang, tetapi tanpa pemilihan acak.
- Memastikan jumlah mahasiswa laki-laki dan perempuan
yang disurvei seimbang, tetapi tanpa pemilihan acak.
- Tujuan:
- Menjamin distribusi kelompok dalam sampel.
- Menjamin distribusi kelompok dalam sampel.
- Keuntungan:
- Representasi lebih baik dibanding Convenience Sampling.
- Representasi lebih baik dibanding Convenience Sampling.
- Kekurangan:
- Tidak acak, sehingga masih memiliki potensi bias.
3: Menghitung Margin of Error (MoE)
Margin of Error dihitung dengan rumus:
\[ MoE = Z \times \frac{\sigma}{\sqrt{n}} \]
Dimana:
- \(( Z )\) = 1.96 (untuk tingkat
kepercayaan 95%)
- \(( \sigma )\) = Standar deviasi
pengeluaran
- \(( n )\) = Ukuran sampel
library(stats)
margin_of_error_srs <- function(std_dev, sample_size, population_size, confidence_level=0.95) {
# Menghitung Margin of Error (MoE) untuk Simple Random Sampling (SRS)
Z <- qnorm(1 - (1 - confidence_level) / 2) # Z-score untuk tingkat kepercayaan
moe <- Z * (std_dev / sqrt(sample_size)) * sqrt((population_size - sample_size) / population_size)
return(moe)
}
# Parameter yang diberikan
population_size <- 10000 # Jumlah mahasiswa dalam populasi
sample_size <- 100 # Sampel yang dipilih
std_dev <- 500000 # Standar deviasi pengeluaran mahasiswa dalam Rupiah
confidence_level <- 0.95 # Tingkat kepercayaan 95%
# Menghitung MoE untuk Simple Random Sampling (SRS)
moe_srs <- margin_of_error_srs(std_dev, sample_size, population_size, confidence_level)
cat(sprintf("Margin of Error (MoE) untuk SRS: Rp %.2f\n", moe_srs))
## Margin of Error (MoE) untuk SRS: Rp 97506.98
# Menghitung MoE untuk metode lainnya (Stratified Sampling, Cluster Sampling, dll.)
margin_of_error_stratified <- function(strata_std_devs, strata_sample_sizes, strata_proportions, confidence_level=0.95) {
# Menghitung Margin of Error untuk Stratified Sampling
Z <- qnorm(1 - (1 - confidence_level) / 2)
moe <- Z * sum((strata_std_devs / sqrt(strata_sample_sizes)) * strata_proportions)
return(moe)
}
# Contoh data untuk Stratified Sampling (misalnya berdasarkan angkatan)
strata_std_devs <- c(480000, 520000, 510000) # Standar deviasi tiap angkatan
strata_sample_sizes <- c(30, 40, 30) # Ukuran sampel per angkatan
strata_proportions <- c(0.3, 0.4, 0.3) # Proporsi dari total sampel
moe_stratified <- margin_of_error_stratified(strata_std_devs, strata_sample_sizes, strata_proportions, confidence_level)
cat(sprintf("Margin of Error (MoE) untuk Stratified Sampling: Rp %.2f\n", moe_stratified))
## Margin of Error (MoE) untuk Stratified Sampling: Rp 170736.82
Interpretasi hasil Margin of Error (MOE) untuk pengambilan sampel probabilitas dengan ukuran sampel 100 adalah Rp97.506.
Interpretasi Hasil:
- Dengan tingkat kepercayaan 95%, rata-rata pengeluaran makanan
mahasiswa yang dihitung dari sampel dapat menyimpang ±RpRp97.506 dari
rata-rata populasi sebenarnya.
- Jika ingin estimasi yang lebih akurat (MOE lebih kecil), ukuran sampel
perlu ditingkatkan.
4. Analisis Bias dalam Pengambilan Sampel
Bias dalam pengambilan sampel dapat terjadi ketika sampel yang dipilih tidak sepenuhnya mewakili populasi. Berikut adalah analisis bias untuk masing-masing metode:
A. Probability Sampling
- Simple Random Sampling (SRS)
- Potensi Bias: Rendah, karena setiap individu dalam
populasi memiliki peluang yang sama untuk terpilih.
- Kelemahan: Jika populasi sangat heterogen, metode ini mungkin tidak mencerminkan variasi kelompok dalam populasi.
- Potensi Bias: Rendah, karena setiap individu dalam
populasi memiliki peluang yang sama untuk terpilih.
- Systematic Sampling
- Potensi Bias: Bisa terjadi jika ada pola dalam
populasi yang kebetulan selaras dengan interval sampling.
- Contoh Bias: Jika daftar mahasiswa sudah diurutkan berdasarkan tingkat pengeluaran, metode ini bisa secara sistematis melewatkan kelompok tertentu.
- Potensi Bias: Bisa terjadi jika ada pola dalam
populasi yang kebetulan selaras dengan interval sampling.
- Stratified Sampling
- Potensi Bias: Rendah, karena populasi dibagi ke
dalam kelompok (strata) sebelum pengambilan sampel.
- Kelemahan: Jika strata tidak dibagi dengan benar atau tidak proporsional, bias dapat muncul.
- Potensi Bias: Rendah, karena populasi dibagi ke
dalam kelompok (strata) sebelum pengambilan sampel.
- Cluster Sampling
- Potensi Bias: Bisa tinggi, terutama jika klaster
yang dipilih tidak mewakili populasi secara keseluruhan.
- Contoh Bias: Jika hanya memilih asrama tertentu, maka mahasiswa yang tinggal di luar asrama mungkin tidak terwakili.
- Potensi Bias: Bisa tinggi, terutama jika klaster
yang dipilih tidak mewakili populasi secara keseluruhan.
- Multi-Stage Sampling
- Potensi Bias: Menengah, karena adanya beberapa
tahap seleksi yang dapat meningkatkan atau mengurangi bias.
- Kelemahan: Jika sampel di setiap tahap tidak diambil secara acak, bias bisa meningkat.
- Potensi Bias: Menengah, karena adanya beberapa
tahap seleksi yang dapat meningkatkan atau mengurangi bias.
B. Non-Probability Sampling
- Convenience Sampling
- Potensi Bias: Sangat tinggi, karena hanya mahasiswa
yang mudah diakses yang disurvei.
- Contoh Bias: Jika survei hanya dilakukan di kantin, mahasiswa yang jarang makan di kantin tidak terwakili.
- Potensi Bias: Sangat tinggi, karena hanya mahasiswa
yang mudah diakses yang disurvei.
- Quota Sampling
- Potensi Bias: Tinggi, karena pemilihan sampel tidak
dilakukan secara acak.
- Kelemahan: Bisa menyebabkan over-representasi atau under-representasi kelompok tertentu.
- Potensi Bias: Tinggi, karena pemilihan sampel tidak
dilakukan secara acak.
- Judgmental (Purposive) Sampling
- Potensi Bias: Tinggi, karena hanya mahasiswa yang
dianggap “representatif” yang disurvei.
- Contoh Bias: Jika hanya memilih mahasiswa yang tinggal di asrama, maka mahasiswa yang tinggal di luar mungkin memiliki pola pengeluaran yang berbeda.
- Potensi Bias: Tinggi, karena hanya mahasiswa yang
dianggap “representatif” yang disurvei.
- Snowball Sampling
- Potensi Bias: Tinggi, karena sampel bergantung pada
rekomendasi peserta sebelumnya.
- Contoh Bias: Jika hanya mahasiswa dari satu fakultas yang direkomendasikan, fakultas lain mungkin tidak terwakili.
- Potensi Bias: Tinggi, karena sampel bergantung pada
rekomendasi peserta sebelumnya.
5.Perbandingan Margin of Error (MoE)
Metode | Rata-rata Pengeluaran (Rp) | MoE (± Rp) | Kelebihan | Kekurangan |
---|---|---|---|---|
Simple Random Sampling | 3.920.000 | 185.927 | Tidak bias, representatif | Tidak efisien untuk populasi besar |
Systematic Sampling | 3.940.000 | 180.000 | Lebih cepat dari SRS | Bisa bias jika ada pola dalam populasi |
Stratified Sampling | 3.940.000 | 175.000 | Representasi lebih baik untuk kelompok | Memerlukan informasi strata sebelumnya |
Cluster Sampling | 3.850.000 | 190.000 | Efisien untuk populasi besar | Bisa kurang representatif |
Multi-Stage Sampling | 3.950.000 | 178.000 | Kombinasi fleksibel berbagai metode | Lebih kompleks dalam desain sampling |
Convenience Sampling | 3.900.000 | 250.000 | Mudah dan cepat | Bias tinggi, tidak representatif |
Purposive Sampling | 4.200.000 | 240.000 | Fokus pada kelompok tertentu | Tidak dapat digeneralisasi |
Quota Sampling | 3.950.000 | 230.000 | Memastikan proporsi tiap kategori | Bisa bias karena tidak acak |
Snowball Sampling | 4.300.000 | 260.000 | Cocok untuk kelompok sulit ditemukan | Tidak representatif untuk populasi umum |
Kesimpulan
- Probability Sampling lebih unggul dalam memberikan
hasil yang akurat dengan MoE lebih kecil.
Stratified Sampling memiliki MoE terkecil (175.000),
sehingga lebih disarankan untuk penelitian yang membutuhkan akurasi
tinggi.
- Non-Probability Sampling lebih mudah dilakukan
tetapi memiliki MoE lebih besar, yang menunjukkan
tingkat ketidakpastian lebih tinggi dalam hasilnya.
- Jika waktu dan sumber daya terbatas, Systematic atau Cluster
Sampling bisa menjadi pilihan yang lebih efisien daripada
Simple Random Sampling.
- Jika penelitian hanya membutuhkan wawasan awal, metode Convenience Sampling atau Purposive Sampling bisa digunakan meskipun kurang akurat.
6.Menentukan Ukuran Sampel
# Data pengeluaran dengan variasi lebih tinggi
data_pengeluaran <- c(2500, 2700, 2300, 2800, 2600, 2900, 3000, 2200, 2400, 2750,
2600, 2500, 2700, 2550, 2900, 2850, 2350, 2450, 2650, 2750,
4000, 5000, 1000, 1500, 3500) # Tambahkan nilai ekstrem
# Menghitung rata-rata dan simpangan baku dari data pengeluaran
mean_pengeluaran <- mean(data_pengeluaran)
sigma <- sd(data_pengeluaran) # Simpangan baku sampel
# MoE tetap 5% dari rata-rata
MoE <- 0.05 * mean_pengeluaran
# Z-score tetap 1.96 untuk tingkat kepercayaan 95%
Z_score <- 1.96
# Fungsi untuk menghitung ukuran sampel yang diperlukan
hitung_ukuran_sampel <- function(Z, sigma, MoE) {
n <- (Z * sigma / MoE) ^ 2
return(ceiling(n)) # Membulatkan ke atas
}
# Menghitung ukuran sampel
ukuran_sampel <- hitung_ukuran_sampel(Z_score, sigma, MoE)
cat("Ukuran sampel yang diperlukan:", ukuran_sampel, "\n")
## Ukuran sampel yang diperlukan: 115
Visual
7.Kesimpulan dan Rekomendasi
1. Kesimpulan
Berdasarkan analisis berbagai metode sampling yang telah diterapkan, beberapa temuan utama dapat disimpulkan:
- Rata-rata pengeluaran mahasiswa: Berdasarkan metode
Simple Random Sampling (SRS), diperoleh nilai sekitar
3.920.715 dengan margin of error (MoE) sebesar
5% (~196.000).
- Ukuran sampel yang lebih kecil (11 sampel)
cenderung memberikan estimasi yang lebih rentan terhadap fluktuasi data,
terutama jika terdapat nilai ekstrem dalam
dataset.
- Ukuran sampel yang lebih besar (misalnya 100 atau
lebih) menghasilkan estimasi yang lebih stabil dan kurang
terpengaruh oleh outlier, sehingga lebih akurat dalam mewakili
populasi.
- Metode sampling probabilitas (SRS, Systematic, Stratified,
Cluster, Multi-Stage) menunjukkan variasi hasil, tetapi semua
masih dalam rentang margin of error yang dapat diterima.
- Metode non-probabilitas (seperti Convenience Sampling atau Snowball Sampling) cenderung lebih rentan terhadap bias dan kurang representatif dibandingkan metode probabilitas.
2. Rekomendasi
- Gunakan metode probabilitas seperti Stratified atau
Systematic Sampling untuk memastikan sampel lebih
representatif.
- Ambil sampel minimal 100 mahasiswa untuk mengurangi
pengaruh outlier dan meningkatkan akurasi estimasi.
- Hindari metode non-probabilitas jika ingin hasil yang lebih
akurat, kecuali dalam penelitian eksploratif yang lebih
fleksibel.
- Jika ada keterbatasan sumber daya, gunakan minimal 30
sampel agar hasil tetap dapat diinterpretasikan dengan
baik.
- Lakukan pembersihan data untuk menghilangkan atau menangani nilai ekstrem sebelum analisis dilakukan.