Teknik Sampling dan Survei
March 09, 2025
Bab 1 Margin Off Error
1.1 Latar Belakang
Sebuah universitas ingin melakukan survei untuk memperkirakan rata-rata pengeluaran makanan bulanan mahasiswanya. Tujuannya adalah mendapatkan estimasi yang akurat dan dapat digeneralisasi ke seluruh populasi mahasiswa, dengan margin of error (MoE) yang wajar. Untuk mencapai ini, peneliti mempertimbangkan dua metode sampling:
1. Probability Sampling (Simple Random Sampling - SRS)
2. Non-Probability Sampling (Convenience Sampling)
1.2 Pendahuluan
Dalam praktikum ini, kita akan membandingkan dua metode sampling, yaitu Simple Random Sampling (SRS) dan Convenience Sampling, untuk memperkirakan rata-rata pengeluaran makanan mahasiswa. Selain itu, kita juga akan menghitung Margin of Error (MoE) dari kedua metode tersebut untuk melihat seberapa akurat estimasi yang diperoleh.
1.3 Persiapan Data
Load Library dan Dataset
| NIM | Fakultas | Pengeluaran_Makanan | Semester | Domisili | Jenis_Kelamin | Status_Beasiswa |
|---|---|---|---|---|---|---|
| 10120001 | Teknik | 1500000 | 5 | Kost | Laki-laki | Tidak |
| 10120002 | Ekonomi | 2000000 | 3 | Rumah | Perempuan | Ya |
| 10120003 | Kedokteran | 1800000 | 7 | Asrama | Perempuan | Tidak |
| 10120004 | Hukum | 1200000 | 2 | Kost | Laki-laki | Ya |
| 10120005 | Ilmu Komputer | 1700000 | 6 | Rumah | Perempuan | Tidak |
| 10120006 | Psikologi | 1900000 | 4 | Kost | Perempuan | Ya |
| 10120007 | Teknik | 1600000 | 5 | Asrama | Laki-laki | Tidak |
| 10120008 | Ekonomi | 2100000 | 3 | Rumah | Perempuan | Ya |
| 10120009 | Kedokteran | 1750000 | 7 | Kost | Perempuan | Tidak |
| 10120010 | Hukum | 1300000 | 2 | Rumah | Laki-laki | Ya |
Dataset ini berisi informasi mahasiswa dengan variabel berikut:
- NIM: Nomor Induk Mahasiswa
- Fakultas: Program studi mahasiswa
- Pengeluaran_Makanan: Pengeluaran makanan per bulan (dalam Rupiah)
- Semester: Semester yang sedang ditempuh
- Domisili: Tempat tinggal mahasiswa (Kost, Rumah, Asrama)
- Jenis_Kelamin: Laki-laki atau Perempuan
- Status_Beasiswa: Apakah mahasiswa memiliki beasiswa atau tidak
1.5 A. Probability Sampling
1.5.1 Simple Random Sampling (SRS)
- Penjelasan: Setiap anggota populasi memiliki peluang yang sama untuk terpilih. Misalnya, menggunakan random number generator untuk memilih sampel.
- Kelebihan: Sederhana dan mudah diimplementasikan.
- Kekurangan: Tidak efisien jika populasi sangat heterogen.
1.5.2 Stratified Sampling
- Penjelasan: Populasi dibagi menjadi strata (kelompok homogen), lalu sampel diambil secara acak dari setiap strata.
- Kelebihan: Memastikan representasi dari setiap kelompok.
- Kekurangan: Membutuhkan informasi tentang strata populasi.
1.5.3 Systematic Sampling
- Penjelasan: Memilih setiap elemen ke-k dari daftar populasi. Misalnya, jika ada 10.000 mahasiswa dan sampel 200, maka setiap mahasiswa ke-50 dipilih.
- Kelebihan: Mudah diimplementasikan.
- Kekurangan: Rentan terhadap periodisitas dalam data.
1.6 B. Non-Probability Sampling
1.6.1 Convenience Sampling
- Penjelasan: Memilih sampel yang mudah diakses, seperti mahasiswa di kantin atau perpustakaan.
- Kelebihan: Cepat dan murah.
- Kekurangan: Rentan terhadap bias seleksi.
1.6.2 Quota Sampling
- Penjelasan: Menentukan kuota untuk setiap kategori (misalnya, 50 mahasiswa per fakultas) tanpa randomisasi.
- Kelebihan: Memastikan representasi dari setiap kategori.
- Kekurangan: Tidak seakurat stratified sampling.
1.7 1. Probability Sampling (Simple Random Sampling - SRS)
Simple Random Sampling adalah metode di mana setiap individu dalam populasi memiliki peluang yang sama untuk dipilih.
| NIM | Fakultas | Pengeluaran_Makanan | Semester | Domisili | Jenis_Kelamin | Status_Beasiswa |
|---|---|---|---|---|---|---|
| 10120001 | Teknik | 1500000 | 5 | Kost | Laki-laki | Tidak |
| 10120005 | Ilmu Komputer | 1700000 | 6 | Rumah | Perempuan | Tidak |
| 10120010 | Hukum | 1300000 | 2 | Rumah | Laki-laki | Ya |
| 10120008 | Ekonomi | 2100000 | 3 | Rumah | Perempuan | Ya |
| 10120002 | Ekonomi | 2000000 | 3 | Rumah | Perempuan | Ya |
1.7.1 Definisi
Probability Sampling adalah teknik pengambilan sampel di mana setiap individu dalam populasi memiliki kesempatan yang sama untuk dipilih. Dalam studi ini, Simple Random Sampling (SRS) digunakan sebagai metode utama untuk memastikan representasi yang adil dari seluruh populasi.
1.7.2 Cara Kerja
- Identifikasi Populasi: Seluruh mahasiswa di universitas diidentifikasi sebagai populasi target.
- Pengambilan Sampel Acak: Sejumlah mahasiswa dipilih secara acak menggunakan teknik pengacakan, seperti generator angka acak.
- Pengumpulan Data: Data pengeluaran makanan bulanan dikumpulkan dari sampel yang terpilih.
1.7.3 Keuntungan
- Tingkat Akurasi Tinggi: Karena sampel diambil secara acak, hasilnya cenderung lebih akurat dan dapat mewakili populasi.
- Kemampuan Generalisasi: Hasil penelitian dapat digeneralisasi ke seluruh populasi dengan tingkat kepercayaan yang tinggi.
- Margin of Error (MoE) Terukur: MoE dapat dihitung secara statistik, memberikan informasi tentang tingkat ketidakpastian dalam estimasi.
1.7.4 Simulasi dengan R
Berikut adalah kode R untuk mensimulasikan Simple Random Sampling (SRS) dan menghitung Margin of Error (MoE):
# Parameter
populasi_mean <- 1500000 # Rata-rata populasi (dalam rupiah)
populasi_std <- 300000 # Standar deviasi populasi
ukuran_sampel <- 100 # Ukuran sampel
tingkat_kepercayaan <- 0.95
# Simulasi Simple Random Sampling (SRS)
set.seed(123)
srs_sampel <- rnorm(ukuran_sampel, mean = populasi_mean, sd = populasi_std)
# Menghitung rata-rata dan standar deviasi sampel
srs_mean <- mean(srs_sampel)
srs_std <- sd(srs_sampel)
# Menghitung Margin of Error (MoE)
z_score <- qnorm((1 + tingkat_kepercayaan) / 2)
srs_moe <- z_score * (srs_std / sqrt(ukuran_sampel))
# Hasil
cat("Simple Random Sampling (SRS):\n")## Simple Random Sampling (SRS):
## Rata-rata sampel: 1527122
## Margin of Error (MoE): 53672.59
## Interval Kepercayaan 95%: [ 1473449 , 1580794 ]
1.8 2. Non-Probability Sampling (Convenience Sampling)
1.8.1 Definisi
Non-Probability Sampling adalah metode pengambilan sampel di mana tidak semua anggota populasi memiliki peluang yang sama untuk terpilih. Dalam kasus ini, Convenience Sampling digunakan, di mana sampel dipilih berdasarkan kemudahan akses dan ketersediaan.
1.8.2 Cara Kerja
- Pemilihan Sampel: Peneliti memilih mahasiswa yang mudah dijangkau, seperti mahasiswa yang sering berada di area umum kampus (kantin, perpustakaan, dll.).
- Pengumpulan Data: Data pengeluaran makanan bulanan dikumpulkan dari mahasiswa yang terpilih.
1.8.3 Keuntungan
- Efisiensi Waktu dan Biaya: Proses pengambilan sampel lebih cepat dan tidak memerlukan sumber daya yang besar.
- Kemudahan Implementasi: Tidak memerlukan kerangka sampling yang kompleks, sehingga cocok untuk studi eksploratif atau penelitian dengan sumber daya terbatas.
- Fleksibilitas: Peneliti dapat menyesuaikan sampel berdasarkan situasi dan kondisi di lapangan.
Convenience Sampling adalah metode di mana sampel diambil berdasarkan kemudahan akses. Dalam contoh ini, kita memilih mahasiswa yang tinggal di Asrama.
1.8.4 Simulasi dengan R
Berikut adalah kode R untuk mensimulasikan Convenience Sampling:
# Simulasi Convenience Sampling (dengan asumsi bias)
set.seed(456)
conv_sampel <- rnorm(ukuran_sampel, mean = populasi_mean - 100000, sd = populasi_std + 50000)
# Menghitung rata-rata sampel
conv_mean <- mean(conv_sampel)
# Hasil
cat("Convenience Sampling:\n")## Convenience Sampling:
## Rata-rata sampel: 1442201
## Catatan: Margin of Error (MoE) tidak dapat dihitung karena sampel bias.
| NIM | Fakultas | Pengeluaran_Makanan | Semester | Domisili | Jenis_Kelamin | Status_Beasiswa |
|---|---|---|---|---|---|---|
| 10120007 | Teknik | 1600000 | 5 | Asrama | Laki-laki | Tidak |
| 10120003 | Kedokteran | 1800000 | 7 | Asrama | Perempuan | Tidak |
1.8.5 Perhitungan Rata-rata dan Margin of Error (MoE)
Margin of Error (MoE) digunakan untuk mengukur seberapa besar kemungkinan hasil estimasi menyimpang dari nilai populasi sebenarnya.
| Metode | Rata_Rata | Margin_of_Error |
|---|---|---|
| SRS | 1720000 | 415540.3 |
| Convenience | 1700000 | 1270620.5 |
# Hitung rata-rata pengeluaran makanan
mean_conv <- mean(convenience_sample$Pengeluaran_Makanan, na.rm = TRUE)
# Hitung standar deviasi sampel
sd_conv <- sd(convenience_sample$Pengeluaran_Makanan, na.rm = TRUE)
# Hitung Margin of Error (MoE)
n_conv <- nrow(convenience_sample) # Jumlah sampel
moe_conv <- 1.96 * (sd_conv / sqrt(n_conv)) # MoE untuk tingkat kepercayaan 95%
# Menampilkan hasil
cat("Rata-rata Convenience Sampling:", mean_conv, "\n")## Rata-rata Convenience Sampling: 1700000
## Margin of Error Convenience Sampling: 196000
Interpretasi:
- Jika Margin of Error lebih kecil, maka metode tersebut lebih akurat dalam memperkirakan rata-rata populasi.
- Jika Margin of Error lebih besar, berarti hasil sampel memiliki variasi yang lebih tinggi dan kurang representatif terhadap populasi.
1.9 Interpretasi Hasil
1.9.1 Simple Random Sampling (SRS)
- Rata-rata: Nilai rata-rata pengeluaran makanan dari sampel SRS.
- Margin of Error (MoE): Tingkat ketidakpastian dalam estimasi rata-rata. Semakin kecil MoE, semakin akurat estimasi.
- Kelebihan: Hasilnya lebih representatif karena semua individu memiliki peluang yang sama untuk dipilih.
- Kekurangan: Membutuhkan daftar populasi yang lengkap dan proses pengambilan sampel yang lebih rumit.
1.9.2 Convenience Sampling
- Rata-rata: Nilai rata-rata pengeluaran makanan dari sampel Convenience Sampling.
- Margin of Error (MoE): Tingkat ketidakpastian dalam estimasi rata-rata. Biasanya lebih besar daripada SRS karena sampel kurang representatif.
- Kelebihan: Mudah dan cepat dilakukan.
- Kekurangan: Rentan terhadap bias karena sampel diambil berdasarkan kemudahan akses, bukan representasi populasi.
1.10 Perbandingan Kedua Metode
library(knitr)
library(kableExtra)
data <- data.frame(
Aspek = c("Akurasi", "Generalizability", "Margin of Error (MoE)", "Kemudahan", "Biaya"),
`Probability Sampling (SRS)` = c("Tinggi, karena sampel acak",
"Dapat digeneralisasi ke populasi",
"Dapat dihitung secara statistik",
"Lebih rumit dan memakan waktu",
"Lebih tinggi"),
`Non-Probability Sampling (Convenience Sampling)` = c("Rendah, karena sampel bias",
"Tidak dapat digeneralisasi dengan baik",
"Tidak dapat dihitung secara statistik",
"Mudah dan cepat",
"Lebih rendah")
)
kable(data, format = "html", align = "l", escape = FALSE) %>%
kable_styling("striped", full_width = FALSE)| Aspek | Probability.Sampling..SRS. | Non.Probability.Sampling..Convenience.Sampling. |
|---|---|---|
| Akurasi | Tinggi, karena sampel acak | Rendah, karena sampel bias |
| Generalizability | Dapat digeneralisasi ke populasi | Tidak dapat digeneralisasi dengan baik |
| Margin of Error (MoE) | Dapat dihitung secara statistik | Tidak dapat dihitung secara statistik |
| Kemudahan | Lebih rumit dan memakan waktu | Mudah dan cepat |
| Biaya | Lebih tinggi | Lebih rendah |
1.11 Visualisasi Hasil
library(ggplot2)
library(plotly)
# Data untuk visualisasi
data <- data.frame(
Metode = c("SRS", "Convenience Sampling"),
Rata_Rata = c(srs_mean, conv_mean),
MoE = c(srs_moe, NA)
)
# Plot ggplot
p <- ggplot(data, aes(x = Metode, y = Rata_Rata, fill = Metode)) +
geom_bar(stat = "identity", position = "dodge") +
geom_errorbar(aes(ymin = Rata_Rata - MoE, ymax = Rata_Rata + MoE),
width = 0.2, color = "blue") +
labs(title = "Perbandingan Rata-Rata Pengeluaran Makanan Bulanan",
y = "Rata-Rata (Rp)",
x = "Metode Sampling") +
theme_minimal()
# Konversi ke plotly agar interaktif
ggplotly(p)1.12 Contoh Kasus Serupa
1.12.1 Latar Belakang
Sebuah universitas di Indonesia (sebut saja Universitas X) ingin melakukan survei untuk memperkirakan rata-rata pengeluaran bulanan mahasiswa, khususnya untuk kebutuhan makanan. Tujuannya adalah untuk memahami pola pengeluaran mahasiswa dan merancang program bantuan keuangan yang lebih efektif.
1.12.2 Metode Sampling yang Digunakan
Universitas X menggunakan dua metode sampling:
- Simple Random Sampling (SRS): Dipilih secara acak 200 mahasiswa dari total populasi 10.000 mahasiswa.
- Convenience Sampling: Dipilih 200 mahasiswa yang mudah diakses, seperti mahasiswa yang sering berada di kantin atau perpustakaan.
1.12.3 Hasil Survei
Berikut adalah hasil survei yang diperoleh:
1.12.3.1 1. Simple Random Sampling (SRS)
- Rata-rata Pengeluaran Makanan: Rp 1.500.000 per bulan.
- Margin of Error (MoE): Rp 100.000 (dengan tingkat kepercayaan 95%).
- Interpretasi: Dengan tingkat kepercayaan 95%, rata-rata pengeluaran makanan mahasiswa di Universitas X berada dalam rentang Rp 1.400.000 hingga Rp 1.600.000 per bulan.
1.12.3.2 2. Convenience Sampling
- Rata-rata Pengeluaran Makanan: Rp 1.300.000 per bulan.
- Margin of Error (MoE): Tidak dapat dihitung karena metode ini rentan terhadap bias.
- Interpretasi: Hasil ini mungkin tidak mewakili seluruh populasi karena sampel diambil dari mahasiswa yang mudah diakses (misalnya, mahasiswa dengan pengeluaran lebih rendah).
1.12.4 Analisis dan Rekomendasi
- SRS memberikan estimasi yang lebih akurat dan dapat digeneralisasi ke seluruh populasi mahasiswa di Universitas X.
- Convenience Sampling lebih mudah dilakukan, tetapi hasilnya cenderung bias karena tidak semua mahasiswa memiliki peluang yang sama untuk terpilih.
- Rekomendasi: Untuk studi yang membutuhkan akurasi tinggi, disarankan menggunakan SRS atau metode sampling acak lainnya seperti Stratified Sampling.
1.13 Kesimpulan
- Simple Random Sampling (SRS) memberikan hasil yang lebih representatif dibandingkan Convenience Sampling, karena semua individu memiliki peluang yang sama untuk dipilih.
- Convenience Sampling lebih mudah dilakukan, tetapi bisa menghasilkan bias karena tidak semua individu dalam populasi memiliki kesempatan yang sama untuk masuk dalam sampel.
- Margin of Error (MoE) menunjukkan tingkat ketidakpastian dalam estimasi. Semakin kecil MoE, semakin akurat hasil sampel.
- Probability Sampling (SRS) lebih direkomendasikan untuk penelitian yang membutuhkan akurasi tinggi dan kemampuan generalisasi yang baik.
- Non-Probability Sampling (Convenience Sampling) cocok untuk studi eksploratif atau penelitian dengan sumber daya terbatas, namun rentan terhadap bias.