Dalam praktik survei di lapangan, sering kali jumlah responden yang berhasil dikumpulkan tidak sesuai dengan target awal. Hal ini dapat menyebabkan terjadinya kesalahan sampling yang mempengaruhi kualitas data dan representativitas hasil. Berikut ini saya bahas dua jenis kesalahan sampling yang terjadi pada simulasi survei penggunaan aplikasi transportasi online di tiga kota di Sumatera, beserta cara menghitung bobot penyesuaian agar data tetap proporsional.
Berdasarkan situasi berikut:
Terjadi karena jumlah responden yang berhasil dikumpulkan tidak proporsional terhadap rencana awal. Kota B dan Kota C kurang dari target, sedangkan Kota A melebihi target. Hal ini menyebabkan representasi tiap kota dalam total sampel menjadi tidak seimbang, yang bisa mengakibatkan bias dalam estimasi keseluruhan.
Untuk mengembalikan proporsi yang sesuai dengan target (200 per kota), kita perlu menyesuaikan bobot tiap responden berdasarkan target awal dibandingkan dengan realisasi. Rumus umum:
\[ \text{Bobot Kota} = \frac{\text{Target}}{\text{Realisasi}} \]
# Target dan realisasi
target <- c(A = 200, B = 200, C = 200)
realisasi <- c(A = 250, B = 120, C = 180)
# Hitung bobot untuk tiap kota
bobot <- target / realisasi
bobot
## A B C
## 0.800000 1.666667 1.111111
Setiap responden dari Kota A dihitung sebagai 0.8
responden.
Setiap responden dari Kota B dihitung sebagai 1.67
responden.
Setiap responden dari Kota C dihitung sebagai 1.11
responden.
Dua jenis kesalahan sampling yang terjadi dalam simulasi ini adalah kesalahan nonresponse dan over/undercoverage. Untuk memperbaikinya, bobot sampling dapat disesuaikan agar distribusi data tetap proporsional seperti target awal, meskipun jumlah aktual tidak sama.
Survei ini bertujuan untuk mengukur persepsi kenyamanan pengguna ojek online pada jam sibuk, yaitu pagi (07.00–09.00) dan sore (17.00–19.00). Mengingat keterbatasan sumber daya, survei dilakukan hanya pada jam-jam puncak tersebut, bukan sepanjang hari.
Menangkap persepsi pengguna secara representatif pada waktu-waktu sibuk tanpa survei seharian penuh.
Menggunakan pendekatan Time-based Stratified Sampling, di mana waktu pengambilan sampel dibagi menjadi dua strata:
Jumlah responden diambil secara acak sistematis dalam masing-masing strata waktu, misalnya setiap 5 menit mewawancarai 1 pengguna yang baru selesai menggunakan ojek online.
Misalkan total responden = 100 orang
Namun, menurut data historis:
Maka bobot dihitung dengan:
# Proporsi populasi dan proporsi sampel
prop_pop <- c(pagi = 1/3, sore = 2/3)
prop_sampel <- c(pagi = 0.6, sore = 0.4)
# Hitung bobot
bobot_waktu <- round(prop_pop / prop_sampel, 2)
bobot_waktu
## pagi sore
## 0.56 1.67
Survei ini menggunakan stratifikasi waktu agar tetap representatif meski hanya dilakukan pada jam sibuk. Ketidakseimbangan jumlah responden dari pagi dan sore diperbaiki dengan pemberian bobot berdasarkan distribusi historis pengguna. Ini penting agar hasil akhir tetap mencerminkan populasi pengguna ojek online secara akurat.
Survei ini bertujuan untuk mengevaluasi kepuasan mahasiswa terhadap layanan akademik yang mencakup beberapa aspek, antara lain: KRS online, bimbingan akademik, pelayanan administrasi, akses informasi akademik, dan bantuan penyelesaian studi.
Berikut adalah 25 pertanyaan utama dengan variasi skala dan bentuk pertanyaan yang dapat digunakan dalam survei:
Seberapa cepat Anda mendapatkan tanggapan atas
pertanyaan yang diajukan terkait KRS online?
(1 = sangat lambat, 10 = sangat cepat)
Pada skala 1 hingga 10, seberapa puas Anda dengan layanan administrasi kampus?
Berapa kali dalam seminggu Anda mengakses informasi akademik di
website kampus?
(1 = tidak pernah, 10 = setiap hari)
Berapa lama waktu yang dibutuhkan untuk
menyelesaikan prosedur bimbingan akademik?
(1 = sangat lama, 10 = sangat cepat)
Apa yang menurut Anda perlu diperbaiki dari layanan KRS online?
Bagaimana Anda menilai kualitas bimbingan akademik yang Anda terima dari dosen pembimbing?
Apa kendala yang Anda hadapi dalam mendapatkan pelayanan administrasi yang memadai?
Sebutkan aspek yang menurut Anda perlu ditingkatkan terkait akses informasi akademik.
Apakah Anda merasa layanan bantuan penyelesaian studi cukup membantu dalam menyelesaikan masalah akademik Anda?
Berikut adalah contoh simulasi data untuk pertanyaan tentang kepuasan KRS online (skala 1-5):
# Simulasi data untuk pertanyaan 1 tentang kepuasan KRS Online (skala 1-5)
set.seed(123)
data_krs <- sample(1:5, 1000, replace = TRUE, prob = c(0.1, 0.2, 0.4, 0.2, 0.1))
# Analisis frekuensi jawaban
table(data_krs)
## data_krs
## 1 2 3 4 5
## 92 203 404 195 106
# Simulasi data untuk pertanyaan tentang kepuasan KRS online (skala 1-5)
set.seed(123) # Menentukan seed agar hasil simulasi konsisten
data_krs <- sample(1:5, 1000, replace = TRUE, prob = c(0.1, 0.2, 0.4, 0.2, 0.1))
# Menampilkan hasil distribusi frekuensi untuk pertanyaan kepuasan KRS online
table(data_krs)
## data_krs
## 1 2 3 4 5
## 92 203 404 195 106
# Visualisasi distribusi jawaban menggunakan histogram
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.4.2
ggplot(data.frame(krs = data_krs), aes(x = krs)) +
geom_bar(fill = "steelblue") +
labs(title = "Distribusi Kepuasan KRS Online",
x = "Tingkat Kepuasan",
y = "Frekuensi") +
theme_minimal()
# Menghitung proporsi masing-masing jawaban
proporsi <- prop.table(table(data_krs))
proporsi
## data_krs
## 1 2 3 4 5
## 0.092 0.203 0.404 0.195 0.106
# Menghitung rata-rata dan median untuk tingkat kepuasan
rata_rata <- mean(data_krs)
median_krs <- median(data_krs)
# Menampilkan rata-rata dan median
rata_rata
## [1] 3.02
median_krs
## [1] 3