
Studi Kasus 1 (Simulasi Kesalahan Sampling di
Lapangan)
Andikan Anda adalah bagian dari tim riset lapangan yang diminta untuk
melakukan survei tingkat penggunaan aplikasi transportasi online di
3 kota menengah di Sumatera. Target sampel total adalah
600 responden, masing-masing 200 per kota. Tetapi,
setelah 2 minggu melakukan survei anda menemukan:
- Di Kota A, tim berhasil mendapatkan 250 responden.
- Di Kota B, hanya 120 responden yang dapat diwawancarai.
- Di Kota C, 180 responden.
Instruksi:
Jelaskan dua jenis kesalahan sampling yang
terjadi berdasarkan situasi ini.
Jika Anda harus menyesuaikan bobot untuk mengembalikan
representasi proporsional, bagaimana Anda akan menghitungnya?
Kesalahan Sampling
Berdasarkan situasi yang diberikan, berikut adalah dua jenis
kesalahan sampling yang terjadi:
1. Kesalahan Representasi (Representation
Error)
Jumlah responden yang terkumpul tidak sesuai dengan target awal per
kota, yaitu 200 responden per kota. Situasi ini menyebabkan:
- Kota A memiliki 250 responden, yang berarti kelebihan 50 responden
(+25% dari target).
- Kota B hanya memiliki 120 responden, yang berarti kekurangan 80
responden (-40% dari target).
- Kota C memiliki 180 responden, yang berarti kekurangan 20 responden
(-10% dari target).
Karena distribusi jumlah responden tidak seimbang, hasil survei
menjadi tidak mewakili proporsi yang diinginkan. Kota A yang kelebihan
responden akan memiliki pengaruh yang lebih besar terhadap hasil
survei.
2. Kesalahan Sampling Non-Respons (Non-Response
Error)
Kesalahan ini terjadi karena di Kota B hanya 120 orang yang berhasil
diwawancarai, jauh di bawah target 200. Kemungkinan ada faktor-faktor
tertentu yang membuat responden di Kota B tidak mau atau tidak bisa
berpartisipasi, seperti kurangnya waktu, ketidakpercayaan terhadap
survei, atau alasan lain. Jika karakteristik mereka berbeda dari yang
berpartisipasi, hasil survei akan bias.
Menghitung Bobot Responden
Untuk mengembalikan representasi proporsional ke target awal (200
responden per kota dari total 600), bobot untuk masing-masing kota
dihitung sebagai berikut:
- Proporsi Target:
- Kota A: \(\frac{200}{600} =
0.3333\)
- Kota B: \(\frac{200}{600} =
0.3333\)
- Kota C: \(\frac{200}{600} =
0.3333\)
- Proporsi Aktual:
- Kota A: \(\frac{250}{550} \approx
0.4545\)
- Kota B: \(\frac{120}{550} \approx
0.2182\)
- Kota C: \(\frac{180}{550} \approx
0.3273\)
- Bobot:
- Kota A: \(\frac{0.3333}{0.4545} \approx
0.733\)
- Kota B: \(\frac{0.3333}{0.2182} \approx
1.528\)
- Kota C: \(\frac{0.3333}{0.3273} \approx
1.018\)
Implementasi Perhitungan dengan R
Berikut adalah implementasi kode untuk menghitung bobot menggunakan
R:
## Warning: package 'knitr' was built under R version 4.4.2
# Data jumlah target dan aktual per kota
kota <- c("Kota A", "Kota B", "Kota C")
target <- c(200, 200, 200)
aktual <- c(250, 120, 180)
# Total
total_target <- sum(target)
total_aktual <- sum(aktual)
# Hitung proporsi target dan aktual
proporsi_target <- target / total_target
proporsi_aktual <- aktual / total_aktual
# Hitung bobot
bobot <- round(proporsi_target / proporsi_aktual, 3)
# Buat data frame hasil
hasil <- data.frame(
Kota = kota,
Target = target,
Aktual = aktual,
`Proporsi Target` = round(proporsi_target, 4),
`Proporsi Aktual` = round(proporsi_aktual, 4),
`Bobot Penyesuaian` = bobot
)
# Tampilkan hasil
kable(hasil, caption = "Tabel Penyesuaian Bobot Responden per Kota")
Tabel Penyesuaian Bobot Responden per Kota
Kota A |
200 |
250 |
0.3333 |
0.4545 |
0.733 |
Kota B |
200 |
120 |
0.3333 |
0.2182 |
1.528 |
Kota C |
200 |
180 |
0.3333 |
0.3273 |
1.019 |
Studi Kasus 2 (Mendesain Survei dengan Pembobotan Waktu
Puncak)
Buatlah desain rancangan survei tentang persepsi kenyamanan
pengguna ojek online saat jam sibuk (07.00–09.00 dan
17.00–19.00).
Instruksi:
Desain pendekatan sampling yang memungkinkan Anda
menangkap persepsi pengguna secara representatif pada jam
sibuk, tanpa melakukan survei sepanjang hari.
Sertakan rancangan waktu, metode pemilihan responden, dan
justifikasi pemilihan unit sampling.
Jelaskan bagaimana Anda akan menyesuaikan hasil survei jika 60%
responden berasal dari pagi hari, sementara 40% dari sore hari,
sedangkan data historis menunjukkan pengguna ojek online saat sore hari
dua kali lebih banyak dibanding pagi.
Desain Pendekatan Sampling
Untuk memastikan survei yang representatif, pendekatan yang digunakan
adalah stratified time sampling, dengan pembagian dua
strata waktu:
- Pagi (07.00–09.00): Fokus pada jam berangkat
kerja/sekolah.
- Sore (17.00–19.00): Fokus pada jam pulang
kerja/sekolah.
Dengan pendekatan ini, survei hanya dilakukan pada jam sibuk yang
relevan, sehingga efisien dan tetap representatif tanpa harus
mengumpulkan data sepanjang hari. Masing-masing strata waktu
merepresentasikan pola penggunaan ojek online yang berbeda.
Rancangan Waktu, Metode, dan Justifikasi
Rancangan Waktu: - Survei dilaksanakan pada hari
kerja (Senin-Jumat) selama dua waktu sibuk: pagi (07.00–09.00) dan sore
(17.00–19.00).
Metode Pemilihan Responden: - Systematic
intercept sampling: Responden dipilih secara sistematis pada
lokasi-lokasi strategis, seperti stasiun, terminal, atau kawasan
perkantoran. - Contoh: Setiap 10 menit, satu pengguna ojek online yang
baru turun diwawancarai.
Justifikasi Pemilihan Unit Sampling: - Unit sampling
adalah pengguna aktif ojek online pada jam sibuk.
Mereka dipilih karena berada di lokasi dan waktu yang relevan untuk
menggambarkan persepsi kenyamanan secara langsung.
Penyesuaian Hasil Survei Berdasarkan Data Historis
Dalam survei ini: - 60% responden berasal dari pagi hari
(07.00–09.00). - 40% responden berasal dari sore hari
(17.00–19.00).
Namun, data historis menunjukkan bahwa: - Pengguna ojek online di
sore hari dua kali lebih banyak dibandingkan pagi hari.
Proporsi Aktual Berdasarkan Data Historis:
- Pagi: 1 bagian (1/3 atau 0.33)
- Sore: 2 bagian (2/3 atau 0.67)
Penyesuaian Bobot:
Untuk menghindari bias akibat ketidakseimbangan jumlah responden,
dilakukan penyesuaian bobot berdasarkan proporsi aktual dan proporsi
survei.
Rumus Bobot: \[
\text{Bobot waktu} = \frac{\text{Proporsi sebenarnya}}{\text{Proporsi
hasil survei}}
\]
Perhitungan Bobot: - Bobot pagi:
\(0.33 / 0.60 \approx 0.56\) -
Bobot sore: \(0.67 / 0.40
\approx 1.67\)
library(knitr)
# Data pembobotan
pembobotan_data <- data.frame(
Waktu = c("Pagi", "Sore"),
Proporsi_Survei = c(0.60, 0.40),
Proporsi_Aktual = c(1/3, 2/3),
Bobot = c((1/3)/0.60, (2/3)/0.40)
)
# Tabel pembobotan
kable(pembobotan_data, caption = "Pembobotan Berdasarkan Proporsi Historis Pengguna")
Pembobotan Berdasarkan Proporsi Historis Pengguna
Pagi |
0.6 |
0.3333333 |
0.5555556 |
Sore |
0.4 |
0.6666667 |
1.6666667 |
Simulasi Data dan Analisis
Data Simulasi
Kita buat data simulasi untuk 100 responden:
set.seed(123) # For reproducibility
# Membuat data untuk 100 responden
data <- data.frame(
respondent_id = 1:100,
time_period = c(rep("Pagi", 60), rep("Sore", 40)),
satisfaction_score = c(rnorm(60, mean = 7, sd = 1.5), rnorm(40, mean = 8, sd = 1.2))
)
head(data)
Terapkan Bobot
Tambahkan bobot ke data berdasarkan waktu:
## Warning: package 'dplyr' was built under R version 4.4.3
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
data <- data %>%
left_join(pembobotan_data %>% select(Waktu, Bobot), by = c("time_period" = "Waktu")) %>%
mutate(weighted_score = satisfaction_score * Bobot)
head(data)
Perhitungan Rata-rata Berbobot
Hitung rata-rata berbobot:
weighted_mean <- sum(data$weighted_score) / sum(data$Bobot)
weighted_mean
## [1] 7.801546
Studi Kasus 3 (Evaluasi Kepuasan Mahasiswa terhadap Layanan
Akademik)
Anda ditugaskan oleh biro akademik kampus untuk merancang instrumen
survei yang bertujuan mengevaluasi kepuasan mahasiswa terhadap layanan
akademik, yang mencakup layanan seperti: KRS online, bimbingan akademik,
pelayanan administrasi, akses informasi akademik, dan bantuan
penyelesaian studi.
Tim peneliti meminta Anda untuk:
Merancang 25 pertanyaan utama dengan variasi skala dan
bentuk pertanyaan.
Merancang sistem validasi instrumen.
Menentukan metode distribusi dan pengujian kuesioner secara
statistik.
Menyiapkan simulasi strategi pengambilan sampel dan pengolahan
data awal.
Output Laporan yang diharapkan dalam bentuk naratif, mencakup:
• Desain pertanyaan
• Skema validasi
• Strategi distribusi dan sampling
• Simulasi data dan analisis awal
1. Desain Pertanyaan
Berikut adalah desain 25 pertanyaan yang terbagi dalam lima aspek
layanan akademik:
- KRS Online
- Bimbingan Akademik
- Pelayanan Administrasi
- Akses Informasi Akademik
- Bantuan Penyelesaian Studi
Link Pertanyaan Google Form:
Google
Form
2. Skema validasi
2.1 Validasi Isi (Content Validity)
Proses validasi isi dilakukan dengan melibatkan pakar atau dosen di
bidang pendidikan untuk menilai relevansi setiap pertanyaan terhadap
aspek yang dievaluasi. Penilaian dilakukan dengan tiga kategori:
Sangat relevan
Cukup relevan
Tidak relevan
Hasil penilaian dihitung menggunakan Content Validity Ratio (CVR).
Jika CVR dari suatu pertanyaan berada di atas ambang batas yang
ditentukan, maka pertanyaan tersebut dianggap valid secara isi.
Sebaliknya, jika CVR rendah, pertanyaan tersebut perlu direvisi atau
dihapus.
2.2 Validasi Statistik
Setelah validasi isi selesai, dilakukan uji coba kuesioner kepada 30
mahasiswa sebagai tahap awal pengujian statistik.
2.2.1 Uji Validitas Konstruk (Construct Validity)
Uji ini bertujuan untuk memastikan bahwa setiap pertanyaan dalam
kuesioner benar-benar mengukur aspek yang sesuai. Pendekatan yang
digunakan:
Korelasi Item-Total: Menghitung korelasi antara setiap item
dengan total skor dari aspek terkait. Korelasi > 0.3 menunjukkan
validitas yang baik.
Analisis Faktor: Dilakukan eksplorasi menggunakan metode Analisis
Faktor Eksploratori (EFA) untuk memastikan bahwa kelompok pertanyaan
membentuk faktor yang diharapkan.
2.2.2 Uji Reliabilitas
Reliabilitas instrumen diuji menggunakan Cronbach’s Alpha untuk
mengevaluasi konsistensi internal antaritem. Kriteria:
3. Strategi Distribusi dan Sampling
3.1 Strategi Distribusi
Kuesioner akan disebarkan secara daring menggunakan platform Google
Forms. Langkah distribusi meliputi:
Email Kampus: Kuesioner dikirim melalui sistem email resmi kepada
seluruh mahasiswa aktif.
Grup Media Sosial: Tautan kuesioner disebarkan melalui grup
WhatsApp, Telegram, dan platform komunikasi lainnya.
LMS Kampus: Kuesioner juga akan tersedia di Learning Management
System (LMS) kampus untuk meningkatkan aksesibilitas.
Pengingat akan dikirimkan secara berkala untuk meningkatkan tingkat
respons. Selain itu, insentif berupa sertifikat partisipasi atau hadiah
kecil dapat diberikan kepada responden sebagai bentuk apresiasi.
3.2 Strategi Sampling
3.2.1 Populasi dan Teknik Sampling
Populasi target adalah seluruh mahasiswa aktif di kampus. Metode
sampling yang digunakan adalah Stratified Random Sampling dengan strata
berdasarkan:
Stratifikasi ini bertujuan untuk memastikan bahwa setiap kelompok
terwakili dalam survei.
3.2.2 Ukuran Sampel
Mengacu pada populasi mahasiswa aktif sebanyak 10.000 orang,
diperlukan minimal 384 responden untuk tingkat kepercayaan 95% dan
margin of error 5%. Untuk tahap uji coba, 30 responden awal akan
digunakan untuk memvalidasi instrumen secara statistik.
3.2.3 Alokasi Sampel
Responden dari setiap strata akan diambil secara proporsional.
Misalnya, jika Program Studi A memiliki 20% populasi, maka 20% dari
total sampel akan diambil dari program studi tersebut.
3.2.4 Peningkatan Respons
Strategi untuk meningkatkan tingkat respons meliputi:
Mengirimkan pengingat secara berkala kepada mahasiswa yang belum
mengisi kuesioner.
Melibatkan organisasi mahasiswa dan dosen untuk mempromosikan
survei.
Memberikan insentif kepada responden yang
berpartisipasi.
4. Simulasi Data dan analisis awal
# Simulasi Data Survei Kepuasan Mahasiswa
set.seed(123)
# Membuat data untuk 5 kategori layanan
data_krs <- data.frame(
KRS_akses = sample(1:5, 100, replace = TRUE),
KRS_masalah = sample(1:5, 100, replace = TRUE),
KRS_efisiensi = sample(c("Ya", "Tidak"), 100, replace = TRUE)
)
# Gabungkan data untuk 5 kategori lainnya
data_bimbingan <- data.frame(
Bimbingan_frekuensi = sample(1:10, 100, replace = TRUE),
Bimbingan_kualitas = sample(1:5, 100, replace = TRUE)
)
data_administrasi <- data.frame(
Administrasi_respons = sample(1:5, 100, replace = TRUE),
Administrasi_kemudahan = sample(c("Ya", "Tidak"), 100, replace = TRUE)
)
data_akses <- data.frame(
Akses_frekuensi = sample(1:10, 100, replace = TRUE),
Akses_informatif = sample(1:5, 100, replace = TRUE)
)
data_bantuan <- data.frame(
Bantuan_studi = sample(1:5, 100, replace = TRUE),
Bantuan_tersedia = sample(c("Ya", "Tidak"), 100, replace = TRUE)
)
# Gabungkan semua data menjadi satu data frame
data_survei <- cbind(data_krs, data_bimbingan, data_administrasi, data_akses, data_bantuan)
head(data_survei)
4.1 Deskripsi Statistik Awal
Kita akan menghitung beberapa deskripsi statistik untuk melihat
distribusi data dari setiap kategori.
library(dplyr)
summary_statistics <- data_survei %>%
summarise_all(list(mean = ~mean(as.numeric(as.character(.)), na.rm = TRUE),
sd = ~sd(as.numeric(as.character(.)), na.rm = TRUE),
median = ~median(as.numeric(as.character(.)), na.rm = TRUE)))
## Warning: There were 9 warnings in `summarise()`.
## The first warning was:
## ℹ In argument: `KRS_efisiensi_mean = (structure(function (..., .x = ..1, .y =
## ..2, . = ..1) ...`.
## Caused by warning in `mean()`:
## ! NAs introduced by coercion
## ℹ Run `dplyr::last_dplyr_warnings()` to see the 8 remaining warnings.
knitr::kable(summary_statistics, caption = "Deskripsi Statistik Awal")
Deskripsi Statistik Awal
2.93 |
2.95 |
NaN |
5.55 |
2.99 |
3.02 |
NaN |
5.48 |
3.1 |
3.12 |
NaN |
1.408882 |
1.5333 |
NA |
2.952058 |
1.374332 |
1.456299 |
NA |
2.945567 |
1.438995 |
1.49936 |
NA |
3 |
3 |
NA |
5.5 |
3 |
3 |
NA |
6 |
3 |
3 |
NA |
4.2 Uji Validitas dan Reliabilitas
4.2.1 Korelasi Item-Total
Untuk memeriksa validitas konstruk, kita akan menghitung korelasi
antara item dan total skor untuk setiap kategori.
# Menghitung korelasi item-total untuk kategori KRS
cor_krs <- cor(data_krs$KRS_akses, data_krs$KRS_masalah, use = "complete.obs")
cor_krs
## [1] 0.08720506
4.2.2 Cronbach’s Alpha
Kita akan mengukur reliabilitas setiap kategori menggunakan
Cronbach’s Alpha.
## Warning: package 'psych' was built under R version 4.4.3
# Fungsi untuk menghitung Cronbach's Alpha
cronbach_alpha <- function(data) {
numeric_data <- data[sapply(data, is.numeric)]
data_clean <- na.omit(numeric_data)
alpha_result <- psych::alpha(data_clean)
return(alpha_result$total$raw_alpha)
}
# Menghitung Cronbach's Alpha untuk kategori KRS
cronbach_krs <- cronbach_alpha(data_krs)
cronbach_krs
## [1] 0.1598937
4.3 Penyajian Grafik
Kita akan menggunakan grafik untuk menggambarkan distribusi jawaban
dari beberapa pertanyaan.
2.3.1 Histogram untuk KRS_akses
# Membuat histogram untuk melihat distribusi frekuensi untuk KRS_akses
library(ggplot2)
##
## Attaching package: 'ggplot2'
## The following objects are masked from 'package:psych':
##
## %+%, alpha
ggplot(data_survei, aes(x = KRS_akses)) +
geom_bar(fill = "skyblue", color = "black") +
labs(title = "Distribusi Jawaban KRS Akses", x = "Skala KRS Akses", y = "Frekuensi")

4.3.2 Boxplot untuk Bimbingan_kualitas
# Membuat boxplot untuk Bimbingan_kualitas
ggplot(data_survei, aes(y = Bimbingan_kualitas, x = 1)) +
geom_boxplot(fill = "lightgreen", color = "black") +
labs(title = "Distribusi Kepuasan Terhadap Bimbingan Akademik", y = "Kualitas Bimbingan", x = "")

4.4 Kesimpulan
Berdasarkan analisis data awal, kita dapat menyimpulkan bahwa:
Layanan KRS Online cenderung memiliki tingkat kepuasan yang
bervariasi, dengan sebagian besar mahasiswa merasa kesulitan mengakses
atau mengalami masalah teknis.
Bimbingan Akademik menunjukkan kepuasan yang cukup baik, namun
terdapat kendala dalam hal waktu dan akses.
Pelayanan administrasi umumnya dianggap cepat, meskipun ada
beberapa laporan keterlambatan.
Akses informasi akademik juga bervariasi, dengan beberapa
mahasiswa merasa kesulitan menemukan informasi yang diperlukan.
