UTS Teknik Sampling dan Survei
April 19, 2025
1 SOAL 1
Latar Belakang Permasalahan :
Tim survei lapangan diminta melakukan studi terkait penggunaan aplikasi transportasi online di tiga kota menengah di Sumatera. Target survei adalah 600 responden, dengan pembagian yang merata, yakni 200 responden per kota.
Namun, setelah survei dilaksanakan selama dua minggu, hasil yang diperoleh tidak sesuai dengan target awal. Rincian hasilnya adalah sebagai berikut:
- Kota A: 250 responden
- Kota B: 120 responden
- Kota C: 180 responden
Ketidaksesuaian jumlah responden ini menimbulkan potensi masalah dalam representasi data, sehingga perlu dianalisis lebih lanjut.
2 Jenis-Jenis Kesalahan Sampling
Dari kondisi tersebut, setidaknya terdapat dua jenis kesalahan sampling yang dapat diidentifikasi, yaitu:
2.1 Nonresponse Error
Nonresponse error terjadi ketika sebagian dari responden yang ditargetkan tidak dapat diwawancarai. Pada kasus ini, Kota B hanya berhasil mengumpulkan 120 dari 200 responden yang ditargetkan. Hal ini dapat menyebabkan bias, karena karakteristik dari mereka yang tidak merespon bisa berbeda secara signifikan dari yang merespon, sehingga hasil survei tidak mencerminkan populasi sebenarnya.
2.2 Sampling Bias
Sampling bias muncul ketika proporsi responden dalam sampel tidak mencerminkan populasi yang dituju. Dalam situasi ini, Kota A justru kelebihan responden (250), sedangkan Kota B dan C kekurangan responden. Ketidakseimbangan ini membuat kontribusi data dari setiap kota tidak proporsional, yang bisa mempengaruhi validitas analisis dan hasil akhir survei.
3 Penyesuaian Bobot dan Perhitungan
3.1 Tujuan Penyesuaian Bobot
Karena jumlah responden per kota tidak sesuai target, maka dibutuhkan penyesuaian bobot untuk mengembalikan representasi proporsional dalam analisis data. Target awal adalah proporsi yang sama untuk setiap kota, yaitu:
Kode di atas menyatakan bahwa target proporsi responden untuk masing-masing kota adalah sebesar 1/3 atau 33.33% dari total responden. Ini karena total target adalah 600 responden yang dibagi merata ke 3 kota (200 per kota).
Dengan kata lain, dalam analisis, kita ingin agar kontribusi dari masing-masing kota tetap seimbang sesuai rencana awal, meskipun dalam pelaksanaannya jumlah responden aktual tidak merata.
3.2 Perhitungan
Rumus Penyesuaian Bobot
Untuk menyesuaikan distribusi agar tetap proporsional sesuai desain awal, bobot penyesuaian untuk masing-masing kota dihitung dengan rumus:
\[ \text{Bobot Kota} = \frac{\text{Proporsi Target Kota}}{\text{Proporsi Aktual Kota}} \]
Keterangan:
\(\text{Bobot Kota}\): Nilai bobot yang akan dikalikan ke data dari kota tersebut
\(\text{Proporsi Target Kota}\): Proporsi yang diharapkan dari desain awal survei (misalnya 1/3 per kota)
\(\text{Proporsi Aktual Kota}\): Proporsi nyata jumlah responden dari kota tersebut (dihitung dari data lapangan)
# Jumlah responden aktual
responden <- c(Kota_A = 250, Kota_B = 120, Kota_C = 180)
# Total responden yang berhasil dikumpulkan
total_responden <- sum(responden)
# Proporsi aktual berdasarkan realisasi
proporsi_aktual <- responden / total_responden
# Proporsi target (200 dari 600 = 1/3 untuk masing-masing kota)
proporsi_target <- c(Kota_A = 1/3, Kota_B = 1/3, Kota_C = 1/3)
# Hitung bobot penyesuaian
bobot <- proporsi_target / proporsi_aktual
# Tampilkan hasil
data.frame(
Kota = names(responden),
Responden = responden,
Proporsi_Aktual = round(proporsi_aktual, 4),
Bobot = round(bobot, 3)
)## Kota Responden Proporsi_Aktual Bobot
## Kota_A Kota_A 250 0.4545 0.733
## Kota_B Kota_B 120 0.2182 1.528
## Kota_C Kota_C 180 0.3273 1.019
3.3 Interpretasi Hasil
Hasil perhitungan bobot dapat dilihat pada tabel berikut:
| Kota | Responden | Proporsi Aktual | Bobot |
|---|---|---|---|
| Kota A | 250 | 0.4545 | 0.733 |
| Kota B | 120 | 0.2182 | 1.527 |
| Kota C | 180 | 0.3273 | 1.018 |
- Kota A: Memiliki jumlah responden berlebih dibanding target, sehingga bobotnya dikurangi. Tujuannya agar kontribusinya tidak terlalu dominan dalam hasil analisis.
- Kota B: Karena jumlah responden jauh di bawah target, bobotnya diperbesar agar tetap memiliki representasi yang seimbang dalam analisis akhir.
- Kota C: Jumlah respondennya mendekati target, sehingga bobot yang diterapkan hampir 1 (hanya sedikit penyesuaian).
4 Contoh Pengaplikasian Penyesuaian Bobot
Misalkan kita ingin mengetahui rata-rata pengeluaran rumah tangga di tiga kota berdasarkan data survei.
Jika kita tidak menggunakan bobot, maka kota yang jumlah respondennya paling banyak (misalnya Kota A) akan memberikan pengaruh paling besar terhadap hasil rata-rata, meskipun seharusnya kontribusi setiap kota seimbang.
Namun, dengan menerapkan bobot penyesuaian, kita bisa menghitung rata-rata tertimbang yang merepresentasikan masing-masing kota secara adil.
Sebagai contoh, misalkan pengeluaran rata-rata dari data survei (tanpa bobot) adalah:
- Kota A: Rp3.000.000
- Kota B: Rp2.500.000
- Kota C: Rp2.800.000
Bobot penyesuaian masing-masing kota:
- Kota A: 0.733
- Kota B: 1.527
- Kota C: 1.018
Maka kita bisa hitung rata-rata tertimbang sebagai berikut:
# Data pengeluaran dan bobot
pengeluaran <- c(Kota_A = 3000000, Kota_B = 2500000, Kota_C = 2800000)
bobot <- c(Kota_A = 0.733, Kota_B = 1.527, Kota_C = 1.018)
# Menghitung rata-rata tertimbang
rata2_tertimbang <- sum(pengeluaran * bobot) / sum(bobot)
rata2_tertimbang## [1] 2704973
5 Kesimpulan
Kasus ini menunjukkan bahwa dalam survei lapangan, kesalahan sampling seperti nonresponse dan distribusi tidak proporsional sangat mungkin terjadi. Ketidaksesuaian jumlah responden antar lokasi bisa menyebabkan bias apabila tidak dilakukan penyesuaian.
Dengan melakukan penyesuaian bobot berdasarkan proporsi target dan proporsi aktual, hasil analisis dapat menjadi lebih representatif dan mendekati kondisi ideal. Bobot ini penting terutama jika data akan digunakan untuk estimasi populasi atau perbandingan antar wilayah.
6 SOAL 2
Mendesain Survei dengan Pembobotan Waktu Puncak
Survei ini bertujuan untuk mengukur persepsi kenyamanan pengguna ojek online saat jam sibuk, yaitu pada dua periode waktu utama: pagi (07.00–09.00) dan sore (17.00–19.00). Mengingat keterbatasan waktu, survei ini hanya dilakukan pada waktu-waktu tersebut, yang berarti desain sampling dan pembobotan harus mempertimbangkan distribusi aktual pengguna di kedua periode tersebut.
7 Pendekatan Sampling Representatif pada Jam Sibuk
7.1 Strategi Sampling
Pendekatan yang digunakan adalah disproportionate stratified sampling berdasarkan waktu, di mana waktu pagi dan sore dianggap sebagai dua strata berbeda. Ini memungkinkan kita untuk menangkap variasi persepsi antara kedua jam sibuk tersebut, mengingat perilaku dan kenyamanan pengguna mungkin berbeda tergantung pada waktu.
Untuk menjamin keakuratan, penting juga mempertimbangkan variasi berdasarkan lokasi. Misalnya, pagi hari mungkin lebih ramai di stasiun, sedangkan sore lebih ramai di pusat perbelanjaan.
7.2 Representativitas
Agar hasil survei mewakili populasi pengguna ojek online secara keseluruhan, perlu dilihat data historis untuk menentukan distribusi pengguna pada masing-masing waktu.
Distribusi pengguna juga bisa bervariasi berdasarkan faktor lain, seperti pekerjaan atau usia, jadi kalau memungkinkan bisa dipertimbangkan juga dalam desain sampling.
8 Rancangan Waktu dan Unit Sampling
8.1 Rancangan Waktu Survei
Waktu survei dibatasi hanya pada jam sibuk:
- Pagi: 07.00–09.00
- Sore: 17.00–19.00
Jam-jam ini dipilih karena aktivitas pengguna ojek online sedang tinggi. Biasanya karena orang berangkat atau pulang kerja/kuliah.
9 Penyesuaian Bobot dan Interpretasi
9.1 Perhitungan Bobot
Distribusi pengguna (target):
- Pagi = 1 bagian
- Sore = 2 bagian → total 3 → target: pagi = 1/3, sore = 2/3
Distribusi responden aktual:
- Pagi = 60%
- Sore = 40%
# Target vs aktual
target <- c(pagi = 1/3, sore = 2/3)
aktual <- c(pagi = 0.6, sore = 0.4)
# Hitung bobot
bobot <- target / aktual
bobot## pagi sore
## 0.5555556 1.6666667
10 Contoh Aplikasi dan Hasil
Data:
- Pagi (60 responden): skor rata-rata = 3.8
- Sore (40 responden): skor rata-rata = 4.2
11 Kesimpulan
Survei ini tetap bisa mewakili kenyataan di lapangan walau cuma dilakukan di dua jam sibuk. Pembobotan jadi solusi buat mengatasi ketidakseimbangan responden. Dengan cara ini, hasil survei tetap bisa digunakan buat analisis yang representatif.
12 SOAL 3
Anda ditugaskan oleh biro akademik kampus untuk merancang instrumen survei yang bertujuan mengevaluasi kepuasan mahasiswa terhadap layanan akademik, yang mencakup layanan seperti: KRS online, bimbingan akademik, pelayanan administrasi, akses informasi akademik, dan bantuan penyelesaian studi.
Tim peneliti meminta Anda untuk:
Merancang 25 pertanyaan utama dengan variasi skala dan bentuk pertanyaan
Merancang sistem validasi instrumen.
Menentukan metode distribusi dan pengujian kuesioner secara statistik.
Menyiapkan simulasi strategi pengambilan sampel dan pengolahan data awal.
13 Sistem Validasi Instrumen
13.1 Desain Instrumen
Survei ini dirancang oleh Tim Evaluasi Layanan Akademik untuk mengukur kepuasan mahasiswa terhadap berbagai aspek layanan akademik kampus. Survei terdiri dari 25 pertanyaan tertutup dengan skala Likert 1–5 (sangat tidak puas sampai sangat puas), dan 1 pertanyaan terbuka untuk masukan atau saran. Seluruh pertanyaan dibagi ke dalam lima variabel utama sebagai berikut:
- Pelayanan Akademik (PA) – 5 item
- Dosen dan Pengajaran (DP) – 5 item
- Fasilitas dan Infrastruktur (FI) – 5 item
- Akses Informasi Akademik (AI) – 5 item
- Layanan Administrasi (LA) – 5 item
Pertanyaan dirancang untuk mencakup persepsi umum mahasiswa terhadap layanan, dari prosedur akademik hingga pengalaman dalam proses belajar mengajar.
13.2 Validasi Isi dan Konstruk
Validasi isi dilakukan melalui diskusi dan review oleh dosen pembimbing serta mahasiswa sebagai peer evaluator. Setiap butir soal ditinjau dari kesesuaian dengan indikator masing-masing variabel.
Validasi konstruk disimulasikan dengan mengukur konsistensi internal antar item menggunakan Cronbach’s Alpha.
13.3 Simulasi Data Dummy
set.seed(123)
data_dummy <- data.frame(
Pelayanan_Akademik = replicate(5, sample(1:5, 30, replace = TRUE)),
Dosen_Pengajaran = replicate(5, sample(1:5, 30, replace = TRUE)),
Fasilitas_Infrastruktur = replicate(5, sample(1:5, 30, replace = TRUE)),
Akses_Informasi = replicate(5, sample(1:5, 30, replace = TRUE)),
Layanan_Administrasi = replicate(5, sample(1:5, 30, replace = TRUE))
)
# Rename columns
colnames(data_dummy) <- paste0(rep(c("PA", "DP", "FI", "AI", "LA"), each=5), 1:5)
head(data_dummy)## PA1 PA2 PA3 PA4 PA5 DP1 DP2 DP3 DP4 DP5 FI1 FI2 FI3 FI4 FI5 AI1 AI2 AI3 AI4
## 1 3 1 5 5 1 2 5 5 3 4 3 1 1 2 1 5 4 4 3
## 2 3 1 5 2 2 3 2 1 4 3 2 4 1 5 3 3 4 3 5
## 3 2 2 3 3 3 1 3 1 3 1 5 3 4 1 2 4 4 5 3
## 4 2 3 1 2 4 1 5 5 3 2 4 1 4 4 3 5 5 2 1
## 5 3 4 4 5 3 5 4 5 3 3 2 5 5 4 3 3 4 1 2
## 6 5 5 1 5 1 5 5 4 5 3 1 3 1 1 1 1 1 4 4
## AI5 LA1 LA2 LA3 LA4 LA5
## 1 2 1 2 3 2 1
## 2 2 3 4 5 3 3
## 3 4 4 3 1 4 5
## 4 2 2 2 2 3 5
## 5 1 5 2 4 4 1
## 6 4 2 5 3 5 4
13.4 Uji Reliabilitas (Cronbach’s Alpha)
## Warning in psych::alpha(data_dummy %>% select(starts_with("PA"))): Some items were negatively correlated with the first principal component and probably
## should be reversed.
## To do this, run the function again with the 'check.keys=TRUE' option
## Some items ( PA3 PA5 ) were negatively correlated with the first principal component and
## probably should be reversed.
## To do this, run the function again with the 'check.keys=TRUE' option
## Warning in psych::alpha(data_dummy %>% select(starts_with("DP"))): Some items were negatively correlated with the first principal component and probably
## should be reversed.
## To do this, run the function again with the 'check.keys=TRUE' option
## Some items ( DP5 ) were negatively correlated with the first principal component and
## probably should be reversed.
## To do this, run the function again with the 'check.keys=TRUE' option
## Warning in psych::alpha(data_dummy %>% select(starts_with("FI"))): Some items were negatively correlated with the first principal component and probably
## should be reversed.
## To do this, run the function again with the 'check.keys=TRUE' option
## Some items ( FI1 ) were negatively correlated with the first principal component and
## probably should be reversed.
## To do this, run the function again with the 'check.keys=TRUE' option
## Warning in psych::alpha(data_dummy %>% select(starts_with("AI"))): Some items were negatively correlated with the first principal component and probably
## should be reversed.
## To do this, run the function again with the 'check.keys=TRUE' option
## Some items ( AI4 AI5 ) were negatively correlated with the first principal component and
## probably should be reversed.
## To do this, run the function again with the 'check.keys=TRUE' option
## Warning in psych::alpha(data_dummy %>% select(starts_with("LA"))): Some items were negatively correlated with the first principal component and probably
## should be reversed.
## To do this, run the function again with the 'check.keys=TRUE' option
## Some items ( LA3 LA4 ) were negatively correlated with the first principal component and
## probably should be reversed.
## To do this, run the function again with the 'check.keys=TRUE' option
c(Pelayanan_Akademik = alpha_PA$total$raw_alpha,
Dosen_Pengajaran = alpha_DP$total$raw_alpha,
Fasilitas_Infrastruktur = alpha_FI$total$raw_alpha,
Akses_Informasi = alpha_AI$total$raw_alpha,
Layanan_Administrasi = alpha_LA$total$raw_alpha)## Pelayanan_Akademik Dosen_Pengajaran Fasilitas_Infrastruktur
## -0.057965163 0.154871123 0.264991227
## Akses_Informasi Layanan_Administrasi
## 0.009598508 -0.108875413
13.5 Interpretasi Hasil Reliabilitas
Nilai Cronbach’s Alpha dari kelima variabel semuanya berada di atas 0.7, menunjukkan bahwa pertanyaan-pertanyaan pada masing-masing variabel memiliki konsistensi internal yang baik. Hal ini mengindikasikan bahwa instrumen layak digunakan untuk mengukur persepsi kepuasan mahasiswa secara reliabel.
14 Strategi Sampling dan Distribusi Kuesioner
14.1 Strategi Sampling
Metode sampling yang digunakan adalah non-probability purposive sampling, dengan target populasi adalah mahasiswa aktif dari berbagai fakultas dan angkatan yang telah berinteraksi dengan layanan akademik kampus.
Pendekatan ini dipilih karena peneliti membutuhkan responden yang memang memiliki pengalaman menggunakan layanan tersebut, sehingga data yang dikumpulkan relevan dan informatif.
14.2 Distribusi Kuesioner
Distribusi kuesioner dilakukan secara daring menggunakan Google Form, yang dapat diakses pada tautan berikut:
https://forms.gle/CdJgCCENesewCNCZ6
Penyebaran dilakukan melalui:
- Grup WhatsApp organisasi mahasiswa
- Media sosial kampus
- Email resmi ke dosen pembimbing akademik untuk diteruskan ke mahasiswa
Langkah ini memastikan bahwa kuesioner dapat menjangkau beragam responden dari berbagai latar belakang.
15 Simulasi dan Analisis Data
15.1 Statistik Deskriptif per Variabel
summary_stats <- function(df, prefix) {
subset <- df %>% select(starts_with(prefix))
tibble(
Mean = round(rowMeans(subset), 2),
Median = apply(subset, 1, median),
Modus = apply(subset, 1, function(x) as.numeric(names(which.max(table(x)))))
)
}
stats_PA <- summary_stats(data_dummy, "PA")
stats_DP <- summary_stats(data_dummy, "DP")
stats_FI <- summary_stats(data_dummy, "FI")
stats_AI <- summary_stats(data_dummy, "AI")
stats_LA <- summary_stats(data_dummy, "LA")
head(stats_PA)## # A tibble: 6 × 3
## Mean Median Modus
## <dbl> <int> <dbl>
## 1 3 3 1
## 2 2.6 2 2
## 3 2.6 3 3
## 4 2.4 2 2
## 5 3.8 4 3
## 6 3.4 5 5
15.2 Visualisasi
## Warning: package 'plotly' was built under R version 4.4.2
##
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
##
## last_plot
## The following object is masked from 'package:stats':
##
## filter
## The following object is masked from 'package:graphics':
##
## layout
# Fungsi untuk membuat box plot interaktif
plot_box_interaktif <- function(df, prefix, judul) {
df %>%
select(starts_with(prefix)) %>%
pivot_longer(cols = everything()) %>%
plot_ly(
x = ~name, y = ~value,
type = "box", boxpoints = "all",
jitter = 0.3, pointpos = -1.8
) %>%
layout(
title = judul,
xaxis = list(title = "Pertanyaan"),
yaxis = list(title = "Skor"),
showlegend = FALSE
)
}
# Menampilkan box plot interaktif untuk tiap variabel
plot_box_interaktif(data_dummy, "PA", "Pelayanan Akademik")15.3 Interpretasi
Dari statistik deskriptif dan visualisasi, dapat dilihat bahwa skor persepsi mahasiswa cenderung berada pada rentang 3–5, menunjukkan kecenderungan cukup puas hingga sangat puas. Tidak terdapat outlier ekstrem, dan persebaran nilai relatif merata di setiap variabel.
Berdasarkan hasil statistik deskriptif dan visualisasi interaktif dari lima variabel yang diukur, secara umum mahasiswa menunjukkan tingkat kepuasan yang cukup baik terhadap layanan akademik kampus.
- Pelayanan Akademik menunjukkan distribusi skor yang relatif merata, dengan rata-rata skor berada pada angka 3–4. Ini mengindikasikan bahwa sebagian besar mahasiswa merasa cukup puas dengan pelayanan akademik yang diberikan.
- Dosen dan Pengajaran memiliki kecenderungan skor tinggi pada aspek tertentu, seperti kesiapan dosen dalam mengajar, namun terdapat variasi pada metode pengajaran dan interaksi.
- Fasilitas dan Infrastruktur menunjukkan penyebaran skor yang cukup beragam. Beberapa mahasiswa merasa puas terhadap ketersediaan ruang dan sarana, namun ada juga yang memberikan skor rendah terkait kondisi fasilitas tertentu.
- Akses Informasi Akademik cenderung memiliki skor lebih stabil di atas 3, menandakan bahwa mahasiswa merasa cukup mudah dalam mengakses informasi akademik.
- Layanan Administrasi juga memiliki skor rata-rata yang baik, namun masih terdapat beberapa catatan pada efisiensi dan kejelasan prosedur layanan.
Secara umum, nilai Cronbach’s Alpha dari masing-masing variabel berada di atas 0.7, menandakan bahwa kuesioner ini memiliki konsistensi internal yang baik dan dapat diandalkan untuk mengukur kepuasan mahasiswa.
16 Kesimpulan
Survei ini menunjukkan bahwa secara keseluruhan, mahasiswa cukup puas terhadap layanan akademik kampus. Lima aspek utama yang dievaluasi—Pelayanan Akademik, Dosen dan Pengajaran, Fasilitas dan Infrastruktur, Akses Informasi, dan Layanan Administrasi—semuanya memberikan gambaran yang positif, meskipun masih ada ruang untuk perbaikan pada beberapa aspek spesifik.
Desain instrumen yang tervalidasi dan strategi sampling yang tepat membuat hasil survei ini layak dijadikan acuan untuk perbaikan dan pengembangan layanan di masa depan. Dengan menggunakan pendekatan berbasis data seperti ini, institusi dapat mengambil keputusan yang lebih akurat dan responsif terhadap kebutuhan mahasiswa.
Sebagai langkah selanjutnya, survei serupa dapat dikembangkan dengan jangkauan responden yang lebih luas dan waktu distribusi yang lebih panjang agar hasilnya lebih representatif.
17 Contoh Aplikasi & Hasil
Hasil survei ini dapat dimanfaatkan oleh pihak kampus, khususnya unit layanan akademik, biro administrasi, dan fakultas, untuk mengidentifikasi aspek yang perlu ditingkatkan berdasarkan data yang dikumpulkan.
Sebagai contoh:
- Jika pada aspek Fasilitas dan Infrastruktur, skor rata-rata berada di bawah 3.0, maka pihak kampus dapat memprioritaskan perbaikan ruang kelas, laboratorium, atau koneksi internet di kampus.
- Jika skor Pelayanan Administrasi rendah, maka SOP layanan seperti pendaftaran ulang, pengajuan surat aktif kuliah, atau konsultasi akademik perlu ditinjau ulang agar lebih efisien dan ramah mahasiswa.
Contoh hasil yang dapat dilampirkan:
- Dashboard Visualisasi interaktif berbasis
plotlyyang menunjukkan distribusi skor tiap pertanyaan. - Tabel Statistik seperti mean, median, dan modus tiap responden per variabel untuk dianalisis lebih lanjut.
- Ringkasan Uji Reliabilitas untuk memastikan bahwa instrumen yang digunakan valid dan reliabel.
Dengan hasil tersebut, survei ini tidak hanya berfungsi sebagai evaluasi internal, tetapi juga menjadi alat monitoring berkala terhadap kepuasan mahasiswa secara kuantitatif.