Sampling and Survey

UTS

Mohammad Riyadh

Soal Nomor 1: Simulasi Kesalahan Sampling di Lapangan

a. Dua Jenis Kesalahan Sampling

  1. Sampling Bias (Bias Seleksi)
    Terjadi karena realisasi jumlah responden antar kota tidak proporsional terhadap desain awal, sehingga responden dari Kota Bukittinggi mendominasi hasil. Ini menyebabkan estimasi agregat bias.

  2. Non-response Bias
    Kota B hanya memperoleh 120 dari target 200 responden. Bisa jadi kelompok yang tidak merespons memiliki karakteristik berbeda dari yang merespons → menyebabkan hasil survei tidak mencerminkan populasi sesungguhnya.

b. Cara Menghitung Bobot Penyesuaian Proporsional

Langkah 1: Tentukan Proporsi Ideal (target)

Target = 600 responden, 3 kota → Masing-masing seharusnya:
- Kota Bukittinggi: 200/600 = 0.333
- Kota Payakumbuh: 200/600 = 0.333
- Kota Padang Panjang: 200/600 = 0.333

Langkah 2: Hitung Proporsi Aktual (hasil survei)

Total aktual:

250 (Kota Bukittinggi) + 120 (Kota Payakumbuh) + 180 (Kota Padang Panjang) = 550

  • Kota Bukittinggi: 250/550 = 0.455
  • Kota Payakumbuh: 120/550 = 0.218
  • Kota Padang Panjang: 180/550 = 0.327

Langkah 3: Hitung Bobot Koreksi

Gunakan rumus:
\[ \text{Bobot}_i = \frac{\text{Proporsi Target}_i}{\text{Proporsi Aktual}_i} \]

Kota Proporsi Target Proporsi Aktual Bobot
Bukittinggi 0.333 0.455 0.733
Payakumbuh 0.333 0.218 1.527
Padang panjang 0.333 0.327 1.018

Interpretasi Bobot:

  • Jawaban dari responden Kota Bukittinggi perlu dikalikan 0.733 (dikurangi pengaruhnya).

  • Jawaban dari responden Kota Payakumbuh dikalikan 1.527 (diperbesar).

  • Kota Padang Panjang hampir seimbang.

Soal Nomor 2: Mendesain Survei dengan Pembobotan Waktu Puncak

a. Pendekatan Sampling Representatif di Jam Sibuk

Gunakan: Time-Location Sampling (TLS)

  • Sampling dilakukan di lokasi-lokasi strategis saat jam sibuk (pagi dan sore).

  • Responden dipilih secara acak saat selesai menggunakan ojek online.

  • Tidak perlu survei sepanjang hari, cukup fokus di waktu yang ditargetkan.

Langkah-langkah dalam TLS

  1. Identifikasi Lokasi Strategis:
    • Pilih lokasi padat dan relevan dengan target populasi.
    • Contoh: stasiun, kampus, kantor, halte, pusat kota.
  2. Tentukan Waktu Puncak (Jam Sibuk):
    • Fokus hanya pada jam tertentu ketika target populasi muncul dalam jumlah besar.
    • Dalam soal: jam sibuk pagi (07.00–09.00) dan sore (17.00–19.00).
  3. Pilih Responden di Tempat dan Waktu Tertentu:
    • Gunakan teknik intercept (langsung tanya ke pengguna setelah turun ojek).
    • Bisa juga acak sistematis, misalnya setiap 3 orang pertama.
  4. Tidak Perlu Sepanjang Hari:
    • Karena sudah fokus di jam puncak, survei hanya dilakukan di slot waktu terbatas tapi strategis.

Kelebihan TLS:

  • Efisien: Hemat waktu dan tenaga karena fokus hanya di waktu sibuk.

  • Representatif kontekstual: Cocok untuk populasi musiman atau temporer (seperti penumpang ojek).

  • Fleksibel: Bisa diterapkan di berbagai lokasi dan waktu yang berbeda.

Kekurangan:

  • Bisa bias jika lokasi/waktu yang dipilih tidak benar-benar mencerminkan populasi keseluruhan.

  • Perlu pembobotan untuk menyesuaikan hasil survei dengan populasi aktual (seperti di soal bagian c).

b. Rancangan Waktu dan Metode Pemilihan Responden

Rancangan waktu:

  • Jam sibuk pagi: 07.00–09.00 → 4 slot 30 menit

  • Jam sibuk sore: 17.00–19.00 → 4 slot 30 menit

  • Pilih 1–2 lokasi padat (kantor, stasiun, kampus)

  • Ambil 10–15 responden tiap slot

Metode pemilihan:

  • Teknik intercept (langsung tanya pengguna ojek yang baru turun)

  • Acak sistematis (misalnya tiap 3 orang yang keluar dari ojek)

c. Penyesuaian Bobot berdasarkan Data Historis

Kondisi:

  • Hasil survei: 60% dari pagi, 40% dari sore

  • Tapi data historis: sore hari punya 2x lipat volume pengguna dibanding pagi

→ Berarti distribusi ideal = 33% pagi, 67% sore

Rumus Bobot:

\[ \text{Bobot}_w = \frac{\text{Proporsi Ideal}_w}{\text{Proporsi Aktual}_w} \]

Diketahui: - Total responden = 100

  • Hasil aktual survei:

    • Pagi: 60 responden (60%)

    • Sore: 40 responden (40%)

  • Distribusi ideal (berdasarkan data historis):

    • Pagi: 33%

    • Sore: 67%

  • Bobot per waktu:

    • Pagi: 0.55

    • Sore: 1.675

Langkah Perhitungan:

1. Bobot pada masing-masing kelompok waktu:

  • Total bobot untuk responden pagi: \[ 60 \text{ responden} \times 0.55 = 33 \text{ bobot tertimbang} \]

  • Total bobot untuk responden sore: \[ 40 \text{ responden} \times 1.675 = 67 \text{ bobot tertimbang} \]

2. Total bobot keseluruhan:

\[ 33 (pagi) + 67 (sore) = 100 \]

Interpretasi:

Meskipun secara jumlah *responden sore hanya 40 orang, bobotnya diperbesar agar kontribusinya terhadap hasil survei **setara dengan 67%* dari populasi pengguna sebenarnya. Sebaliknya, responden pagi diturunkan bobotnya karena mereka overrepresented di data awal.

Waktu Proporsi Ideal Proporsi Aktual Bobot
Pagi 0.33 0.60 0.55
Sore 0.67 0.40 1.675

Interpretasi Bobot:

  • Respon pagi harus dikalikan 0.55

  • Respon sore dikalikan 1.675

Artinya, persepsi pengguna sore perlu diperkuat agar mencerminkan kenyataan.

Kesimpulan

  1. Data Historis Penggunaan Ojek Online

    • Misalnya: jumlah perjalanan ojek per jam dari platform (Gojek, Grab, dll).

    • Jika data menunjukkan bahwa 67% pengguna aktif di sore hari dan 33% di pagi, maka itu jadi proporsi ideal.

  2. Observasi Lapangan / Studi Sebelumnya

    • Bisa berdasarkan data transportasi, pergerakan pengguna, atau laporan instansi.
  3. Survei tidak selalu mencerminkan proporsi populasi sebenarnya, terutama jika waktu pengambilan sampel tidak seimbang (misalnya lebih banyak responden pagi daripada sore).

  4. Oleh karena itu, diperlukan pembobotan agar hasil survei mencerminkan komposisi populasi yang sebenarnya, berdasarkan data historis.

  5. Rumus bobot = Proporsi Ideal / Proporsi Aktual digunakan untuk menghitung seberapa besar pengaruh tiap kelompok responden dalam analisis akhir.

  6. Dalam contoh kasus:

    • Respon pagi yang berlebihan harus dikurangi pengaruhnya (dikalikan 0.55).

    • Respon sore yang kurang representatif harus diperbesar pengaruhnya (dikalikan 1.675).

  7. Dengan pembobotan, meskipun jumlah responden sore lebih sedikit, pendapat mereka akan lebih mencerminkan kenyataan populasi, karena pengguna ojek online lebih banyak di sore hari.

Soal Nomor 3 Merancang Instrumen Survei

Laporan Survei Kepuasan Mahasiswa terhadap Layanan Akademik

Institut Teknologi Sains Bandung

Tahun Ajaran 2024/2025 – Semester Genap

1. Desain Instrumen Survei

Instrumen terdiri dari dua bagian:

Bagian A: Informasi Responden

  • Fakultas: Sains Data, Teknik Pengolahan Sawit, Desain Produk, PWK, Lainnya

  • Angkatan: 2020 s.d. 2024

Bagian B: Pertanyaan Inti

  • 20 pertanyaan skala Likert (1–5):

    1 = Sangat Tidak Puas | 2 = Tidak Puas | 3 = Cukup Puas | 4 = Puas | 5 = Sangat Puas

  • 1 Pertanyaan Pilihan Ganda: Apakah layanan akademik sudah memenuhi kebutuhan?

  • 2 Pertanyaan Terbuka: Kendala utama dan saran peningkatan layanan

2. Skema Validasi Instrumen

  • Validitas Konstruk (disarankan untuk data nyata):

    • Diuji dengan Exploratory Factor Analysis (EFA)

    • Persyaratan: KMO > 0.5 dan Bartlett’s Test signifikan

  • Reliabilitas (Uji Dummy Cronbach’s Alpha):

    • Nilai α = 0.14
      > (Nilai rendah karena data masih acak. Nilai ideal ≥ 0.7 pada data nyata)

3. Strategi Distribusi & Sampling

  • Populasi: Mahasiswa aktif ITSB lintas fakultas dan angkatan

  • Sampling: Stratified Random Sampling

  • Distribusi Kuesioner:

    • Melalui Google Form: Link survey

    • Grup WhatsApp tiap angkatan/prodi

    • Bantuan dari dosen wali dan admin fakultas

4. Simulasi Data & Analisis Awal (30 Responden Dummy)

Distribusi Responden:

  • Fakultas terbanyak: Lainnya (33%)

  • Angkatan dominan: 2024 (30%)

Analisis Frekuensi (Contoh: Pertanyaan Q1 - Kemudahan akses KRS online)

Skor Kepuasan Frekuensi Persentase
1 (Sangat Tidak Puas) 4 13.3%
2 (Tidak Puas) 7 23.3%
3 (Cukup Puas) 4 13.3%
4 (Puas) 8 26.7%
5 (Sangat Puas) 7 23.3%
Rata-rata Skor 3.23

(Hasil di atas bisa diulangi untuk Q2–Q20)

Rata-rata Skor Kepuasan Keseluruhan:

  • Skor rata-rata dari semua pertanyaan Q1–Q20: 3.07
    (Cukup Puas secara umum)

5. Analisis Pertanyaan Non-Likert

Pertanyaan Ya/Tidak/Tidak Tahu

  • Ya: 11 responden (36.7%)

  • Tidak: 9 responden (30%)

  • Tidak Tahu: 10 responden (33.3%)

Sebagian besar mahasiswa masih ragu atau belum puas sepenuhnya.

Isian Kendala (Top 3 Terbanyak):

  1. Lambat respon dari bagian akademik

  2. Informasi beasiswa kurang jelas

  3. Portal mahasiswa sulit diakses

Saran Terbanyak:

  • Tingkatkan kecepatan layanan dan kejelasan informasi

  • Permudah akses portal dan layanan online

  • Perjelas alur proses seperti wisuda dan revisi nilai

Menghitung otomatis dan visual

# Load library
library(readxl)
library(dplyr)
library(tidyr)
library(ggplot2)

# 1. Membaca data dari file Excel (pastikan file ini ada di folder kerja)
data <- read_excel("data_dummy_kepuasan_mahasiswa.xlsx")

# 2. Tampilkan 6 baris pertama dari data
head(data)
## # A tibble: 6 × 25
##   Fakultas  Angkatan `Persepsi Umum` Kendala Saran    Q1    Q2    Q3    Q4    Q5
##   <chr>        <dbl> <chr>           <chr>   <chr> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 Perencan…     2022 Tidak           Pelaya… Perj…     4     4     1     4     1
## 2 Lainnya       2023 Tidak           Lambat… Ting…     4     4     4     1     4
## 3 Desain P…     2023 Tidak           Lambat… Sedi…     4     2     3     2     1
## 4 Lainnya       2020 Tidak           Lambat… Perc…     4     3     5     1     4
## 5 Lainnya       2022 Tidak           Lambat… Perj…     3     1     3     4     1
## 6 Teknik P…     2024 Ya              Inform… Ting…     2     5     4     5     5
## # ℹ 15 more variables: Q6 <dbl>, Q7 <dbl>, Q8 <dbl>, Q9 <dbl>, Q10 <dbl>,
## #   Q11 <dbl>, Q12 <dbl>, Q13 <dbl>, Q14 <dbl>, Q15 <dbl>, Q16 <dbl>,
## #   Q17 <dbl>, Q18 <dbl>, Q19 <dbl>, Q20 <dbl>
# 3. Ambil hanya kolom Q1–Q20 (skala Likert)
likert_data <- data %>% select(starts_with("Q"))

# 4. Hitung rata-rata skor tiap pertanyaan
avg_scores <- colMeans(likert_data)

# 5. Buat data frame untuk visualisasi rata-rata
avg_df <- data.frame(Pertanyaan = names(avg_scores), RataRata = avg_scores)

# 6. Visualisasi rata-rata skor kepuasan
ggplot(avg_df, aes(x = Pertanyaan, y = RataRata)) +
  geom_col(fill = "steelblue") +
  ylim(1, 5) +
  geom_text(aes(label = round(RataRata, 2)), vjust = -0.5, size = 5) +
  labs(title = "Rata-rata Skor Kepuasan Mahasiswa per Pertanyaan",
       y = "Skor Rata-rata", x = "Pertanyaan") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1, size = 12),
        plot.title = element_text(size = 16, face = "bold"))

# 7. Ubah data ke format long untuk distribusi jawaban
long_likert <- likert_data %>%
  pivot_longer(cols = everything(), names_to = "Pertanyaan", values_to = "Skor")

# 8. Hitung frekuensi per skor
frekuensi <- long_likert %>%
  group_by(Pertanyaan, Skor) %>%
  summarise(Jumlah = n(), .groups = "drop")

# 9. Visualisasi distribusi skor Likert per pertanyaan
ggplot(frekuensi, aes(x = factor(Skor), y = Jumlah, fill = factor(Skor))) +
  geom_col(position = "dodge") +
  facet_wrap(~ Pertanyaan, ncol = 5) +
  labs(title = "Distribusi Jawaban Responden per Pertanyaan (Skala Likert)",
       x = "Skor Kepuasan", y = "Jumlah Responden") +
  scale_fill_brewer(palette = "Blues") +
  theme_minimal() +
  theme(strip.text = element_text(size = 12),
        axis.text.x = element_text(size = 10),
        plot.title = element_text(size = 16, face = "bold"),
        legend.position = "none")

Kesimpulan Hasil Analisis Survei

Tingkat Kepuasan Mahasiswa secara Umum

Dari grafik rata-rata skor kepuasan per pertanyaan, terlihat bahwa sebagian besar pertanyaan memiliki skor di atas 3.0, yang berarti mahasiswa umumnya merasa cukup puas hingga puas terhadap layanan akademik kampus.

Pertanyaan dengan skor rata-rata tertinggi mengindikasikan aspek layanan yang paling diapresiasi mahasiswa. Biasanya ini seperti:

  • Kemudahan akses sistem KRS

  • Kemudahan penggunaan portal mahasiswa

  • Pelayanan tata usaha fakultas

Sementara itu, pertanyaan dengan rata-rata di bawah 3.0 (jika ada) menunjukkan area yang perlu ditingkatkan.

Contoh dari data dummy bisa saja:

  • Ketersediaan layanan untuk mahasiswa berkebutuhan khusus

  • Kecepatan mendapatkan feedback nilai

Distribusi Jawaban (Skala Likert)

  • Pada grafik distribusi responden per skor, terlihat bahwa:

  • Jawaban “Puas” dan “Cukup Puas” mendominasi di hampir semua pertanyaan.

  • Jumlah responden yang memilih “Sangat Tidak Puas” atau “Tidak Puas” relatif sedikit, namun tetap muncul pada beberapa layanan tertentu.

  • Variasi distribusi menunjukkan bahwa tingkat kepuasan tidak merata antar aspek layanan, sehingga perlu perhatian lebih pada aspek-aspek yang nilainya rendah.

Rekomendasi Umum

Berdasarkan pola data dan grafik: - Pertahankan layanan yang sudah mendapat skor tinggi karena menunjukkan efektivitas sistem.

  • Fokus pada perbaikan layanan dengan skor rendah, seperti:

    • Mempercepat feedback nilai dari dosen

    • Meningkatkan akses informasi beasiswa dan program internasional

    • Menyediakan fasilitas inklusif bagi mahasiswa berkebutuhan khusus

  • Melakukan evaluasi lanjutan dengan data asli dari mahasiswa untuk hasil lebih akurat dan terpercaya.