ANALISIS DATA KUANTITATIF
Pendekatan Konseptual, Manual Statistik, dan Implementasi R untuk Riset
Sosial
Penulis: Dr. Cece Mulyadi, M.Si.
KATA PENGANTAR
Buku ini disusun sebagai jembatan antara metodologi penelitian kuantitatif dan praktik analisis data menggunakan R. Dalam banyak situasi pembelajaran, dua ranah ini sering dipisahkan: metodologi dibahas secara teoretik, sedangkan komputasi statistik diajarkan sebagai keterampilan teknis semata. Naskah ini dirancang untuk menghindari pemisahan tersebut.
Setiap bab disusun dengan pola tetap agar pembaca memperoleh alur yang konsisten:
Dengan struktur tersebut, mahasiswa, dosen, peneliti pemula, dan praktisi kebijakan diharapkan dapat menggunakan buku ini baik sebagai buku ajar, modul praktikum, maupun rujukan awal untuk penelitian kuantitatif terapan.
PETUNJUK PENGGUNAAN BUKU
Sasaran pembaca
Prasyarat dasar
Strategi belajar yang disarankan
CAPAIAN PEMBELAJARAN
Setelah mempelajari buku ini, pembaca diharapkan mampu:
BAGIAN I - FONDASI METODOLOGI KUANTITATIF
Paradigma penelitian adalah sistem keyakinan ilmiah yang membimbing peneliti dalam melihat realitas, memformulasikan pertanyaan, memilih metode, dan menafsirkan bukti empiris (Kuhn, 1962; Creswell, 2014). Dalam penelitian kuantitatif, paradigma yang dominan adalah positivisme dan post-positivisme.
Contoh:
Pendekatan kuantitatif adalah pendekatan yang mengubah fenomena sosial menjadi data numerik agar dapat dianalisis secara statistik (Babbie, 2013). Ciri utama pendekatan ini:
Pendekatan kuantitatif tepat ketika peneliti ingin:
Relasinya: paradigma memayungi teori, teori menurunkan hipotesis, metodologi memilih cara menguji hipotesis (Creswell, 2014; Kerlinger & Lee, 2000).
Paradigma -> Teori -> Model konseptual -> Hipotesis -> Desain -> Data -> Analisis -> Interpretasi
Jika salah satu mata rantai tidak sinkron, hasil penelitian berisiko bias walau secara statistik tampak signifikan.
Kasus: kepuasan layanan administrasi kampus.
Teori adalah mesin penjelasan. Dalam riset kuantitatif, teori berfungsi untuk:
Tanpa teori, analisis cenderung menjadi pencarian angka signifikan tanpa makna substantif.
Teori dipilih jika:
Topik: prestasi akademik mahasiswa.
Model: literasi digital + dukungan keluarga + motivasi belajar -> prestasi akademik.
Contoh:
Data sosial adalah representasi empiris fenomena masyarakat dalam bentuk numerik atau kategori terstruktur yang dapat dianalisis secara statistik (Babbie, 2013; Neuman, 2014). Dalam penelitian kuantitatif, data sosial tidak hanya berfungsi sebagai "bahan hitung", tetapi sebagai dasar inferensi ilmiah untuk menjawab pertanyaan kebijakan, pendidikan, kesehatan, ketenagakerjaan, dan tata kelola publik.
Kualitas data sosial ditentukan oleh:
Tabel ringkas indikator mutu data:
| Dimensi | Pertanyaan audit | Risiko jika lemah |
|---|---|---|
| Validitas | Apakah indikator sesuai konstruk teori? | Salah tafsir konsep |
| Reliabilitas | Apakah item konsisten antar responden/waktu? | Hasil tidak stabil |
| Representativitas | Apakah sampel mewakili populasi sasaran? | Generalisasi bias |
| Integritas data | Apakah perubahan data tercatat? | Replikasi gagal |
Topik yang baik harus:
Formula praktis: Isu penting + variabel terukur + data tersedia + metode layak + kontribusi jelas.
Langkah praktis:
Topik layak untuk standar buku ajar nasional jika:
Isu umum: pengangguran pemuda.
| Kriteria | Deskripsi | Skor (1-5) |
|---|---|---|
| Relevansi sosial | Tingkat urgensi isu di masyarakat | |
| Kejelasan variabel | Variabel dapat didefinisikan operasional | |
| Ketersediaan data | Data primer/sekunder dapat diperoleh | |
| Kelayakan waktu-biaya | Sesuai jadwal dan sumber daya penelitian | |
| Kelayakan analitik | Teknik statistik sesuai level data | |
| Kontribusi ilmiah | Memberi nilai tambah bagi literatur | |
| Kontribusi praktis | Bermanfaat bagi kebijakan/program |
Interpretasi skor:
Buat 3 kandidat topik kuantitatif dari isu sosial berbeda.
Nilai tiap topik dengan kriteria relevansi, keterukuran, dan kelayakan.
Pilih 1 topik terbaik disertai justifikasi.
Untuk topik terpilih, tulis:
Banyak proposal penelitian kuantitatif gagal bukan karena analisis statistiknya lemah, melainkan karena fondasi awalnya keliru: masalah penelitian tidak tajam, variabel tidak operasional, dan pertanyaan penelitian tidak selaras dengan data yang tersedia. Pada tahap proposal, kelemahan ini sering belum terlihat karena dokumen masih dipenuhi pernyataan umum yang terdengar meyakinkan. Namun, saat masuk tahap pengumpulan data dan analisis, kelemahan desain segera muncul. Akibatnya, data yang dikumpulkan tidak menjawab pertanyaan inti, hipotesis tidak dapat diuji secara valid, dan simpulan penelitian menjadi lemah.
Bab ini dirancang sebagai panduan teknis yang sangat rinci untuk memastikan peneliti mampu mengubah isu sosial yang luas menjadi masalah penelitian kuantitatif yang spesifik, terukur, dan dapat diuji. Fokus bab ini bukan sekadar definisi, tetapi keterampilan berpikir metodologis: bagaimana menyeleksi isu, memvalidasi urgensi dengan data awal, membaca celah literatur, merumuskan variabel, menulis rumusan masalah, menurunkan tujuan-pertanyaan-hipotesis, hingga memilih teknik analisis yang konsisten.
Jika bab ini dikuasai dengan baik, maka proses penelitian pada bab-bab berikutnya menjadi lebih terarah, efisien, dan bermakna. Peneliti tidak lagi sekadar “mengolah angka”, melainkan membangun argumen ilmiah berbasis data yang sahih untuk menjawab persoalan sosial secara bertanggung jawab.
Masalah penelitian kuantitatif adalah kesenjangan antara kondisi empiris dan penjelasan ilmiah yang dapat diuji menggunakan data numerik (Creswell, 2014). Kesenjangan ini dapat berupa:
Masalah penelitian kuantitatif yang baik harus memuat unsur berikut:
Masalah penelitian bukan slogan. Kalimat seperti “kualitas pendidikan rendah” atau “pengangguran pemuda tinggi” belum bisa disebut masalah penelitian kuantitatif jika belum dirumuskan menjadi hubungan antarvariabel yang dapat diukur.
Dalam praktik akademik, banyak mahasiswa mencampuradukkan istilah isu, topik, masalah, dan rumusan masalah. Padahal keempatnya berada pada level abstraksi yang berbeda.
Contoh alur transformasi:
Dengan memahami perbedaan ini, peneliti dapat menghindari proposal yang terlalu normatif dan tidak operasional.
Sebuah masalah penelitian kuantitatif disebut kuat jika memenuhi delapan kriteria berikut:
Jika satu atau lebih kriteria ini tidak terpenuhi, peneliti perlu merevisi masalah sebelum masuk ke tahap desain dan instrumen.
Masalah penelitian kuantitatif umumnya berasal dari beberapa jalur berikut.
Contoh singkat:
Langkah berikut dapat digunakan sebagai alur kerja standar.
Identifikasi isu prioritas. Pilih isu dengan urgensi sosial dan relevansi akademik.
Kumpulkan bukti awal. Gunakan data deskriptif awal dari sumber resmi untuk memvalidasi bahwa masalah benar-benar ada.
Tinjau literatur. Cari teori utama, variabel yang sering dipakai, temuan konsisten/kontradiktif, dan celah konteks.
Tentukan variabel inti. Tentukan outcome (Y), prediktor utama (X), serta variabel kontrol jika diperlukan.
Tentukan unit analisis dan populasi. Pastikan siapa yang dianalisis: individu, rumah tangga, sekolah, organisasi, atau wilayah.
Batasi konteks ruang dan waktu. Tentukan lokasi dan periode secara eksplisit.
Tulis rumusan masalah. Gunakan kalimat yang bisa langsung diturunkan menjadi pertanyaan, hipotesis, dan teknik analisis.
Lakukan uji konsistensi logis. Cek keselarasan masalah -> tujuan -> pertanyaan -> hipotesis -> metode.
Agar rumusan masalah tajam, gunakan kerangka 5W1H.
Contoh:
Tujuan penelitian harus merupakan transformasi langsung dari rumusan masalah. Jika masalah berbunyi “pengaruh X terhadap Y”, maka tujuan harus berbunyi “menguji pengaruh X terhadap Y”, bukan “mengetahui secara umum”.
Contoh tujuan umum:
Contoh tujuan khusus:
Pertanyaan penelitian adalah versi interogatif dari tujuan.
Contoh:
Pertanyaan harus jelas, terukur, dan tidak normatif.
Hipotesis kuantitatif ditulis dalam pasangan H0 dan H1.
Contoh:
Jika outcome biner, model yang sesuai adalah regresi logistik. Jika outcome kontinu, gunakan regresi linear.
Pemilihan teknik analisis harus konsisten dengan bentuk variabel dependen.
Kesalahan umum adalah menulis masalah dengan istilah “pengaruh” tetapi memilih analisis yang tidak mendukung inferensi tersebut.
Data daerah menunjukkan tingkat pengangguran lulusan SMK lebih tinggi dibanding lulusan jenjang lain. Pemerintah daerah telah menjalankan program pelatihan kerja, namun efektivitas program belum dievaluasi dengan desain kuantitatif yang memadai.
“Apakah pelatihan kerja, sertifikasi kompetensi, dan pengalaman magang berpengaruh terhadap peluang kerja formal lulusan SMK usia 18-24 tahun di Kota X pada tahun 2026?”
H01/H11, H02/H12, H03/H13 dengan arah positif untuk H1.
Regresi logistik biner dengan outcome kerja formal (1=ya, 0=tidak).
Hasil dapat menjadi dasar revisi targeting peserta pelatihan, penyesuaian kurikulum vokasi, dan integrasi sertifikasi-magang.
Kampus melaporkan rendahnya budaya baca pada mahasiswa tahun pertama.
“Apakah frekuensi kunjungan perpustakaan, akses e-book, dukungan dosen, dan beban kerja akademik berpengaruh terhadap skor minat baca mahasiswa semester 1 di Universitas X tahun ajaran 2026?”
Regresi linear berganda.
Pengguna mengeluhkan antrean layanan administrasi kependudukan.
“Apakah waktu tunggu, kejelasan prosedur, keramahan petugas, dan kemudahan kanal digital berpengaruh terhadap tingkat kepuasan pengguna layanan administrasi kependudukan di Kabupaten Z tahun 2026?”
Jika kepuasan diukur kontinu: regresi linear. Jika dikategorikan puas/tidak puas: logistik.
Penelitian memberi dasar numerik untuk redesign antrean, SOP layanan, dan integrasi kanal daring.
Masalah terlalu luas Perbaikan: batasi populasi, lokasi, periode.
Masalah normatif Perbaikan: ubah menjadi relasi variabel terukur.
Variabel belum operasional Perbaikan: tulis indikator dan skala pengukuran.
Tidak ada data awal Perbaikan: tampilkan statistik deskriptif pendukung dari sumber kredibel.
Tidak selaras dengan metode Perbaikan: tentukan outcome dulu, lalu pilih analisis sesuai tipe data.
Hipotesis tidak diturunkan dari teori Perbaikan: cantumkan teori dan mekanisme hubungan.
Tidak ada kontribusi jelas Perbaikan: pisahkan kontribusi akademik dan kontribusi kebijakan.
Mencampur banyak isu Perbaikan: fokus pada satu outcome utama dalam satu studi.
Bias bisa muncul bahkan sebelum data dikumpulkan.
Strategi mitigasi:
Sebelum proposal disahkan, gunakan matriks berikut.
| Elemen | Pertanyaan cek | Status |
|---|---|---|
| Masalah | Sudah spesifik dan terukur? | |
| Variabel | Outcome dan prediktor jelas? | |
| Unit analisis | Individu/rumah tangga/organisasi jelas? | |
| Populasi | Batas populasi tegas? | |
| Konteks | Lokasi dan periode ditulis? | |
| Tujuan | Selaras dengan masalah? | |
| Pertanyaan | Interogatif dan terukur? | |
| Hipotesis | Turunan teori dan bisa diuji? | |
| Metode | Selaras dengan tipe outcome? | |
| Kontribusi | Akademik dan praktis jelas? |
Agar layak dalam buku metodologi tingkat nasional, rumusan masalah harus memenuhi standar berikut:
Dalam konteks pengajaran, rumusan masalah sebaiknya disajikan bersama:
Rumusan masalah B: “Apakah terdapat perbedaan skor minat baca antara mahasiswa yang mengikuti program literasi kampus dan yang tidak mengikuti pada tahun 2026?”
Unit analisis: mahasiswa individu. Populasi: mahasiswa semester 1 Universitas X. Wilayah: Universitas X (Kota X). Periode: tahun akademik 2026.
Analisis:
Isu: meningkatnya obesitas remaja.
Tujuan khusus:
Hipotesis contoh:
Metode: regresi linear berganda.
Program: pelatihan kerja pemuda.
Rumusan masalah: “Apakah partisipasi pelatihan kerja, kepemilikan sertifikasi kompetensi, dan pengalaman magang meningkatkan peluang kerja formal pemuda usia 18-24 tahun di Kota X tahun 2026 setelah mengontrol pendidikan dan jenis kelamin?”
Variabel perancu:
Perbandingan metode:
Pilihan: regresi logistik.
Potensi bias dan mitigasi:
Ringkasan kebijakan (contoh singkat):
Hasil riset diharapkan menunjukkan bahwa kombinasi pelatihan, sertifikasi, dan magang berasosiasi positif dengan peluang kerja formal pemuda. Temuan ini dapat menjadi dasar redesign program pelatihan agar tidak berhenti pada pelatihan kelas, tetapi terintegrasi dengan sertifikasi kompetensi dan penempatan magang industri. Pemerintah daerah dapat memprioritaskan kelompok pemuda berisiko tinggi menganggur dengan skema intervensi berjenjang berbasis profil individu. Pendekatan ini berpotensi meningkatkan efektivitas belanja program ketenagakerjaan.
Dalam konteks kebijakan publik, penentuan masalah penelitian memiliki tuntutan tambahan dibanding penelitian akademik murni. Peneliti tidak hanya diminta membuktikan hubungan variabel, tetapi juga menilai apakah program mencapai tujuan, siapa kelompok yang paling diuntungkan, dan apakah sumber daya publik digunakan secara efektif.
Pada evaluasi kebijakan, masalah penelitian yang kuat biasanya memuat unsur berikut:
Contoh masalah evaluatif:
“Apakah program beasiswa daerah meningkatkan angka kelulusan tepat waktu mahasiswa penerima dibanding mahasiswa non-penerima di Universitas X pada periode 2024-2026?”
Masalah ini lebih kuat dibanding kalimat umum seperti “apakah beasiswa efektif”, karena menyebut indikator hasil, kelompok pembanding, unit analisis, dan periode.
Sebelum menulis rumusan masalah final, peneliti disarankan menyusun lembar justifikasi masalah berbasis data awal. Lembar ini berisi:
Contoh struktur justifikasi:
Dengan pendekatan ini, masalah penelitian tidak disusun dari asumsi subjektif, tetapi dari bukti empiris awal yang bisa dipertanggungjawabkan.
Sebelum rumusan masalah dipakai di proposal, lakukan audit cepat dengan 10 pertanyaan ya/tidak:
Interpretasi:
Perguruan tinggi Y mencatat bahwa retensi mahasiswa tahun pertama menurun. Terdapat dugaan bahwa faktor adaptasi akademik, dukungan finansial, dan keterlibatan dosen berperan terhadap keputusan mahasiswa untuk bertahan.
“Apakah dukungan finansial, keterlibatan akademik dosen, dan indeks adaptasi belajar berpengaruh terhadap retensi mahasiswa tahun pertama di Universitas Y tahun akademik 2026?”
Regresi logistik biner.
Dinas kesehatan Kota Z ingin mengetahui faktor perilaku yang paling terkait dengan risiko obesitas remaja untuk menyusun intervensi sekolah.
“Apakah pola makan tinggi kalori, rendah aktivitas fisik, dan durasi tidur pendek berpengaruh terhadap indeks massa tubuh siswa SMA di Kota Z tahun 2026?”
Regresi linear (jika IMT kontinu) atau logistik (jika obesitas dikategorikan ya/tidak).
Hasil membantu prioritas intervensi: edukasi gizi, program aktivitas fisik sekolah, atau promosi higiene tidur.
Keluhan masyarakat terhadap layanan adminduk meningkat, terutama terkait antrean dan ketidakjelasan prosedur.
“Apakah waktu tunggu, kejelasan prosedur, dan kualitas interaksi petugas memengaruhi kepuasan pengguna layanan adminduk di Kabupaten A tahun 2026?”
Temuan langsung dapat dipakai untuk desain ulang SOP layanan dan digitalisasi antrean.
Gunakan format kerja berikut sebelum menulis proposal final.
Bagian A: Formulir isu
Bagian B: Formulir masalah penelitian
Bagian C: Konsistensi logis
Bagian D: Risiko metodologis
Dokumen kerja ini memaksa peneliti berpikir runtut dan menurunkan kemungkinan mismatch antar bagian proposal.
Rubrik berikut dapat digunakan dosen untuk menilai kualitas formulasi masalah.
| Aspek | Bobot | Kriteria unggul |
|---|---|---|
| Kejelasan masalah | 20% | spesifik, tidak ambigu, terukur |
| Dukungan bukti awal | 15% | ada data deskriptif kredibel |
| Kesesuaian teori | 15% | teori menjelaskan hubungan variabel |
| Kualitas rumusan variabel | 15% | Y dan X jelas, operasional |
| Konsistensi logis | 15% | masalah-tujuan-pertanyaan-hipotesis sinkron |
| Kesesuaian metode | 10% | teknik analisis sesuai tipe data |
| Kontribusi praktis/ilmiah | 10% | manfaat nyata dan argumentatif |
Interpretasi nilai:
Tinjau 5 rumusan masalah berikut dan tentukan mana yang paling layak. Jelaskan alasan metodologis minimal 150 kata per rumusan.
Ubah tiga rumusan masalah yang terlalu umum menjadi rumusan kuantitatif yang:
Untuk topik pilihan Anda, identifikasi minimal 5 potensi bias dari tahap perumusan masalah hingga analisis awal, lalu usulkan mitigasi praktis.
Rumusan umum: “Bagaimana mengurangi stunting?”kuantitatif: “Apakah asupan protein, akses air bersih, dan frekuensi kunjungan posyandu berpengaruh terhadap status stunting balita usia 24-59 bulan di Kecamatan X tahun 2026?”
Potensi bias:
Menentukan masalah penelitian kuantitatif adalah keputusan metodologis paling strategis dalam seluruh siklus riset. Rumusan masalah yang tajam akan memandu pemilihan variabel, instrumen, teknik sampling, analisis statistik, hingga kualitas simpulan. Sebaliknya, rumusan masalah yang kabur akan membuat penelitian kehilangan arah meskipun perhitungan statistik dilakukan dengan benar.
Karena itu, peneliti perlu mendisiplinkan diri pada tiga prinsip inti:
Pada level praktik, tambahkan tiga prinsip pendukung:
Dengan prinsip-prinsip tersebut, penelitian kuantitatif tidak hanya menghasilkan angka, tetapi menghasilkan pengetahuan yang dapat dipertanggungjawabkan secara ilmiah, dapat diajarkan secara sistematis, dan bermanfaat bagi perbaikan kebijakan publik.
Bagian ini memberi panduan operasional cepat untuk memilih teknik analisis berdasarkan bentuk rumusan masalah.
Langkah 1: identifikasi bentuk pertanyaan.
Langkah 2: identifikasi tipe variabel dependen (Y).
Langkah 3: identifikasi jumlah prediktor dan tujuan inferensi.
Langkah 4: cocokkan dengan teknik analisis.
Langkah 5: cek asumsi minimum.
Jika asumsi tidak terpenuhi, lakukan strategi koreksi (transformasi, robust standard error, atau metode alternatif).
Gunakan checklist ini sebagai standar mutu akhir.
A. Substansi masalah
B. Konsistensi metodologis
C. Kelayakan operasional
D. Kualitas akademik
Interpretasi cepat:
Simulasi ini menunjukkan cara reviewer metodologi menilai kualitas masalah penelitian.
Judul awal mahasiswa: “Pengaruh pelatihan terhadap kerja.”
Catatan reviewer:
Revisi putaran 1: “Pengaruh pelatihan kerja terhadap peluang kerja lulusan SMK.”
Catatan reviewer:
Revisi putaran 2: “Apakah pelatihan kerja berpengaruh terhadap peluang kerja formal lulusan SMK usia 18-24 tahun di Kota X tahun 2026?”
Catatan reviewer:
Revisi final: “Apakah pelatihan kerja, sertifikasi kompetensi, dan pengalaman magang berpengaruh terhadap peluang kerja formal lulusan SMK usia 18-24 tahun di Kota X tahun 2026 setelah mengontrol pendidikan dan jenis kelamin?”
Penilaian akhir reviewer:
Pelajaran utama:
Gunakan latihan ini sebelum bimbingan dengan dosen pembimbing.
Menit 1-5: tulis masalah Anda dalam 1 kalimat.
Menit 6-10: tandai unsur yang sudah ada:
Menit 11-15: cek keterukuran variabel.
Tulis indikator minimum untuk tiap variabel dan jenis skala datanya.
Menit 16-20: cocokkan metode.
Pastikan tipe outcome sesuai dengan teknik analisis yang dipilih.
Menit 21-25: cek konsistensi dokumen.
Bandingkan masalah, tujuan, pertanyaan, hipotesis. Jika tidak selaras, revisi dari masalah dulu, bukan dari analisis dulu.
Menit 26-30: tulis paragraf justifikasi akhir.
Paragraf ini harus menjawab tiga pertanyaan:
Output mini-workbook:
Jika keempat output ini sudah kuat, maka proposal Anda secara metodologis sudah berada pada jalur yang benar. *** # Bab Desain Penelitian Kuantitatif
Desain penelitian kuantitatif adalah cetak biru metodologis yang menghubungkan pertanyaan penelitian, strategi pengumpulan data, dan teknik analisis statistik agar inferensi yang dihasilkan valid, reliabel, dan dapat dipertanggungjawabkan. Dalam praktik, desain penelitian bukan sekadar format proposal, melainkan keputusan strategis yang menentukan kualitas seluruh siklus riset: mulai dari penetapan populasi, penyusunan instrumen, pengambilan sampel, hingga penarikan simpulan.
Banyak penelitian gagal menghasilkan temuan kuat bukan karena software atau rumus yang salah, tetapi karena desain yang tidak konsisten dengan masalah penelitian. Misalnya, peneliti menuliskan tujuan “menguji dampak” tetapi menggunakan desain yang hanya mampu menggambarkan asosiasi; atau peneliti ingin melakukan generalisasi populasi tetapi menggunakan kerangka sampel yang tidak representatif. Kelemahan desain semacam ini tidak dapat diperbaiki sepenuhnya oleh analisis statistik di tahap akhir.
Pada level buku ajar nasional, pembahasan desain penelitian kuantitatif harus menekankan tiga prinsip inti. Pertama, keselarasan logis antara rumusan masalah, variabel, dan metode. Kedua, keterukuran operasional agar data yang dikumpulkan benar-benar relevan dengan hipotesis. Ketiga, pengendalian bias sejak tahap desain, bukan setelah data terkumpul.
Bab ini membahas secara komprehensif ragam desain kuantitatif yang umum dipakai di ilmu sosial dan kebijakan publik, termasuk desain survei, eksperimen, kuasi-eksperimen, korelasional, dan eksplanatori. Selain itu, bab ini memuat pembahasan horizon waktu, ancaman validitas, strategi mitigasi, kerangka pemilihan desain, serta contoh kasus terapan di konteks Indonesia.
Desain survei adalah desain penelitian kuantitatif yang bertujuan mengumpulkan data terstandar dari sampel untuk mengestimasi karakteristik populasi dan/atau menguji hubungan antarvariabel. Survei menjadi desain paling umum dalam penelitian sosial karena relatif efisien untuk populasi besar dan cocok untuk variabel sikap, persepsi, perilaku, serta karakteristik demografis.
Dalam desain survei, unit analisis biasanya individu, rumah tangga, atau organisasi. Data dikumpulkan melalui instrumen baku seperti kuesioner, baik secara tatap muka, telepon, daring, maupun campuran. Kekuatan desain ini terletak pada kemampuan menghasilkan data kuantitatif yang sebanding antarresponden.
Karakter utama desain survei:
Desain survei umumnya dipakai untuk:
Desain survei dapat dibedakan berdasarkan horizon waktu:
Pada praktik kebijakan, cross-sectional sering dipakai untuk diagnosis awal, sedangkan panel/repeated digunakan untuk memantau dinamika perubahan.
Kasus pendidikan:
“Survei mahasiswa semester pertama untuk mengukur hubungan literasi digital, dukungan keluarga, dan intensitas belajar terhadap IP semester.”
Kasus ketenagakerjaan:
“Survei pemuda 18-24 tahun untuk menguji faktor yang terkait dengan kerja formal, termasuk pelatihan, sertifikasi, dan pengalaman magang.”
Kasus pelayanan publik:
“Survei pengguna adminduk untuk mengukur pengaruh waktu tunggu, kejelasan prosedur, dan kualitas interaksi petugas terhadap kepuasan.”
Survei bukan pilihan terbaik jika pertanyaan penelitian menuntut identifikasi kausal yang kuat dari intervensi terkontrol, atau jika outcome lebih tepat diukur melalui observasi eksperimental. Dalam konteks ini, desain eksperimen atau kuasi-eksperimen biasanya lebih tepat.
Desain eksperimen adalah desain yang paling kuat untuk menguji hubungan sebab-akibat karena memadukan tiga elemen inti: manipulasi perlakuan, kelompok pembanding, dan randomisasi. Ketiganya menurunkan risiko bias seleksi dan meningkatkan validitas internal.
Pada eksperimen murni (true experiment), unit penelitian diacak ke kelompok perlakuan dan kontrol. Karena randomisasi, perbedaan rata-rata hasil pasca-intervensi dapat ditafsirkan lebih meyakinkan sebagai efek perlakuan, dengan asumsi tidak ada gangguan desain lain.
Bentuk umum:
Kuasi-eksperimen adalah alternatif saat randomisasi tidak memungkinkan, tetapi peneliti tetap berupaya membangun pembanding yang layak agar evaluasi dampak lebih kredibel daripada survei observasional biasa.
Bentuk umum kuasi-eksperimen:
Program pelatihan kerja diterapkan lebih dulu di Kabupaten A, sementara Kabupaten B baru menerima program tahun berikutnya. Peneliti menggunakan data sebelum-sesudah di dua kabupaten untuk mengestimasi dampak program terhadap peluang kerja formal dengan pendekatan DiD.
Walau lebih kuat dibanding observasional murni, kuasi-eksperimen tetap rentan terhadap bias seleksi tersisa, perubahan konteks eksternal, dan asumsi identifikasi yang tidak terpenuhi. Karena itu, laporan hasil harus mencantumkan uji robustness dan batas inferensi secara eksplisit.
Desain korelasional berfokus pada pengukuran derajat hubungan antarvariabel, sedangkan desain eksplanatori berfokus pada penjelasan pengaruh variabel prediktor terhadap outcome dengan model statistik tertentu.
Desain ini cocok saat tujuan penelitian adalah menguji kekuatan dan arah hubungan variabel tanpa klaim kausal murni. Misalnya, hubungan antara durasi belajar dan nilai ujian, atau hubungan kualitas tidur dan produktivitas belajar.
Kekuatan:
Keterbatasan:
Desain eksplanatori mencoba menjelaskan variasi outcome melalui kombinasi prediktor berdasarkan kerangka teori. Model yang lazim digunakan termasuk regresi linear, logistik, dan varian model multivariat lainnya.
Keunggulan desain eksplanatori:
Kelemahan:
Pada desain korelasional dan eksplanatori observasional, peneliti sebaiknya menggunakan istilah “berasosiasi” atau “berkaitan” ketika kondisi identifikasi kausal tidak kuat. Klaim “menyebabkan” harus digunakan sangat hati-hati dan didukung desain serta argumen metodologis yang memadai.
Horizon waktu adalah dimensi penting desain yang menentukan kemampuan penelitian membaca dinamika perubahan. Pemilihan horizon waktu berpengaruh langsung pada validitas inferensi.
Desain cross-sectional mengumpulkan data pada satu titik waktu. Desain ini efisien, cepat, dan umum dipakai untuk survei dasar, pemetaan kondisi, atau pengujian asosiasi awal.
Kelebihan:
Keterbatasan:
Desain longitudinal mengamati unit yang sama atau populasi sejenis pada lebih dari satu waktu. Desain ini lebih kuat untuk memotret perubahan, trajektori, dan dinamika dampak kebijakan.
Jenis longitudinal:
Kelebihan longitudinal:
Keterbatasan longitudinal:
Gunakan cross-sectional jika tujuan utama adalah diagnosis kondisi saat ini atau asosiasi awal. Gunakan longitudinal jika penelitian menuntut pemahaman perubahan perilaku, evaluasi keberlanjutan dampak, atau pembacaan tren kausal lebih meyakinkan.
Validitas adalah jantung kualitas desain. Penelitian yang analisis statistiknya canggih tetap dapat lemah jika ancaman validitas tidak dikelola sejak perencanaan.
Validitas internal menilai sejauh mana perubahan pada outcome dapat dikaitkan dengan variabel penjelas/intervensi, bukan faktor lain. Ancaman umum:
Validitas eksternal menilai sejauh mana temuan dapat digeneralisasikan ke populasi, lokasi, dan periode berbeda. Ancaman umum:
| Ancaman | Dampak | Mitigasi inti |
|---|---|---|
| Selection bias | estimasi efek bias | randomisasi/matching/kontrol kovariat |
| History effect | outcome dipengaruhi kejadian eksternal | catat kejadian, tambah pembanding |
| Instrumentation | data tidak konsisten antar fase | standar instrumen + pelatihan |
| Attrition | sampel panel tidak seimbang | strategi retensi + analisis attrition |
| Nonresponse | generalisasi lemah | follow-up, weighting, dokumentasi |
Pemilihan desain sebaiknya dilakukan secara eksplisit, bukan berdasarkan kebiasaan. Kerangka berikut dapat dipakai sebagai prosedur standar.
Tidak ada desain yang “paling baik” untuk semua situasi. Desain selalu melibatkan kompromi antara validitas internal, validitas eksternal, biaya, waktu, etika, dan akses data.
Dalam praktik kebijakan, peneliti sering menggabungkan beberapa elemen desain kuantitatif untuk memperkuat inferensi. Contoh:
Gabungan ini tetap berada dalam ranah kuantitatif sepanjang data utama bersifat numerik dan analisis inferensial tetap menjadi inti.
Pertanyaan: apakah pelatihan kerja meningkatkan peluang kerja formal?
Pilihan desain:
Rekomendasi:
Jika randomisasi tidak mungkin, gunakan kuasi-eksperimen + data pra-pasca untuk meningkatkan kekuatan inferensi.
Pertanyaan: faktor apa yang memengaruhi kepuasan layanan?
Pilihan desain:
Rekomendasi:
Gunakan survei cross-sectional untuk fase diagnosis awal, lalu ulangi periodik sebagai monitoring kualitas layanan.
Pertanyaan: apakah program literasi meningkatkan minat baca mahasiswa?
Pilihan desain:
Rekomendasi:
Untuk klaim dampak, pretest-posttest dengan kelompok pembanding lebih kuat dibanding survei satu kali.
Desain penelitian kuantitatif tidak boleh mengabaikan etika. Pertimbangan etika harus masuk sejak pemilihan desain, bukan setelah instrumen selesai.
Aspek etika utama:
Pada eksperimen sosial, pertanyaan etis yang penting: apakah adil jika sebagian peserta tidak menerima intervensi? Jika tidak adil, alternatif desain seperti stepped-wedge atau phased rollout dapat dipertimbangkan.
Agar desain dapat direplikasi, peneliti harus menulis dokumen teknis desain yang memuat:
Dokumen ini memudahkan audit metodologi dan meningkatkan kredibilitas penelitian.
Berikut kesalahan yang sangat sering muncul pada proposal kuantitatif.
Perbaikan praktis:
Gunakan checklist berikut sebelum proposal diserahkan.
Jika sebagian besar butir belum terpenuhi, revisi desain sebelum melanjutkan ke tahap sampling dan instrumen.
Template yang bisa langsung digunakan dalam proposal:
“Penelitian ini menggunakan desain [survei/eksperimen/kuasi-eksperimen/eksplanatori] karena tujuan penelitian adalah [deskriptif/komparatif/pengaruh/dampak]. Desain ini dipilih dengan mempertimbangkan [ketersediaan data, etika, sumber daya, horizon waktu]. Outcome utama berupa [tipe variabel], sehingga teknik analisis yang digunakan adalah [metode]. Ancaman validitas yang paling mungkin adalah [X, Y, Z], dengan strategi mitigasi [A, B, C].”
Template tersebut memaksa peneliti menyatakan alasan metodologis secara eksplisit, bukan sekadar menuliskan nama desain.
Isu: efektivitas pelatihan kerja pemuda.
Desain paling feasible: kuasi-eksperimen dengan pendekatan DiD.
Alasan:
Dua desain alternatif:
Skenario sumber daya ideal:
Konsekuensi: inferensi kausal lebih kuat.
Skenario sumber daya terbatas:
Konsekuensi: lebih efisien, tetapi inferensi kausal lebih lemah.
Ancaman validitas dan mitigasi:
Isu perubahan perilaku kerja pasca-pelatihan lebih tepat dengan longitudinal karena efek program biasanya tidak muncul instan dan perlu observasi lintas waktu.
Jika longitudinal terlalu mahal, repeated cross-sectional bisa dipakai sebagai kompromi untuk membaca tren agregat.
“Penelitian ini menggunakan desain kuasi-eksperimen dengan pendekatan difference-in-differences untuk menilai dampak pelatihan kerja terhadap peluang kerja formal pemuda usia 18-24 tahun. Desain ini dipilih karena randomisasi tidak memungkinkan pada program yang telah berjalan, namun data pra-pasca tersedia pada wilayah intervensi dan wilayah pembanding. Outcome penelitian bersifat biner (kerja formal: ya/tidak), sehingga analisis utama menggunakan regresi logistik yang dipadukan dengan estimasi DiD. Ancaman validitas yang dipetakan meliputi bias seleksi, efek sejarah, dan attrition; mitigasi dilakukan melalui kontrol kovariat, pencatatan kejadian eksternal, dan strategi pelacakan responden.”
Untuk memperkuat kemampuan terapan, bagian ini memberikan framework keputusan desain yang bisa dipakai peneliti atau mahasiswa saat menyusun proposal. Framework ini cocok untuk riset akademik, evaluasi program pemerintah daerah, maupun penelitian kelembagaan.
Sebelum memilih desain, jawab lima pertanyaan berikut:
Jika jawaban pada pertanyaan 2 dan 3 adalah "ya", eksperimen menjadi kandidat kuat. Jika jawabannya "tidak", kuasi-eksperimen atau desain observasional eksplanatori perlu dipertimbangkan tergantung ketersediaan pembanding dan kualitas data.
| Tujuan penelitian | Kondisi lapangan | Desain paling cocok | Catatan inferensi |
|---|---|---|---|
| Estimasi profil populasi | Sumber daya terbatas, cakupan luas | Survei cross-sectional | kuat untuk deskriptif, lemah untuk kausal |
| Uji perbedaan antar kelompok | data kelompok tersedia, tanpa intervensi | Komparatif observasional | klaim kausal terbatas |
| Prediksi outcome | banyak prediktor, data observasional | Eksplanatori (regresi) | asosiasi dengan kontrol kovariat |
| Evaluasi dampak program | randomisasi mungkin | Eksperimen | kausal paling kuat |
| Evaluasi dampak program | randomisasi tidak mungkin, ada pembanding | Kuasi-eksperimen | kausal moderat, butuh asumsi eksplisit |
| Pemantauan perubahan | ada sumber data periodik | Repeated cross-sectional/panel | baik untuk tren |
Pada level praktis, validitas sering dibahas terlalu abstrak. Bagian ini menerjemahkan validitas ke keputusan operasional yang bisa langsung diterapkan di lapangan.
Validitas konstruk berarti indikator benar-benar mewakili konsep teoritik. Dalam desain kuantitatif, validitas konstruk harus diperhatikan sejak perumusan variabel.
Contoh:
Karena desain observasional rentan confounding, peneliti perlu menggabungkan tiga strategi:
Validitas eksternal tidak otomatis tercapai hanya karena ukuran sampel besar. Sampel besar yang tidak representatif tetap menghasilkan inferensi lemah.
Praktik yang disarankan:
Validitas statistik berkaitan dengan ketepatan pengujian inferensial:
Desain yang baik perlu SOP agar eksekusi lapangan konsisten.
Pertanyaan:
"Apakah bantuan kuota internet meningkatkan kehadiran kuliah daring dan nilai akhir mahasiswa?"
Pilihan desain:
Pilihan paling realistis:
Kuasi-eksperimen phased rollout, karena kebijakan sering dilaksanakan bertahap.
Ancaman validitas:
Mitigasi:
Pertanyaan:
"Apakah digitalisasi antrean menurunkan waktu tunggu dan meningkatkan kepuasan pasien?"
Desain:- repeated cross-sectional sebelum dan sesudah digitalisasi.
Alasan:- randomisasi sulit pada layanan berjalan,- data sebelum-sesudah dapat dikumpulkan periodik.
Catatan:- untuk inferensi lebih kuat, tambahkan puskesmas pembanding yang belum digitalisasi.
Pertanyaan:
"Apakah mentoring meningkatkan retensi mahasiswa tahun pertama?"
Desain alternatif:
| Komponen | Bobot | Kriteria nilai tinggi |
|---|---|---|
| Kesesuaian desain dengan pertanyaan | 20% | desain menjawab tujuan secara langsung |
| Kekuatan inferensi | 20% | validitas internal dikelola dengan baik |
| Kelayakan implementasi | 15% | realistis waktu, biaya, akses data |
| Strategi mitigasi bias | 15% | ancaman utama dipetakan dan ditangani |
| Kualitas rencana analisis | 15% | metode sesuai tipe data dan asumsi |
| Etika penelitian | 10% | informed consent, privasi, fairness jelas |
| Replikabilitas | 5% | SOP dan dokumentasi desain lengkap |
Skor total dapat dipakai sebagai dasar keputusan:
=85: desain siap implementasi.- 70-84: revisi minor.- 55-69: revisi substansial.- <55: desain perlu dibangun ulang.
Topik: dampak pelatihan kerja pemuda terhadap kerja formal.
Desain final: kuasi-eksperimen DiD karena feasible dan memberi kekuatan inferensi lebih baik dari survei murni.
Kerangka longitudinal: - Gelombang 1: baseline pra-intervensi.- Gelombang 2: 6 bulan pasca-intervensi.- Gelombang 3: 12 bulan pasca-intervensi. Risiko attrition:- perpindahan alamat, perubahan nomor kontak, hilang minat responden. Mitigasi:- multi-contact, reminder berkala, insentif etis, tracking protocol. Analisis:- model perubahan skor antar gelombang + pemeriksaan attrition bias.
Evaluasi tanpa randomisasi: - gunakan kelompok pembanding natural,- ukur baseline comparability,- terapkan DiD/logistik sesuai outcome,- laporkan asumsi parallel trend (jika relevan),- tambah robustness checks.
Batas inferensi: "Hasil menunjukkan asosiasi dampak program yang konsisten pada beberapa spesifikasi model, namun interpretasi kausal tetap mempertimbangkan kemungkinan bias seleksi tersisa dan faktor eksternal yang tidak terukur."
Sebelum proposal memasuki tahap pengumpulan data, disarankan melakukan audit desain pra-implementasi. Audit ini merupakan "uji ketahanan" untuk memastikan desain yang tertulis benar-benar bisa dijalankan di lapangan.
Aspek audit yang perlu diperiksa:
Jika lebih dari tiga butir tidak terpenuhi, desain sebaiknya direvisi sebelum implementasi.
Bagian ini penting karena dalam praktik, desain tidak selalu berjalan sesuai rencana.
Dampak:
Respon perbaikan:
Dampak:
Respon perbaikan:
Dampak:
Respon perbaikan:
Dampak:
Respon perbaikan:
Dampak:
Respon perbaikan:
Template ini dapat digunakan untuk menilai kualitas proposal mahasiswa atau naskah riset kebijakan.
Komponen penilaian:
Kecocokan desain dengan tujuan penelitian.- Ketepatan horizon waktu.- Kekuatan strategi mitigasi validitas.- Kesesuaian rencana analisis.- Kelayakan implementasi lapangan.- Kualitas rencana dokumentasi dan replikasi. Contoh komentar reviewer yang konstruktif:
"Desain sudah selaras dengan pertanyaan, tetapi strategi mitigasi nonresponse belum operasional."- "Pilihan kuasi-eksperimen tepat, namun asumsi identifikasi perlu dituliskan eksplisit dan diuji."- "Rencana analisis sudah sesuai outcome, tetapi variabel kontrol belum memiliki justifikasi teori yang cukup." Komentar semacam ini membantu peneliti memperbaiki desain secara teknis, bukan sekadar mengganti istilah.
Agar pembelajaran metodologi utuh, Bab 6 harus dihubungkan dengan bab-bab berikut:
Jika Bab 6 memilih desain longitudinal, maka bab sampling harus menyiapkan strategi retensi, bab instrumen harus stabil antar gelombang, dan bab analisis harus mengakomodasi data berulang.
Untuk memudahkan implementasi, ringkas Bab 6 menjadi sepuluh keputusan teknis:
Jika sepuluh keputusan ini diterapkan, kualitas studi kuantitatif meningkat signifikan meski sumber daya penelitian terbatas.
Tidak. Desain terbaik adalah desain yang paling selaras dengan pertanyaan penelitian, kondisi lapangan, kualitas data, dan tujuan inferensi. Desain sederhana tetapi konsisten sering menghasilkan temuan lebih kredibel daripada desain kompleks yang dipaksakan.
Boleh, selama batas inferensinya dinyatakan jelas. Pada studi observasional, istilah yang lebih aman biasanya "berasosiasi" atau "berkaitan", kecuali ada strategi identifikasi yang memperkuat klaim kausal.
Gunakan desain kuasi-eksperimen dengan kelompok pembanding yang layak, data pra-pasca, dan kontrol kovariat berbasis teori. Tambahkan uji robustness agar hasil lebih tahan terhadap alternatif spesifikasi.
Sangat penting. Pilot test membantu mengecek keterbacaan item, durasi wawancara, konsistensi jawaban, dan potensi miskonsepsi responden. Melewati pilot test meningkatkan risiko kesalahan pengukuran.
Sulit. Generalisasi temuan kurang bermakna bila estimasi dasar pada studi itu sendiri tidak kuat. Karena itu, validitas internal tetap prioritas awal.
Versi awal: "Penelitian ini bertujuan mengetahui pengaruh digitalisasi layanan terhadap kepuasan masyarakat."
Masalah pada versi awal: - desain belum disebut,- outcome belum operasional,- horizon waktu tidak jelas,- ancaman validitas belum dibahas.
Versi revisi 1: "Penelitian menggunakan survei cross-sectional untuk menganalisis hubungan digitalisasi layanan dan kepuasan pengguna adminduk di Kabupaten A tahun 2026."
Perbaikan: - desain jelas,- populasi, lokasi, dan periode jelas,- hubungan variabel lebih operasional.
Versi revisi 2: "Penelitian menggunakan repeated cross-sectional sebelum dan sesudah digitalisasi layanan pada tahun 2025-2026 untuk menganalisis perubahan waktu tunggu dan kepuasan pengguna adminduk di Kabupaten A, serta membandingkannya dengan Kabupaten B sebagai pembanding."
Perbaikan lanjutan: - horizon waktu lebih kuat,- ada elemen pembanding,- nilai inferensi kebijakan meningkat.
Pelajaran utama: - kualitas desain naik melalui revisi bertahap,- reviewer metodologi menilai detail operasional, bukan istilah umum,- setiap revisi desain harus memperjelas siapa, di mana, kapan, dan bagaimana hubungan diuji.
Untuk pengajaran metodologi, Bab 6 idealnya digunakan dalam dua mode: mode konseptual dan mode studio desain. Pada mode konseptual, dosen menekankan logika pemilihan desain, validitas, serta batas inferensi. Pada mode studio desain, mahasiswa diminta merancang desain untuk isu nyata lalu diuji dengan rubrik dan skenario gangguan lapangan. Untuk riset institusional, format yang sama dapat dipakai oleh unit mutu akademik, dinas daerah, dan lembaga evaluasi program agar keputusan metodologis tidak semata didorong oleh kemudahan data, tetapi oleh kualitas inferensi yang ditargetkan.
Sebelum survei dimulai, tim peneliti perlu menjalankan audit sampling agar desain di atas kertas benar-benar dapat dieksekusi di lapangan. Audit ini sangat penting pada studi kebijakan publik karena konsekuensi pengambilan keputusan bisa besar jika estimasi populasi bias.audit yang disarankan:
Checklist audit praktis:
Jika lebih dari dua butir di atas tidak terpenuhi, sebaiknya jadwal lapangan ditunda sampai audit dipenuhi.
Pada riset lapangan, keputusan sampling berhubungan langsung dengan biaya, waktu, dan kualitas data. Peneliti perlu menghitung trade-off, bukan hanya ukuran sampel teoritik.trade-off:
Pendekatan praktis alokasi sumber daya:
Rumus sederhana perencanaan biaya:
\[\text{Total biaya} = (\text{biaya listing}) + (\text{biaya wawancara} \times n_{kontak}) + (\text{biaya supervisi})\]_kontak harus memperhitungkan nonresponse, bukan hanya n efektif.
Agar penelitian dapat direplikasi, peneliti wajib menyiapkan dokumentasi sampling berikut:
Dokumentasi ini harus disimpan bersama codebook dan script analisis. Tanpa dokumentasi sampling yang lengkap, hasil studi sulit diaudit dan kepercayaan terhadap inferensi menurun.
Nonresponse bias sering menjadi penyebab utama lemahnya generalisasi. Mitigasi sebaiknya dirancang sejak awal, bukan setelah data terkumpul.pencegahan:
Strategi koreksi setelah pengumpulan:
Prinsip pelaporan: penelitian harus menyebutkan response rate, prosedur callback, dan langkah penyesuaian agar pembaca dapat menilai kualitas estimasi.
Bisa untuk pemetaan awal populasi tersembunyi, tetapi tidak ideal sebagai dasar estimasi prevalensi populasi umum tanpa metode koreksi yang memadai.
Ketika subkelompok kecil penting untuk analisis kebijakan (misalnya disabilitas, wilayah terpencil, atau kelompok risiko tinggi), oversampling dapat meningkatkan ketepatan estimasi kelompok tersebut.
Tidak. Stratified sampling berbasis probabilitas dalam setiap strata. Quota sampling hanya memastikan jumlah responden per kategori, tetapi pemilihan di dalam kategori sering tidak acak.
Peneliti dapat melakukan listing lapangan, area sampling, atau rancangan bertahap berbasis blok wilayah. Jika tetap memakai non-probability, keterbatasan generalisasi harus dinyatakan jelas.
Untuk estimasi populasi biasanya perlu. Untuk model inferensial, keputusan penggunaan bobot tergantung tujuan analitik dan sifat desain; namun pada survei kompleks, pendekatan survey-weighted umumnya lebih tepat.
Diberikan studi dengan desain berikut: convenience sampling 300 responden pengguna layanan publik, lalu hasilnya digeneralisasikan ke seluruh kabupaten. Identifikasi minimal 5 kelemahan metodologis dan usulkan perbaikan.
Topik: faktor ketidakaktifan peserta JKN di kabupaten.dua rancangan: - desain ideal (sumber daya tinggi),- desain realistis (sumber daya sedang).kekuatan inferensi dan risiko bias tiap rancangan.
Sebagai reviewer, nilai proposal sampling berikut:"Sampel dipilih secara acak dari masyarakat sebanyak 500 orang." kritik teknis minimal 10 poin dan tulis versi revisi paragraf metode sampling yang lebih kuat.
Kelemahan utama:
Desain ideal: - stratified multistage probability sampling,- oversampling kelompok rentan,- weighting lengkap. realistis: - cluster sampling kecamatan-desa-rumah tangga,- penguatan kontrol nonresponse. Kekuatan inferensi ideal lebih tinggi, tetapi biaya lebih besar.
Kritik reviewer: - "acak" tidak menjelaskan frame,- tidak jelas unit analisis,- tidak jelas level wilayah,- tidak jelas tahap sampling,- tidak jelas nonresponse plan,- tidak jelas bobot,- tidak jelas design effect,- tidak jelas prosedur substitusi,- tidak jelas kontrol kualitas,- tidak jelas batas inferensi. Versi revisi harus menyebut: populasi, frame, teknik sampling, tahapan, ukuran sampel, penyesuaian nonresponse, dan pendekatan analisis.
Desain penelitian kuantitatif adalah keputusan metodologis yang menentukan ketahanan inferensi. Desain yang tepat tidak selalu yang paling kompleks, tetapi yang paling selaras dengan pertanyaan penelitian, jenis data, keterbatasan etika-operasional, dan tujuan inferensi. Peneliti yang disiplin pada tahap desain akan lebih mudah menyusun instrumen, mengelola data, dan menafsirkan hasil secara kredibel.
Dalam praktik pembelajaran, penguasaan desain penelitian perlu dilatih melalui simulasi keputusan desain, evaluasi kasus nyata, dan audit validitas. Dengan demikian, mahasiswa atau peneliti pemula tidak hanya hafal jenis desain, tetapi mampu memilih desain terbaik untuk persoalan sosial yang konkret.
Pada akhirnya, kualitas penelitian kuantitatif dimulai dari kualitas desain. Jika desain kuat, data lebih bermakna; jika data bermakna, kebijakan yang disarankan pun lebih tepat sasaran. ***
BAGIAN II - POPULASI, SAMPEL, DAN INSTRUMEN
Dalam penelitian kuantitatif, kualitas kesimpulan sangat ditentukan oleh bagaimana peneliti mendefinisikan populasi, menyusun kerangka sampel, dan memilih teknik sampling. Banyak penelitian terlihat rapi pada tahap analisis statistik, tetapi simpulannya lemah karena sampel tidak representatif, unit analisis tidak konsisten, atau prosedur pemilihan responden tidak transparan. Karena itu, pembahasan sampling bukan bagian teknis kecil, melainkan fondasi inferensi.
Bab ini membahas secara menyeluruh konsep populasi, unit analisis, kerangka sampel, probability sampling, non-probability sampling, ukuran sampel, kesalahan sampling, hingga rancangan multistage untuk konteks lapangan Indonesia. Materi disusun agar dapat digunakan sebagai referensi kelas metodologi, panduan proposal skripsi/tesis, dan pedoman riset kebijakan daerah.
Populasi adalah keseluruhan elemen yang menjadi sasaran inferensi penelitian. Elemen populasi dapat berupa individu, rumah tangga, organisasi, sekolah, desa, kecamatan, atau entitas lain sesuai pertanyaan penelitian. Intinya, populasi menjawab pertanyaan “siapa yang ingin kita ketahui karakteristiknya”.
Unit analisis adalah entitas yang dianalisis dalam model statistik. Dalam banyak penelitian sosial, unit analisis sering berupa individu. Namun, tidak selalu demikian. Jika topik berkaitan dengan kinerja sekolah, unit analisis bisa sekolah. Jika topik berkaitan dengan kapasitas pemerintahan lokal, unit analisis bisa desa atau kecamatan.
Perlu dibedakan antara unit analisis dan unit observasi. Unit observasi adalah entitas dari mana data dikumpulkan. Unit analisis adalah entitas yang menjadi dasar inferensi. Keduanya bisa sama, bisa juga berbeda.
Contoh:
Penelitian tentang kepuasan pasien puskesmas. Unit observasi: pasien. Unit analisis: pasien.
Penelitian tentang kualitas sekolah. Unit observasi: siswa, guru, kepala sekolah. Unit analisis: sekolah.
Jika unit analisis tidak konsisten sejak awal, hasil analisis dapat mengalami kesalahan interpretasi. Misalnya, data dikumpulkan dari individu tetapi simpulan ditarik pada level organisasi tanpa agregasi yang benar.
Dalam praktik, ada tiga konsep yang harus dibedakan:
Contoh:
Topik: perilaku pencarian kerja pemuda 18-24 tahun di provinsi tertentu.
Membedakan tiga level ini penting agar peneliti jujur terhadap batas generalisasi.
Kerangka sampel adalah daftar elemen populasi yang dapat diakses untuk penarikan sampel. Kerangka sampel bisa berupa daftar rumah tangga, daftar siswa, daftar peserta program, daftar sekolah, daftar UMKM, atau daftar wilayah administratif.
Kualitas kerangka sampel sangat menentukan representativitas. Kerangka yang buruk akan menghasilkan bias bahkan jika rumus dan software analisis sangat canggih.
Sebelum sampling, lakukan audit singkat:
Jika audit menunjukkan masalah serius, peneliti wajib memperbaiki kerangka atau menyatakan keterbatasan inferensi secara eksplisit.
Probability sampling adalah teknik sampling di mana setiap elemen populasi memiliki peluang terpilih yang diketahui (dan tidak nol). Teknik ini adalah fondasi utama untuk generalisasi statistik dari sampel ke populasi.
Simple random sampling (SRS) memilih elemen secara acak murni dari kerangka sampel. Setiap elemen memiliki peluang yang sama untuk dipilih.
Kelebihan:
Keterbatasan:
Contoh:
Dari daftar 10.000 mahasiswa, dipilih 400 mahasiswa menggunakan random number generator.
Systematic sampling memilih elemen dengan interval tetap setelah titik awal acak.
Langkah:
Kelebihan:
Risiko:
Stratified sampling membagi populasi ke dalam strata homogen (misal jenis kelamin, wilayah, sekolah negeri/swasta), lalu sampling dilakukan dalam setiap strata.
Tujuan utama stratifikasi:
Jenis alokasi sampel strata:
Kelebihan:
Keterbatasan:
Cluster sampling memilih unit kelompok (misal desa/sekolah) sebagai langkah awal, lalu memilih elemen di dalam cluster. Multistage sampling adalah versi bertahap dari cluster sampling, sering dipakai pada survei skala wilayah luas.
Contoh multistage:
Kelebihan:
Keterbatasan:
Non-probability sampling adalah teknik sampling yang tidak memberikan peluang terpilih yang diketahui untuk setiap elemen populasi. Teknik ini sering dipakai ketika kerangka sampel tidak tersedia, populasi sulit dijangkau, atau studi bersifat eksploratif.
Purposive sampling memilih responden berdasarkan kriteria tertentu yang relevan dengan tujuan penelitian.
Contoh:
Memilih hanya kepala sekolah yang sudah menerapkan kurikulum tertentu minimal dua tahun.
Quota sampling menetapkan kuota karakteristik tertentu (misal gender, wilayah), lalu enumerator memilih responden sampai kuota terpenuhi.
Kelebihan:
Keterbatasan:
Snowball sampling dimulai dari responden awal (seed), lalu responden tersebut merekomendasikan responden berikutnya.
Cocok untuk populasi tersembunyi seperti pekerja informal tertentu atau komunitas yang sulit diakses.
Keterbatasan:
Convenience sampling mengambil responden yang paling mudah dijangkau.
Teknik ini paling lemah untuk generalisasi dan sebaiknya digunakan untuk studi pendahuluan atau pilot.
Non-probability sampling dapat diterima jika:
Pada laporan akhir, keterbatasan generalisasi wajib dinyatakan tegas.
Menentukan ukuran sampel tidak boleh dilakukan sembarangan. Sampel terlalu kecil membuat penelitian kehilangan power untuk mendeteksi efek yang nyata. Sampel terlalu besar dapat memboroskan sumber daya tanpa peningkatan manfaat yang proporsional.
Pendekatan ringkas yang sering digunakan dalam riset terapan:
\[ n = \frac{N}{1 + N e^2} \]
dengan:
Contoh N = 1500, e = 0.05:
\[ n = \frac{1500}{1 + 1500(0.05)^2} = \frac{1500}{4.75} \approx 316 \]
Pendekatan ini praktis, tetapi bersifat simplifikasi. Untuk penelitian inferensial ketat, disarankan pendekatan berbasis power.
Untuk estimasi proporsi dengan populasi besar:
\[ n_0 = \frac{Z^2 p(1-p)}{e^2} \]
Jika populasi terbatas, gunakan finite population correction:
\[ n = \frac{n_0}{1 + \frac{n_0 - 1}{N}} \]
Power analysis mempertimbangkan:
Keunggulan power analysis:
Ukuran sampel final harus disesuaikan dengan perkiraan nonresponse.
Jika response rate diperkirakan 80%, maka:
\[ n_{final} = \frac{n_{target}}{0.8} \]
Contoh n_target = 400:
\[ n_{final} = 500 \]
Artinya peneliti harus mengontak lebih banyak responden agar sampel efektif tercapai.
Pada sampling berkelompok, varians meningkat karena kemiripan responden dalam cluster. Penyesuaian dapat dilakukan dengan design effect (deff):
\[ n_{adj} = n \times deff \]
Jika deff = 1.5 dan n awal 400, maka n_adj = 600.
# Slovin
N <- 1500
e <- 0.05
n_slovin <- N / (1 + N * e^2)
n_slovin
## [1] 315.7895
# Penyesuaian nonresponse
response_rate <- 0.80
n_final <- n_slovin / response_rate
n_final
## [1] 394.7368
# Penyesuaian design effect
deff <- 1.5
n_cluster_adj <- n_slovin * deff
n_cluster_adj
## [1] 473.6842
Dalam desain kompleks (stratifikasi disproporsional, multistage), pembobotan dibutuhkan agar estimasi kembali mencerminkan populasi.
Prinsip umum bobot dasar:
\[ w_i = \frac{1}{\pi_i} \]
dengan \(\pi_i\) adalah probabilitas terpilih unit ke-i.
Bobot dapat disesuaikan untuk nonresponse dan kalibrasi distribusi populasi (post-stratification). Tanpa bobot yang tepat, estimasi populasi dapat bias.
Kualitas sampel dipengaruhi dua jenis kesalahan.
Sampling error adalah variasi alami karena hanya sebagian populasi diamati. Ini bisa dihitung dan dinyatakan dalam standard error atau interval kepercayaan.
Non-sampling error meliputi:
Pada praktik lapangan, non-sampling error sering lebih besar dampaknya dibanding sampling error. Karena itu, quality control tidak boleh diabaikan.
Berikut contoh skema multistage yang realistis untuk survei rumah tangga tingkat kabupaten.
Langkah perancangan:
Keuntungan desain ini:
Catatan penting:
Untuk meningkatkan kualitas inferensi dari sampel ke populasi, lakukan strategi berikut:
Sampling bukan sekadar prosedur statistik, tetapi juga keputusan etis. Kelompok rentan sering terabaikan jika kerangka sampel buruk atau prosedur lapangan tidak sensitif konteks.
Prinsip etika sampling:
Prinsip inklusivitas:
Gunakan alur keputusan berikut:
Tujuan: mengestimasi proporsi siswa dengan literasi digital memadai di tingkat kabupaten.
Desain sampling:
Alasan: menjamin representasi wilayah sekaligus efisiensi lapangan.
Tujuan: menilai faktor risiko hipertensi rumah tangga.
Desain sampling:
Alasan: populasi luas, biaya harus terkendali.
Tujuan: menguji faktor yang memengaruhi peluang kerja formal pemuda.
Desain sampling:
Catatan: jika oversampling dilakukan, pembobotan wajib diterapkan saat estimasi populasi.
Stratified sampling membagi populasi ke strata homogen lalu mengambil sampel dari setiap strata untuk meningkatkan presisi dan keterwakilan subkelompok. Cluster sampling memilih kelompok alami (cluster) untuk efisiensi logistik ketika populasi tersebar luas. Stratifikasi biasanya menurunkan varians jika strata relevan, sedangkan cluster cenderung menaikkan varians sehingga perlu design effect.
Gunakan rumus Slovin:
\[ n = \frac{4200}{1 + 4200(0.04)^2} = \frac{4200}{1 + 6.72} = \frac{4200}{7.72} \approx 544 \]
Jadi kebutuhan sampel efektif sekitar 544 responden.
Jika response rate 75%:
\[ n_{awal} = \frac{544}{0.75} \approx 725 \]
Artinya peneliti harus menargetkan sekitar 725 kontak agar memperoleh 544 responden efektif.
Contoh multistage kabupaten:
Non-probability sampling dapat diterima untuk studi eksplorasi populasi tersembunyi ketika frame tidak tersedia, misalnya snowball pada komunitas pekerja informal spesifik. Batas inferensi: temuan tidak boleh digeneralisasikan ke seluruh populasi tanpa kehati-hatian tinggi.
Contoh checklist audit frame:
Pada penelitian skala kelas maupun riset kebijakan daerah, kualitas sampling ditentukan bukan hanya oleh desain awal, tetapi oleh kualitas implementasi harian di lapangan. Quality assurance sampling harus berjalan sejak hari pertama pengumpulan data.
Komponen quality assurance minimum:
Jika quality assurance lemah, penelitian bisa mengalami dua masalah besar: sampel menyimpang dari desain, dan data final tidak lagi mencerminkan populasi target.
Response rate sebaiknya tidak dipantau sebagai angka tunggal. Pantau per strata agar peneliti dapat melihat ketimpangan representasi.
Contoh:
Jika ketimpangan ini diabaikan, estimasi agregat bisa terlalu dipengaruhi strata dengan respons tinggi. Tindakan korektif dapat berupa callback tambahan, re-visit dengan jadwal berbeda, atau penambahan enumerator lokal.
Dalam systematic sampling, kesalahan umum adalah enumerator tidak mematuhi interval yang ditetapkan karena tekanan waktu. Audit supervisor harus memeriksa:
Audit ini sebaiknya dilakukan harian, bukan di akhir survei.
Back-check adalah verifikasi ulang sebagian responden untuk menilai kualitas wawancara. Praktik umum:
Jika ketidaksesuaian tinggi, lakukan re-training enumerator dan evaluasi potensi pengulangan wawancara pada cluster terkait.
Tidak semua populasi mudah didekati dengan desain klasik. Pada populasi tertentu, sampling memerlukan penyesuaian strategi.
Contoh: pekerja platform, pekerja musiman, migran sementara.
Tantangan:
Strategi:
Contoh: penyandang disabilitas, kelompok minoritas kecil, lansia tanpa akses digital.
Tantangan:
Strategi:
Contoh: sekolah, puskesmas, kantor layanan publik.
Dalam populasi institusional, desain sampling sering dua tingkat:
Peneliti harus memperhitungkan korelasi intrakelas (intra-cluster correlation) karena responden dalam institusi sama cenderung mirip.
Dalam evaluasi program, sampling harus mendukung komparasi yang valid antara kelompok intervensi dan pembanding.
Langkah:
Risiko utama:
Mitigasi:
Kualitas sampling tidak dapat dipisahkan dari manajemen data. Setiap unit sampel harus memiliki jejak data yang jelas dari frame awal hingga dataset akhir.
Komponen wajib:
Dengan struktur ini, tim dapat menghitung response rate yang akurat, menilai bias nonresponse, dan mengaudit deviasi sampling.
Setiap status harus memiliki definisi operasional yang konsisten agar laporan field tidak ambigu.
Banyak naskah gagal pada bagian metode karena sampling dijelaskan terlalu singkat. Untuk standar buku dan jurnal nasional, bagian sampling setidaknya menjawab pertanyaan berikut:
Contoh paragraf pelaporan yang baik:
“Populasi target penelitian ini adalah seluruh rumah tangga di Kabupaten X tahun 2026. Kerangka sampel menggunakan daftar rumah tangga hasil pemutakhiran desa tahun 2025. Teknik sampling yang digunakan adalah multistage probability sampling: pemilihan kecamatan secara PPS, pemilihan desa secara acak sederhana, dan pemilihan rumah tangga secara systematic random sampling. Ukuran sampel efektif ditetapkan 600 rumah tangga, kemudian disesuaikan dengan perkiraan response rate 80% sehingga target kontak menjadi 750 rumah tangga. Analisis menggunakan bobot desain dan penyesuaian nonresponse.”
Masalah: daftar frame memiliki 12% duplikasi.
Dampak:
Koreksi:
Masalah: 25% unit sampel diganti tanpa prosedur.
Dampak:
Koreksi:
Masalah: strata minoritas underrepresented.
Dampak:
Koreksi:
Template ini dapat langsung dipakai pada proposal skripsi/tesis atau riset lembaga.
Bagian A: Populasi dan unit analisis
Bagian B: Kerangka sampel
Bagian C: Teknik sampling
Bagian D: Quality control
Bagian E: Batas inferensi
Jawaban nomor 2:
Interpretasi: semakin rendah response rate yang diperkirakan, semakin besar kebutuhan sumber daya lapangan.
Jawaban nomor 4 (contoh paragraf):
“Hasil penelitian ini digeneralisasikan pada populasi yang tercakup dalam kerangka sampel. Karena kerangka diketahui belum mencakup sekitar 8% kelompok rentan tertentu, estimasi pada kelompok tersebut perlu ditafsirkan secara hati-hati. Potensi undercoverage telah diminimalkan melalui listing tambahan di wilayah prioritas, namun bias residual tetap mungkin terjadi.” ## Pendalaman final: perencanaan ukuran sampel berbasis skenario
Dalam praktik penelitian terapan, ukuran sampel sebaiknya direncanakan dengan pendekatan skenario, bukan satu angka tunggal. Pendekatan skenario membantu tim memahami dampak perubahan asumsi terhadap kebutuhan sumber daya.
Misal populasi 10.000 orang. Jika peneliti memilih margin error 5%, ukuran sampel akan jauh lebih kecil dibanding margin error 3%. Konsekuensinya:
Skenario semacam ini harus dibahas sejak proposal agar keputusan metodologis konsisten dengan kapasitas tim.
Pada cluster sampling, variasi deff sangat mungkin terjadi. Peneliti sebaiknya menyiapkan tiga skenario:
Jika hasil akhir menunjukkan deff lebih tinggi dari prediksi, sampel efektif bisa menurun tajam. Dengan skenario awal, tim dapat menyiapkan cadangan responden.
Response rate aktual sering lebih rendah dari rencana. Karena itu, ukuran kontak awal harus dihitung dengan beberapa skenario:
Rencana ini menghindari situasi di mana lapangan berhenti sebelum sampel efektif tercapai.
Banyak penelitian kebijakan membutuhkan hasil per subkelompok, misalnya laki-laki vs perempuan, urban vs rural, atau penerima vs non-penerima program. Jika kebutuhan ini tidak dirancang sejak awal, analisis subkelompok sering tidak stabil.
Topik: kepuasan layanan digital pemerintah daerah.
Jika daerah ingin tahu gap kepuasan urban-rural, maka desain sampling harus memastikan responden rural cukup, bukan sekadar mengikuti proporsi umum sampel total.
Pada riset kebijakan, indikator yang dilaporkan harus sinkron dengan desain sampling. Jika desain hanya representatif tingkat kabupaten, maka hasil tidak boleh dipaksakan untuk menyimpulkan tingkat kecamatan tanpa kehati-hatian tambahan.
Aturan pelaporan:
Contoh pelaporan benar:
“Estimasi mewakili tingkat kabupaten, bukan estimasi resmi per kecamatan.”
Contoh pelaporan bermasalah:
“Hasil ini menunjukkan kondisi seluruh kecamatan,” padahal desain tidak mendukung inferensi per kecamatan.
Substitusi responden sering tak terhindarkan, tetapi harus dikontrol ketat.
Protokol substitusi yang disarankan:
Tanpa protokol ini, substitusi dapat mengubah desain probabilistik menjadi convenience terselubung.
Untuk penelitian berulang (repeated survey/panel), harmonisasi sampling antar gelombang penting agar tren dapat dibandingkan secara sahih.
Aspek harmonisasi:
Jika perubahan metodologi terpaksa dilakukan, laporkan secara transparan dan jelaskan dampaknya pada komparabilitas hasil.
Metadata sampling adalah catatan teknis yang menjelaskan bagaimana sampel dibangun. Metadata ini sering diabaikan, padahal sangat penting untuk audit dan replikasi.
Metadata minimum:
Tanpa metadata, penelitian menjadi sulit ditinjau ulang oleh reviewer atau pengguna data sekunder.
Laporan akhir sebaiknya tidak hanya memuat ukuran sampel, tetapi juga indikator kualitas sampling berikut:
Dengan indikator ini, pembaca dapat menilai kredibilitas inferensi secara objektif.
Gunakan rubrik 1-5 untuk menilai kesiapan tim sebelum lapangan.
Aspek yang dinilai:
Interpretasi:
Topik: faktor akses layanan kesehatan primer.
Desain A: SRS dari daftar rumah tangga kabupaten.
Desain B: stratified-cluster.
Desain C: convenience di fasilitas kesehatan.
Pilihan terbaik untuk kebijakan kabupaten umumnya B, karena menyeimbangkan kualitas inferensi dan efisiensi operasional.
Jawaban yang kuat biasanya memiliki ciri berikut:
Jika paragraf metode belum memuat lima unsur itu, metode sampling perlu direvisi sebelum penelitian dijalankan. ## Ringkasan strategis implementasi sampling
Sebagai penutup teknis sebelum kesimpulan, bagian ini merangkum pesan operasional yang paling penting untuk implementasi sampling di lapangan.
Pertama, sampling harus diperlakukan sebagai proses end-to-end, bukan langkah tunggal. Proses dimulai dari definisi populasi, dilanjutkan dengan validasi kerangka sampel, pemilihan teknik sampling yang sesuai, penyesuaian ukuran sampel, hingga audit kualitas selama pengumpulan data.
Kedua, kualitas inferensi tidak pernah melebihi kualitas sampling. Peneliti tidak bisa mengompensasi kerangka sampel buruk dengan model statistik rumit. Oleh karena itu, investasi terbesar pada awal penelitian sebaiknya difokuskan pada perbaikan frame, SOP pemilihan responden, dan kontrol nonresponse.
Ketiga, pada desain kompleks, dokumentasi adalah syarat mutlak. Semua keputusan sampling harus tercatat: aturan pemilihan unit, probabilitas tiap tahap, alasan substitusi, hingga formula bobot. Dokumentasi ini bukan beban administratif, tetapi fondasi transparansi ilmiah.
Keempat, sampling yang baik selalu mempertimbangkan inklusivitas. Kelompok kecil, rentan, atau sulit dijangkau harus dipikirkan sejak desain, bukan setelah data terkumpul. Jika tidak, hasil penelitian bisa “rapi” secara statistik tetapi bias secara sosial.
Kelima, pelaporan sampling harus jujur tentang batas inferensi. Jika desain hanya mewakili tingkat kabupaten, jangan mengeklaim kesimpulan tingkat kecamatan. Jika nonresponse tinggi, nyatakan dampaknya. Sikap ini memperkuat kredibilitas riset.
Akhirnya, untuk konteks pembelajaran nasional, keterampilan sampling harus dilatih berulang melalui praktik desain, simulasi gangguan lapangan, dan audit proposal. Peneliti yang terbiasa melakukan evaluasi sampling sejak awal akan menghasilkan penelitian yang lebih kuat, lebih replikabel, dan lebih berguna untuk perumusan kebijakan berbasis data. ## Catatan implementasi akhir untuk tim penelitian
Saat penelitian masuk fase operasional, tim sebaiknya mengadakan rapat sampling harian singkat dengan agenda tetap: progres capaian sampel, distribusi respon per strata, deviasi prosedur, dan rencana korektif esok hari. Rapat ini sederhana tetapi efektif mencegah penyimpangan desain yang sering luput jika evaluasi hanya dilakukan di akhir minggu.
Selain itu, tim perlu menyiapkan dashboard internal minimal yang menampilkan jumlah target, jumlah kontak, complete interview, refusal, non-contact, dan substitusi. Dengan dashboard ini, keputusan lapangan dapat berbasis data harian, bukan asumsi. Jika satu strata tertinggal, tim bisa segera menambah callback atau mengalokasikan enumerator tambahan.
Di tahap penulisan laporan, sertakan lampiran alur sampel (sample flow) dari frame awal hingga dataset final. Lampiran ini akan sangat membantu pembaca, reviewer, dan pengguna data memahami bagaimana sampel terbentuk dan seberapa kuat generalisasi hasil penelitian. Paragraf tambahan ini menegaskan bahwa keputusan sampling harus terus dievaluasi sampai tahap pelaporan akhir, karena kualitas inferensi populasi tidak ditentukan sekali di awal, melainkan dipelihara sepanjang siklus penelitian, mulai desain, lapangan, hingga analisis dan interpretasi. ## Penutup
Sampling adalah jembatan antara data lapangan dan kesimpulan populasi. Jembatan ini hanya kuat jika tiga komponen bekerja bersama: definisi populasi yang tepat, kerangka sampel yang berkualitas, dan teknik sampling yang selaras dengan tujuan inferensi.
Penelitian dengan teknik sampling yang baik akan lebih kredibel, lebih mudah direplikasi, dan lebih berguna untuk pengambilan keputusan. Sebaliknya, kelemahan sampling akan melemahkan seluruh hasil meskipun analisis statistik terlihat canggih.
Karena itu, peneliti kuantitatif perlu menempatkan sampling sebagai keputusan metodologis strategis, bukan keputusan administratif. Dengan disiplin pada prinsip representativitas, transparansi, dan kontrol kualitas, penelitian sosial kuantitatif dapat menghasilkan bukti yang benar-benar kuat untuk ilmu dan kebijakan. ***
Dalam penelitian kuantitatif, kualitas instrumen menentukan kualitas data. Jika instrumen lemah, maka statistik secanggih apa pun tidak akan memperbaiki kesalahan pengukuran pada hulu proses riset. Karena itu, pengembangan instrumen harus diperlakukan sebagai proses ilmiah yang sistematis, bukan sekadar menyusun daftar pertanyaan.
Instrumen kuantitatif yang baik harus memenuhi setidaknya tiga syarat utama. Pertama, instrumen harus relevan secara teoritik, artinya setiap item mewakili konstruk yang benar-benar hendak diukur. Kedua, instrumen harus valid, artinya skor yang dihasilkan merefleksikan konsep target, bukan konsep lain. Ketiga, instrumen harus reliabel, artinya hasil pengukuran cukup konsisten ketika diterapkan pada kondisi yang sebanding.
Pada praktik di lapangan, kelemahan instrumen sering muncul dalam bentuk hal yang terlihat kecil: kalimat item terlalu panjang, istilah ambigu, skala respons tidak seimbang, atau urutan pertanyaan memengaruhi jawaban responden. Kelemahan kecil ini bisa menimbulkan error sistematis yang akhirnya mengubah simpulan penelitian. Oleh sebab itu, bab ini membahas pengembangan instrumen secara rinci, mulai dari menurunkan indikator dari teori, menulis item yang baik, menguji validitas dan reliabilitas, hingga melakukan revisi berbasis bukti.
Bab ini dirancang untuk kebutuhan buku ajar nasional sehingga tidak hanya memuat definisi, tetapi juga prosedur operasional, contoh praktis, template kerja, dan latihan terstruktur. Setelah mempelajari bab ini, pembaca diharapkan mampu menyusun instrumen kuantitatif yang layak pakai untuk penelitian akademik maupun evaluasi kebijakan.
Penyusunan indikator adalah proses menerjemahkan konsep abstrak menjadi komponen terukur. Pada tahap ini peneliti harus menjaga jembatan antara teori dan pengukuran. Jika jembatan ini putus, instrumen bisa terlihat rapi tetapi tidak mengukur konstruk yang seharusnya.
Tahapan umum penyusunan indikator:
Uji isi (content validity) dilakukan dengan meminta ahli menilai kesesuaian item terhadap konstruk. Ahli dapat berasal dari dosen metodologi, praktisi sektor terkait, atau peneliti berpengalaman pada topik yang sama.
Hal yang dinilai oleh ahli:
Hasil expert judgment harus didokumentasikan, termasuk item yang direvisi atau dihapus. Dokumentasi ini penting untuk transparansi metodologis.
Uji coba terbatas (pilot test) bertujuan menguji keterbacaan item, durasi pengisian, distribusi respons, dan masalah teknis kuesioner. Sampel pilot tidak harus besar, tetapi harus cukup mewakili karakter populasi sasaran.
Target utama pilot test:
Pada tahap ini, peneliti dapat melakukan wawancara kognitif singkat setelah responden mengisi instrumen untuk mengetahui bagaimana responden memahami setiap pertanyaan.
Revisi item tidak boleh dilakukan sembarang. Revisi harus berbasis temuan pilot dan masukan ahli. Perubahan besar perlu dicatat dalam log revisi instrumen, misalnya:
Dengan log revisi, peneliti dapat mempertanggungjawabkan evolusi instrumen dari versi awal ke versi final.
Item adalah inti instrumen. Kualitas item menentukan kualitas skor dan akhirnya menentukan kualitas inferensi penelitian.
Prinsip utama penulisan item:
Item yang baik fokus pada satu ide. Item ganda (double-barreled) seperti “Saya puas dengan dosen dan fasilitas kampus” harus dihindari karena responden bisa setuju pada salah satu aspek tetapi tidak pada aspek lain.
Istilah seperti “sering”, “cukup”, “layak”, atau “baik” bisa ditafsirkan berbeda oleh responden. Jika memungkinkan, gunakan batas waktu atau konteks yang jelas.
Contoh:
Pertanyaan memandu (leading question) mendorong jawaban tertentu dan meningkatkan bias sosial.
Contoh:
Pada beberapa skala sikap, item positif dan negatif digunakan untuk mengurangi response set (misalnya kecenderungan selalu setuju). Namun, item negatif harus ditulis hati-hati agar tidak membingungkan responden.
Contoh item negatif yang terlalu rumit:
“Saya tidak merasa tidak mampu mengelola uang.”
Kalimat semacam ini sebaiknya dihindari karena memuat negasi ganda.
Pemilihan skala respons memengaruhi sensitivitas instrumen dan pilihan analisis statistik.
Jenis skala yang umum:
Pertimbangan pemilihan skala:
Semua item harus dikodekan konsisten. Untuk item negatif, lakukan reverse coding sebelum menghitung skor total agar arah interpretasi seragam.
Contoh:
Tanpa reverse coding, reliabilitas dan interpretasi bisa keliru.
Validitas adalah sejauh mana instrumen benar-benar mengukur apa yang seharusnya diukur. Validitas bukan atribut tunggal, melainkan kumpulan bukti yang mendukung interpretasi skor.
Jenis validitas yang umum dalam penelitian kuantitatif:
Validitas isi menilai kesesuaian isi item dengan domain konsep yang diukur. Uji ini biasanya dilakukan melalui expert judgment dan telaah literatur.
Indikator validitas isi baik:
Validitas konstruk menilai apakah struktur item benar-benar merepresentasikan konstruk teoretik. Bukti konstruk dapat diperoleh melalui:
Pada tahap awal penelitian kelas, EFA sering digunakan untuk memeriksa apakah item mengelompok sesuai dimensi teoretik.
Validitas kriteria menilai apakah skor instrumen berkorelasi dengan ukuran eksternal yang relevan.
Bentuk umum:
Contoh:
Skor literasi keuangan yang tinggi diharapkan berkorelasi positif dengan perilaku menabung aktual.
Walau bukan bukti statistik kuat, validitas wajah tetap penting secara praktis: apakah item tampak masuk akal bagi responden dan pemangku kepentingan. Instrumen yang secara wajah tidak masuk akal bisa ditolak responden meskipun secara statistik cukup baik.
Reliabilitas adalah konsistensi pengukuran. Instrumen reliabel akan menghasilkan skor yang relatif stabil jika kondisi pengukuran sebanding.
Reliabilitas internal umumnya diukur dengan Cronbach’s alpha:
\[ \alpha = \frac{k}{k-1}\left(1 - \frac{\sum S_i^2}{S_t^2}\right) \]
dengan:
Selain konsistensi internal, jenis reliabilitas lain:
Pada riset survei sosial, konsistensi internal paling sering digunakan karena efisien dan sesuai untuk skala multi-item.
Interpretasi praktis umum:
= 0.90: sangat tinggi,
Namun, alpha tidak boleh ditafsirkan mekanis. Nilai alpha dipengaruhi jumlah item, homogenitas konstruk, dan karakter responden. Alpha sangat tinggi bisa juga menandakan item terlalu redundan.
Untuk perbaikan instrumen, periksa:
Item dengan korelasi item-total sangat rendah bisa dipertimbangkan untuk direvisi atau dihapus. Keputusan ini harus mempertimbangkan teori, bukan hanya angka statistik.
set.seed(123)
inst <- data.frame(
item1 = sample(1:5, 40, replace = TRUE),
item2 = sample(1:5, 40, replace = TRUE),
item3 = sample(1:5, 40, replace = TRUE),
item4 = sample(1:5, 40, replace = TRUE)
)
psych::alpha(inst)
## Some items ( item2 ) were negatively correlated with the first principal component and
## probably should be reversed.
## To do this, run the function again with the 'check.keys=TRUE' option
##
## Reliability analysis
## Call: psych::alpha(x = inst)
##
## raw_alpha std.alpha G6(smc) average_r S/N ase mean sd median_r
## 0.075 0.1 0.21 0.028 0.12 0.24 3 0.75 0.029
##
## 95% confidence boundaries
## lower alpha upper
## Feldt -0.50 0.08 0.47
## Duhachek -0.39 0.08 0.54
##
## Reliability if an item is dropped:
## raw_alpha std.alpha G6(smc) average_r S/N alpha se var.r med.r
## item1 0.17 0.19 0.187 0.072 0.233 0.23 0.044 0.0091
## item2 0.41 0.42 0.349 0.195 0.726 0.16 0.017 0.2298
## item3 -0.47 -0.50 -0.231 -0.125 -0.332 0.40 0.035 -0.0984
## item4 -0.14 -0.09 0.057 -0.028 -0.083 0.32 0.078 0.0091
##
## Item statistics
## n raw.r std.r r.cor r.drop mean sd
## item1 40 0.43 0.46 0.12 -0.042 2.8 1.4
## item2 40 0.31 0.28 -0.31 -0.205 2.9 1.5
## item3 40 0.71 0.74 0.74 0.362 3.2 1.3
## item4 40 0.64 0.60 0.39 0.136 3.2 1.6
##
## Non missing response frequency for each item
## 1 2 3 4 5 miss
## item1 0.22 0.20 0.28 0.12 0.17 0
## item2 0.25 0.20 0.17 0.15 0.22 0
## item3 0.15 0.15 0.22 0.32 0.15 0
## item4 0.20 0.22 0.12 0.10 0.35 0
Contoh di atas menunjukkan alur dasar pengujian alpha. Dalam praktik nyata, data item sebaiknya berasal dari pilot test atau survei awal, bukan simulasi acak murni.
Agar proses pengembangan instrumen lebih sistematis, gunakan workflow berikut.
Tahap konseptual:
Tahap penyusunan item:
Tahap uji coba:
Tahap implementasi:
Tahap pelaporan:
Contoh ini menunjukkan bagaimana mengembangkan instrumen dari nol.
Literasi keuangan mahasiswa didefinisikan sebagai kemampuan memahami konsep keuangan dasar, mengelola uang harian, merencanakan keuangan jangka pendek, serta mengambil keputusan finansial yang rasional.
Pengetahuan:
Perilaku:
Sikap:
Keputusan:
Item negatif (jika dipakai):
Ahli menilai bahwa item 2 terlalu teknis untuk sebagian responden semester awal. Revisi dilakukan dengan bahasa lebih sederhana.
Pilot pada 60 mahasiswa menunjukkan dua item negatif sering disalahpahami. Solusi:
Instrumen final tetap 10 item dengan dua item revisi redaksi. Alpha meningkat menjadi 0.82 pada uji lapangan berikutnya.
Instrumen kuantitatif rentan bias. Peneliti harus mengenali sumber bias sejak desain.
Responden cenderung selalu setuju pada semua item.
Mitigasi:
Responden sulit mengingat kejadian lama.
Mitigasi:
Cara enumerator bertanya memengaruhi jawaban.
Mitigasi:
Gunakan checklist ini:
Jika beberapa butir belum terpenuhi, instrumen sebaiknya direvisi sebelum survei utama.
Paragraf metode yang baik harus memuat:
Contoh kalimat pelaporan:
“Instrumen literasi keuangan disusun berdasarkan empat dimensi teoretik dengan total 10 item skala Likert 1-5. Validitas isi dievaluasi oleh tiga ahli metodologi dan dua praktisi literasi keuangan. Uji coba pada 60 mahasiswa menghasilkan Cronbach’s alpha 0.82, menunjukkan konsistensi internal yang baik. Dua item negatif direverse coding sebelum analisis.”
Tidak selalu. Pada konstruk baru atau jumlah item sedikit, nilai mendekati 0.70 bisa dipertimbangkan sambil menilai bukti validitas lain.
Tidak wajib. Item negatif bisa membantu mengurangi response set, tetapi jika menimbulkan kebingungan, kualitas data bisa memburuk.
Tidak ada angka tunggal. Untuk riset awal, 3-6 item per dimensi sering digunakan. Keputusan harus didukung teori dan hasil uji empiris.
Tidak otomatis. Penghapusan item harus mempertimbangkan relevansi teoritik agar konstruk tidak kehilangan cakupan substantif.
“Sebagai mahasiswa cerdas, saya selalu menabung.” Masalah: leading question.
“Saya cukup baik dalam mengelola uang.” Masalah: kata “cukup baik” ambigu.
“Saya paham semua hal tentang keuangan pribadi.” Masalah: absolut, tidak realistis, rentan social desirability.
set.seed(321)
dat <- data.frame(
i1 = sample(1:5, 100, replace = TRUE),
i2 = sample(1:5, 100, replace = TRUE),
i3 = sample(1:5, 100, replace = TRUE),
i4 = sample(1:5, 100, replace = TRUE),
i5 = sample(1:5, 100, replace = TRUE),
i6 = sample(1:5, 100, replace = TRUE),
i7 = sample(1:5, 100, replace = TRUE),
i8 = sample(1:5, 100, replace = TRUE),
i9 = sample(1:5, 100, replace = TRUE),
i10 = sample(1:5, 100, replace = TRUE)
)
# contoh reverse coding item negatif
dat$i9 <- 6 - dat$i9
dat$i10 <- 6 - dat$i10
psych::alpha(dat)
## Some items ( i1 i2 i4 i5 i7 i9 ) were negatively correlated with the first principal component and
## probably should be reversed.
## To do this, run the function again with the 'check.keys=TRUE' option
##
## Reliability analysis
## Call: psych::alpha(x = dat)
##
## raw_alpha std.alpha G6(smc) average_r S/N ase mean sd median_r
## -0.12 -0.099 -0.02 -0.0091 -0.09 0.17 3 0.42 0.0093
##
## 95% confidence boundaries
## lower alpha upper
## Feldt -0.47 -0.12 0.18
## Duhachek -0.44 -0.12 0.21
##
## Reliability if an item is dropped:
## raw_alpha std.alpha G6(smc) average_r S/N alpha se var.r med.r
## i1 -0.0722 -0.0586 0.0104 -0.00618 -0.0553 0.16 0.0079 0.0126
## i2 -0.0159 0.0058 0.0593 0.00065 0.0058 0.15 0.0066 0.0122
## i3 -0.0865 -0.0705 -0.0104 -0.00737 -0.0659 0.16 0.0063 0.0156
## i4 -0.1106 -0.0908 -0.0093 -0.00934 -0.0832 0.17 0.0087 0.0065
## i5 -0.1283 -0.1109 -0.0302 -0.01121 -0.0998 0.17 0.0085 0.0122
## i6 -0.1792 -0.1589 -0.0717 -0.01547 -0.1371 0.18 0.0078 -0.0128
## i7 -0.0862 -0.0778 -0.0118 -0.00809 -0.0722 0.16 0.0073 0.0122
## i8 -0.0089 -0.0059 0.0457 -0.00065 -0.0059 0.15 0.0064 0.0122
## i9 -0.1330 -0.1129 -0.0324 -0.01140 -0.1014 0.17 0.0081 0.0122
## i10 -0.2488 -0.2425 -0.1501 -0.02217 -0.1952 0.19 0.0067 -0.0214
##
## Item statistics
## n raw.r std.r r.cor r.drop mean sd
## i1 100 0.28 0.27 NaN -0.06838 3.1 1.5
## i2 100 0.19 0.19 NaN -0.13983 3.2 1.4
## i3 100 0.27 0.28 NaN -0.05350 2.7 1.4
## i4 100 0.29 0.31 NaN -0.02452 2.9 1.3
## i5 100 0.35 0.33 NaN -0.00714 2.8 1.5
## i6 100 0.37 0.38 NaN 0.05621 2.7 1.3
## i7 100 0.30 0.29 NaN -0.05242 3.2 1.5
## i8 100 0.21 0.20 NaN -0.13974 3.1 1.5
## i9 100 0.33 0.33 NaN 0.00038 3.2 1.4
## i10 100 0.43 0.46 NaN 0.14065 3.3 1.3
##
## Non missing response frequency for each item
## 1 2 3 4 5 miss
## i1 0.18 0.18 0.21 0.17 0.26 0
## i2 0.16 0.18 0.20 0.25 0.21 0
## i3 0.27 0.19 0.27 0.13 0.14 0
## i4 0.18 0.22 0.30 0.15 0.15 0
## i5 0.27 0.19 0.20 0.13 0.21 0
## i6 0.20 0.28 0.26 0.10 0.16 0
## i7 0.20 0.14 0.20 0.21 0.25 0
## i8 0.22 0.13 0.26 0.13 0.26 0
## i9 0.16 0.15 0.26 0.18 0.25 0
## i10 0.10 0.19 0.23 0.26 0.22 0
Sebelum: “Saya sering menabung.”
Sesudah: “Dalam 3 bulan terakhir, saya menabung minimal satu kali per bulan.”
Sebelum: “Saya pintar mengatur uang.”
Sesudah: “Saya menyusun prioritas pengeluaran sebelum menggunakan uang saku bulanan.”
“Instrumen literasi keuangan disusun berdasarkan empat dimensi teoretik dengan total 10 item skala Likert 1-5. Validitas isi dinilai oleh lima ahli menggunakan lembar penilaian relevansi item. Pilot test dilakukan pada 60 mahasiswa semester awal untuk menguji keterbacaan item dan durasi pengisian. Konsistensi internal dievaluasi menggunakan Cronbach’s alpha. Dua item negatif direverse coding sebelum analisis reliabilitas.”
Setelah validitas isi dan reliabilitas awal terpenuhi, langkah penting berikutnya adalah memeriksa struktur konstruk instrumen. Pada tahap ini, peneliti menilai apakah item-item memang membentuk dimensi sesuai teori.
EFA digunakan ketika struktur dimensi belum sepenuhnya pasti, atau ketika instrumen baru diadaptasi ke konteks baru. Tujuan EFA adalah menemukan pola pengelompokan item berdasarkan kovariasi data.
Langkah umum EFA:
Prinsip interpretasi sederhana:
EFA bukan alat otomatis menghapus item. Keputusan tetap harus mempertimbangkan teori dan tujuan pengukuran.
CFA digunakan ketika peneliti sudah memiliki model konstruk teoritik yang jelas dan ingin menguji kesesuaian model tersebut dengan data.
CFA relevan untuk:
Dalam konteks pembelajaran awal, mahasiswa tidak selalu wajib melakukan CFA. Namun memahami logikanya penting agar peneliti tidak menyederhanakan validitas hanya menjadi nilai alpha.
Validitas konvergen berarti item dalam dimensi yang sama saling berkorelasi cukup kuat. Validitas diskriminan berarti dimensi yang berbeda memang dapat dibedakan secara empiris.
Jika dua dimensi teoritik terlalu sulit dibedakan secara data, kemungkinan:
Dalam kondisi ini, peneliti perlu revisi model teori atau redaksi item.
Alpha populer karena mudah dihitung, tetapi bukan satu-satunya ukuran reliabilitas.
Koefisien omega sering dianggap lebih fleksibel pada beberapa kondisi, terutama ketika asumsi tau-equivalence pada alpha tidak terpenuhi.
Jika instrumen mengukur konstruk yang relatif stabil, test-retest dapat digunakan untuk menilai stabilitas skor antar waktu.
Langkah umum:
Korelasi tinggi menunjukkan stabilitas lebih baik.
Untuk instrumen berbasis penilai (misal observasi perilaku), konsistensi antar penilai penting. Tanpa reliabilitas antar penilai, variasi skor bisa berasal dari perbedaan penilai, bukan perbedaan subjek.
Banyak peneliti menggunakan instrumen dari studi terdahulu. Adaptasi instrumen bukan sekadar menerjemahkan kata per kata. Adaptasi harus menjaga equivalence konsep, bahasa, dan konteks budaya.
Langkah adaptasi instrumen:
Kesalahan umum:
Penggunaan survei daring meningkat, tetapi membawa tantangan instrumen yang berbeda dari survei tatap muka.
Tantangan utama:
Strategi mitigasi:
Instrumen yang baik di survei daring perlu mempertimbangkan pengalaman pengguna (UX), bukan hanya konten item.
Sebelum uji lapangan, peneliti sebaiknya membuat matriks spesifikasi instrumen agar jelas hubungan antara teori dan item.
Contoh komponen matriks:
Manfaat matriks:
Bahasa instrumen harus disesuaikan dengan karakter responden. Instrumen untuk mahasiswa, rumah tangga, pegawai, atau remaja tidak selalu bisa menggunakan redaksi yang sama.
Prinsip bahasa instrumen:
Uji keterbacaan sederhana dapat dilakukan dengan meminta beberapa responden target menjelaskan kembali arti item dengan kata mereka sendiri.
Urutan item memengaruhi kualitas respons. Item sensitif di awal dapat menurunkan kenyamanan responden.
Urutan yang disarankan:
Jika instrumen panjang, pertimbangkan pengelompokan per dimensi dengan transisi yang jelas.
Setelah data terkumpul, lakukan diagnosis item.
Indikator item bermasalah:
Tindakan terhadap item bermasalah:
Instrumen harus memiliki versioning seperti software.
Format sederhana:
Setiap versi disertai changelog:
Versioning mencegah kebingungan saat analisis dan memperkuat audit trail penelitian.
Pengembangan instrumen juga memiliki dimensi etika.
Aspek etika penting:
Pada topik sensitif (utang, kekerasan, kesehatan mental), redaksi item harus sangat hati-hati dan diuji secara etis.
Rubrik berikut dapat digunakan dosen atau tim riset untuk menilai instrumen.
| Aspek | Bobot | Kriteria unggul |
|---|---|---|
| Kesesuaian teori-indikator | 20% | semua dimensi terwakili jelas |
| Kualitas redaksi item | 20% | tidak ambigu, tidak leading |
| Validitas isi | 15% | ada proses expert review terdokumentasi |
| Reliabilitas awal | 15% | alpha/indikator reliabilitas memadai |
| Kesiapan implementasi | 10% | SOP pengisian jelas |
| Kualitas coding data | 10% | reverse coding dan skoring konsisten |
| Dokumentasi revisi | 10% | changelog instrumen lengkap |
Interpretasi skor:
=85: sangat siap lapangan,
Berikut contoh alur analisis item dasar di R setelah data terkumpul.
set.seed(777)
inst2 <- data.frame(
i1 = sample(1:5, 120, replace = TRUE),
i2 = sample(1:5, 120, replace = TRUE),
i3 = sample(1:5, 120, replace = TRUE),
i4 = sample(1:5, 120, replace = TRUE),
i5 = sample(1:5, 120, replace = TRUE),
i6 = sample(1:5, 120, replace = TRUE),
i7 = sample(1:5, 120, replace = TRUE),
i8 = sample(1:5, 120, replace = TRUE),
i9 = sample(1:5, 120, replace = TRUE),
i10 = sample(1:5, 120, replace = TRUE)
)
# contoh reverse coding item negatif
inst2$i9 <- 6 - inst2$i9
inst2$i10 <- 6 - inst2$i10
# ringkasan deskriptif item
summary(inst2)
## i1 i2 i3 i4 i5
## Min. :1.000 Min. :1.000 Min. :1.000 Min. :1.000 Min. :1.0
## 1st Qu.:2.000 1st Qu.:2.000 1st Qu.:1.000 1st Qu.:2.000 1st Qu.:2.0
## Median :3.000 Median :3.000 Median :3.000 Median :3.000 Median :3.0
## Mean :3.017 Mean :3.025 Mean :2.625 Mean :3.017 Mean :2.8
## 3rd Qu.:4.000 3rd Qu.:4.000 3rd Qu.:4.000 3rd Qu.:4.000 3rd Qu.:4.0
## Max. :5.000 Max. :5.000 Max. :5.000 Max. :5.000 Max. :5.0
## i6 i7 i8 i9 i10
## Min. :1.0 Min. :1.00 Min. :1 Min. :1.000 Min. :1.000
## 1st Qu.:2.0 1st Qu.:2.00 1st Qu.:2 1st Qu.:2.000 1st Qu.:1.000
## Median :3.0 Median :3.00 Median :3 Median :3.000 Median :3.000
## Mean :2.9 Mean :2.85 Mean :3 Mean :3.058 Mean :2.842
## 3rd Qu.:4.0 3rd Qu.:4.00 3rd Qu.:4 3rd Qu.:4.000 3rd Qu.:4.000
## Max. :5.0 Max. :5.00 Max. :5 Max. :5.000 Max. :5.000
# reliabilitas
alpha_out <- psych::alpha(inst2)
## Some items ( i3 ) were negatively correlated with the first principal component and
## probably should be reversed.
## To do this, run the function again with the 'check.keys=TRUE' option
alpha_out$total
## raw_alpha std.alpha G6(smc) average_r S/N ase mean sd
## 0.1715884 0.1699332 0.23513 0.02006152 0.2047223 0.1112955 2.913333 0.4854061
## median_r
## 0.03981768
alpha_out$item.stats
## n raw.r std.r r.cor r.drop mean sd
## i1 120 0.352625163 0.34203746 0.14933502 0.05386880 3.016667 1.466622
## i2 120 0.355392719 0.36754560 0.18922193 0.08508621 3.025000 1.337642
## i3 120 0.007602805 0.01607036 -0.45353421 -0.26414066 2.625000 1.366234
## i4 120 0.368650564 0.37380782 0.22573087 0.08947848 3.016667 1.384083
## i5 120 0.298505139 0.30270540 0.10275905 0.01582085 2.800000 1.375659
## i6 120 0.405245949 0.40312006 0.28015051 0.12310934 2.900000 1.416588
## i7 120 0.452189996 0.45030239 0.36939404 0.17662172 2.850000 1.418071
## i8 120 0.432742945 0.44214421 0.37674094 0.16155449 3.000000 1.384184
## i9 120 0.470532605 0.47194830 0.43965988 0.19602272 3.058333 1.427790
## i10 120 0.290568972 0.26623710 -0.01337412 -0.02539310 2.841667 1.528419
Pada data nyata, fokuskan interpretasi pada:
Kesalahan yang sering terjadi:
Strategi perbaikan:
Jawaban kuat biasanya memuat:
Contoh kriteria keputusan item:
Dengan standar ini, instrumen akan lebih siap untuk menghasilkan data yang kredibel.
Lima keputusan inti pengembangan instrumen:
Jika lima keputusan ini dijalankan disiplin, maka kualitas data meningkat dan risiko bias pengukuran berkurang secara signifikan. ## Pendalaman akhir: studi mini pengembangan instrumen dari awal sampai final
Bagian ini memberi simulasi ringkas tetapi lengkap bagaimana satu instrumen dikembangkan secara profesional.
Tim peneliti ingin mengukur “kesiapan kerja digital mahasiswa”. Dari literatur, konstruk ini dipetakan menjadi empat dimensi:
Tim menyepakati definisi operasional per dimensi agar tidak terjadi tumpang tindih konsep.
Tim menulis 24 item (6 item per dimensi). Pada tahap ini prinsipnya adalah menghasilkan variasi item yang cukup, bukan langsung mencari versi final.
Setelah audit internal, 4 item dihapus karena double-barreled, 3 item direvisi karena ambigu, dan 2 item dipindah dimensi karena kurang tepat secara teori.
Lima ahli menilai item berdasarkan relevansi dan kejelasan. Hasil ringkas:
Tim merevisi 8 item dan menghapus 2 item. Versi instrumen menjadi 22 item.
Pilot dilakukan pada 80 mahasiswa. Temuan:
Berdasarkan diskusi, tim menyederhanakan redaksi 3 item dan memperjelas petunjuk respons untuk mengurangi salah tafsir.
Pada data pilot revisi:
Keputusan ini menunjukkan prinsip penting: statistik memberi sinyal, teori memberi keputusan.
Instrumen final berisi 20 item. Tim menyusun:
Dengan demikian, instrumen tidak hanya valid-reliabel secara angka, tetapi juga siap implementasi dan replikasi.
Instrumen yang baik tetap bisa menghasilkan data buruk jika quality control lapangan lemah. Karena itu, quality control instrumen harus menjadi bagian dari SOP survei.
Komponen quality control yang disarankan:
Contoh aturan praktis:
80% item dijawab nilai sama -> tandai potensi low-engagement response,
Dengan quality control ini, tim dapat meminimalkan error pengukuran sebelum analisis akhir.
Skor instrumen harus ditafsirkan sesuai tujuan pengukuran. Skor tinggi tidak otomatis berarti “baik” secara absolut jika standar kategorisasi tidak jelas.
Agar interpretasi lebih bertanggung jawab:
Contoh kehati-hatian:
Skala literasi keuangan yang dikembangkan untuk mahasiswa belum tentu valid digunakan langsung untuk pelaku UMKM tanpa adaptasi ulang.
Inti pengembangan instrumen adalah disiplin metodologis. Peneliti harus menyeimbangkan teori, bahasa, psikometri, dan operasional lapangan. Jika salah satu sisi diabaikan, kualitas data akan turun.
Prinsip ringkas yang harus diingat:
Dengan prinsip tersebut, instrumen menjadi fondasi kuat bagi analisis kuantitatif yang kredibel.
Untuk naskah yang ditargetkan siap ISBN, dokumentasi teknis instrumen perlu ditulis eksplisit dan konsisten antar bab. Sertakan riwayat perubahan item, ringkasan masukan ahli, hasil pilot test, alasan item dibuang/dipertahankan, serta pedoman skoring final dalam lampiran metodologis. Praktik ini membantu reviewer menilai jejak keputusan secara transparan, memudahkan replikasi di konteks lain, dan memperkuat akuntabilitas ilmiah buku ajar. Dengan demikian, kualitas instrumen tidak hanya terlihat dari statistik, tetapi juga dari keterlacakan proses pengembangannya. ## Penutup
Pengembangan instrumen adalah proses metodologis yang menentukan mutu data kuantitatif. Instrumen yang baik lahir dari integrasi teori, redaksi item yang cermat, uji validitas, uji reliabilitas, dan revisi berbasis bukti. Dengan disiplin pada proses ini, penelitian kuantitatif menghasilkan data yang lebih akurat, inferensi yang lebih kredibel, dan rekomendasi yang lebih dapat dipertanggungjawabkan. ***
Bab ini membahas fondasi operasional penelitian kuantitatif yang sering dianggap “teknis”, padahal menentukan kredibilitas hasil secara langsung: etika penelitian, standar operasional prosedur (SOP) lapangan, dan kontrol mutu data. Banyak penelitian gagal bukan karena rumus statistik salah, tetapi karena proses pengumpulan data tidak etis, enumerator tidak disiplin, atau quality control tidak berjalan. Akibatnya, data terlihat lengkap tetapi sesungguhnya bias, tidak konsisten, atau tidak dapat dipertanggungjawabkan.
Dalam konteks buku ajar nasional, tiga hal ini harus dipahami sebagai satu sistem kerja. Etika memberi batas normatif tentang apa yang boleh dan tidak boleh dilakukan kepada responden. SOP memberi panduan rinci agar semua petugas bekerja seragam dan dapat diaudit. Kontrol mutu memastikan data yang terkumpul memenuhi standar validitas operasional sebelum dianalisis lebih lanjut.
Bab ini disusun untuk membantu Anda menyusun riset yang tidak hanya “jalan” di lapangan, tetapi juga siap diuji oleh reviewer akademik, pembimbing, komite etik, dan pemangku kebijakan. Semua bagian disertai contoh konkret, format praktis, serta latihan berikut jawaban ringkas agar mudah diterapkan.
Etika penelitian adalah seperangkat prinsip yang melindungi martabat, hak, keamanan, dan kepentingan partisipan, sekaligus menjaga integritas ilmiah peneliti. Dalam penelitian kuantitatif, etika bukan sekadar dokumen formal untuk memenuhi persyaratan administrasi. Etika adalah standar minimal agar data yang diperoleh sah secara moral dan dapat dipertanggungjawabkan secara akademik.
Empat prinsip inti yang harus selalu dijaga:
Penjelasan praktis tiap prinsip:
Dalam praktik lapangan, penghormatan terhadap partisipan dimulai dari hal sederhana: cara menyapa, cara menjelaskan tujuan penelitian, pilihan kata dalam pertanyaan, hingga hak responden untuk menolak menjawab item sensitif. Ketika partisipan diposisikan sebagai “objek” semata, kualitas jawaban menurun karena responden merasa tidak aman.
Contoh baik:
Contoh buruk:
Keadilan dalam penelitian berarti beban dan manfaat partisipasi dibagi secara proporsional. Jangan sampai kelompok rentan selalu diminta datanya, tetapi tidak pernah mendapatkan manfaat kebijakan dari penelitian tersebut. Dalam studi kuantitatif sosial, keadilan juga berarti desain sampling tidak sistematis mengecualikan kelompok tertentu tanpa alasan metodologis yang sah.
Praktik keadilan yang disarankan:
Penelitian sosial sering dianggap “aman” karena tidak ada intervensi medis. Anggapan ini keliru. Risiko tetap ada, terutama risiko non-fisik.
Jenis risiko umum:
Mitigasi praktis:
Informed consent adalah proses, bukan sekadar lembar tanda tangan. Tujuannya memastikan partisipasi terjadi secara sadar, sukarela, dan dapat ditarik kapan saja. Dalam penelitian kuantitatif berskala besar, consent dapat berbentuk tertulis, lisan terdokumentasi, atau digital, tergantung konteks lapangan.
Dokumen persetujuan minimal memuat:
Agar dokumen consent tidak bersifat formalistik, gunakan bahasa sederhana, hindari istilah teknis berlebihan, dan sesuaikan dengan tingkat literasi responden. Kalimat seperti “partisipasi Anda bersifat sukarela” harus dijelaskan artinya secara konkret, misalnya: “Anda bebas menolak tanpa konsekuensi apa pun.”
Template ringkas pembuka consent:
“Kami dari tim penelitian Universitas X sedang melakukan studi tentang akses kerja pemuda. Wawancara berlangsung sekitar 20-30 menit. Tidak ada jawaban benar atau salah. Anda boleh menolak menjawab pertanyaan tertentu atau menghentikan wawancara kapan saja. Data Anda akan dirahasiakan dan hanya digunakan untuk kepentingan penelitian.”
Kelompok rentan memerlukan perlindungan tambahan. Contoh kelompok rentan: anak/remaja, lansia dengan keterbatasan kognitif, penyandang disabilitas tertentu, komunitas termarjinalkan, atau pihak yang bergantung pada otoritas tertentu.
Prinsip tambahan:
Contoh: survei pada siswa SMA tidak boleh hanya mengandalkan izin sekolah; perlu prosedur persetujuan yang sesuai kebijakan etik untuk peserta di bawah umur.
Dalam beberapa konteks, tanda tangan tertulis tidak realistis atau menimbulkan kecurigaan responden. Solusinya dapat berupa consent lisan yang direkam dalam log sistem, atau consent digital pada aplikasi survei.
Catatan penting:
Kerahasiaan adalah tulang punggung kepercayaan publik terhadap penelitian. Jika responden merasa datanya rawan bocor, partisipasi menurun dan jawaban menjadi defensif.
Strategi perlindungan data yang wajib diterapkan:
Perbedaan yang sering tertukar:
Pada penelitian longitudinal, pseudonimisasi lebih lazim karena tim perlu menghubungkan data antar gelombang. Namun kunci identitas harus disimpan terpisah dengan standar keamanan lebih tinggi.
Contoh struktur kerja yang rapi:
/data_raw/ untuk data mentah dari lapangan
(read-only);/data_identitas/ untuk file identitas terpisah (akses
terbatas);/data_clean/ untuk data hasil cleaning;/logs/ untuk catatan transformasi dan audit;/scripts/ untuk kode pembersihan dan analisis.Aturan operasional:
data_raw;SOP lapangan adalah dokumen standar yang mengatur alur kerja pengumpulan data secara rinci agar kualitas antar-enumerator konsisten. Tanpa SOP, setiap petugas bisa menafsirkan prosedur berbeda, menghasilkan error sistematik yang sulit dideteksi setelah data masuk.
Fungsi utama SOP:
SOP yang baik harus spesifik, dapat diukur, realistis, dan mudah dijalankan di lapangan. Hindari SOP yang hanya normatif, misalnya “enumerator harus profesional” tanpa indikator perilaku operasional.
Komponen dasar SOP survei kuantitatif:
Di bawah ini versi lengkap yang dapat dijadikan template lapangan.
Aktivitas inti:
Output yang harus ada:
Briefing bukan sekadar pembagian target. Briefing harus memastikan semua petugas memahami tujuan studi, definisi variabel, teknik probing netral, dan prosedur etik.
Materi briefing minimum:
Checklist lulus briefing:
Role play wajib dilakukan sebelum lapangan nyata. Tujuan utama adalah mendeteksi potensi salah tafsir item dan melatih stabilitas gaya wawancara.
Skenario minimal:
Indikator evaluasi role play:
Urutan standar kunjungan:
Aturan perilaku enumerator:
Logbook harian adalah catatan operasional yang mencatat apa yang terjadi di lapangan secara sistematik. Dokumen ini sangat penting untuk menjelaskan deviasi target dan memudahkan investigasi error data.
Kolom minimal logbook:
Supervisor melakukan audit acak untuk memastikan prosedur berjalan. Audit bukan mencari kesalahan personal, tetapi menjaga standar kualitas tim.
Komponen audit:
Tindak lanjut audit:
Back-check adalah verifikasi sebagian responden setelah wawancara selesai untuk memastikan kunjungan benar terjadi dan jawaban kunci konsisten.
Prinsip pelaksanaan:
Kontrol mutu (quality control) adalah serangkaian mekanisme untuk mendeteksi dan mencegah kesalahan data sejak proses pengumpulan berlangsung, bukan setelah analisis selesai. Dalam proyek besar, quality control harus berjalan harian agar error tidak menumpuk.
Komponen kontrol mutu prioritas:
Spot check adalah kunjungan mendadak atau terjadwal oleh supervisor untuk melihat proses wawancara aktual. Tujuannya memverifikasi kepatuhan SOP dan etika.
Apa yang dinilai:
Skema penilaian sederhana:
Konsistensi logis antaritem perlu diperiksa otomatis jika memungkinkan. Contoh:
Jenis rule yang bisa dipakai:
Durasi wawancara merupakan indikator kualitas proses. Wawancara terlalu cepat mengindikasikan kemungkinan pengisian asal, sedangkan terlalu lama dapat menandakan kendala pemahaman instrumen.
Aturan praktis:
Durasi tidak boleh dipakai sebagai satu-satunya indikator fraud, tetapi efektif sebagai alarm awal.
Outlier bisa mencerminkan realitas sosial langka atau kesalahan input. Karena itu, outlier tidak boleh langsung dihapus.
Prosedur aman:
Untuk proyek skala menengah-besar, gunakan model kendali mutu berlapis:
Keunggulan model berlapis:
Sebelum mengirim data, enumerator wajib memeriksa:
Supervisor memeriksa:
Tim QA melakukan pemeriksaan lintas wilayah untuk menghindari bias supervisor lokal. Tugasnya menilai kepatuhan SOP secara lebih objektif.
Fraud data adalah pengisian data tanpa wawancara nyata, manipulasi jawaban, atau perubahan data pasca-lapangan tanpa prosedur. Risiko ini meningkat saat target tinggi, supervisi lemah, dan insentif hanya berbasis kuantitas.
Jika terdeteksi dugaan fraud:
Kelebihan:
Risiko:
Kontrol khusus:
Kelebihan:
Risiko:
Kontrol khusus:
Kelebihan:
Risiko:
Kontrol khusus:
Kualitas data sangat dipengaruhi kualitas manajemen manusia, bukan hanya alat survei.
Prinsip manajemen tim:
Kriteria minimum:
Materi pelatihan sebaiknya mencakup:
Petugas yang kelelahan, tidak jelas insentifnya, atau tidak mendapat dukungan logistik cenderung melakukan shortcut. Karena itu, kualitas data terkait langsung dengan desain manajemen operasional.
Kebijakan minimal:
Audit trail adalah jejak dokumentasi semua keputusan lapangan dan data. Tanpa audit trail, penelitian sulit direplikasi dan sulit dibela saat reviewer mempertanyakan kualitas data.
Dokumen yang wajib disimpan:
Agar etika tidak berdiri terpisah dari teknis, gunakan siklus berikut:
Siklus ini membuat tim belajar dari kesalahan, bukan sekadar menyalahkan individu setelah proyek selesai.
Berikut contoh yang bisa langsung diadaptasi.
Judul SOP: Pengumpulan Data Survei Akses Kerja Pemuda 2026
Target: 500 responden, 10 enumerator, 2 supervisor
Durasi lapangan: 10 hari kerja
Rincian operasional:
Alur kerja harian:
Indikator kinerja mutu:
Checklist berikut dapat digunakan supervisor:
Skor harian dapat dikonversi:
Gunakan matriks sederhana berikut untuk monitoring.
Kolom matriks:
Contoh isi:
Kesalahan umum di lapangan:
Strategi perbaikan:
Untuk naskah buku ajar atau laporan penelitian formal, bagian etika dan mutu data sebaiknya memuat:
Contoh kalimat pelaporan:
“Penelitian ini menerapkan informed consent tertulis, pseudonimisasi data responden, serta back-check 15% sampel harian oleh tim validator independen. Tingkat mismatch item kunci sebesar 3,8%, berada di bawah ambang mutu 5% yang ditetapkan pada protokol penelitian.”
Untuk memperjelas integrasi etika, SOP, dan kontrol mutu, berikut simulasi studi kasus yang sering ditemui dalam riset sosial kuantitatif.
Konteks:
Risiko utama yang teridentifikasi:
Desain mitigasi:
Output mutu harian yang dipantau:
Pembelajaran penting:
Salah satu kelemahan umum proyek survei adalah tidak adanya aturan eskalasi. Akibatnya, enumerator mengambil keputusan sendiri saat menghadapi situasi sulit, dan keputusan antarpetugas menjadi tidak konsisten.
SOP eskalasi minimal harus menjawab:
Klasifikasi masalah dan jalur eskalasi:
Template laporan insiden lapangan:
Aturan waktu respons:
Dengan protokol ini, tim tidak bekerja berdasarkan improvisasi personal, melainkan standar yang seragam.
Non-respons adalah kondisi ketika unit sampel tidak memberikan data lengkap, baik karena tidak dapat dihubungi, menolak, atau menghentikan wawancara di tengah jalan. Non-respons bukan hanya isu teknis, tetapi juga isu etik dan inferensial.
Mengapa penting:
Kategori non-respons:
Strategi pengelolaan non-respons yang etis:
Dokumentasi non-respons:
Implikasi analitik:
Interviewer effect adalah variasi jawaban yang dipengaruhi oleh karakteristik atau perilaku pewawancara, bukan oleh perbedaan nyata antar responden. Dalam riset sosial, efek ini bisa muncul karena gaya bertanya, intonasi, ekspresi non-verbal, atau asumsi personal pewawancara.
Gejala interviewer effect:
Pencegahan:
Tindakan korektif:
Pada proyek menengah-besar, dashboard mutu harian sangat membantu pengambilan keputusan cepat. Dashboard tidak perlu kompleks; yang penting indikatornya relevan dan ditinjau konsisten.
Indikator inti dashboard:
Contoh aturan warna:
Manfaat dashboard:
Isu penting dalam kontrol mutu adalah batasan koreksi data. Banyak tim melakukan perubahan tanpa aturan, sehingga integritas dataset diragukan.
Prinsip umum:
Koreksi yang diperbolehkan:
Koreksi yang tidak diperbolehkan:
Format log koreksi:
Insentif sering menjadi isu sensitif. Insentif boleh diberikan, tetapi tidak boleh bersifat memaksa atau menyesatkan.
Prinsip insentif responden:
Prinsip insentif enumerator:
Contoh skema enumerator yang sehat:
Skema ini mengurangi dorongan melakukan shortcut demi mengejar angka.
Data sensitif mencakup informasi yang bila bocor dapat merugikan responden, seperti data kesehatan, pendapatan detail, status hukum, pengalaman kekerasan, atau identitas personal.
Aturan pengelolaan data sensitif:
Praktik aman kolaborasi tim:
Kebijakan retensi:
Setelah data terkumpul, tanggung jawab etik belum selesai. Komunikasi hasil juga harus etis dan tidak menyesatkan.
Prinsip komunikasi:
Contoh pelanggaran komunikasi:
Agar proyek siap diaudit, siapkan paket dokumen minimum berikut:
Jika dokumen ini lengkap, proses evaluasi akademik, institutional review, dan persiapan publikasi menjadi jauh lebih kuat.
Untuk menjaga konsistensi antar supervisor, gunakan rubrik baku.
Komponen rubrik:
Interpretasi skor:
Dengan rubrik ini, evaluasi tim tidak bersifat subjektif dan dapat ditindaklanjuti secara sistematis.
Jika bab ini digunakan dalam buku metodologi tingkat nasional, sertakan lampiran praktis agar pembaca dapat langsung menerapkan standar operasional di penelitian mereka. Lampiran yang disarankan meliputi contoh formulir informed consent, contoh logbook harian, form spot check, form back-check, dan template laporan mutu mingguan. Selain itu, gunakan istilah yang konsisten antar bab, misalnya membedakan tegas antara "validasi" (proses verifikasi data lapangan) dan "validitas" (mutu pengukuran instrumen). Konsistensi bahasa ini penting agar pembaca tidak salah memahami prosedur metodologis. Terakhir, pastikan setiap tabel SOP memiliki kolom penanggung jawab dan tenggat waktu, sehingga isi bab bukan hanya deskriptif, tetapi benar-benar operasional untuk kebutuhan skripsi, tesis, penelitian lembaga, maupun evaluasi program pemerintah. Pendekatan ini memperkuat akuntabilitas ilmiah naskah.
Etika penelitian, SOP lapangan, dan kontrol mutu data adalah fondasi yang tidak bisa dipisahkan. Penelitian kuantitatif yang baik bukan hanya menghasilkan angka signifikan, tetapi dibangun melalui proses pengumpulan data yang menghormati partisipan, terstandar, dan terawasi. Dengan menerapkan prinsip etika secara konsisten, menjalankan SOP secara disiplin, dan mengaktifkan quality control berlapis sejak hari pertama lapangan, peneliti dapat menghasilkan data yang lebih valid, lebih reliabel, dan lebih layak dijadikan dasar kebijakan maupun pengembangan ilmu. ***
BAGIAN III - MANAJEMEN DATA DAN STATISTIK DESKRIPTIF
Bab ini membahas fondasi manajemen data kuantitatif sebelum analisis statistik dilakukan. Banyak peneliti pemula langsung menjalankan uji hipotesis tanpa memastikan struktur data benar, definisi variabel konsisten, dan proses pembersihan data terdokumentasi. Akibatnya, hasil analisis terlihat rapi tetapi sesungguhnya rapuh: variabel tercampur, kode kategori ambigu, nilai hilang ditangani tidak konsisten, atau keputusan cleaning tidak bisa diaudit ulang.
Dalam praktik penelitian yang siap publikasi, kualitas data ditentukan oleh tiga pilar. Pilar pertama adalah struktur data yang benar sejak awal. Pilar kedua adalah codebook yang lengkap agar seluruh tim membaca variabel dengan definisi sama. Pilar ketiga adalah data cleaning yang sistematis, transparan, dan dapat direplikasi. Ketiga pilar ini saling terkait. Struktur data tanpa codebook akan membingungkan tim. Codebook tanpa cleaning akan menghasilkan data kotor. Cleaning tanpa dokumentasi akan menurunkan kredibilitas hasil.
Bab ini disusun sebagai panduan operasional level lanjut untuk konteks penelitian sosial kuantitatif di Indonesia. Isi bab mencakup definisi, standar teknis, contoh format, alur kerja praktis, contoh kode R, template data log, kesalahan umum, serta latihan dan kunci jawaban ringkas. Targetnya sederhana: setelah mempelajari bab ini, pembaca mampu menyiapkan dataset yang layak analisis dan layak audit.
Struktur data tabular adalah format paling umum dalam penelitian kuantitatif. Prinsip umumnya:
Walaupun terlihat sederhana, pelanggaran terhadap prinsip ini sangat sering terjadi. Misalnya, satu baris berisi dua responden sekaligus, atau satu kolom mencampur dua konsep (misalnya “umur/pendidikan”), atau satu sel berisi teks gabungan seperti “Laki-laki, 22 tahun” yang seharusnya dipisah menjadi variabel berbeda.
Unit observasi adalah entitas yang menjadi sasaran pengukuran. Unit bisa berupa individu, rumah tangga, sekolah, desa, perusahaan, atau dokumen kebijakan. Kesalahan umum muncul ketika unit observasi berubah di tengah proses tanpa penyesuaian struktur data.
Contoh:
Implikasi metodologis:
Setiap baris idealnya memiliki kunci unik (ID) agar tidak terjadi duplikasi dan memudahkan penggabungan data antar file.
Karakter ID yang baik:
Contoh format ID aman:
KAB01-KEC03-000145RESP_2026_0001Kesalahan yang perlu dihindari:
Dalam praktik analitik, data tabular memiliki dua bentuk umum: wide dan long.
nilai_t1, nilai_t2,
nilai_t3).waktu) dan nilai (nilai).Kapan wide lebih cocok:
Kapan long lebih cocok:
Catatan praktis:
Kualitas struktur data juga bergantung pada tipe data yang tepat. Tipe umum:
Kesalahan tipe data yang sering terjadi:
Dampaknya:
Agar dataset konsisten antar tim, gunakan standar berikut.
Penamaan variabel yang baik harus jelas, ringkas, dan konsisten.
Prinsip penamaan:
_) sebagai pemisah,Contoh baik:
usiajenis_kelaminpendapatan_bulananjam_belajar_mingguanContoh kurang baik:
UsiaRespondenFinalBangetx1, x2, abcjenis kelaminUntuk variabel kategorik, tentukan kode secara eksplisit di codebook.
Contoh pengkodean:
jenis_kelamin: 1 = Laki-laki, 2 = Perempuanstatus_kerja: 0 = Tidak bekerja, 1 = Bekerja informal,
2 = Bekerja formalwilayah: 1 = Perkotaan, 2 = PerdesaanAturan penting:
Nilai hilang (missing values) harus dibedakan dari nol atau nilai valid lainnya.
Contoh kode missing yang disarankan:
NA untuk tidak ada data,-99 hanya jika dibutuhkan sistem,
tetapi harus dijelaskan.Kesalahan umum:
0 padahal maknanya berbeda,Codebook adalah dokumen metadata yang menjelaskan isi dataset secara lengkap. Tanpa codebook, dataset hanya kumpulan angka yang sulit ditafsirkan.
Codebook minimal memuat:
Untuk naskah siap cetak/ISBN, codebook sebaiknya diperluas dengan:
Codebook memiliki fungsi strategis, bukan sekadar lampiran administratif.
Manfaat utama:
Kolom minimal yang sangat dianjurkan:
nama_variabellabeltipe_dataskalanilai_validkode_missingsumber_itemcatatanContoh satu baris codebook:
nama_variabel: literasi_digitallabel: Skor literasi digital totaltipe_data: numericskala: interval (0-100)nilai_valid: 0-100kode_missing: NAsumber_item: adaptasi skala A (2020)catatan: skor hasil penjumlahan 20 itemCodebook harus memiliki versi agar perubahan terdokumentasi.
Aturan sederhana:
v1.0v1.1v2.0Setiap perubahan versi wajib mencatat:
Contoh daftar variabel untuk studi mahasiswa:
id_responden - ID unik responden.jenis_kelamin - kategori gender.usia - umur dalam tahun.semester - semester aktif.ipk - indeks prestasi kumulatif.jam_belajar_mingguan - total jam belajar.literasi_digital - skor literasi digital.dukungan_keluarga - skor dukungan keluarga.status_kerja - status kerja sambilan.pendapatan_bulanan - pendapatan per bulan (juta
rupiah).akses_internet - kualitas akses internet.frekuensi_perpustakaan - kunjungan per bulan.kesehatan_mental - skor skala kesejahteraan
psikologis.wilayah_tinggal - urban/rural.tanggal_wawancara - tanggal pengisian.Data cleaning adalah proses sistematis untuk memastikan data akurat, konsisten, lengkap secara layak, dan siap dianalisis. Cleaning bukan aktivitas kosmetik untuk “memperbagus” hasil statistik.
Tahapan inti:
Tujuan tahap ini adalah memastikan setiap variabel memiliki tipe dan format sesuai desain.
Aktivitas utama:
Contoh masalah umum:
usia berisi “dua puluh” pada beberapa baris,tanggal_wawancara bercampur format
dd/mm/yyyy dan yyyy-mm-dd,Perempuan ditulis beberapa versi:
P, Perempuan, perempuan.Duplikasi dapat terjadi karena sinkronisasi ganda, kesalahan input, atau responden diwawancarai dua kali.
Jenis duplikasi:
Prosedur penanganan:
Missing tidak selalu buruk. Yang penting adalah memahami pola missing dan dampaknya terhadap inferensi.
Kategori missing:
Langkah operasional:
Catatan:
Outlier adalah nilai ekstrem yang berbeda jauh dari mayoritas data. Outlier dapat berarti kesalahan input atau fenomena nyata.
Deteksi outlier:
Keputusan terhadap outlier:
Rekoding adalah perubahan representasi nilai agar sesuai kebutuhan analisis.
Contoh rekoding:
L/P menjadi label lengkap,Aturan rekoding:
Setiap perubahan harus bisa ditelusuri. Dokumentasi adalah syarat utama replikasi dan audit.
Isi dokumentasi minimum:
Cleaning modern sebaiknya berbasis skrip agar dapat diulang otomatis.
Prinsip reproducible cleaning:
Struktur folder yang disarankan:
data_raw/data_intermediate/data_clean/scripts/logs/codebook/Manfaat alur ini:
Sebelum menjalankan uji statistik, lakukan quality checks berikut.
Checklist minimum:
Tambahan penting:
Contoh logic checks:
status_kerja = tidak bekerja tetapi
jam_kerja_mingguan > 0 -> perlu verifikasi.semester = 1 tetapi ipk = 4.5 -> di
luar rentang valid.Bagian ini mempertahankan contoh inti, lalu memperluas menjadi alur cleaning yang lebih realistis.
df <- tibble(
id = c(1,2,3,4,4),
usia = c(19, 20, NA, 22, 22),
pendapatan = c(2.5, 3.0, 2.8, 50, 50),
gender = c("L","P","P","L","L")
)
# 1) cek duplikasi id
sum(duplicated(df$id))
## [1] 1
# 2) imputasi sederhana usia
median_usia <- median(df$usia, na.rm = TRUE)
df$usia[is.na(df$usia)] <- median_usia
# 3) winsor sederhana untuk outlier pendapatan (contoh)
q <- quantile(df$pendapatan, probs = c(0.05, 0.95))
df$pendapatan_w <- pmin(pmax(df$pendapatan, q[1]), q[2])
# 4) coding kategori
df$gender <- factor(df$gender, levels = c("L", "P"), labels = c("Laki-laki", "Perempuan"))
df
## # A tibble: 5 × 5
## id usia pendapatan gender pendapatan_w
## <dbl> <dbl> <dbl> <fct> <dbl>
## 1 1 19 2.5 Laki-laki 2.56
## 2 2 20 3 Perempuan 3
## 3 3 21 2.8 Perempuan 2.8
## 4 4 22 50 Laki-laki 50
## 5 4 22 50 Laki-laki 50
Versi lanjutan yang lebih lengkap:
library(dplyr)
library(stringr)
# Simulasi data mentah dengan beberapa masalah umum
raw <- tibble(
id = c("R001", "R002", "R003", "R003", "R005"),
usia = c("19", "20", " 21", "21", "-"),
pendapatan = c("2.5", "3,0", "2.8", "2.8", "500"),
gender = c("L", "P", "Perempuan", "P", "L "),
tanggal = c("2026-01-10", "10/01/2026", "2026-01-11", "2026-01-11", "2026-01-12")
)
# A) standardisasi teks awal
clean <- raw %>%
mutate(
across(where(is.character), ~str_trim(.x)),
pendapatan = str_replace(pendapatan, ",", ".")
)
# B) konversi tipe data
clean <- clean %>%
mutate(
usia = na_if(usia, "-"),
usia = as.numeric(usia),
pendapatan = as.numeric(pendapatan)
)
# C) tangani duplikasi ID (pertahankan kemunculan pertama)
clean <- clean %>%
distinct(id, .keep_all = TRUE)
# D) harmonisasi kategori gender
clean <- clean %>%
mutate(
gender = case_when(
gender %in% c("L", "Laki-laki") ~ "Laki-laki",
gender %in% c("P", "Perempuan") ~ "Perempuan",
TRUE ~ NA_character_
)
)
# E) imputasi sederhana usia (contoh pedagogis)
clean <- clean %>%
mutate(usia = if_else(is.na(usia), median(usia, na.rm = TRUE), usia))
# F) flag outlier pendapatan dengan aturan IQR
q1 <- quantile(clean$pendapatan, 0.25, na.rm = TRUE)
q3 <- quantile(clean$pendapatan, 0.75, na.rm = TRUE)
iqr <- q3 - q1
lower <- q1 - 1.5 * iqr
upper <- q3 + 1.5 * iqr
clean <- clean %>%
mutate(flag_outlier_pendapatan = pendapatan < lower | pendapatan > upper)
clean
## # A tibble: 4 × 6
## id usia pendapatan gender tanggal flag_outlier_pendapatan
## <chr> <dbl> <dbl> <chr> <chr> <lgl>
## 1 R001 19 2.5 Laki-laki 2026-01-10 FALSE
## 2 R002 20 3 Perempuan 10/01/2026 FALSE
## 3 R003 21 2.8 Perempuan 2026-01-11 FALSE
## 4 R005 20 500 Laki-laki 2026-01-12 TRUE
Catatan pedagogis:
Setiap perubahan wajib dicatat pada data log:
Untuk standar nasional, tambahkan kolom berikut:
Kolom template:
tanggalversi_dataid_kasusvariabelnilai_lamanilai_barumetode_perubahanalasanpenanggung_jawabcatatanContoh entri log:
Data log harus memenuhi prinsip audit trail:
Praktik yang disarankan:
Isu umum:
Contoh kesalahan satuan:
Solusi:
Isu umum:
Solusi:
Isu umum:
Solusi:
YYYY-MM-DD),Codebook dan cleaning harus berjalan bersama. Codebook menentukan apa yang valid; cleaning menegakkan validitas itu pada data aktual.
Alur integratif:
Kesalahan umum:
Pada laporan akhir, peneliti sebaiknya tidak hanya menulis “data telah dibersihkan”. Reviewer membutuhkan detail proses.
Komponen pelaporan yang dianjurkan:
Contoh narasi metodologis:
“Dataset awal terdiri dari 1.250 observasi. Pemeriksaan ID menemukan 18 duplikasi, dengan 12 kasus dipertahankan berdasarkan verifikasi timestamp dan 6 kasus dihapus karena pengisian ganda. Missing pada variabel utama berkisar 0,8%-4,3%; penanganan menggunakan imputasi median untuk analisis deskriptif dan multiple imputation untuk model inferensial. Outlier pendapatan ditinjau dengan aturan IQR dan diverifikasi melalui catatan lapangan. Seluruh transformasi dicatat dalam data log versi v1.3.”
Kesalahan 1: mengedit data mentah langsung di spreadsheet.
Risiko: jejak perubahan hilang dan tidak bisa direplikasi.
Kesalahan 2: menghapus outlier tanpa verifikasi.
Risiko: bias hasil dan hilangnya informasi penting.
Kesalahan 3: menggunakan satu strategi missing untuk semua
variabel.
Risiko: ketidaktepatan inferensi karena mekanisme missing berbeda.
Kesalahan 4: rekoding tanpa update codebook.
Risiko: tim lain salah menafsirkan variabel.
Kesalahan 5: tidak menyimpan versi data.
Risiko: sulit rollback saat ada kesalahan.
Kesalahan 6: menjalankan model sebelum quality checks selesai.
Risiko: analisis didasarkan pada data yang belum valid.
Untuk proyek tim, buat rencana kerja berikut.
Untuk menjaga transparansi, laporkan indikator berikut.
Indikator struktur:
Indikator kelengkapan:
Indikator konsistensi:
Indikator kesiapan analitik:
Jika bab ini digunakan pada buku ajar nasional, lakukan standardisasi istilah agar konsisten antar bab:
Tambahan editorialis:
Skenario:
Studi meneliti pengaruh literasi digital dan dukungan keluarga terhadap IPK mahasiswa. Data mentah terkumpul 800 responden.
Masalah awal yang ditemukan:
Langkah penyelesaian:
Hasil akhir:
Pembelajaran:
Pada level dasar, missing sering ditangani dengan penghapusan baris atau imputasi sederhana. Namun untuk analisis inferensial, pendekatan ini perlu dipertimbangkan lebih kritis karena dapat memengaruhi bias estimasi dan ketepatan standar error.
Listwise deletion menghapus observasi yang memiliki missing pada variabel yang digunakan model.
Kelebihan:
Keterbatasan:
Kapan dapat dipertimbangkan:
Imputasi sederhana (mean/median/mode) sering dipakai pada tahap eksplorasi atau kebutuhan operasional cepat.
Kelebihan:
Keterbatasan:
Prinsip:
Multiple imputation membuat beberapa dataset hasil imputasi, menjalankan analisis pada masing-masing dataset, lalu menggabungkan hasilnya. Pendekatan ini lebih kuat dibanding imputasi tunggal ketika missing cukup berarti.
Keunggulan:
Catatan implementasi:
Untuk transparansi, laporan metodologi minimal memuat:
Dengan pelaporan ini, pembaca memahami bahwa hasil analisis tidak lahir dari keputusan cleaning yang tersembunyi.
Dalam proyek kuantitatif, dataset sering berasal dari banyak sumber: survei individu, data rumah tangga, data sekolah, data wilayah, atau data administratif. Penggabungan data (join) menjadi titik kritis karena kesalahan kecil dapat merusak seluruh analisis.
Jenis join yang umum:
Prinsip praktis:
left join
agar unit utama tidak hilang tanpa sadar;anti join sebagai quality check untuk menemukan
mismatch key.Sebelum join, lakukan tiga pemeriksaan:
Contoh masalah:
id_sekolah pada file A berupa angka, di file B berupa
teks dengan nol di depan;Setelah join, cek:
NA baru pada variabel hasil gabungan,Aturan audit sederhana:
library(dplyr)
utama <- tibble(
id_responden = c("R001", "R002", "R003", "R004"),
id_kecamatan = c("K01", "K01", "K02", "K03"),
ipk = c(3.2, 3.5, 2.9, 3.8)
)
wilayah <- tibble(
id_kecamatan = c("K01", "K02"),
indeks_kemiskinan = c(12.4, 18.1)
)
# Join utama
gabung <- utama %>% left_join(wilayah, by = "id_kecamatan")
# Quality check: kecamatan yang tidak match
tidak_match <- utama %>% anti_join(wilayah, by = "id_kecamatan")
gabung
## # A tibble: 4 × 4
## id_responden id_kecamatan ipk indeks_kemiskinan
## <chr> <chr> <dbl> <dbl>
## 1 R001 K01 3.2 12.4
## 2 R002 K01 3.5 12.4
## 3 R003 K02 2.9 18.1
## 4 R004 K03 3.8 NA
tidak_match
## # A tibble: 1 × 3
## id_responden id_kecamatan ipk
## <chr> <chr> <dbl>
## 1 R004 K03 3.8
Contoh di atas menunjukkan K03 tidak memiliki pasangan
pada data wilayah. Keputusan lanjutannya bisa berupa pelengkapan data
referensi atau pelaporan eksplisit bahwa indikator wilayah tidak
tersedia untuk sebagian unit.
Pendekatan rule-based membantu tim menjaga konsistensi keputusan cleaning. Alih-alih keputusan ad-hoc, tim menetapkan aturan sejak awal.
Contoh aturan:
usia harus 15-65 untuk studi pemuda kerja,ipk harus 0-4,jam_belajar_mingguan harus 0-120,status_kerja = 0 maka
jam_kerja_mingguan harus 0.Keuntungan pendekatan rule-based:
Rule bisa dibagi menjadi:
Contoh hard rule:
Contoh soft rule:
Dengan klasifikasi ini, tim dapat memprioritaskan perbaikan berdasarkan tingkat risiko.
Untuk dataset besar, quality checks manual akan lambat dan rentan kelupaan. Automasi membantu memastikan semua pemeriksaan dijalankan konsisten.
Langkah automasi minimum:
Output automasi sebaiknya berupa:
Jika memungkinkan, integrasikan output ke dashboard internal agar supervisor data dapat memantau progres harian.
Ketika beberapa orang mengerjakan cleaning secara paralel, risiko inkonsistensi meningkat. Karena itu, tata kelola kolaborasi wajib disiapkan.
Prinsip kolaborasi:
Setiap perubahan besar (misal rekoding variabel utama) sebaiknya melalui tahapan:
Dengan mekanisme ini, proyek terhindar dari perubahan diam-diam yang sulit dilacak.
Survei digital memberi keunggulan validasi real-time, tetapi tetap memerlukan cleaning pasca-pengumpulan.
Keunggulan validasi real-time:
Namun masalah yang masih bisa muncul:
Tambahan checks untuk data digital:
Di tahap penulisan, integritas data harus tetap dijaga. Jangan mengubah data hanya untuk "membuat hasil signifikan". Praktik tersebut melanggar etika ilmiah.
Prinsip integritas:
Contoh pelaporan jujur:
"Hasil model sensitif terhadap perlakuan outlier pendapatan; karena itu penelitian melaporkan dua spesifikasi model (tanpa winsorisasi dan dengan winsorisasi) sebagai uji ketahanan hasil."
Pendekatan ini meningkatkan kredibilitas naskah dibanding hanya menampilkan satu hasil terbaik.
Data freeze adalah titik ketika dataset final ditetapkan untuk analisis utama. Setelah freeze, perubahan harus sangat terbatas dan melalui prosedur resmi.
Checklist data freeze:
Format penamaan file final yang disarankan:
data_clean_v2_0_2026-02-27.csvcodebook_v2_0_2026-02-27.xlsxdata_log_v2_0_2026-02-27.csvDengan sistem ini, tim dapat menghindari kebingungan akibat banyak file "final_revisi_fix_terbaru" yang sering muncul pada proyek tanpa tata kelola.
Untuk konteks kelas metodologi, dosen dapat menilai kualitas manajemen data mahasiswa menggunakan rubrik.
Komponen rubrik:
Interpretasi:
Rubrik ini membantu mahasiswa memahami bahwa manajemen data memiliki bobot ilmiah setara dengan analisis statistik.
Jika bab ini ditujukan untuk buku ajar nasional, sertakan lampiran operasional berikut agar pembaca dapat langsung menerapkan materi:
Gunakan istilah secara konsisten antar bab:
Konsistensi istilah akan mengurangi salah tafsir konseptual dan meningkatkan kualitas akademik naskah secara keseluruhan.
Untuk kepentingan pembelajaran metodologi kuantitatif, Bab 10 sebaiknya digunakan dalam dua tahap. Tahap pertama berfokus pada praktik teknis: mahasiswa membangun struktur data, menyusun codebook, lalu menjalankan cleaning dasar hingga lanjutan secara skrip. Tahap kedua berfokus pada argumentasi metodologis: mahasiswa diminta menjelaskan mengapa suatu keputusan cleaning diambil dan bagaimana keputusan itu mempengaruhi inferensi. Dengan skema ini, mahasiswa tidak hanya bisa "membersihkan data", tetapi juga memahami konsekuensi ilmiah dari setiap tindakan. Pendekatan ini sangat relevan untuk skripsi, tesis, evaluasi program, dan riset kebijakan, karena kualitas temuan akhir sangat bergantung pada disiplin manajemen data di tahap awal penelitian. Dalam konteks kelas, dosen juga disarankan menilai proses, bukan hanya output akhir, agar mahasiswa terbiasa bekerja transparan, terdokumentasi, dan bertanggung jawab secara akademik. Pola ini mendorong budaya riset yang reproducible dan memperkuat kualitas keputusan statistik pada tahap analisis lanjutan. Dampaknya terlihat pada meningkatnya konsistensi laporan metode antarpeneliti. Praktik tersebut juga memperkuat kesiapan data untuk audit eksternal. Hal ini penting untuk mutu kebijakan berbasis bukti secara nasional.
Struktur data yang benar, codebook yang lengkap, dan data cleaning yang disiplin merupakan fondasi analisis kuantitatif yang kredibel. Ketika tiga komponen ini dikerjakan secara sistematis, hasil statistik menjadi lebih dapat dipercaya, lebih mudah direplikasi, dan lebih kuat saat dipertanggungjawabkan di hadapan pembimbing, reviewer, maupun pembaca publik. Dalam praktik penelitian modern, kualitas temuan bukan hanya ditentukan oleh teknik analisis yang canggih, tetapi oleh ketelitian menata data sejak awal hingga akhir. ***
Statistik deskriptif, visualisasi, dan eksplorasi data merupakan fondasi analisis kuantitatif sebelum peneliti melangkah ke inferensi atau pengujian hipotesis. Banyak kesalahan metodologis terjadi karena peneliti melewati tahap eksplorasi dan langsung menjalankan model statistik. Akibatnya, hasil uji terlihat “signifikan”, tetapi dibangun di atas data dengan distribusi tidak dipahami, outlier tidak ditinjau, missing tidak dipetakan, atau pola hubungan yang sebenarnya non-linear.
Bab ini menempatkan analisis deskriptif sebagai proses ilmiah, bukan sekadar tabel angka di awal laporan. Tujuannya bukan hanya “meringkas” data, tetapi membaca karakter data secara mendalam: pusat distribusi, penyebaran, bentuk distribusi, anomali, ketimpangan kelompok, serta indikasi hubungan awal antarvariabel. Dengan pemahaman ini, peneliti dapat memilih model inferensial yang lebih tepat dan menulis interpretasi yang lebih bertanggung jawab.
Dalam konteks buku ajar nasional, pembahasan difokuskan pada praktik yang dapat langsung diterapkan di kelas, skripsi/tesis, dan riset kebijakan. Bab ini dilengkapi konsep inti, contoh sosial, contoh kode R, prinsip visualisasi, standar pelaporan, kesalahan umum, latihan, serta kunci jawaban ringkas.
Statistik deskriptif berfungsi sebagai jembatan antara data mentah dan inferensi. Fungsi utamanya:
Pada penelitian sosial, statistik deskriptif juga penting untuk menjawab pertanyaan kebijakan dasar. Contoh:
Pertanyaan ini sering kali sudah bernilai kebijakan, bahkan sebelum model inferensial dijalankan.
Ukuran pemusatan menggambarkan titik pusat distribusi data. Tiga ukuran inti:
Mean adalah jumlah seluruh nilai dibagi banyak observasi. Mean sangat informatif untuk data numerik kontinu, terutama ketika distribusi relatif simetris.
Kelebihan mean:
Keterbatasan mean:
Contoh:
Jika pendapatan mayoritas responden berada di kisaran 2-5 juta, tetapi ada beberapa nilai 50 juta, mean dapat meningkat tajam dan tidak lagi mewakili mayoritas responden.
Median adalah nilai yang membagi data terurut menjadi dua bagian sama besar. Median lebih robust terhadap outlier dibanding mean.
Kapan median lebih tepat:
Interpretasi median:
Jika median pendapatan 3,2 juta, artinya 50% responden memiliki pendapatan <= 3,2 juta dan 50% lainnya >= 3,2 juta.
Modus adalah nilai yang paling sering muncul. Modus berguna terutama untuk data kategorik.
Contoh penggunaan:
Catatan:
Panduan praktis:
Dalam pelaporan yang baik, mean dan median sering dilaporkan bersamaan untuk memberi gambaran lebih lengkap.
Berikut rumus-rumus yang paling sering dipakai pada analisis deskriptif.
\[ \bar{x} = \frac{1}{n}\sum_{i=1}^{n}x_i \]
\[ \bar{x}_w = \frac{\sum_{i=1}^{n} w_i x_i}{\sum_{i=1}^{n} w_i} \]
Untuk data yang diurutkan \(x_{(1)} \le \cdots \le x_{(n)}\):
\[ \tilde{x} = \begin{cases} x_{\left(\frac{n+1}{2}\right)}, & n \text{ ganjil} \\ \frac{x_{(n/2)} + x_{(n/2+1)}}{2}, & n \text{ genap} \end{cases} \]
Modus adalah nilai dengan frekuensi terbesar:
\[ \text{Mo} = \arg\max_x f(x) \]
dengan \(f(x)\) frekuensi kemunculan nilai \(x\).
\[ s^2 = \frac{1}{n-1}\sum_{i=1}^{n}(x_i-\bar{x})^2 \]
\[ s = \sqrt{s^2} \]
\[ R = x_{\max} - x_{\min} \]
\[ IQR = Q_3 - Q_1 \]
\[ CV = \frac{s}{\bar{x}} \times 100\% \]
\[ P_p = \text{nilai pada posisi } \frac{p}{100}(n+1) \]
\[ g_1 = \frac{\frac{1}{n}\sum_{i=1}^{n}(x_i-\bar{x})^3}{\left(\frac{1}{n}\sum_{i=1}^{n}(x_i-\bar{x})^2\right)^{3/2}} \]
\[ g_2 = \frac{\frac{1}{n}\sum_{i=1}^{n}(x_i-\bar{x})^4}{\left(\frac{1}{n}\sum_{i=1}^{n}(x_i-\bar{x})^2\right)^2} \]
Untuk kategori ke-\(j\):
\[ p_j = \frac{f_j}{n},\quad \%\_j = p_j \times 100\% \]
dengan \(f_j\) adalah frekuensi kategori ke-\(j\).
Ukuran pemusatan saja tidak cukup. Dua kelompok bisa memiliki mean sama tetapi tingkat variasi berbeda jauh. Karena itu, ukuran penyebaran wajib dilaporkan.
Ukuran inti:
Varians mengukur rata-rata kuadrat deviasi nilai terhadap mean.
Makna praktis:
Keterbatasan:
Simpangan baku adalah akar kuadrat varians, sehingga kembali ke satuan asli data.
Interpretasi sederhana:
Dalam distribusi mendekati normal:
Aturan ini berguna sebagai orientasi awal, bukan hukum mutlak untuk semua data sosial.
Rentang = nilai maksimum - nilai minimum.
Kelebihan:
Keterbatasan:
IQR adalah selisih kuartil ketiga (Q3) dan kuartil pertama (Q1), mencakup 50% data tengah.
Kelebihan IQR:
Selain pusat dan penyebaran, bentuk distribusi menentukan cara membaca data dan memilih metode analisis.
Aspek penting:
Skewness menggambarkan ketidaksimetrian distribusi.
Jenis umum:
Contoh sosial:
Implikasi:
Kurtosis menggambarkan ketebalan ekor distribusi dan konsentrasi nilai di sekitar pusat.
Interpretasi umum:
Dalam praktik terapan, kurtosis dipakai sebagai indikator tambahan, bukan satu-satunya dasar keputusan analitik.
Distribusi multimodal memiliki lebih dari satu puncak. Ini bisa menandakan adanya subpopulasi dengan karakter berbeda.
Contoh:
Distribusi skor kemampuan digital mahasiswa memiliki dua puncak: kelompok yang sangat terbiasa teknologi dan kelompok yang terbatas aksesnya.
Implikasi:
Walau pembahasan sering fokus pada data numerik, riset sosial banyak memakai data kategorik. Untuk variabel kategorik, ukuran utama:
Contoh pelaporan baik:
Jenis kelamin: 54,2% perempuan, 45,8% laki-laki.Status kerja: 38% tidak bekerja, 42% informal, 20% formal.Catatan:
Analisis deskriptif lebih bernilai bila membandingkan kelompok relevan.
Contoh perbandingan:
Prinsip kehati-hatian:
Exploratory Data Analysis (EDA) adalah pendekatan sistematis untuk memahami data melalui kombinasi statistik ringkas dan visualisasi. EDA bertujuan menemukan pola, anomali, dan hipotesis awal.
Tahap EDA yang disarankan:
EDA yang baik selalu menghasilkan keputusan konkret, misalnya:
set.seed(42)
df2 <- tibble(
jam_belajar = rnorm(120, mean = 3.5, sd = 1.1),
nilai = 55 + 7 * jam_belajar + rnorm(120, sd = 6),
kelompok = sample(c("Kontrol", "Intervensi"), 120, replace = TRUE)
)
summary(df2)
## jam_belajar nilai kelompok
## Min. :0.2076 Min. : 57.71 Length:120
## 1st Qu.:2.8667 1st Qu.: 73.15 Class :character
## Median :3.5980 Median : 79.21 Mode :character
## Mean :3.5326 Mean : 79.09
## 3rd Qu.:4.2192 3rd Qu.: 86.22
## Max. :6.4721 Max. :100.17
psych::describe(df2[, c("jam_belajar", "nilai")])
## vars n mean sd median trimmed mad min max range skew
## jam_belajar 1 120 3.53 1.14 3.60 3.56 0.99 0.21 6.47 6.26 -0.25
## nilai 2 120 79.09 8.97 79.21 79.42 9.73 57.71 100.17 42.46 -0.28
## kurtosis se
## jam_belajar 0.23 0.10
## nilai -0.42 0.82
Kode di atas memberikan dua level ringkasan:
summary() menampilkan min, kuartil, median, mean,
max,psych::describe() memberi ringkasan lebih kaya termasuk
SD, skewness, kurtosis.Tambahan EDA yang dianjurkan:
# Cek missing
colSums(is.na(df2))
## jam_belajar nilai kelompok
## 0 0 0
# Korelasi awal antar variabel numerik
cor(df2$jam_belajar, df2$nilai)
## [1] 0.80735
# Ringkasan per kelompok
df2 %>%
group_by(kelompok) %>%
summarise(
n = n(),
mean_nilai = mean(nilai),
sd_nilai = sd(nilai),
median_nilai = median(nilai)
)
## # A tibble: 2 × 5
## kelompok n mean_nilai sd_nilai median_nilai
## <chr> <int> <dbl> <dbl> <dbl>
## 1 Intervensi 57 79.2 9.26 80.1
## 2 Kontrol 63 79.0 8.77 78.4
Output ini membantu membaca apakah ada perbedaan awal antar kelompok
dan apakah hubungan jam_belajar dengan nilai
tampak linear.
ggplot(df2, aes(nilai)) +
geom_histogram(bins = 20, fill = "#0a3d91", color = "white") +
labs(title = "Distribusi Nilai", x = "Nilai", y = "Frekuensi")
Histogram membantu melihat bentuk distribusi, skewness, dan kemungkinan outlier. Pilihan jumlah bins memengaruhi tampilan; gunakan nilai yang tidak terlalu kasar dan tidak terlalu halus.
ggplot(df2, aes(kelompok, nilai, fill = kelompok)) +
geom_boxplot(alpha = 0.7) +
scale_fill_manual(values = c("#0a3d91", "#f07b16")) +
theme(legend.position = "none") +
labs(title = "Perbandingan Nilai per Kelompok")
Boxplot efektif menampilkan median, IQR, dan kandidat outlier antar kelompok.
Scatterplot hubungan dua variabel numerik:
ggplot(df2, aes(jam_belajar, nilai, color = kelompok)) +
geom_point(alpha = 0.75) +
geom_smooth(method = "lm", se = FALSE) +
scale_color_manual(values = c("#0a3d91", "#f07b16")) +
labs(title = "Hubungan Jam Belajar dan Nilai", x = "Jam Belajar", y = "Nilai")
Density plot per kelompok:
ggplot(df2, aes(nilai, fill = kelompok)) +
geom_density(alpha = 0.35) +
scale_fill_manual(values = c("#0a3d91", "#f07b16")) +
labs(title = "Kurva Kepadatan Nilai per Kelompok", x = "Nilai", y = "Densitas")
Bar chart variabel kategorik:
ggplot(df2, aes(kelompok, fill = kelompok)) +
geom_bar() +
scale_fill_manual(values = c("#0a3d91", "#f07b16")) +
theme(legend.position = "none") +
labs(title = "Komposisi Sampel per Kelompok", x = "Kelompok", y = "Jumlah")
Visualisasi statistik bukan dekorasi, tetapi alat berpikir. Prinsip penting:
Kesalahan umum visualisasi:
Outlier tidak selalu kesalahan. Pada data sosial, outlier bisa mewakili kelompok kecil yang substantif penting.
Langkah membaca outlier:
Contoh:
Nilai pendapatan sangat tinggi mungkin benar untuk responden pengusaha sukses. Menghapus nilai ini tanpa alasan dapat mereduksi realitas ketimpangan yang justru penting.
Missing harus dilaporkan sebagai bagian dari kualitas data, bukan disembunyikan.
Pelaporan minimal:
Praktik baik:
Tabel deskriptif yang baik biasanya mencakup:
Contoh format ringkas:
Usia (tahun): 20,8 (2,1), N=480Pendapatan (juta): median 3,4 (IQR 2,1-5,2), N=450Kelompok intervensi: 52,1%Untuk konsistensi naskah nasional, pilih satu gaya pelaporan dan gunakan seragam di seluruh bab.
Deskripsi data yang baik bukan daftar angka tanpa makna. Narasi harus:
Contoh narasi kuat:
“Rata-rata jam belajar responden adalah 3,6 jam per hari (SD 1,1), dengan distribusi nilai akademik cenderung simetris. Kelompok intervensi menunjukkan median nilai lebih tinggi dibanding kontrol, meski terdapat tumpang tindih distribusi yang cukup besar. Ditemukan beberapa nilai pendapatan ekstrem yang telah diverifikasi sebagai kasus valid dan tetap dipertahankan pada analisis deskriptif.”
Laporan deskriptif yang baik menyebutkan:
Tambahan untuk laporan lebih kuat:
Kesalahan 1: hanya melaporkan mean tanpa SD/median/IQR.
Dampak: pembaca tidak tahu variasi data.
Kesalahan 2: menyimpulkan sebab-akibat dari tabel deskriptif.
Dampak: overclaim metodologis.
Kesalahan 3: tidak menyebut N valid tiap variabel.
Dampak: interpretasi bias jika missing besar.
Kesalahan 4: memilih grafik tidak sesuai tipe data.
Dampak: informasi salah dibaca.
Kesalahan 5: mengabaikan outlier tanpa catatan.
Dampak: transparansi ilmiah rendah.
Untuk proyek tim, gunakan alur berikut.
Tahap 1: audit data awal
Tahap 2: statistik deskriptif inti
Tahap 3: visualisasi kunci
Tahap 4: memo temuan
Konteks:
Studi menilai hubungan jam belajar dan nilai statistik pada 120 mahasiswa, dengan dua kelompok pembelajaran.
Temuan deskriptif hipotetik:
Interpretasi awal:
Statistik deskriptif harus memandu keputusan inferensial berikutnya.
Contoh integrasi:
Dengan cara ini, inferensi tidak dilakukan secara mekanis, melainkan berbasis pemahaman data.
Sebelum finalisasi laporan, cek:
Checklist sederhana ini membantu menjaga mutu penulisan akademik dan kesiapan publikasi.
Untuk buku ajar nasional, bagian deskriptif sebaiknya memiliki konsistensi editorial berikut:
Tambahkan lampiran praktis:
Dengan demikian, bab tidak hanya informatif tetapi juga langsung dapat dipakai dosen, mahasiswa, dan peneliti terapan.
Setelah analisis univariat selesai, langkah berikutnya adalah melihat hubungan antarvariabel. Tahap ini masih bersifat eksploratif, namun sangat penting untuk membaca pola awal.
Untuk dua variabel numerik, alat utama:
Hal yang perlu diperhatikan:
Korelasi tinggi tidak selalu berarti hubungan kausal. Korelasi bisa dipengaruhi variabel ketiga, struktur kelompok, atau pola non-linear.
Untuk satu variabel kategorik dan satu variabel numerik:
Pertanyaan deskriptif:
Untuk dua variabel kategorik:
Fokus interpretasi:
Matriks korelasi berguna untuk memetakan hubungan awal beberapa variabel numerik sekaligus.
Praktik baik:
Peringatan:
Contoh kode matriks korelasi:
num_vars <- df2 %>% dplyr::select(jam_belajar, nilai)
cor(num_vars, use = "pairwise.complete.obs")
## jam_belajar nilai
## jam_belajar 1.00000 0.80735
## nilai 0.80735 1.00000
Untuk visual:
library(GGally)
GGally::ggpairs(df2[, c("jam_belajar", "nilai")])
Kadang distribusi variabel sangat miring sehingga sulit dibaca. Transformasi dapat membantu pada tahap eksplorasi.
Transformasi umum:
log(x) atau log1p(x)),Kapan digunakan:
Catatan:
Faceting membantu melihat pola per subkelompok tanpa membuat grafik terlalu padat.
Contoh:
ggplot(df2, aes(nilai)) +
geom_histogram(bins = 18, fill = "#0a3d91", color = "white") +
facet_wrap(~kelompok) +
labs(title = "Distribusi Nilai per Kelompok")
Manfaat:
Density overlay atau histogram overlay berguna untuk melihat tumpang tindih distribusi.
Kehati-hatian:
alpha) dan label jelas.Untuk pelaporan ringkas mean dan ketidakpastian awal, gunakan point-range/error bar.
df2 %>%
group_by(kelompok) %>%
summarise(
mean_nilai = mean(nilai),
se_nilai = sd(nilai) / sqrt(n())
) %>%
ggplot(aes(kelompok, mean_nilai, color = kelompok)) +
geom_point(size = 3) +
geom_errorbar(aes(ymin = mean_nilai - se_nilai, ymax = mean_nilai + se_nilai), width = 0.1) +
scale_color_manual(values = c("#0a3d91", "#f07b16")) +
theme(legend.position = "none") +
labs(title = "Rata-rata Nilai dan Standard Error")
Grafik ini deskriptif, bukan uji signifikansi final.
Riset sosial sering memakai data Likert (1-5 atau 1-7). Perlakukan data ini secara konsisten.
Pendekatan deskriptif:
Visualisasi yang cocok:
Kelebihan diverging bar:
Jika data punya dimensi waktu (harian, bulanan, tahunan), statistik deskriptif perlu memeriksa pola temporal.
Aspek penting:
Grafik utama:
Contoh interpretasi:
"Rata-rata kunjungan layanan meningkat bertahap dari Januari ke Juni, tetapi turun tajam pada April karena gangguan sistem eksternal."
Tanpa eksplorasi waktu, perubahan tersebut bisa salah ditafsirkan sebagai efek kebijakan.
Pada data wilayah, deskriptif dapat diperkuat dengan pemetaan sederhana.
Format minimal:
Kehati-hatian:
Segmentasi membantu memahami heterogenitas populasi.
Contoh segmentasi:
Tujuan segmentasi:
Prinsip:
Pada proyek institusi, dashboard deskriptif berguna untuk monitoring.
Komponen dashboard minimum:
Aturan desain dashboard:
Dashboard bukan pengganti analisis mendalam, tetapi alat komunikasi cepat kepada pengambil keputusan.
Untuk meningkatkan keandalan bacaan deskriptif, lakukan robust checks:
Contoh:
Jika mean pendapatan 6,2 tetapi median 3,1, artinya distribusi sangat miring dan interpretasi harus berhati-hati.
Dalam laporan kebijakan, grafik harus menjawab pertanyaan keputusan.
Struktur narasi yang efektif:
Contoh:
"Grafik boxplot menunjukkan median nilai kelompok intervensi lebih tinggi dibanding kontrol dengan sebaran lebih sempit. Temuan deskriptif ini mengisyaratkan program berpotensi meningkatkan konsistensi hasil belajar, meski uji inferensial masih diperlukan untuk konfirmasi statistik."
Visualisasi juga memiliki dimensi etika. Grafik yang menyesatkan dapat menghasilkan keputusan kebijakan yang salah.
Prinsip etika:
Etika ini penting terutama saat hasil dipublikasikan ke publik luas.
Urutan yang disarankan:
Dengan urutan ini, pembaca dapat mengikuti logika analisis secara sistematis.
Gunakan checklist cepat sebelum finalisasi:
Checklist ini mencegah kesalahan presentasi yang sering muncul pada tahap akhir.
Konteks:
Penelitian pendidikan tinggi mengumpulkan data 1.200 mahasiswa dari 8 kampus untuk melihat faktor terkait capaian akademik.
Variabel utama:
Temuan deskriptif utama (simulatif):
Temuan visual:
Implikasi awal:
Kasus ini menunjukkan nilai strategis deskriptif dalam menyusun model inferensial yang lebih tepat.
Kesalahan 1: menganggap perbedaan visual kecil pasti tidak penting. : perbedaan kecil bisa substantif penting pada sampel besar atau konteks kebijakan tertentu.
Kesalahan 2: menganggap pola visual sebagai bukti final. : visualisasi memberi indikasi, bukan konfirmasi inferensial.
Kesalahan 3: menafsirkan korelasi sebagai arah sebab-akibat. : kausalitas membutuhkan desain dan asumsi tambahan.
Kesalahan 4: mengabaikan peran ukuran sampel per kelompok. : kelompok kecil dapat menghasilkan grafik yang tampak ekstrem karena varians sampling.
Hubungan dengan Bab 10:
Hubungan dengan Bab 12:
Karena itu, Bab 11 harus dipahami sebagai jembatan metodologis, bukan bagian dekoratif laporan.
Untuk kebutuhan pengajaran, Bab 11 efektif diterapkan dalam format studio data, bukan hanya ceramah teori. Mahasiswa bekerja langsung dengan dataset nyata/simulatif, lalu menyusun output deskriptif terstruktur.
Skema studio 3 sesi:
Target capaian:
Keuntungan studio data:
Rubrik membantu penilaian lebih objektif.
Komponen rubrik:
Indikator nilai tinggi:
Indikator nilai rendah:
Dalam kebijakan publik, audiens tidak selalu berlatar statistik. Karena itu, hasil deskriptif perlu dikomunikasikan dengan bahasa jelas tanpa mengorbankan akurasi.
Prinsip komunikasi:
Contoh terjemahan:
Pendekatan ini meningkatkan pemanfaatan temuan dalam praktik kebijakan.
Karena buku ini bersifat komprehensif, konsistensi istilah sangat penting.
Gunakan secara konsisten:
Hindari mencampur istilah berbeda untuk konsep sama tanpa penjelasan, karena dapat membingungkan pembaca pemula.
Agar hasil deskriptif siap diterbitkan:
Untuk tema buku biru-oranye:
Dengan standar ini, tampilan tetap profesional dan mudah dipahami.
Bab 11 idealnya dipakai sebagai gerbang kualitas sebelum masuk ke inferensi. Jika tahap ini dikerjakan dengan disiplin, peneliti akan lebih siap memilih uji yang tepat, menafsirkan hasil secara proporsional, dan menghindari kesalahan klaim. Dalam konteks pendidikan tinggi, bab ini membantu mahasiswa membangun kebiasaan analitik yang sehat: membaca data secara jujur, memeriksa anomali, serta menulis temuan yang argumentatif namun tetap hati-hati. Untuk kebutuhan buku ajar nasional, pendekatan ini penting agar pembaca tidak hanya mampu menghasilkan grafik yang menarik, tetapi juga mampu menjelaskan makna statistiknya secara benar dan bertanggung jawab.
Agar materi Bab 11 dapat langsung dioperasionalkan di kelas atau workshop, berikut skema praktik cepat 90 menit.
Sesi 1 (20 menit): audit struktur dan ringkasan awal
summary() dan describe(),Sesi 2 (35 menit): visualisasi inti
Sesi 3 (20 menit): narasi deskriptif singkat
Sesi 4 (15 menit): refleksi metodologis
Output akhir:
Paket output ini sudah cukup sebagai fondasi kuat untuk transisi ke Bab 12.
Sebelum memulai Bab 12 (inferensi), pastikan hasil Bab 11 memenuhi daftar cek berikut:
Jika semua poin ini terpenuhi, proses inferensial akan lebih terarah, asumsi model lebih mudah diverifikasi, dan kualitas argumen metodologis pada laporan akhir akan meningkat secara signifikan.
Praktik ini juga memperkuat konsistensi keputusan analitik tim lintas institusi nasional. Dengan demikian hasil deskriptif tidak berhenti sebagai ringkasan angka melainkan menjadi dasar dialog ilmiah pedagogik dan perbaikan kebijakan berbasis data nasional.
Statistik deskriptif, visualisasi, dan eksplorasi data adalah tahap strategis untuk memahami karakter data secara jernih sebelum membuat klaim inferensial. Ketika peneliti menguasai tahap ini, keputusan analitik berikutnya menjadi lebih tepat, interpretasi lebih bertanggung jawab, dan laporan penelitian lebih kuat secara metodologis. Dalam praktik riset kuantitatif modern, kualitas temuan tidak hanya ditentukan oleh kecanggihan model, tetapi oleh kedalaman pemahaman terhadap data yang dianalisis. ***
Inferensi statistik menyimpulkan karakteristik populasi berdasarkan informasi sampel. Ketidakpastian inferensi direpresentasikan melalui standard error, interval kepercayaan, dan pengujian hipotesis. Kerangka inferensi ini menjadi fondasi statistik modern dalam riset sosial kuantitatif (Walpole et al., 2012; Casella & Berger, 2002).
Keduanya sebaiknya dilaporkan bersama ukuran efek. Pelaporan bersama ini direkomendasikan agar interpretasi tidak berhenti pada signifikansi statistik semata (Cumming, 2014; Wasserstein & Lazar, 2016).
Power = 1 - beta. Konsep kesalahan dan power sangat penting untuk perencanaan ukuran sampel dan ketepatan inferensi (Cohen, 1988; Field, 2018).
Rata-rata sampel:
\[ \bar{X}=\frac{1}{n}\sum_{i=1}^n X_i \]
Standard error untuk mean:
\[ SE(\bar{X}) = \frac{s}{\sqrt{n}} \]
Statistik uji t satu sampel:
\[ t=\frac{\bar{X}-\mu_0}{s/\sqrt{n}} \]
Interval kepercayaan 95%:
\[ \bar{X}\pm t_{\alpha/2,df}\cdot SE(\bar{X}) \]
Untuk dua sampel independen (Welch):
\[ t=\frac{\bar{X}_1-\bar{X}_2}{\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}} \]
Derajat bebas aproksimasi Welch:
\[ df \approx \frac{\left(\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}\right)^2} {\frac{\left(\frac{s_1^2}{n_1}\right)^2}{n_1-1}+\frac{\left(\frac{s_2^2}{n_2}\right)^2}{n_2-1}} \]
A <- c(70, 75, 80, 74, 78)
B <- c(65, 68, 70, 67, 69)
t.test(A, B)
##
## Welch Two Sample t-test
##
## data: A and B
## t = 3.9511, df = 5.8824, p-value = 0.007834
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## 2.870358 12.329642
## sample estimates:
## mean of x mean of y
## 75.4 67.8
\[ d = \frac{\bar{x}_1 - \bar{x}_2}{s_p} \]
dengan pooled standard deviation:
\[ s_p = \sqrt{\frac{(n_1-1)s_1^2 + (n_2-1)s_2^2}{n_1+n_2-2}} \]
Interpretasi praktis Cohen’s d (aturan awal):
Gunakan data:
Rata-rata:
\[ \bar{X}_A = \frac{70+75+80+74+78}{5}=75.4,\quad \bar{X}_B = \frac{65+68+70+67+69}{5}=67.8 \]
Varians sampel:
\[ s_A^2=\frac{\sum (A_i-\bar{X}_A)^2}{4}=\frac{59.2}{4}=14.8,\quad s_B^2=\frac{\sum (B_i-\bar{X}_B)^2}{4}=\frac{14.8}{4}=3.7 \]
Statistik \(t\) Welch:
\[ t=\frac{75.4-67.8}{\sqrt{14.8/5+3.7/5}} =\frac{7.6}{\sqrt{3.70}} =\frac{7.6}{1.923}\approx 3.95 \]
Pooled SD untuk Cohen’s \(d\):
\[ s_p=\sqrt{\frac{4(14.8)+4(3.7)}{8}} =\sqrt{9.25}=3.041 \]
\[ d=\frac{7.6}{3.041}\approx 2.50 \]
Nilai \(d\) sekitar 2.50 menunjukkan efek praktis sangat besar.
BAGIAN IV - UJI STATISTIK LANJUTAN
Korelasi Pearson mengukur kekuatan hubungan linear dua variabel kontinu:
\[ r = \frac{\sum (x-\bar{x})(y-\bar{y})}{\sqrt{\sum(x-\bar{x})^2\sum(y-\bar{y})^2}} \] Penggunaan korelasi Pearson menuntut perhatian pada linearitas, outlier, dan skala pengukuran (Agresti & Finlay, 2009; Field, 2018).
Uji signifikansi korelasi:
\[ t = r\sqrt{\frac{n-2}{1-r^2}}, \quad df=n-2 \]
Koefisien determinasi korelasi:
\[ R^2 = r^2 \]
x <- c(2,3,4,5,6,7)
y <- c(3,4,5,6,7,8)
cor.test(x, y, method = "pearson")
##
## Pearson's product-moment correlation
##
## data: x and y
## t = Inf, df = 4, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 1 1
## sample estimates:
## cor
## 1
\[ Y = \beta_0 + \beta_1 X + \epsilon \] Model ini diestimasi dengan metode ordinary least squares (OLS) dan banyak dipakai untuk prediksi maupun penjelasan hubungan awal antarvariabel (Wooldridge, 2016).
Estimator OLS:
\[ \hat{\beta}_1 = \frac{\sum (x_i-\bar{x})(y_i-\bar{y})}{\sum (x_i-\bar{x})^2}, \quad \hat{\beta}_0 = \bar{y} - \hat{\beta}_1\bar{x} \]
Prediksi:
\[ \hat{Y}_i = \hat{\beta}_0 + \hat{\beta}_1 X_i \]
mod1 <- lm(y ~ x)
summary(mod1)
##
## Call:
## lm(formula = y ~ x)
##
## Residuals:
## 1 2 3 4 5 6
## 6.731e-16 -6.170e-16 -1.876e-16 -1.488e-16 -3.695e-17 3.173e-16
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.000e+00 5.733e-16 1.744e+15 <2e-16 ***
## x 1.000e+00 1.191e-16 8.395e+15 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 4.983e-16 on 4 degrees of freedom
## Multiple R-squared: 1, Adjusted R-squared: 1
## F-statistic: 7.048e+31 on 1 and 4 DF, p-value: < 2.2e-16
par(mfrow = c(2,2))
plot(mod1)
par(mfrow = c(1,1))
Data:
Rata-rata:
\[ \bar{x}=4.5,\quad \bar{y}=5.5 \]
Korelasi:
\[ \sum (x_i-\bar{x})(y_i-\bar{y}) = 17.5 \] \[ \sum (x_i-\bar{x})^2 = 17.5,\quad \sum (y_i-\bar{y})^2=17.5 \] \[ r=\frac{17.5}{\sqrt{17.5\times 17.5}}=1.00 \]
Koefisien regresi:
\[ \hat{\beta}_1=\frac{17.5}{17.5}=1,\quad \hat{\beta}_0=5.5-(1)(4.5)=1 \]
Model manual:
\[ \hat{Y}=1+1X \]
Jika \(X=6\), maka \(\hat{Y}=7\), sama dengan nilai observasi data contoh.
\[ Y = \beta_0 + \beta_1X_1 + \beta_2X_2 + ... + \beta_kX_k + \epsilon \] Regresi berganda memungkinkan estimasi pengaruh parsial setelah mengontrol kovariat lain, sehingga lebih kuat dibanding analisis bivariat sederhana (Fox, 2016; Montgomery et al., 2021).
Bentuk matriks:
\[ \mathbf{Y}=\mathbf{X}\beta+\varepsilon,\quad \hat{\beta}=(X'X)^{-1}X'Y \]
Uji F model keseluruhan:
\[ F=\frac{SSR/k}{SSE/(n-k-1)} \]
Uji t koefisien parsial:
\[ t_j=\frac{\hat{\beta}_j}{SE(\hat{\beta}_j)} \]
set.seed(123)
n <- 150
x1 <- rnorm(n, 4, 1)
x2 <- rnorm(n, 3, 1)
x3 <- rnorm(n, 2, 0.8)
y <- 40 + 5*x1 + 3*x2 - 2*x3 + rnorm(n, 0, 4)
reg_df <- data.frame(y, x1, x2, x3)
mod2 <- lm(y ~ x1 + x2 + x3, data = reg_df)
summary(mod2)
##
## Call:
## lm(formula = y ~ x1 + x2 + x3, data = reg_df)
##
## Residuals:
## Min 1Q Median 3Q Max
## -11.4427 -2.5109 0.1038 2.7331 9.5216
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 40.4869 2.1157 19.136 < 2e-16 ***
## x1 4.8728 0.3375 14.438 < 2e-16 ***
## x2 3.0671 0.3375 9.087 6.67e-16 ***
## x3 -1.9654 0.3837 -5.123 9.38e-07 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.813 on 146 degrees of freedom
## Multiple R-squared: 0.6824, Adjusted R-squared: 0.6759
## F-statistic: 104.6 on 3 and 146 DF, p-value: < 2.2e-16
car::vif(mod2)
## x1 x2 x3
## 1.052665 1.034202 1.027042
Rumus VIF:
\[ VIF_j=\frac{1}{1-R_j^2} \] VIF umum dipakai sebagai indikator awal masalah ketergantungan linear antar prediktor (Kutner et al., 2005).
lmtest::bptest(mod2)
##
## studentized Breusch-Pagan test
##
## data: mod2
## BP = 1.1651, df = 3, p-value = 0.7614
Model uji Breusch-Pagan (konseptual):
\[ \hat{u}_i^2=\alpha_0+\alpha_1Z_{1i}+...+\alpha_mZ_{mi}+v_i \] Jika heteroskedastisitas terdeteksi, standard error robust dapat digunakan untuk menjaga inferensi parameter tetap lebih reliabel (Long & Ervin, 2000).
car::durbinWatsonTest(mod2)
## lag Autocorrelation D-W Statistic p-value
## 1 -0.02841372 2.020251 0.916
## Alternative hypothesis: rho != 0
Statistik Durbin-Watson:
\[ DW=\frac{\sum_{t=2}^{n}(e_t-e_{t-1})^2}{\sum_{t=1}^{n}e_t^2} \]
coeftest(mod2, vcov = sandwich::vcovHC(mod2, type = "HC1"))
##
## t test of coefficients:
##
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 40.48693 2.17040 18.6541 < 2.2e-16 ***
## x1 4.87282 0.35970 13.5469 < 2.2e-16 ***
## x2 3.06712 0.31263 9.8106 < 2.2e-16 ***
## x3 -1.96536 0.37248 -5.2764 4.67e-07 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Gunakan model:
\[ \hat{Y}=40+5X_1+3X_2-2X_3 \]
Untuk satu observasi dengan \(X_1=4.5\), \(X_2=3.2\), \(X_3=1.8\):
\[ \hat{Y}=40+5(4.5)+3(3.2)-2(1.8) =40+22.5+9.6-3.6 =68.5 \]
Jika nilai aktual \(Y=70\), residual:
\[ e=Y-\hat{Y}=70-68.5=1.5 \]
Contoh VIF manual:
Jika \(R_j^2=0.36\), maka:
\[ VIF_j=\frac{1}{1-0.36}=1.56 \]
Nilai 1.56 menunjukkan multikolinearitas rendah untuk prediktor tersebut.
ANOVA menguji apakah rerata lebih dari dua kelompok berbeda secara statistik. Metode ini merupakan perluasan logika uji t ke lebih dari dua kelompok dan berlandaskan dekomposisi variasi total (Montgomery, 2019; Field, 2018).
Hipotesis:
Model one-way ANOVA:
\[ Y_{ij}=\mu+\tau_j+\varepsilon_{ij} \]
Dekomposisi jumlah kuadrat:
\[ SS_T = SS_B + SS_W \]
Statistik F:
\[ F=\frac{MS_B}{MS_W} \]
dengan:
\[ MS_B=\frac{SS_B}{k-1},\quad MS_W=\frac{SS_W}{N-k} \]
set.seed(99)
kel <- factor(rep(c("A", "B", "C"), each = 30))
skor <- c(rnorm(30, 70, 6), rnorm(30, 75, 6), rnorm(30, 78, 6))
aov_df <- data.frame(kel, skor)
fit_aov <- aov(skor ~ kel, data = aov_df)
summary(fit_aov)
## Df Sum Sq Mean Sq F value Pr(>F)
## kel 2 1370 685.1 23.97 5.09e-09 ***
## Residuals 87 2486 28.6
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
TukeyHSD(fit_aov)
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = skor ~ kel, data = aov_df)
##
## $kel
## diff lwr upr p adj
## B-A 3.586657 0.2955412 6.877773 0.0293086
## C-A 9.465245 6.1741291 12.756360 0.0000000
## C-B 5.878588 2.5874722 9.169704 0.0001519
Uji lanjut diperlukan ketika hasil ANOVA signifikan untuk mengidentifikasi pasangan kelompok mana yang berbeda (Howell, 2013).
Ukuran efek ANOVA:
\[ \eta^2=\frac{SS_B}{SS_T} \]
Untuk ANCOVA, model umum:
\[ Y_{ij}=\mu+\tau_j+\beta(X_{ij}-\bar{X})+\varepsilon_{ij} \]
Misal data sederhana tiga kelompok:
Rata-rata gabungan:
\[ \bar{Y}_{..}=75 \]
Jumlah kuadrat antar kelompok:
\[ SS_B = 3(70-75)^2 + 3(75-75)^2 + 3(80-75)^2 = 150 \]
Jumlah kuadrat dalam kelompok:
\[ SS_W = (4+0+4) + (1+0+1) + (4+0+4) = 18 \]
Derajat bebas:
\[ df_B=2,\quad df_W=6 \]
Mean square:
\[ MS_B=150/2=75,\quad MS_W=18/6=3 \]
Statistik F:
\[ F=75/3=25 \]
Ukuran efek:
\[ \eta^2=\frac{150}{150+18}=0.893 \]
Nilai \(\eta^2\) tinggi menunjukkan proporsi variasi antar kelompok sangat besar pada contoh ini.
BAGIAN V - STUDI KASUS SOSIAL INDONESIA
Digitalisasi pendidikan menuntut mahasiswa memiliki literasi digital yang memadai. Namun, perbedaan akses perangkat, kualitas jaringan, dan dukungan lingkungan belajar dapat menciptakan kesenjangan hasil akademik.
Model empiris yang diestimasi:
\[ IPK_i=\beta_0+\beta_1Literasi_i+\beta_2Jam_i+\beta_3Dukungan_i+\varepsilon_i \]
Jika ingin menguji efek interaksi:
\[ IPK_i=\beta_0+\beta_1Literasi_i+\beta_2Jam_i+\beta_3(Literasi_i\times Jam_i)+\varepsilon_i \]
set.seed(301)
n <- 300
literasi <- round(rnorm(n, 70, 10), 0)
jam <- pmax(rnorm(n, 3.5, 1), 0.5)
dukungan <- round(rnorm(n, 72, 9), 0)
ipk <- 1.5 + 0.012*literasi + 0.18*jam + 0.006*dukungan + rnorm(n, 0, 0.25)
ipk <- pmin(pmax(ipk, 0), 4)
kasus1 <- tibble(literasi, jam, dukungan, ipk)
summary(kasus1)
## literasi jam dukungan ipk
## Min. : 41.00 Min. :0.8979 Min. :48.00 Min. :2.419
## 1st Qu.: 64.00 1st Qu.:2.8754 1st Qu.:66.00 1st Qu.:3.184
## Median : 70.00 Median :3.4949 Median :71.00 Median :3.398
## Mean : 69.83 Mean :3.4752 Mean :71.82 Mean :3.393
## 3rd Qu.: 77.00 3rd Qu.:4.1965 3rd Qu.:77.00 3rd Qu.:3.654
## Max. :106.00 Max. :6.2129 Max. :95.00 Max. :4.000
psych::describe(kasus1)
## vars n mean sd median trimmed mad min max range skew
## literasi 1 300 69.83 9.95 70.00 69.85 8.90 41.00 106.00 65.00 0.04
## jam 2 300 3.48 1.01 3.49 3.50 1.00 0.90 6.21 5.32 -0.17
## dukungan 3 300 71.82 9.15 71.00 71.65 8.15 48.00 95.00 47.00 0.18
## ipk 4 300 3.39 0.33 3.40 3.40 0.36 2.42 4.00 1.58 -0.26
## kurtosis se
## literasi 0.19 0.57
## jam -0.21 0.06
## dukungan -0.08 0.53
## ipk -0.40 0.02
m_k1 <- lm(ipk ~ literasi + jam + dukungan, data = kasus1)
summary(m_k1)
##
## Call:
## lm(formula = ipk ~ literasi + jam + dukungan, data = kasus1)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.60510 -0.16111 -0.01136 0.16566 0.64248
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.430589 0.153842 9.299 < 2e-16 ***
## literasi 0.012605 0.001408 8.955 < 2e-16 ***
## jam 0.177216 0.013839 12.806 < 2e-16 ***
## dukungan 0.006489 0.001531 4.237 3.02e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.2421 on 296 degrees of freedom
## Multiple R-squared: 0.4775, Adjusted R-squared: 0.4722
## F-statistic: 90.18 on 3 and 296 DF, p-value: < 2.2e-16
Jika koefisien jam belajar positif dan signifikan, maka peningkatan jam belajar berkaitan dengan kenaikan IPK rata-rata, setelah mengontrol literasi digital dan dukungan keluarga.
Pakai model:
\[ \hat{IPK}=1.5+0.012(Literasi)+0.18(Jam)+0.006(Dukungan) \]
Jika satu mahasiswa memiliki:
maka prediksi:
\[ \hat{IPK}=1.5+0.012(75)+0.18(4)+0.006(70) =1.5+0.9+0.72+0.42 =3.54 \]
Artinya, dengan kombinasi karakteristik tersebut, model memperkirakan IPK sekitar 3.54.
Kepuasan layanan publik dipengaruhi oleh waktu tunggu, kualitas interaksi petugas, kejelasan prosedur, dan kemudahan kanal digital.
set.seed(303)
serv <- tibble(
item1 = sample(1:5, 250, replace = TRUE),
item2 = sample(1:5, 250, replace = TRUE),
item3 = sample(1:5, 250, replace = TRUE),
item4 = sample(1:5, 250, replace = TRUE),
item5 = sample(1:5, 250, replace = TRUE)
)
psych::alpha(serv)
## Some items ( item1 item2 ) were negatively correlated with the first principal component and
## probably should be reversed.
## To do this, run the function again with the 'check.keys=TRUE' option
##
## Reliability analysis
## Call: psych::alpha(x = serv)
##
## raw_alpha std.alpha G6(smc) average_r S/N ase mean sd median_r
## -0.036 -0.04 -0.02 -0.0077 -0.038 0.1 3 0.63 -0.0047
##
## 95% confidence boundaries
## lower alpha upper
## Feldt -0.25 -0.04 0.15
## Duhachek -0.24 -0.04 0.17
##
## Reliability if an item is dropped:
## raw_alpha std.alpha G6(smc) average_r S/N alpha se var.r med.r
## item1 0.042 0.041 0.035 0.0105 0.042 0.099 0.0017 0.012
## item2 -0.141 -0.142 -0.096 -0.0320 -0.124 0.118 0.0023 -0.022
## item3 -0.066 -0.069 -0.038 -0.0164 -0.065 0.110 0.0046 -0.018
## item4 -0.030 -0.035 -0.020 -0.0084 -0.033 0.106 0.0022 -0.022
## item5 0.034 0.030 0.034 0.0076 0.031 0.099 0.0043 0.032
##
## Item statistics
## n raw.r std.r r.cor r.drop mean sd
## item1 250 0.40 0.39 NaN -0.066 3.2 1.4
## item2 250 0.52 0.51 NaN 0.061 3.0 1.5
## item3 250 0.48 0.46 NaN 0.011 3.1 1.5
## item4 250 0.43 0.44 NaN -0.013 3.0 1.4
## item5 250 0.38 0.40 NaN -0.062 2.8 1.4
##
## Non missing response frequency for each item
## 1 2 3 4 5 miss
## item1 0.17 0.18 0.20 0.20 0.26 0
## item2 0.22 0.21 0.18 0.16 0.22 0
## item3 0.20 0.20 0.15 0.21 0.23 0
## item4 0.18 0.20 0.19 0.25 0.18 0
## item5 0.22 0.22 0.22 0.17 0.16 0
serv$skor_kepuasan <- rowMeans(serv)
summary(serv$skor_kepuasan)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.400 2.600 3.000 3.017 3.400 5.000
Skor kepuasan dapat dipakai sebagai variabel dependen dalam model yang memasukkan faktor demografis dan pengalaman layanan. Dalam evaluasi layanan publik, pemodelan kepuasan berguna untuk memetakan determinan kualitas layanan secara terukur (Hair et al., 2019; Babbie, 2013).
Model linear dasar:
\[ Kepuasan_i=\beta_0+\beta_1WaktuTunggu_i+\beta_2KualitasPetugas_i+\beta_3AksesDigital_i+\varepsilon_i \]
Jika outcome dikategorikan puas/tidak puas, gunakan logistik:
\[ \log\left(\frac{p_i}{1-p_i}\right)=\beta_0+\beta_1X_{1i}+...+\beta_kX_{ki} \]
Odds ratio:
\[ OR_j=e^{\beta_j} \]
Misal model logistik menghasilkan:
Maka odds ratio:
\[ OR_{\text{waktu tunggu}}=e^{-0.12}=0.887 \]
\[ OR_{\text{kualitas petugas}}=e^{0.35}=1.419 \]
Interpretasi:
BAGIAN VI - PELAPORAN ILMIAH, REPLIKASI, DAN PENULISAN AKADEMIK
Lampiran ini melengkapi seluruh bab dengan rumus inti dan bentuk model yang paling sering dipakai pada penelitian kuantitatif sosial. Tujuannya agar pembaca tidak hanya memahami narasi metodologi, tetapi juga memiliki referensi matematis yang konsisten untuk implementasi analisis.
Gunakan notasi umum berikut:
Bab 1-3 berisi fondasi konseptual. Bentuk matematis yang relevan:
Model konseptual umum:
\[ Y = f(X_1, X_2, \ldots, X_k) + \varepsilon \]
Model jalur sederhana (mediasi):
\[ M = aX + \varepsilon_M,\quad Y = c'X + bM + \varepsilon_Y \]
Efek total:
\[ c = c' + ab \]
Model moderasi:
\[ Y = \beta_0 + \beta_1 X + \beta_2 Z + \beta_3 (X \times Z) + \varepsilon \]
Parameter kunci moderasi adalah \(\beta_3\). Jika signifikan, pengaruh \(X\) terhadap \(Y\) berbeda menurut level \(Z\).
Struktur hipotesis statistik:
\[ H_0: \theta = \theta_0 \quad \text{vs} \quad H_1: \theta \neq \theta_0 \]
Untuk hipotesis arah:
\[ H_0: \beta_1 \le 0 \quad \text{vs} \quad H_1: \beta_1 > 0 \]
Atau:
\[ H_0: \mu_1 = \mu_2 \quad \text{vs} \quad H_1: \mu_1 \neq \mu_2 \]
Model difference-in-differences (DiD):
\[ Y_{it} = \beta_0 + \beta_1 \text{Treat}_i + \beta_2 \text{Post}_t + \beta_3 (\text{Treat}_i \times \text{Post}_t) + \varepsilon_{it} \]
Estimasi efek kebijakan utama ada pada \(\beta_3\).
Model panel sederhana:
\[ Y_{it} = \alpha_i + \lambda_t + \beta X_{it} + \varepsilon_{it} \]
dengan \(\alpha_i\) efek tetap unit dan \(\lambda_t\) efek waktu.
Rumus Slovin:
\[ n = \frac{N}{1 + N e^2} \]
Koreksi populasi terbatas (proporsi):
\[ n = \frac{N Z^2 p(1-p)}{(N-1)d^2 + Z^2 p(1-p)} \]
Bobot sampling dasar:
\[ w_i = \frac{1}{\pi_i} \]
dengan \(\pi_i\) probabilitas terpilihnya unit ke-\(i\).
Korelasi item-total (konsep umum):
\[ r_{it} = \text{cor}(X_j, T_{-j}) \]
Cronbach’s alpha:
\[ \alpha = \frac{k}{k-1}\left(1 - \frac{\sum_{j=1}^{k} s_j^2}{s_T^2}\right) \]
Standard error of measurement (SEM):
\[ SEM = s_X \sqrt{1-\alpha} \]
Composite Reliability (CR):
\[ CR = \frac{\left(\sum \lambda_j\right)^2}{\left(\sum \lambda_j\right)^2 + \sum \theta_j} \]
Average Variance Extracted (AVE):
\[ AVE = \frac{\sum \lambda_j^2}{\sum \lambda_j^2 + \sum \theta_j} \]
Response rate:
\[ RR = \frac{\text{wawancara selesai}}{\text{unit eligibel}} \times 100\% \]
Mismatch back-check:
\[ \text{Mismatch Rate} = \frac{\text{item tidak cocok}}{\text{item diverifikasi}} \times 100\% \]
Completion rate item:
\[ \text{Completion} = \frac{\text{isian valid}}{\text{total item wajib}} \times 100\% \]
Z-score untuk screening nilai ekstrem:
\[ z_i = \frac{x_i - \bar{x}}{s} \]
IQR outlier rule:
\[ \text{Lower Bound} = Q_1 - 1.5(IQR),\quad \text{Upper Bound} = Q_3 + 1.5(IQR) \]
dengan:
\[ IQR = Q_3 - Q_1 \]
Winsorisasi sederhana:
\[ x_i^{(w)} = \begin{cases} L, & x_i < L \\ x_i, & L \le x_i \le U \\ U, & x_i > U \end{cases} \]
Rata-rata:
\[ \bar{x} = \frac{1}{n}\sum_{i=1}^{n} x_i \]
Varians sampel:
\[ s^2 = \frac{1}{n-1}\sum_{i=1}^{n}(x_i-\bar{x})^2 \]
Simpangan baku:
\[ s = \sqrt{s^2} \]
Koefisien variasi:
\[ CV = \frac{s}{\bar{x}} \times 100\% \]
Skewness (bentuk umum):
\[ \text{Skew} \approx \frac{1}{n}\sum \left(\frac{x_i-\bar{x}}{s}\right)^3 \]
Kurtosis (bentuk umum):
\[ \text{Kurt} \approx \frac{1}{n}\sum \left(\frac{x_i-\bar{x}}{s}\right)^4 \]
Statistik uji t satu sampel:
\[ t = \frac{\bar{x} - \mu_0}{s/\sqrt{n}} \]
Uji t dua sampel (Welch):
\[ t = \frac{\bar{x}_1 - \bar{x}_2}{\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}} \]
Interval kepercayaan mean:
\[ \bar{x} \pm t_{\alpha/2,df}\left(\frac{s}{\sqrt{n}}\right) \]
Ukuran efek Cohen’s d:
\[ d = \frac{\bar{x}_1 - \bar{x}_2}{s_p} \]
dengan:
\[ s_p = \sqrt{\frac{(n_1-1)s_1^2 + (n_2-1)s_2^2}{n_1+n_2-2}} \]
Koefisien korelasi Pearson:
\[ r = \frac{\sum (x_i-\bar{x})(y_i-\bar{y})}{\sqrt{\sum (x_i-\bar{x})^2 \sum (y_i-\bar{y})^2}} \]
Model regresi linear sederhana:
\[ Y_i = \beta_0 + \beta_1 X_i + \varepsilon_i \]
Estimator OLS:
\[ \hat{\beta}_1 = \frac{\sum (x_i-\bar{x})(y_i-\bar{y})}{\sum (x_i-\bar{x})^2},\quad \hat{\beta}_0 = \bar{y} - \hat{\beta}_1 \bar{x} \]
Koefisien determinasi:
\[ R^2 = 1 - \frac{\sum (y_i-\hat{y}_i)^2}{\sum (y_i-\bar{y})^2} \]
Model:
\[ Y_i = \beta_0 + \beta_1 X_{1i} + \beta_2 X_{2i} + \cdots + \beta_k X_{ki} + \varepsilon_i \]
Bentuk matriks OLS:
\[ \hat{\beta} = (X'X)^{-1}X'Y \]
Uji F keseluruhan model:
\[ F = \frac{(SSR/k)}{(SSE/(n-k-1))} \]
Variance Inflation Factor (VIF):
\[ VIF_j = \frac{1}{1-R_j^2} \]
Breusch-Pagan (konsep):
\[ \hat{u}_i^2 = \alpha_0 + \alpha_1 Z_{1i} + \cdots + \alpha_m Z_{mi} + v_i \]
Durbin-Watson:
\[ DW = \frac{\sum_{t=2}^{n}(e_t-e_{t-1})^2}{\sum_{t=1}^{n}e_t^2} \]
Model one-way ANOVA:
\[ Y_{ij} = \mu + \tau_j + \varepsilon_{ij} \]
Statistik F:
\[ F = \frac{MS_{between}}{MS_{within}} \]
dengan:
\[ MS_{between} = \frac{SS_{between}}{k-1},\quad MS_{within} = \frac{SS_{within}}{N-k} \]
Ukuran efek ANOVA (eta squared):
\[ \eta^2 = \frac{SS_{between}}{SS_{total}} \]
Model ANCOVA:
\[ Y_{ij} = \mu + \tau_j + \beta (X_{ij}-\bar{X}) + \varepsilon_{ij} \]
Contoh model regresi IPK:
\[ IPK_i = \beta_0 + \beta_1 \text{Literasi}_i + \beta_2 \text{JamBelajar}_i + \beta_3 \text{Dukungan}_i + \varepsilon_i \]
Contoh model kepuasan layanan:
\[ Kepuasan_i = \beta_0 + \beta_1 \text{WaktuTunggu}_i + \beta_2 \text{KualitasPetugas}_i + \beta_3 \text{AksesDigital}_i + \varepsilon_i \]
Jika outcome biner (puas/tidak puas), gunakan logistik:
\[ \log\left(\frac{p_i}{1-p_i}\right)=\beta_0+\beta_1X_{1i}+\cdots+\beta_kX_{ki} \]
Odds ratio:
\[ OR_j = e^{\beta_j} \]
Format umum pelaporan koefisien:
\[ \hat{\beta}_j \; (SE),\; t,\; p,\; CI_{95\%} \]
Contoh format kalimat:
b = 0.28, SE = 0.07, t = 4.00, p < 0.001, 95% CI [0.14, 0.42]
Model pelaporan ringkas regresi:
Pilih model berdasarkan tipe variabel dependen:
Jika data berjenjang (siswa dalam sekolah, pasien dalam puskesmas), pertimbangkan model multilevel:
\[ Y_{ij} = \beta_0 + \beta_1 X_{ij} + u_j + \varepsilon_{ij} \]
dengan \(u_j\) efek acak level kelompok.
Lampiran ini berfungsi sebagai referensi rumus dan model untuk seluruh buku. Dalam praktik, pemilihan rumus tidak boleh dipisahkan dari desain penelitian, tipe data, kualitas pengukuran, dan tujuan inferensi. Gunakan rumus sebagai alat berpikir metodologis, bukan sekadar alat hitung mekanis.
Agresti, A., & Finlay, B. (2009). Statistical methods for the social sciences (4th ed.). Pearson.
American Psychological Association. (2020). Publication manual of the American Psychological Association (7th ed.). APA.
Babbie, E. (2013). The practice of social research (13th ed.). Cengage Learning.
Casella, G., & Berger, R. L. (2002). Statistical inference (2nd ed.). Duxbury.
Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed.). Lawrence Erlbaum Associates.
Creswell, J. W., & Creswell, J. D. (2018). Research design: Qualitative, quantitative, and mixed methods approaches (5th ed.). SAGE.
Cumming, G. (2014). The new statistics: Why and how. Psychological Science, 25(1), 7-29.
Field, A. (2018). Discovering statistics using IBM SPSS statistics (5th ed.). SAGE.
Fox, J. (2016). Applied regression analysis and generalized linear models (3rd ed.). SAGE.
Hair, J. F., Black, W. C., Babin, B. J., & Anderson, R. E. (2019). Multivariate data analysis (8th ed.). Cengage.
Howell, D. C. (2013). Statistical methods for psychology (8th ed.). Cengage.
Kutner, M. H., Nachtsheim, C. J., Neter, J., & Li, W. (2005). Applied linear statistical models (5th ed.). McGraw-Hill/Irwin.
Long, J. S., & Ervin, L. H. (2000). Using heteroscedasticity consistent standard errors in the linear regression model. The American Statistician, 54(3), 217-224.
Montgomery, D. C. (2019). Design and analysis of experiments (10th ed.). Wiley.
Montgomery, D. C., Peck, E. A., & Vining, G. G. (2021). Introduction to linear regression analysis (6th ed.). Wiley.
Tabachnick, B. G., & Fidell, L. S. (2019). Using multivariate statistics (7th ed.). Pearson.
Walpole, R. E., Myers, R. H., Myers, S. L., & Ye, K. (2012). Probability and statistics for engineers and scientists (9th ed.). Pearson.
Wasserstein, R. L., & Lazar, N. A. (2016). The ASA statement on p-values: Context, process, and purpose. The American Statistician, 70(2), 129-133.
Wasserstein, R. L., Schirm, A. L., & Lazar, N. A. (2019). Moving to a world beyond “p < 0.05”. The American Statistician, 73(sup1), 1-19.
Wooldridge, J. M. (2016). Introductory econometrics: A modern approach (6th ed.). Cengage.
7.10.1 Social desirability bias
Responden cenderung memberi jawaban “baik” secara sosial.
Mitigasi: