Distribusi Probabilitas
Teknik Sampling dan Survei
1. Konsep 3 sigma (\(\sigma\)) dan Konsep 6 sigma (\(\sigma\))
Dalam statistik, sigma (\(\sigma\)) merujuk pada simpangan baku, yang mengukur tingkat penyebaran data terhadap rata-rata. Semakin besar nilai simpangan baku, semakin luas variasi data, yang dapat mengindikasikan keberadaan pencilan (outlier) atau tingginya tingkat kesalahan dalam suatu sistem.
Simpangan baku memiliki peran penting dalam berbagai analisis statistik, termasuk aturan empiris serta konsep Six Sigma, yang bertujuan untuk mengendalikan variasi dan meningkatkan kualitas proses.
1.1 3 Sigma (\(\sigma\))
Metode 3 Sigma merupakan pendekatan statistik yang menyatakan bahwa sekitar 99,73% data dalam suatu distribusi normal berada dalam rentang tiga simpangan baku dari rata-rata (𝜇 ± 3𝜎). Dengan demikian, hanya 0,27% data yang berada di luar rentang tersebut dan dianggap sebagai outlier atau nilai yang tidak biasa.
Aplikasi Metode 3 Sigma:
- Digunakan dalam kontrol kualitas untuk mengidentifikasi anomali dalam suatu proses.
- Membantu menentukan apakah suatu data termasuk dalam variasi normal atau merupakan hasil dari kesalahan sistematis.
1.1.1 Penerapan 3 Sigma
| Aspek | Penjelasan | Contoh Penerapan |
|---|---|---|
| Kontrol Kualitas | Menjaga kualitas produk agar tetap dalam batas toleransi yang telah
ditetapkan. Produk dengan hasil produksi di luar batas ±3𝜎 dikategorikan sebagai cacat. |
Mengidentifikasi produk cacat dalam lini produksi dan melakukan perbaikan proses untuk mengurangi cacat. |
| Deteksi Outlier | Dalam analisis data, nilai yang berada di luar rentang ±3𝜎 sering kali dianggap sebagai anomali yang memerlukan pemeriksaan lebih lanjut. | Mendeteksi transaksi mencurigakan yang bisa menjadi indikasi fraud atau manipulasi pasar. |
| Perhitungan Probabilitas Kejadian Langka | Hanya 0,27% data yang berada di luar batas 3𝜎, menunjukkan bahwa kejadian tersebut sangat jarang terjadi. | Menganalisis hasil laboratorium pasien untuk mendeteksi kondisi medis langka atau abnormal yang memerlukan perhatian khusus. |
1.1.2 Kelebihan dan Kekurangan 3 Sigma
Kelebihan:
- Dapat diterapkan secara luas di berbagai bidang.
- Efektif dalam mendeteksi pencilan (outlier).
- Memastikan akurasi data dengan cakupan sebesar 99,73%.
Kekurangan:
- Kurang ketat untuk industri dengan standar kualitas yang sangat
tinggi.
- Masih memungkinkan ribuan cacat dalam setiap satu juta produk.
1.2 6 sigma (\(\sigma\))
Six Sigma merupakan pendekatan yang lebih ketat, di mana 99,99966% data berada dalam rentang enam simpangan baku dari rata-rata (𝜇 ± 6𝜎). Dengan demikian, tingkat cacat hanya sebesar 3,4 per satu juta peluang (DPMO), menjadikannya metode dengan tingkat kesalahan yang sangat rendah.
1.2.1 Penerapan 6 Sigma
| Aspek | Deskripsi | Contoh Penerapan |
|---|---|---|
| Kontrol Kualitas | Mengurangi variabilitas dalam proses produksi guna memastikan hasil yang lebih konsisten. | Toyota dan General Electric menerapkan Six Sigma untuk meminimalkan cacat dalam produksi. |
| Efisiensi Operasional | Mengoptimalkan proses bisnis untuk meningkatkan efisiensi dan meminimalkan kesalahan. | Lembaga perbankan menggunakan Six Sigma untuk mengurangi kesalahan dalam transaksi keuangan. |
| Manajemen Risiko | Menganalisis serta mengurangi potensi kegagalan dalam sistem untuk meningkatkan keandalan. | Rumah sakit menerapkan Six Sigma untuk mencegah kesalahan medis dan meningkatkan kualitas layanan kesehatan. |
1.2.2 Kelebihan dan Kekurangan 6 Sigma
Kelebihan:
- Meminimalkan cacat hingga mendekati nol (3,4 cacat per satu juta
peluang).
- Meningkatkan efisiensi operasional dan kepuasan pelanggan.
- Sesuai untuk industri yang menerapkan standar kualitas tinggi.
Kekurangan:
- Proses implementasi yang kompleks dan berbiaya tinggi.
- Memerlukan pelatihan khusus bagi karyawan.
- Tidak selalu relevan bagi semua jenis industri.
1.3 Perbedaan Utama 3 Sigma vs 6 Sigma
| Aspek | 3 Sigma | 6 Sigma n |
|---|---|---|
| Definisi | Mengizinkan variasi hingga ±3 standar deviasi | Membatasi variasi hingga ±6 standar deviasi |
| Tingkat Cacat (DPMO) | ~66.800 cacat per juta peluang | 3,4 cacat per juta peluang |
| Ketelitian dan Kualitas | Toleransi variasi lebih besar | Kontrol lebih ketat untuk hampir nol cacat |
| Penerapan | Standar kualitas fleksibel | Standar kualitas tinggi (manufaktur, kesehatan, dll.) |
| Tingkat Kesulitan Implementasi | Mudah diterapkan, biaya lebih rendah | Lebih sulit, membutuhkan lebih banyak sumber daya |
1.4 Kesimpulan
Tiga Sigma (3 Sigma) dan Enam Sigma (6 Sigma) adalah metode untuk mengukur variasi dalam data atau proses. 3 Sigma memiliki toleransi yang lebih longgar, mencakup 99,73% data dan masih memungkinkan sekitar 66.800 cacat per juta peluang, sehingga lebih sesuai untuk analisis data atau deteksi anomali. Sementara itu, 6 Sigma menetapkan standar yang jauh lebih ketat, hanya menyisakan 3,4 cacat per juta peluang, sehingga banyak digunakan dalam industri yang memerlukan tingkat presisi tinggi, seperti manufaktur dan layanan kesehatan.
Pemilihan metode bergantung pada kebutuhan. Jika diperlukan fleksibilitas, seperti dalam analisis data atau deteksi anomali tanpa batasan ketat, 3 Sigma lebih tepat digunakan. Namun, jika tujuan utama adalah menjaga kualitas tinggi dengan tingkat kesalahan minimal, maka 6 Sigma merupakan pilihan yang lebih baik karena lebih ketat dan stabil. 3 Sigma lebih cepat dan sederhana, sedangkan 6 Sigma lebih presisi tetapi memerlukan usaha lebih besar dalam penerapannya.
2. Z-Score dan T-Score
2.1 Z-Score
Z-score adalah metode untuk mengukur seberapa jauh suatu nilai berada dari rata-rata dalam suatu himpunan data. Jarak ini dinyatakan dalam satuan standar deviasi, yang menggambarkan tingkat penyebaran data dalam suatu distribusi.
Z-score dihitung dengan rumus:
\[ Z = \frac{X - \mu}{\sigma} \]
Di mana:
- \(Z\) = Z-score
- \(X\) = nilai data yang diamati
- \(\mu\) = rata-rata populasi
- \(\sigma\) = standar deviasi
populasi
2.1.1 Kapan Menggunakan Z-Score?
Z-score digunakan dalam berbagai analisis statistik, terutama dalam situasi berikut:
- Menentukan probabilitas suatu kejadian dalam distribusi
normal
- Z-score memungkinkan perhitungan probabilitas kemunculan suatu nilai dalam distribusi normal dengan merujuk pada tabel Z.
- Mendeteksi data pencilan (outlier)
- Jika Z-score suatu data memiliki nilai yang jauh dari nol (umumnya lebih dari 2 atau 3), data tersebut dapat dianggap sebagai pencilan atau nilai yang tidak biasa.
- Membandingkan data dari skala yang berbeda
- Dengan mengonversi data ke satuan standar deviasi, Z-score memungkinkan perbandingan nilai dari kumpulan data yang berbeda tanpa dipengaruhi oleh skala aslinya.
2.1.2 Syarat Menggunakan Z-Score
- Distribusi Data Normal
- Z-score hanya valid apabila data berdistribusi normal atau mendekati normal.
- Diketahui Nilai Rata-Rata dan Simpangan Baku
- Nilai rata-rata (\(\mu\)) dan simpangan baku (\(\sigma\)) dari populasi atau sampel harus tersedia.
- Data dalam Skala Kontinu
- Z-score umumnya diterapkan pada data kuantitatif kontinu dibandingkan dengan data kategorikal.
2.1.3 Perumpamaan dalam Probabilitas Distribusi
Misalkan tinggi badan mahasiswa di suatu universitas berdistribusi normal dengan parameter sebagai berikut:
- Rata-rata (\(\mu\)) = 170 cm
- Standar deviasi (\(\sigma\)) = 10 cm
Untuk menghitung Z-score dari mahasiswa dengan tinggi 185 cm, digunakan rumus:
\[ Z = \frac{185 - 170}{10} = \frac{15}{10} = 1.5 \]
Interpretasi:
- Z-score sebesar 1.5 menunjukkan bahwa tinggi
185 cm berada 1,5 standar deviasi di atas
rata-rata.
- Dengan menggunakan tabel distribusi normal standar (Z-table), dapat ditentukan probabilitas seseorang memiliki tinggi lebih dari 185 cm atau kurang dari 185 cm.
2.1.4 Kesimpulan
Z-score merupakan indikator fundamental dalam probabilitas dan distribusi yang digunakan untuk menganalisis data dalam distribusi normal, menentukan probabilitas suatu kejadian, serta mengidentifikasi nilai pencilan (outlier).
2.2 T-Score
T-score merupakan nilai dalam statistik yang digunakan untuk menguji hipotesis, terutama ketika jumlah data yang tersedia relatif kecil (kurang dari 30) atau ketika variabilitas populasi tidak diketahui. Nilai ini menunjukkan sejauh mana hasil dari sampel berbeda dari rata-rata populasi, dinyatakan dalam satuan standar error.
Formula T-score:
\[ t = \frac{\bar{X} - \mu}{\frac{s}{\sqrt{n}}} \]
di mana:
- \(\bar{X}\) = rata-rata sampel
- \(\mu\) = rata-rata populasi
(hipotesis nol)
- \(s\) = standar deviasi sampel
- \(n\) = ukuran sampel
2.2.1 Kapan Menggunakan T-Score?
Gunakan T-score dalam analisis statistik apabila memenuhi kondisi berikut:
- Ukuran sampel kecil \((n
< 30)\).
- Varians populasi tidak diketahui, sehingga hanya
tersedia standar deviasi sampel sebagai estimasi.
- Distribusi data mendekati normal, sehingga asumsi distribusi t-Student dapat digunakan.
2.2.2 Syarat Menggunakan T-Score
Untuk menerapkan distribusi t-Student, terdapat beberapa persyaratan utama yang harus dipenuhi:
- Data berasal dari populasi yang berdistribusi
normal atau mendekati normal.
- Sampel diperoleh secara acak guna menghindari bias
dalam pengambilan data.
- Varians populasi tidak diketahui, sehingga estimasi dilakukan menggunakan standar deviasi sampel.
2.2.3 Contoh Perumpamaan T-Score
Seorang peneliti ingin menguji apakah terdapat perbedaan yang signifikan antara rata-rata tinggi mahasiswa di universitasnya dengan rata-rata tinggi populasi nasional, yaitu 170 cm. Untuk itu, peneliti mengambil sampel acak sebanyak 10 mahasiswa dan memperoleh rata-rata tinggi 172 cm dengan standar deviasi 5 cm.
Berdasarkan data tersebut, apakah terdapat cukup bukti secara statistik untuk menyimpulkan bahwa rata-rata tinggi mahasiswa di universitas ini berbeda secara signifikan dari rata-rata nasional?
Langkah-langkah Analisis
Menentukan Hipotesis
- Hipotesis nol (\(H_0\)): Tidak ada perbedaan
rata-rata, jadi \(\mu = 170\).
- Hipotesis alternatif (\(H_A\)): Ada perbedaan rata-rata, jadi \(\mu \neq 170\).
- Hipotesis nol (\(H_0\)): Tidak ada perbedaan
rata-rata, jadi \(\mu = 170\).
Menghitung T-score
Kita gunakan rumus:\[ t = \frac{\bar{X} - \mu}{\frac{s}{\sqrt{n}}} \]
Substitusikan angka yang ada:
\[ t = \frac{172 - 170}{\frac{5}{\sqrt{10}}} = \frac{2}{1.58} = 1.27 \]
Membandingkan dengan Nilai T Kritis
- Derajat kebebasan (df) = \(n - 1 = 10 - 1
= 9\).
- Untuk tingkat signifikansi 0.05 (uji dua sisi), dari tabel distribusi t kita dapatkan t kritis sekitar 2.262.
- Derajat kebebasan (df) = \(n - 1 = 10 - 1
= 9\).
Mengambil Keputusan
- Karena nilai t = 1.27 lebih kecil dari t
kritis = 2.262, maka kita gagal menolak hipotesis nol
(\(H_0\)).
- Ini berarti tidak ada cukup bukti statistik untuk menyatakan bahwa tinggi mahasiswa di universitas ini berbeda secara signifikan dari rata-rata nasional.
- Karena nilai t = 1.27 lebih kecil dari t
kritis = 2.262, maka kita gagal menolak hipotesis nol
(\(H_0\)).
Kesimpulannya, meskipun rata-rata tinggi mahasiswa dalam sampel sedikit lebih tinggi dari populasi umum, perbedaannya tidak cukup besar untuk dikatakan signifikan secara statistik.
Kesimpulan
T-score digunakan dalam distribusi t-Student untuk menguji hipotesis ketika ukuran sampel kecil dan varians populasi tidak diketahui. Syaratnya, data harus berasal dari populasi yang mendekati normal, dan sampel harus acak.
Referensi
DSCienceLabs. (2025). Probability and distributions. Dalam Sampling and survey techniques. Retrieved from https://bookdown.org/dsciencelabs/sampling_and_survey_techniques/docs/02-Probability-and-Distributions.html
TimesPro. (2025, January). 3 sigma vs 6 sigma: Methods, differences with examples. Retrieved from https://timespro.com/blog/3-sigma-vs-6-sigma-what-are-the-top-differences-and-examples
Glints Blog. (2022, March). Six Sigma: Pengertian, prinsip, metode, dan tekniknya. Retrieved from https://glints.com/id/lowongan/six-sigma/
Wikipedia. (2025, February). 68–95–99.7 rule. Retrieved from https://en.wikipedia.org/wiki/68%E2%80%9395%E2%80%9399.7_rule
Mahmud, M. (2018). Analisis pengendalian kualitas produk dengan metode six sigma pada CV Makmur Tani. Jurnal Teknik, 3(1), 24–35. Retrieved from https://jurnal.stt.web.id/index.php/Teknik/article/download/111/71e
Statistic How To. (n.d.). T-score vs. Z-score: Differences between them. Retrieved from https://www.statisticshowto.com/probability-and-statistics/hypothesis-testing/t-score-vs-z-score/
Ikatan Dinas. (n.d.). Apa itu Z-Score dan T-Score? Retrieved from https://ikatandinas.com/apa-itu-z-score-dan-t-score/