Three Sigma adalah konsep dalam statistika yang digunakan untuk
memahami sebaran data dalam distribusi normal. Three Sigma mengacu pada
batas tiga kali standar deviasi (\(\sigma\)) dari nilai rata-rata (\(\mu\)) suatu dataset.
1.2 Prinsip Dasar Three Sigma
Dalam distribusi normal, sebagian besar data akan berada di sekitar
rata-rata. Berdasarkan aturan empiris (empirical rule) atau aturan
68-95-99.7, distribusi data adalah sebagai berikut:
\(\mu \pm
1\sigma\) mencakup 68.27% dari semua
data.
\(\mu \pm
2\sigma\) mencakup 95.45% dari semua
data.
\(\mu \pm
3\sigma\) mencakup 99.73% dari semua
data.
Artinya, hanya 0.27% (sekitar 3 dari 1000) data yang
akan berada di luar ±3σ, sehingga nilai-nilai tersebut dianggap sebagai
outlier atau kejadian langka.
1.3 Rumus Three Sigma
Batas bawah dan batas atas dalam metode Three Sigma dihitung dengan
rumus: \[
Lower\ Limit = \mu - 3\sigma
\]\[
Upper\ Limit = \mu + 3\sigma
\]
Di mana:
\(\mu\) = mean (rata-rata) dari
dataset
\(\sigma\) = standar deviasi dari
dataset
Jika suatu nilai berada di luar batas ini, maka kemungkinan besar
nilai tersebut adalah anomali atau penyimpangan dari
pola normal.
1.4 Penerapan Three Sigma dalam Berbagai Bidang
a. Quality Control (Six Sigma)
Dalam industri manufaktur dan kontrol kualitas, metode Six Sigma
dikembangkan berdasarkan prinsip Three Sigma.
Jika proses memiliki standar deviasi kecil dan tetap berada dalam
±3σ, maka dianggap stabil dan berkualitas baik.
Jika produk memiliki lebih dari 3σ penyimpangan, maka ada
kemungkinan besar cacat atau produk gagal.
b Statistical Process Control (SPC)
Dalam analisis proses industri, grafik kendali (control
charts) menggunakan Three Sigma Rule untuk
mendeteksi kapan suatu proses mulai menyimpang dari standar normal.
c. Deteksi Anomali dalam Data Science
Dalam machine learning dan analisis data, Three
Sigma digunakan untuk mendeteksi outlier dalam
dataset.
Jika suatu data memiliki nilai lebih dari 3σ dari
rata-rata, maka dapat dipertimbangkan sebagai
anomali.
d. Keuangan dan Manajemen Risiko
Dalam bidang keuangan, Three Sigma digunakan untuk
mengukur volatilitas harga saham dan
memprediksi risiko investasi.
Jika harga saham mengalami perubahan yang lebih dari 3σ dari
rata-rata, hal ini bisa menjadi indikator risiko
tinggi.
1.5 Kesimpulan
Three Sigma Rule menyatakan bahwa sekitar
99.73% data akan berada dalam rentang
±3σ.
Jika suatu data berada di luar rentang ±3σ, maka
dianggap sebagai outlier atau penyimpangan dari pola
normal.
Three Sigma banyak digunakan dalam quality
control, deteksi anomali, manajemen risiko, dan data
science.
Implementasi Three Sigma dapat dilakukan dengan
R untuk mendeteksi outlier dan memahami pola distribusi
data.
Six Sigma
2.1 Apa Itu Six Sigma?
Six Sigma adalah metodologi berbasis data yang bertujuan untuk
meningkatkan kualitas proses bisnis dengan mengurangi variasi dan cacat
dalam suatu sistem produksi atau layanan. Six Sigma menggunakan alat
statistik untuk mengukur, menganalisis, meningkatkan, dan mengendalikan
proses agar menghasilkan output yang bebas dari cacat atau berada dalam
batas toleransi yang sangat kecil.
Six Sigma dikembangkan pertama kali oleh Motorola pada tahun 1986 dan
kemudian diadopsi oleh berbagai perusahaan besar seperti General
Electric (GE), Toyota, dan Samsung.
2.2 Konsep Dasar Six Sigma
Six Sigma berfokus pada mengurangi variasi dalam proses sehingga
cacat dalam produksi atau layanan dapat diminimalkan.
a. Hubungan dengan Three Sigma
Six Sigma adalah pengembangan dari Three Sigma, di mana:
Three Sigma berarti 99.73% dari output berada dalam
batas kendali.
Six Sigma meningkatkan kontrol kualitas hingga
99.99966%, atau hanya 3,4 cacat per juta
peluang (DPMO - Defects Per Million Opportunities).
Singkatnya, semakin tinggi sigma, semakin sedikit cacat dalam proses
produksi atau layanan.
2.3 Tingkatan Sigma dalam Kualitas Proses
Tingkat Sigma
Tingkat Kesalahan (DPMO)
Kualitas
1 Sigma
690.000 cacat per juta
31% baik
2 Sigma
308.000 cacat per juta
69% baik
3 Sigma
66.800 cacat per juta
93.32% baik
4 Sigma
6.210 cacat per juta
99.38% baik
5 Sigma
230 cacat per juta
99.977% baik
6 Sigma
3,4 cacat per juta
99.99966% baik
Perusahaan dengan standar Six Sigma akan memiliki hanya 3,4
kesalahan dari setiap 1 juta unit yang diproduksi.
2.4 Metodologi Six Sigma: DMAIC & DMADV
Six Sigma memiliki dua metodologi utama untuk meningkatkan proses
bisnis:
Metodologi ini digunakan ketika merancang proses atau produk baru
agar memenuhi standar Six Sigma.
Define → Menentukan kebutuhan pelanggan dan tujuan
desain.
Measure → Mengukur karakteristik penting untuk
memenuhi kebutuhan pelanggan.
Analyze → Menganalisis opsi desain terbaik.
Design → Merancang solusi optimal.
Verify → Menguji dan memverifikasi desain sebelum
implementasi.
2.5 Manfaat Six Sigma dalam Bisnis
Six Sigma memberikan banyak manfaat bagi perusahaan, termasuk:
✅ Meningkatkan kualitas produk & layanan
✅ Mengurangi jumlah cacat dan kesalahan
✅ Menghemat biaya produksi
✅ Meningkatkan efisiensi operasional
✅ Meningkatkan kepuasan pelanggan
✅ Mempermudah pengambilan keputusan berbasis data
2.6 Contoh Penerapan Six Sigma
a. Industri Manufaktur (Toyota, Motorola)
Mengurangi cacat dalam produksi kendaraan atau perangkat
elektronik.
Memastikan setiap komponen memenuhi standar kualitas tinggi.
b. Industri Keuangan (Banking & Insurance)
Mengoptimalkan proses pengajuan pinjaman agar lebih cepat dan
akurat.
Mengurangi kesalahan transaksi keuangan.
c. Layanan Kesehatan (Rumah Sakit & Farmasi)
Mengurangi kesalahan dalam pemberian obat kepada pasien.
Meningkatkan efisiensi pelayanan rumah sakit.
d. E-commerce & Teknologi (Amazon, Google)
Mengoptimalkan pengalaman pelanggan dengan mengurangi waktu loading
website.
Mengurangi tingkat kesalahan dalam sistem logistik dan pengiriman
barang.
2.7 Kesimpulan
Six Sigma adalah metodologi berbasis data yang
bertujuan untuk meningkatkan kualitas dan efisiensi proses dengan
mengurangi variasi dan cacat.
Menggunakan pendekatan statistik, Six Sigma dapat
membantu perusahaan mencapai tingkat kesalahan hanya 3,4 cacat
per juta unit.
Metode Six Sigma seperti DMAIC dan
DMADV digunakan untuk memperbaiki atau merancang proses
bisnis yang lebih baik.
Penerapan Six Sigma dapat meningkatkan kualitas
produk, mengurangi biaya, meningkatkan kepuasan pelanggan, dan
meningkatkan daya saing bisnis.
Three Sigma vs Six Sigma
3.1 Kapan Digunakan 3 Sigma dan 6 Sigma?
Baik Three Sigma maupun Six Sigma digunakan untuk mengukur dan
meningkatkan kualitas proses, tetapi mereka memiliki tujuan dan
penerapan yang berbeda tergantung pada kebutuhan bisnis atau analisis
data.
Kriteria
Three Sigma
Six Sigma
Tingkat Kesalahan
66.800 cacat per juta (93.32% baik)
3,4 cacat per juta (99.99966% baik)
Tingkat Kualitas
Cukup baik, masih ada toleransi kesalahan
Sangat tinggi, hampir tanpa kesalahan
Kapan Digunakan?
Untuk kontrol kualitas dasar, deteksi anomali, analisis statistik
umum
Untuk proses bisnis yang sangat kritis di mana kesalahan harus
sangat minim
Kompleksitas Implementasi
Lebih mudah diterapkan dan cocok untuk pemantauan rutin
Membutuhkan pendekatan lebih ketat, pelatihan, dan strategi jangka
panjang
Contoh Penerapan
- Deteksi outlier dalam analisis data
- Produksi pesawat terbang
- Kontrol kualitas produk standar
- Sektor medis (rumah sakit & farmasi)
- Pemantauan performa mesin
- Transaksi perbankan & keamanan data
3.2 Perbedaan Three Sigma dan Six Sigma
Tingkat Kualitas & Toleransi Kesalahan
Three Sigma masih memiliki 66.800 cacat per juta peluang (DPMO). Ini
berarti prosesnya cukup baik, tetapi masih ada toleransi kesalahan.
Six Sigma hanya memiliki 3,4 cacat per juta, sehingga lebih ketat
dan presisi tinggi.
Tingkat Kesulitan Implementasi
Three Sigma lebih mudah diterapkan karena hanya memerlukan
pemantauan dasar terhadap distribusi data.
Six Sigma lebih kompleks dan memerlukan metodologi seperti DMAIC
atau DMADV, serta analisis mendalam dengan alat statistik.
Bidang Penggunaan
Three Sigma digunakan dalam analisis statistik umum dan kontrol
kualitas standar, misalnya untuk menentukan outlier dalam data atau
memantau variasi dalam produksi.
Six Sigma digunakan dalam industri dengan tingkat risiko tinggi,
seperti produksi mobil, pesawat, kesehatan, dan keuangan, di mana
kesalahan harus sangat kecil atau nol.
3.3 Kapan Menggunakan Three Sigma?
Jika kesalahan masih bisa ditoleransi dan kita hanya ingin
mendeteksi outlier atau variasi dalam proses.
Jika digunakan untuk kontrol kualitas dasar, seperti pemeriksaan
barang dalam pabrik yang tidak memerlukan presisi ekstrem.
Jika ingin melakukan analisis data cepat untuk melihat distribusi
normal atau outlier dalam dataset.
✅ Contoh: - Mengidentifikasi data yang tidak normal
dalam distribusi nilai mahasiswa. - Memantau kualitas produksi dalam
industri makanan yang masih memiliki sedikit toleransi kesalahan.
3.4 Kapan Menggunakan Six Sigma?
Jika kesalahan harus benar-benar minimal dan berpengaruh besar
terhadap keselamatan atau biaya produksi.
Jika ingin meningkatkan efisiensi bisnis secara drastis dengan
mengurangi cacat seminimal mungkin.
Jika bekerja dalam industri dengan persyaratan keamanan tinggi
(penerbangan, farmasi, otomotif, dll.).
✅ Contoh: - Produksi pesawat terbang (karena
kesalahan kecil bisa menyebabkan kecelakaan). - Sistem perbankan &
keuangan (untuk menghindari kesalahan transaksi). - Sektor medis (untuk
mengurangi kesalahan dalam pemberian obat atau operasi bedah).
3.5 Kesimpulan
Gunakan Three Sigma jika masih ada toleransi
kesalahan dan fokusnya adalah deteksi anomali atau kontrol kualitas
dasar.
Gunakan Six Sigma jika kesalahan harus hampir nol,
terutama dalam industri kritis seperti penerbangan, kesehatan, dan
keuangan.
Z-Score
4.1 Apa Itu Z-Score?
Z-score, atau disebut juga standard score, adalah nilai yang
menunjukkan seberapa jauh suatu data berada dari rata-rata dalam satuan
standar deviasi. Z-score dihitung dengan rumus:
\[ Z = \frac{X - \mu}{\sigma}
\]
di mana:
\(X\) = nilai data yang ingin
dianalisis
\(\mu\) = rata-rata populasi
\(\sigma\) = standar deviasi
populasi
Z-score menunjukkan apakah suatu data lebih tinggi atau lebih rendah
dari rata-rata dan sejauh mana perbedaannya dalam satuan standar
deviasi.
4.2 Kapan Menggunakan Z-Score?
1. Mendeteksi Outlier
Nilai dengan Z-score yang sangat besar (biasanya di atas 3 atau di
bawah -3) dapat dianggap sebagai outlier karena jauh dari rata-rata.
2. Standarisasi Data
Dalam analisis data atau pembelajaran mesin (machine learning),
Z-score digunakan untuk menormalkan data sehingga memiliki distribusi
dengan rata-rata 0 dan standar deviasi 1.
3. Distribusi Normal dan Probabilitas
Dalam statistik inferensial, Z-score digunakan untuk menghitung
probabilitas dalam distribusi normal, seperti dalam Z-test atau tabel
distribusi normal.
4. Perbandingan Antar Dataset
Ketika ingin membandingkan nilai dari dua dataset yang memiliki skala
atau unit berbeda, Z-score membantu menyamakan skala agar lebih mudah
dibandingkan.
5. Statistik dalam Keuangan
Dalam analisis risiko keuangan, Z-score digunakan untuk menilai
kemungkinan kebangkrutan suatu perusahaan (Altman Z-score).
T-Score
5.1 Apa Itu T-Score?
T-score (juga disebut t-value atau Student’s t-score) adalah nilai
yang digunakan dalam uji statistik untuk menentukan seberapa jauh suatu
sampel berbeda dari rata-rata populasi, terutama ketika ukuran sampel
kecil $( n < 30 $) dan standar deviasi populasi tidak diketahui.
T-score dihitung dengan rumus:
\[
T = \frac{X - \mu}{\frac{s} {\sqrt{n}}}
\]
di mana:
\(X\) = rata-rata sampel
\(\mu\) = rata-rata populasi
\(s\) = standar deviasi
sampel
\(n\) = ukuran sampel
T-score mirip dengan Z-score, tetapi digunakan dalam kondisi di mana
populasi tidak diketahui secara pasti dan ukuran sampel relatif
kecil.
5.2 Kapan Menggunakan T-Score?
T-score digunakan dalam berbagai situasi, terutama dalam statistik
inferensial, seperti:
1. Uji t (T-Test) untuk Perbandingan Mean
Digunakan untuk membandingkan rata-rata antara dua kelompok,
misalnya:
One-sample t-test: membandingkan rata-rata sampel
dengan nilai tertentu.
Independent t-test: membandingkan dua kelompok yang
tidak berhubungan (misalnya, skor ujian antara dua kelas).
Paired t-test: membandingkan dua kelompok yang
berhubungan (misalnya, sebelum dan sesudah suatu perlakuan).
2. Ketika Standar Deviasi Populasi Tidak Diketahui
Jika standar deviasi populasi \((\sigma\)) tidak diketahui, maka kita
menggunakan standar deviasi sampel \((s\)) dan distribusi t-Student untuk
mengestimasi nilai yang diharapkan.
3. Sampel Kecil (n < 30)
Jika ukuran sampel lebih kecil dari 30, distribusi t lebih sesuai
daripada distribusi normal karena lebih memperhitungkan variabilitas
sampel.
4. Analisis Inferensial dalam Penelitian
T-score digunakan dalam pengujian hipotesis untuk menentukan apakah
ada perbedaan yang signifikan dalam data, terutama dalam penelitian
eksperimental dan sosial.
Z-Score vs T-Score
6.1 Perbedaan Z-Score dan T-Score
Aspek
Z-Score
T-Score
Definisi
Mengukur seberapa jauh suatu nilai dari rata-rata dalam satuan
standar deviasi.
Digunakan dalam statistik inferensial untuk membandingkan rata-rata
sampel terhadap populasi, terutama jika ukuran sampel kecil.
Kapan Digunakan
Jika ukuran sampel besar \((𝑛≥
30\)) dan standar deviasi populasi diketahui.
Jika ukuran sampel kecil \((𝑛<
30\)) atau standar deviasi populasi tidak diketahui.
Distribusi yang Digunakan
Distribusi normal standar.
Distribusi t-Student, yang memiliki ekor lebih panjang dibandingkan
distribusi normal (karena lebih sensitif terhadap sampel kecil).
Rumus
\[ Z = \frac{X - \mu}{\sigma}
\]
\[ T = \frac{X - \mu}{\frac{s}
{\sqrt{n}}} \]
Ketergantungan terhadap Ukuran Sampel
Tidak tergantung pada ukuran sampel selama distribusi mendekati
normal.
Sangat bergantung pada ukuran sampel; semakin kecil sampel, semakin
besar pengaruhnya pada distribusi t.
Aplikasi
- Menentukan probabilitas dalam distribusi normal.
- Uji-t (one-sample, independent, paired).
- Mendeteksi outlier.
- Uji hipotesis saat standar deviasi populasi tidak diketahui.
- Normalisasi data.
- Analisis statistik inferensial untuk sampel kecil.
6.2 Kesimpulan
Gunakan Z-score jika memiliki data yang cukup besar
dan standar deviasi populasi diketahui.
Gunakan T-score jika ukuran sampel kecil
(n < 30) atau standar deviasi populasi tidak diketahui.