Distribusi Probabilitas

Probabilitas Dalam Pengambilan Sampel

Logo


1 Penjelasan Three Sigma dan Six Sigma


1.1 Definisi Sigma

Sigma \((σ)\) adalah standar deviasi, yang menunjukkan seberapa jauh data tersebar dari rata-rata (\(μ\)) dalam suatu distribusi normal (kurva lonceng).

  • Semakin kecil nilai sigma, semakin terpusat datanya di sekitar rata-rata.

  • Semakin besar nilai sigma, semakin beragam atau menyebar datanya.

Dalam dunia industri dan manajemen kualitas, sigma digunakan untuk mengukur konsistensi dan variasi dalam suatu proses.

1.2 Definisi Three Sigma

Three Sigma adalah level Sigma ketiga, yang menyatakan bahwa hanya boleh ada margin kesalahan hingga tiga standar deviasi dari nilai rata-rata.

Three Sigma mengizinkan 2.700 cacat per 1 juta peluang (DPMO - Defects Per Million Opportunities).

1.2.1 Cara Kerja Three Sigma dalam Kontrol Kualitas

Pada level Three Sigma, produk atau proses dianggap masih dalam kontrol selama variasi berada dalam \(±3σ\) dari rata-rata.

Namun, karena masih ada 2.700 cacat per 1 juta unit, maka ini belum cukup untuk industri yang membutuhkan presisi tinggi.

1.2.2 Kelebihan & Kekurangan Three Sigma

Adapun kelebihan dan kekurangan yang terdapat pada Three Sigma:

Kelebihan:

  • Mudah diterapkan dalam berbagai industri.

  • Biaya kontrol kualitas lebih rendah dibandingkan Six Sigma.

  • Sudah cukup baik untuk industri dengan toleransi cacat yang lebih besar.

Kekurangan:

  • Masih memungkinkan tingkat cacat yang cukup tinggi.

  • Tidak cocok untuk industri dengan standar ketat (farmasi, penerbangan, dll.).

1.3 Definisi Six Sigma

Six Sigma adalah level tertinggi Sigma, yang menentukan bahwa margin kesalahan dapat mencapai enam standar deviasi dari rata-rata.

Persentase akurasi yang tinggi ini menghasilkan hanya 3,4 cacat per 1 juta peluang (DPMO).

1.3.1 Cara Kerja Six Sigma dalam Kontrol Kualitas

Pada level six Sigma, perusahaan harus memastikan bahwa proses berjalan dengan variasi yang sangat kecil, sehingga kemungkinan terjadi cacat menjadi hampir nol.

1.3.2 Metode Implementasi Six Sigma

Six Sigma memiliki dua pendekatan utama:

A. DMAIC (Define, Measure, Analyze, Improve, Control)

Digunakan untuk meningkatkan proses yang sudah ada.

  1. Define (Definisikan): Tentukan masalah dan tujuan.

  2. Measure (Ukur): Kumpulkan data dan identifikasi penyebab kesalahan.

  3. Analyze (Analisis): Gunakan metode statistik untuk mencari akar masalah.

  4. Improve (Perbaikan): Terapkan solusi untuk mengurangi cacat.

  5. Control (Kontrol): Pastikan perbaikan tetap berjalan dengan baik.

B. DMADV (Define, Measure, Analyze, Design, Verify)

Digunakan untuk mendesain proses atau produk baru agar mencapai tingkat kualitas yang tinggi.

  1. Define (Definisikan): Tetapkan kebutuhan pelanggan.

  2. Measure (Ukur): Kumpulkan data dan buat metrik keberhasilan.

  3. Analyze (Analisis): Rancang solusi berbasis data.

  4. Design (Desain): Buat desain produk/proses baru.

  5. Verify (Verifikasi): Pastikan desain memenuhi standar Six Sigma.

1.3.3 Kelebihan & Kekurangan Six Sigma

Adapun kelebihan dan kekurangan yang terdapat pada Six Sigma:

Kelebihan:

  • Menghasilkan produk dengan kualitas yang hampir sempurna.

  • Mengurangi biaya akibat cacat dan produksi ulang.

  • Meningkatkan efisiensi proses bisnis.

Kekurangan:

  • Memerlukan pelatihan khusus untuk menerapkan metode ini.

  • Biaya implementasi awal yang tinggi.

  • Tidak selalu cocok untuk usaha kecil yang tidak membutuhkan tingkat presisi tinggi.

1.4 Perbandingan Three Sigma vs Six Sigma Berdasarkan Table:

\[\text{Faktor}\] \[\text{Three Sigma}\] \[\text{Six Sigma}\]
Akurasi 99,73% bebas cacat 99,99966% bebas cacat
Cacat per 1 juta produk (DPMO) 2.700 cacat 3,4 cacat
Standar Deviasi \[±3σ\] \[±6σ\]
Biaya Implementasi Relatif rendah Relatif tinggi
Industri yang Cocok Manufaktur umum, makanan, layanan pelanggan Farmasi, otomotif, penerbangan, teknologi

1.5 Konsep Three Sigma dan Six Sigma dalam Distribusi Normal

Dalam distribusi normal (kurva lonceng), hampir semua data jatuh dalam rentang tertentu dari rata-rata (\(μ\)).

Berikut adalah distribusi normal berdasarkan standar deviasi (\(σ\)):

  • One Sigma (\(±1σ\)): 68,27% data berada dalam rentang ini.

  • Two Sigma (\(±2σ\)): 95,45% data berada dalam rentang ini.

  • Three Sigma (\(±3σ\)): 99,73% data berada dalam rentang ini.

  • Six Sigma (\(±6σ\)): 99,99966% data berada dalam rentang ini.

Setiap angka sigma menunjukkan berapa persen produk yang bebas dari cacat dan berapa banyak cacat per sejuta peluang (DPMO - Defects Per Million Opportunities).

1.6 Perhitungan Tingkat Cacat pada Three Sigma dan Six Sigma

Tabel berikut menunjukkan hubungan antara tingkat sigma dan jumlah cacat per sejuta produk:

\[\text{Tingkat Sigma}\] \[\text{Persentase Produk Bebas Cacat}\] \[\text{Cacat per Sejuta Produk (DPMO)}\]
One Sigma (\(±1σ\)) 68,27% 317.400 cacat
Two Sigma (\(±2σ\)) 95,45% 45.500 cacat
Three Sigma (\(±3σ\)) 99,73% 2.700 cacat
Four Sigma (\(±4σ\)) 99,9937% 63 cacat
Five Sigma (\(±5σ\)) 99,99994% 3,4 cacat
Six Sigma (\(±6σ\)) 99,99966% 3,4 cacat

1.7 Contoh Perhitungan Three Sigma dan Six Sigma

Contoh 1: Pabrik Minuman Botol (Three Sigma vs Six Sigma)

Sebuah pabrik minuman memproduksi 1 juta botol air kemasan per bulan. Jika pabrik ini menggunakan standar Three Sigma, maka jumlah botol yang cacat bisa dihitung sebagai berikut:

\[ \text{Cacat pada Three Sigma} = \frac{2.700}{1.000.000}. 1.000.000 = 2.700 \text{ botol cacat} \]

Jika pabrik meningkatkan prosesnya ke Six Sigma, maka jumlah botol cacat menjadi:

\[ \text{Cacat pada Six Sigma} = \frac{3,4}{1.000.000}. 1.000.000 = 3,4 \text{ botol cacat} \]

Kesimpulan:

  • Dengan Three Sigma, ada 2.700 botol cacat setiap bulan.

  • Dengan Six Sigma, hanya ada 3-4 botol cacat setiap bulan.

Hal ini menunjukkan bahwa peningkatan dari Three Sigma ke Six Sigma secara drastis mengurangi jumlah produk cacat.

1.7.1 Cara Menghitung Sigma Level dari Data Aktual

Untuk mengetahui tingkat sigma dari suatu proses, kita bisa menggunakan rumus berikut:

\[ \text{Sigma Level} = 1.5 + \Phi^{-1} \left( \frac{\text{Produk Bebas Cacat}}{\text{Total Produk}} \right) \]

Keterangan:

  • \(Φ^−1\) adalah fungsi distribusi normal invers.

  • Produk Bebas Cacat adalah jumlah barang yang diproduksi tanpa cacat.

Contoh:

Sebuah pabrik memproduksi 500.000 unit dalam sebulan, dan ditemukan ada 200 unit cacat. Tingkat bebas cacatnya adalah:

\[ \frac{500.000 - 200}{500.000} = 0.9996 \text{ atau } 99.96\% \]

Menggunakan tabel distribusi normal, nilai ini mendekati level Four Sigma (\(±4σ\)).

1.8 Strategi dan aplikasi

Karena Three Sigma mewakili setengah dari tingkat akurasi yang ditentukan Six Sigma, perusahaan yang menerapkan proses ini sering kali berada dalam tingkat pertumbuhan dan perkembangan rata-rata. Ini berarti bahwa strategi untuk meningkatkan akurasi dan kinerja dapat berbeda dari strategi yang diterapkan perusahaan saat menggunakan Six Sigma.

Misalnya, perusahaan tingkat menengah yang memproduksi aplikasi digital dapat mempertimbangkan strategi yang memperbaiki kesalahan atau bug dalam aplikasi untuk meningkatkan pengalaman pengguna dan menghasilkan lebih banyak pendapatan saat pengguna berlangganan. Penerapan prinsip-prinsip dari Three Sigma membutuhkan tingkat kesalahan sebesar 66.800 cacat aplikasi per satu juta unduhan. Penerapan Six Sigma berarti hanya ada 3,4 cacat atau bug aplikasi per satu juta unduhan.

1.9 Kesimpulan

  1. Semakin tinggi level sigma, semakin kecil kemungkinan cacat terjadi.

  2. Pada Three Sigma, sekitar 2.700 cacat per 1 juta produk, sedangkan pada Six Sigma hanya ada 3,4 cacat per 1 juta produk.

  3. Industri dengan toleransi kesalahan tinggi (seperti manufaktur umum) bisa menggunakan Three Sigma, sedangkan industri dengan kebutuhan presisi tinggi (farmasi, elektronik, penerbangan) harus menggunakan Six Sigma.

  4. Menghitung tingkat sigma bisa dilakukan dengan membandingkan jumlah produk cacat terhadap total produksi.

  5. Penerapan Six Sigma membantu perusahaan mengurangi biaya akibat kesalahan produksi, meningkatkan kepuasan pelanggan, dan meningkatkan efisiensi bisnis.


2 Penjelasan Z-Score dan T-Score


Dalam statistik, Z-Score dan T-Score digunakan untuk menentukan posisi suatu data dalam distribusi, terutama saat melakukan pengujian hipotesis dan interval kepercayaan. Keduanya memiliki fungsi serupa tetapi digunakan dalam situasi yang berbeda.

2.1 Definisi Z-Score

Z-Score adalah konversi dari data mentah ke nilai standar, Ketika data didasarkan pada rata-rata dan standar deviasi populasi. Nilai standar menunjukkan kedudukan skor tersebut dalam suatu sebaran. Ketika kita memiliki data yang lengkap, kita dapat menghitung Z-score. Z-score merupakan selisih antara rata-rata populasi dan data yang kita miliki, kemudian dibagi dengan standar deviasi populasi.

Adapun rumus yang terdapat Z-Score:

\[ Z = \frac{X - \mu}{\sigma} \]

Keterangan:

  • Z = Z-score

  • X = Nilai yang ingin kita cari probabilitasnya dalam tabel distribusi normal

  • \(μ\) = Rata-rata (mean) populasi

  • \(σ\)= Standar deviasi populasi

Adapun Z-score menunjukkan seberapa jauh suatu nilai yang menyimpang dari rata-rata populasi dan juga menunjukkan posisi dari data ketika dibandingkan dengan rata-rata tersebut.

2.1.1 Interpretasi Z-Score

  • Jika Z-score = 0: Nilai tersebut berada tepat pada rata-rata populasi.

  • Jika Z-score bernilai positif: Nilai tersebut berada di atas rata-rata populasi data.

  • Jika Z-score bernilai negatif: Nilai tersebut berada di bawah rata-rata populasi data.

Semakin besar deviasi Z-score dari nol (dari arah positif atau negatif), semakin besar pula deviasi data dari rata-rata. Sementara itu, Batasan kurva normal berada pada rentang -3 sampai +3, tetapi sebaiknya Z-score yang kita dapat berada pada rentang -2,5 sampai 2.5 karena jika data berada pada rentang ini, maka dapat dikatakan cukup berdistribusi normal.

2.1.2 Contoh Perhitungan Z-Score

Misalkan nilai ujian seorang siswa adalah 80, sedangkan rata-rata nilai kelas adalah 70 dengan standar deviasi 5.

\[ Z = \frac{X - \mu}{\sigma} \]

\[ Z = \frac{80 - 70}{5} = \frac{10}{5} = 2 \] Interpretasi: Nilai 80 berada 2 standar deviasi di atas rata-rata.

2.2 Definisi T-Score

T-score adalah konversi dari data mentah ke nilai standar, ketika konversi tersebut didasarkan pada rata-rata dan standar deviasi populasi. T Score digunakan ketika standar deviasi populasi tidak diketahui dan ketika ukuran sampel (\(n\)) kurang dari 30, sehingga kita dapat membuat estimasi dengan menggunakan data sampel yang ada.

Adapun rumus yang terdapat pada T-Score:

\[ T = \frac{X - \mu}{\frac{s}{\sqrt{n}}} \] Keterangan:

  • X = Rata-rata (mean) sampel
  • \(μ\) = Rata-rata (mean) populasi
  • \(s\) = Standar deviasi sampel
  • \(n\) = Ukuran sampel

Jika T-Score semakin besar, maka perbedaan di antara kelompok yang sedang dianalisis juga semakin besar. Hal ini dipengaruhi oleh beberapa faktor, seperti ukuran sampel yang digunakan, rata-rata sampel, rata-rata populasi, dan standar deviasi sampel.

2.2.1 Interpretasi Z-score

Jika Z-score memiliki nilai di antara -3 sampai 3, T-score memiliki nilai yang lebih besar. Hal ini karena rentang nilai T-score berada di antara 0 sampai 100 (kebanyakan hanya berada pada rentang 20 sampai 80). Banyak orang yang lebih menyukai T-score karena kurangnya angka negatif yang berarti T-Score lebih mudah untuk dikerjakan dan ada pada rentang yang lebih besar sehingga angka desimal hampir dihilangkan.

2.2.2 Contoh Perhitungan T-Score

Misalkan kita memiliki sampel kecil (n = 10) dengan rata-rata 70, standar deviasi 5, dan kita ingin mengetahui seberapa jauh nilai 80 dari rata-rata.

\[ T = \frac{X - \mu}{\frac{s}{\sqrt{n}}} \]

\[ T = \frac{80 - 70}{\frac{5}{\sqrt{10}}} \]

\[ T = \frac{10}{\frac{5}{3.16}} = \frac{10}{1.58} = 6.33 \] Interpretasi: Nilai 80 berada 6,33 standar deviasi dari rata-rata, yang menunjukkan bahwa ini adalah nilai yang sangat ekstrem dalam sampel kecil.

2.3 Perbedaan Z-Score dan T-Score

\[\text{Faktor}\] \[\text{Z-Score}\] \[\text{T-Score}\]
Ukuran Sampel \[n≥30\] \[n<30\]
Standar Deviasi Populasi \[(σ)\] diketahui Hanya sampel \[(s)\] diketahui
Distribusi Normal t-Student
Penggunaan Evaluasi distribusi data, pengujian hipotesis jika \[σ\] diketahui Pengujian hipotesis dengan sampel kecil

2.4 Contoh Pengujian Hipotesis dengan T-Test

Misalkan kita ingin menguji apakah obat baru meningkatkan tekanan darah rata-rata pasien.

  • Sampel: 15 pasien

  • Rata-rata sebelum obat: 120 mmHg

  • Rata-rata setelah obat: 125 mmHg

  • Standar deviasi: 4 mmHg

\[ T = \frac{X - \mu}{\frac{s}{\sqrt{n}}} \]

\[ T = \frac{125 - 120}{\frac{4}{\sqrt{15}}} = \frac{5}{1.03} = 4.85 \] Jika nilai T-Score ini lebih besar dari nilai kritis t-table, maka kita dapat menyimpulkan bahwa obat memiliki efek signifikan.

2.5 Tabel yang menunjukkan Z-score dan T-score yang ekuivalen

\[\text{Z-Score}\] \[\text{T-Score}\]
-5 0
-4 10
-3 20
-2 30
-1 40
0 50
1 60
2 70
3 80
4 90
5 100

2.6 Perbedaan antara Z-score dan T-score

Z-Score dan T-Score sama-sama mengkonversi nilai data menjadi nilai standar. Akan tetapi, terdapat beberapa perbedaan yang dapat dilihat pada tabel berikut:

\[\text{Indikator}\] \[\text{Z-Score}\] \[\text{T-Score}\]
Standarisasi Data Data yang distandarisasi merupakan data populasi Data yang distandarisasi merupakan data sampel
Ukuran Data Populasi diketahui atau jumlah data \[(n) \text{ lebih dari } 30\] Populasi tidak diketahui dan jumlah data \[(n) \text{ kurang dari } 30\]
Rata-rata Rata-rata selalu bernilai 0 Rata-rata selalu bernilai 50
Rentang Z-Score berada pada rentang -3 sampai 3 T-Score berada pada rentang 20 sampai 80
Standar Deviasi Standar deviasi selalu bernilai 1 Standar deviasi selalu bernilai 10
Hasil Turunan Hasil turunan dapat bernilai negatif Hasil turunan tidak dapat bernilai negatif
Preferensi Tidak lebih sering digunakan dibanding T-Score karena harus terdapat data yang besar Lebih sering digunakan dibanding Z-Score karena rentang yang lebih tinggi dan dapat digunakan pada data yang lebih kecil
Distribusi Z-Score adalah bagian dari distribusi Z T-Score adalah bagian dari distribusi T
Peningkatan Nilai Dengan peningkatan nilainya, Z-Score semakin mudah digunakan Dengan peningkatan nilainya, kegunaan T-Score menurun

2.7 Perbedaan antara Z-Score dan T-Score terkait dengan ukuran sampel karena alasan berikut:

1. Distribusi Normal vs Distribusi t-Student

  • Z-Score menggunakan distribusi normal, yang berlaku jika jumlah sampel cukup besar (biasanya \(n≥30\)).

  • T-Score menggunakan distribusi t-Student, yang lebih lebar dan memiliki ekor lebih panjang untuk menyesuaikan ketidakpastian akibat sampel kecil \((n<30)\).

Mengapa perlu distribusi t-Student untuk sampel kecil?

Ketika sampel kecil, ada lebih banyak variabilitas dalam data karena kita belum cukup mewakili seluruh populasi. Oleh karena itu, t-Score lebih “longgar” dibandingkan Z-Score untuk mengatasi ketidakpastian ini.

2. Standar Deviasi Populasi vs. Standar Deviasi Sampel

  • Pada Z-Score, kita mengetahui standar deviasi populasi \((σ)\), sehingga estimasi kita yang lebih akurat.

  • Pada T-Score, kita hanya mempunyai standar deviasi sampel \((s)\), yang mungkin belum cukup baik dalam merepresentasikan populasi.

Mengapa ukuran sampel 30 menjadi batasan umum?

  • Secara empiris, ketika \(n≥30\), distribusi sampel mulai mendekati distribusi normal berdasarkan Teorema Limit Pusat (Central Limit Theorem).

  • Jika ukuran sampel kecil \((n<30)\), distribusi cenderung lebih bervariasi dan tidak selalu normal, sehingga distribusi t-Student lebih cocok digunakan.

3. Perbedaan Bentuk Kurva Z dan T

  • Distribusi Z berbentuk simetris dan tetap.

  • Distribusi t berbentuk lebih lebar dengan ekor lebih panjang saat ukuran sampel kecil, karena ada lebih banyak ketidakpastian.

Saat ukuran sampel semakin besar, distribusi t-Student mendekati distribusi normal, sehingga perbedaan antara T-Score dan Z-Score semakin kecil. Pada \(n≥30\), t-Student hampir sama dengan distribusi normal, sehingga penggunaan Z-Score bisa dilakukan tanpa masalah.

2.8 Kesimpulan

Z-Score dan T-Score merupakan bagian uji hipotesis di bawah distribusi normal. Jika terdapat beberapa nilai yang dihasilkan dari beberapa kelompok berbeda, kita dapat menggunakan Z-Score untuk mengetahui letak ukuran nilai yang sebenarnya pada distribusi data. Standar nilai adalah prosedur yang digunakan secara luas di bidang penelitian dan perencanaan, karena standarisasi dapat membantu membandingkan berbagai nilai pada tes.

  1. Menggunakan Z-Score jika \(n≥30\): karena distribusi normal dapat digunakan dengan akurat berdasarkan Teorema Limit Pusat.

  2. Menggunakan T-Score jika \(n<30\): karena distribusi t-Student mengkompensasi ketidakpastian akibat ukuran sampel kecil.

  3. Jika standar deviasi populasi diketahui, gunakan Z-Score, berapa pun ukuran sampelnya. Jika hanya standar deviasi sampel yang diketahui, gunakan T-Score.

Sehingga, aturan 30 sebagai batasan adalah aturan praktis yang umum digunakan, tetapi dalam beberapa kasus bisa disesuaikan tergantung distribusi data yang sesungguhnya.