Probability Distribution

Teknik Survey dan Sampling

Chello Frhino Mike Mandolang (52240031)

February 23, 2025

1 \(3\sigma\) dan \(6\sigma\)

Berikut adalah video penjelasan awal mengenai sigma (\(\sigma\)), yang mulai dari 1-sigma (\(1\sigma\)) hingga 6-sigma (\(6\sigma\)),

Penjelasan lebih rinci mengenai 3-sigma(\(3\sigma\)) dan 6-sigma (\(6\sigma\)) sebagai berikut:

1.1 Penjelasan \(3\sigma\)

3-Sigma (\(3\sigma\)) merupakan sebuah konsep dalam statistik yang digunakan untuk mengukur tingkat variasi atau penyebaran data dalam suatu distribusi. Istilah “Sigma” (\(\sigma\)) sendiri merujuk pada standar deviasi, yaitu ukuran yang menunjukkan seberapa jauh suatu data menyimpang dari rata-rata populasi.

Dalam pendekatan 3-Sigma, nilai yang berada dalam rentang tiga kali standar deviasi dari rata-rata dianggap sebagai bagian dari distribusi normal, sedangkan data yang berada di luar batas tersebut sering kali dikategorikan sebagai anomali atau outlier. Dengan kata lain, konsep ini membantu dalam mendeteksi penyimpangan atau keganjilan dalam suatu proses atau dataset.

Dalam distribusi normal, prinsip 3-Sigma menunjukkan bahwa:
- Sekitar 68% dari data berada dalam ±1 Sigma dari rata-rata.
- Sekitar 95% dari data berada dalam ±2 Sigma dari rata-rata.
- Sekitar 99,7% dari data berada dalam ±3 Sigma dari rata-rata.

Karena hampir semua data berada dalam rentang tiga standar deviasi, nilai yang melampaui batas ini dianggap sebagai indikasi bahwa ada sesuatu yang tidak biasa atau memerlukan perhatian lebih lanjut. Oleh karena itu, metode ini sering digunakan dalam berbagai bidang, seperti pengendalian kualitas, analisis risiko, dan deteksi anomali dalam data statistik.

3-Sigma (\(3\sigma\)) memiliki rumus yang digunakan untuk menentukan batas normal dalam suatu distribusi data. Rumus ini membantu mengidentifikasi batas atas dan batas bawah untuk mendeteksi outlier atau penyimpangan dalam suatu proses.

1.2 Rumus 3-Sigma (\(3\sigma\))

Untuk menentukan batas kontrol dalam pendekatan 3-Sigma, digunakan rumus:

\[ Batas Atas = \mu + 3\sigma \]

\[ Batas Bawah = \mu - 3\sigma \]

Di mana:

  • \(\mu\) = Mean (rata-rata data)
  • \(\sigma\) = Standar deviasi (ukuran sebaran data)
  • 3 = Faktor skala untuk mencakup 99,73% dari distribusi normal

1.2.1 Kegunaan Rumus 3-Sigma (\(3\sigma\))

  1. Pengendalian Kualitas (Quality Control): Mengidentifikasi produk cacat berdasarkan batas kontrol.
  2. Deteksi Anomali: Mengidentifikasi nilai yang menyimpang dari tren normal.
  3. Pengambilan Keputusan: Menentukan apakah suatu variasi dalam proses masih dapat diterima atau tidak.

Rumus \(3\sigma\) sangat bermanfaat dalam berbagai bidang seperti manufaktur, keuangan, dan analisis data.

1.3 Contoh Penggunaan 3-Sigma (\(3\sigma\)) dalam Berbagai Bidang

1. Pengendalian Kualitas dalam Manufaktur

Sebuah pabrik memproduksi botol plastik dengan tinggi rata-rata 20 cm dan standar deviasi 0,5 cm. Dengan menggunakan metode 3-Sigma, batas kontrol produksi ditentukan sebagai:

\[ Batas Atas = 20 + (3 \times 0,5) = 21,5 \text{ cm} \]

\[ Batas Bawah = 20 - (3 \times 0,5) = 18,5 \text{ cm} \]

Jika dalam inspeksi ditemukan botol dengan tinggi di bawah 18,5 cm atau di atas 21,5 cm, maka botol tersebut dianggap cacat produksi dan perlu dilakukan evaluasi lebih lanjut.

2. Deteksi Anomali dalam Keuangan

Sebuah bank menganalisis transaksi nasabah untuk mendeteksi kecurangan. Jika rata-rata transaksi harian seorang nasabah adalah Rp5 juta dengan standar deviasi Rp500 ribu, maka batas 3-Sigma dihitung sebagai:

\[ Batas Atas = 5.000.000 + (3 \times 500.000) = 6.500.000 \]

\[ Batas Bawah = 5.000.000 - (3 \times 500.000) = 3.500.000 \]

Jika ada transaksi yang lebih dari Rp6,5 juta atau kurang dari Rp3,5 juta, sistem akan menandainya sebagai potensi transaksi mencurigakan dan akan dilakukan investigasi lebih lanjut.

3. Analisis Performa Mahasiswa

Di sebuah universitas, nilai rata-rata ujian mata kuliah statistik adalah 75 dengan standar deviasi 10. Dengan menggunakan pendekatan 3-Sigma, batas nilai normal adalah:

\[ Batas Atas = 75 + (3 \times 10) = 105 \]

\[ Batas Bawah = 75 - (3 \times 10) = 45 \]

Karena nilai maksimum adalah 100, maka nilai di atas 100 tidak relevan. Namun, jika ada mahasiswa yang mendapatkan nilai di bawah 45, maka ia mungkin memerlukan bimbingan tambahan untuk meningkatkan pemahamannya terhadap materi.

4. Pemantauan Waktu Pengiriman dalam Logistik

Sebuah perusahaan ekspedisi mencatat waktu rata-rata pengiriman barang adalah 48 jam dengan standar deviasi 6 jam. Maka batas 3-Sigma adalah:

\[ Batas Atas = 48 + (3 \times 6) = 66 \text{ jam} \]

\[ Batas Bawah = 48 - (3 \times 6) = 30 \text{ jam} \]

Jika ada paket yang dikirim dalam kurang dari 30 jam atau lebih dari 66 jam, maka paket tersebut akan ditandai sebagai keluar dari standar operasional, sehingga perlu dilakukan evaluasi terhadap penyebab keterlambatan atau kecepatan yang tidak biasa.

Kesimpulan dari contoh:

Dengan pendekatan 3-Sigma (\(3\sigma\)), berbagai industri dapat mengidentifikasi pola yang menyimpang dari standar normal dan mengambil tindakan korektif yang diperlukan.

1.4 Penjelasan \(6\sigma\)

6-Sigma merupakan sebuah metodologi statistik yang digunakan untuk mengoptimalkan kualitas suatu proses dengan meminimalkan variasi dan cacat. Istilah “Sigma” (\(\sigma\)) dalam statistik merujuk pada standar deviasi, yang menunjukkan seberapa jauh suatu data menyimpang dari rata-rata.

Dalam pendekatan 6-Sigma, proses yang berjalan dengan baik adalah yang memiliki tingkat cacat yang sangat rendah, yaitu hanya 3,4 cacat per satu juta peluang. Dengan kata lain, tingkat keberhasilan proses mencapai 99,99966%, sehingga hampir semua hasil yang diperoleh berada dalam batas kontrol yang telah ditentukan.

6-Sigma menggunakan pendekatan berbasis data dan analisis statistik untuk mengidentifikasi dan menghilangkan penyebab variasi dalam suatu sistem. Metodologi ini sering diterapkan dalam pengendalian kualitas, peningkatan efisiensi operasional, dan pengambilan keputusan berbasis data.

Pendekatan utama dalam 6-Sigma terbagi menjadi dua metode:
- DMAIC (Define, Measure, Analyze, Improve, Control) – Digunakan untuk meningkatkan proses yang sudah ada dengan mengidentifikasi penyebab utama cacat dan menghilangkannya.
- DMADV (Define, Measure, Analyze, Design, Verify) – Digunakan untuk merancang produk atau proses baru yang memiliki kualitas tinggi sejak awal.

Karena fokusnya pada peningkatan kualitas dan pengurangan variasi, metode 6-Sigma sering diterapkan dalam berbagai industri, seperti manufaktur, kesehatan, keuangan, dan layanan pelanggan, untuk memastikan efisiensi yang lebih tinggi dan hasil yang lebih konsisten.

1.5 Rumus dalam 6-Sigma

6-Sigma menggunakan pendekatan berbasis statistik untuk mengukur seberapa baik suatu proses beroperasi dengan meminimalkan cacat atau variasi. Salah satu rumus utama dalam 6-Sigma adalah kapabilitas proses, yang dinyatakan dalam bentuk Sigma Level.

1.5.1 1. Rumus Sigma Level

Sigma level dihitung menggunakan rumus:

\[ Z = \frac{USL - \mu}{\sigma} \] \[ Z = \frac{\mu - LSL}{\sigma} \]

Di mana:
- \(Z\) = Nilai sigma (Sigma Level)
- \(\mu\) = Mean (rata-rata proses)
- \(\sigma\) = Standar deviasi proses
- USL = Upper Specification Limit (Batas spesifikasi atas)
- LSL = Lower Specification Limit (Batas spesifikasi bawah)

Interpretasi Sigma Level:
- 1-Sigma → 690.000 cacat per juta peluang (DPMO) → 31% kualitas baik
- 2-Sigma → 308.000 cacat per juta peluang (DPMO) → 69% kualitas baik
- 3-Sigma → 66.800 cacat per juta peluang (DPMO) → 93,3% kualitas baik
- 4-Sigma → 6.210 cacat per juta peluang (DPMO) → 99,38% kualitas baik
- 5-Sigma → 230 cacat per juta peluang (DPMO) → 99,977% kualitas baik
- 6-Sigma → 3,4 cacat per juta peluang (DPMO) → 99,99966% kualitas baik

1.5.2 2. Rumus Defects Per Million Opportunities (DPMO)

Untuk mengukur jumlah cacat dalam suatu proses, digunakan rumus:

\[ DPMO = \left( \frac{Jumlah\ Cacat}{Jumlah\ Unit \times Peluang\ Cacat\ per\ Unit} \right) \times 1.000.000 \]

Di mana:
- Jumlah Cacat = Total jumlah kesalahan atau produk cacat yang ditemukan
- Jumlah Unit = Total produk yang diproduksi
- Peluang Cacat per Unit = Jumlah kemungkinan cacat dalam satu unit produk

1.6 Contoh Perhitungan 6-Sigma

Misalkan sebuah pabrik memproduksi 100.000 unit barang, dan dalam pemeriksaan ditemukan 500 cacat. Jika setiap unit memiliki 5 peluang cacat, maka nilai DPMO dihitung sebagai:

\[ DPMO = \left( \frac{500}{100.000 \times 5} \right) \times 1.000.000 \]

\[ DPMO = \left( \frac{500}{500.000} \right) \times 1.000.000 \]

\[ DPMO = 1.000 \]

Berdasarkan tabel Sigma Level, 1.000 DPMO berada di antara 5-Sigma dan 6-Sigma, yang berarti proses ini sudah memiliki kualitas yang sangat baik.

Dengan menggunakan rumus ini, perusahaan dapat menilai efektivitas prosesnya, mengidentifikasi penyebab variasi, dan mengambil tindakan perbaikan untuk mencapai standar 6-Sigma.

1.7 Perbandingan 3-Sigma (\(3\sigma\)) dan 6-Sigma (\(6\sigma\))

Berikut adalah tabel yang menjelaskan perbandingan dari 3-sigma (\(3\sigma\)) dan 6-sigma (\(6\sigma\)),ditampilkan dengan tabel agar lebih mudah dilihat mata dan lebih mudah untuk dipahami:

Aspek 3-Sigma (\(3\sigma\)) 6-Sigma (\(6\sigma\))
Konsep Utama Metode statistik untuk memantau stabilitas proses. Pendekatan berbasis data untuk mencapai kualitas hampir sempurna.
Jumlah Cacat (DPMO) Sekitar 66.800 cacat per satu juta peluang. Hanya 3,4 cacat per satu juta peluang.
Tingkat Keakuratan Sekitar 93,3% produk atau layanan bebas dari cacat. Memastikan kualitas hingga 99,99966% tanpa kesalahan.
Sensitivitas terhadap Variasi Masih rentan terhadap fluktuasi dalam proses produksi atau layanan. Mengontrol variasi secara ketat agar tetap konsisten.
Lingkup Penggunaan Cocok untuk sistem yang memiliki toleransi kesalahan lebih besar. Lebih sesuai untuk industri dengan standar kualitas tinggi seperti otomotif dan medis.
Pendekatan Kualitas Mendeteksi kesalahan setelah terjadi, lalu memperbaikinya. Menghindari kesalahan sejak awal dengan strategi perbaikan berkelanjutan.
Metode yang Digunakan Menggunakan batas kontrol ±3σ untuk mengidentifikasi penyimpangan. Mengandalkan metode DMAIC dan DMADV untuk optimalisasi proses.
Tujuan Utama Menjaga agar proses tetap dalam batas kendali. Mengembangkan proses agar mencapai hasil dengan cacat yang nyaris nol.

1.7.1 Kesimpulan:

  • 3-Sigma (\(3\sigma\)) masih memiliki tingkat kesalahan yang relatif tinggi sehingga lebih fleksibel dalam aplikasi di bidang tertentu.
  • 6-Sigma (\(6\sigma\)) memastikan kontrol kualitas yang jauh lebih ketat, ideal untuk industri yang memerlukan tingkat presisi tinggi.

2 Z-score dan T-score

Dalam analisis statistik, Z-score dan T-score merupakan dua ukuran yang digunakan untuk menilai posisi suatu data dalam distribusi serta menguji perbedaan antar kelompok. Keduanya berfungsi untuk menentukan seberapa jauh suatu nilai dari rata-rata dalam satuan standar deviasi, tetapi memiliki perbedaan dalam penerapannya.

Z-score digunakan ketika jumlah sampel cukup besar dan standar deviasi populasi diketahui, sehingga distribusi data dapat diasumsikan mengikuti distribusi normal. Sementara itu, T-score lebih sesuai untuk sampel kecil atau ketika standar deviasi populasi tidak diketahui, dengan mempertimbangkan ketidakpastian dalam estimasi.

Pemahaman mengenai Z-score dan T-score sangat penting dalam berbagai bidang, seperti penelitian akademik, pengambilan keputusan bisnis, dan analisis data, karena memungkinkan kita untuk menilai pola distribusi data serta membandingkan kelompok dengan lebih akurat. Berikut adalah penjelasan lebih rincinya:

2.1 Z-score

Z-score, atau dikenal juga sebagai standard score, adalah suatu ukuran statistik yang digunakan untuk menentukan sejauh mana suatu nilai menyimpang dari rata-rata dalam suatu distribusi data. Nilai ini dinyatakan dalam satuan standar deviasi, yang memungkinkan perbandingan antar data dalam skala yang berbeda.

Z-score menunjukkan apakah suatu data berada di atas atau di bawah rata-rata dan seberapa jauh dari rata-rata tersebut. Jika nilai Z-score positif, berarti data tersebut berada di atas rata-rata, sedangkan jika negatif, data tersebut berada di bawah rata-rata.

2.1.1 Interpretasi Z-Score

  • Z = 0 → Nilai data sama dengan rata-rata.
  • Z positif → Nilai data lebih besar dari rata-rata.
  • Z negatif → Nilai data lebih kecil dari rata-rata.
  • |Z| > 2 → Data cukup jauh dari rata-rata, sering dianggap sebagai outlier dalam beberapa analisis statistik.
  • |Z| > 3 → Data dianggap sebagai outlier yang signifikan.

Dengan menggunakan Z-score, kita dapat menilai apakah suatu data memiliki perilaku normal dalam distribusi atau menunjukkan pola yang tidak biasa.

2.1.2 Situasi di Mana Z-Score Perlu Digunakan

Z-score digunakan dalam berbagai situasi ketika kita perlu menganalisis posisi suatu data dalam distribusi, membandingkan data dari skala yang berbeda, atau mendeteksi nilai yang tidak biasa (outlier). Berikut adalah beberapa kondisi utama di mana Z-score sangat berguna:

1. Membandingkan Data dari Skala yang Berbeda

Ketika kita memiliki dua atau lebih kumpulan data dengan satuan atau skala yang berbeda, Z-score membantu menyamakan perbandingan.

Contoh:
- Seorang siswa mendapat 85 dalam ujian Matematika dan 78 dalam ujian Fisika.
- Rata-rata kelas untuk Matematika adalah 75 dengan standar deviasi 10, sedangkan rata-rata kelas untuk Fisika adalah 70 dengan standar deviasi 5.
- Dengan menghitung Z-score untuk kedua nilai, kita bisa menentukan dalam mata pelajaran mana siswa tersebut lebih unggul dibanding teman-temannya.

2. Menentukan Seberapa Jauh Suatu Nilai dari Rata-Rata

Z-score digunakan untuk mengetahui apakah suatu data jauh dari nilai rata-rata atau berada dalam distribusi normal.

Contoh:
- Jika sebuah mesin produksi menghasilkan botol air dengan rata-rata volume 500 ml dan standar deviasi 5 ml, maka botol dengan volume 490 ml memiliki Z-score negatif yang menunjukkan bahwa volumenya berada di bawah rata-rata.

3. Mendeteksi Outlier dalam Data

Outlier adalah data yang sangat berbeda dari kebanyakan nilai dalam distribusi. Dalam banyak kasus, nilai dengan Z-score lebih dari 3 atau kurang dari -3 dianggap sebagai outlier yang perlu dianalisis lebih lanjut.

Contoh:
- Jika kita menganalisis penghasilan bulanan karyawan di suatu perusahaan dan menemukan bahwa sebagian besar berada dalam rentang 5–10 juta rupiah, tetapi ada satu karyawan yang berpenghasilan 50 juta rupiah, Z-score dapat menunjukkan bahwa nilai ini merupakan outlier.

4. Mengonversi Data ke Distribusi Normal (Standarisasi Data)

Dalam analisis statistik dan pembelajaran mesin (machine learning), banyak metode memerlukan data yang berdistribusi normal. Jika data asli memiliki skala yang bervariasi, Z-score membantu mengubahnya menjadi distribusi standar dengan rata-rata 0 dan standar deviasi 1.

Contoh:
- Dalam analisis regresi atau algoritma pembelajaran mesin seperti K-Nearest Neighbors (KNN), data sering kali perlu dinormalisasi menggunakan Z-score agar fitur dengan skala besar tidak mendominasi model.

2.1.3 Kesimpulan

Z-score sangat bermanfaat dalam berbagai situasi, terutama ketika kita ingin:
Membandingkan data dengan skala berbeda
Mengetahui posisi suatu data dalam distribusi
Mendeteksi outlier dalam data
Melakukan standarisasi untuk analisis statistik lebih lanjut

Dengan menggunakan Z-score, kita bisa memahami data lebih dalam dan membuat keputusan berdasarkan informasi yang lebih objektif.

2.2 T-score

T-score, atau dikenal sebagai T-value, adalah ukuran statistik yang digunakan untuk menentukan posisi suatu nilai dalam distribusi data ketika ukuran sampel terbatas atau standar deviasi populasi tidak diketahui. T-score sering digunakan dalam uji hipotesis, terutama dalam uji-t (t-test), untuk membandingkan rata-rata suatu kelompok dengan populasi atau membandingkan dua kelompok berbeda.

T-score mirip dengan Z-score, tetapi digunakan ketika jumlah sampel kecil (n < 30) atau saat variabilitas populasi belum diketahui dengan pasti. Distribusi T memiliki ekor yang lebih tebal dibandingkan distribusi normal, yang berarti lebih cocok untuk menangani ketidakpastian dalam sampel kecil.

2.2.1 Interpretasi T-Score

  • T-score mendekati 0 → Nilai data tidak jauh dari rata-rata sampel.
  • T-score positif → Nilai data lebih besar dari rata-rata sampel.
  • T-score negatif → Nilai data lebih kecil dari rata-rata sampel.
  • T-score besar (baik positif maupun negatif) → Perbedaan antara sampel dan populasi cukup signifikan.

T-score sering digunakan dalam analisis statistik untuk menentukan apakah suatu perbedaan terjadi karena faktor acak atau memang menunjukkan pola yang nyata dalam data.

2.2.2 Situasi di Mana T-Score Perlu Digunakan

T-score digunakan dalam berbagai kondisi ketika data yang dianalisis memiliki keterbatasan dalam jumlah sampel atau ketika standar deviasi populasi tidak diketahui secara pasti. Berikut adalah beberapa situasi utama di mana T-score lebih tepat digunakan dibandingkan ukuran statistik lainnya:

1. Ketika Ukuran Sampel Kecil (n < 30)

T-score digunakan jika jumlah sampel yang tersedia relatif kecil, yaitu kurang dari 30 pengamatan. Dalam kondisi ini, distribusi normal mungkin tidak sepenuhnya berlaku, sehingga distribusi t lebih sesuai karena memperhitungkan ketidakpastian dalam estimasi parameter populasi.

Contoh:
- Sebuah perusahaan ingin menguji efektivitas pelatihan baru terhadap peningkatan produktivitas karyawan. Karena hanya 15 karyawan yang mengikuti pelatihan, T-score digunakan untuk mengukur perbedaan rata-rata sebelum dan sesudah pelatihan.

2. Ketika Standar Deviasi Populasi Tidak Diketahui

Jika standar deviasi populasi tidak tersedia atau sulit untuk dihitung, maka T-score lebih tepat digunakan dibandingkan Z-score. Ini karena T-score memperhitungkan variasi dalam sampel untuk memperkirakan standar deviasi populasi.

Contoh:
- Seorang peneliti ingin mengetahui apakah konsumsi suplemen tertentu meningkatkan daya ingat mahasiswa. Karena standar deviasi populasi tidak diketahui, ia menggunakan T-score untuk menguji apakah ada perbedaan signifikan antara kelompok yang mengonsumsi suplemen dan yang tidak.

3. Saat Melakukan Uji Hipotesis terhadap Rata-Rata

Dalam uji statistik seperti uji-t satu sampel, uji-t dua sampel independen, dan uji-t berpasangan, T-score digunakan untuk menentukan apakah terdapat perbedaan signifikan antara dua kelompok data.

Contoh:
- Sebuah laboratorium ingin membandingkan rata-rata tekanan darah pasien sebelum dan sesudah diberikan obat baru. Karena jumlah pasien dalam penelitian terbatas dan standar deviasi populasi tidak diketahui, analisis menggunakan T-score lebih sesuai.

4. Saat Menganalisis Perbedaan Antara Dua Kelompok Kecil

Jika ingin membandingkan dua kelompok kecil yang mungkin memiliki perbedaan rata-rata, T-score digunakan untuk mengevaluasi apakah perbedaan tersebut signifikan secara statistik atau hanya terjadi karena variabilitas acak dalam data.

Contoh:
- Sebuah sekolah ingin mengetahui apakah ada perbedaan skor ujian antara dua kelas yang diajar dengan metode pengajaran berbeda. Karena jumlah siswa di masing-masing kelas relatif kecil, uji-t dengan T-score digunakan untuk menganalisis perbedaannya.

2.2.3 Kesimpulan

T-score digunakan dalam situasi berikut:
Jumlah sampel kecil (n < 30)
Standar deviasi populasi tidak diketahui
Analisis uji hipotesis terhadap rata-rata
Perbandingan antara dua kelompok kecil

Dengan menggunakan T-score, analisis statistik menjadi lebih akurat dalam kondisi data yang terbatas, sehingga keputusan yang diambil berdasarkan data menjadi lebih valid.

2.3 Perbandingan Z-Score dan T-Score

Disajikan dalam bentuk tabel agar lebih mudah unuk dicermati dan dipahami, berikut adalah tabelnya:

Aspek Z-Score T-Score
Definisi Ukuran statistik yang menunjukkan seberapa jauh suatu nilai dari rata-rata dalam satuan standar deviasi berdasarkan distribusi normal. Ukuran statistik yang digunakan untuk mengukur posisi suatu nilai dalam distribusi ketika ukuran sampel kecil atau standar deviasi populasi tidak diketahui.
Kapan Digunakan Jika ukuran sampel besar (n ≥ 30) dan standar deviasi populasi diketahui. Jika ukuran sampel kecil (n < 30) atau standar deviasi populasi tidak diketahui.
Distribusi Menggunakan distribusi normal (z-distribution). Menggunakan distribusi t-Student, yang memiliki ekor lebih tebal untuk mengakomodasi ketidakpastian.
Rumus \(Z = \frac{x - \mu}{\sigma}\) \(T = \frac{x - \bar{x}}{s / \sqrt{n}}\)
Variabilitas Lebih rendah karena standar deviasi populasi diketahui. Lebih tinggi karena standar deviasi sampel digunakan sebagai estimasi standar deviasi populasi.
Penggunaan dalam Uji Hipotesis Uji-Z untuk membandingkan sampel terhadap populasi saat standar deviasi populasi diketahui. Uji-T digunakan untuk membandingkan sampel terhadap populasi atau antar dua kelompok saat standar deviasi populasi tidak diketahui.

Tabel ini memberikan perbandingan antara Z-score dan T-score, membantu dalam menentukan metode statistik yang paling tepat sesuai dengan karakteristik data yang dianalisis.

