Probability Distribution

Tugas Week 11

## Warning: package 'htmltools' was built under R version 4.5.2

Ahmad Rizki Mubarak

Mahasiswa Sains Data ITSB

1.Introduction Probability Distributions

Probabilitas tidak hanya membantu kita memahami seberapa besar kemungkinan suatu peristiwa akan terjadi, tetapi juga membentuk fondasi dari banyak metode statistik yang digunakan untuk pengambilan keputusan. Ketika suatu proses atau eksperimen menghasilkan berbagai hasil yang berbeda, kita menggunakan variabel acak untuk merepresentasikan hasil-hasil tersebut dan distribusi probabilitas untuk menjelaskan bagaimana probabilitas dialokasikan ke setiap nilai yang mungkin.

Memahami bentuk dan sifat dari suatu distribusi adalah hal yang penting karena ini menentukan bagaimana data berperilaku, bagaimana kita menghitung probabilitas, dan bagaimana kita membuat prediksi. Mulai dari distribusi untuk variabel kontinu hingga perilaku statistik seperti rata-rata sampel, distribusi probabilitas berfungsi sebagai inti dari statistika inferensial.

Materi ini akan memandu Anda melalui beberapa konsep kunci:

  • Variabel Acak Kontinu (Continuous Random Variables): Untuk variabel kontinu, yang menjelaskan kemungkinan nilai di atas rentang yang berkelanjutan.
  • Distribusi Sampling (Sampling Distributions): Yang merepresentasikan distribusi statistik sampel seperti rata-rata sampel atau proporsi sampel.
  • Teorema Batas Pusat (The Central Limit Theorem - CLT): Salah satu hasil terpenting dalam statistik, yang menjelaskan mengapa distribusi rata-rata sampel cenderung menjadi normal terlepas dari bentuk dasar populasi.
  • Distribusi Proporsi Sampel (Sample Proportion Distributions): Digunakan secara luas dalam analisis survei dan penelitian kuantitatif.

Setiap bagian didukung dengan penjelasan video untuk meningkatkan pemahaman konseptual. Dengan menguasai topik-topik ini, Anda akan lebih siap untuk menganalisis data, membangun model statistik, dan menarik kesimpulan berdasarkan prinsip-prinsip probabilistik yang kuat.

2.Continuous Random

Tentu, berikut adalah terjemahan dari teks mengenai Variabel Acak Kontinu ke dalam Bahasa Indonesia yang formal dan terstruktur:


Variabel Acak Kontinu (Random Variable)

Variabel acak

[Image of Random variable density function] dikatakan kontinu jika variabel tersebut dapat mengambil nilai apa pun di dalam suatu interval pada garis bilangan riil.

Contoh meliputi: tinggi badan (height), waktu (time), suhu (temperature), usia (age), tekanan (pressure), dan kecepatan (velocity).

Karakteristik Kunci:

  • Variabel mengambil nilai dalam suatu interval, seperti \((a, b)\) atau bahkan \((-\infty, +\infty)\).
  • Peluang dari satu titik atau nilai tunggal selalu nol: \[P(X = x) = 0\]
  • Peluang hanya bermakna jika dihitung untuk interval (rentang nilai): \[P(a \leq X \leq b) = \int_{a}^{b} f(x) dx\]

(Keterangan: Dalam konteks peluang kontinu, \(f(x)\) adalah fungsi kepadatan peluang (probability density function) dan peluang dihitung sebagai area di bawah kurva \(f(x)\) dari \(a\) hingga \(b\)).

Perbedaan Variabel Diskrit dan Kontinu

Video ini dimulai dengan meninjau kembali variabel diskrit untuk menjelaskan perbedaannya dengan variabel kontinu, yang menjadi fokus utama.

Variabel Diskrit

Variabel Diskrit adalah variabel yang hanya dapat mengambil nilai yang dapat dihitung (countable) atau terbatas.

Karakteristik Contoh
Nilai: Hanya bilangan bulat tertentu, atau nilai yang terpisah. Jumlah anak dalam keluarga (0, 1, 2, 3…).
Diperoleh melalui: Penghitungan (Counting). Jumlah kepala yang muncul saat melempar koin 4 kali.

Variabel Kontinu

Variabel Kontinu adalah variabel yang dapat mengambil nilai numerik apa pun dalam rentang tertentu, dan nilainya bersifat tak terhitung (uncountable).

Karakteristik Contoh
Nilai: Dapat diukur hingga titik desimal tak terbatas (infinite possibilities). Berat (150.3054… kg), Usia (23 tahun, 6 bulan, 2 hari…), Suhu, Jarak.
Diperoleh melalui: Pengukuran (Measuring). Mengukur tinggi badan seseorang.

Distribusi Probabilitas dan Visualisasi

Cara mempresentasikan distribusi probabilitas kedua jenis variabel ini berbeda.

Visualisasi Variabel Diskrit

  • Alat: Diagram Batang (Bar Chart).
  • Fitur: Terdapat celah/ruang di antara setiap batang.
  • Tujuan: Untuk menunjukkan bahwa setiap kemungkinan hasil adalah entitas yang terpisah (dapat dihitung).

Visualisasi Variabel Kontinu

  • Alat: Histogram dan Kurva Kepadatan (Density Curve).
  • Fitur Histogram: Tidak ada celah di antara setiap batang, mencerminkan sifat data yang kontinu.
  • Kurva Kepadatan (Density Curve): Merupakan representasi halus dari histogram, menunjukkan distribusi probabilitas variabel kontinu.

Kurva kepadatan adalah kunci untuk memahami probabilitas variabel kontinu.

Konsep Rumus untuk Variabel Kontinu

Karena variabel kontinu memiliki kemungkinan nilai yang tak terbatas, formula probabilitasnya berbeda dari variabel diskrit.

Probabilitas pada Kurva Kepadatan

Untuk variabel kontinu, probabilitas tidak bisa dihitung untuk satu titik nilai spesifik.

  1. Probabilitas Titik Tunggal adalah Nol: \[P(X = x) = 0\]

    • Penjelasan: Probabilitas seseorang memiliki usia tepat 23.5000000000… tahun adalah nol, karena ada kemungkinan tak terbatas di sekitar titik tersebut.
  2. Probabilitas adalah Luas di Bawah Kurva: Probabilitas bahwa variabel acak kontinu \(X\) berada dalam rentang nilai tertentu (misalnya, antara \(a\) dan \(b\)) diwakili oleh luas area di bawah Kurva Kepadatan dalam rentang tersebut. \[P(a \le X \le b) = \text{Luas di bawah kurva } f(x) \text{ dari } a \text{ sampai } b\]

    • Secara matematis, luas di bawah kurva dihitung menggunakan Integral (meskipun istilah integral tidak disebutkan eksplisit, ini adalah konsep di balik “formula kurva kepadatan”).

Fokus Utama: Distribusi Normal

Video ini menyoroti bahwa Distribusi Normal (Normal Distribution) adalah jenis Kurva Kepadatan yang akan sering digunakan. Distribusi Normal menjadi model penting dalam probabilitas variabel kontinu.

Untuk Distribusi Normal, perhitungan probabilitas biasanya melibatkan standarisasi nilai \(X\) menjadi skor \(Z\):

Rumus Z-Score (Skor Standar): \[Z = \frac{X - \mu}{\sigma}\]

  • \(Z\): Nilai standar (Z-Score).
  • \(X\): Nilai data observasi.
  • \(\mu\): Rata-rata populasi.
  • \(\sigma\): Simpangan baku (Standard Deviation) populasi.

3.Sampling Distributions

Tiga Jenis Distribusi Utama

Video ini membedakan antara tiga jenis distribusi data:

Jenis Distribusi Definisi Statistik yang Digunakan
Distribusi Populasi Distribusi yang dibuat dengan mengukur setiap individu dalam seluruh populasi. \(\mu\) (Rata-rata Populasi), \(\sigma\) (Simpangan Baku Populasi)
Distribusi Sampel Distribusi yang dibuat dari data satu sampel tunggal yang diambil dari populasi. Rata-rata Sampel (\(\bar{x}\)), Simpangan Baku Sampel (\(s\))
Distribusi Sampling Distribusi dari statistik (misalnya, rata-rata \(\bar{x}\)) yang dibuat dari berbagai sampel acak sederhana yang ditarik berulang kali dari populasi yang sama. Rata-rata dari semua \(\bar{x}\) (\(\mu_{\bar{x}}\)), Simpangan Baku dari \(\bar{x}\) (\(\sigma_{\bar{x}}\))

Tujuan Distribusi Sampling: Distribusi Sampling sangat berguna karena memungkinkan kita untuk mendapatkan gambaran tentang nilai rata-rata populasi (\(\mu\)) tanpa perlu mengukur setiap individu, serta memungkinkan perhitungan probabilitas untuk hasil rata-rata sampel.


Parameter dan Formula Kunci

Video ini membandingkan parameter (rata-rata dan simpangan baku) antara Distribusi Populasi dan Distribusi Sampling.

Parameter Distribusi Populasi

Distribusi Populasi diasumsikan berdistribusi normal dengan rata-rata \(\mu\) dan simpangan baku \(\sigma\).

  • Notasi: \(X \sim N(\mu, \sigma)\)
  • Z-score Populasi (Standarisasi): \[Z = \frac{X - \mu}{\sigma}\] Digunakan ketika menganalisis nilai individu (\(X\)) dari populasi.

Parameter Distribusi Sampling (dari Rata-rata Sampel, \(\bar{x}\))

Distribusi Sampling dari rata-rata sampel \((\bar{x})\) juga akan menjadi distribusi normal (berkat Central Limit Theorem) dan memiliki karakteristik sebagai berikut:

  1. Rata-rata Distribusi Sampling (\(\mu_{\bar{x}}\)): Rata-rata dari semua rata-rata sampel sama dengan rata-rata populasi. \[\mu_{\bar{x}} = \mu\]

  2. Simpangan Baku Distribusi Sampling (Galat Baku / Standard Error): Simpangan baku dari distribusi sampling selalu lebih kecil daripada simpangan baku populasi. Ini menunjukkan penyebaran yang lebih kecil/sempit (lebih sedikit variabilitas). \[\sigma_{\bar{x}} = \frac{\sigma}{\sqrt{n}}\] di mana \(n\) adalah ukuran sampel.

  • Notasi: \(\bar{x} \sim N(\mu, \sigma/\sqrt{n})\)
  1. Z-score Distribusi Sampling (Standarisasi): Digunakan untuk menghitung probabilitas suatu rata-rata sampel (\(\bar{x}\)) tertentu. \[Z = \frac{\bar{x} - \mu}{\sigma_{\bar{x}}} = \frac{\bar{x} - \mu}{\sigma/\sqrt{n}}\]

Visualisasi Penyebaran

Video menunjukkan secara visual bahwa Distribusi Sampling memiliki penyebaran (spread) yang jauh lebih kecil dibandingkan Distribusi Populasi.

  • Distribusi Populasi: Memiliki \(\sigma\) yang besar (kurva lebih lebar).
  • Distribusi Sampling: Memiliki \(\sigma_{\bar{x}}\) yang lebih kecil (kurva lebih sempit dan tinggi).

Penyebaran yang lebih sempit ini terjadi karena nilai rata-rata (averages) secara alami kurang bervariasi daripada nilai pengamatan individu.


Penggunaan Z-score dalam Probabilitas

Video mengilustrasikan dua jenis perhitungan Z-score:

Kasus A: Probabilitas Rata-rata Sampel (Menggunakan Distribusi Sampling)

Soal Contoh: Berapa probabilitas rata-rata tinggi badan dari 10 orang kurang dari 157 cm?

  1. Identifikasi: Gunakan Z-score Distribusi Sampling (dengan \(\sigma_{\bar{x}}\)) karena ini melibatkan rata-rata sampel (\(n=10\)).

  2. Hitung \(Z\): Masukkan \(\bar{x}\), \(\mu\), dan \(\sigma_{\bar{x}}\) ke dalam rumus Z-score Distribusi Sampling.

  3. Cari Area: Gunakan nilai \(Z\) yang dihasilkan untuk mencari luas area/probabilitas yang dicari (misalnya, \(P(\bar{x} < 157)\)) menggunakan tabel Z atau fungsi pnorm() di R.

Kasus B: Probabilitas Nilai Individu (Menggunakan Distribusi Populasi)

Soal Contoh: Berapa proporsi semua orang yang memiliki tinggi badan lebih dari 170 cm?

  1. Identifikasi: Gunakan Z-score Populasi (dengan \(\sigma\)) karena ini melibatkan individu dari seluruh populasi, bukan rata-rata sampel.

  2. Hitung \(Z\): Masukkan nilai individu (\(X\)), \(\mu\), dan \(\sigma\) ke dalam rumus Z-score Populasi.

  3. Cari Area: Cari probabilitasnya. Jika tabel/fungsi R memberikan area di sebelah kiri, lakukan \(1 - Area\) untuk mendapatkan probabilitas di sebelah kanan (\(P(X > 170)\)).

4.Central Limit Theorem

Video ini membahas Central Limit Theorem (CLT), sebuah konsep fundamental dalam statistika inferensial yang memprediksi bentuk dari Distribusi Sampling berdasarkan ukuran sampel (\(n\)).

Tinjauan Distribusi Sampling

Sebelum membahas CLT, penting untuk meninjau Distribusi Sampling.

  • Definisi: Distribusi Sampling adalah distribusi yang dibuat dengan mengambil sampel berulang kali dari suatu populasi, menghitung statistik (misalnya, rata-rata \(\bar{x}\)) untuk setiap sampel, dan kemudian menggabungkan semua statistik tersebut menjadi satu grafik.

Definisi dan Konsep Central Limit Theorem (CLT)

Central Limit Theorem (CLT) memprediksi bahwa jika ukuran sampel (\(n\)) cukup besar, maka Distribusi Sampling dari rata-rata sampel (\(\bar{x}\)) akan berdistribusi Normal secara mendekati (approximately normal).

  • Poin Penting: Terlepas dari seperti apa bentuk Distribusi Populasi awalnya (miring (skewed), seragam, atau bentuk lainnya), jika \(n\) cukup besar, Distribusi Sampling akan selalu menjadi Normal.

Aturan Ukuran Sampel (\(n\))

CLT menentukan seberapa besar \(n\) harus agar Distribusi Sampling menjadi Normal:

Kondisi Awal Populasi Ukuran Sampel Minimum (\(n\)) Hasil Distribusi Sampling
Tidak Diketahui atau Miring (Skewed) \(n \ge 30\) Mendekati Normal (CLT berlaku)
Sudah Normal (Normally Distributed) \(n < 30\) (kecil) Tetap Normal (CLT dapat diasumsikan berlaku)

Catatan Praktis: Sampel kecil dapat menyebabkan lebih banyak variabilitas dan risiko mendapatkan sampel yang tidak biasa, yang akan membuat perkiraan distribusi sampling menjadi tidak akurat.

Parameter dan Formula Distribusi Sampling

Ketika CLT berlaku, Distribusi Sampling memiliki parameter berikut, yang merupakan fondasi untuk perhitungan probabilitas di R Studio:

  • Rata-rata Distribusi Sampling (\(\mu_{\bar{x}}\)): Rata-rata dari rata-rata sampel sama dengan rata-rata populasi. \[\mu_{\bar{x}} = \mu\]
  • Simpangan Baku Distribusi Sampling (Galat Baku / Standard Error - \(\sigma_{\bar{x}}\)): \[\sigma_{\bar{x}} = \frac{\sigma}{\sqrt{n}}\]

Ini memungkinkan penggunaan Z-score Distribusi Sampling untuk menghitung probabilitas rata-rata sampel (\(\bar{x}\)) tertentu: \[Z = \frac{\bar{x} - \mu}{\sigma/\sqrt{n}}\]

Peran dan Kegunaan CLT

Karena CLT menjamin bahwa Distribusi Sampling akan Normal (jika \(n\) besar), kita dapat menggunakan formula dan metode statistik yang berkaitan dengan Distribusi Normal untuk menafsirkan data dan menghitung probabilitas, yang sangat penting dalam analisis inferensial.

CLT sangat berguna untuk analisis data besar:

  • Dengan mengetahui bahwa distribusi akan Normal, kita dapat menggunakan formula dan metode statistik yang berkaitan dengan Distribusi Normal untuk menafsirkan data dan menghitung probabilitas.
  • CLT memungkinkan kita untuk membuat kesimpulan yang valid tentang populasi (inferensi statistik) hanya dengan mengambil sampel, yang jauh lebih efisien daripada mengukur seluruh populasi.

5.Sample Proportion

Definisi dan Notasi Proporsi

Proporsi menjelaskan pecahan (fraksi) hasil yang menguntungkan (favorable outcomes) relatif terhadap keseluruhan.

  • Proporsi Populasi (\(p\)): Proporsi hasil yang menguntungkan dalam seluruh populasi.
  • Proporsi Sampel (\(\hat{p}\)): Proporsi hasil yang menguntungkan dalam satu sampel.

Formula Proporsi

Proporsi dihitung dengan membagi jumlah hasil yang menguntungkan dengan total jumlah hasil (ukuran sampel atau populasi):

\[\hat{p} \text{ atau } p = \frac{\text{Jumlah hasil yang menguntungkan (x)}}{\text{Total jumlah hasil (n atau N)}}\]

Distribusi Sampling Proporsi Sampel

Jika sampel diambil berulang kali, dan \(\hat{p}\) dihitung untuk setiap sampel, lalu semua nilai \(\hat{p}\) diplot, kita mendapatkan Distribusi Sampling Proporsi Sampel.

Parameter Distribusi Sampling Proporsi

Jika distribusi sampling ini mendekati normal (memenuhi CLT), distribusinya memiliki tiga karakteristik utama:

  1. Rata-rata Distribusi Sampling (\(\mu_{\hat{p}}\)): Rata-rata dari semua \(\hat{p}\) sama dengan proporsi populasi (\(p\)). \[\mu_{\hat{p}} = p\]
  2. Simpangan Baku Distribusi Sampling (\(\sigma_{\hat{p}}\)): Disebut juga Galat Baku (Standard Error) proporsi. \[\sigma_{\hat{p}} = \sqrt{\frac{p(1-p)}{n}} \text{ atau } \sqrt{\frac{pq}{n}}\]
    • \(n\): Ukuran sampel.
    • \(p\): Proporsi hasil sukses.
    • \(q\): Proporsi hasil tidak sukses, di mana \(q = 1 - p\).
  3. Bentuk Distribusi: Distribusi Sampling dari \(\hat{p}\) akan berdistribusi Normal.

Kondisi Penerapan Central Limit Theorem (CLT)

Agar Distribusi Sampling Proporsi (\(\hat{p}\)) dapat diasumsikan Normal dan menggunakan Z-score, ia harus memenuhi dua kondisi binomial:

  1. Kondisi 1: Jumlah hasil sukses yang diharapkan harus \(\ge 10\). \[n \times p \ge 10\]
  2. Kondisi 2: Jumlah hasil gagal yang diharapkan harus \(\ge 10\). \[n \times (1 - p) \ge 10\]

Perbandingan Kondisi CLT

Berikut adalah perbandingan dua kondisi utama agar Distribusi Sampling dapat dianggap Normal dan formula Z-score dapat digunakan:

Fitur Distribusi Rata-rata Sampel (\(\bar{x}\)) Distribusi Proporsi Sampel (\(\hat{p}\))
Digunakan untuk Data Kuantitatif (Continuous Variables) Data Kategorikal (Proportion)
Kondisi CLT Satu Kondisi Dua Kondisi
Aturan Ukuran \(n\) \(n \ge 30\) 1. \(n \cdot p \ge 10\)
2. \(n \cdot (1-p) \ge 10\)

Formula Z-score Proporsi Sampel

Formula ini digunakan untuk menstandarisasi nilai \(\hat{p}\) ke skala Z sehingga probabilitas dapat dihitung:

\[Z = \frac{\hat{p} - \mu_{\hat{p}}}{\sigma_{\hat{p}}} = \frac{\hat{p} - p}{\sqrt{\frac{p(1-p)}{n}}}\]

6 Review Sampling Distribution

Komprehensif: Memilih Formula Probabilitas

Bab ini membahas transisi metodologi perhitungan probabilitas dalam percobaan Binomial, terutama bagaimana kita bergerak dari perhitungan eksak menjadi perkiraan ketika jumlah percobaan (\(n\)) meningkat.

Skenario Dasar Percobaan: Kita memiliki probabilitas sukses \(p=0.4\) dan probabilitas gagal \(1-p=0.6\).

1. Metode Probabilitas Eksak (Untuk \(n\) Kecil)

Metode ini menghasilkan nilai probabilitas yang tepat dan akurat (exact probability).

1.1 Metode Dasar (Analisis Ruang Sampel)

Kapan Digunakan: Ketika \(n\) sangat kecil (misalnya \(n=3\)). Ini adalah metode fundamental yang menggunakan Aturan Perkalian Probabilitas. Proses: Kita harus secara manual mengidentifikasi dan menghitung probabilitas setiap hasil yang memenuhi syarat di ruang sampel, kemudian menjumlahkannya. Contoh (\(n=3\), \(P(X \ge 2)\)):

$$P(\text{HHB}) = 0.4 \times 0.4 \times 0.6 = 0.096$$
$$P(X \ge 2) = (\text{3 urutan untuk } X=2) + (\text{1 urutan untuk } X=3) = \mathbf{0.352}$$

1.2 Metode Distribusi Binomial

Kapan Digunakan: Ketika \(n\) mulai membesar (misalnya \(n=5\) hingga \(n=50\)). Penghitungan manual melalui ruang sampel menjadi tidak praktis, sehingga kita membutuhkan alat yang efisien untuk menghitung kombinasi. Formula Kunci: Formula Binomial digunakan untuk menemukan probabilitas tepat \(k\) kali sukses. \[\mathbf{P(X=k)} = \binom{n}{k} p^k (1-p)^{n-k}\] Contoh (\(n=5\), \(P(X \ge 2)\)): Diperlukan penjumlahan empat perhitungan Binomial (untuk \(k=2, 3, 4, 5\)). \[P(X \ge 2) = \mathbf{0.6634}\]

# P(X >= 2) = 1 - P(X <= 1)
n <- 5
p <- 0.4
prob_eksak_binomial <- 1 - pbinom(1, size = n, prob = p)
# Hasil: 0.66304 (Probabilitas Eksak)

2. Metode Pendekatan Normal (Untuk \(n\) Besar)

Metode ini digunakan karena pada \(n\) yang sangat besar (misalnya \(n=100\)), bahkan melakukan ratusan perhitungan Binomial pun menjadi mustahil secara komputasi. Solusinya adalah beralih dari model Diskrit (Binomial) ke model Kontinu (Normal).

2.1 Kondisi Wajib Central Limit Theorem (CLT)

Pendekatan Normal hanya dapat digunakan jika Distribusi Sampling Proporsi (\(\hat{p}\)) telah mendekati bentuk Normal.

Syarat Wajib: Kedua kondisi berikut harus terpenuhi (berbeda dengan CLT untuk Rata-rata \(\bar{x}\)): 1. \(n \cdot p \ge 10\) 2. \(n \cdot (1-p) \ge 10\) Validasi (\(n=100, p=0.4\)): \(40 \ge 10\) dan \(60 \ge 10\). (Lolos, Pendekatan Normal Valid)

2.2 Perhitungan Probabilitas Proporsi (Z-score)

Konsep Kunci: Kita beralih dari menghitung jumlah sukses (\(X\)) menjadi menghitung proporsi sampel (\(\hat{p}\)), yang kini menjadi variabel acak berdistribusi Normal.

Kasus: \(P(\text{Minimal 35 Hijau}) \implies P(\hat{p} \ge 0.35)\)

Langkah 1: Hitung Z-score: Z-score berfungsi sebagai jembatan yang mentransformasi nilai \(\hat{p}\) ke Distribusi Normal Baku (Mean 0, SD 1). \[Z = \frac{\hat{p} - p}{\sqrt{\frac{p(1-p)}{n}}} = \frac{0.35 - 0.4}{\sqrt{\frac{0.4(0.6)}{100}}} \approx \mathbf{-1.02}\]

Langkah 2: Hitung Luas Area (Probabilitas Perkiraan): \[P(Z \ge -1.02) = 1 - P(Z < -1.02) = 1 - 0.1539 = \mathbf{0.8461}\]

# Hitung Standard Error (SE)
p <- 0.4
n <- 100
se_proporsi <- sqrt(p * (1 - p) / n)

# P(phat >= 0.35) menggunakan Normal Approximation
phat_target <- 0.35
prob_perkiraan_normal <- 1 - pnorm(phat_target, mean = p, sd = se_proporsi)
# Hasil: 0.84613 (Probabilitas Perkiraan)

3. Kesimpulan: Probabilitas Eksak vs. Perkiraan

Meskipun Metode 3 (Z-score) hanya memberikan Probabilitas Perkiraan, ia adalah solusi statistik yang paling praktis, akurat, dan efisien untuk analisis sampel besar, menjadikannya fondasi bagi sebagian besar statistika inferensial.