Probability Distribution

Tugas Week 11 ~ Probability Distribution


Probability Distribution

Distribusi Probabilitas menjelaskan bagaimana probabilitas ditetapkan pada setiap nilai yang mungkin dari suatu Variabel Acak (\(X\)). Distribusi ini adalah inti dari statistik inferensial.


1. Continuous Random

Video ini menjelaskan perbedaan mendasar antara Variabel Diskrit dan Variabel Kontinu dalam konteks probabilitas.

  1. Variabel Diskrit
  • Definisi: Variabel yang hanya dapat mengambil sejumlah nilai yang dapat dihitung (countable).

  • Contoh: Jumlah anak, jumlah sisi gambar (head) saat melempar koin, atau skor tes. Nilainya terbatas pada bilangan bulat (atau nilai yang dapat dihitung).

  • Representasi: Distribusi probabilitasnya disajikan menggunakan diagram batang (bar chart) dengan celah di antara setiap batang, menunjukkan tidak adanya kesinambungan (continuity).

  1. Variabel Kontinu
  • Definisi: Variabel yang dapat mengambil nilai numerik apa pun dalam rentang tertentu, dan datanya diperoleh melalui pengukuran (measuring). Nilainya dianggap tak terbatas (infinite) dan tidak dapat dihitung (uncountable).

  • Contoh: Berat, usia, suhu, dan jarak. Pengukuran dapat diuraikan hingga titik desimal tak terbatas.

  • Representasi: Disajikan menggunakan histogram (tanpa celah) untuk mencerminkan kesinambungan data, atau menggunakan kurva kepadatan (density curve).

  • Probabilitas: Rumus probabilitasnya berbeda; probabilitas untuk variabel kontinu dihitung sebagai luas area di bawah kurva kepadatan (seperti distribusi normal).

1.1. Random variable

Definisi: Variabel yang nilainya tidak terbatas dalam suatu interval (diperoleh dari pengukuran, seperti berat atau waktu).

Probabilitas Titik: Probabilitas untuk nilai tunggal selalu nol (\(P(X = x) = 0\)).

1.2. Probability Density Funct (PDF)

\(f(x)\): Probabilitas hanya dapat dihitung untuk interval (\(P(a \leq X \leq b)\)). Probabilitas adalah luas area di bawah kurva PDF. - Syarat: \(f(x) \geq 0\) dan total area di bawah kurva adalah 1.

1.3. Cumulative Distribution Funct (CDF)

\(F(x)\): Probabilitas bahwa \(X\) kurang dari atau sama dengan nilai tertentu (\(P(X \leq x)\)).


2. Sampling Distributions

Video ini menjelaskan konsep Distribusi Sampling (Distribusi Rerata Sampel) dengan membandingkannya dengan Distribusi Populasi dan Distribusi Sampel.

  1. Konsep Dasar
  • Distribusi Sampel (Sample Distribution): Distribusi yang dibuat dari data satu sampel tunggal yang diambil dari suatu populasi.

  • Distribusi Sampling (Sampling Distribution): Distribusi dari suatu statistik (misalnya, rerata \(\bar{x}\)) yang dibuat dari banyak sampel acak sederhana yang diambil secara berulang-ulang dari populasi yang sama.

  1. Proses Pembentukan Distribusi Sampling
  • Ambil sampel acak sederhana berukuran \(n\) dari populasi (misalnya \(n=5\)).

  • Hitung rerata sampel (\(\bar{x}\)) untuk sampel tersebut.

  • Plot nilai \(\bar{x}\) tersebut.

  • Ulangi langkah 1-3 ratusan hingga ribuan kali. Hasil plot dari semua \(\bar{x}\) ini akan membentuk Distribusi Sampling.

  1. Karakteristik Distribusi Sampling

Ketika dibuat dari rerata sampel (\(\bar{x}\)), Distribusi Sampling memiliki ciri-ciri khusus dibandingkan Distribusi Populasi aslinya:

  • Rerata (Mean): \(\mu\)

\(\mu_{\bar{x}} = \mu\) (Rerata distribusi sampling sama dengan rerata populasi).

  • Simpangan Baku (Standard Deviation): \(\sigma\)

\(\sigma_{\bar{x}} = \frac{\sigma}{\sqrt{n}}\) (Disebut Galat Baku (Standard Error)).

  • Penyebaran (Spread): Lebih besar

Lebih kecil (Rerata sampel cenderung kurang bervariasi daripada observasi individu).

  • Bentuk, Jika \(n\) cukup besar, bentuknya akan mendekati Distribusi Normal (berdasarkan Teorema Limit Pusat).
  1. Manfaat

Distribusi sampling sangat penting karena memungkinkan kita untuk mengestimasi rerata populasi (\(\mu\)) tanpa perlu mengukur setiap individu dalam populasi tersebut, sehingga lebih efisien dan praktis (misalnya, mengukur tinggi badan 8 miliar orang di Bumi).


3. Central Limit Theorem

Video ini menjelaskan Teorema Limit Pusat (Central Limit Theorem - CLT), yaitu aturan fundamental yang memprediksi bentuk dari Distribusi Sampling Rerata Sampel (\(\bar{x}\)).

  1. Definisi Teorema Limit Pusat

(CLT)CLT menyatakan bahwa jika ukuran sampel (\(n\)) cukup besar, maka Distribusi Sampling Rerata Sampel (\(\bar{x}\)) akan berbentuk hampir normal (Distribusi Normal).

  • Penting: Prinsip ini berlaku tanpa memandang bentuk asli dari Distribusi Populasi. Bahkan jika populasi aslinya miring (skewed), distribusi sampling rerata sampel akan tetap normal jika \(n\) besar.
  1. Aturan Praktis (Rule of Thumb)
  • Secara umum, Teorema Limit Pusat dapat diterapkan dengan aman ketika ukuran sampel (\(n\)) lebih besar atau sama dengan 30 (\(n \ge 30\)).
  1. Pengecualian
  • Jika Distribusi Populasi aslinya sudah berbentuk normal, maka Distribusi Sampling akan tetap normal meskipun ukuran sampel (\(n\)) kecil (\(n < 30\)).
  1. Mengapa \(n\) Besar Penting?

Mengambil sampel dengan \(n\) yang kecil:

  • Menghasilkan variabilitas yang lebih besar dan estimasi yang kurang tepat.

  • Meningkatkan risiko mendapatkan sampel yang tidak biasa hanya karena kebetulan.

CLT sangat berguna karena memungkinkan kita menggunakan rumus-rumus dan alat statistik yang berkaitan dengan Distribusi Normal untuk menganalisis data besar.


4. Sample Proportion

Video ini menjelaskan tentang Distribusi Sampling Proporsi Sampel (\(\hat{p}\)), yang merupakan distribusi dari statistik \(\hat{p}\) yang diperoleh dari pengambilan sampel berulang.

  1. Proporsi dalam Statistik
  • Proporsi (\(P\)): Proporsi populasi, mewakili pecahan hasil yang menguntungkan (favorable outcomes) terhadap keseluruhan populasi.

  • Proporsi Sampel (\(\hat{p}\)): Proporsi yang dihitung dari satu sampel tunggal.

\[\hat{p} = \frac{\text{Jumlah hasil yang menguntungkan}}{\text{Total jumlah hasil (ukuran sampel)}}\]

  1. Distribusi Sampling Proporsi Sampel (\(\hat{p}\))
  • Distribusi Sampling \(\hat{p}\) adalah distribusi yang dibuat dengan mengambil sampel acak berulang kali dari populasi yang sama dan memplot semua nilai \(\hat{p}\) yang dihasilkan.
  1. Syarat Penerapan Teorema Limit Pusat (CLT)

Untuk memastikan bahwa Distribusi Sampling \(\hat{p}\) berbentuk normal, CLT harus dipenuhi. Untuk proporsi, terdapat dua kondisi yang harus dipenuhi secara bersamaan:

  • \(n \times P \ge 10\)

  • \(n \times (1-P) \ge 10\)

Jika kedua syarat ini terpenuhi, Distribusi \(\hat{p}\) dapat diasumsikan normal, dan tabel skor Z dapat digunakan.


5. Review Sampling Distribution

Video ini adalah ulasan yang bertujuan untuk membandingkan dan menjelaskan kapan menggunakan tiga metode utama untuk menghitung probabilitas dalam percobaan berulang (seperti mengambil kelereng), dengan fokus pada jumlah percobaan (\(n\)).