Pendahuluan


Probabilitas tidak hanya membantu kita memahami seberapa besar kemungkinan suatu peristiwa terjadi, tetapi juga membentuk fondasi bagi banyak metode statistik yang digunakan dalam pengambilan keputusan.

- Konsep Inti

Ketika suatu proses atau eksperimen menghasilkan hasil yang bervariasi, kita menggunakan dua konsep utama untuk memahaminya.

  • Variabel Acak
    Digunakan untuk mewakili hasil-hasil yang bervariasi tersebut.
  • Distribusi Probabilitas
    Digunakan untuk mendeskripsikan bagaimana probabilitas ditugaskan atau diberikan ke setiap nilai yang mungkin muncul.

Memahami bentuk dan sifat dari suatu distribusi sangatlah esensial karena hal tersebut menentukan “bagaimana data berperilaku, bagaimana kita menghitung probabilitas, dan bagaimana kita membuat prediksi.”

Variabel Acak Kontinu


  • Tujuan: Digunakan untuk variabel kontinu, yang mendeskripsikan kemungkinan nilai-nilai dalam suatu rentang yang berkelanjutan. Contoh: Usia, usia tidak hanya dihitung dalam tahun bulat, tetapi bisa sangat presisi hingga bulan, hari, detik, bahkan milidetik. Ini menunjukkan bahwa variabel kontinu memiliki jumlah kemungkinan nilai yang tak terbatas dalam suatu rentang.

Variabel Acak

Variabel acak berfungsi untuk mengaitkan setiap hasil yang mungkin dalam ruang sampel dengan bilangan real.

Fungsi Kepadatan Probabilitas

Karena variabel kontinu memiliki nilai tak terhingga, probabilitas suatu variabel acak sama dengan satu titik spesfik (\(P(X = x)\)) selalu bernilai nol. Oleh karena itu, kita tidak menggunakan fungsi probabilitas, tetapi menggunakan fungsi kepadatan probabilitas \[\int_{-\infty}^{\infty} f(x) dx = 1\]

Probabilitas Pada Suatu Interval

Untuk variabel kontinu, probabilitas selalu dihitung untuk suatu rentang atau interval nilai. - Rumus probabilitas bahwa variabel acak \(X\) berada di antara nilai \(a\) dan \(b\) dihitung menggunakan integral \[P(a \le X \le b) = \int_{a}^{b} f(x) dx\]

Penting , karena probabilitas pada satu titik adalah nol, maka: \[P(a \le X \le b) = P(a < X \le b) = P(a \le X < b) = P(a < X < b)\]

Fungsi Distribusi Kumulatif

Fungsi distribusi kumulatif dilambangkan dengan \(F(x)\), memberikan probabilitas bahwa variabel acak \(X\) mengambil nilai yang kurang dari atau sama dengan suatu nilai \(x\) tertentu. \[F(x) = P(X \le x) = \int_{-\infty}^{x} f(t) dt\] Fungsi distribusi kumulatif sangat berguna untuk menghitung probabilitas rentang (interval) yang lebih kompleks dan merupakan landasan untuk memahami persentil dan kuantil suatu distribusi.

  • Probabilitas suatu interval dapat dihitung menggunakan: \[P(a < X \le b) = F(b) - F(a)\]

Distribusi Sampling


  • Definisi : Distribusi sampling adalah distribusi probabilitas dari suatu statistik sampel yang dihitung dari sejumlah besar sampel berukuran sama yang ditarik dari populasi yang sama.

  • Tujuan: Statistik inferensial memnggunakan distribusi sampling untuk memperkirakan parameter populasi yang tidak diketahui.

  • Manfaat utama: Memungkinkan kita untuk mengukur seberapa banyak rata-rata sampel kita akan bervariasi dari satu sampel ke sampel yang lainnya. Variabilitas ini diukur dengan kesalahan standar(standard error).

Statistik Inferensial : adalah dasar untuk membuat interval kepercayaan dan melakukan uji hipotesis. Dengan mengetahui distribusi statistik sampel, kita dapat menentukan seberapa mungkin statistik sampel yang kita amati terjadi secara kebetulan.

Hubungan dengan Populasi : Rata-rata dari distribusi sampling cenderung sama dengan rata-rata populasi

Kesalahan Standar (Standard Error)

\[\sigma_{\bar{x}} = \frac{\sigma}{\sqrt{n}}\]

\(n\) = Ukuran sampel

\(σ\) = Standar deviasi populasi

  • Note: Semakin besar ukuran sampel, semakin kecil kesalahan standar, yang berarti rata-rata sampel yang kita hitung akan semakin dekat dan mewakili rata-rata populasi yang sebenarnya.

Teorema Limit Pusat


  • Definisi : Teorema limit pusat adalah pilar fundamental dalam statistik inferensial. Teorema ini menjawab pertanyaan kritis tentang bentuk distribusi sampling dan memungkinkan kita membuat generalisasi tentang populasi.

  • Inti Teorema : Menyatakan bahwa jika kita mengambil sampel acak yang cukup besar dari populasi manapun, distribusi sampling dari rata-rata sampel akan cenderung berbentuk distribusi normal.

Note :

  • Ukuran sampel harus cukup besar.

  • pengambilan sampel harus dilakukan secara acak.

Distribusi Proporsi Sampel

Konsep ini sangat penting dalam riset kuantitatif dan analisis survei, di mana kita sering tertarik pada persentase atau proporsi suatu populasi yang memiliki karakteristik tertentu.

Proporsi Sampel


Merupakan perkiraan dari proporsi populasi \[\hat{p} = \frac{X}{n}\]

  • Proporsi sampel dihitung sebagai rasio dari jumlah keberhasilan dalam sampel dibagi dengan ukuran sampel.

Distribusi Sampling Proporsi Sampel

Sama seperti rata-rata sampel, proporsi sampel juga memiliki distribusi samplingnya sendiri, yang sangat bergantung pada Teorema Limit Pusat. \[\mu_{\hat{p}} = p\]

  • Kondisi Kenormalan, Agar distribusi dapat diasumsikan normal, kita perlu memastikan bahwa jumlah “keberhasilan” dan “kegagalan” dalam sampel cukup besar: \[n \cdot p \ge 10 \quad \text{dan} \quad n \cdot (1-p) \ge 10\]

  • Skor Z untuk Proporsi Sampel, Skor Z merupakan konsep perhitungan yang menunjukkan besarnya nilai suatu sampel terhadap rat-rata dalam satuan standar deviasi. Kita dapat menggunakan skor Z untuk menghitung Probabilitas: \[Z = \frac{\hat{p} - \mu_{\hat{p}}}{\sigma_{\hat{p}}} = \frac{\hat{p} - p}{\sqrt{\frac{p(1-p)}{n}}}\]

Review Distribusi Sampling


Berfungsi sebagai rekapitulasi dan praktik untuk mengintegrasikan semua konsep distribusi sampling yang telah dibahas.

1. Probabiltas Sederhana dan Ruang Sampel

Probabilitas sederhana mencakup konsep aturan komplemen. Aturan yang menentukan probabilitas bahwa suatu kejadian tidak terjadi.

  • Rumus: \[P(A^c) = 1 - P(A)\]

2. Distribusi Binomial

Distribusi binomial adalah distribusi probabilitas diskret yang memberikan probabilitas untuk mendapatkan tepat sejumlah keberhasilan dalam sejumlah percobaan tetap, asalkan semua kriteria eksperimen binomial terpenuhi.

Rumus: \[P(X=x) = C(n, x) \cdot p^x \cdot (1-p)^{n-x}\]

3. Distribusi Sampling Proporsi Sampel

Konsep ini adalah inti dari statistik inferensial yang berkaitan dengan data kategorikal, seperti hasil survei.

Tujuan Review

  • Memastikan pemahaman tentang peran Teorema Limit Pusat dalam menormalkan kedua distribusi tersebut.

  • Membedakan kapan harus menggunakan kesalahan standar rata-rata.

  • Mempraktikkan penggunaan rumus skor Z yang relevan untuk menghitung probabilitas pada kedua jenis distribusi sampling tersebut.

Referensi


Khan Academy. (n.d.). Sampling distributions.

Ismay, C., & Kim, A. Y. (2024). Statistical Inference via Data Science: A Modern Dive into R and the Tidyverse.

Stat Trek. (n.d.). Sampling Distributions.

Ross, Sheldon M. (2014). A First Course in Probability (9th ed.). Pearson.

Hogg, R. V., Tanis, E. A., & Zimmerman, D. L. (2019). Probability and Statistical Inference (10th ed.). Pearson.

Diez, D. M., Barr, C. D., & Çetinkaya-Rundel, M. (2016). OpenIntro Statistics (3rd ed.).

Tentang Penulis


Morris Alexander Pangaribuan, Student At Institut Teknologi Sains Bandung
Morris Alexander Pangaribuan, Student At Institut Teknologi Sains Bandung

Jl. Ganesha Boulevard, Lot-A1 CBD Kota Deltamas Kab. Bekasi Jawa Barat