Distribusi lain yang memainkan peran penting dalam kaitannya dengan pengambilan sampel dari populasi yang berdistribusi normal adalah distribusi F. Distribusi F, yang juga dikenal sebagai distribusi ANOVA (Analysis of Variance), ditemukan oleh salah satu ahli statistik ternama, Ronald A. Fisher pada awal tahun 1920 dan sangat berguna bagi para research worker untuk menguji hipotesis mengenai suatu parameter dari beberapa populasi (lebih dari dua). Nama distribusi ini diambil dari penemunya, Sir Fisher. Awalnya, distribusi F dipelajari sebagai distribusi sampling dari rasio dua variabel acak yang independen dan masing-masing berdistribusi Chi-Square setelah dibagi dengan derajat kebebasannya. Secara umum, distribusi F digunakan untuk menarik kesimpulan statistik tentang rasio dari dua varians sampel.
Berikut ini adalah teorema yang berkaitan dengan distribusi F (Walpole dkk., 2012):
Apabila \(S_1^2\) dan \(S_2^2\) adalah varians dari sampel acak yang saling bebas dengan ukuran sampel masing-masing adalah \(n_1\) dan \(n_2\) dan sampel tersebut diambil dari populasi yang berdistribusi normal dengan varians masing-masing adalah \(\sigma_1^2\) dan \(\sigma_2^2\) maka \[ F = \frac{S_1^2 / \sigma_1^2}{S_2^2 / \sigma_2^2} = \frac{\sigma_2^2 S_1^2}{\sigma_1^2 S_2^2} \] Bentuk Distribusi F, perbandingan dua Distribusi Chi-Kuadrat: \[ F = \frac{\frac{U}{r_1}}{\frac{V}{r_2}} \]
Keterangan:
U: Distribusi Chi-Kuadrat pembilang
r1: derajat kebebasan pembilang
V: Distribusi Chi-Kuadrat Penyebut
r2: derajat kebebasan penyebut
Karena distribusi ini diturunkan dari distribusi Chi-Kuadrat, maka grafiknya sedikit positif, yaitu miring ke kanan. Adapun tabel untuk distribusi F ini umumnya diberikan untuk nilai peluang a = 0,01 dan a 0,05 dengan derajat bebas v1 dan v2. Peluang a ini dinyatakan oleh luas daerah di kanan fa seperti pada gambar di atas.
Distribusi F memiliki beberapa keguanaan, diantaranya:
Untuk menguji rata-rata atau nilai tengah dari tiga atau lebih populasi secara sekaligus
Untuk mengetahui apakah rata-rata atau nilai tengah tersebut sama atau tidak.
Adapun ciri-ciri distribusi f, berikut ini merupakan ciri-cirinya:
Penurunan dari Distribusi Probabilitas Normal Baku melalui Distribusi Chi-Kuadrat
Perbandingan dua Distribusi Chi-Kuadrat
Pada Distribusi Probabilitas F terdapat dua derajat kebebasan yaitu derajat kebebasan pembilang r₁ dan derajat kebebasan penyebut r2
Distribusi F bersifat kontinu
Distribusi F memiliki nilai terkecil dari F adalah 0
Bentuknya tidak simetris
Semakin besar derajat kebebasan pada pembilang dan penyebut distribusinya mendekati Distribusi Normal
Semakin besar nilai X, kurva semakin mendekati sumbu X tetapi tidak pernah menyentuh sumbu X
Grafik sedikit positif, yaitu miring ke kanan
Pengunaan distribusi F di beberapa bidang, diantaranya;
Distribusi F memungkinkan ahli ekonomi untuk menguji asumsi mengenai tepatnya fungsi produksi, fungsi permintaan dan fungsi konsumsi untuk diterapkan terhadap data empiris atau data hasil observasi;
Distribusi F memungkinkan ahli pemasaran untuk menguji pendapatnya bahwa harga beras sama di beberapa pasar di Jakarta; para ahli riset pertanian untuk menguji hipotesis bahwa tidak ada perbedaan pengaruh yang berarti dari berbagai varietas;
Distribusi F memungkinkan seorang ahli ekonomi untuk menguji pendapatnya bahwa beberapa faktor (variabel) tidak mempunyai pengaruh yang berarti terhadap hasil penjualan, terhadap produksi padi, terhadap kenaikan penerimaan devisa ekspor, terhadap kenaikan GDP, dan lain sebagainya.
Suatu peubah acak dikatakan memiliki distribusi F dengan r1 dan r2 derajat kebebasan jika fungsi kepekatannya ditentukan oleh
\[ h(f; r_1; r_2) = \frac{ \Gamma\!\left(\frac{r_1 + r_2}{2}\right) }{ \Gamma\!\left(\frac{r_1}{2}\right) \Gamma\!\left(\frac{r_2}{2}\right) } \left(\frac{r_1}{r_2}\right)^{\frac{r_1}{2}} \frac{ f^{\frac{r_1}{2} - 1} }{ \left(1 + \frac{r_1 f}{r_2}\right)^{\frac{r_1 + r_2}{2}} } \]
0; x lainnya
Peubah acak X yang berditribusi F dengan derajat kebebasan r1 dan r2 dapat ditulis dengan X ~ F (r1, r2)
\[ E(X) = \frac{r_2}{r_2 - 2}, \quad r_2 > 2 \]
\[ Var(x) = \frac{2r_2^2 (r_1 + r_1 - 2)}{r_1 (r_2 - 2)^2 (r_2 - 4)}, \quad r_2 > 4 \]
Apabila X ∼ F(9,10), berapakah nilai dari P[X ≥ 3.02]? Berikutnya, dapatkan mean dan varians dari X.
Pembahasan: \[ \begin{aligned} P[X \ge 3.02] &= 1 - P[X \le 3.02] \\ &= 1 - P[F(9,10) \le 3.02] \\ &= 1 - 0.95 \quad \text{(dari tabel distribusi F)} \\ &= 0.05 \end{aligned} \]
Berikutnya, kita akan menghitung mean dan varians dari X sebagai berikut:
\[ E[X] = \frac{v_2}{v_2 - 2} \]
\[ E[X] = \frac{10}{10 - 2} = \frac{10}{8} = 1.25 \]
Rumus varian distribusi F:
\[ Var(X) = \frac{2v_2^2 (v_1 + v_2 - 2)}{v_1 (v_2 - 2)^2 (v_2 - 4)} \]
\[ Var(X) = \frac{2(100)(17)}{9(8)^2(6)} \\ = \frac{3400}{3456} \\ = 0.9838 \]
Suatu tes penempatan untuk matematika diberikan pada 25 siswa laki-laki dan 16 siswa perempuan. Siswa laki-laki mencapai nilai rata-rata 82 dengan simpangan baku 8, sedangkan siswa perempuan mencapai nilai rata-rata 78 dengan simpangan baku 7. Buat selang kepercayaan 98% bagi σ/σε dan 01/02, bila σε dan o masing-masing adalah ragam populasi semua nilai siswa laki-laki dan perempuan yang mungkin mengambil tes tersebut. Asumsikan bahwa populasinya menyebar normal.
Jawab:
Diketahui:
Jumlah siswa laki-laki (\(n_1\)) = 25
Jumlah siswa perempuan (\(n_2\)) = 16
Simpangan baku laki-laki (\(S_1\)) = 8
Simpangan baku perempuan (\(S_2\)) = 7
\[ \frac{\dfrac{s_1^2}{s_2^2}}{f_{\alpha/2}(v_1, v_2)} < \frac{\sigma_1^2}{\sigma_2^2} < \frac{s_1^2}{s_2^2} f_{\alpha/2}(v_2, v_1) \]
\[ \frac{64}{49} \left( \frac{1}{3.29} \right) < \frac{\sigma_1^2}{\sigma_2^2} < \frac{64}{49}(2.89) \]
\[ 0.397 < \frac{\sigma_1^2}{\sigma_2^2} < 3.775 \]
Dengan menggunakan Tabel F, kita memperoleh f0,01 (24,15) = 3,29 dan f0,01 (15,24) = 2,89. Dengan mensubstitusikan nilai-nilai itu kedalam rumus
Distribusi F merupakan distribusi probabilitas yang penting dalam statistik inferensial, terutama untuk menguji rasio dua varians dari populasi yang berdistribusi normal. Distribusi ini diperkenalkan oleh Sir Ronald A. Fisher dan menjadi dasar dalam uji ANOVA (Analysis of Variance).
Distribusi F terbentuk dari perbandingan dua distribusi Chi-Kuadrat yang masing-masing dibagi dengan derajat kebebasan tertentu. Karena berasal dari distribusi Chi-Kuadrat, bentuk kurvanya miring ke kanan (positif skewed) dan bersifat kontinu. Nilai F selalu positif, dengan nilai minimum 0 dan tidak memiliki batas maksimum yang pasti. Semakin besar derajat kebebasan (v₁ dan v₂), distribusi F akan semakin mendekati distribusi normal. Distribusi ini banyak digunakan untuk:
Menguji kesamaan varians dua populasi.
Menguji perbedaan rata-rata tiga atau lebih populasi secara bersamaan (uji ANOVA).
Menguji model regresi, fungsi produksi, dan hipotesis lain di bidang ekonomi, pertanian, serta pemasaran.
Dengan demikian, Distribusi F berfungsi sebagai alat penting untuk menguji kesetaraan varians dan analisis perbedaan antar kelompok. Distribusi ini menjadi dasar bagi banyak metode statistik modern, termasuk ANOVA dan uji regresi berganda.
Walpole, R. E., Myers, R. H., Myers, S. L., & Ye, K. (2012). Pengantar Teori Probabilitas dan Statistika (Edisi 4). Jakarta: PT Gramedia Pustaka Utama.