Sebaran F atau dikenal juga dengan Fisher-Snedecor Distribution merupakan salah satu sebaran probabilitas kontinu yang sangat penting dalam bidang statistika inferensial. Sebaran ini muncul secara alami ketika kita membandingkan dua varians yang diperoleh dari dua sampel acak independen yang berasal dari populasi berdistribusi normal.
Distribusi F diperkenalkan oleh Sir Ronald A. Fisher, seorang tokoh statistik terkenal yang banyak memberikan kontribusi dalam teori analisis varians (ANOVA) dan uji hipotesis. Oleh karena itu, sebaran ini sering disebut juga sebagai Sebaran Fisher.
Secara matematis, distribusi F didefinisikan sebagai rasio dari dua variabel acak chi-square yang telah dinormalisasi oleh derajat kebebasannya masing-masing, yaitu:
\[ F = \frac{(U_1 / v_1)}{(U_2/v_2)} \]
di mana:
\(U_1\) adalah peubah acak yang mengikuti sebaran \(\chi^2\) dengan derajat kebebasan \(v_1\)
\(U_2\) adalah peubah acak yang mengikuti sebaran \(\chi^2\) dengan derajat kebebasan \(v_2\)
dan \(v_1\) serta \(v_2\) adalah derajat kebebasan dari masing-masing variabel.
Distribusi F memiliki bentuk asimetris ke kanan (right-skewed), terutama ketika derajat kebebasan masih kecil. Namun, seiring dengan bertambahnya nilai derajat kebebasan \(v_1\) dan \(v_2\), bentuk distribusinya akan semakin mendekati simetris, menyerupai sebaran normal.
Sebaran F memainkan peranan yang sangat penting dalam berbagai uji statistik, di antaranya:
Uji perbandingan dua varians (Uji F Dua Sampel): digunakan untuk menentukan apakah dua populasi memiliki varians yang sama.
Analisis varians (ANOVA): digunakan untuk menguji apakah terdapat perbedaan rata-rata di antara lebih dari dua kelompok.
Regresi linear: distribusi F digunakan untuk menguji signifikansi model regresi secara keseluruhan.
Dengan demikian, pemahaman terhadap distribusi F sangat penting dalam praktik statistik karena menjadi dasar bagi pengujian model, pengendalian kualitas, hingga analisis perbedaan antar kelompok dalam penelitian sosial, eksperimental, dan industri.
Sebaran F terbentuk dari perbandingan dua variabel acak chi-square (\(\chi^2\)) yang telah dibagi dengan derajat kebebasannya masing-masing, yaitu:
\[ F = \frac{(U_1 / v_1)}{(U_2 / v_2)} \]
dengan: - \(U_1 \sim \chi^2(v_1)\) → peubah acak chi-square dengan derajat bebas \(v_1\)
\(U_2 \sim \chi^2(v_2)\) → peubah acak chi-square dengan derajat bebas \(v_2\)
\(v_1, v_2\) → derajat kebebasan (degrees of freedom)
Fungsi kepekatan peluang (Probability Density Function, PDF) untuk sebaran F adalah:
\[ f(x) = \frac{\Gamma\left(\frac{v_1 + v_2}{2}\right)}{\Gamma\left(\frac{v_1}{2}\right)\Gamma\left(\frac{v_2}{2}\right)} \left( \frac{v_1}{v_2} \right)^{\frac{v_1}{2}} \frac{x^{\frac{v_1}{2} - 1}}{ \left(1 + \frac{v_1}{v_2}x \right)^{\frac{v_1 + v_2}{2}} }, \quad x > 0 \]
dengan \(\Gamma(\cdot)\) adalah fungsi gamma.
Nilai harapan (mean) dari F: \[ E(F) = \frac{v_2}{v_2 - 2}, \quad \text{untuk } v_2 > 2 \]
Nilai varians (keragaman): \[ Var(F) = \frac{2v_2^2(v_1 + v_2 - 2)}{v_1 (v_2 - 2)^2 (v_2 - 4)}, \quad \text{untuk } v_2 > 4 \]
Domain: \(F > 0\)
Sebaran F bersifat positif miring (right-skewed), dan semakin besar derajat kebebasan \(v_1\) dan \(v_2\), bentuknya mendekati simetris.
Misalkan: - \(v_1 = 5\) - \(v_2 = 10\)
# Derajat kebebasan
v1 <- 5
v2 <- 10
# Rentang nilai x
x <- seq(0, 5, by = 0.1)
# Hitung fungsi kepekatan peluang (PDF)
f_x <- df(x, v1, v2)
# Buat tabel hasil
data.frame(x = round(x,2), f_x = round(f_x,5))
## x f_x
## 1 0.0 0.00000
## 2 0.1 0.22740
## 3 0.2 0.45374
## 4 0.3 0.59725
## 5 0.4 0.66825
## 6 0.5 0.68761
## 7 0.6 0.67354
## 8 0.7 0.63952
## 9 0.8 0.59482
## 10 0.9 0.54552
## 11 1.0 0.49548
## 12 1.1 0.44700
## 13 1.2 0.40140
## 14 1.3 0.35933
## 15 1.4 0.32102
## 16 1.5 0.28646
## 17 1.6 0.25547
## 18 1.7 0.22782
## 19 1.8 0.20322
## 20 1.9 0.18138
## 21 2.0 0.16201
## 22 2.1 0.14484
## 23 2.2 0.12963
## 24 2.3 0.11615
## 25 2.4 0.10420
## 26 2.5 0.09359
## 27 2.6 0.08418
## 28 2.7 0.07581
## 29 2.8 0.06837
## 30 2.9 0.06174
## 31 3.0 0.05583
## 32 3.1 0.05055
## 33 3.2 0.04583
## 34 3.3 0.04160
## 35 3.4 0.03782
## 36 3.5 0.03442
## 37 3.6 0.03137
## 38 3.7 0.02862
## 39 3.8 0.02615
## 40 3.9 0.02391
## 41 4.0 0.02190
## 42 4.1 0.02007
## 43 4.2 0.01842
## 44 4.3 0.01693
## 45 4.4 0.01557
## 46 4.5 0.01434
## 47 4.6 0.01321
## 48 4.7 0.01219
## 49 4.8 0.01126
## 50 4.9 0.01041
## 51 5.0 0.00963
# Visualisasi dengan plot
plot(x, f_x, type = "l", lwd = 2, col = "pink",
main = paste("Sebaran F (v1 =", v1, ", v2 =", v2, ")"),
xlab = "Nilai F", ylab = "f(x)")
grid()
Sebaran F merupakan salah satu distribusi probabilitas kontinu yang berperan penting dalam inferensi statistik, terutama dalam menguji kesamaan dua varians dan dalam analisis varians (ANOVA). Distribusi ini muncul dari rasio dua peubah acak chi-square yang telah dinormalisasi oleh derajat kebebasannya masing-masing.
Bentuk sebaran F bersifat miring ke kanan, namun akan mendekati simetris apabila derajat kebebasan meningkat. Dalam praktiknya, distribusi F banyak digunakan dalam pengujian model regresi dan analisis perbandingan rata-rata lebih dari dua kelompok.
Melalui penerapan fungsi df() di R, kita dapat menghitung dan memvisualisasikan fungsi kepekatan peluang dari distribusi F untuk berbagai kombinasi derajat kebebasan, sehingga membantu memahami sifat dan perilaku distribusi ini dalam analisis data statistik
Walpole, R. E. (2012). Pengantar Statistika. Edisi ke-3. Jakarta: PT Gramedia.
Sudjana. (2016). Metode Statistika. Bandung: Tarsito.
Ghozali, I. (2018). Aplikasi Analisis Multivariate dengan Program IBM SPSS 25. Semarang: Badan Penerbit Universitas Diponegoro.
Supangat, A. (2017). Statistika untuk Ekonomi dan Bisnis. Jakarta: Mitra Wacana Media.
Nuryadi, Dkk. (2017). Dasar-Dasar Statistika Penelitian. Yogyakarta: Media Akademi.
Hidayat, S. (2020). Distribusi Probabilitas dan Simulasi dalam Statistika. Malang: UB Press.
Santoso, S. (2019). Statistik Nonparametrik: Konsep dan Aplikasi dengan SPSS. Jakarta: Elex Media Komputindo.
Hasan, M. Iqbal. (2015). Pokok-Pokok Materi Statistik 1 (Statistik Deskriptif). Jakarta: Bumi Aksara.
Firmansyah, R. (2022). Analisis Data Statistik Menggunakan R Studio. Bandung: Informatika.
BPS (Badan Pusat Statistik). (2023). Statistik Indonesia 2023. Jakarta: BPS.