pengertian uji normalitas

Uji Normalitas adalah metode statistik untuk menentukan apakah data mengikuti distribusi Normal (berbentuk lonceng simetris). Uji ini penting dilakukan sebelum menggunakan analisis statistik tertentu yang mensyaratkan data berdistribusi normal.

  1. Uji Jarque-Bera Uji Jarque-Bera digunakan untuk menguji hipotesis: Hipotesis Nol (H_0): Data berasal dari populasi yang berdistribusi Normal. Hipotesis Alternatif (H_1): Data berasal dari populasi yang bukan berdistribusi Normal. Statistik Uji (JB) berdasarkan formula:

\[JB = n \left[ \frac{S^2}{6} + \frac{(K - 3)^2}{24} \right]\]

Di mana: * \(n\): Ukuran sampel. * \(S\): Koefisien Skewness (Kemencengan). * \(K\): Koefisien Kurtosis (Keruncingan). * \((K-3)\): Koreksi untuk Excess Kurtosis (Kurtosis normal adalah 3).

Di mana: n adalah ukuran sampel. S adalah nilai skewness (kemencengan) yang telah dibahas. K adalah nilai kurtosis (keruncingan) yang telah dibahas. Pengambilan Keputusan: Nilai JB hitung dibandingkan dengan nilai ^2 (Chi Square) pada derajat bebas 2. Contoh: Jika JB hitung lebih besar dari nilai ^2 sebesar 9,21 (untuk keyakinan 99%) atau 7,37 (untuk keyakinan 95%), maka H_0 ditolak, dan data diuji tidak normal. Sebaliknya, jika nilai JB hitung ,21, maka H_0 diterima, dan data termasuk dalam kelas distribusi normal.

  1. Uji Anderson-Darling Uji Anderson-Darling digunakan untuk menguji hipotesis: Hipotesis Nol (H_0): Data berasal dari populasi yang berdistribusi Normal. Hipotesis Alternatif (H_1): Data berasal dari populasi yang bukan berdistribusi Normal. Statistik Uji (A) berdasarkan formula:

Uji Shapiro-Wilk (W) adalah salah satu uji statistik paling kuat untuk menguji normalitas data. Formula-formula berikut menunjukkan perhitungan yang terkait dengan statistik uji \(W\) (meskipun statistik \(A\) dan \(S\) dalam rumus yang Anda berikan bukan formula standar untuk \(W\), namun merupakan bagian dari perhitungan).

Formula untuk \(Z_i\) (Skor Baku/Z-score): \[Z_i = \frac{x_i - \bar{x}}{s}\]

Di mana: * \(x_i\): Nilai data ke-\(i\). * \(\bar{x}\): Rata-rata sampel. * \(s\): Simpangan baku sampel.

Formula untuk \(S\) (Statistik Komponen): \[S = \sum_{i=1}^{n} \frac{(2i - 1)}{n} [\ln(F(Z_i)) + \ln(1 - F(Z_{n+1-i}))]\]

Di mana: * \(n\): Ukuran sampel. * \(F(Z_i)\): Fungsi Distribusi Kumulatif (CDF) dari \(Z_i\), biasanya \(P(Z \le Z_i)\). * \(\ln\): Logaritma natural. * \(Z_{n+1-i}\): Skor baku yang diurutkan secara terbalik.

Formula untuk \(A\) (Statistik Komponen Akhir): \[A = -n - S\]

F(Z_i) adalah fungsi sebaran kumulatif baku (Standard Normal Cumulative Distribution Function). x_i adalah nilai data ke-i. {x} adalah rata-rata sampel. s adalah standar deviasi sampel. Pengambilan Keputusan: Hipotesis nol (H_0) ditolak jika statistik uji A memiliki nilai lebih besar dibandingkan nilai tabel Anderson-Darling.

  1. Metode Liliefors Metode Liliefors (sering disebut sebagai Uji Lilliefors) digunakan untuk menguji hipotesis: Hipotesis Nol (H_0): Data berasal dari populasi yang berdistribusi Normal. Hipotesis Alternatif (H_1): Data berasal dari populasi yang bukan berdistribusi Normal. Statistik Uji (L) berdasarkan formula:

Statistik uji \(L\) mengukur perbedaan absolut terbesar antara Fungsi Distribusi Kumulatif (CDF) Teoritis, \(F(Z_i)\), dan Fungsi Distribusi Kumulatif Empiris, \(S(Z_i)\).

\[L = \max_{1 \le i \le n} \left\{ \left| F(Z_i) - S(Z_i) \right| \right\}\]

Di mana: * \(L\): Statistik Uji Kolmogorov-Smirnov (atau variannya, seperti Lilliefors). * \(\max_{1 \le i \le n}\): Nilai maksimum dari perbedaan di antara semua titik data (\(i=1\) sampai \(n\)). * \(F(Z_i)\): CDF Teoritis (misalnya, CDF Normal Standar) pada skor \(Z_i\). * \(S(Z_i)\): CDF Empiris (proporsi data yang nilainya \(\le\) data ke-\(i\)) pada skor \(Z_i\). * \(Z_i\): Skor baku (Z-score) dari data ke-\(i\).

Di mana: F(Z_i) adalah fungsi sebaran Normal baku (Standard Normal Cumulative Distribution Function). S(Z_i) adalah fungsi sebaran empirik (Empirical Cumulative Distribution Function). Pengambilan Keputusan: Hipotesis nol (H_0) ditolak jika L > L_{tabel}. L_{tabel} adalah nilai kritis Lilliefors yang dicari berdasarkan tingkat taraf nyata () yang dipilih (misalnya 5%) dan ukuran sampel (n). Jika n diasumsikan lebih dari 30, digunakan tabel nilai kritis Lilliefors.

  1. Uji Normalitas dengan Grafik Uji normalitas juga dapat dilakukan secara visual menggunakan grafik, seperti: Boxplot (Diagram Kotak Garis): Grafik yang menampilkan distribusi data berdasarkan lima statistik utama: nilai minimum, kuartil pertama (Q_1), median, kuartil ketiga (Q_3), dan nilai maksimum. Boxplot dapat membantu melihat sebaran data, bentang, dan mendeteksi outlier. Grafik Q-Q Plot (Quantile-Quantile Plot) atau P-P Plot (Probability-Probability Plot): Meskipun tidak dijelaskan secara rinci di teks, grafik ini adalah cara umum untuk menilai normalitas. Data dikatakan normal jika titik-titik data berada dekat dengan garis lurus diagonal.