Verilerin normal dağılıp dağılmadığının değerlendirilmesi, parametrik testlerin temel bir varsayımı olduğu için birçok istatistiksel test için önkoşuldur. Mesela bağımsız örneklerde student-t testi, her bir grupta numerik değişkenin normal dağılması varsayımına sahipken, bağımlı örneklerde eşleştirilmiş t testi için gruplar arasındaki farkın normal dağılması varsayımı vardır. Ancak, merkezi limit teoremi, örneklem hacmi büyük ise (>100-200) çok ciddi olmayan bir normalite ihlali yoksa, bu varsayımın hafif-orta ihlallerinin önemli bir problem oluşturmayacağını öne sürmektedir.
Normaliteyi değerlendirmenin iki ana yöntemi vardır: grafik aracılığı ile ve test aracılığı ile değerlendirme. İstatistiksel testler, normaliteyi objektif bir şekilde değerlendirme avantajına sahiptir, ancak düşük örneklem büyüklüklerinde bazen yeterince duyarlı değildir veya büyük örneklem büyüklüklerine aşırı duyarlı olabilirler. Bu nedenle, bazı istatistikçiler, verileri çizim/grafiklerden yapacakları subjektif bir değerlendirme yapmayı tercih ederler. Grafiksel yorumlama, sayısal testlerin aşırı veya yetersiz hassas olabileceği durumlarda normaliteyi değerlendirmek için iyi bir değerlendirme yapmaya izin verir, ancak grafik yöntemleri objektiviteden yoksundur. Grafiksel olarak normaliteyi yorumlama konusunda çok fazla deneyime sahip değilseniz, muhtemelen sayısal yöntemlere güvenmek en iyisidir.
Normal dağılımın özellikleri: 1) Bell shaped curve (çan eğrisi) şeklindedir, tek tepelidir (unimodal) ve simetriktir. Mean=Median’dir. Verilerin %50si ortalamanın altında, %50si ortalamanın üstündedir.
Verilerin %68.3% +- 1SD, verilerin %95.5% +-2SD ve verilerin %99.7%’si +- 3SD içerisindedir.
** Ortalaması 0, standat sapması 1 olan özel normal dağılıma “standart normal dağılım yada z dağılımı” denmektedir.**
1) Histogram: Belkide en sık uygulanan yöntemdir.
2) Q-Q (quantile-quantile) grafikleri:
Öncelikle herhangi bir normal dağılım simule edilir (hayali), genellikle kolay olsun diye standart normal dağılım üretilir (ortalaması sıfır, standart sapması 1). daha sonra bu hayali dağılımın quantilleri not edilir. gerçek verisetinin de quantilleri not edilir ve bunlar saçılım grafiği ile çizidirilir. eğer noktalar 45 derecelik eğri olan diagonal eğri üzerinde ise veri dağılımı normale yakındır denir.
Kolmogorov-Smirnov (KS) veya Shapiro-Wilks (SW) testi kullanılabilir. Bu testler ile verimizin normal dağılıma yakın/yaklaşık dağılıp dağılmadığı test edilir. Küçük örenklemlerde (<50) SW testi daha çok tercih edilmektedir.
Ho= Veri normal dağılmaktadır (veri dağılımı ile normal dağılım arasında fark yoktur)
Test sonucunda p değeri <0.05 bulunursa, Ho red edilir, yani normal dağılmadığı belirtilir.