Aşağıdaki algoritmayı gözönünde bulundurup, analitik süreci ilerlettiğimizde;
Bağımsız ikiden fazla grupta numerik veri analizi için 2 test karşımıza çıkmaktadır: varyans analizi (Analysis of variance, ANOVA) ve Krıskal-Wallis (KW) testi. Bu durumda işlem şu şekilde yürüyecektir.
Varyans analizi (ANOVA), en az üç ve daha fazla bağımsız (ilişkisiz) grup arasındaki ortalama farklılıklarının istatistiksel olarak anlamlı olup olmadığını belirlemek için kullanılır. Örneğin, üç bağımsız grupta (normal, tip-1 diyabet ve tip-2 diyabet) bir kronik inflamasyon göstergesi olan sedimantasyon düzeyinin farklı olup olmadığını anlamak için ANOVA kullanabilirsiniz. Ayrıca, ANOVA’nın bir omnibus test istatistiği olduğunu ve hangi belirli grupların birbirinden istatistiksel olarak önemli derecede farklı olduğunu söyleyemeyeceğini fark etmek önemlidir; sadece en az iki grubun farklı olduğunu söyler. Çalışma tasarımınızda üç, dört, beş veya daha fazla grup olabileceği için hangi grupların birbirinden farklı olduğunu belirlemek önemlidir. Bu, post-hoc test kullanarak yapılabilir.
Omnibus test ve post-hoc testler: Kombine veya birleşik test olarakta bilinir. İkiden fazla grupta, bir numerik değişken düzeyinin anlamlı farklılık gösterip göstermediğini bize söyler ancak anlamlılık hangi grup/gruplardan kaynaklanır? bunu bize söyleyemez. Bunun için ikişerli karşılaştırmalar yapılarak (posthoc testler ile) farklılığın kaynağı olan grup/gruplar belirnebilir. ANOVA ve Ki-Kare testleri aynı zamanda omnibus testler olarak ta bilinir. İstatistikte geliştirilmiş pek çok post-hoc test vardır, bunlardan en çok bilinenler şunlardır: Bonferroni, Tukey, Scheffe, LSD, Sidak, Games-Howell… (Varyanslar homojen ise en fazla Bonferroni ve Tukey kullanılırken, varyanslar homojen değilse en fazla Games-Howell kullanılır)
Varsayım #1: Bağımlı değişkeniniz numerik bir
değişken olmalıdır
Varsayım #2: Bağımsız
değişkeniniz en az üç kategorili, bağımsız gruptan oluşmalıdır.
Varsayım #3: Gözlemler bağımsız olmalıdır. Yani
öncesi-sonrası bir tasarım olmamalıdır.
Varsayım
#4: Bağımlı değişkenmiz her bir grupta normale yakın
dağılmalıdır
Varsayım #5: gruplar arasında
varyanslar homojen olmaldır [gruplar arasında varyanslar homojen (buna
levene testi ile bakılır) değilse Welch ANOVA testi kullanılır].
Örnek raporlama:
Ho=Tip-1 DM, Tip-2 DM ve Kontrol gruplarının sedimantasyon ortalamaları arasında fark yoktur.
Bu çalışma, Tip-1 DM, Tip-2 DM ve kontrol grupları arasında sedimantason düzeyi için istatistiksel olarak anlamlı bir farklılık olduğunu göstermiştir. Farklılığın hangi gruptan kaynaklandığını tespit etmek için yapılan post-hoc analizde (Bonferroni testi), Tip-1 DM ve Tip-2 DM arasında fark yokken, her iki DM grubunda sedimantasyon düzeyi, kontrol grubuna göre istatistiksel olarak anlamlı bir şekilde daha yüksek bulundu.
ANOVA testinin arka planında, varyasyonu ölçen 2 temel tanımlama mevcuttur. Varyasyonun iki temel kaynağı vardır: Grup içi ve gruplar arası
Tüm grubun ortalama CRP değeri: \(\overline{Y}\) Her bir grubun ortalama CRP değeri: \(\overline{Yi}\) (i; A, B, C gruplarını gösterir) Her bir bireyin CRP değeri: \({Yj}\) (j; bireylerin numarasını gösterir)
Yukarıdaki şekilde, solda, Her bir bireyin tüm grup artalamasına olan uzaklığını 2 bölüme ayırabiliriz: Total = Groups + Error
\({Yij}\) -\(\overline{Y}\) = (\({Yij}\) -\(\overline{Yi}\)) + (\(\overline{Yi}\) -\(\overline{Y}\)). [formülün ilk parçası, her gözlemin kendi ortalamasına olan uzaklığını gösterirken (yukarıdaki şekil, sağ), ikinci parçası ise gözlemin ait olduğu grup ortalamasının genel tüm grup ortalamasına olan mesafesini gösterir (yukarıdaki şekil, orta)]
Yukarıdaki formüle benzer şekilde **karelerin toplamı (sum of squares) hesaplanabilir.
Daha sonra ortalamanın kareleri (mean squares) hesaplanır
En son aşağıdaki formüle göre ANOVA istatistik değeri olan F değeri hesaplanır. F değeri 1 ise grup ortalamaları benzerdir.
ANOVA testi ile benzer durumlarda kullanılır ve ANOVA testinin nonparametrik karşılığı olarak kabul edilir. Gruplarda, numerik değişkenin dağılımının belirgin non-normal olması durumunda kullanılır. Tıpkı ANOVA testi gibi, KW testi de bir omnibus testtir. Bize gruplar arasında farklılık olduğunu söyler ama farklılığın kaynağı hakkında bilgi vermez.
Varsayım #1: Bağımlı değişkeniniz numerik bir
değişken olmalıdır
Varsayım #2: Bağımsız
değişkeniniz en az üç kategorili, bağımsız gruptan oluşmalıdır.
Varsayım #3: Gözlemlerin bağımsız olması gereklidir,
yani her grup veya gruplar arasındaki gözlemler arasında bir ilişki
olmamalıdır (öncesi-sonrası çalışmalarda gözlemler bağımlıdır!!). Bu
daha çok bir çalışma tasarımı sorunu olup, test edilebilecek bir şey
değildir.
Nonparametrik testler genellikle verilerin gerçek değerleri yerine verilerin sıraları temel alınarak yapılır. Başka bir deyişle, veriler en küçükten en büyüğe doğru sıralanır ve her verinin sıralaması (birinci, ikinci, üçüncü vb.) kaydedilir. Gerçek ölçümler test için tekrar kullanılmaz. Sıraları kullanmak, ölçümlerin olasılık dağılımı hakkında varsayımlar yapmaktan kaçınmamızı sağlar, çünkü tüm dağılımlar ölçümlerin sıraları hakkında benzer tahminler yaparlar.
Eğer üç grubun dağılımları aynı şekle sahipse, KWT üç grubun konumlarını (medyan) karşılaştırır. Ancak eğer şekiller benzer değilse, bu durumda medianlar karşılaştırılmaz, mean rank (ortalama sıra) karşılaştırılır.
KW testinin post-hoc analizlerinde, Dunn testi veya ikişerli MWU testi kullanılabilir.
ANOVA testinde, test istatistiği F değeridir, Kruskal-Wallis testinde H değeridir.
Yukarıda tanımlanan ANOVA testi, aslında tek yönlü ANOVA testidir. Bunun dışında iki-yönlü, 3-yönlü, faktöryel ANOVA gibi testlerde vardır.
Homoskedastisite: Varyansların homojen olması (Levene testi ile varyanslar homojen mi? heterojen mi? bakılır)
İstatistikte genel kural: Aynı anda birden fazla hipotez (çoklu karşılaştırma, multiplw comparison) test ediliyorsa (mesela post-hoc testler), Tip-1 hata oranını korumak için, elde edilen p değeri düzeltilerel verilmelidir. Mesela iki grup arasında numerik değişken farkı araştırılırken, Tip-1 hata 0.05, ve p değerinin sınırı da 0.05 kabul edilir. Benzer şekilde 3 grup (A, B, C) arasında numerik bir değişken araştırılırken (omnibus test), yine tip-1 hata 0.05, ve p değerinin sınırı da 0.05 kabul edilir. Ancak, posthoc test verilirken, A-B, A-C ve B-C şeklinde üç karşılaştırma olacağı için, tip-1 hata değerini 0.05’te koruyabilmek için p değerinin anlamlılık sınırı, mesela Bonferroni testi ile 0.05/3 = 0.017 olarak kabul edilir.