Aşağıdaki algoritmayı gözönünde bulundurup, analitik süreci ilerlettiğimizde;
Bağımsız iki grupta numerik veri analizi için 2 test karşımıza çıkmaktadır: Bağımsız gruplarda t-testi (student t testi) ve Mann-Whitney U testi. Bu durumda işlem şu şekilde yürüyecektir.
Bağımsız örneklem t-testi (veya kısaca bağımsız t-testi), aynı sürekli, bağımlı değişken üzerinde iki ilgili olmayan grup (bağımsız) arasındaki ortalamaları karşılaştırır. Örneğin, Diyabet durumuna göre CRP düzeyleri arasında fark olup olmadığını anlamak için bir bağımsız t-testi kullanabilirsiniz (yani bağımlı değişkeniniz “CRP” ve bağımsız değişkeniniz “Diyabet” olacaktır, bu iki grup “Diyabet var” ve “diyabet yok” olarak belirlenecektir).
Varsayımlar
Varsayım #1: Bağımlı değişkeniniz numerik bir
değişken olmalıdır
Varsayım #2: Bağımsız
değişkeniniz iki kategorili, bağımsız gruptan oluşmalıdır.
Varsayım #3: Gözlemlerin bağımsız olması gereklidir,
yani her grup veya gruplar arasındaki gözlemler arasında bir ilişki
olmamalıdır (öncesi-sonrası çalışmalarda gözlemler bağımlıdır!!). Bu
daha çok bir çalışma tasarımı sorunu olup, test edilebilecek bir şey
değildir ancak bağımsız t-testinin önemli bir varsayımıdır. Eğer
çalışmanız bu varsayımı karşılamıyorsa, bağımsız t-testi yerine başka
bir istatistiksel test kullanmanız gerekebilir (örneğin, eşleştirilmiş
örneklem t-testi).
Varsayım #4: Bağımsız
değişkenin her bir grubu için bağımlı değişkeniniz yaklaşık normal
dağılıma sahip olmalıdır. Bağımsız t-testinin yaklaşık normal veriler
gerektirdiğinden bahsediyoruz çünkü normal dağılım bozulmalarına oldukça
“sağlam-robust” bir testtir, yani bu varsayım biraz bozulsa bile hala
geçerli sonuçlar verebilir.
Varsayım #5: Gruplar
arasında varyansların homojen olması gereklidir. Bu varsayımı Levene
varyans homojenliği testi ile test edebilirsiniz.
Varsayım1#, 2# ve 3#, herhangi bir test ile kontrol edilemez. Ancak, 4# ve 5# kontrol edilebilir. Varsayım1#, 2# ve 3# ihlal edildiğinde bu test seçilemez. Ayrıca 4# ve 5#’de ihlal edilirse bu test seçilmemelidir, ancak bazı özel durumlarda (transformasyonlar, çok büyük örneklem büyüklüğü) terscih edilebilir.
Örnek raporlama:
Ho=DM olan ve olmayanların CRP düzeylerinin ortalamaları arasında fark yoktur
Bu çalışma, Diyabeti olmayanların (5,80 ± 0,38 mmol/L), diyabeti olanlara göre (6,15 ± 0,52 mmol/L) istatistiksel olarak anlamlı düzeyde daha düşük CRP konsantrasyonlarına sahip olduklarını bulmuştur. Bağımsız t-testi sonucuna göre, t(38)=2.428, p=0.020.
Formül:
\(t = \frac{\bar{x}_1 - \bar{x}_2}{s_p \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}}\), \(\bar{x}_1\) ve \(\bar{x}_2\) örneklem ortalamaları, \(s_p\) pooled standard deviation (\(s_p = \sqrt{\frac{(n_1-1)s_1^2 + (n_2-1)s_2^2}{n_1+n_2-2}}\)), ve \(n_1\) ve \(n_2\) örneklem büyüklükleridir.
Mann-Whitney U testi, bağımlı değişken ordinal ya da sürekli olsa da, normal dağılmadığında iki bağımsız grup arasındaki farklılıkları karşılaştırmak için kullanılır. Mann-Whitney U testi, bağımsız t-testinin nonparametrik alternatifi olarak kabul edilir.
Varsayım #1: Bağımlı değişkeniniz numerik bir
değişken olmalıdır
Varsayım #2: Bağımsız
değişkeniniz iki kategorili, bağımsız gruptan oluşmalıdır.
Varsayım #3: Gözlemlerin bağımsız olması gereklidir,
yani her grup veya gruplar arasındaki gözlemler arasında bir ilişki
olmamalıdır (öncesi-sonrası çalışmalarda gözlemler bağımlıdır!!). Bu
daha çok bir çalışma tasarımı sorunu olup, test edilebilecek bir şey
değildir.
Nonparametrik testler genellikle verilerin gerçek değerleri yerine verilerin sıraları temel alınarak yapılır. Başka bir deyişle, veriler en küçükten en büyüğe doğru sıralanır ve her verinin sıralaması (birinci, ikinci, üçüncü vb.) kaydedilir. Gerçek ölçümler test için tekrar kullanılmaz. Sıraları kullanmak, ölçümlerin olasılık dağılımı hakkında varsayımlar yapmaktan kaçınmamızı sağlar, çünkü tüm dağılımlar ölçümlerin sıraları hakkında benzer tahminler yaparlar. Sıraları kullanan nonparametrik yöntemlerden bir örnek, Mann–Whitney U testidir.
Mann–Whitney U testi, iki örneklem t testinin normal dağılım varsayımı sağlanamadığında iki örneklem t testi yerine kullanılabilir. Bu yöntem, iki grubun frekans dağılımlarının aynı olup olmadığını test eder. Eğer iki grubun dağılımları aynı şekle sahipse (overlap yapmış, aynı lokasyon, benzer median), Mann–Whitney U testi iki grubun konumlarını (medyan veya ortalama) karşılaştırır. Ancak eğer şekiller benzer (aslında bu MWU testinin unutulan bir varsayımıdır) ve lokasyonlar farklı ise (median farklı), bu durumda medianlar karşılaştırılmaz, mean rank (ortalama sıra) karşılaştırılır.
Mann-Whitney U testi için test istatistiği (U), şöyle hesaplanır:
\(\U1 = n1*n2+\frac{n1(n1+1)}{2}-R1\) ve \(\U2 = n1*n2-U1\) ve R1; grup-1’in rank’larının toplamıdır. U1 ve U2’den hangisi büyük ise U-statistics olarak kabul edilir. U değerinin dağılım normal dağılım ile yaklaşık olarak hesaplanabilir ve testin p-değeri hesaplanabilir.