1 Kruskal Wallis Testi

Bu kitap bölümünde non-parametrik bir test olan Kruskal Wallis’in teorik bilgisinin verilmesinin ardından, varsayımları açıklanacaktır. Sonrasında ise örnek veri üzerinden bu testin nasıl yapılacağı gösterilecektir.

1.1 Teorik Bilgiler

Kruskal Wallis testi, ilişkili örneklemler için tek yönlü varyans analizinin (ANOVA) non-parametrik alternatifidir. Tek yönlü ANOVA için gerekli varsayımlar karşılanmadığında bu test önerilmektedir. Üç veya daha fazla grup için bazı sürekli değişkenler üzerindeki puanları karşılaştırmaya olanak tanır (Pallant 2020). Kruskal Wallis testi, her ölçüm değeri için genel veri setindeki sıralamayı değiştirerek başlar. En küçük değerin sıralaması 1, ikinci en küçük değerin sıralaması 2 vb. olur (Hecke 2012).

1.2 Kruskal Wallis Testi İçin Varsayımlar

Kontrol edilmesi gereken iki genel varsayım vardır:

  1. Randomize örneklem,

  2. Bağımsız gözlemler.

Yukarıdaki varsayımlar genellikle non-parametrik testleri yapmadan önce kontrol ettiğimiz varsayımlardır. Kruskal Wallis testinin gerçekleştirilebilmesi için bir kategorik bağımsız değişkenin (üç ya da daha fazla kategori) ve bir sürekli bağımlı değişkenin olması elzemdir. Bunun yanı sıra normal dağılım göstermediği varsayılır.

1.3 Problem Durumu ve Hipotezler

Bu kitap bölümünde Kruskal Wallis testi baba eğitim düzeyi açısından öğrencilerin okula yönelik tutumları arasında fark olup olmadığını test etmek üzere kullanılmıştır.

Problem durumu: Baba eğitim düzeyi açısından öğrencilerin okuldaki eğitsel aktivitelere yönelik tutumları arasında fark var mıdır?

H0 : Baba eğitim düzeyi açısından öğrencilerin okuldaki eğitsel aktivitelere yönelik tutumları arasında fark yoktur.

H1 : Baba eğitim düzeyi açısından öğrencilerin okuldaki eğitsel aktivitelere yönelik tutumları arasında fark vardır.

1.4 Analizde Kullanılan Verinin Tanıtılması

Bu analizde PISA2018 verileri kullanılacaktır. Veri setinde 1119 değişken ve 6890 gözlem bulunmaktadır. Bağımlı değişken okuldaki eğitsel aktivitelere yönelik tutumları olarak belirlenmiştir. Bu değişken süreklidir. Bağımsız değişken olarak ise öğrencilerin baba eğitim düzey kullanılmıştır. tuev paketi indirilmiştir ve buradaki 2018 PISA verileri kullanılmıştır. Aşağıdaki kodlarla veri seti etkinleştirilebilir. Analizde kullanılan değişkenlerin isimleri FISCED, baba eğitim düzeyini, ATTLNACT ise okuldaki eğitsel aktivitelere yönelik tutumlarını göstermektedir.

library(tuev)
data("PISA_STU_2018")
library(pillar)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following object is masked from 'package:pillar':
## 
##     dim_desc
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
dat_analysis <- PISA_STU_2018 %>% select(FISCED, ATTLNACT)
names(dat_analysis) <- c("BABAE", "TUET")
dat_analysis2 <- expss::drop_val_labs(dat_analysis)

Her iki değişkenin adında değişiklik yapmak için aşağıdaki kod çalıştırılmıştır. Yeni değişken isimleri FISCED için BABAE ve ATTLNACT için TUET olarak belirlenmiştir. Seçilen değişkenler dat_anaylsis olarak tanıtılmıştır. Verilerde iki değişken ve 6890 gözlem bulunmaktadır. Analizlerde karşımıza hata çıkmaması için verilerin haven etiketleri de drop_var_labs () fonksiyonu kullanılarak kaldırılmıştır. Bu verilere ilişkin betimsel istatistikler hesaplanmıştır.

1.4.1 Betimsel İstatistikler

Veri setindeki değişkenler için betimsel istatistikler hesaplanmıştır.

Baba eğitim düzeyininin betimsel istatistiklerini hesaplamak için summary() fonksiyonu kullanılmıştır.

BABAE <-expss::drop_var_labs(PISA_STU_2018$FISCED)
BABAE_df <- as.data.frame(t(summary(BABAE)))
hist(BABAE)

Burada dağılımın normal olmadığı ve 0-6 arasında dağıldığını söylemek mümkündür. Tablo 1 baba eğitim düzeyine dair betimsel istatistikleri sunmaktadır.

Tablo 1

Baba Eğitim Düzeyi Betimsel İstatistikler

BABAE_df2 <- BABAE_df %>% select(-Var1) 
BABAE_df2 <- BABAE_df2 %>% rename(Betimsel=Var2 , Değer= Freq)
knitr::kable(BABAE_df)
Var1 Var2 Freq
A Min. 0.000000
A 1st Qu. 1.000000
A Median 2.000000
A Mean 3.124835
A 3rd Qu. 5.000000
A Max. 6.000000
A NA’s 57.000000
TUET_bet <- summary (dat_analysis2$TUET, subset(dat_analysis2$TUET))
TUET_bet_df <- as.data.frame(t(TUET_bet))
hist(dat_analysis2$TUET)

Tablo 2

Okuldaki Eğitsel Aktivitelere Yönelik Tutumlar

TUET_bet_df_2 <- TUET_bet_df %>% select(-Var1) 
TUET_bet_df_2 <- TUET_bet_df_2 %>% rename(Betimsel=Var2 , Değer= Freq) 
knitr::kable(TUET_bet_df_2, round(2))
Betimsel Değer
Min. -2.5375000
1st Qu. -0.6583000
Median 0.0281000
Mean -0.1134841
3rd Qu. 1.0844000
Max. 1.0844000
NA’s 125.0000000

Tablo 2’de de görüldüğü gibi bu değişkende 125 kayıp veri bulunmaktadır. Kayıp veri istatistiksel analiz öncesinde işlem gerektirmektedir. Kayıp veri analizi için birçok yöntem bulunmaktadır. Burada değerleri incelediğimizde minimum değer -2.537 ve maksimum değer ise 1.084’tir.

1.5 Kruskal Wallis Testi Bulguları

Şimdi Kruskal Wallis testini yapmak için yeni bir veri çerçevesi oluşturalım.

PISA2018_Kruskal <- data.frame(BABAE, dat_analysis2$TUET, check.rows = FALSE, check.names = TRUE, stringsAsFactors = default.stringsAsFactors())
kruskal_table <- kruskal.test(dat_analysis2$TUET~BABAE, data=PISA2018_Kruskal)

‘TUET’ değişkeni ‘BABAE’ değişkeninin kategorileri arasında farklılık gösterip göstermediğine dair test edilmiştir. Ki-kare değeri 18.457 olarak hesaplanmıştır. Baba eğitim düzeyinde 7 farklı kategori olduğu için serbestlik derecesi 6’dır. 0-yok, 6-yüksek lisans ve doktora olarak belirlenmiştir(OECD 2019). Anlamlı bir farklılık olup olmadığına dair yapılan hesaplamalar sonucunda p-değeri 0.005 olarak bulunmuştur. Bu değer 0.05’ten küçük olduğu için H0 hipotezi reddedilir ve baba eğitim düzeyi ile okulda düzenlenen etkinliklere yönelik tutum arasında anlamlı bir farklılık olduğu sonucuna ulaşılır.

Bu Kruskal-Wallis testine göre, ‘BABAE’ değişkeninin farklı seviyeleri veya kategorileri arasında ‘TUET’ değişkeninde anlamlı farklılıklar olduğu sonucuna varılmıştır.

Etki Büyüklüğü
Etki büyüklüğünü hesaplamak için rstatix paketinin indirilmesi gerekmektedir. H-istatistiğine dayanan eta kare, Kruskal-Wallis testi etki büyüklüğünün ölçüsü olarak kullanılabilir. Aşağıdaki gibi hesaplanır:

\[eta2[H]={(H - k + 1)}/{(n - k)}\]

Burada H, Kruskal-Wallis testinde elde edilen değerdir,

k, grup sayısıdır;

n, toplam gözlem sayısıdır (Tomczak and Tomczak 2014)

Eta-kare tahmini 0 ile 1 arasında değerler alır ve 100 ile çarpıldığında bağımlı değişkendeki varyansın bağımsız değişken tarafından açıklanan yüzdesini gösterir.

Yayımlanmış literatürde yaygın olarak kullanılan yorumlama değerleri şunlardır: 0.01- < 0.06 (küçük etki), 0.06 - < 0.14 (orta etki) ve >= 0.14 (büyük etki). Buradaki kruskal_effsize fonksiyonu ile etki büyüklüğü hesaplanabilir.

library(rstatix)
## 
## Attaching package: 'rstatix'
## The following object is masked from 'package:stats':
## 
##     filter
kruskal_efftab <- kruskal_effsize(
  PISA2018_Kruskal,
  dat_analysis2$TUET~BABAE,
  ci = FALSE,
  conf.level = 0.95,
  ci.type = "perc",
  nboot = 1000
)

Hesaplanan etki büyüklüğü küçük bir etki büyüklüğünü göstermektedir. Tüm bu istatistiksel değerler Tablo 3’te verilmiştir.

Tablo 3
Kruskal Wallis Test Bulguları

Kruskal-Wallis chi square df p Cohen-h n
18.45689 6 .005 0.001809805 6890

Kruskal-Wallis test sonuçlarına göre gruplar arasında anlamlı bir farklılık olduğuna ulaşılmıştır. Bu anlamlı farklılığın hangi gruplar arasında olduğunu öğrenmek için farklı non-parametrik istatistikler yürütülebilir. Bu istatistiklerden biri Wilcoxon mertebeler testidir ama genellikle gruplar arasındaki farkı bulmak için Dunn Testi yapılmaktadır. Bonferonni düzeltmesi olarak da bilinen bu test Kruskal Wallis testinden sonra yapılan bir post-hoc testidir. Dunn Testi, her bağımsız grup arasında ikili karşılaştırmalar yapar ve size hangi grupların belirli bir α düzeyinde istatistiksel olarak anlamlı derecede farklılaştığını ortaya çıkarır.

pwc <- PISA2018_Kruskal %>% 
  dunn_test(dat_analysis2.TUET~BABAE, p.adjust.method = "bonferroni")
pwc
## # A tibble: 21 × 9
##    .y.              group1 group2    n1    n2 statistic     p p.adj p.adj.signif
##  * <chr>            <chr>  <chr>  <int> <int>     <dbl> <dbl> <dbl> <chr>       
##  1 dat_analysis2.T… 0      1        256  1436    0.279  0.780     1 ns          
##  2 dat_analysis2.T… 0      2        256  1684   -0.0530 0.958     1 ns          
##  3 dat_analysis2.T… 0      3        256   662    0.623  0.533     1 ns          
##  4 dat_analysis2.T… 0      4        256   529    0.493  0.622     1 ns          
##  5 dat_analysis2.T… 0      5        256   875   -0.679  0.497     1 ns          
##  6 dat_analysis2.T… 0      6        256  1303   -1.60   0.109     1 ns          
##  7 dat_analysis2.T… 1      2       1436  1684   -0.625  0.532     1 ns          
##  8 dat_analysis2.T… 1      3       1436   662    0.574  0.566     1 ns          
##  9 dat_analysis2.T… 1      4       1436   529    0.366  0.715     1 ns          
## 10 dat_analysis2.T… 1      5       1436   875   -1.57   0.117     1 ns          
## # ℹ 11 more rows

21 gruplama yapılmıştır ve 1. ve 6. gruplar arasında ( p = 0.01637148), 3. ve 6. gruplar arasında (p = 0.02351829) anlamlı ölçüde farklılık olduğuna ulaşılmıştır.

Rapor

Bu kitap bölümünde Kruskal Wallis testinin nasıl yapıldığı açıklanmıştır. Baba eğitim düzeyine göre öğrencilerin okulda yapılan eğitsel etkinliklere yönelik tutumlarının anlamlı derecede farklılaşıp farklılaşmadığı analiz edilmiştir. Yapılan test sonucuna göre gruplar arasında farklılaşma olduğu ancak bu farklılaşmanın küçük bir etki büyüklüğüne sahip olduğuna ulaşılmıştır. Hangi gruplar arasında anlamlı derece farklılaşma olduğunu ortaya çıkarmak amacıyla Dunn testi yapılmıştır ve gruplar arasında yalnızca 1. ve 6., 3. ve 6. gruplar arasında anlamlı farklılık olduğuna ulaşılmıştır. 1. grup; ilkokul düzeyini, 3. grup; lise düzeyini temsil ederken 6. grup; yüksek lisans ve doktora düzeyini temsil etmektedir (OECD 2019). Buna göre baba eğitim durumunun ilkokul veya lise düzeyinde olması yüksek lisans ve doktora grubuna göre öğrencilerin okulda düzenlenen eğitsel aktivitelere yönelik tutumlarında anlamlı düzeyde farklılık oluşturmaktadır.

1.6 Örnek Makale

(Çalişkan and Baloglu 2023) BİLSEM’e Öğrenci Aday Gösteren ve Göstermeyen Öğretmenlerin Üstün Yetenekliler Eğitimine İlişkin Özyeterliliklerinin İncelenmesi adlı araştırmalarında sınıf öğretmenlerinin mesleki özyeterlilik puan ortalamaları; yaş, kıdem ve üstün yetenekliler eğitimine ilişkin görüşlerine göre anlamlı farklılık gösterip göstermediği Kruskal Wallis testiyle analiz edilmiştir. ÖZ yeterlilik alt alanları; genel özyeteterlilik, temel alan bilgisi, öğretim model ve yöntemleri, bireyselleştirilmiş eğitim programı, tanılama ve değerlendirme, öğretmen nitelik ve sorumlulukları, sınıf yönetimi, materyal geliştirme/teknoloji, işbirliği/aile eğitimi olmak üzere farklı puanlar dahilinde hesaplanmıştır. Yaş grubuna, 22-32, 33-43, 44-54, 55-65, göre öğretmenlerin öz yeterlilik puan ortalamaları anlamlı düzeyde farklılaşmadığına ulaşılmıştır. Ayrıca kıdem yıllarına göre 11-21, 22-32, 33-43, öz yeterlilik puanlarının anlamlı düzeyde farklılaşmadığına ulaşılmıştır. Üstün yetenekliler eğitimine ilişkin görüşler değerlendirildiğinde ise yine farklılaşma olmadığına ulaşılmıştır.

Çalişkan, Kadir, and Mustafa Baloglu. 2023. “BİLSEMe Öğrenci Aday Gösteren ve Göstermeyen Öğretmenlerin Üstün Yetenekliler Eğitimine İlişkin Özyeterliliklerinin İncelenmesi.” Dokuz Eylül Üniversitesi Buca Eğitim Fakültesi Dergisi, no. 55 (March): 210–30. https://dergipark.org.tr/en/pub/deubefd/issue/76537/1214243.
Hecke, T. Van. 2012. “Power Study of Anova Versus Kruskal-Wallis Test.” Journal of Statistics and Management Systems 15 (2-3): 241–47. https://doi.org/10.1080/09720510.2012.10701623.
OECD. 2019. PISA 2018 Assessment and Analytical Framework. PISA. OECD. https://doi.org/10.1787/b25efab8-en.
Pallant, Julie. 2020. SPSS Survival Manual: A Step by Step Guide to Data Analysis Using IBM SPSS. 7th ed. London: Routledge. https://doi.org/10.4324/9781003117452.
Tomczak, Ewa, and Maciej Tomczak. 2014. “The need to report effect size estimates revisited. An overview of some recommended measures of effect size.” Biblioteka Akademii Wychowania Fizycznego w Poznaniu. https://www.wbc.poznan.pl/dlibra/publication/413565/edition/325867.