1 İlişkili Örneklemlerde Tek Yönlü Varyans Analizi

1.1 Teorik Bilgiler

Tekrarlı ölçümlerde kullanılan varyans analizi, aynı katılımcıların farklı koşullarda (farklı zamanlarda) ölçülmesinde ortalamaları arasında farklılık olup olmadığını analiz eden bir parametrik testtir. Aynı zamanda grup içi desen olarak da bilinmektedir (Pallant 2020). Öyleyse en az üç ölçümün olması ve aynı gruba uygulamanın yapılmasına ihtiyacımız vardır.

Bu desenlerde kareler toplamının ve bağımsız değişken etkisi ortalama karesinin hesaplanması gruplararası desende olduğu gibidir. Tekrarlı ölçümlerdeki hata gruplararasına göre daha hassastır. Ancak katılımcıların ölçümlerde aldıkları puanlarda bireysel farklılıklar yoksa ya da vakalar ve işlem arasında etkileşim varsa hata terimi gruplararası deseninkinden daha büyük olabilir. Böyle bir durumda yokluk hipotezini reddetmek zorlaşır (Tabachnick and Fidell 2013).

1.2 İlişkili Örneklemlerde Tek Yönlü Varyans Analizi İçin Varsayımlar

ANOVA (Analysis of Variance)’nın üç temel varsayımı bulunmaktadır. Bu varsayımlar aşağıdaki gibidir.

  1. Normallik

  2. Varyansların eşitliği

  3. Bağımsızlık (Pallant 2020)

1.3 Problem Durumu ve Hipotezler

İlişkili örneklemlerde tek yönlü ANOVA için seçilen veri setinde iki grup (deney ve kontrol) bulunmaktadır ancak bu gruplardan yalnızca deney grubuna ait olan veriler alınmıştır. Zenginleştirilmiş ortam olan müdahale, 6 aylık bebekliklerinden itibaren deney grubuna yapılmıştır ve 1 yaş, 1.5 yaş ve 2 yaşında bu müdahale sonucunda bebeklerin bilişsel skorları ölçülmüştür. Yapacağımız analizde ise yaş gruplarında deney grubunda olan bebeklerin bilişsel skorlarında anlamlı bir farklılık oluşup oluşmadığı değerlendirilecektir. Bu kapsamda problem durumu ve hipotezler aşağıdaki gibi hazırlanmıştır.

Problem durumu: Zenginleştirilmiş ortam müdahalesi bebeklerin 1, 1.5 ve 2 yaşlarında bilişsel skorlarında anlamlı farklılığı sağlar mı?

H0 : Zenginleştirilmiş ortam müdahalesi bebeklerin 1, 1.5 ve 2 yaşlarında bilişsel skorlarında anlamlı farklılığa neden olmaz.

H1 : Zenginleştirilmiş ortam müdahalesi bebeklerin 1, 1.5 ve 2 yaşlarında bilişsel skorlarında anlamlı farklılığa neden olur.

1.4 Analizde Kullanılan Verinin Tanıtılması

Yukarıda da bahsettiğimiz gibi yalnızca deney grubunda olan bebeklerin 3 farklı ölçümünden elde edilen bilişsel skorlarına müdahalenin anlamlı farklılık oluşturup oluşturmadığı analiz edilecektir. 58 deney ve 45 kontrol grubundan oluşan bu veri setinde düşük sosyoekonomik duruma sahip Afro-Amerikan ailelelerin bebekleri yer almaktadır. Bizim analizde kullanacağımız grup olan deney grubuna 6 aydan itibaren zenginleştirilmiş ortam müdahalesi yapılmaya başlanmıştır.

Veri seti aşağıdaki gibi R ortamına aktarılır. Öncesinde install.packages() ile readxl paketi yüklenir.

library(readxl)
earlychild <- read_xlsx("earlychild.xlsx")

1.4.1 Betimsel İstatistikler

Veri setinde üç farklı zamanda bebeklere uygulanan bilişsel testin sonuçları yer almaktadır. Burada zenginleştirilmiş ortam müdahalesinin yaşları değiştikçe bebeklerde anlamlı bir farklılık yaratıp yaratmadığı analiz edilecektir. Öncesinde betimsel istatistiklerinin incelenmesi ve normallik analizinin yapılması önemlidir.

Bu verileri gruplayarak (örn; bebeklerin 1., 1,5. ve 2. yaşı) betimsel istatistikleri ortaya çıkarabiliriz. group_by() fonksiyonu dplyr paketinde yer almaktadır. install.packages ile öncelikle bu paketin yüklenmesi ve library ile aktif hale getirilmesi gerekmektedir.

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
betimsel <- earlychild %>% 
  filter(age == 1) %>%
  summarise(mean_cog = mean(cog, na.rm = TRUE),
            median_cog = median(cog, na.rm = TRUE),
            sd_cog = sd(cog, na.rm = TRUE),
            min_cog = min(cog, na.rm = TRUE),
            max_cog = max(cog, na.rm = TRUE))

Daha fazla betimsel istatistiğe ulaşmak için psych paketindeki describe fonksiyonunu da kullanabiliriz. Aşağıda bu fonksiyonun kullanım örneği verilmiştir.

library(dplyr)
library(psych)

age_1_data <- filter(earlychild, age == 1)

cog_age_1 <- describe(age_1_data$cog)

Tablo 1
Yaş 1 için Betimsel İstatistikler

colnames(cog_age_1) <- c("Değişken Sayısı", "n", "Ortalama", "Standart Sapma","Medyan", "Trimmed", "Medyana Olan Uzaklık", "Minimum", "Maksimum", "Ranj", "Çarpıklık", "Basıklık", "Standart Hata")
knitr::kable(cog_age_1) 
Değişken Sayısı n Ortalama Standart Sapma Medyan Trimmed Medyana Olan Uzaklık Minimum Maksimum Ranj Çarpıklık Basıklık Standart Hata
X1 1 58 112.931 14.93478 112 113.875 14.0847 57 137 80 -0.9470501 1.941336 1.961033

1, 5 yaşında bebekleirn elde ettikleri puanlara ilişkin betimsel istatistikler Tablo 2’de sunulmuştur.

Tablo 2
Yaş 1, 5 için Betimsel İstatistikler

age_1.5_data <- filter(earlychild, age == "1, 5")

cog_age_1.5 <- describe(age_1.5_data$cog)
colnames(cog_age_1.5) <- c("Değişken Sayısı", "n", "Ortalama", "Standart Sapma","Medyan", "Trimmed", "Medyana Olan Uzaklık", "Minimum", "Maksimum", "Ranj", "Çarpıklık", "Basıklık", "Standart Hata")
knitr::kable(cog_age_1.5) 
Değişken Sayısı n Ortalama Standart Sapma Medyan Trimmed Medyana Olan Uzaklık Minimum Maksimum Ranj Çarpıklık Basıklık Standart Hata
X1 1 58 110.2931 13.82727 109 110.8125 13.3434 68 136 68 -0.4351118 0.4519882 1.815609

Tablo 3
Yaş 2 için Betimsel İstatistikler

age_2_data <- filter(earlychild, age == 2)

cog_age_2 <- describe(age_2_data$cog)
colnames(cog_age_2) <- c("Değişken Sayısı", "n", "Ortalama", "Standart Sapma","Medyan", "Trimmed", "Medyana Olan Uzaklık", "Minimum", "Maksimum", "Ranj", "Çarpıklık", "Basıklık", "Standart Hata")
knitr::kable(cog_age_2) 
Değişken Sayısı n Ortalama Standart Sapma Medyan Trimmed Medyana Olan Uzaklık Minimum Maksimum Ranj Çarpıklık Basıklık Standart Hata
X1 1 58 97.06897 10.63899 96 97.14583 11.8608 72 116 44 -0.0724021 -0.4377726 1.396968

Yaşlara göre katılımcılar incelendiğinde eksik veri bulunmadığına ve uç değer bulunmadığına ulaşılmıştır. Her yaş grubu için çarpıklık ve basıklık değerleri normallik varsayımını desteklemektedir (Mishra et al. 2019)

1.5 İlişkili Örneklemlerde Tek Yönlü Varyans Analizi Bulguları

RStudio’da ilişkili örneklemlerde tek yönlü varyans analizi yapmak için öncelikle bazı paketlerin yüklenmesi gerekmektedir;

tidyverse, ggpubr, rstatix, ggplot2

#install.packages("ggpubr")
library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ forcats   1.0.0     ✔ readr     2.1.4
## ✔ ggplot2   3.4.4     ✔ stringr   1.5.0
## ✔ lubridate 1.9.3     ✔ tibble    3.2.1
## ✔ purrr     1.0.2     ✔ tidyr     1.3.0
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ ggplot2::%+%()   masks psych::%+%()
## ✖ ggplot2::alpha() masks psych::alpha()
## ✖ dplyr::filter()  masks stats::filter()
## ✖ dplyr::lag()     masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(ggpubr)
library(rstatix)
## 
## Attaching package: 'rstatix'
## 
## The following object is masked from 'package:stats':
## 
##     filter
library(dplyr)

Yukarıda analizde kullanacağımız veriler için betimsel istatistik analizleri yürütmüştük. ANOVA yapılmadan önce veri setinin normalliği farklı yöntemlerle değerlendirilmelidir. Bunlardan birincisi Shapiro-Wilk testidir. Shapiro-Wilk testi örneklemin rastgele dağılıp dağılmadığını analiz eder. Üç yaş grubunda da bulunan öğrencilerin bilişsel skorlarının normal dağılıp dağılmadığı aşağıdaki gibi analiz edilmiştir. R’da Shapiro-Wilk analizi için kabul edilen p değeri .10’dur.

earlychild %>% 
  filter(age==1) %>% 
shapiro_test(cog)
## # A tibble: 1 × 3
##   variable statistic       p
##   <chr>        <dbl>   <dbl>
## 1 cog          0.939 0.00601

age==1 olarak seçildiğinde katılımcıların 1 yaşında elde ettiği bilişsel skorlarının dağılımının normalliği incelenmiştir. Bu analize göre p değerinin .10’dan küçük olması dağılımın normal olmadığını göstermektedir.

earlychild %>% 
  filter(age== "1, 5") %>% 
shapiro_test(cog)
## # A tibble: 1 × 3
##   variable statistic     p
##   <chr>        <dbl> <dbl>
## 1 cog          0.970 0.161

age== “1, 5” olarak seçildiğinde katılımcıların 1,5 yaşında elde ettiği bilişsel skorlarının dağılımının normalliği incelenmiştir. Bu analize göre p değerinin .10’dan büyük olması dağılımın normal olduğunu göstermektedir.

earlychild %>% 
  filter(age==2) %>% 
shapiro_test(cog)
## # A tibble: 1 × 3
##   variable statistic     p
##   <chr>        <dbl> <dbl>
## 1 cog          0.970 0.157

age== 2 olarak seçildiğinde katılımcıların 2 yaşında elde ettiği bilişsel skorlarının dağılımının normalliği incelenmiştir. Bu analize göre p değerinin .10’dan büyük olması dağılımın normal olduğunu göstermektedir.

Normallik analizi için bir diğer yol ise grafiklerden veri seti ile ilgili yorumlamalar yapmaktır. Aşağıda yazılan kodla birlikte yaşa göre alt gruplara bölünen bilişsel skorların grafiklerine ulaşılabilir.

ggqqplot(earlychild, "cog", facet.by = "age")

Bilişsel skorlar x eksenine yerleştirilmiştir ve yaş gruplarına göre bu değişkenin dağılımı gösterilmiştir. Yani yaş gruplarına göre bebeklerin bilişsel yeteneklerinin nasıl değiştiği görselleştirilebilir. age=1 durumunda uç değerlerin olduğu görülmektedir.

options(scipen=999)
res.aov <- anova_test(data = earlychild, dv = cog, wid = id, within = age)
res.aov
## ANOVA Table (type III tests)
## 
## $ANOVA
##   Effect DFn DFd      F                     p p<.05   ges
## 1    age   2 114 55.501 0.0000000000000000148     * 0.218
## 
## $`Mauchly's Test for Sphericity`
##   Effect     W     p p<.05
## 1    age 0.893 0.042     *
## 
## $`Sphericity Corrections`
##   Effect   GGe       DF[GG]               p[GG] p[GG]<.05   HFe       DF[HF]
## 1    age 0.903 1.81, 102.96 0.00000000000000043         * 0.931 1.86, 106.13
##                  p[HF] p[HF]<.05
## 1 0.000000000000000163         *

ANOVA sonuçlarına göre grupların tekrarlı ölçümlerinde farklılaşma olduğuna ulaşılmıştır ( p <.05). Tekrarlı ölçümlerde Mauchly’nin küresellik testi yapılmaktadır. Bunun nedeni tekrarlı ölçümlerle, aynı veri kaynağından elde edilen ikiden fazla ölçümde, her bir sonraki ölçüm ile elde edilen veri ile bir önceki ölçüm sonucu elde edilen veri çiftleri arasındaki farkların oluşturduğu dizilerin varyanslarının da eşit olması gerekmektedir. Bu kapsamda elde edilen sonuçlara göre p değerinin .05’ten büyük olması küresellik varsayımını karşılar. Ancak elde ettiğimiz sonuçlarda bu koşulun sağlanmadığına ulaşılmıştır. Düzeltme için ise iki farklı yol kullanılmaktadır. Birincisi Greenhouse-Geisser epsilon (GG) ve ikincisi ise Huynh-Feldt epsilon (HF)’dir. Genellikle düzeltme yöntemi olarak Greenhouse-Geisser değeri dikkate alınır. Burada epsilon değerinin <.75’ten büyük veya küçük olması önem arz etmektedir. <.75’ten küçük olması durumunda Greenhouse-Geisser değeri dikkate alınırken, büyük olması durumunda Huynh-Feldt değerine bakılır (Girden 1992). Son satırdaki analizler incelendiğinde epsilon değerinin .75’ten büyük olduğu görülmektedir. Bu durumda Huynh-Feldt değeri incelenmelidir. Baktığımızda ise p değerinin .05’ten küçük olduğu bulgusuna erişmekteyiz. Buna göre küreselliğin sağlandığı söylenebilir.

get_anova_table(res.aov)
## ANOVA Table (type III tests)
## 
##   Effect  DFn    DFd      F                   p p<.05   ges
## 1    age 1.81 102.96 55.501 0.00000000000000043     * 0.218

Yaş değişkenine göre bilişsel skorlarda anlamlı bir farklılık olduğuna (p <.05) ve etki büyüklüğünün ise (ges) .218 olarak hesaplandığına ulaşılmıştır. Bir sonraki bölümde ise hangi yaşlarda anlamlı farklılaşmanın olduğu analiz edilmiştir.

Etki Büyüklüğü

pwc <- earlychild %>% 
  pairwise_t_test(
    cog~age, paired = TRUE,
    p.adjust.method = "bonferroni"
  )
pwc
## # A tibble: 3 × 10
##   .y.   group1 group2    n1    n2 statistic    df        p    p.adj p.adj.signif
## * <chr> <chr>  <chr>  <int> <int>     <dbl> <dbl>    <dbl>    <dbl> <chr>       
## 1 cog   1      1, 5      58    58      1.62    57 1.1 e- 1 3.3 e- 1 ns          
## 2 cog   1      2         58    58      8.70    57 4.77e-12 1.43e-11 ****        
## 3 cog   1, 5   2         58    58      9.73    57 1.03e-13 3.09e-13 ****

Etki büyüklüğü hesaplaması sonucunda 1-2 ve 1,5-2 yaşlarında yapılan ölçümler arasında anlamlı bir farklılığa ulaşılmıştır ( p < .05).

Rapor

Düşük sosyoekonomik düzeye sahip Afro-Amerikalı ebeveynlerin bebeklerine uygulanan zenginleştirilmiş ortam müdahalesinin bebeklerin bilişsel yeteneklerine olan etkisi araştırılmıştır. Bebeklerin bilişsel yeteneklerine dair skorları üç yaş aralığında (1, 1.5 ve 2) aynı ölçekle değerlendirilmiştir. Zenginleştirilmiş ortamın bilişsel yeteneklerde farklılaşma oluşturup oluşturmadığını değerlendirmek için ilişkili örneklemlerde tek yönlü varyans analizi kullanılmıştır. Yapılan analiz bulgularına göre zenginleştirilmiş ortam müdahalesine dahil edilen bebeklerin farklı yaşlarında bilişsel yetenekler skorlarında farklılaşma olduğuna ulaşılmıştır ( p < .05). Yapılan etki büyüklüğü analizi sonucunda ise bebeklerin yaşları arttıkça bilişsel yeteneklerde elde ettiği skorların da arttığına ulaşılmıştır. 1-1.5 yaş ölçümlerinde anlamlı bir farklılık yoktur ancak 1-2 ve 1.5-2 yaşlarında bebeklerin bilişsel yeteneklerinde farklılaşma olduğuna ulaşılmıştır.

1.6 Örnek Makale

Preckel, Götz, and Frenzel (2010) üstün zekalıların dahil olduğu tam zamanlı aktivitelerin öğrencilerin akademik benlik kavramları ve matematik derslerindeki sıkılma deneyimleri üzerindeki etkilerini araştırmışlardır. Bunu yaparken normal sınıftaki öğrencilerle de karşılaştırma yapmışlardır. Öğrenciler, okul yılının ilk yarısında üç kez öz bildirim anketleri ve bir IQ testi uygulanarak tekrarlı ölçümlerle değerlendirilmiştir. Aktivitelere katılan öğrencilerin akademik benlik algılarında ve matematik derslerinde sıkılma deneyimlerinde herhangi bir farklılık olup olmadığı zaman değişkenine bağlı olarak değişip değişmediği ilişkili örneklemler tek yönlü varyans analizi ile değerlendirilmiştir. Öğrencilerin akademik benliklerinin özel sınıflarda etkinliklere katıldıklarında farklılaştığına ulaşılmıştır (F = 3.56, p = .04, partial η2 = .02).

Kaynaklar

Girden, Ellen R. 1992. ANOVA: repeated measures. Quantitative applications in the social sciences. Newbury Park, Calif.: Sage Publications. http://catdir.loc.gov/catdir/enhancements/fy0655/91034563-t.html.
Mishra, Prabhaker, Chandra M Pandey, Uttam Singh, Anshul Gupta, Chinmoy Sahu, and Amit Keshri. 2019. “Descriptive Statistics and Normality Tests for Statistical Data.” Annals of Cardiac Anaesthesia 22 (1): 67–72. https://doi.org/10.4103/aca.ACA_157_18.
Pallant, Julie. 2020. SPSS Survival Manual: A Step by Step Guide to Data Analysis Using IBM SPSS. 7th ed. London: Routledge. https://doi.org/10.4324/9781003117452.
Preckel, Franzis., Thomas. Götz, and Anne. Frenzel. 2010. “Ability Grouping of Gifted Students: Effects on Academic Self-Concept and Boredom.” British Journal of Educational Psychology 80 (3): 451–72. https://doi.org/10.1348/000709909X480716.
Tabachnick, Barbara G., and Linda S. Fidell. 2013. Using Multivariate Statistics. Pearson Education.