Samet EKER¹, Hülya YILDIZLI²
¹ Doktora Öğrencisi, Hacettepe Üniversitesi, Eğitim Bilimleri A.B.D.,
Eğitimde Ölçme ve Değerlendirme
² Doç. Dr. İstanbul Üniversitesi-Cerrahpaşa, Eğitim Bilimleri A.B.D.,
Eğitim Programları ve Öğretim
Özet
…
GİRİŞ
Uluslararası Matematik ve Fen Eğilimleri Araştırması’nın (TIMSS) 2023 döngüsü, ulusal eğitim sistemlerinin COVID-19 sürecinden nasıl etkilendiğine dair benzersiz bir çerçeve sunmaktadır (Kuhfeld & Tarasawa, 2020; UNESCO, 2021). 2019 döngüsüne kıyasla, sekizinci sınıf öğrencilerinin ortalama matematik puanları katılımcı ülkelerin üçte ikisinden fazlasında düşüş göstermiştir (Mullis, Martin ve Erberber, 2024). Tarihsel olarak güçlü performanslarıyla tanınan eğitim sistemleri (Finlandiya, Hollanda, Japonya, Kanada) bile istatistiksel olarak anlamlı düşüşler kaydederek pandemiyle bağlantılı öğrenme kayıplarına ilişkin uluslararası endişeleri yoğunlaştırmıştır (OECD, 2023; Engzell, Frey ve Verhagen, 2021). Konuya ilişkin bazı araştırmalar, bu tür öğrenme kayıplarının zamanında tespit edilip analiz edilmemesi durumunda, bireylerin yaşam boyu daha düşük gelir elde etmesine ve ülke genelinde üretkenliğin azalmasına yol açabileceğini göstermektedir (Hanushek & Woessmann, 2020). Ancak TIMSS 2023 sonuçları, bazı eğitim sistemlerinin sadece başarı kayıplarını önlemekle kalmayıp aynı zamanda ölçülebilir düzeyde ilerleme sağladığını da göstermektedir. Türkiye bu durumun çarpıcı bir örneğidir. 2019 ve 2023 yılları arasında Türkiye’nin 8. sınıf matematik ortalaması 496’dan 509’a yükselerek ilk kez 500 olan uluslararası merkez noktasını aşmıştır (Milli Eğitim Bakanlığı [MEB], 2024). Dördüncü sınıf Türk öğrenciler de aynı şekilde matematikte 30, fen bilimlerinde 44 ölçek puanı kazanarak Türkiye’yi dünya çapında en çok gelişme gösteren ilk beş ülke arasında konumlandırmıştır (TIMSS & PIRLS International Study Center, 2024). Bu ilerlemeler, Türkiye’nin 2015-2019 döneminde 4. sınıf fen bilimlerinde 38 puanlık artış kaydettiği ve sosyoekonomik başarı farklarını azalttığı olumlu eğilimin devam ettiğini göstermektedir (Dünya Bankası, 2021). Daha da önemlisi, iyileşme sadece seçkin öğrencilerle sınırlı kalmamıştır: Türkiye’deki sekizinci sınıf öğrencilerinin yüksek veya ileri seviyelere ulaşma oranı 2011 ile 2023 yılları arasında iki katına çıkarken, düşük seviyenin altında puan alanların oranı dörtte bir oranında azalmıştır (MEB, 2024). Böylesine geniş tabanlı bir ilerleme, pandemi kesintilerinin kaçınılmaz olarak ülke içi eşitsizlikleri genişlettiği hipotezine ters düşmektedir (Reimers, 2022). Dolayısıyla Türkiye örneği, önemli bir ampirik soruyu gündeme getirmektedir: Türkiye’de hangi çok düzeyli faktörler, matematik alanındaki küresel başarı düşüşüne direnç göstererek bu eğilimin tersine çevrilmesini sağlamıştır? Bu faktörleri anlamak en az üç nedenle kritik öneme sahiptir. Birincisi, Türkiye büyük, orta gelirli ve hızlı reformlar gerçekleştiren bir eğitim sistemi olarak, öğrenme düzeylerini artırmak isteyen benzer ülkeler için potansiyel bir model sunmaktadır (Vegas & Alfaro, 2022). İkincisi, Türkiye’nin elde ettiği kazanımlarla ilişkili etkenlerin belirlenmesi, hangi reformların en yüksek etkiyi yarattığını ve ilerlemenin sürdürülebilmesi için hangi alanlarda ek müdahaleye ihtiyaç olduğunu ortaya koyarak ulusal politika süreçlerine katkı sağlayabilir (Fullan, 2021). Üçüncüsü, karşılaştırmalı eğitim alanında yapılan çağrılar, zorlu koşullara rağmen başarıyı sürdürebilen ya da artırabilen ‘dirençli’ sistemlerin incelenmesine ve bu stratejilerin diğer bağlamlara nasıl uyarlanabileceğine dair daha fazla kanıt sunulmasını gerekli kılmaktadır (Miks & McIlwaine, 2023; Schleicher, 2023). Eğitimde etkililiğe yönelik araştırmalar, öğrenci başarısının; öğrenci, sınıf ve okul düzeylerinde eşzamanlı olarak işleyen birbiriyle bağlantılı etkenler tarafından belirlendiğini tutarlı biçimde ortaya koymaktadır (Creemers & Kyriakides, 2008; Scheerens, 2016). Bireysel düzeyde, öğrencinin ön bilgisi gibi bilişsel özellikler; motivasyon, benlik algısı ve matematiğin faydasına yönelik inançlar gibi bilişsel olmayan faktörlerle etkileşerek katılımı ve öğrenmede kalıcılığı belirler (Marsh & Martin, 2011; Wigfield & Eccles, 2020). Uluslararası geniş ölçekli değerlendirmeler (ILSA), matematik özgüveninin öğrenci başarısıyla en güçlü ilişkili değişkenlerden biri olduğunu tutarlı şekilde ortaya koymaktadır (Scherer & Gustafsson, 2015). Türkiye’de yapılan bir çalışmada, Arıkan, van de Vijver ve Yağmur (2016), özgüvenin ve matematiğe verilen önemin, sosyoekonomik durum kontrol altına alındığında bile 8. sınıf TIMSS puanlarındaki varyansın üçte birinden fazlasını açıkladığını göstermiştir. Ayrıca düzenli derse devam, ödevlerin tamamlanması ve derse ayrılan zamanın artması, daha yüksek başarıyla ilişkilidir ve psikososyal değişkenlerin etkilerinde aracılık rolü oynamaktadır (Sulisworo, Dadang ve Rosmansyah, 2020). Öğretim düzeyinde, öğretmenlerin konuyu açık şekilde anlatması, sınıf içi etkileşim ve verilen geri bildirimin kalitesi, matematik başarısı üzerinde orta ila yüksek düzeyde etkili olmaktadır (Hattie, 2009; Nilsen, Gustafsson ve Blömeke, 2016). TIMSS’in bağlamsal verileri, öğretim kalitesinin uluslararası düzeyde başarıyla ilişkili yönlerini ölçmektedir. Bu yönler arasında, öğretmenlerin farklı çözüm yolları sunması ya da biçimlendirici değerlendirme yöntemlerini kullanma sıklığı yer almaktadır (Erberber, Arora ve Williams, 2012). Pandemi sonrası yapılan analizler, dijital araçlara erişim ve öğretmenlerin karma öğrenme süreçlerini yönetme becerilerinin, matematik öğrenme süresi üzerinde ek belirleyiciler haline geldiğini ortaya koymuştur (Li vd., 2023). Okul düzeyinde yapılan uzun süreli araştırmalar, okulun ortalama sosyoekonomik yapısı, akademik iklimi, disiplin düzeyi ve kaynak yeterliliğinin, öğrenci başarısını topluca etkilediğini ortaya koymuştur (Teddlie & Reynolds, 2000; Rumberger & Palardy, 2005). Sosyoekonomik açıdan avantajlı öğrencilerin yoğunlukta olduğu okullar, genellikle daha güçlü akran etkileri, daha düşük öğretmen sirkülasyonu ve daha yüksek düzeyde ebeveyn katılımı gösterir; bu unsurlar da genellikle daha yüksek başarı ile ilişkilidir (Caro & Mirazchiyski, 2021). Güvenli ve düzenli bir okul ortamı ise öğretim süresini artırarak ve öğrencilerin kaygı düzeyini azaltarak akademik başarıyı destekler (Thapa, Cohen, Guffey ve Higgins-D’Alessandro, 2013). TIMSS 2019 verilerine dayanan analizler, Türkiye’de akademik başarıya verilen önem ve disiplin sorunlarının düşük düzeyde olması gibi okul özelliklerinin, sosyoekonomik durumdan bağımsız olarak, daha yüksek matematik ortalamalarıyla anlamlı biçimde ilişkili olduğunu göstermiştir (Karaca ve Yıldırım, 2022). Mevcut güçlü literatüre rağmen, üç önemli boşluk dikkat çekmektedir. Birincisi, Türkiye’nin TIMSS 2019 sonrası performansını ele alan hakemli çalışmalar oldukça sınırlıdır. Bildiğimiz kadarıyla, 2023 veri setini gelişmiş hiyerarşik doğrusal modelleme (HLM) ile analiz eden ve eksik verileri çok düzeyli çoklu imputasyon yöntemiyle ele alan herhangi bir çalışma bulunmamaktadır. İkincisi, mevcut Türkiye odaklı TIMSS analizleri genellikle kesitsel olup, ya yalnızca öğrenci düzeyindeki ya da yalnızca okul düzeyindeki korelasyonlara odaklanmaktadır. Ancak bu iki düzeyi aynı anda modele dahil etmemek, iç içe geçmiş veri yapısını ihmal eder ve bu durum standart hata tahminlerini bozarak Tip I hata riskini artırabilir (Raudenbush & Bryk, 2002; Snijders & Bosker, 2012). Üçüncüsü, pandemi süreci okullar arasında farklı düzeylerde aksaklıklara yol açmıştır (örneğin, kapanma sürelerinin değişkenliği, dijital altyapı farkları). Ancak bu bağlamsal farklılıkların Türkiye’deki öğrenci başarı örüntülerine etkisine dair sistem düzeyinde bir analiz veya kanıt hâlâ mevcut değildir. Türkiye’nin TIMSS’teki yükseliş eğilimi, Eğitim Vizyonu 2023 girişimi kapsamında hayata geçirilen sistem düzeyindeki reformlarla aynı döneme denk gelmektedir. Bu reformlar; müfredatın yeterlilik temelli öğrenme doğrultusunda yeniden yapılandırılması, öğretmenlerin mesleki gelişim olanaklarının genişletilmesi, ölçme ve değerlendirme kapasitesinin güçlendirilmesi ve ülke genelinde telafi programlarının uygulanmasına öncelik vermiştir (MEB, 2020). 2018–2023 yılları arasında Milli Eğitim Bakanlığı, Eğitim ve Bilişim Ağı’nın (EBA) öğrenci ve öğretmenler tarafından kullanımını artırmış, uyarlanabilir öğrenme yazılımlarını devlet okullarında uygulamaya koymuş ve öğretmenlerin yıllık hizmet içi eğitim süresini 38 saatten 92 saate yükseltmiştir (Dünya Bankası, 2021). Bunun yanı sıra, sınıf mevcutlarının azaltılması, fen laboratuvarlarının iyileştirilmesi ve geniş bant internet erişiminin sağlanması gibi hedefli yatırımlar özellikle Güneydoğu Anadolu’daki düşük SES’li bölgelere yönlendirilmiştir (Avrupa Eğitim Vakfı, 2022). Betimleyici raporlar bu reformları TIMSS’teki başarı artışıyla ilişkilendirse de, çok düzeyli ve titiz analizler yapılmadıkça bu ilişkilere dair nedensel çıkarımlar spekülatif olmaya devam etmektedir. Bu çalışma, Türkiye’nin 8. sınıf matematik başarısı ile ilişkili faktörlerin kapsamlı bir çok düzeyli araştırmasını yapmak için TIMSS 2023 veri setinden yararlanmaktadır. Aşağıdaki araştırma sorularını ele almak için HLM uygulayarak 140 okulda iç içe geçmiş 4.859 öğrenciden elde edilen veriler analiz edilmiştir. 1. Öğrenci düzeyindeki demografik, sosyo-ekonomik ve psikososyal özellikler Türkiye’de TIMSS 2023 matematik başarısını nasıl yordar? 2. Okul düzeyindeki akademik vurgu, kaynak yeterliliği ve disiplin iklimi, öğrenci düzeyindeki faktörlerin ötesinde matematik başarısını nasıl etkiler? 3. Tüm öğrenci ve okul düzeyindeki değişkenler, matematik başarısındaki okul içi ve okullar arası varyansın ne kadarını açıklar? Bu çalışma, yalnızca temel araştırma sorularıyla sınırlı kalmayıp, aynı zamanda metodolojik düzeyde de katkı sunmaktadır. Arka plan anketlerinde sıkça karşılaşılan eksik yanıtları ele almak amacıyla çok düzeyli çoklu imputasyon (MMI) yöntemi benimsenmiştir (Enders, 2022). Geleneksel tek düzeyli imputasyon yöntemleri, iç içe geçmiş veri yapısında varyans bileşenlerini bozma riski taşırken, MMI hem okul içi hem de okullar arası değişkenliği koruyarak daha doğru tahminler sağlar (Grund, Lüdtke & Robitzsch, 2019). Bu çalışmada, her biri beş makul değer (PV) içeren başarı kümeleri için beş ayrı imputasyon uygulanarak, toplamda 25 çoklu imputasyonlu veri kümesi oluşturulmuştur. Bu yaklaşım, büyük ölçekli değerlendirme analizlerinde nadiren kullanılsa da, en iyi uygulamalarla uyumlu bir stratejidir (von Davier, Khorramdel & Haberman, 2021). Araştırma, politika bağlamı, psikolojik kuram ve gelişmiş çok düzeyli modellemeyi bütünleştirerek eğitim araştırmaları alanına çok yönlü katkılar sunmaktadır. Türkiye’nin yükselen performansı, pandemi sonrası toparlanmaya çalışan eğitim sistemleri için aktarılabilir dersler içermektedir. Öğrenci, öğretim ve okul düzeyindeki faktörlerin eşzamanlı olarak modellenmesi ise başarıyı etkileyen unsurlar hakkında daha derin ve bütüncül bir anlayış sunar. Ayrıca, HLM ile MMI ve PV entegrasyonunun birlikte uygulanması, geçerliliği artıran ve diğer uluslararası değerlendirmelerde de tekrarlanabilir nitelikte bir analitik yaklaşım örneklemektedir. Sonuç olarak, bu çalışma; öğrenci motivasyonunu artırmaya yönelik programlar, okul iklimini iyileştirme girişimleri ve kaynakların daha adil dağıtımına ilişkin mekanizmalar gibi politika kaldıraçlarını belirleyerek, Türkiye’deki performans artışını sürdürebilecek ve benzer uluslararası bağlamlara da ilham verebilecek kanıta dayalı karar süreçlerine katkı sağlamayı amaçlamaktadır.
2. KURAMSAL ÇERÇEVE
…
3. YÖNTEM
3.1. Araştırma Modeli
Bu araştırmada, çok düzeyli veri yapısına sahip TIMSS 2023 Türkiye sekizinci sınıf örneklemi kullanılarak, öğrencilerin matematik başarılarını etkileyen bireysel ve bağlamsal değişkenler incelenmiştir. Bağımlı ve bağımsız değişkenler arasındaki ilişkileri inceleyen modellerin kurulması ve karşılaştırılmasını içerdiğinden ilişkisel tarama ile desenlenmiştir (Büyüköztürk et al., 2014; Fraenkel et al., 2012). Araştırma modeli, öğrencilerin belirli okullar içinde kümelendiği hiyerarşik veri yapısına uygun olarak hiyerarşik doğrusal modelleme yaklaşımıyla yapılandırılmıştır. Bu model, bağımlı değişkenin birey düzeyinde yer aldığı, açıklayıcı değişkenlerin ise hem birey hem de grup (okul) düzeylerinde tanımlandığı çok düzeyli yapıları analiz etmek için uygundur. Çalışmada, öğrencilerin aynı okul ortamında benzer pedagojik, yönetsel ve çevresel koşullara maruz kalmaları nedeniyle başarı puanlarının birbirine benzemesi olasılığı dikkate alınmış; bu nedenle klasik regresyon yaklaşımlarının yetersiz kalacağı öngörülerek HLM tercih edilmiştir. Nitekim, varyansın anlamlı bir bölümünün okul düzeyinde toplandığı durumlarda çok düzeyli modelleme, analiz sonuçlarının geçerliliğini ve güvenirliğini artırmaktadır (Şen, 2022).
3.2. Çalışma Grubu
Analizlerde, International Association for the Evaluation of Educational Achievement’ın (IEA) çevrimiçi uluslararası veritabanı üzerinden erişilen TIMSS 2023 Türkiye sekizinci sınıf verisi kullanılmıştır. IEA IDB Analyzer 5.0 sürümü yardımıyla, öğrenci ve okul anketlerinden seçilen değişkenler birleştirilmiş; veri, R ortamına uygun formata dönüştürülmüştür. Başlangıçta 4925 öğrenci ve 141 okul analiz kapsamına alınmış, varsayımların konrolü sonrası sonrası nihai örneklem 140 okul, 4859 öğreIcden oluşmuştur.
3.3. Bağımsız Değişkenler
Bu araştırmada kullanılan bağımsız değişkenler iki düzeyde yapılandırılmıştır. Birinci düzeyde (öğrenci), demografik, sosyo-ekonomik ve kültürel, psikososyal, öğrenme ve öğretim süreci ile teknoloji alanlarına ilişkin değişkenler yer almaktadır. Demografik değişken olarak cinsiyet kullanılmıştır. Sosyo-ekonomik ve kültürel faktörleri temsilen ulaşılması beklenen eğitim düzeyi ve evdeki eğitim kaynakları değişkenleri modele dahil edilmiştir. Psikososyal alan kapsamında, öğrencilerin matematikte kendine güveni, okul aidiyeti hissi, zorbalığın olmaması, matematik öğrenmeyi sevme ve matematiğe değer verme değişkenleri yer almaktadır. Öğrenme ve öğretim süreciyle ilişkili olarak, öğrencilerin matematik dersinde bireysel çalışma yapma sıklığı, öğretmenlerin ödev verme sıklığı, öğretimsel açıklık ve sınıf ortamındaki düzensiz davranışlar dikkate alınmıştır. Ayrıca, öğrencilerin dijital öz-yeterlik düzeylerini yansıtan bir teknoloji değişkeni de modele eklenmiştir. İkinci düzeyde (okul) ise bağlamsal etkileri temsil eden, yönetici anketlerinden üç değişken tanımlanmıştır: okullarda akademik başarıya verilen önem, kaynak eksikliğinden etkilenmeme ve okul disiplin anlayışı. Bu değişkenler, okulun yapısal ve kültürel özelliklerini temsil etmektedir.
3.4. Bağımlı Değişken
Bu çalışmada, TIMSS 2023 Türkiye sekizinci sınıf öğrencilerinin matematik başarı puanları bağımlı değişken olarak ele alınmıştır. TIMSS, öğrencilerin matematik alanındaki bilgi ve becerilerini ölçen uluslararası bir sınavdır. Bu sınav, öğrencilerin matematikteki temel kavramları anlama, problem çözme becerilerini kullanma, matematiksel düşünme ve akıl yürütme yeteneklerini sergileme düzeylerini değerlendirmektedir. TIMSS 2023’te öğrencilerin matematik başarıları beş olasılıklı değer (plausible value) üzerinden ölçülmüştür.
3.5. Verilerin Analizi
Veri analizine kayıp veri kontrolü ile başlanmıştır. Ölçeklere ait verisi olmayan 5031 numaralı okul ve ilgili öğrenciler veri setinden çıkarılmış ve nihai analiz örneklemi bu şekilde elde edilmiştir. “Ödev Verilme Sıklığı” ve “Matematik Dersinde Bireysel Çalışma” değişkenleri, başarı puanlarıyla aynı yönde yorumlanabilmesi amacıyla ters kodlanmıştır. Ters kodlama sonrasında bu değişkenlerde yüksek puanlar, daha sık ödev verildiğini ve öğrencilerin derslerde daha fazla bireysel çalıştığını göstermektedir.
Araştırma verilerinde eksiklik desenini değerlendirmek amacıyla Little’ın MCAR testi uygulanmıştır. Elde edilen sonuçlara göre test istatistiği anlamlı bulunmuştur (χ²(1936) = 2983.41, p < .001). Bu sonuç, verilerin tamamen rastgele eksik olmadığını ve eksiklik deseninin sistematik bir örüntüye sahip olabileceğini göstermektedir. Veri seti çok düzeyli bir yapıya sahip olduğundan, eksik veriler çok düzeyli çoklu atama (Multilevel Multiple Imputation; MMI) yöntemiyle işlenmiştir. Bu yaklaşım, eksikliğin hem birey düzeyindeki hem de grup düzeyindeki varyansını dikkate alarak güvenilir ve önyargısız tahminler üretmektedir. Literatürde, MMI yönteminin çok düzeyli modellerde eksik verilerin ele alınmasında geçerli ve etkili olduğu çeşitli çalışmalarla ortaya konmuştur (Carpenter & Goldstein, 2004; Grund et al., 2019; Quartagno & Carpenter, 2020). Veri setinde yer alan her bir olasılığa dayalı matematik puanı (PvMath) için ayrı ayrı atama işlemi gerçekleştirilmiştir. Her PvMath seti için 5 yineleme kullanılarak çok düzeyli çoklu atama uygulanmış, böylece PvMath çeşitliliğiyle birleştirildiğinde toplam 25 tamamlanmış veri seti elde edilmiştir. Bu iki düzeyli çoklu tamamlama yapısı, ölçüm hatası ve eksiklik belirsizliğinin entegre şekilde modele katılmasını sağlamaktadır ve büyük ölçekli değerlendirme verilerinde sınırlı sayıda uygulamayla temsil edilmektedir (OECD, 2017; von Davier et al., 2009). Her tamamlanmış veri seti üzerinde çok düzeyli modeller tahmin edilmiş ve elde edilen tahminler Rubin’in birleşim kuralları kullanılarak tek bir sonuca havuzlanmıştır (Rubin, 1987). Bu yöntem, varyans bileşenlerini doğru yansıtarak eksik veriye bağlı belirsizliğin modele entegrasyonunu sağlar (Enders, 2010; Lüdtke et al., 2017).
Çok düzeyli doğrusal modellerin geçerli sonuçlar üretmesi için bunların dışında bazı temel istatistiksel varsayımların da sağlanması gerekmektedir (Raudenbush & Bryk, 2002; Snijders & Bosker, 2012, Şen, 2022). Bağımlı değişken ile bağımsız değişkenler arasındaki ilişkinin doğrusal olduğu varsayılmıştır. Her bir sürekli değişken için artık (residual) grafikleri incelenmiş ve eğrisel bir örüntüye rastlanmamıştır. Öğrenci düzeyindeki hata terimlerinin birbirinden bağımsız olduğu varsayılmıştır. Null Model üzerinden elde edilen ICC değeri (ICC = 0.338), öğrenci puanları arasında okul kaynaklı bağımlılık olduğunu doğrulamaktadır. Bu bağlamda çok düzeyli modelleme uygun bir tercihtir (Hox et al., 2017). Artıkların varyansının her düzeyde sabit olduğu varsayımı, düzey 1 ve düzey 2 için ayrı ayrı test edilmiştir. Artıkların okul bazında dağılımı görsel olarak incelenmiş ve ciddi bir varyans heterojenliği gözlenmemiştir. Öğrenci düzeyindeki bağımsız değişkenler için VIF değerleri hesaplanmıştır. Tüm değişkenlerin VIF değerleri 5’in altında kalmış, bu da multikolinearite riskinin düşük olduğunu göstermiştir (Kutner et al., 2005). Hem artıklar hem de rastgele etkiler için çok değişkenli normal dağılım varsayımı görsel (Q–Q grafikleri) ve istatistiksel (Henze-Zirkler testi) yollarla test edilmiştir. Rastgele etkilerde gözlenen hafif sapmalar, MLR tahmin yöntemiyle telafi edilmiştir; bu yöntem, özellikle 50’den fazla grup içeren modellerde küçük normalite sapmalarına karşı dayanıklıdır (Muthén & Asparouhov, 2014). TIMSS 2019 veri seti, çok aşamalı rastgele örnekleme yöntemiyle toplandığı için, örneklemin genellenebilirlik açısından temsili olduğu kabul edilmiştir. Bu varsayımların çoğu analiz öncesinde doğrudan test edilmiş, bazıları ise model yapısı ve kullanılan robust tahmin yöntemi (MLR) sayesinde dolaylı olarak kontrol altına alınmıştır. Böylece, kurulan modellerin istatistiksel geçerliliği güvence altına alınmıştır.
Öğrenci ve okul düzeyindeki tüm değişkenler, analiz öncesinde anlamlı yorum yapılabilmesi ve çok düzeyli modellerin yorumlanabilirliğinin artması amacıyla merkezileştirilmiştir. Öğrenci düzeyindeki sürekli değişkenler, ait oldukları okulun ortalamasına göre merkezlenmiş ve bu yolla grup-ortalaması merkezleme (group-mean centering) uygulanmıştır. Bu yöntem, düzey-1 (öğrenci düzeyi) değişkenlerinin etkilerini düzey-2 (okul düzeyi) etkilerinden istatistiksel olarak ayırma olanağı sağlayarak yorum gücünü ve modelin iç geçerliliğini artırır (Enders & Tofighi, 2007). Bu merkezleme sonucunda elde edilen katsayılar, öğrencilerin kendi okulları içerisindeki göreli konumlarının etkisini yansıtır. Grup-ortalaması ile genel ortalama merkezleme (grand-mean centering), farklı teorik anlamlara ve yorumlara sahiptir; bu nedenle düzey-1 değişkenlerinde grup-ortalaması tercih edilmiştir (Enders & Tofighi, 2007; Lüdtke et al., 2008). Öte yandan, okul düzeyindeki sürekli değişkenler tüm örneklem ortalamasına göre merkezlenmiş, yani genel ortalama merkezleme yöntemi uygulanmıştır. Bu yaklaşım, düzey-2 regresyon katsayılarının yorumunu kolaylaştırmakta ve ilgili okul değişkeninin ortalama bir okula kıyasla daha yüksek ya da düşük düzeyde olmasının etkisini ortaya koymaktadır. İkili (0/1) biçiminde kodlanmış olan cinsiyet değişkeni (ITSEX) ise, merkezleme uygulandığında yorumlanabilirliğini yitirebileceğinden, merkezlenmemiş olarak modele dahil edilmiştir. Bu yöntem, kategorik değişkenlerde önerilen uygulamalarla tutarlıdır (Raudenbush & Bryk, 2002).
TIMSS verilerinin kompleks örneklem yapısını dikkate alabilmek için analizlerde örneklem ağırlıkları kullanılmıştır. Öğrenci düzeyinde toplam öğrenci ağırlığı (TOTWGT) ve okul düzeyinde okul ağırlığı (SCHWGT) olmak üzere iki seviyeli ağırlıklandırma uygulanmıştır. Büyük ölçekli değerlendirmelerde ağırlıkların kullanımı, örneklem tasarımından kaynaklanan olasılık farklılıklarını dengeleyerek tahminlerin hedef evreni temsil etmesini sağlar ve olası yanlılığı engeller (Huang, 2024; Joncas, 2007). Nitekim TIMSS teknik raporları ve ilgili literatür, popülasyona genellenebilir bulgular elde edebilmek için ağırlık kullanımını önermektedir (IEA, 2023). Tüm istatistiksel analizler Mplus version 8.4 yazılımı kullanılarak gerçekleştirilmiştir. Mplus, birden fazla veri setiyle çoklu atama sonuçlarını otomatik olarak birleştirme ve iki düzeyli karma modelleri ağırlıklı verilerle tahmin etme kapasitesine sahiptir. Modeller robust maksimum olabilirlik yöntemiyle tahmin edilmiştir. Analiz sonuçları sunulurken %95 güven aralıkları raporlanmış, böylece katsayıların istatistiksel anlamlılık düzeyleri güven aralıklarının sıfır değerini içerip içermemesine göre yorumlanmıştır.
3.6. Model Kurulumu
Bu çalışmada, TIMSS 2019 verilerinin çok düzeyli yapısı dikkate alınarak üç aşamalı bir hiyerarşik doğrusal model (HLM) yapılandırılmıştır. Kurulan modeller, varyans bileşenlerinin öğrenci ve okul düzeylerinde nasıl dağıldığını analiz etmek, bağımlı değişken üzerindeki bireysel ve bağlamsal etkileri ayrıştırmak ve bu etkileri sistematik olarak test etmek amacıyla kademeli şekilde geliştirilmiştir (Raudenbush & Bryk, 2002; Hox et al., 2017).
3.6.1. Model 1 – Null Model (Boş Model)
İlk modelde herhangi bir açıklayıcı değişken yer almamaktadır. Bu model, toplam varyansın ne kadarının öğrenci düzeyinden ve ne kadarının okul düzeyinden kaynaklandığını belirlemek amacıyla oluşturulmuştur. Bu modelden elde edilen Sınıf İçi Korelasyon Katsayısı (ICC), öğrencilerin performans puanları üzerindeki okul etkisinin büyüklüğünü değerlendirmek için kullanılmıştır.
\[ Y_{ij} = \beta_{0j} + e_{ij} \]
\[ \beta_{0j} = \gamma_{00} + u_{0j} \]
3.6.2. Model 2 – Öğrenci Düzeyi Modeli
İkinci modelde yalnızca öğrenci düzeyindeki açıklayıcı değişkenler (düzey-1 değişkenleri) eklenmiştir. Bu model ile bireysel özelliklerin başarı üzerindeki etkileri test edilmiştir. Tüm eğimler sabit (fixed slopes) olarak tanımlanmıştır, yani öğrenci düzeyindeki etkilerin okuldan okula değiştiği varsayılmamıştır. Bu model, bireysel düzeydeki varyasyonun açıklanma düzeyini ölçmeyi amaçlamaktadır.
\[ Y_{ij} = \beta_{0j} + \sum_{p=1}^{P} \beta_{pj}X_{pij} + e_{ij} \]
3.6.3. Model 3 – Tam Model (Öğrenci ve Okul Düzeyi)
Üçüncü ve nihai model, hem öğrenci hem de okul düzeyindeki değişkenleri aynı anda içerir. Bu model ile öğrenci düzeyindeki bireysel farklılıkların yanı sıra, okul bağlamındaki değişkenlerin genel ortalamalar üzerindeki etkileri analiz edilmiştir. Eğriler sabit tutulmuş; okul düzeyindeki değişkenler sadece sabit terim (intercept) üzerine etkide bulunacak şekilde yapılandırılmıştır. Bu yaklaşım, çok düzeyli modellemede bağlamsal etkilerin (contextual effects) modellenmesinde yaygın olarak kullanılan bir yapıdır (Snijders & Bosker, 2012).
\[ \beta_{0j} = \gamma_{00} + \sum_{q=1}^{Q} \gamma_{0q} Z_{qj} + u_{0j} \]
Öğrenci düzeyindeki eğimler sabit tutulduğundan, \(\beta_{pj} = \gamma_{p0}\) şeklinde tanımlanmıştır.
Bu üç aşamalı yapı, önce temel varyans yapısının tanımlanmasına, ardından bireysel ve bağlamsal etkilerin kademeli olarak test edilmesine olanak tanımıştır. Çapraz düzey etkileşimler dahil edilmemiştir çünkü okul düzeyindeki değişkenlerin öğrenci düzeyindeki etkileri sistematik olarak değiştireceğine dair teorik bir beklenti bulunmamaktadır. Ayrıca, örneklem yapısı ve model parsimony’si göz önünde bulundurularak sabit eğimli (fixed slope) modeller tercih edilmiştir (Hox et al., 2017).
4. BULGULAR
4.1. Betimsel İstatistikler
TIMSS 2023 Türkiye sekizinci sınıf örneklemi kapsamında analiz edilen matematik başarı puanlarına ilişkin betimsel istatistikler, beş olasılıklı değer üzerinden hesaplanmıştır. Ortalama değerler 504–506 arasında değişmekte olup, standart sapmalar 111 ile 114 arasındadır. Çarpıklık ve basıklık değerleri ±1 sınırları içinde yer almakta, bu durum dağılımın yaklaşık olarak normal olduğunu göstermektedir. Öğrencilerin büyük bir kısmının matematikte ortalama düzeyde başarı sergilediği, ancak bireysel düzeyde geniş bir başarı dağılımı bulunduğu görülmektedir (Tablo 2). Bu durum, matematik performansına ilişkin analizlerde yalnızca ortalama puanlara değil, dağılımın yapısına da duyarlı modelleme yapılması gerektiğini göstermektedir.
Öğrenci ve okul düzeyindeki yordayıcı değişkenlere ilişkin betimsel istatistikler incelendiğinde, dağılımlar genellikle normal eğrinin kabul edilebilir sınırları içinde yer almaktadır. Özellikle okul düzeyindeki değişkenlerin dağılımı daha homojen görünmekte, bu da model varsayımlarını desteklemektedir (Tablo 3). Bu yapı, çok düzeyli modelleme için uygun bir temel sunmakta; öğrenciler arası ve okullar arası farklılıkların anlamlı şekilde çözümlenebileceğini göstermektedir.
4.2. Model Sonuçları
4.2.1. Null Model (Model 1)
İlk modelde herhangi bir yordayıcı değişken yer almamaktadır. Sabit terim 492.879 (SE = 8.468, p < .001) olarak tahmin edilmiştir. Öğrenci düzeyi hata varyansı\[\sigma^2_e = 8978.739\], okul düzeyindeki varyans bileşeni ise\[\sigma^2_{u0} = 4695.719\] olarak hesaplanmıştır. Bu modelde, öğrenci düzeyindeki varyansın okul düzeyindeki varyansa oranı (Sınıf İçi Korelasyon Katsayısı; ICC) aşağıdaki gibi hesaplanmıştır:
\[ ICC = \frac{\sigma^2_{u0}}{\sigma^2_{u0} + \sigma^2_e} = \frac{4695.719}{4695.719 + 8978.739} \approx 0.343 \]
Bu oran, toplam varyansın %34.3’ünün okul düzeyinden kaynaklandığını ve çok düzeyli modellemenin uygun bir yaklaşım olduğunu göstermektedir. Bu bulgu, öğrenciler arası başarı farklılıklarının yalnızca bireysel değil, aynı zamanda bağlamsal (okul) düzeyde de anlamlı olduğunu ortaya koymaktadır.
4.2.2. Model 2: Öğrenci Düzeyi Açıklayıcı Değişkenler
Model 2’de yalnızca bireysel (1. düzey) değişkenler modele dâhil edilmiştir. Modelin sabit terimi 480.615 (SE = 10.631, p < .001) olarak tahmin edilmiştir. Bu modelde öğrenci düzeyi varyansı anlamlı ölçüde azalarak σ²ₑ = 5348.141’e düşmüştür. Buna karşılık, okul düzeyindeki varyans σ²ᵤ₀ = 4853.564 olup istatistiksel olarak anlamlı kalmıştır. Model 2, bireysel düzeydeki değişkenlerin açıklayıcı gücünü ortaya koymakla birlikte, okul düzeyindeki varyansı doğrudan hedeflememektedir.
Modelde yer alan bazı değişkenlerin matematik başarısına etkisi özellikle dikkat çekicidir. Matematik dersinde bireysel çalışma yapma (β = 31.584, p < .001), öğrencinin ulaşmayı beklediği eğitim düzeyi (β = 18.945, p < .001) ve matematikte kendine güven (β = 12.505, p < .001) gibi değişkenler pozitif ve anlamlı yönde başarıyı yordamaktadır. Bunun yanı sıra, okul aidiyeti hissi (β = -6.041, p < .001), ödev sıklığı (β = -10.671, p < .001) ve matematik öğrenmeyi sevme (β = -4.146, p < .05) değişkenlerinin negatif yönlü ve anlamlı etkileri dikkat çekmektedir. Bu bulgular, öğrenci deneyimlerinin karmaşık yapısını ve bazı öğrenme tutumlarının başarı üzerindeki doğrudan etkilerinin beklenenin aksine işleyebileceğini göstermektedir.
Model 2, öğrenci düzeyinde varyansın %40.4’ünü açıklamakta olup (R²_within = .404), bireysel özelliklerin başarı üzerindeki güçlü etkisini ortaya koymaktadır. Buna karşın, yalnızca birey düzeyine ait açıklayıcı değişkenler kullanıldığından, okul düzeyindeki varyansta anlamlı bir azalma gözlenmemiştir. Hatta okul düzeyindeki varyansın sınırlı da olsa artış göstermesi nedeniyle hesaplanan R²_between değeri negatif çıkmıştır (–.034). Literatürde bu tür sonuçlar, çok düzeyli modellemenin doğası gereği mümkündür ve daha önce Snijders ve Bosker (2012) ile Lüdtke ve arkadaşları (2009) tarafından da teorik olarak açıklanmıştır. Özellikle üst düzey değişkenlerin modele dahil edilmediği, ancak birey düzeyindeki açıklayıcıların varyans dağılımını etkilediği durumlarda bu tür negatif varyans açıklama değerleri ortaya çıkabilmektedir. Bu bağlamda, Model 2’nin temel katkısı, birey düzeyindeki psikososyal, demografik ve öğrenme süreçlerine ilişkin değişkenlerin başarı üzerindeki belirleyici etkilerini ortaya koymasıdır. Modelin okul düzeyindeki varyansı açıklamada yetersiz kalması, daha üst düzey değişkenlerin modele dahil edilmesiyle elde edilecek katkının önemine işaret etmektedir. Model 2’ye ait regresyon denklemi aşağıdaki gibidir:
\[ Y_{MATH_{ij}} = 480.615 + \beta_{1j} \cdot ITSEX_{ij} + \beta_{2j} \cdot EXPEDU_{ij} + \beta_{3j} \cdot HER_{ij} + \beta_{4j} \cdot SCM_{ij} + \beta_{5j} \cdot SSB_{ij} + \beta_{6j} \cdot SB_{ij} + \beta_{7j} \cdot SLLM_{ij} + \beta_{8j} \cdot WOYO_{ij} + \beta_{9j} \cdot HMWRK_{ij} + \beta_{10j} \cdot DSE_{ij} + e_{ij} \]
4.2.3. Model 3: Öğrenci ve Okul Düzeyi Açıklayıcı Değişkenler
Model 3, bireysel (1. düzey) değişkenlere ek olarak okul düzeyinde (2. düzey) bağlamsal özellikleri de modele dahil ederek çok düzeyli yapının tamamını yansıtmaktadır. Sabit terim 484.738 (SE = 10.067, p < .001) olarak tahmin edilmiştir. Bu modelde öğrenci düzeyi varyansı σ²ₑ = 5349.626, okul düzeyi varyansı ise σ²ᵤ₀ = 2708.622 olarak hesaplanmıştır.
Modelin açıklayıcılık gücü, Snijders ve Bosker (2012) yaklaşımına göre değerlendirildiğinde, toplam varyansın yaklaşık %41.1’inin bu model tarafından açıklandığı görülmektedir. Bu sonuç aşağıdaki şekilde hesaplanmıştır:
\[ R^2_{total} = \frac{(8978.739 + 4695.719) - (5349.626 + 2708.622)}{8978.739 + 4695.719} = \frac{13674.458 - 8058.248}{13674.458} \approx 0.411 \]
Ayrıca, modelin okul düzeyindeki varyansı açıklama gücü dikkate değerdir. Boş modelde 0.343 olan ICC değeri bu modelde 0.336’ya düşmüştür. Bu küçük azalma, okul düzeyine ait açıklayıcı değişkenlerin varyansı anlamlı düzeyde açıkladığını göstermektedir. Snijders ve Bosker (2012), varyans bileşenlerindeki bu tür düşüşlerin, üst düzey yordayıcıların modele katkısının göstergesi olduğunu ifade etmektedir.
Modelde yer alan bağlamsal değişkenlerden okulun akademik başarıya verdiği önem (β = 16.880, p < .001) en güçlü yordayıcıdır. Bu bulgu, okul kültürü ve akademik beklentilerin öğrencilerin bireysel performanslarını etkileyen önemli faktörler olduğunu ortaya koymaktadır. Ayrıca, kaynak eksikliğinden etkilenmeme değişkeni de (β = 8.284, p < .05) anlamlı ve pozitif bir yordayıcı olarak öne çıkmaktadır. Buna karşın, okul disiplin anlayışı değişkeni modelde istatistiksel olarak anlamlı bir etki göstermemiştir (p > .05). Model 3’e ait okul düzeyi regresyon denklemi aşağıdaki biçimde ifade edilebilir:
\[ \beta_{pj} = 484.738 + \gamma_{p1} \cdot SEAS_j + \gamma_{p2} \cdot IAMRS_j + \gamma_{p3} \cdot SD_j + u_{pj} \]
Bu modelin bulguları, okul ortamına ilişkin yapısal ve kültürel değişkenlerin yalnızca öğrencilerin algılarıyla değil, aynı zamanda akademik başarılarıyla da anlamlı biçimde ilişkili olduğunu göstermektedir. Özellikle bağlamsal etkilerin okul düzeyindeki varyansın %42.3’ünü açıklaması (R²_between = 0.423), bu tür değişkenlerin modelde yer almasının önemli ve gerekli olduğunu ortaya koymaktadır. Tüm modellere ait tahmin edilen parametreler, standart hatalar ve anlamlılık düzeyleri ayrıntılı biçimde Tablo 4’te sunulmuştur.
4.3. Model Karşılaştırması
Çok düzeyli modellerin karşılaştırılmasında Loglikelihood, AIC (Akaike Information Criterion), BIC (Bayesian Information Criterion) ve SABIC (Sample-size Adjusted BIC) bilgi kriterleri temel alınarak modellerin uyum kalitesi değerlendirilmiştir. Tablo 5’te yer alan karşılaştırmalı değerlere göre, her yeni modelle birlikte bu kriterlerde belirgin azalmalar gözlenmiştir. Bu azalmalar, modele eklenen açıklayıcı değişkenlerin yalnızca istatistiksel olarak anlamlı olmadığını, aynı zamanda modelin genel uyumunu da önemli ölçüde geliştirdiğini göstermektedir.
Özellikle Model 3’ün tüm bilgi kriterlerinde en düşük değerlere sahip olması, birey ve bağlam düzeyindeki değişkenlerin birlikte ele alındığı bu modelin, öğrenci başarısını yordamada en yüksek uyum kalitesine sahip olduğunu ortaya koymaktadır. Bu bulgu, model karmaşıklığının artırılmasının –örneğin üst düzey bağlamsal değişkenlerin eklenmesiyle– aşırı uyum (overfitting) riskine yol açmadan modelin hem açıklayıcılığını hem de istatistiksel güvenilirliğini güçlendirdiğini göstermektedir.
Model 1 ile Model 2 arasında BIC değerinde 2308 birimlik azalma ve Model 2’den Model 3’e geçişte 91 birimlik ek azalma gerçekleşmiştir. Bu farklar, Raftery’nin (1995) önerdiği sınıflandırmaya göre ΔBIC > 10 eşiğini aşarak, model iyileşmeleri lehine “çok güçlü kanıt” düzeyinde kabul edilmektedir. Bu nedenle Model 3, veriye en iyi uyum sağlayan model olarak değerlendirilmektedir. Ayrıca, bu bulgu modelde yer alan değişkenlerin yalnızca sayıca değil, içerik bakımından da anlamlı ve katkı sunan unsurlar olduğunu desteklemektedir (Snijders & Bosker, 2012; Raudenbush & Bryk, 2002).
Model karşılaştırma sonuçları Tablo 5’te görsel olarak sunulmuştur.
5. TARTIŞMA
…
6. Implications for Practice and Policy
…
7. Limitations and Future Research
…
Kaynaklar
Lüdtke, O., Marsh, H. W., Robitzsch, A., Trautwein, U., Asparouhov, T., & Muthén, B. (2009). The multilevel latent covariate model: A new, more reliable approach to group-level effects in contextual studies. Psychological Methods, 14(3), 203–229. https://doi.org/10.1037/a0015038
Raudenbush, S. W., & Bryk, A. S. (2002). Hierarchical linear models: Applications and data analysis methods (2nd ed.). Sage.
Raftery, A. E. (1995). Bayesian model selection in social research. Sociological Methodology, 25, 111–163. https://doi.org/10.2307/271063
Enders, C. K. (2010). Applied missing data analysis. Guilford Press.
Enders, C. K., & Tofighi, D. (2007). Centering predictor variables in cross-sectional multilevel models: A new look at an old issue. Psychological Methods, 12(2), 121–138. https://doi.org/10.1037/1082-989X.12.2.121
Hox, J. J., Moerbeek, M., & van de Schoot, R. (2017). Multilevel analysis: Techniques and applications (3rd ed.). Routledge. Huang, F. (2024). Sample weights in large-scale assessments: A review of the literature and recommendations for practice. Educational Measurement: Issues and Practice, 43(1), 3–15. https://doi.org/10.1111/emip.12445 Joncas, M. (2007). Sample design and weighting in the TIMSS 2007 assessment. In M. O. Martin, I. V. Mullis, & S. J. Chrostowski (Eds.), TIMSS 2007 technical report (pp. 1–36). TIMSS & PIRLS International Study Center, Boston College. IEA. (2023). TIMSS 2019 user guide for data files and research (Version 3.0). International Association for the Evaluation of Educational Achievement. https://timssandpirls.bc.edu/timss2019/user-guide.html Huang, F. (2024). Sample weights in large-scale assessments: A review of the literature and recommendations for practice. Educational Measurement: Issues and Practice, 43(1), 3–15. https://doi.org/10.1111/emip.12445