OpenIntro’da incelememiz gereken ilk bölümde, iki sürekli değişken
arasındaki ilişkiyi nasıl göreceğimizle başladık. X ekseninde bağımsız,
Y ekseninde bağımlı değişken olacak şekilde saçılım grafiği kurmayı ve
noktaların yoğunluk ve kümelenmelerine göre ilişkinin yönünü ve biçimini
yorumlamayı öğrendim. Değişkenleri sınıflara bölmek için
cut() ile yeni kategorik değişken oluşturuğ, kutu
grafikleri ve jitter ile bakmak yorumlamayı daha kolay hale getiriyor o
yüzden sadece denkleme bakmak yeterli değil, mutlaka görselleştirmek
gerekiyor. Büyük verilerde de logaritma dönüşümü log() ve
scale_x/y_log10() ile eksenleri dönüştürüp ilişkiyi daha
okunur hale getirebileceğimiziöğrendim.
İkinci bölüm korelasyon hakkındaydı. Bu bölümdeki ana tema bence
korelasyonun tek başına neden sonuç anlamına gelmeyeceği
olmalı.cor()fonksiyonunu kullanarak Pearson korelasyonunu
hesaplarken eksik değerleri use="pairwise.complete.obs"
kullanarak her değişken çifti için boş (NA) bulunan satırları o çiftten
çıkarıp kalan değişkenlerle korelasyon hesaplanabileceğini gördüm.
Anscombe dörtlüsü örneğindeyse, aynı korelasyon ve betimsel istatistik
sonuçlarına rağmen aslında grafiklerin farklı olabileceğini, bu yüzden
de önce grafiğe bakmak gerektiğini öğrendim.
Üçüncü bölümün konusu basit doğrusal regresyon modellemesiydi. Eğim
katsayısı x bir birim arttığında y ne kadar değişiyor,
kesişim ise x=0 noktasında y’nin beklenen değeri ve tahmin
edilen değerlerle gerçek değerler arasındaki farklar artık (residual)
anlamına gelmektedir. En küçük kareler yöntemi ise bu artıkların
karelerinin toplamını minimum yapan doğrultuyu seçer. Scatterplot’taki
geom_smooth(method="lm"), verideki ilişkiyi özetleyen en
iyi doğrusal modeli çiziyor ve bu model de matematiksel olarak \(y = \beta_0 + \beta_1 x\) şeklinde.
Dördüncü bölümde regresyon modeli kurduktan sonra
summary() ile eğim, kesişim ve R²’yi, coef(),
fitted() ve residuals() gibi fonksiyonlarla da
modelin çıktılarına bakmayı öğrendim. broom paketinde
bulunan augment() ile veri setine .fitted,
.resid, .hat, .cooksd gibi
sütunlar ekleyip bunları hem tablo olarak hem de grafiklerde kullanmanın
daha pratik olduğunu gördüm. Sonrasında predict() ile
modele yeni gözlemler verip tahmin yapmayı öğrendim.
Bu bölümde, modelin veriye ne kadar iyi uyduğunu görmek için artık
kareleri toplamı olan SSE’yi ve bunun üzerinden hesaplanan artıkların
standart sapması gibi düşünebileceğimiz RMSE’yi öğrendim. Sadece R²’ye
bakmak yerine artıkların büyüklüğünü ve dağılımını incelemenin önemli
olduğunu, augment() içindeki .hat ve .cooksd
değişkenleriyle hangi gözlemlerin yüksek kaldıraçlı veya modele yüksek
etkisi olduğunu görebildiğimizi ve bu noktaları silmenin
literatüre/bilimsey bir gerekçeye dayanması gerektiğini öğrendim.
Altıncı bölümde, tek değişkenli basit regresyona ek olarak bir sayısal ve bir de kategorik değişken içeren paralel eğimli modelleri gördüm. Örneğin yakıt tüketimini motor hacmi ve yıl ile birlikte modele aldığımızda, lm(hwy ~ displ + factor(year)) ifadesinin her yıl için eğimi aynı, sadece kesişimi farklı iki doğru ürettiğini öğrendim. Burada sayısal değişkenin katsayısı her iki yıl için ortak eğimi, yıl katsayısı ise iki yıla göre ortalama farkını veriyor.
Yedinci bölümde, R²’nin model uyumunu özetlediğini ama çoklu
regresyonda her yeni değişken eklendiğinde R²’nin şiştiğini, bu yüzden
modelleri karşılaştırırken düzeltilmiş R²’ye bakmamız gerektiğinic
öğrendim. Hem tahmin hatasını hem de artıkları görmek için
predict() ve augment() ile modelden tahmin
üretip bunları gerçek değerlerle yan yana getirmek gerektiğini öğrendim.
Etkileşim kısmındaysa modele x*z gibi bir terim
eklediğimizde her grup için eğimin değişebildiğini ve doğruların
birbirini kesebildiğini gördüm. Böyle bir durumda da “z sabitken x’teki
bir birimlik artışın etkisi” olarak okumamız gerekiyor. Yaptığım
örneklerde ise veriye genel bakınca ilişki tek bir yöndeyken, veriyi
gruplara ayırınca ters yönde çıkabildiği için önemli değişkenleri modele
katmadan yorum yapmanın yanlış yorumlamaya neden olacağını gördüm.
Bu bölümde iki sayısal değişkeni aynı anda modele koyunca tek bir
doğru değil, düzleme benzeyen bir yapı ortaya çıktığını gördüm. İki
sayısal değişkene bir de kategorik değişken eklediğimizde ise her grup
için ayrı ama birbirine paralel düzlemler oluşuyor. Yani grup değişkeni
yalnızca bu düzlemler arasındaki dikey farkı temsil ediyor. Örneğin
lm(bwt ~ gestation + age + smoke, data = babies) modelinde
gestation ve age katsayıları düzlemin eğimi gibi;
smoke katsayısı ise “aynı gebelik süresi ve aynı yaşta, sigara
içen annenin bebeği ortalama kaç ons daha hafif” sorusunun cevabı gibi
oluyor. Ek olarak yorumlamada “diğer değişkenler sabit tutulduğunda veya
kontrol edildiğinde diyerek yorum yapmak gerektiğini öğrendim.
Bu çalışmada yazarlar, sorgulamaya dayalı öğrenme ile fen öz yeterliği arasındaki ilişkiyi PISA 2015 verilerini kullanarak incelemiş ve bu ilişkiyi aynı anda hem aracılık (mediation) hem de düzenleyicilik (moderation) içeren bir modelle açıklamaya çalışmışlardır.
Çalışmada sorgulamaya dayalı öğrenme (inquiry-based learning), fen öz
yeterliği (science self-efficacy), fen ilgisi (science interest) ve
öğretmen desteği (teacher support) olmak üzere dört temel değişken
bulunmaktadır. Sorgulamaya dayalı öğrenme öğrencilerin soru
sorma, araştırma planlama, veri toplama, kanıt–açıklama ilişkisini
tartışma ve bilimsel argüman kurma gibi süreçlere aktif olarak
katıldıkları, “bilim yapma” temelli sınıf ortamlarını ifade etmektedir.
Fen öz yeterliği, Bandura’nın çerçevesiyle öğrencinin fenle
ilgili görevleri başarıyla yerine getirebileceğine ilişkin inancını,
yani fen alanına özgü öz yeterlik algısını ifade eder.
Fen ilgisi öğrencinin fen etkinliklerine yönelik olumlu
duygu ve merak içeren, etkinliğin sürecinden haz alma ve bu etkinliğe
gönüllü katılma eğilimi olarak ele alınmakta ve öz yeterliğin önemli bir
psikolojik kaynağı olarak görülmektedir. Öğretmen desteği
ise öğrencinin öğretmeni tarafından değer gördüğünü, anlaşıldığını ve
ihtiyaçlarının fark edildiğini hissetmesiyle ilgili algısal bir yapı
olup, yeterlik, özerklik ve ilişkililik gereksinimlerini destekleyen
sınıf ikliminin temel bileşenlerinden biri olarak
konumlandırılmaktadır.
Sorgulamaya dayalı öğrenme (inquiry-based learning), modelde bağımsız değişken, fen öz yeterliği (science self-efficacy) ise bağımlı değişkendir. Fen ilgisi (science interest), sorgulamaya dayalı öğrenme ile fen öz yeterliği arasındaki ilişkide aracı değişken (mediator) olarak konumlandırılmıştır. Öğretmen desteği (teacher support) ise, sorgulamaya dayalı öğrenmenin fen öz yeterliği üzerindeki doğrudan etkisinin ve fen ilgisi üzerinden işleyen dolaylı etkinin gücünü değiştiren düzenleyici değişken (moderator) olarak tanımlanmaktadır.
4 değişken PISA veri setinde makalenin instruments başlığında
bahsedildiği üzere; sorgulamaya dayalı öğrenme IBTEACH, fen
öz yeterliği SCIEEFF, fen ilgisi INTBRSCI ve
öğretmen desteği TEACHSUP ile kodlanmıştır.
Bu çalışmada sorgulamaya dayalı öğrenme ile fen öz-yeterliği arasındaki ilişki, araya fen ilgisi ve öğretmen desteği alınarak açıklanmaya çalışılmıştır. Önce sorgulamaya dayalı öğrenmenin öğrencilerin fen ilgisini artırdığı, artan ilginin de fen öz-yeterliğiyle ilişkili olduğu düşünülmüştür. Bu yüzden fen ilgisi, sorgulamaya dayalı öğrenme ile fen öz-yeterliği arasındaki ilişkide aracı (mediator) değişken olarak ele alınmıştır. Öğretmen desteği ise, bu ilişkilerin ne kadar güçlü olacağını etkileyen bir koşul gibi görülmüştür. Öğrencinin öğretmenini destekleyici ve ilgili algıladığı durumlarda, sorgulamaya dayalı öğrenmenin hem fen ilgisiyle olan ilişkisi hem de fen öz-yeterliğiyle ilişkisi daha olumlu sonuç verebilir, destek düşük olduğunda bu etkiler zayıflayabilir. Bu nedenle öğretmen desteği, hem doğrudan etkiyi hem de fen ilgisi üzerinden giden dolaylı etkiyi değiştiren düzenleyici (moderator) değişken olarak modele eklenmiştir. Teorik modelde sorgulamaya dayalı öğrenme bağımsız değişken, fen ilgisi bu ilişkiyi açıklayan aracı değişken, fen öz-yeterliği bağımlı değişken ve öğretmen desteği de düzenleyici değişken olarak kurgulanmıştır.
Bu çalışmada veri kaynağı olarak TIMSS 2019 sekizinci sınıf öğrenci verisini kullanmayı planlıyorum. Özellikle matematik alanına odaklanarak Türkiye ve Japonya’daki 8. sınıf öğrencilerinin matematik başarısı ile matematik dersine ilişkin tutum ve algıları arasındaki ilişkileri karşılaştırmak istiyorum. Veriyi IEA’nın TIMSS 2019 uluslararası veri tabanından, ülke bazlı öğrenci dosyaları şeklinde indirip Türkiye ve Japonya dosyalarını birleştirerek çalışacağım.
Bağımlı değişken olarak öğrencilerin matematik başarısını kullanacağım. TIMSS’te başarı puanları “plausible value” olarak birden fazla değişkende veriliyor. Matematik için BSMMAT01–BSMMAT05 kodlu beş başarı değişkeni bulunuyor. Bu ödev kapsamında bildiklerim kadarını uygulayacağım için BSMMAT01 değişkeninin matematik başarısını temsil ettiğini varsayacağım. Yani BSMMAT01’i bağımlı değişkenim (Y) olarak alacağım. Bağımsız değişken olarak, dersin nasıl işlendiğine dair öğrencilerin algısını yansıtan “matematik derslerinde öğretimsel açıklık” indeksini kullanmayı düşünüyorum. Bu değişken TIMSS kod kitabında BSDGICM (Instructional Clarity in Mathematics Lessons Index) olarak geçiyor. Yani BSDGICM, öğrencinin matematik derslerinde öğretmenin konuyu ne kadar açık, anlaşılır ve adım adım anlattığına ilişkin genel algısını özetleyen bir ölçek ve çalışmamda temel bağımsız değişken (X) olarak yer alacak. Aracı değişken için öğrencilerin matematik dersini ne kadar sevdiğini temsil eden indeksi seçtim. Bu ölçek, TIMSS’te BSDGSLM (Students Like Learning Mathematics Lessons Index) koduyla yer alıyor. BSDGSLM öğrencinin matematik dersinden hoşlanma, derse karşı ilgi duyma ve matematiği öğrenmekten keyif alma durumunu özetliyor. Modelde, BSDGICM ile BSMMAT01 arasındaki ilişkiyi kısmen açıklayan aracı değişken olarak BSDGSLM’i kullanmayı planlıyorum. Düzenleyici değişken olarak cinsiyeti kullanacağım. TIMSS 2019 sekizinci sınıf öğrenci dosyasında cinsiyet değişkeni ITSEX koduyla tanımlanıyor ve kız erkek ayrımını veriyor. Kuracağım bu yapı öğretimsel açıklık ile matematik başarısı arasındaki ilişkinin ve bu ilişkide matematik dersini sevmenin rolünün cinsiyete göre değişip değişmediğini gözlemlememe yardımcı olacak.
Özetle, TIMSS 2019 sekizinci sınıf öğrenci verisinde kullanacağım temel değişkenler ve kodları:
Matematik Başarısı BSMMAT01 –> Bağımlı
değişken,
Matematik Derslerinde Öğretimsel Açıklık İndeksi
BSDGICM –> Bağımsız değişken,
Matematik Dersini Sevme İndeksi BSDGSLM –> Aracı
değişken,
Cinsiyet ITSEX –> Düzenleyici değişken.