➰ REGRESYON ÖĞRENME GÜNLÜĞÜ

➿ 1. Bölüm

OpenIntro’da incelememiz gereken ilk bölümde, iki sürekli değişken arasındaki ilişkiyi nasıl göreceğimizle başladık. X ekseninde bağımsız, Y ekseninde bağımlı değişken olacak şekilde saçılım grafiği kurmayı ve noktaların yoğunluk ve kümelenmelerine göre ilişkinin yönünü ve biçimini yorumlamayı öğrendim. Değişkenleri sınıflara bölmek için cut() ile yeni kategorik değişken oluşturuğ, kutu grafikleri ve jitter ile bakmak yorumlamayı daha kolay hale getiriyor o yüzden sadece denkleme bakmak yeterli değil, mutlaka görselleştirmek gerekiyor. Büyük verilerde de logaritma dönüşümü log() ve scale_x/y_log10() ile eksenleri dönüştürüp ilişkiyi daha okunur hale getirebileceğimiziöğrendim.

➿ 2.Bölüm

İkinci bölüm korelasyon hakkındaydı. Bu bölümdeki ana tema bence korelasyonun tek başına neden sonuç anlamına gelmeyeceği olmalı.cor()fonksiyonunu kullanarak Pearson korelasyonunu hesaplarken eksik değerleri use="pairwise.complete.obs" kullanarak her değişken çifti için boş (NA) bulunan satırları o çiftten çıkarıp kalan değişkenlerle korelasyon hesaplanabileceğini gördüm. Anscombe dörtlüsü örneğindeyse, aynı korelasyon ve betimsel istatistik sonuçlarına rağmen aslında grafiklerin farklı olabileceğini, bu yüzden de önce grafiğe bakmak gerektiğini öğrendim.

➿ 3.Bölüm

Üçüncü bölümün konusu basit doğrusal regresyon modellemesiydi. Eğim katsayısı x bir birim arttığında y ne kadar değişiyor, kesişim ise x=0 noktasında y’nin beklenen değeri ve tahmin edilen değerlerle gerçek değerler arasındaki farklar artık (residual) anlamına gelmektedir. En küçük kareler yöntemi ise bu artıkların karelerinin toplamını minimum yapan doğrultuyu seçer. Scatterplot’taki geom_smooth(method="lm"), verideki ilişkiyi özetleyen en iyi doğrusal modeli çiziyor ve bu model de matematiksel olarak \(y = \beta_0 + \beta_1 x\) şeklinde.

➿ 4. Bölüm

Dördüncü bölümde regresyon modeli kurduktan sonra summary() ile eğim, kesişim ve R²’yi, coef(), fitted() ve residuals() gibi fonksiyonlarla da modelin çıktılarına bakmayı öğrendim. broom paketinde bulunan augment() ile veri setine .fitted, .resid, .hat, .cooksd gibi sütunlar ekleyip bunları hem tablo olarak hem de grafiklerde kullanmanın daha pratik olduğunu gördüm. Sonrasında predict() ile modele yeni gözlemler verip tahmin yapmayı öğrendim.

➿ 5. Bölüm

Bu bölümde, modelin veriye ne kadar iyi uyduğunu görmek için artık kareleri toplamı olan SSE’yi ve bunun üzerinden hesaplanan artıkların standart sapması gibi düşünebileceğimiz RMSE’yi öğrendim. Sadece R²’ye bakmak yerine artıkların büyüklüğünü ve dağılımını incelemenin önemli olduğunu, augment() içindeki .hat ve .cooksd değişkenleriyle hangi gözlemlerin yüksek kaldıraçlı veya modele yüksek etkisi olduğunu görebildiğimizi ve bu noktaları silmenin literatüre/bilimsey bir gerekçeye dayanması gerektiğini öğrendim.

➿ 6. Bölüm

Altıncı bölümde, tek değişkenli basit regresyona ek olarak bir sayısal ve bir de kategorik değişken içeren paralel eğimli modelleri gördüm. Örneğin yakıt tüketimini motor hacmi ve yıl ile birlikte modele aldığımızda, lm(hwy ~ displ + factor(year)) ifadesinin her yıl için eğimi aynı, sadece kesişimi farklı iki doğru ürettiğini öğrendim. Burada sayısal değişkenin katsayısı her iki yıl için ortak eğimi, yıl katsayısı ise iki yıla göre ortalama farkını veriyor.

➿ 7. Bölüm

Yedinci bölümde, R²’nin model uyumunu özetlediğini ama çoklu regresyonda her yeni değişken eklendiğinde R²’nin şiştiğini, bu yüzden modelleri karşılaştırırken düzeltilmiş R²’ye bakmamız gerektiğinic öğrendim. Hem tahmin hatasını hem de artıkları görmek için predict() ve augment() ile modelden tahmin üretip bunları gerçek değerlerle yan yana getirmek gerektiğini öğrendim. Etkileşim kısmındaysa modele x*z gibi bir terim eklediğimizde her grup için eğimin değişebildiğini ve doğruların birbirini kesebildiğini gördüm. Böyle bir durumda da “z sabitken x’teki bir birimlik artışın etkisi” olarak okumamız gerekiyor. Yaptığım örneklerde ise veriye genel bakınca ilişki tek bir yöndeyken, veriyi gruplara ayırınca ters yönde çıkabildiği için önemli değişkenleri modele katmadan yorum yapmanın yanlış yorumlamaya neden olacağını gördüm.

➿ 8. Bölüm

Bu bölümde iki sayısal değişkeni aynı anda modele koyunca tek bir doğru değil, düzleme benzeyen bir yapı ortaya çıktığını gördüm. İki sayısal değişkene bir de kategorik değişken eklediğimizde ise her grup için ayrı ama birbirine paralel düzlemler oluşuyor. Yani grup değişkeni yalnızca bu düzlemler arasındaki dikey farkı temsil ediyor. Örneğin lm(bwt ~ gestation + age + smoke, data = babies) modelinde gestation ve age katsayıları düzlemin eğimi gibi; smoke katsayısı ise “aynı gebelik süresi ve aynı yaşta, sigara içen annenin bebeği ortalama kaç ons daha hafif” sorusunun cevabı gibi oluyor. Ek olarak yorumlamada “diğer değişkenler sabit tutulduğunda veya kontrol edildiğinde diyerek yorum yapmak gerektiğini öğrendim.

🥽 Makale İncelemesi: Liu & Wang (2022)

Bu çalışmada yazarlar, sorgulamaya dayalı öğrenme ile fen öz yeterliği arasındaki ilişkiyi PISA 2015 verilerini kullanarak incelemiş ve bu ilişkiyi aynı anda hem aracılık (mediation) hem de düzenleyicilik (moderation) içeren bir modelle açıklamaya çalışmışlardır.

Çalışmada sorgulamaya dayalı öğrenme (inquiry-based learning), fen öz yeterliği (science self-efficacy), fen ilgisi (science interest) ve öğretmen desteği (teacher support) olmak üzere dört temel değişken bulunmaktadır. Sorgulamaya dayalı öğrenme öğrencilerin soru sorma, araştırma planlama, veri toplama, kanıt–açıklama ilişkisini tartışma ve bilimsel argüman kurma gibi süreçlere aktif olarak katıldıkları, “bilim yapma” temelli sınıf ortamlarını ifade etmektedir. Fen öz yeterliği, Bandura’nın çerçevesiyle öğrencinin fenle ilgili görevleri başarıyla yerine getirebileceğine ilişkin inancını, yani fen alanına özgü öz yeterlik algısını ifade eder. Fen ilgisi öğrencinin fen etkinliklerine yönelik olumlu duygu ve merak içeren, etkinliğin sürecinden haz alma ve bu etkinliğe gönüllü katılma eğilimi olarak ele alınmakta ve öz yeterliğin önemli bir psikolojik kaynağı olarak görülmektedir. Öğretmen desteği ise öğrencinin öğretmeni tarafından değer gördüğünü, anlaşıldığını ve ihtiyaçlarının fark edildiğini hissetmesiyle ilgili algısal bir yapı olup, yeterlik, özerklik ve ilişkililik gereksinimlerini destekleyen sınıf ikliminin temel bileşenlerinden biri olarak konumlandırılmaktadır.

Sorgulamaya dayalı öğrenme (inquiry-based learning), modelde bağımsız değişken, fen öz yeterliği (science self-efficacy) ise bağımlı değişkendir. Fen ilgisi (science interest), sorgulamaya dayalı öğrenme ile fen öz yeterliği arasındaki ilişkide aracı değişken (mediator) olarak konumlandırılmıştır. Öğretmen desteği (teacher support) ise, sorgulamaya dayalı öğrenmenin fen öz yeterliği üzerindeki doğrudan etkisinin ve fen ilgisi üzerinden işleyen dolaylı etkinin gücünü değiştiren düzenleyici değişken (moderator) olarak tanımlanmaktadır.

4 değişken PISA veri setinde makalenin instruments başlığında bahsedildiği üzere; sorgulamaya dayalı öğrenme IBTEACH, fen öz yeterliği SCIEEFF, fen ilgisi INTBRSCI ve öğretmen desteği TEACHSUP ile kodlanmıştır.

📐 Mediating-Moderating Model

Bu çalışmada sorgulamaya dayalı öğrenme ile fen öz-yeterliği arasındaki ilişki, araya fen ilgisi ve öğretmen desteği alınarak açıklanmaya çalışılmıştır. Önce sorgulamaya dayalı öğrenmenin öğrencilerin fen ilgisini artırdığı, artan ilginin de fen öz-yeterliğiyle ilişkili olduğu düşünülmüştür. Bu yüzden fen ilgisi, sorgulamaya dayalı öğrenme ile fen öz-yeterliği arasındaki ilişkide aracı (mediator) değişken olarak ele alınmıştır. Öğretmen desteği ise, bu ilişkilerin ne kadar güçlü olacağını etkileyen bir koşul gibi görülmüştür. Öğrencinin öğretmenini destekleyici ve ilgili algıladığı durumlarda, sorgulamaya dayalı öğrenmenin hem fen ilgisiyle olan ilişkisi hem de fen öz-yeterliğiyle ilişkisi daha olumlu sonuç verebilir, destek düşük olduğunda bu etkiler zayıflayabilir. Bu nedenle öğretmen desteği, hem doğrudan etkiyi hem de fen ilgisi üzerinden giden dolaylı etkiyi değiştiren düzenleyici (moderator) değişken olarak modele eklenmiştir. Teorik modelde sorgulamaya dayalı öğrenme bağımsız değişken, fen ilgisi bu ilişkiyi açıklayan aracı değişken, fen öz-yeterliği bağımlı değişken ve öğretmen desteği de düzenleyici değişken olarak kurgulanmıştır.

📊 Kendi Kullanacağım Veri Seti ve Özellikleri

Bu çalışmada veri kaynağı olarak TIMSS 2019 sekizinci sınıf öğrenci verisini kullanmayı planlıyorum. Özellikle matematik alanına odaklanarak Türkiye ve Japonya’daki 8. sınıf öğrencilerinin matematik başarısı ile matematik dersine ilişkin tutum ve algıları arasındaki ilişkileri karşılaştırmak istiyorum. Veriyi IEA’nın TIMSS 2019 uluslararası veri tabanından, ülke bazlı öğrenci dosyaları şeklinde indirip Türkiye ve Japonya dosyalarını birleştirerek çalışacağım.

Bağımlı değişken olarak öğrencilerin matematik başarısını kullanacağım. TIMSS’te başarı puanları “plausible value” olarak birden fazla değişkende veriliyor. Matematik için BSMMAT01–BSMMAT05 kodlu beş başarı değişkeni bulunuyor. Bu ödev kapsamında bildiklerim kadarını uygulayacağım için BSMMAT01 değişkeninin matematik başarısını temsil ettiğini varsayacağım. Yani BSMMAT01’i bağımlı değişkenim (Y) olarak alacağım. Bağımsız değişken olarak, dersin nasıl işlendiğine dair öğrencilerin algısını yansıtan “matematik derslerinde öğretimsel açıklık” indeksini kullanmayı düşünüyorum. Bu değişken TIMSS kod kitabında BSDGICM (Instructional Clarity in Mathematics Lessons Index) olarak geçiyor. Yani BSDGICM, öğrencinin matematik derslerinde öğretmenin konuyu ne kadar açık, anlaşılır ve adım adım anlattığına ilişkin genel algısını özetleyen bir ölçek ve çalışmamda temel bağımsız değişken (X) olarak yer alacak. Aracı değişken için öğrencilerin matematik dersini ne kadar sevdiğini temsil eden indeksi seçtim. Bu ölçek, TIMSS’te BSDGSLM (Students Like Learning Mathematics Lessons Index) koduyla yer alıyor. BSDGSLM öğrencinin matematik dersinden hoşlanma, derse karşı ilgi duyma ve matematiği öğrenmekten keyif alma durumunu özetliyor. Modelde, BSDGICM ile BSMMAT01 arasındaki ilişkiyi kısmen açıklayan aracı değişken olarak BSDGSLM’i kullanmayı planlıyorum. Düzenleyici değişken olarak cinsiyeti kullanacağım. TIMSS 2019 sekizinci sınıf öğrenci dosyasında cinsiyet değişkeni ITSEX koduyla tanımlanıyor ve kız erkek ayrımını veriyor. Kuracağım bu yapı öğretimsel açıklık ile matematik başarısı arasındaki ilişkinin ve bu ilişkide matematik dersini sevmenin rolünün cinsiyete göre değişip değişmediğini gözlemlememe yardımcı olacak.

Özetle, TIMSS 2019 sekizinci sınıf öğrenci verisinde kullanacağım temel değişkenler ve kodları:

  • Matematik Başarısı BSMMAT01 –> Bağımlı değişken,

  • Matematik Derslerinde Öğretimsel Açıklık İndeksi BSDGICM –> Bağımsız değişken,

  • Matematik Dersini Sevme İndeksi BSDGSLM –> Aracı değişken,

  • Cinsiyet ITSEX –> Düzenleyici değişken.