Veri Hazırlığı
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
processed_data <- data %>%
mutate(
RESP = ifelse(SCORE > 0, 1, 0), # cevap verdi mi?
CORR = ifelse(SCORE == 2, 1, 0), # doğru mu?
RT_RW = TT - FAT # Review time
) %>%
# Item-level behavior classification
group_by(ITEM) %>%
mutate(
# Yanıt süresi (Log-transformed)
FATlog = log(FAT + 1),
# log-transformed yanıt süresinin 25. persentili
Q1logFAT = quantile(FATlog, probs = 0.25, na.rm = TRUE)[[1]],
# Rapid guessing davranışı: 5 sn altı ya da Q1logFAT'den düşük
RAPID = ifelse(FAT < 5 | FATlog < Q1logFAT, 1, 0),
# Gözden geçirme süresinin 75. persentili
Q3RT = quantile(RT_RW, probs = 0.75, na.rm = TRUE)[[1]],
REVW = ifelse(RT_RW > Q3RT, 1, 0),
# Gözden geçirme türüne göre kategorileştirme
RT_typ = case_when(
TT == FAT ~ "no_revision", # hiç gözden geçirme yok
RT_RW <= quantile(RT_RW[RT_RW > 0], 0.25, na.rm = TRUE)[[1]] ~ "nominal_revision", # sembolik gözden geçirme
TRUE ~ "substantive_revision" # anlamlı gözden geçirme
),
RT_typ = factor(RT_typ,
levels = c("no_revision", "nominal_revision", "substantive_revision"),
ordered = TRUE),
# Anlamlı çözüm davranışı
SOLVE = ifelse(FAT >= exp(Q1logFAT) & RESP == 1 & RAPID == 0, 1, 0)
) %>%
ungroup()## Warning: There were 22 warnings in `mutate()`.
## The first warning was:
## ℹ In argument: `FATlog = log(FAT + 1)`.
## ℹ In group 1: `ITEM = 1`.
## Caused by warning in `log()`:
## ! NaNs produced
## ℹ Run `dplyr::last_dplyr_warnings()` to see the 21 remaining warnings.
## [1] "IDCNT" "IDSTU" "ITEM" "SCORE" "FAT" "TT"
## [7] "RT" "COND" "COGD" "ITSEX" "SCM" "PHEL"
## [13] "CNTA" "RESP" "CORR" "RT_RW" "RAPID" "REVW"
## [19] "RT_typ" "SOLVE" "ACCRCY" "PRPD" "PREV" "PSOL"
## [25] "PSREV" "Q1FAT" "Q3RT" "FATlog" "Q1logFAT"
DEĞİŞKEN TANIMLARI
RAPID: Hızlı Tahmin Davranışı FAT < 5 veya FAT_log < Q1_logFAT (bu değişken bilişsel işlem barındırmayan yanıtları belirlemek için oluşturuldu) Literatürde Goldhammer (2015), Wise (2017) 5 sn altı yanıtları çabasız ve düşük çaba demişler.
Q3RT: Yoğun Gözden Geçirme Eşiği
Ulitzsch (2022) ve Goldhammer’a göre gözden geçirme kalitesini bu şekilde sınıflamışlar.
processed_data %>%
group_by(RT_typ) %>%
summarise(
Mean_Accuracy = mean(CORR, na.rm = TRUE),
N = n()
)öğrencilerin gözden geçirme davranışları ile başarıları arasında belirgin bir ilişki var.
Hiç gözden geçirme yapmayan öğrenciler (no_revision) en düşük doğruluk oranına sahip. Bu, birçok öğrencinin ya yanıtı düşünmeden verdiğini ya da emin olmadığı sorularda zaman harcamadığını düşündürebilir. Bu grup aynı zamanda en kalabalık grup, yani testlerde en yaygın strateji bu.
Sembolik gözden geçirme yapanlar (nominal_revision) en yüksek başarı oranına sahip. Bu oldukça dikkat çekici; çünkü bu öğrenciler çok kısa süreli kontrol yapmalarına rağmen diğerlerinden daha doğru yanıt vermiş. Bu, genellikle bilgili ama stratejik davranan öğrencilerin özelliğidir. Sayıca az olsalar da etkili bir yanıt stratejisine sahipler.
Anlamlı gözden geçirme yapanlar (substantive_revision) başarı açısından ortada yer alıyor. Bu öğrenciler ciddi çaba gösteriyor olabilir fakat bu çaba her zaman başarıya dönüşmüyor. Bu grup, ya daha zorlandığı sorulara ciddi vakit ayıranlar ya da yanıtını tekrar tekrar sorgulayanlardan oluşuyor olabilir.
Sadece çok uzun gözden geçirme değil, hedefe yönelik ve kısa kontrol stratejisi (nominal revision) başarıyı daha fazla destekliyor gibi görünüyor. Bu, özellikle sınav sırasında zamana duyarlı stratejik davranışların önemini vurgulayabilir.
VERİ SETİYLE YAPILABİLECEK ÇALIŞMALAR
1. Stratejik Gözden Geçirme Davranışlarının Akademik Başarı ile İlişkisi
Öğrencilerin sınav sırasında gösterdiği gözden geçirme davranışları (nominal vs. substantive) ile başarıları arasındaki ilişkiyi incelemek için çalışılabilir.
Araştırma Problemleri
Öğrencilerin gözden geçirme türleri (RT_typ) ile doğru yanıt oranı (CORR) arasında anlamlı fark var mı?
Nominal revizyon davranışı sergileyen öğrenciler, diğer gruplara göre daha mı stratejik?
Anlamlı gözden geçirme yapan öğrencilerin başarıları, düşük özgüvene sahip öğrencilerde nasıl değişiyor? (Student confident in math değişkenini kullanabiliriz)
Anlamlı gözden geçirme davranışı, ülke başarı düzeyi (CNTA) ile farklı şekillerde mi ortaya çıkıyor?
2. Hızlı Tahmin (Rapid Guessing) Davranışlarının Psikometrik Geçerliliğe Etkisi
Hızlı yanıt verme davranışlarının testin güvenilirliğini ve ölçüm geçerliliğini nasıl etkilediğini analiz etmek.
Araştırma Problemleri:
Rapid yanıtların dahil edilmesi, test doğruluk ortalamalarını (ACCRCY) nasıl etkiliyor?
Hızlı tahmin eğilimi yüksek olan öğrencilerde anlamlı çözüm (SOLVE) oranı nasıl değişiyor?
Öğrenci özgüveni (SCM), hızlı tahmin davranışı ile ters orantılı mı?
Ülkeler arasında hızlı tahmin davranışında sistematik farklar var mı?
3. Zaman Kullanımı ve Sınav Performansı: Bilişsel Alanlara Göre Karşılaştırma
Farklı bilişsel alanlarda (COGD) öğrencilerin zaman kullanımı (FAT, RT_RW) ve başarı ilişkilerini inceleme.
Araştırma Problemleri:
Bilişsel alanlar arasında gözden geçirme süresi (RT_RW) farklılık gösteriyor mu?
Hangi bilişsel alanda öğrenciler daha fazla anlamlı revizyon yapıyor?
Süre kullanımı ile başarı (CORR) ilişkisi, bilişsel alanlara göre değişiyor mu?
Bilişsel alana göre hızlı tahmin oranlarında fark var mı?
4. Davranışsal tutarsızlık (Discrepant profile) ve bilişsel geçerlilik ilişkisi: işlem süreci verisine dayalı sınıflandırma yaklaşımı
Veri setindeki değişkenler ile, öğrencilerin sınav sırasında gösterdikleri davranışları ve bu davranışların akademik başarı üzerindeki etkilerini incelemek için kullanılabilir. Yapılabilecek bazı araştırma soruları ve problemleri:
. Q2: “Sadece hızlı cevaplayan” (QuickFirst=1, diğerleri=0) öğrencilerin başarı düzeyi nedir?
. Q3: “Full stratejik” davranış (Q=1, R=1, S=1) gösteren öğrenciler gerçekten daha mı başarılı?
. Q4: QRS örüntüsü ile DDI (Tutarsızlık Endeksi) arasında ilişki var mı?
. Q5: Bu örüntüler ülkeler veya cinsiyet grupları arasında sistematik olarak değişiyor mu?
. Q1: “Tahmin” sınıfına düşen öğrencilerin büyük kısmı davranışsal olarak da tutarsız mı?
. Q2: “Yanlış anlama” ve “Şanslı tahmin” profilleri PET sınıflarında nasıl dağılmıştır?
. Q3: PET ve ProfilEtiketi arasında uyum oranı nedir? (Cohen’s Kappa ile ölçülebilir)
. Q4: PET sınıflarının ortalama davranış skoru farklı mıdır?
. Q5: Hangi sınıflarda PET ve davranışsal etiketlerin örtüşmediği durumlar daha sık görülüyor?
. Q1: DDI skoru yüksek olan öğrenciler daha çok hangi davranış örüntüsüne sahiptir?
. Q2: DDI ile davranış skoru arasında nasıl bir korelasyon vardır?
. Q3: Cinsiyete göre DDI dağılımı anlamlı fark gösteriyor mu?
. Q4: DDI seviyesi arttıkça, öğrencinin başarısında düşüş gözleniyor mu?
. Q1: “Tahmin” veya “Şanslı Tahmin” gibi tutarsız profiller, sınavın geçerliliğini zedeliyor mu?
. Q2: Bu profillerdeki öğrencilerin işlem süresi dağılımı nasıl?
. Q3: Profil değişkenleri test puanlarından bağımsız olarak bilişsel çabayı temsil ediyor mu?
. Q4: Test tasarımı açısından bu profillerin azaltılması mümkün mü?
. Q5: Bu öğrenciler, sınavdan çıkarılsa bile sonuçların güvenilirliği nasıl değişir?
BU ÖNERİ İLE İLGİLİ bu linkte bir çalışma yapmaya çalıştım.