library(haven)

data <- read_sav("C:/Users/Lenovo/Desktop/processed_data.sav")

Veri Hazırlığı

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
processed_data <- data %>%
  mutate(
    RESP = ifelse(SCORE > 0, 1, 0),          # cevap verdi mi?
    CORR = ifelse(SCORE == 2, 1, 0),         # doğru mu?
    RT_RW = TT - FAT                         # Review time
  ) %>%
  
  # Item-level behavior classification
  group_by(ITEM) %>%
  mutate(
    # Yanıt süresi (Log-transformed)
    FATlog = log(FAT + 1),
    
    # log-transformed yanıt süresinin 25. persentili
    Q1logFAT = quantile(FATlog, probs = 0.25, na.rm = TRUE)[[1]],
    
    # Rapid guessing davranışı: 5 sn altı ya da Q1logFAT'den düşük
    RAPID = ifelse(FAT < 5 | FATlog < Q1logFAT, 1, 0),
    
    # Gözden geçirme süresinin 75. persentili
    Q3RT = quantile(RT_RW, probs = 0.75, na.rm = TRUE)[[1]],
    REVW = ifelse(RT_RW > Q3RT, 1, 0),
    
    # Gözden geçirme türüne göre kategorileştirme
    RT_typ = case_when(
      TT == FAT ~ "no_revision",  # hiç gözden geçirme yok
      RT_RW <= quantile(RT_RW[RT_RW > 0], 0.25, na.rm = TRUE)[[1]] ~ "nominal_revision",  # sembolik gözden geçirme
      TRUE ~ "substantive_revision"  # anlamlı gözden geçirme
    ),
    RT_typ = factor(RT_typ,
                    levels = c("no_revision", "nominal_revision", "substantive_revision"),
                    ordered = TRUE),
    
    # Anlamlı çözüm davranışı
    SOLVE = ifelse(FAT >= exp(Q1logFAT) & RESP == 1 & RAPID == 0, 1, 0)
  ) %>%
  ungroup()
## Warning: There were 22 warnings in `mutate()`.
## The first warning was:
## ℹ In argument: `FATlog = log(FAT + 1)`.
## ℹ In group 1: `ITEM = 1`.
## Caused by warning in `log()`:
## ! NaNs produced
## ℹ Run `dplyr::last_dplyr_warnings()` to see the 21 remaining warnings.
names(processed_data)
##  [1] "IDCNT"    "IDSTU"    "ITEM"     "SCORE"    "FAT"      "TT"      
##  [7] "RT"       "COND"     "COGD"     "ITSEX"    "SCM"      "PHEL"    
## [13] "CNTA"     "RESP"     "CORR"     "RT_RW"    "RAPID"    "REVW"    
## [19] "RT_typ"   "SOLVE"    "ACCRCY"   "PRPD"     "PREV"     "PSOL"    
## [25] "PSREV"    "Q1FAT"    "Q3RT"     "FATlog"   "Q1logFAT"

DEĞİŞKEN TANIMLARI

  1. RESP: Yanıt Verildi mi?
  1. CORR: Doğru Yanıt mı?
  1. RT_RW: Gözden Geçirme Süresi
  1. FATlog: Logaritmik İlk Süre Dönüşümü
  1. Q1logFAT: Log-FAT için 25. Yüzdelik Eşik
  1. RAPID: Hızlı Tahmin Davranışı FAT < 5 veya FAT_log < Q1_logFAT (bu değişken bilişsel işlem barındırmayan yanıtları belirlemek için oluşturuldu) Literatürde Goldhammer (2015), Wise (2017) 5 sn altı yanıtları çabasız ve düşük çaba demişler.

  2. Q3RT: Yoğun Gözden Geçirme Eşiği

  1. REVW: Yoğun Gözden Geçirme Davranışı
  1. RT_typ: Gözden Geçirme Türü (3 kategorili)

Ulitzsch (2022) ve Goldhammer’a göre gözden geçirme kalitesini bu şekilde sınıflamışlar.

  1. SOLVE: Anlamlı Çözüm Davranışı
  1. ACCURCY: Doğru Yanıt Ort.
  1. PRPD: Hızlı Tahmin Oranı
  1. PREV: Yoğun Gözden Geçirme Oranı
  1. PSOL: Anlamlı Çözüm Oranı
  1. PSREV: Anlamlı Gözden Geçirme Oranı
processed_data %>%
  group_by(RT_typ) %>%
  summarise(
    Mean_Accuracy = mean(CORR, na.rm = TRUE),
    N = n()
  )

öğrencilerin gözden geçirme davranışları ile başarıları arasında belirgin bir ilişki var.

Hiç gözden geçirme yapmayan öğrenciler (no_revision) en düşük doğruluk oranına sahip. Bu, birçok öğrencinin ya yanıtı düşünmeden verdiğini ya da emin olmadığı sorularda zaman harcamadığını düşündürebilir. Bu grup aynı zamanda en kalabalık grup, yani testlerde en yaygın strateji bu.

Sembolik gözden geçirme yapanlar (nominal_revision) en yüksek başarı oranına sahip. Bu oldukça dikkat çekici; çünkü bu öğrenciler çok kısa süreli kontrol yapmalarına rağmen diğerlerinden daha doğru yanıt vermiş. Bu, genellikle bilgili ama stratejik davranan öğrencilerin özelliğidir. Sayıca az olsalar da etkili bir yanıt stratejisine sahipler.

Anlamlı gözden geçirme yapanlar (substantive_revision) başarı açısından ortada yer alıyor. Bu öğrenciler ciddi çaba gösteriyor olabilir fakat bu çaba her zaman başarıya dönüşmüyor. Bu grup, ya daha zorlandığı sorulara ciddi vakit ayıranlar ya da yanıtını tekrar tekrar sorgulayanlardan oluşuyor olabilir.

Sadece çok uzun gözden geçirme değil, hedefe yönelik ve kısa kontrol stratejisi (nominal revision) başarıyı daha fazla destekliyor gibi görünüyor. Bu, özellikle sınav sırasında zamana duyarlı stratejik davranışların önemini vurgulayabilir.

VERİ SETİYLE YAPILABİLECEK ÇALIŞMALAR

1. Stratejik Gözden Geçirme Davranışlarının Akademik Başarı ile İlişkisi

Öğrencilerin sınav sırasında gösterdiği gözden geçirme davranışları (nominal vs. substantive) ile başarıları arasındaki ilişkiyi incelemek için çalışılabilir.

Araştırma Problemleri

2. Hızlı Tahmin (Rapid Guessing) Davranışlarının Psikometrik Geçerliliğe Etkisi

Hızlı yanıt verme davranışlarının testin güvenilirliğini ve ölçüm geçerliliğini nasıl etkilediğini analiz etmek.

Araştırma Problemleri:

3. Zaman Kullanımı ve Sınav Performansı: Bilişsel Alanlara Göre Karşılaştırma

Farklı bilişsel alanlarda (COGD) öğrencilerin zaman kullanımı (FAT, RT_RW) ve başarı ilişkilerini inceleme.

Araştırma Problemleri:

4. Davranışsal tutarsızlık (Discrepant profile) ve bilişsel geçerlilik ilişkisi: işlem süreci verisine dayalı sınıflandırma yaklaşımı

Veri setindeki değişkenler ile, öğrencilerin sınav sırasında gösterdikleri davranışları ve bu davranışların akademik başarı üzerindeki etkilerini incelemek için kullanılabilir. Yapılabilecek bazı araştırma soruları ve problemleri:

. Q2: “Sadece hızlı cevaplayan” (QuickFirst=1, diğerleri=0) öğrencilerin başarı düzeyi nedir?

. Q3: “Full stratejik” davranış (Q=1, R=1, S=1) gösteren öğrenciler gerçekten daha mı başarılı?

. Q4: QRS örüntüsü ile DDI (Tutarsızlık Endeksi) arasında ilişki var mı?

. Q5: Bu örüntüler ülkeler veya cinsiyet grupları arasında sistematik olarak değişiyor mu?

. Q1: “Tahmin” sınıfına düşen öğrencilerin büyük kısmı davranışsal olarak da tutarsız mı?

. Q2: “Yanlış anlama” ve “Şanslı tahmin” profilleri PET sınıflarında nasıl dağılmıştır?

. Q3: PET ve ProfilEtiketi arasında uyum oranı nedir? (Cohen’s Kappa ile ölçülebilir)

. Q4: PET sınıflarının ortalama davranış skoru farklı mıdır?

. Q5: Hangi sınıflarda PET ve davranışsal etiketlerin örtüşmediği durumlar daha sık görülüyor?

. Q1: DDI skoru yüksek olan öğrenciler daha çok hangi davranış örüntüsüne sahiptir?

. Q2: DDI ile davranış skoru arasında nasıl bir korelasyon vardır?

. Q3: Cinsiyete göre DDI dağılımı anlamlı fark gösteriyor mu?

. Q4: DDI seviyesi arttıkça, öğrencinin başarısında düşüş gözleniyor mu?

. Q1: “Tahmin” veya “Şanslı Tahmin” gibi tutarsız profiller, sınavın geçerliliğini zedeliyor mu?

. Q2: Bu profillerdeki öğrencilerin işlem süresi dağılımı nasıl?

. Q3: Profil değişkenleri test puanlarından bağımsız olarak bilişsel çabayı temsil ediyor mu?

. Q4: Test tasarımı açısından bu profillerin azaltılması mümkün mü?

. Q5: Bu öğrenciler, sınavdan çıkarılsa bile sonuçların güvenilirliği nasıl değişir?

BU ÖNERİ İLE İLGİLİ bu linkte bir çalışma yapmaya çalıştım.