Bu hafta derse canlı katılım sağlayamadım; ancak ders videosunu ve kayıtlarını detaylıca inceleyerek ödevimi hazırladım.Umarım doğru bir şekilde anlamışımdır:)

Ödevim 3 farklı analizden oluşmaktadır.

1.Analiz Raporu: Eğitim Harcamaları ve SAT Puanları İlişkisi

Veri seti

Bu çalışmada, David C. Howell’ın Statistical Methods for Psychology (8. Baskı) kitabının 15. bölümünde yer alan ve literatürde Guber (1999) verisi olarak bilinen “SAT Scores and Education Spending” seti kullanılmıştır.

Analizin Temel Sorusu: Eyalet bazında yapılan eğitim harcamaları (Expend), SAT puanlarını (SATcombined) nasıl etkilemektedir? Bu ilişkide sınava katılım oranının (PctSAT) “karıştırıcı” (confounding) etkisi nedir?

Analizde kullanılan veri seti, ABD’deki 50 eyalete ait şu değişkenleri içermektedir:

SATcombined: Eyalet bazında toplam SAT puanı (Bağımlı Değişken)

Expend: Öğrenci başına yapılan eğitim harcaması

PctSAT: Eyalette sınava katılan öğrencilerin yüzdesi

Analizin Amacı

Bu analizin temel amacı, eğitim harcamaları ile akademik başarı (SAT puanları) arasındaki ilişkiyi incelerken, sınava katılım oranı gibi “karıştırıcı” (confounding) değişkenlerin etkisini gözlemlemektir. Howell (2012), basit regresyon analizinin yanıltıcı sonuçlar verebileceğini, bu sebeple üçüncü değişkenlerin kontrol edildiği Çoklu Regresyon modelinin gerekliliğini bu veri üzerinden tartışmaktadır.

setwd("C:/Users/User/OneDrive/Desktop/OLC_733") 

veri <- read.table("Tab15-1.dat", header = TRUE)

# Verinin ilk 6 satırına bak
head(veri)
##   id   State Expend PTratio Salary PctSAT Verbal Math SATcombined PctACT
## 1  1 Alabama  4.405    17.2 31.144      8    491  538        1029     61
## 2  2  Alaska  8.963    17.6 47.951     47    445  489         934     32
## 3  3 Arizona  4.778    19.3 32.175     27    448  496         944     27
## 4  4     Ark  4.459    17.1 28.934      6    482  523        1005     66
## 5  5   Calif  4.992    24.0 41.078     45    417  485         902     11
## 6  6     Col  5.443    18.4 34.571     29    462  518         980     62
##   ACTcombined LogPctSAT
## 1        20.2     2.079
## 2        21.0     3.850
## 3        21.1     3.296
## 4        20.3     1.792
## 5        21.0     3.807
## 6        21.5     3.367
# Kaç satır ve sütun 
dim(veri)
## [1] 50 12
names(veri)
##  [1] "id"          "State"       "Expend"      "PTratio"     "Salary"     
##  [6] "PctSAT"      "Verbal"      "Math"        "SATcombined" "PctACT"     
## [11] "ACTcombined" "LogPctSAT"

Modelin kurulması

# model
model <- lm(SATcombined ~ Expend + PctSAT, data = veri)

# Sonuçlar
summary(model)
## 
## Call:
## lm(formula = SATcombined ~ Expend + PctSAT, data = veri)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -88.400 -22.884   1.968  19.142  68.755 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 993.8317    21.8332  45.519  < 2e-16 ***
## Expend       12.2865     4.2243   2.909  0.00553 ** 
## PctSAT       -2.8509     0.2151 -13.253  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 32.46 on 47 degrees of freedom
## Multiple R-squared:  0.8195, Adjusted R-squared:  0.8118 
## F-statistic: 106.7 on 2 and 47 DF,  p-value: < 2.2e-16

Bulguların Tartışılması ve Yorumlanması

Analiz sonuçlarına göre, modele hem harcama (Expend) hem de katılım oranı (PctSAT) değişkenleri dahil edildiğinde, her iki yordayıcının da bağımlı değişken (SAT puanları) üzerinde istatistiksel olarak anlamlı bir etkisi olduğu görülmektedir (p < .01).

Eğitim Harcamaları (Expend): Diğer değişkenler sabit tutulduğunda, harcamadaki 1 birimlik (1000$) artış, SAT puanlarında yaklaşık 12.29 puanlık bir artışla ilişkilidir. Bu durum, eğitim bütçesinin akademik başarı üzerindeki pozitif katkısını net bir şekilde ortaya koymaktadır.

Katılım Oranı (PctSAT): Katılım oranındaki her %1’lik artış, toplam puanda 2.85 puanlık bir düşüşe neden olmaktadır. Bu beklenen bir durumdur; çünkü sınava katılım oranı arttıkça, örneklem sadece “en başarılı” öğrencilerden oluşmaktan çıkıp genel öğrenci popülasyonunu yansıtmaya başlamakta, bu da ortalamayı aşağı çekmektedir.

Modelin Açıklayıcılık Gücü (Multiple R-squared) 0.8195 olarak bulunmuştur. Bu değer, eyaletler arasındaki SAT puanı varyansının %82’sinin sadece eğitim harcamaları ve katılım oranı değişkenleri tarafından açıklandığını göstermektedir. Sosyal bilimler ve eğitim araştırmaları için bu oldukça yüksek ve tatmin edici bir açıklayıcılık oranıdır.

Eğer analiz sadece harcama ve puan arasında yapılsaydı, aradaki ilişki negatif görünecekti. Ancak katılım oranının (PctSAT) modele dahil edilmesiyle, harcamanın başarı üzerindeki “gerçek” pozitif etkisi maskelenmekten kurtulmuş ve ortaya çıkmıştır. Bu, eğitim politikaları değerlendirilirken bağlamsal değişkenlerin (contextual variables) kontrol edilmesinin önemini kanıtlamaktadır.

Sonuç

Yapılan çoklu regresyon analizi, eğitim harcamalarının akademik başarıyı artırmada önemli bir rol oynadığını doğrulamaktadır. Ancak bu ilişkinin doğru yorumlanabilmesi için sınava katılım oranları gibi demografik ve operasyonel değişkenlerin istatistiksel olarak kontrol edilmesi şarttır.

Regresyon modelinin güvenilirliğini test etmek amacıyla oluşturulan tanılayıcı grafikler

plot(model)

Regresyon modelinin güvenilirliğini test etmek amacıyla oluşturulan tanılayıcı grafikler incelendiğinde şu sonuçlara ulaşılmıştır:

Residuals vs Fitted: Hataların (residuals) tahmin edilen değerler etrafında rastgele dağıldığı görülmektedir. Bu durum, bağımlı ve bağımsız değişkenler arasındaki ilişkinin doğrusal (linear) olduğunu ve varyansın sabit olduğunu (homoscedasticity) doğrulamaktadır.

Normal Q-Q: Hataların büyük çoğunluğunun teorik çizgi üzerinde toplandığı görülmektedir. Bu, modeldeki hata terimlerinin normal dağılım sergilediğine dair güçlü bir kanıttır.

Scale-Location: Bu grafik, hataların yayılımının model boyunca sabit olduğunu destekleyerek, analizimizi etkileyecek ciddi bir değişen varyans (heteroscedasticity) sorunu olmadığını göstermektedir.

Residuals vs Leverage: Grafik üzerinde Cook’s Distance sınırlarını aşan çok uç bir gözlem (influential observation) bulunmamaktadır. Bu da model sonuçlarımızın tek bir eyaletin verisi tarafından domine edilmediğini, genel bir eğilimi yansıttığını kanıtlar.

Howell, Bölüm 15.10 ve devamında, iyi bir regresyon modelinin sadece yüksek açıklayıcılık gücüne (R^2) sahip olmasının yetmediğini, aynı zamanda hataların (residuals) belirli varsayımları karşılaması gerektiğini vurgular.

R ile elde ettiğimiz bu grafikler, kitaptaki şu kavramları doğrulamaktadır:

Doğrusallık ve Sabit Varyans: “Residuals vs Fitted” grafiği, Howell’ın belirttiği hataların rastgele dağılması gerekliliğini karşılamaktadır.

Normallik: “Normal Q-Q” grafiği, hataların normal dağılım varsayımına (normality of residuals) uygunluğunu göstermektedir.

Etkili Gözlemler (Leverage): “Residuals vs Leverage” grafiği, veri setindeki Alaska (9. eyalet) gibi uç değerlerin modelin genel eğilimini (regresyon doğrusunu) aşırı derecede büküp bükmediğini kontrol etmemize olanak tanır. Kitapta da belirtildiği gibi, Cook’s Distance sınırları içinde kaldığımız için modelimiz stabildir.

2.Analiz Raporu:“BFI” (Big Five Inventory)

Patrick Mair’in “Modern Psychometrics with R” kitabında 3. Bölümün 76. sayfasına kadar işlediğiniz kısım, psikometrinin en temel ve güçlü araçlarından biri olan “Faktör Analizi” konusuna, spesifik olarak da Açımlayıcı Faktör Analizi konusuna giriş yapar.

Mair, bu bölümde şunu anlatıyor: Elimizde birbiriyle ilişkili çok sayıda madde olduğunda, bu soruların altında yatan “gizli yapıları” (latent variables) nasıl buluruz?

Temel Amaç: Veriyi boyutlandırmak ve özetlemek.

Kullanılan Veri Seti: “BFI” (Big Five Inventory)

Kitabın bu bölümünde kişiliği ölçen “BFI” veri seti kullanılır. Bu veri seti psych paketi içerisinde hazır olarak bulunur. 25 maddeden oluşur ve insanların 5 büyük kişilik özelliğini (Açıklık, Sorumluluk, Dışadönüklük, Uyumluluk, Duygusal Tutarsızlık) nasıl puanladığını gösterir.

Analiz kapsamında, bfi veri setindeki 25 kişilik maddesi (5 alt boyut x 5 madde) seçilmiştir. Kişi sayısı (n=2800) ile madde sayısı (k=25) arasındaki oran, faktör analizinin sağlamlığı (robustness) açısından literatürdeki kriterleri fazlasıyla karşılamaktadır.

library(psych)
## Warning: package 'psych' was built under R version 4.5.2
data(bfi)

bfi_sub <- bfi[1:25]
bfi_clean <- na.omit(bfi_sub)

Açımlayıcı Faktör Analizi (AFA)

# nfactors = 5: Beş faktör 
# rotate = "oblimin": Faktörler birbirine bağlı olabilir (Eğik döndürme)
# fm = "pa": Principal Axis factoring yöntemi 

efa_model <- fa(bfi_clean, nfactors = 5, rotate = "oblimin", fm = "pa")
## Loading required namespace: GPArotation
# Sonuçları Görme
# cutoff = 0.3: 0.30'un altındaki düşük yükleri gizle 
print(efa_model$loadings, cutoff = 0.3)
## 
## Loadings:
##    PA2    PA1    PA3    PA5    PA4   
## A1                      -0.435       
## A2                       0.656       
## A3                       0.678       
## A4                       0.448       
## A5                       0.537       
## C1                0.555              
## C2                0.669              
## C3                0.574              
## C4               -0.644              
## C5               -0.563              
## E1         0.555                     
## E2         0.667                     
## E3        -0.408                0.302
## E4        -0.587                     
## E5        -0.418                     
## N1  0.832                            
## N2  0.780                            
## N3  0.703                            
## N4  0.471  0.405                     
## N5  0.484                            
## O1                              0.518
## O2                             -0.473
## O3                              0.619
## O4         0.335                0.363
## O5                             -0.540
## 
##                  PA2   PA1   PA3   PA5   PA4
## SS loadings    2.504 1.963 1.979 1.889 1.562
## Proportion Var 0.100 0.079 0.079 0.076 0.062
## Cumulative Var 0.100 0.179 0.258 0.333 0.396

2.Analiz Sonuçlarının Yorumlanması

Analiz başlangıcında belirtilen ‘Duygusal Tutarsızlık’ boyutu, literatürde ve analiz çıktısında ‘Nevrotiklik’ (Neuroticism) olarak; ‘Açıklık’ boyutu ise ‘Deneyime Açıklık’ olarak adlandırılmaktadır. Madde kodları (N1-N5 ve O1-O5) bu terminoloji ile uyumludur.

PA2 Nevrotiklik (Neuroticism): N1’den N5’e kadar olan tüm maddeler en yüksek burada toplanmış (0.832, 0.780 vb.).

PA1 Dışadönüklük (Extraversion): E1’den E5’e kadar olan maddeler burada (0.555, 0.667 vb.).

PA3 Sorumluluk (Conscientiousness): C1’den C5’e kadar olan maddeler burada toplanmış.

PA5 Uyumluluk (Agreeableness): A1’den A5’e kadar olan maddeler bu faktörün altında.

PA4 Deneyime Açıklık (Openness): O1’den O5’e kadar olan maddeler de bu grupta.

Negatif Yüklemeler Ne Anlama Geliyor?

Tabloda bazı değerlerin başında eksi işareti var (Örn: A1 = -0.435, C4 = -0.644). Bu durum, o maddelerin “ters maddeler” olduğunu gösterir. Örneğin; faktör “Dışadönüklük” ise, eksi yüklü bir madde muhtemelen “Yalnız kalmayı severim” gibi bir cümledir. Bu, analizin ne kadar tutarlı olduğunu gösterir; maddeler anlamca birbirinin tersi olsa bile aynı faktör çatısı altında buluşmuşlardır.

Açıklanan Varyans:

Bu 5 faktör, 25 maddenin içerdiği toplam varyansın yaklaşık %40’ını açıklamaktadır.Not: Kişilik testleri gibi sosyal bilimlerde %40-60 arası bir açıklayıcılık oranı oldukça iyi kabul edilir. Patrick Mair de kitabında bu oranın bu veri seti için standart olduğunu belirtir.

Karmaşık Maddeler

N4 maddesi hem PA2 (0.471) hem de PA1 (0.405) faktörlerine yüklenmiştir. Bu durum, bu sorunun hem nevrotiklik hem de dışadönüklük ile ilişkili olduğunu, yani ‘saf’ bir madde olmadığını göstermektedir.

Bulguların Değerlendirilmesi:

Yapılan Açımlayıcı Faktör Analizi (AFA) sonucunda, 25 maddenin ‘Beş Büyük Kişilik Özelliği’ kuramına uygun olarak 5 faktörlü bir yapı sergilediği görülmüştür. Özdeğerler (eigenvalues) ve paralel analiz sonuçları bu 5 faktörlü yapıyı desteklemektedir.Özellikle PA2 faktörünün Nevrotiklik boyutunu temsil ettiği ve en yüksek varyansı (0.10) açıkladığı saptanmıştır. Bazı maddelerdeki negatif yüklemeler (Örn: C4, A1), ilgili maddelerin ters puanlanmasıyla uyumludur. Toplam açıklanan varyansın %40 olması, modelin veri yapısını yeterli düzeyde özetlediğini kanıtlamaktadır.

3.Analiz-CASchools (Kendi çalışmam)

Howell’ın SAT örneğinde ele aldığı “üçüncü değişkenlerin etkisi” temasını daha derinlemesine incelemek amacıyla Kaliforniya Eğitim Bölgeleri (CASchools) veri seti üzerinde bir analiz gerçekleştidim.

Bu analizin temel sorusu şudur: “Sınıf mevcutlarının (öğretmen başına düşen öğrenci sayısı) azaltılması, test puanlarını doğrudan artırır mı?”

Veri seti

AER paketi içerisinde yer alan bu veri seti, Kaliforniya’daki 420 bölgeye ait 1998-1999 yılı verilerini içermektedir. Analizde şu temel değişkenler kullanılacaktır:

STR (Student-Teacher Ratio): Sınıf mevcudu / Öğretmen başına düşen öğrenci sayısı (Bağımsız Değişken).

TestScore: Matematik ve okuma puanlarının ortalaması (Bağımlı Değişken).

English: Bölgedeki ana dili İngilizce olmayan öğrenci oranı (Kontrol Değişkeni).

CalWorks: Kamu yardımı alan ailelerin oranı (Sosyo-ekonomik Kontrol Değişkeni).

library(AER)
## Warning: package 'AER' was built under R version 4.5.2
## Zorunlu paket yükleniyor: car
## Zorunlu paket yükleniyor: carData
## 
## Attaching package: 'car'
## The following object is masked from 'package:psych':
## 
##     logit
## Zorunlu paket yükleniyor: lmtest
## Warning: package 'lmtest' was built under R version 4.5.2
## Zorunlu paket yükleniyor: zoo
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
## Zorunlu paket yükleniyor: sandwich
## Warning: package 'sandwich' was built under R version 4.5.2
## Zorunlu paket yükleniyor: survival
data("CASchools")

# Değişkenleri Hesaplama 
CASchools$testscore <- (CASchools$read + CASchools$math) / 2
CASchools$STR <- CASchools$students / CASchools$teachers

# Model 1: Basit Regresyon
model_ca_basit <- lm(testscore ~ STR, data = CASchools)

# Model 2: Çoklu Regresyon (Gelir ve Dil faktörü kontrol edildiğinde)
model_ca_coklu <- lm(testscore ~ STR + english + income, data = CASchools)

# Sonuç Karşılaştırma
summary(model_ca_coklu)
## 
## Call:
## lm(formula = testscore ~ STR + english + income, data = CASchools)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -42.800  -6.862   0.275   6.586  31.199 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 640.31550    5.77488 110.879   <2e-16 ***
## STR          -0.06878    0.27691  -0.248    0.804    
## english      -0.48827    0.02928 -16.674   <2e-16 ***
## income        1.49452    0.07483  19.971   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 10.35 on 416 degrees of freedom
## Multiple R-squared:  0.7072, Adjusted R-squared:  0.7051 
## F-statistic: 334.9 on 3 and 416 DF,  p-value: < 2.2e-16

Sonuçların Değerlendirilmesi

Modelin Adjusted R-squared değeri 0.7051 olarak bulunmuştur. Bu, Kaliforniya’daki eğitim bölgeleri arasındaki başarı farkının (testscore) yaklaşık %71’inin sadece sınıf mevcudu (STR), İngilizce seviyesi ve gelir düzeyi ile açıklanabildiğini gösterir. Bu, eğitim araştırmaları için oldukça yüksek bir açıklayıcılık oranıdır.

Değişkenlerin Etkisi

Gelir Düzeyi (income): Modeldeki en güçlü yordayıcıdır (t = 19.971, p < .001). Bölgedeki ortalama gelirdeki her 1 birimlik artış, test puanlarını yaklaşık 1.49 puan artırmaktadır. Bu durum, sosyo-ekonomik statünün akademik başarı üzerindeki baskın etkisini kanıtlar.

Dil Faktörü (English): Ana dili İngilizce olmayan öğrencilerin oranı arttıkça başarı puanları anlamlı şekilde düşmektedir (beta = -0.48, p < .001).

Öğrenci-Öğretmen Oranı (STR): İşte analizin en can alıcı noktası burasıdır. Basit regresyon yaptığımızda genellikle anlamlı çıkan sınıf mevcudu, gelir ve dil faktörü modele girince anlamlılığını yitirmiştir (p = 0.804)

Bu sonuç, Howell’ın SAT örneğinde tartıştığı “Karıştırıcı Değişken” etkisinin mükemmel bir örneğidir.Sınıf mevcutları (STR) aslında başarıyı doğrudan etkilemekten ziyade, “zengin bölgelerin hem daha küçük sınıflara hem de daha yüksek başarıya sahip olması” nedeniyle başarıyla ilişkili görünmektedir.Gelir ve dil desteği gibi yapısal değişkenleri kontrol ettiğimizde (istatistiksel olarak sabitlediğimizde), sınıf mevcudunun puanlar üzerindeki etkisi akademik başarının temel belirleyicilerinin sınıf mevcudundan ziyade, bölgelerin sosyo-ekonomik imkanları ve öğrencilerin dil arka planları olduğunu göstermektedir. Bu analiz, eğitim politikaları geliştirilirken sadece fiziksel imkanlara (sınıf büyüklüğü gibi) odaklanmanın, arka plandaki yapısal eşitsizlikler kontrol edilmediği sürece yanıltıcı sonuçlar doğurabileceğini ortaya koymaktadır.