Bu hafta derse canlı katılım sağlayamadım; ancak ders videosunu ve kayıtlarını detaylıca inceleyerek ödevimi hazırladım.Umarım doğru bir şekilde anlamışımdır:)
Ödevim 3 farklı analizden oluşmaktadır.
Bu çalışmada, David C. Howell’ın Statistical Methods for Psychology (8. Baskı) kitabının 15. bölümünde yer alan ve literatürde Guber (1999) verisi olarak bilinen “SAT Scores and Education Spending” seti kullanılmıştır.
Analizin Temel Sorusu: Eyalet bazında yapılan eğitim harcamaları (Expend), SAT puanlarını (SATcombined) nasıl etkilemektedir? Bu ilişkide sınava katılım oranının (PctSAT) “karıştırıcı” (confounding) etkisi nedir?
Analizde kullanılan veri seti, ABD’deki 50 eyalete ait şu değişkenleri içermektedir:
SATcombined: Eyalet bazında toplam SAT puanı (Bağımlı Değişken)
Expend: Öğrenci başına yapılan eğitim harcaması
PctSAT: Eyalette sınava katılan öğrencilerin yüzdesi
Bu analizin temel amacı, eğitim harcamaları ile akademik başarı (SAT puanları) arasındaki ilişkiyi incelerken, sınava katılım oranı gibi “karıştırıcı” (confounding) değişkenlerin etkisini gözlemlemektir. Howell (2012), basit regresyon analizinin yanıltıcı sonuçlar verebileceğini, bu sebeple üçüncü değişkenlerin kontrol edildiği Çoklu Regresyon modelinin gerekliliğini bu veri üzerinden tartışmaktadır.
setwd("C:/Users/User/OneDrive/Desktop/OLC_733")
veri <- read.table("Tab15-1.dat", header = TRUE)
# Verinin ilk 6 satırına bak
head(veri)
## id State Expend PTratio Salary PctSAT Verbal Math SATcombined PctACT
## 1 1 Alabama 4.405 17.2 31.144 8 491 538 1029 61
## 2 2 Alaska 8.963 17.6 47.951 47 445 489 934 32
## 3 3 Arizona 4.778 19.3 32.175 27 448 496 944 27
## 4 4 Ark 4.459 17.1 28.934 6 482 523 1005 66
## 5 5 Calif 4.992 24.0 41.078 45 417 485 902 11
## 6 6 Col 5.443 18.4 34.571 29 462 518 980 62
## ACTcombined LogPctSAT
## 1 20.2 2.079
## 2 21.0 3.850
## 3 21.1 3.296
## 4 20.3 1.792
## 5 21.0 3.807
## 6 21.5 3.367
# Kaç satır ve sütun
dim(veri)
## [1] 50 12
names(veri)
## [1] "id" "State" "Expend" "PTratio" "Salary"
## [6] "PctSAT" "Verbal" "Math" "SATcombined" "PctACT"
## [11] "ACTcombined" "LogPctSAT"
# model
model <- lm(SATcombined ~ Expend + PctSAT, data = veri)
# Sonuçlar
summary(model)
##
## Call:
## lm(formula = SATcombined ~ Expend + PctSAT, data = veri)
##
## Residuals:
## Min 1Q Median 3Q Max
## -88.400 -22.884 1.968 19.142 68.755
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 993.8317 21.8332 45.519 < 2e-16 ***
## Expend 12.2865 4.2243 2.909 0.00553 **
## PctSAT -2.8509 0.2151 -13.253 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 32.46 on 47 degrees of freedom
## Multiple R-squared: 0.8195, Adjusted R-squared: 0.8118
## F-statistic: 106.7 on 2 and 47 DF, p-value: < 2.2e-16
Analiz sonuçlarına göre, modele hem harcama (Expend) hem de katılım oranı (PctSAT) değişkenleri dahil edildiğinde, her iki yordayıcının da bağımlı değişken (SAT puanları) üzerinde istatistiksel olarak anlamlı bir etkisi olduğu görülmektedir (p < .01).
Eğitim Harcamaları (Expend): Diğer değişkenler sabit tutulduğunda, harcamadaki 1 birimlik (1000$) artış, SAT puanlarında yaklaşık 12.29 puanlık bir artışla ilişkilidir. Bu durum, eğitim bütçesinin akademik başarı üzerindeki pozitif katkısını net bir şekilde ortaya koymaktadır.
Katılım Oranı (PctSAT): Katılım oranındaki her %1’lik artış, toplam puanda 2.85 puanlık bir düşüşe neden olmaktadır. Bu beklenen bir durumdur; çünkü sınava katılım oranı arttıkça, örneklem sadece “en başarılı” öğrencilerden oluşmaktan çıkıp genel öğrenci popülasyonunu yansıtmaya başlamakta, bu da ortalamayı aşağı çekmektedir.
Modelin Açıklayıcılık Gücü (Multiple R-squared) 0.8195 olarak bulunmuştur. Bu değer, eyaletler arasındaki SAT puanı varyansının %82’sinin sadece eğitim harcamaları ve katılım oranı değişkenleri tarafından açıklandığını göstermektedir. Sosyal bilimler ve eğitim araştırmaları için bu oldukça yüksek ve tatmin edici bir açıklayıcılık oranıdır.
Eğer analiz sadece harcama ve puan arasında yapılsaydı, aradaki ilişki negatif görünecekti. Ancak katılım oranının (PctSAT) modele dahil edilmesiyle, harcamanın başarı üzerindeki “gerçek” pozitif etkisi maskelenmekten kurtulmuş ve ortaya çıkmıştır. Bu, eğitim politikaları değerlendirilirken bağlamsal değişkenlerin (contextual variables) kontrol edilmesinin önemini kanıtlamaktadır.
Yapılan çoklu regresyon analizi, eğitim harcamalarının akademik başarıyı artırmada önemli bir rol oynadığını doğrulamaktadır. Ancak bu ilişkinin doğru yorumlanabilmesi için sınava katılım oranları gibi demografik ve operasyonel değişkenlerin istatistiksel olarak kontrol edilmesi şarttır.
plot(model)
Regresyon modelinin güvenilirliğini test etmek amacıyla oluşturulan tanılayıcı grafikler incelendiğinde şu sonuçlara ulaşılmıştır:
Residuals vs Fitted: Hataların (residuals) tahmin edilen değerler etrafında rastgele dağıldığı görülmektedir. Bu durum, bağımlı ve bağımsız değişkenler arasındaki ilişkinin doğrusal (linear) olduğunu ve varyansın sabit olduğunu (homoscedasticity) doğrulamaktadır.
Normal Q-Q: Hataların büyük çoğunluğunun teorik çizgi üzerinde toplandığı görülmektedir. Bu, modeldeki hata terimlerinin normal dağılım sergilediğine dair güçlü bir kanıttır.
Scale-Location: Bu grafik, hataların yayılımının model boyunca sabit olduğunu destekleyerek, analizimizi etkileyecek ciddi bir değişen varyans (heteroscedasticity) sorunu olmadığını göstermektedir.
Residuals vs Leverage: Grafik üzerinde Cook’s Distance sınırlarını aşan çok uç bir gözlem (influential observation) bulunmamaktadır. Bu da model sonuçlarımızın tek bir eyaletin verisi tarafından domine edilmediğini, genel bir eğilimi yansıttığını kanıtlar.
Howell, Bölüm 15.10 ve devamında, iyi bir regresyon modelinin sadece yüksek açıklayıcılık gücüne (R^2) sahip olmasının yetmediğini, aynı zamanda hataların (residuals) belirli varsayımları karşılaması gerektiğini vurgular.
R ile elde ettiğimiz bu grafikler, kitaptaki şu kavramları doğrulamaktadır:
Doğrusallık ve Sabit Varyans: “Residuals vs Fitted” grafiği, Howell’ın belirttiği hataların rastgele dağılması gerekliliğini karşılamaktadır.
Normallik: “Normal Q-Q” grafiği, hataların normal dağılım varsayımına (normality of residuals) uygunluğunu göstermektedir.
Etkili Gözlemler (Leverage): “Residuals vs Leverage” grafiği, veri setindeki Alaska (9. eyalet) gibi uç değerlerin modelin genel eğilimini (regresyon doğrusunu) aşırı derecede büküp bükmediğini kontrol etmemize olanak tanır. Kitapta da belirtildiği gibi, Cook’s Distance sınırları içinde kaldığımız için modelimiz stabildir.
Patrick Mair’in “Modern Psychometrics with R” kitabında 3. Bölümün 76. sayfasına kadar işlediğiniz kısım, psikometrinin en temel ve güçlü araçlarından biri olan “Faktör Analizi” konusuna, spesifik olarak da Açımlayıcı Faktör Analizi konusuna giriş yapar.
Mair, bu bölümde şunu anlatıyor: Elimizde birbiriyle ilişkili çok sayıda madde olduğunda, bu soruların altında yatan “gizli yapıları” (latent variables) nasıl buluruz?
Temel Amaç: Veriyi boyutlandırmak ve özetlemek.
Kitabın bu bölümünde kişiliği ölçen “BFI” veri seti kullanılır. Bu veri seti psych paketi içerisinde hazır olarak bulunur. 25 maddeden oluşur ve insanların 5 büyük kişilik özelliğini (Açıklık, Sorumluluk, Dışadönüklük, Uyumluluk, Duygusal Tutarsızlık) nasıl puanladığını gösterir.
Analiz kapsamında, bfi veri setindeki 25 kişilik maddesi (5 alt boyut x 5 madde) seçilmiştir. Kişi sayısı (n=2800) ile madde sayısı (k=25) arasındaki oran, faktör analizinin sağlamlığı (robustness) açısından literatürdeki kriterleri fazlasıyla karşılamaktadır.
library(psych)
## Warning: package 'psych' was built under R version 4.5.2
data(bfi)
bfi_sub <- bfi[1:25]
bfi_clean <- na.omit(bfi_sub)
# nfactors = 5: Beş faktör
# rotate = "oblimin": Faktörler birbirine bağlı olabilir (Eğik döndürme)
# fm = "pa": Principal Axis factoring yöntemi
efa_model <- fa(bfi_clean, nfactors = 5, rotate = "oblimin", fm = "pa")
## Loading required namespace: GPArotation
# Sonuçları Görme
# cutoff = 0.3: 0.30'un altındaki düşük yükleri gizle
print(efa_model$loadings, cutoff = 0.3)
##
## Loadings:
## PA2 PA1 PA3 PA5 PA4
## A1 -0.435
## A2 0.656
## A3 0.678
## A4 0.448
## A5 0.537
## C1 0.555
## C2 0.669
## C3 0.574
## C4 -0.644
## C5 -0.563
## E1 0.555
## E2 0.667
## E3 -0.408 0.302
## E4 -0.587
## E5 -0.418
## N1 0.832
## N2 0.780
## N3 0.703
## N4 0.471 0.405
## N5 0.484
## O1 0.518
## O2 -0.473
## O3 0.619
## O4 0.335 0.363
## O5 -0.540
##
## PA2 PA1 PA3 PA5 PA4
## SS loadings 2.504 1.963 1.979 1.889 1.562
## Proportion Var 0.100 0.079 0.079 0.076 0.062
## Cumulative Var 0.100 0.179 0.258 0.333 0.396
Analiz başlangıcında belirtilen ‘Duygusal Tutarsızlık’ boyutu, literatürde ve analiz çıktısında ‘Nevrotiklik’ (Neuroticism) olarak; ‘Açıklık’ boyutu ise ‘Deneyime Açıklık’ olarak adlandırılmaktadır. Madde kodları (N1-N5 ve O1-O5) bu terminoloji ile uyumludur.
PA2 Nevrotiklik (Neuroticism): N1’den N5’e kadar olan tüm maddeler en yüksek burada toplanmış (0.832, 0.780 vb.).
PA1 Dışadönüklük (Extraversion): E1’den E5’e kadar olan maddeler burada (0.555, 0.667 vb.).
PA3 Sorumluluk (Conscientiousness): C1’den C5’e kadar olan maddeler burada toplanmış.
PA5 Uyumluluk (Agreeableness): A1’den A5’e kadar olan maddeler bu faktörün altında.
PA4 Deneyime Açıklık (Openness): O1’den O5’e kadar olan maddeler de bu grupta.
Tabloda bazı değerlerin başında eksi işareti var (Örn: A1 = -0.435, C4 = -0.644). Bu durum, o maddelerin “ters maddeler” olduğunu gösterir. Örneğin; faktör “Dışadönüklük” ise, eksi yüklü bir madde muhtemelen “Yalnız kalmayı severim” gibi bir cümledir. Bu, analizin ne kadar tutarlı olduğunu gösterir; maddeler anlamca birbirinin tersi olsa bile aynı faktör çatısı altında buluşmuşlardır.
Bu 5 faktör, 25 maddenin içerdiği toplam varyansın yaklaşık %40’ını açıklamaktadır.Not: Kişilik testleri gibi sosyal bilimlerde %40-60 arası bir açıklayıcılık oranı oldukça iyi kabul edilir. Patrick Mair de kitabında bu oranın bu veri seti için standart olduğunu belirtir.
N4 maddesi hem PA2 (0.471) hem de PA1 (0.405) faktörlerine yüklenmiştir. Bu durum, bu sorunun hem nevrotiklik hem de dışadönüklük ile ilişkili olduğunu, yani ‘saf’ bir madde olmadığını göstermektedir.
Yapılan Açımlayıcı Faktör Analizi (AFA) sonucunda, 25 maddenin ‘Beş Büyük Kişilik Özelliği’ kuramına uygun olarak 5 faktörlü bir yapı sergilediği görülmüştür. Özdeğerler (eigenvalues) ve paralel analiz sonuçları bu 5 faktörlü yapıyı desteklemektedir.Özellikle PA2 faktörünün Nevrotiklik boyutunu temsil ettiği ve en yüksek varyansı (0.10) açıkladığı saptanmıştır. Bazı maddelerdeki negatif yüklemeler (Örn: C4, A1), ilgili maddelerin ters puanlanmasıyla uyumludur. Toplam açıklanan varyansın %40 olması, modelin veri yapısını yeterli düzeyde özetlediğini kanıtlamaktadır.
Howell’ın SAT örneğinde ele aldığı “üçüncü değişkenlerin etkisi” temasını daha derinlemesine incelemek amacıyla Kaliforniya Eğitim Bölgeleri (CASchools) veri seti üzerinde bir analiz gerçekleştidim.
Bu analizin temel sorusu şudur: “Sınıf mevcutlarının (öğretmen başına düşen öğrenci sayısı) azaltılması, test puanlarını doğrudan artırır mı?”
AER paketi içerisinde yer alan bu veri seti, Kaliforniya’daki 420 bölgeye ait 1998-1999 yılı verilerini içermektedir. Analizde şu temel değişkenler kullanılacaktır:
STR (Student-Teacher Ratio): Sınıf mevcudu / Öğretmen başına düşen öğrenci sayısı (Bağımsız Değişken).
TestScore: Matematik ve okuma puanlarının ortalaması (Bağımlı Değişken).
English: Bölgedeki ana dili İngilizce olmayan öğrenci oranı (Kontrol Değişkeni).
CalWorks: Kamu yardımı alan ailelerin oranı (Sosyo-ekonomik Kontrol Değişkeni).
library(AER)
## Warning: package 'AER' was built under R version 4.5.2
## Zorunlu paket yükleniyor: car
## Zorunlu paket yükleniyor: carData
##
## Attaching package: 'car'
## The following object is masked from 'package:psych':
##
## logit
## Zorunlu paket yükleniyor: lmtest
## Warning: package 'lmtest' was built under R version 4.5.2
## Zorunlu paket yükleniyor: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
## Zorunlu paket yükleniyor: sandwich
## Warning: package 'sandwich' was built under R version 4.5.2
## Zorunlu paket yükleniyor: survival
data("CASchools")
# Değişkenleri Hesaplama
CASchools$testscore <- (CASchools$read + CASchools$math) / 2
CASchools$STR <- CASchools$students / CASchools$teachers
# Model 1: Basit Regresyon
model_ca_basit <- lm(testscore ~ STR, data = CASchools)
# Model 2: Çoklu Regresyon (Gelir ve Dil faktörü kontrol edildiğinde)
model_ca_coklu <- lm(testscore ~ STR + english + income, data = CASchools)
# Sonuç Karşılaştırma
summary(model_ca_coklu)
##
## Call:
## lm(formula = testscore ~ STR + english + income, data = CASchools)
##
## Residuals:
## Min 1Q Median 3Q Max
## -42.800 -6.862 0.275 6.586 31.199
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 640.31550 5.77488 110.879 <2e-16 ***
## STR -0.06878 0.27691 -0.248 0.804
## english -0.48827 0.02928 -16.674 <2e-16 ***
## income 1.49452 0.07483 19.971 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 10.35 on 416 degrees of freedom
## Multiple R-squared: 0.7072, Adjusted R-squared: 0.7051
## F-statistic: 334.9 on 3 and 416 DF, p-value: < 2.2e-16
Modelin Adjusted R-squared değeri 0.7051 olarak bulunmuştur. Bu, Kaliforniya’daki eğitim bölgeleri arasındaki başarı farkının (testscore) yaklaşık %71’inin sadece sınıf mevcudu (STR), İngilizce seviyesi ve gelir düzeyi ile açıklanabildiğini gösterir. Bu, eğitim araştırmaları için oldukça yüksek bir açıklayıcılık oranıdır.
Değişkenlerin Etkisi
Gelir Düzeyi (income): Modeldeki en güçlü yordayıcıdır (t = 19.971, p < .001). Bölgedeki ortalama gelirdeki her 1 birimlik artış, test puanlarını yaklaşık 1.49 puan artırmaktadır. Bu durum, sosyo-ekonomik statünün akademik başarı üzerindeki baskın etkisini kanıtlar.
Dil Faktörü (English): Ana dili İngilizce olmayan öğrencilerin oranı arttıkça başarı puanları anlamlı şekilde düşmektedir (beta = -0.48, p < .001).
Öğrenci-Öğretmen Oranı (STR): İşte analizin en can alıcı noktası burasıdır. Basit regresyon yaptığımızda genellikle anlamlı çıkan sınıf mevcudu, gelir ve dil faktörü modele girince anlamlılığını yitirmiştir (p = 0.804)
Bu sonuç, Howell’ın SAT örneğinde tartıştığı “Karıştırıcı Değişken” etkisinin mükemmel bir örneğidir.Sınıf mevcutları (STR) aslında başarıyı doğrudan etkilemekten ziyade, “zengin bölgelerin hem daha küçük sınıflara hem de daha yüksek başarıya sahip olması” nedeniyle başarıyla ilişkili görünmektedir.Gelir ve dil desteği gibi yapısal değişkenleri kontrol ettiğimizde (istatistiksel olarak sabitlediğimizde), sınıf mevcudunun puanlar üzerindeki etkisi akademik başarının temel belirleyicilerinin sınıf mevcudundan ziyade, bölgelerin sosyo-ekonomik imkanları ve öğrencilerin dil arka planları olduğunu göstermektedir. Bu analiz, eğitim politikaları geliştirilirken sadece fiziksel imkanlara (sınıf büyüklüğü gibi) odaklanmanın, arka plandaki yapısal eşitsizlikler kontrol edilmediği sürece yanıltıcı sonuçlar doğurabileceğini ortaya koymaktadır.