1. SAT Scores and Education Spending Veri Seti ile Regresyon Analizleri

Giriş

Bu çalışmada, Statistical Methods for Psychology kitabının 15. bölümünde yer alan “SAT Scores and Education Spending” veri seti kullanılarak eğitim harcamaları ile öğrencilerin akademik başarıları arasındaki ilişki incelenmiştir. Veri seti, Amerika Birleşik Devletleri’ndeki 50 eyalete ait öğrenci başına eğitim harcaması (Expend), öğrenci-öğretmen oranı (PTRatio), öğretmen maaşları (Salary), SAT sınavına katılım oranı (PctSAT), ortalama SAT puanları (SAT), ACT sınavına katılım oranı (PctACT) ve ortalama ACT puanları (ACT) gibi değişkenleri içermektedir.

Eğitim harcamalarının öğrencilerin akademik başarılarını ne ölçüde yordadığını incelemek amacıyla öncelikle eğitim harcamaları ile SAT puanları arasındaki ilişki basit doğrusal regresyon analizi ile ele alınmıştır.

library(readr)

sat_data <- read_csv("sat_spending.csv")
## Rows: 50 Columns: 8
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (1): State
## dbl (7): Expend, PTRatio, Salary, PctSAT, SAT, PctACT, ACT
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
summary(sat_data)
##     State               Expend         PTRatio          Salary     
##  Length:50          Min.   :3.656   Min.   :13.80   Min.   :25.99  
##  Class :character   1st Qu.:4.882   1st Qu.:15.22   1st Qu.:30.98  
##  Mode  :character   Median :5.768   Median :16.60   Median :33.29  
##                     Mean   :5.905   Mean   :16.86   Mean   :34.83  
##                     3rd Qu.:6.434   3rd Qu.:17.57   3rd Qu.:38.55  
##                     Max.   :9.774   Max.   :24.30   Max.   :50.05  
##      PctSAT           SAT             PctACT           ACT       
##  Min.   : 4.00   Min.   : 844.0   Min.   : 2.00   Min.   :18.70  
##  1st Qu.: 9.00   1st Qu.: 897.2   1st Qu.:11.25   1st Qu.:20.45  
##  Median :28.00   Median : 945.5   Median :47.00   Median :21.30  
##  Mean   :35.24   Mean   : 965.9   Mean   :40.52   Mean   :21.04  
##  3rd Qu.:63.00   3rd Qu.:1032.0   3rd Qu.:65.75   3rd Qu.:21.57  
##  Max.   :81.00   Max.   :1107.0   Max.   :83.00   Max.   :22.40
head(sat_data)
## # A tibble: 6 × 8
##   State      Expend PTRatio Salary PctSAT   SAT PctACT   ACT
##   <chr>       <dbl>   <dbl>  <dbl>  <dbl> <dbl>  <dbl> <dbl>
## 1 Alabama      4.40    17.2   31.1      8  1029     61  20.2
## 2 Alaska       8.96    17.6   48.0     47   934     32  21  
## 3 Arizona      4.78    19.3   32.2     27   944     27  21.1
## 4 Arkansas     4.46    17.1   28.9      6  1005     66  20.3
## 5 California   4.99    24     41.1     45   902     11  21  
## 6 Colorado     5.44    18.4   34.6     29   980     62  21.5

Dağılımların İncelenmesi

par(mfrow = c(2,3))

qqnorm(sat_data$Expend); qqline(sat_data$Expend, col="red")
qqnorm(sat_data$PTRatio); qqline(sat_data$PTRatio, col="red")
qqnorm(sat_data$Salary); qqline(sat_data$Salary, col="red")
qqnorm(sat_data$PctSAT); qqline(sat_data$PctSAT, col="red")
qqnorm(sat_data$SAT); qqline(sat_data$SAT, col="red")
qqnorm(sat_data$ACT); qqline(sat_data$ACT, col="red")
mtext("Şekil 1.\nDeğişkenlere Ait Normal Q-Q Grafikleri",
      outer = TRUE, cex = 1.2, line = -2)

Regresyon analizine geçmeden önce, veri setinde yer alan değişkenlerin dağılımları incelenmiştir.Q-Q grafikleri incelendiğinde, özellikle PctSAT değişkeninin normal dağılımdan sapma gösterdiği görülmektedir

Model 1. Basit regresyon

model1 <- lm(SAT ~ Expend, data = sat_data)
summary(model1)
## 
## Call:
## lm(formula = SAT ~ Expend, data = sat_data)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -145.074  -46.821    4.087   40.034  128.489 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 1089.294     44.390  24.539  < 2e-16 ***
## Expend       -20.892      7.328  -2.851  0.00641 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 69.91 on 48 degrees of freedom
## Multiple R-squared:  0.1448, Adjusted R-squared:  0.127 
## F-statistic: 8.128 on 1 and 48 DF,  p-value: 0.006408

Eğitim harcamalarının (Expend) SAT puanları üzerindeki etkisini incelemek amacıyla basit doğrusal regresyon analizi gerçekleştirilmiştir. Analiz sonuçlarına göre model genel olarak istatistiksel olarak anlamlı bulunmuştur (F(1, 48) = 8.13, p < .01). Modelin açıklayıcılık düzeyi incelendiğinde, eğitim harcamalarının SAT puanlarındaki varyansın yaklaşık %14’ünü açıkladığı görülmektedir (R² = .145).

Regresyon katsayıları incelendiğinde, eğitim harcamalarının SAT puanları üzerinde negatif ve anlamlı bir etkiye sahip olduğu belirlenmiştir (β = -20.89, p < .01). Buna göre, eğitim harcamalarındaki bir birimlik artışın SAT puanlarında yaklaşık 20.89 puanlık bir azalış ile ilişkili olduğu görülmektedir.

library(ggplot2)
ggplot(sat_data, aes(x = Expend, y = SAT)) +
  geom_point(color = "blue") +
  geom_smooth(method = "lm", se = FALSE, color = "red") +
  labs(title = "Şekil 2.\nSAT ve Eğitim Harcaması İlişkisi",
       x = "Eğitim Harcaması",
       y = "SAT Puanı")
## `geom_smooth()` using formula = 'y ~ x'

Şekil 1’de eğitim harcamaları ile ortalama SAT puanları arasındaki ilişki saçılım grafiği ile gösterilmiştir. Grafikte yer alan regresyon doğrusu, iki değişken arasında negatif yönlü bir doğrusal ilişki olduğunu göstermektedir. Eğitim harcamalarının artmasının akademik başarıyı artırması beklenirken, elde edilen negatif yönlü ilişki dikkat çekicidir.

Model 2. Karıştırıcı Değişken (PctSAT) Etkisinin İncelenmesi

İlk aşamada gerçekleştirilen basit doğrusal regresyon analizinde, eğitim harcamaları ile SAT puanları arasında beklenmedik bir ilişki elde edilmiştir. Bu durumun daha ayrıntılı incelenebilmesi amacıyla analiz süreci genişletilmiştir. Bu kapsamda, SAT sınavına katılım oranını ifade eden PctSAT değişkeni modele dahil edilerek çoklu doğrusal regresyon analizi gerçekleştirilmiştir.

model2 <- lm(SAT ~ Expend + PctSAT, data = sat_data)
summary(model2)
## 
## Call:
## lm(formula = SAT ~ Expend + PctSAT, data = sat_data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -88.400 -22.884   1.968  19.142  68.755 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 993.8317    21.8332  45.519  < 2e-16 ***
## Expend       12.2865     4.2243   2.909  0.00553 ** 
## PctSAT       -2.8509     0.2151 -13.253  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 32.46 on 47 degrees of freedom
## Multiple R-squared:  0.8195, Adjusted R-squared:  0.8118 
## F-statistic: 106.7 on 2 and 47 DF,  p-value: < 2.2e-16

Eğitim harcamaları (Expend) ve SAT sınavına katılım oranının (PctSAT) birlikte etkisini incelemek amacıyla çoklu regresyon analizi yapılmıştır. Model anlamlı bulunmuş (p < .001) ve SAT puanlarındaki varyansın yaklaşık %82’sini açıklamıştır (R² = .819).

Sonuçlara göre, eğitim harcamalarının SAT puanları üzerinde pozitif ve anlamlı bir etkisi vardır (β = 12.29, p < .01). Buna karşılık, sınava katılım oranının negatif ve anlamlı bir etkisi bulunmaktadır (β = -2.85, p < .001).

Bu bulgular, basit regresyonda elde edilen negatif ilişkinin yanıltıcı olduğunu göstermektedir. PctSAT değişkeni modele dahil edildiğinde, eğitim harcamalarının etkisinin yön değiştirmesi bu değişkenin karıştırıcı bir değişken olduğunu ortaya koymaktadır.

Logaritmik Dönüşüm Sonrası Çoklu Regresyon Modeli

sat_data$LogPctSAT <- log(sat_data$PctSAT)

Veri setindeki değişkenlerin dağılımları incelendiğinde, özellikle SAT sınavına katılım oranını temsil eden PctSAT değişkeninin normal dağılım göstermediği ve çarpık bir yapıya sahip olduğu görülmüştür. Bu durum, regresyon analizinde modelin doğruluğunu olumsuz etkileyebileceğinden, ilgili değişkene logaritmik dönüşüm uygulanmıştır.

model_final <- lm(SAT ~ Expend + LogPctSAT, data = sat_data)
summary(model_final)
## 
## Call:
## lm(formula = SAT ~ Expend + LogPctSAT, data = sat_data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -61.510 -13.586  -2.587  16.562  54.932 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 1147.113     16.700   68.69  < 2e-16 ***
## Expend        11.130      3.264    3.41  0.00134 ** 
## LogPctSAT    -78.205      4.471  -17.49  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 25.78 on 47 degrees of freedom
## Multiple R-squared:  0.8861, Adjusted R-squared:  0.8813 
## F-statistic: 182.9 on 2 and 47 DF,  p-value: < 2.2e-16

Logaritmik dönüşüm sonrası kurulan çoklu doğrusal regresyon modeli istatistiksel olarak anlamlı bulunmuş (p < .001) ve SAT puanlarındaki varyansın yaklaşık %89’unu açıklamıştır (R² = .886). Bu değer, basit doğrusal regresyon modelinde elde edilen R² = .145 ve PctSAT değişkeninin eklendiği modelde elde edilen R² = .819 değerlerine kıyasla daha yüksek olup modelin açıklayıcılığının arttığını göstermektedir.

Kurulan modele göre SAT puanı aşağıdaki şekilde ifade edilmektedir:

SAT = 1147.11 + 11.13(Expend) − 78.21(LogPctSAT)

Buna göre, eğitim harcamalarındaki bir birimlik artış SAT puanlarında yaklaşık 11 puanlık bir artış ile ilişkiliyken, LogPctSAT değişkenindeki artış SAT puanlarında yaklaşık 78 puanlık bir azalış ile ilişkilidir. Bu durum, sınava katılım oranı arttıkça ortalama SAT puanlarının düşme eğiliminde olduğunu göstermektedir.

sat_data$predicted <- predict(model_final) #Tahmin edilen değerleri oluşturma

plot(sat_data$SAT, sat_data$predicted,
     xlab = "Gerçek SAT",
     ylab = "Tahmin Edilen SAT",
     main = "Şekil 3.\nGerçek ve Tahmin Edilen SAT İlişkisi")

abline(0,1, col="red")

Şekil 3’te gerçek SAT puanları ile model tarafından tahmin edilen SAT puanları arasındaki ilişki gösterilmektedir.Noktaların büyük ölçüde referans doğrusu etrafında yoğunlaştığı görülmektedir. Bu durum, kurulan regresyon modelinin gözlenen değerleri başarılı bir şekilde tahmin ettiğini göstermektedir.

Bu çalışmada eğitim harcamaları ile SAT puanları arasındaki ilişki incelenmiş ve başlangıçta elde edilen negatif ilişkinin yanıltıcı olduğu görülmüştür. SAT katılım oranı modele dahil edildiğinde bu ilişkinin yön değiştirdiği ve eğitim harcamalarının pozitif etkisinin ortaya çıktığı belirlenmiştir. Ayrıca logaritmik dönüşüm sonrasında modelin açıklayıcılığının arttığı görülmüştür. Elde edilen bulgular, çoklu regresyon analizinde karıştırıcı değişkenlerin kontrol edilmesinin önemini göstermektedir.

2. Modern Psychometrics with R Kitabı Egzersizleri

Bergh Data Set ile Multivariate Regresyon ve MANOVA Analizi

Bu çalışmada, Bergh Dataset veri seti kullanılarak bireylerin önyargı düzeyleri ile kişilik özellikleri arasındaki ilişkiler incelenmiştir. Veri setinde iki bağımlı değişken yer almaktadır: etnik önyargıyı temsil eden EP ve engellilere yönelik önyargıyı temsil eden DP.

Bağımsız değişkenler ise kişilik özelliklerine ilişkin ölçümlerden oluşmakta olup, A1 ve A2 (uyumluluk/agreeableness) ile O1 ve O2 (açıklık/openness) değişkenlerini içermektedir.

Bu çalışmanın amacı, söz konusu kişilik özelliklerinin önyargı düzeyleri üzerindeki etkisini çok değişkenli (multivariate) regresyon analizi ile incelemektir. Bu yaklaşım sayesinde birden fazla bağımlı değişken aynı anda ele alınarak değişkenler arasındaki ilişkiler daha kapsamlı bir biçimde değerlendirilmektedir.

library(MPsychoR)
## Warning: package 'MPsychoR' was built under R version 4.5.2
library(car)
## Zorunlu paket yükleniyor: carData
data("Bergh")

fitmvreg <- lm(cbind(EP, DP) ~ A1 + A2 + O1 + O2, data = Bergh)

summary(fitmvreg)  
## Response EP :
## 
## Call:
## lm(formula = EP ~ A1 + A2 + O1 + O2, data = Bergh)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -1.80940 -0.42065 -0.08615  0.36992  2.68498 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  5.521316   0.221269  24.953  < 2e-16 ***
## A1          -0.004603   0.058115  -0.079    0.937    
## A2          -0.455286   0.064013  -7.112 2.41e-12 ***
## O1          -0.259175   0.058675  -4.417 1.13e-05 ***
## O2          -0.248048   0.061255  -4.049 5.60e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.6212 on 856 degrees of freedom
## Multiple R-squared:   0.24,  Adjusted R-squared:  0.2365 
## F-statistic: 67.59 on 4 and 856 DF,  p-value: < 2.2e-16
## 
## 
## Response DP :
## 
## Call:
## lm(formula = DP ~ A1 + A2 + O1 + O2, data = Bergh)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -1.22691 -0.32035 -0.02323  0.27757  2.21455 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  4.85833    0.16234  29.927  < 2e-16 ***
## A1          -0.04127    0.04264  -0.968  0.33334    
## A2          -0.42763    0.04696  -9.105  < 2e-16 ***
## O1          -0.11797    0.04305  -2.740  0.00626 ** 
## O2          -0.17611    0.04494  -3.919 9.61e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.4557 on 856 degrees of freedom
## Multiple R-squared:  0.2742, Adjusted R-squared:  0.2709 
## F-statistic: 80.87 on 4 and 856 DF,  p-value: < 2.2e-16
Manova(fitmvreg, test.statistic = "Pillai")
## 
## Type II MANOVA Tests: Pillai test statistic
##    Df test stat approx F num Df den Df    Pr(>F)    
## A1  1  0.001205    0.516      2    855    0.5971    
## A2  1  0.103297   49.247      2    855 < 2.2e-16 ***
## O1  1  0.023774   10.411      2    855 3.411e-05 ***
## O2  1  0.026217   11.510      2    855 1.168e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Etnik önyargıyı (EP) yordamak amacıyla kurulan regresyon modeli istatistiksel olarak anlamlı bulunmuştur (F(4, 856) = 67.59, p < .001). Model, EP değişkenindeki varyansın yaklaşık %24’ünü açıklamaktadır (R² = .24).

Katsayılar incelendiğinde, A2, O1 ve O2 değişkenlerinin anlamlı yordayıcılar olduğu görülmektedir (p < .001). Bu değişkenlerin katsayılarının negatif olması, bu özelliklerdeki artışın etnik önyargı düzeyinde azalış ile ilişkili olduğunu göstermektedir. A1 değişkeninin anlamlı bir etkisi bulunmamıştır (p > .05).

Engellilere yönelik önyargıyı (DP) yordamak amacıyla kurulan regresyon modeli istatistiksel olarak anlamlı bulunmuştur (F(4, 856) = 80.87, p < .001). Model, DP değişkenindeki varyansın yaklaşık %27’sini açıklamaktadır (R² = .274).

Katsayılar incelendiğinde, A2, O1 ve O2 değişkenlerinin anlamlı yordayıcılar olduğu görülmektedir. Bu değişkenlerin katsayılarının negatif olması, bu özelliklerdeki artışın engellilere yönelik önyargı düzeyinde azalış ile ilişkili olduğunu göstermektedir.A1 değişkeninin anlamlı bir etkisi bulunmamıştır (p > .05).

Path Diyagramı

library(lavaan)
## Warning: package 'lavaan' was built under R version 4.5.3
## This is lavaan 0.6-21
## lavaan is FREE software! Please report any bugs.
library(semPlot)
## Warning: package 'semPlot' was built under R version 4.5.2
mvreg.model <- '
EP ~ A1 + A2 + O1 + O2
DP ~ A1 + A2 + O1 + O2
'

fitmvreg2 <- sem(mvreg.model, data = Bergh)

semPaths(fitmvreg2, what = "est", layout = "tree")

Şekilde, çok değişkenli regresyon modeline ait path diyagramı gösterilmektedir. Modelde A1, A2, O1 ve O2 değişkenleri dışsal (exogenous) değişkenler olarak yer almakta olup, EP ve DP değişkenleri içsel (endogenous) değişkenlerdir. İçsel değişkenler dışsal değişkenler tarafından yordanmakta, ayrıca EP ve DP arasında kovaryans bulunduğu görülmektedir.

Paskvan Dataset ile Moderatör Modeli

Bu çalışmada, Paskvan Dataset veri seti kullanılarak iş yoğunluğu ile bilişsel değerlendirme arasındaki ilişki incelenmiştir. Veri setinde bağımlı değişken olarak bilişsel değerlendirme (cogapp) ele alınırken, bağımsız değişken olarak iş yoğunluğu (wintense) kullanılmıştır. Ayrıca modele katılımcı iklimi (pclimate) değişkeni moderatör (düzenleyici) değişken olarak dahil edilmiştir.

Bu çalışmanın temel amacı, iş yoğunluğunun bilişsel değerlendirme üzerindeki etkisinin, katılımcı iklim düzeyine bağlı olarak değişip değişmediğini incelemektir. Bu kapsamda moderatör analizine dayalı çoklu regresyon modeli kurulmuştur.

library(QuantPsyc)
## Warning: package 'QuantPsyc' was built under R version 4.5.2
## Zorunlu paket yükleniyor: boot
## 
## Attaching package: 'boot'
## The following object is masked from 'package:car':
## 
##     logit
## Zorunlu paket yükleniyor: dplyr
## 
## Attaching package: 'dplyr'
## The following object is masked from 'package:car':
## 
##     recode
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
## Zorunlu paket yükleniyor: purrr
## 
## Attaching package: 'purrr'
## The following object is masked from 'package:car':
## 
##     some
## Zorunlu paket yükleniyor: MASS
## 
## Attaching package: 'MASS'
## The following object is masked from 'package:dplyr':
## 
##     select
## 
## Attaching package: 'QuantPsyc'
## The following object is masked from 'package:base':
## 
##     norm
data("Paskvan")

# Merkezleme
wintense.c <- scale(Paskvan$wintense, scale = FALSE)
pclimate.c <- scale(Paskvan$pclimate, scale = FALSE)

# Basit regresyonlar
fit.YX <- lm(cogapp ~ wintense.c, data = Paskvan)
round(summary(fit.YX)$coefficients, 4)
##             Estimate Std. Error  t value Pr(>|t|)
## (Intercept)   3.7265     0.0227 164.4470        0
## wintense.c    0.5458     0.0237  22.9954        0
fit.YZ <- lm(cogapp ~ pclimate.c, data = Paskvan)
round(summary(fit.YZ)$coefficients, 4)
##             Estimate Std. Error  t value Pr(>|t|)
## (Intercept)   3.7265     0.0272 136.8341        0
## pclimate.c   -0.3324     0.0304 -10.9408        0
# Moderatör modeli
fit.mod <- moderate.lm(x = wintense, z = pclimate, y = cogapp, data = Paskvan)
round(summary(fit.mod)$coefficients, 4)
##             Estimate Std. Error  t value Pr(>|t|)
## (Intercept)   3.7097     0.0227 163.0954   0.0000
## mcx           0.5003     0.0241  20.7653   0.0000
## mcz          -0.1790     0.0257  -6.9765   0.0000
## mcx:mcz      -0.0663     0.0236  -2.8094   0.0051
# Simple slopes
fit.ss <- sim.slopes(fit.mod, Paskvan$pclimate)
round(fit.ss, 4)
##             INT  Slope     SE    LCL    UCL
## at zHigh 3.5492 0.4407 0.0313 0.3793 0.5022
## at zMean 3.7097 0.5003 0.0241 0.4530 0.5475
## at zLow  3.8703 0.5598 0.0328 0.4953 0.6242

Moderatör analizinde yorumlamayı kolaylaştırmak ve çoklu doğrusal bağlantı (multicollinearity) sorununu azaltmak amacıyla bağımsız değişkenler merkezlenmiştir. Bu işlem sonucunda değişkenlerin ortalaması sıfıra eşitlenmiş ve etkileşim teriminin daha sağlıklı yorumlanması sağlanmıştır.

Düşük katılımcı iklim düzeyinde (zLow) iş yoğunluğunun etkisi daha güçlüdür (b = 0.5598). Ortalama düzeyde (zMean) bu etki biraz azalmakta (b = 0.5003), yüksek katılımcı iklim düzeyinde (zHigh) ise daha da zayıflamaktadır (b = 0.4407).

Bu bulgular, katılımcı iklim arttıkça iş yoğunluğu ile bilişsel değerlendirme arasındaki ilişkinin zayıfladığını göstermektedir. Dolayısıyla, katılımcı iklim değişkeninin bu ilişki üzerinde düzenleyici (moderator) bir rol oynadığı söylenebilir.

Paskvan Dataset ile Mediation Analizi

Bu çalışmada iş yoğunluğunun duygusal tükenme üzerindeki etkisinde bilişsel değerlendirmenin aracılık rolü incelenmiştir. Bu amaçla iki aşamalı regresyon modeli kurulmuş ve bootstrap yöntemi ile dolaylı etkiler test edilmiştir.

Elde edilen sonuçlar, bilişsel değerlendirmenin iş yoğunluğu ile duygusal tükenme arasındaki ilişkide anlamlı bir aracı rol oynadığını göstermektedir. Bu durum, iş yoğunluğunun duygusal tükenmeyi yalnızca doğrudan değil, aynı zamanda bilişsel değerlendirme üzerinden dolaylı olarak da etkilediğini ortaya koymaktadır.

library(mediation)
## Warning: package 'mediation' was built under R version 4.5.2
## Zorunlu paket yükleniyor: Matrix
## Zorunlu paket yükleniyor: mvtnorm
## Warning: package 'mvtnorm' was built under R version 4.5.2
## Zorunlu paket yükleniyor: sandwich
## Warning: package 'sandwich' was built under R version 4.5.2
## mediation: Causal Mediation Analysis
## Version: 4.5.1
# X → M
fit.MX <- lm(cogapp ~ wintense, data = Paskvan)

# X + M → Y
fit.YXM <- lm(emotion ~ wintense + cogapp, data = Paskvan)

set.seed(123)

fitmed <- mediation::mediate(
  fit.MX, fit.YXM,
  treat = "wintense",
  mediator = "cogapp",
  sims = 999,
  boot = TRUE
)
## Running nonparametric bootstrap
summary(fitmed)
## 
## Causal Mediation Analysis 
## 
## Nonparametric Bootstrap Confidence Intervals with the Percentile Method
## 
##                Estimate 95% CI Lower 95% CI Upper   p-value    
## ACME            0.33370      0.26056      0.41187 < 2.2e-16 ***
## ADE             0.24926      0.13650      0.36845 < 2.2e-16 ***
## Total Effect    0.58297      0.50014      0.67495 < 2.2e-16 ***
## Prop. Mediated  0.57242      0.42507      0.74632 < 2.2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Sample Size Used: 803 
## 
## 
## Simulations: 999

Yapılan aracılık analizi sonucunda, iş yoğunluğunun (wintense) duygusal tükenme (emotion) üzerindeki etkisinde bilişsel değerlendirmenin (cogapp) anlamlı bir aracı rol oynadığı görülmektedir. Dolaylı etki (ACME = 0.3337, p < .001) istatistiksel olarak anlamlı bulunmuştur.

Bununla birlikte, doğrudan etkinin (ADE = 0.2493, p < .001) de anlamlı olduğu belirlenmiştir. Bu durum, bilişsel değerlendirmenin iş yoğunluğu ile duygusal tükenme arasındaki ilişkide kısmi aracılık (partial mediation) rolü üstlendiğini göstermektedir.

Toplam etkinin anlamlı olduğu (Total Effect = 0.5830, p < .001) ve bu etkinin yaklaşık %57’sinin aracılık yoluyla gerçekleştiği (Prop. Mediated = 0.572) görülmektedir. Bu bulgular, iş yoğunluğunun duygusal tükenmeyi hem doğrudan hem de bilişsel değerlendirme üzerinden dolaylı olarak etkilediğini ortaya koymaktadır.

Paskvan Dataset ile Moderated Mediation Analizi

Bu çalışmada, iş yoğunluğunun duygusal tükenme üzerindeki dolaylı etkisinin katılımcı iklim düzeyine bağlı olarak değişip değişmediği incelenmiştir. Bu amaçla moderated mediation modeli kurulmuş ve dolaylı etkiler farklı katılımcı iklim düzeyleri için hesaplanmıştır.

library(lavaan)

medmod.model <- '
# regresyonlar
cogapp ~ a1*wintense + a2*pclimate + a3*wintense:pclimate
emotion ~ c*wintense + b*cogapp

# koşullu dolaylı etkiler
cie.q1 := (a1 + a3*2)*b
cie.q2 := (a1 + a3*3.5)*b
cie.q3 := (a1 + a3*5)*b
'

set.seed(123)

fitmedmod <- sem(
  medmod.model,
  data = Paskvan,
  se = "bootstrap",
  bootstrap = 999
)

summary(fitmedmod)
## lavaan 0.6-21 ended normally after 2 iterations
## 
##   Estimator                                         ML
##   Optimization method                           NLMINB
##   Number of model parameters                         7
## 
##   Number of observations                           803
## 
## Model Test User Model:
##                                                       
##   Test statistic                                23.079
##   Degrees of freedom                                 2
##   P-value (Chi-square)                           0.000
## 
## Parameter Estimates:
## 
##   Standard errors                            Bootstrap
##   Number of requested bootstrap draws              999
##   Number of successful bootstrap draws             999
## 
## Regressions:
##                    Estimate  Std.Err  z-value  P(>|z|)
##   cogapp ~                                            
##     wintense  (a1)    0.685    0.080    8.540    0.000
##     pclimate  (a2)    0.053    0.113    0.471    0.637
##     wntns:pcl (a3)   -0.066    0.031   -2.155    0.031
##   emotion ~                                           
##     wintense   (c)    0.249    0.054    4.608    0.000
##     cogapp     (b)    0.611    0.057   10.680    0.000
## 
## Variances:
##                    Estimate  Std.Err  z-value  P(>|z|)
##    .cogapp            0.385    0.028   13.551    0.000
##    .emotion           0.992    0.053   18.686    0.000
## 
## Defined Parameters:
##                    Estimate  Std.Err  z-value  P(>|z|)
##     cie.q1            0.338    0.034    9.976    0.000
##     cie.q2            0.277    0.040    6.843    0.000
##     cie.q3            0.216    0.060    3.610    0.000

Kurulan model sonuçları incelendiğinde, iş yoğunluğunun (wintense) bilişsel değerlendirme (cogapp) üzerindeki etkisinin anlamlı olduğu görülmektedir (a1 = 0.685, p < .001). Buna karşılık, katılımcı iklimin (pclimate) doğrudan etkisi anlamlı bulunmamıştır (a2 = 0.053, p > .05).

Ancak etkileşim teriminin (wintense × pclimate) anlamlı olduğu belirlenmiştir (a3 = -0.066, p < .05). Bu bulgu, katılımcı iklimin iş yoğunluğu ile bilişsel değerlendirme arasındaki ilişkiyi düzenlediğini (moderation) göstermektedir.

Bilişsel değerlendirmenin duygusal tükenme üzerindeki etkisinin de anlamlı olduğu görülmektedir (b = 0.611, p < .001). Ayrıca iş yoğunluğunun duygusal tükenme üzerindeki doğrudan etkisi de anlamlıdır (c’ = 0.249, p < .001).

Koşullu dolaylı etkiler incelendiğinde, tüm düzeylerde dolaylı etkinin anlamlı olduğu görülmektedir (cie.q1 = 0.338, cie.q2 = 0.277, cie.q3 = 0.216; p < .001). Ancak dolaylı etkinin büyüklüğü katılımcı iklim düzeyi arttıkça azalmaktadır.

Öğrenme Günlüğüm

Bu hafta derse katılamadığım için konuları sonradan izleyerek çalıştım. Süreç boyunca notlar çıkardım, kitapları inceledim ve ilgili egzersizleri uygulamaya çalıştım. Basit ve çoklu regresyon analizleri ile başlayarak değişkenler arasındaki temel ilişkileri anlamaya odaklandım. Ardından çok değişkenli (multivariate) regresyon ile birden fazla bağımlı değişkenin birlikte nasıl analiz edildiğini öğrendim.

Devamında moderatör ve medyatör modeller üzerinde çalışarak, değişkenler arasındaki ilişkilerin yalnızca doğrudan değil, aynı zamanda belirli koşullara bağlı olarak değişebildiğini ve dolaylı yollarla gerçekleşebildiğini fark ettim. Son olarak moderated mediation modeli ile bu iki yaklaşımın birlikte nasıl ele alındığını görerek, analizlerin daha bütüncül bir şekilde yorumlanabileceğini anladım.