Bu hafta derste öğrendiğimiz kodları ve bilgileri daha iyi kavrayabilmek için, dersteki örnekten farklı bir veri seti üzerinde kendim çalışma yaptım. Analizimde, Bollen (1989) tarafından oluşturulan ve 75 ülkenin sanayileşme ile demokrasi verilerini içeren gerçek ‘PoliticalDemocracy’ veri setini kullandım. Bu sayede hem öğrendiklerimi pekiştirdim hem de yol analizi (path analysis) mantığını gerçek bir veri tabanı üzerinden test etme şansı buldum.
Veri setinin aktarılması
library(lavaan)
## Warning: package 'lavaan' was built under R version 4.5.2
## This is lavaan 0.6-21
## lavaan is FREE software! Please report any bugs.
library(semPlot)
## Warning: package 'semPlot' was built under R version 4.5.2
data("PoliticalDemocracy")
pd <- PoliticalDemocracy
head(pd)
## y1 y2 y3 y4 y5 y6 y7 y8 x1
## 1 2.50 0.000000 3.333333 0.000000 1.250000 0.000000 3.726360 3.333333 4.442651
## 2 1.25 0.000000 3.333333 0.000000 6.250000 1.100000 6.666666 0.736999 5.384495
## 3 7.50 8.800000 9.999998 9.199991 8.750000 8.094061 9.999998 8.211809 5.961005
## 4 8.90 8.800000 9.999998 9.199991 8.907948 8.127979 9.999998 4.615086 6.285998
## 5 10.00 3.333333 9.999998 6.666666 7.500000 3.333333 9.999998 6.666666 5.863631
## 6 7.50 3.333333 6.666666 6.666666 6.250000 1.100000 6.666666 0.368500 5.533389
## x2 x3
## 1 3.637586 2.557615
## 2 5.062595 3.568079
## 3 6.255750 5.224433
## 4 7.567863 6.267495
## 5 6.818924 4.573679
## 6 5.135798 3.892270
Bu modelde; 1960 yılındaki sanayileşme göstergelerinin (x_1, x_2, x_3), hem o yılın hem de 5 yıl sonrasının (1965) demokrasi seviyelerini nasıl etkilediğini test etmek istedim. Yol analizi (path analysis) kullanarak, sanayileşmenin demokratikleşme süreci üzerindeki doğrudan etkisine ve bu etkinin 1960’tan 1965’e zaman içinde nasıl bir değişim gösterdiğine baktım.
yol_modeli <- '
# 1960 Demokrasisi, Sanayileşme tarafından yordanır
y1 ~ x1 + x2 + x3
# 1965 Demokrasisi, hem 1960 verilerinden hem de sanayileşmeden etkilenir
y5 ~ y1 + x1
# Hata terimleri ve kovaryanslar
y1 ~~ y5
'
# Modeli Fit Etme
fit <- sem(yol_modeli, data = pd)
summary(fit, standardize = TRUE, fit.measures = TRUE)
## lavaan 0.6-21 ended normally after 50 iterations
##
## Estimator ML
## Optimization method NLMINB
## Number of model parameters 8
##
## Number of observations 75
##
## Model Test User Model:
##
## Test statistic 0.586
## Degrees of freedom 1
## P-value (Chi-square) 0.444
##
## Model Test Baseline Model:
##
## Test statistic 90.175
## Degrees of freedom 7
## P-value 0.000
##
## User Model versus Baseline Model:
##
## Comparative Fit Index (CFI) 1.000
## Tucker-Lewis Index (TLI) 1.035
##
## Loglikelihood and Information Criteria:
##
## Loglikelihood user model (H0) -311.381
## Loglikelihood unrestricted model (H1) -311.088
##
## Akaike (AIC) 638.762
## Bayesian (BIC) 657.302
## Sample-size adjusted Bayesian (SABIC) 632.088
##
## Root Mean Square Error of Approximation:
##
## RMSEA 0.000
## 90 Percent confidence interval - lower 0.000
## 90 Percent confidence interval - upper 0.278
## P-value H_0: RMSEA <= 0.050 0.485
## P-value H_0: RMSEA >= 0.080 0.457
##
## Standardized Root Mean Square Residual:
##
## SRMR 0.010
##
## Parameter Estimates:
##
## Standard errors Standard
## Information Expected
## Information saturated (h1) model Structured
##
## Regressions:
## Estimate Std.Err z-value P(>|z|) Std.lv Std.all
## y1 ~
## x1 1.889 0.856 2.206 0.027 1.889 0.528
## x2 -0.206 0.379 -0.543 0.587 -0.206 -0.119
## x3 -0.092 0.260 -0.356 0.722 -0.092 -0.050
## y5 ~
## y1 -0.204 1.525 -0.134 0.894 -0.204 -0.204
## x1 2.292 2.122 1.080 0.280 2.292 0.643
##
## Covariances:
## Estimate Std.Err z-value P(>|z|) Std.lv Std.all
## .y1 ~~
## .y5 4.718 8.827 0.534 0.593 4.718 0.785
##
## Variances:
## Estimate Std.Err z-value P(>|z|) Std.lv Std.all
## .y1 5.760 0.941 6.124 0.000 5.760 0.849
## .y5 6.267 14.422 0.435 0.664 6.267 0.931
Modelin verilere ne kadar iyi uyduğunu gösterir.
Ki-Kare Değerin 0.586 ve P-value değerinin 0.444 olması mükemmeldir. İstatistikte bu değerin 0.05’ten büyük olmasını isteriz (Model ile veri arasında anlamlı bir fark olmadığını gösterir).
CFI ve TLI: CFI değerin 1.000. Bu, modelin mükemmel uyum sağladığını gösterir (0.95 üstü mükemmeldir). TLI’nın 1.00 üzerinde olması (1.035) yine kusursuz bir uyuma işaret eder.
RMSEA: Değerin 0.000. Bu, hata payının yok denecek kadar az olduğunu kanıtlar (0.05 altı idealdir).
SRMR: 0.010 değeri, standartlaştırılmış kalıntıların çok düşük olduğunu ve modelin veriyi çok iyi temsil ettiğini gösterir.
Modelin uyum indeksleri (CFI=1.000, RMSEA=0.000), kurulan teorik modelin gözlenen verilerle mükemmel bir uyum içinde olduğunu kanıtlamaktadır.
Burada hangi değişkenin hangisini gerçekten etkilediğine bakıyoruz (P(>|z|) sütunu 0.05’ten küçükse etki anlamlıdır).
y1 (1960 Demokrasisi) Üzerindeki Etkiler:x1 -> y1: Etki katsayısı 1.889 ve p-değeri 0.027.
Bu sonuç istatistiksel olarak anlamlıdır. Yani, x1 (Sanayileşme göstergesi), 1960 yılındaki demokrasiyi pozitif yönde güçlü bir şekilde etkilemektedir.
x2 ve x3 -> y1: Bu yolların p-değerleri (0.587 ve 0.722) 0.05’ten büyük olduğu için bu değişkenlerin y1 üzerinde doğrudan anlamlı bir etkisi gözlenmemiştir.
y5 (1965 Demokrasisi) Üzerindeki Etkiler:Hem y1’in hem de x1’in y5 üzerindeki etkisi bu modelde anlamlı çıkmamış (p > 0.05). Bu durum, 1965 yılındaki demokrasi düzeyinin bu modeldeki bağımsız değişkenlerden ziyade, model dışı başka faktörlerden etkilenmiş olabileceğini gösterir.
y1 ~~ .y5 (Kovaryans): 1960 ve 1965 demokrasilerinin hata terimleri arasındaki ilişki anlamlı bulunmamıştır (p = 0.593).
Varyanslar: y1 değişkeninin varyansı anlamlıdır (p < 0.001), yani veride bu değişken açısından açıklanması gereken bir çeşitlilik bulunmaktadır.
Yapılan yol analizi sonucunda, sanayileşmenin temel göstergelerinden biri olan x1’in, ülkelerin 1960 yılındaki demokrasi düzeyleri (y1) üzerinde pozitif ve anlamlı bir etkiye sahip olduğu saptanmıştır (beta = 1.889, p < 0.05). Ancak, 1965 yılındaki demokrasi düzeyi (y5) üzerinde doğrudan sanayileşmenin veya bir önceki dönem demokrasisinin anlamlı bir etkisi bu veri seti özelinde gözlemlenmemiştir.
Analizimin son aşamasında, elde ettiğim tüm bu katsayılar ve değişkenler arasındaki ilişkileri daha net görebilmek için bir yol diyagramı (path diagram) oluşturdum. semPaths fonksiyonu ile hazırladığım bu görselleştirme, sanayileşme göstergelerinden demokrasi düzeylerine giden yolları ve bu etkilerin gücünü (standartlaştırılmış katsayılar üzerinden) toplu bir şekilde görmemi sağladı.
semPaths(fit,
whatLabels = "std", # Standart katsayıları çizgilerin üzerine yazar
layout = "tree2", # Düzenli bir akış şeması sağlar
edge.label.cex = 1.2, # Yazı büyüklüğü
edge.color = "darkblue", # Çizgi rengi
color = "lightblue", # Kutu rengi
sizeMan = 10, # Kutu büyüklüğü
fade = FALSE)
Şekil 1: Sanayileşme ve Demokrasi Arasındaki İlişkilerin Yol Analizi Diyagramı
Bu diyagram, değişkenler arasındaki doğrudan etkileri ve bu etkilerin gücünü göstermektedir. Şekil üzerindeki değerler standardize edilmiş katsayılar (Beta) olup şu şekilde yorumlanmaktadır:
Sanayileşmenin Doğrudan Etkisi: Analiz sonuçlarına göre, sanayileşmenin en güçlü göstergesi olan x1 değişkeni, 1960 yılındaki demokrasi düzeyi (y1) üzerinde 0.53 katsayısı ile pozitif ve anlamlı bir etkiye sahiptir. Bu durum, x1’deki bir birimlik standart sapma artışının, y1 üzerinde 0.53 birimlik bir artış sağladığını gösterir.
Anlamlı Olmayan Yollar: Diyagramda görülen diğer yollar (örneğin x2’den y1’e -0.12 veya y1’den y5’e -0.20) istatistiksel olarak anlamlı eşik değerine ulaşamamıştır. Bu, ilgili değişkenlerin bu model çerçevesinde güçlü bir yordayıcı olmadığını kanıtlar.
Açıklanan Varyans ve Hatalar: Değişkenlerin altındaki kavisli oklar (residual varyanslar), modelin açıklayamadığı hata paylarını temsil eder. Örneğin y1 için bu değer 0.85’tir; bu da modelin y1 değişkenindeki değişimin yaklaşık %15’ini (1 - 0.85) açıkladığını gösterir.
Değişkenler Arası Korelasyon: Üst kısımdaki kesikli oklar (örneğin x1 ve x2 arasındaki 0.89), bağımsız değişkenlerin kendi aralarında ne kadar yüksek korelasyona sahip olduğunu ve birbirini desteklediğini göstermektedir.
x1 sanayileşmenin temel taşıdır (örneğin kişi başı milli gelir gibi), x2 ve x3 ise tamamlayıcı unsurlardır ve bu modelde x1’in etkisi o kadar baskındır ki diğerleri gölgede kalmıştır.