Bu hafta derste öğrendiğimiz kodları ve bilgileri daha iyi kavrayabilmek için, dersteki örnekten farklı bir veri seti üzerinde kendim çalışma yaptım. Analizimde, Bollen (1989) tarafından oluşturulan ve 75 ülkenin sanayileşme ile demokrasi verilerini içeren gerçek ‘PoliticalDemocracy’ veri setini kullandım. Bu sayede hem öğrendiklerimi pekiştirdim hem de yol analizi (path analysis) mantığını gerçek bir veri tabanı üzerinden test etme şansı buldum.

Sanayileşme Göstergelerinin Demokratikleşme Süreci Üzerindeki Etkilerinin Yol Analizi ile İncelenmesi

Veri setinin aktarılması

library(lavaan)
## Warning: package 'lavaan' was built under R version 4.5.2
## This is lavaan 0.6-21
## lavaan is FREE software! Please report any bugs.
library(semPlot)
## Warning: package 'semPlot' was built under R version 4.5.2
data("PoliticalDemocracy")
pd <- PoliticalDemocracy

head(pd)
##      y1       y2       y3       y4       y5       y6       y7       y8       x1
## 1  2.50 0.000000 3.333333 0.000000 1.250000 0.000000 3.726360 3.333333 4.442651
## 2  1.25 0.000000 3.333333 0.000000 6.250000 1.100000 6.666666 0.736999 5.384495
## 3  7.50 8.800000 9.999998 9.199991 8.750000 8.094061 9.999998 8.211809 5.961005
## 4  8.90 8.800000 9.999998 9.199991 8.907948 8.127979 9.999998 4.615086 6.285998
## 5 10.00 3.333333 9.999998 6.666666 7.500000 3.333333 9.999998 6.666666 5.863631
## 6  7.50 3.333333 6.666666 6.666666 6.250000 1.100000 6.666666 0.368500 5.533389
##         x2       x3
## 1 3.637586 2.557615
## 2 5.062595 3.568079
## 3 6.255750 5.224433
## 4 7.567863 6.267495
## 5 6.818924 4.573679
## 6 5.135798 3.892270

Bu modelde; 1960 yılındaki sanayileşme göstergelerinin (x_1, x_2, x_3), hem o yılın hem de 5 yıl sonrasının (1965) demokrasi seviyelerini nasıl etkilediğini test etmek istedim. Yol analizi (path analysis) kullanarak, sanayileşmenin demokratikleşme süreci üzerindeki doğrudan etkisine ve bu etkinin 1960’tan 1965’e zaman içinde nasıl bir değişim gösterdiğine baktım.

Yol Analizi ve Model Kurma

yol_modeli <- '
  # 1960 Demokrasisi, Sanayileşme tarafından yordanır
  y1 ~ x1 + x2 + x3
  
  # 1965 Demokrasisi, hem 1960 verilerinden hem de sanayileşmeden etkilenir
  y5 ~ y1 + x1
  
  # Hata terimleri ve kovaryanslar 
  y1 ~~ y5
'

#  Modeli Fit Etme 
fit <- sem(yol_modeli, data = pd)

summary(fit, standardize = TRUE, fit.measures = TRUE)
## lavaan 0.6-21 ended normally after 50 iterations
## 
##   Estimator                                         ML
##   Optimization method                           NLMINB
##   Number of model parameters                         8
## 
##   Number of observations                            75
## 
## Model Test User Model:
##                                                       
##   Test statistic                                 0.586
##   Degrees of freedom                                 1
##   P-value (Chi-square)                           0.444
## 
## Model Test Baseline Model:
## 
##   Test statistic                                90.175
##   Degrees of freedom                                 7
##   P-value                                        0.000
## 
## User Model versus Baseline Model:
## 
##   Comparative Fit Index (CFI)                    1.000
##   Tucker-Lewis Index (TLI)                       1.035
## 
## Loglikelihood and Information Criteria:
## 
##   Loglikelihood user model (H0)               -311.381
##   Loglikelihood unrestricted model (H1)       -311.088
##                                                       
##   Akaike (AIC)                                 638.762
##   Bayesian (BIC)                               657.302
##   Sample-size adjusted Bayesian (SABIC)        632.088
## 
## Root Mean Square Error of Approximation:
## 
##   RMSEA                                          0.000
##   90 Percent confidence interval - lower         0.000
##   90 Percent confidence interval - upper         0.278
##   P-value H_0: RMSEA <= 0.050                    0.485
##   P-value H_0: RMSEA >= 0.080                    0.457
## 
## Standardized Root Mean Square Residual:
## 
##   SRMR                                           0.010
## 
## Parameter Estimates:
## 
##   Standard errors                             Standard
##   Information                                 Expected
##   Information saturated (h1) model          Structured
## 
## Regressions:
##                    Estimate  Std.Err  z-value  P(>|z|)   Std.lv  Std.all
##   y1 ~                                                                  
##     x1                1.889    0.856    2.206    0.027    1.889    0.528
##     x2               -0.206    0.379   -0.543    0.587   -0.206   -0.119
##     x3               -0.092    0.260   -0.356    0.722   -0.092   -0.050
##   y5 ~                                                                  
##     y1               -0.204    1.525   -0.134    0.894   -0.204   -0.204
##     x1                2.292    2.122    1.080    0.280    2.292    0.643
## 
## Covariances:
##                    Estimate  Std.Err  z-value  P(>|z|)   Std.lv  Std.all
##  .y1 ~~                                                                 
##    .y5                4.718    8.827    0.534    0.593    4.718    0.785
## 
## Variances:
##                    Estimate  Std.Err  z-value  P(>|z|)   Std.lv  Std.all
##    .y1                5.760    0.941    6.124    0.000    5.760    0.849
##    .y5                6.267   14.422    0.435    0.664    6.267    0.931

Model Uyum İyiliği (Model Fit) Analizi

Modelin verilere ne kadar iyi uyduğunu gösterir.

Ki-Kare Değerin 0.586 ve P-value değerinin 0.444 olması mükemmeldir. İstatistikte bu değerin 0.05’ten büyük olmasını isteriz (Model ile veri arasında anlamlı bir fark olmadığını gösterir).

CFI ve TLI: CFI değerin 1.000. Bu, modelin mükemmel uyum sağladığını gösterir (0.95 üstü mükemmeldir). TLI’nın 1.00 üzerinde olması (1.035) yine kusursuz bir uyuma işaret eder.

RMSEA: Değerin 0.000. Bu, hata payının yok denecek kadar az olduğunu kanıtlar (0.05 altı idealdir).

SRMR: 0.010 değeri, standartlaştırılmış kalıntıların çok düşük olduğunu ve modelin veriyi çok iyi temsil ettiğini gösterir.

Modelin uyum indeksleri (CFI=1.000, RMSEA=0.000), kurulan teorik modelin gözlenen verilerle mükemmel bir uyum içinde olduğunu kanıtlamaktadır.

Regresyon (Yol) Katsayılarının Analizi

Burada hangi değişkenin hangisini gerçekten etkilediğine bakıyoruz (P(>|z|) sütunu 0.05’ten küçükse etki anlamlıdır).

y1 (1960 Demokrasisi) Üzerindeki Etkiler:x1 -> y1: Etki katsayısı 1.889 ve p-değeri 0.027.

Bu sonuç istatistiksel olarak anlamlıdır. Yani, x1 (Sanayileşme göstergesi), 1960 yılındaki demokrasiyi pozitif yönde güçlü bir şekilde etkilemektedir.

x2 ve x3 -> y1: Bu yolların p-değerleri (0.587 ve 0.722) 0.05’ten büyük olduğu için bu değişkenlerin y1 üzerinde doğrudan anlamlı bir etkisi gözlenmemiştir.

y5 (1965 Demokrasisi) Üzerindeki Etkiler:Hem y1’in hem de x1’in y5 üzerindeki etkisi bu modelde anlamlı çıkmamış (p > 0.05). Bu durum, 1965 yılındaki demokrasi düzeyinin bu modeldeki bağımsız değişkenlerden ziyade, model dışı başka faktörlerden etkilenmiş olabileceğini gösterir.

Kovaryans ve Varyans Analizi

y1 ~~ .y5 (Kovaryans): 1960 ve 1965 demokrasilerinin hata terimleri arasındaki ilişki anlamlı bulunmamıştır (p = 0.593).

Varyanslar: y1 değişkeninin varyansı anlamlıdır (p < 0.001), yani veride bu değişken açısından açıklanması gereken bir çeşitlilik bulunmaktadır.

Yapılan yol analizi sonucunda, sanayileşmenin temel göstergelerinden biri olan x1’in, ülkelerin 1960 yılındaki demokrasi düzeyleri (y1) üzerinde pozitif ve anlamlı bir etkiye sahip olduğu saptanmıştır (beta = 1.889, p < 0.05). Ancak, 1965 yılındaki demokrasi düzeyi (y5) üzerinde doğrudan sanayileşmenin veya bir önceki dönem demokrasisinin anlamlı bir etkisi bu veri seti özelinde gözlemlenmemiştir.

Yol Diyagramı

Analizimin son aşamasında, elde ettiğim tüm bu katsayılar ve değişkenler arasındaki ilişkileri daha net görebilmek için bir yol diyagramı (path diagram) oluşturdum. semPaths fonksiyonu ile hazırladığım bu görselleştirme, sanayileşme göstergelerinden demokrasi düzeylerine giden yolları ve bu etkilerin gücünü (standartlaştırılmış katsayılar üzerinden) toplu bir şekilde görmemi sağladı.

semPaths(fit, 
         whatLabels = "std",       # Standart katsayıları çizgilerin üzerine yazar
         layout = "tree2",         # Düzenli bir akış şeması sağlar
         edge.label.cex = 1.2,     # Yazı büyüklüğü
         edge.color = "darkblue",  # Çizgi rengi
         color = "lightblue",      # Kutu rengi
         sizeMan = 10,             # Kutu büyüklüğü
         fade = FALSE)

Şekil 1: Sanayileşme ve Demokrasi Arasındaki İlişkilerin Yol Analizi Diyagramı

Bu diyagram, değişkenler arasındaki doğrudan etkileri ve bu etkilerin gücünü göstermektedir. Şekil üzerindeki değerler standardize edilmiş katsayılar (Beta) olup şu şekilde yorumlanmaktadır:

Sanayileşmenin Doğrudan Etkisi: Analiz sonuçlarına göre, sanayileşmenin en güçlü göstergesi olan x1 değişkeni, 1960 yılındaki demokrasi düzeyi (y1) üzerinde 0.53 katsayısı ile pozitif ve anlamlı bir etkiye sahiptir. Bu durum, x1’deki bir birimlik standart sapma artışının, y1 üzerinde 0.53 birimlik bir artış sağladığını gösterir.

Anlamlı Olmayan Yollar: Diyagramda görülen diğer yollar (örneğin x2’den y1’e -0.12 veya y1’den y5’e -0.20) istatistiksel olarak anlamlı eşik değerine ulaşamamıştır. Bu, ilgili değişkenlerin bu model çerçevesinde güçlü bir yordayıcı olmadığını kanıtlar.

Açıklanan Varyans ve Hatalar: Değişkenlerin altındaki kavisli oklar (residual varyanslar), modelin açıklayamadığı hata paylarını temsil eder. Örneğin y1 için bu değer 0.85’tir; bu da modelin y1 değişkenindeki değişimin yaklaşık %15’ini (1 - 0.85) açıkladığını gösterir.

Değişkenler Arası Korelasyon: Üst kısımdaki kesikli oklar (örneğin x1 ve x2 arasındaki 0.89), bağımsız değişkenlerin kendi aralarında ne kadar yüksek korelasyona sahip olduğunu ve birbirini desteklediğini göstermektedir.

x1 sanayileşmenin temel taşıdır (örneğin kişi başı milli gelir gibi), x2 ve x3 ise tamamlayıcı unsurlardır ve bu modelde x1’in etkisi o kadar baskındır ki diğerleri gölgede kalmıştır.