SPSS Syntax Kullanarak Çok Kategorili Değişken İçin Kukla Değişkenlerin Oluşturulması

Modelin son aşaması olan “Kentleşme Durumu” değişkeninin analize dahil edilebilmesi için, bu üç kategorili (degurba) değişkenin, regresyon modelinin yorumlayabileceği sayısal bir formata dönüştürülmesi gerekmektedir. Bu bölümde, degurba değişkeninden üç adet yeni kukla (dummy) değişken, SPSS Syntax editörü kullanılarak oluşturulmuştur.

Kukla Değişken Oluşturma Syntax Kodu

Aşağıdaki kod bloğu, orijinal degurba değişkenini (1=Kırsal, 2=Orta Yoğun Kent, 3=Yoğun Kent) temel alarak kirsal, ortayogun ve yogun adında üç yeni kukla değişken oluşturmak ve etiketlemek için kullanılmıştır.

* --- Kentleşme Durumu için Kukla Değişkenlerin Oluşturulması ---.

RECODE degurba (1=1) (2,3=0) INTO kirsal.
RECODE degurba (2=1) (1,3=0) INTO ortayogun.
RECODE degurba (3=1) (1,2=0) INTO yogun.
EXECUTE.

* --- Yeni Değişkenlere Etiket Atanması ---.

VALUE LABELS kirsal
    1 'Kırsal'
    0 'Kırsal Değil'.
VALUE LABELS ortayogun
    1 'Orta Yoğun'
    0 'Orta Yoğun Değil'.
VALUE LABELS yogun
    1 'Yoğun Kent'
    0 'Yoğun Kent Değil'.
EXECUTE.

* --- Kontrol için Frekans Analizi ---.

FREQUENCIES VARIABLES=degurba kirsal ortayogun yogun.

Syntax Komutlarının Teknik Açıklaması

RECODE Komutu: Bu komut, her bir kategoriyi temsil eden yeni ikili (0/1) değişkenleri yaratır.

VALUE LABELS ve FREQUENCIES Komutları: Cinsiyet değişkeninde olduğu gibi, bu komutlar da sırasıyla yeni oluşturulan 0/1 değişkenlerine anlaşılır etiketler atamak ve yeniden kodlama işleminin doğruluğunu (orijinal ve yeni değişkenlerdeki vaka sayılarının eşleştiğini) kontrol etmek için kullanılmıştır.

Sonuç ve Regresyona Geçiş İçin Temel Kuralın Tekrarı

Hocamızın da gösterdiği gibi, kodun doğruluğu teyit edildikten sonra TEMPORARY komutu kaldırılarak yeni kukla değişkenler (kirsal, ortayogun, yogun) veri setine kalıcı olarak kaydedilmiştir.

Bu kritik adımın tamamlanmasıyla birlikte, hocamızın da altını önemle çizdiği temel kuralı bir kez daha hatırlamak gerekir: K sayıda kategoriden oluşturulan K adet kukla değişkenin tamamı aynı anda modele dahil edilemez. Regresyon modeline, bu kukla değişkenlerden en fazla K-1 tanesi eklenebilir. Bu durumda, 3 kategoriden oluşturduğumuz 3 kukla değişkenden en fazla 2 tanesini aynı anda modele koyabiliriz. Dışarıda bırakılan kategori, modeldeki diğer kentsel yoğunluk kategorilerinin karşılaştırılacağı referans kategorisi olacaktır.

Kırsal Alanın Diğer Yerleşim Yerlerine Kıyasla Etkisinin İncelenmesi

“Kentleşme Durumu” için kukla değişkenler oluşturulduktan sonra, analizin bu aşamasında yerleşim yerinin gelir üzerindeki etkisinin olup olmadığı bir regresyon modeli ile test edilecektir. Hocamızın da belirttiği gibi, bu ilk modelde, bilinçli bir metodolojik sadeleştirmeye gidilerek, oluşturulan üç kukla değişkenden yalnızca kirsal değişkeni bağımsız değişken olarak modele dahil edilmiştir.

Bu yaklaşımda, “Orta Yoğun Kent” ve “Yoğun Kent” kategorileri birleştirilerek kirsal değişkeninin “0” (Kırsal Değil) kodunu alan bir referans grubu oluşturulmaktadır. Dolayısıyla, bu basit regresyon analizi, spesifik olarak “kırsal bir bölgede yaşamanın (kirsal=1), kırsal olmayan bir bölgede (orta yoğun veya yoğun kent) yaşamaya (kirsal=0) kıyasla” gelir seviyesi üzerinde istatistiksel olarak anlamlı bir etkisi olup olmadığını test edecektir. Bu analiz, daha karmaşık olan nihai modele geçmeden önce, kır/kent ayrımının temel etkisini görmek için önemli bir ilk adım niteliğindedir.

Modelin Genel Değerlendirmesi ve Beklenmedik Bulgu

Anlamsız Katsayının Doğru Yorumlanması

Hocamızın da altını önemle çizdiği gibi, bu bulgu, “kırsalda yaşamanın gelirle hiçbir ilişkisi yoktur” şeklinde basitçe yorumlanmamalıdır. Regresyon analizinin gücü, değişkenlerin net etkisini göstermesinde yatar. Bu katsayının doğru ve teknik yorumu şöyledir:

“Yaş, eğitim seviyesi ve cinsiyetin etkileri kontrol altına alındığında, kırsalda yaşamanın, kırsal olmayan bir yerde (orta yoğun veya yoğun kent) yaşamaya kıyasla gelir seviyesi üzerinde istatistiksel olarak anlamlı bir etkisi yoktur.”

Hocamızın da belirttiği gibi, ilk bakışta mantığa aykırı görünen bu durumun birkaç olası teknik açıklaması olabilir:

  1. Aracılık Etkisi (Mediation): Kırsalda yaşamanın gelir üzerindeki etkisi, doğrudan bir etki olmayabilir. Modeldeki diğer değişkenler, bu ilişkiye aracılık ediyor olabilir. Örneğin, kırsal bölgelerdeki bireylerin genel olarak daha düşük eğitim seviyelerine sahip olması muhtemeldir. Bu durumda, kırsalda yaşamak, düşük eğitime yol açmakta ve asıl gelir düşüklüğüne neden olan faktör eğitim olmaktadır. Bizim modelimiz zaten eğitimin etkisini doğrudan kontrol ettiği için, kırsalın dolaylı etkisini “emmiş” ve geriye anlamlı bir doğrudan etki bırakmamış olabilir.

  2. Referans Kategorisinin Yapısı: Bu modelde referans kategorisi, “Orta Yoğun Kent” ve “Yoğun Kent” kategorilerinin birleşiminden oluşmaktadır. Hocamızın da değindiği gibi, bu iki grup aslında kendi içlerinde farklı dinamiklere sahip olabilir. Bu heterojen referans grubu, kırsal ile olan farkı net bir şekilde ortaya koymayı engelliyor olabilir.

Bu sonuç, çoklu regresyon analizinde bir değişkenin anlamsız çıkmasının, o değişkenin önemsiz olduğu anlamına gelmediğini; aksine, etkisinin modeldeki diğer güçlü yordayıcılar tarafından zaten açıklanmış olabileceğini gösteren mükemmel bir örnektir.

Yoğun Kentin Diğer Yerleşim Yerlerine Kıyasla Etkisinin İncelenmesi

Bir önceki modelde “kırsal” değişkeninin anlamsız çıkmasının, referans kategorisinin heterojen yapısından kaynaklanıp kaynaklanmadığını test etmek ve yerleşim yeri etkisini farklı bir açıdan incelemek amacıyla, hocamızın da belirttiği gibi, modelde bir değişiklik yapılmıştır. Bu yeni modelde, kirsal kukla değişkeni analizden çıkarılmış ve yerine yogun (Yoğun Kent) kukla değişkeni dahil edilmiştir.

Bu model konfigürasyonunda, “Kırsal” ve “Orta Yoğun Kent” kategorileri birleştirilerek yogun değişkeninin “0” (Yoğun Kent Değil) kodunu alan yeni referans grubu oluşturulmuştur. Dolayısıyla bu analiz, “yoğun bir kentte yaşamanın (yogun=1), yoğun olmayan bir yerde (kırsal veya orta yoğun) yaşamaya (yogun=0) kıyasla” gelir üzerindeki net etkisini test etmektedir.

Model Sonuçları ve Yorumlanması

Nihai Sonuç ve Genel Yorum

Her iki alternatif modelin de benzer sonuçlar vermesi, bulguları daha da güçlendirmektedir:

Yaş, eğitim seviyesi ve cinsiyet gibi temel sosyo-demografik ve ekonomik faktörler kontrol altına alındığında, bireylerin yaşadığı yerin kentsel yoğunluğunun (ister kırsal ister yoğun kent olsun), gelir seviyesi üzerinde istatistiksel olarak anlamlı, bağımsız bir ek etkisi bulunmamaktadır.

Hocamızın da sorguladığı gibi, bu durum, yerleşim yerinin gelirle ilişkisiz olduğu anlamına gelmez. Bu, yerleşim yerinin gelir üzerindeki etkisinin büyük olasılıkla dolaylı olduğu ve etkisinin modeldeki diğer güçlü değişkenler (özellikle eğitim) tarafından zaten açıklandığı anlamına gelir. Yani, kentte yaşamanın getirdiği gelir avantajı, büyük ölçüde kentlerin sunduğu daha yüksek eğitim olanaklarından kaynaklanıyor olabilir. Modelde eğitim zaten kontrol edildiği için, yerleşim yerinin tek başına ek bir açıklama gücü kalmamaktadır.

Kentleşme Durumunun Gelir Üzerindeki Bağımsız Etkisinin Yokluğu

Analizin bu son aşamasında, yaş, eğitim ve cinsiyet gibi temel faktörlerin gelir üzerindeki etkisi kontrol altına alındıktan sonra, “Yoğun Kent”te yaşamanın ek, bağımsız bir etkisi olup olmadığını test etmek amacıyla çoklu regresyon modeli kurulmuştur.

Model Sonuçları ve Yorumu

Bu modelde bağımsız değişken olarak yaş, eğitim, cinsiyet (female) ve yogun kukla değişkeni kullanılmıştır. Coefficients (Katsayılar) tablosu incelendiğinde, temel bulgular şunlardır:

Anlamsızlığın Teknik Anlamı

Bu bulgunun doğru ve teknik yorumu şudur:

Yaş, eğitim seviyesi ve cinsiyet gibi güçlü yordayıcıların etkileri istatistiksel olarak kontrol altına alındığında, bireyin yoğun bir kentte yaşayıp yaşamamasının, gelir seviyesi üzerinde ek, anlamlı ve bağımsız bir etkisi kalmamaktadır.

Hocamızın önceki analizlerde de değindiği gibi, bu sonuç, kentte yaşamanın gelirle ilişkisiz olduğu anlamına gelmez. Bu bulgu, kentte yaşamanın gelir üzerindeki potansiyel etkisinin, büyük olasılıkla, modeldeki diğer temel değişkenler (özellikle eğitim) tarafından zaten açıklandığını ve bu değişkenler aracılığıyla dolaylı bir şekilde gerçekleştiğini göstermektedir. Model, eğitimin güçlü etkisini zaten hesaba kattığı için, “yoğun kentte yaşama” bilgisinin tek başına, gelir tahminine ek bir açıklama gücü katmadığı görülmektedir. Bu durum, çoklu regresyon analizinin, bir değişkenin diğer faktörler kontrol altındayken sahip olduğu net ve özgün katkıyı ortaya çıkarma gücünü göstermesinin mükemmel bir örneğidir.

Çok Kategorili Kukla Değişkenler ve Referans Grubu Mantığı

Analizin bu son aşamasında, modelin en kapsamlı halini test etmek amacıyla, üç kategorili “Kentleşme Durumu” değişkeninden türetilen iki kukla değişken (ortayogun ve yogun) modele dahil edilmiştir. Bu model, çok kategorili bir değişkenin regresyon analizinde nasıl yorumlanması ve yorumlanmaması gerektiğine dair temel kuralları anlamak için kritik bir öneme sahiptir.

Model Kurulumu ve Fiili Sonuçlar

Yorumlama Metodolojisi: Hipotetik Bir Senaryo

Katsayıların doğru yorumlama mantığını kavramak için, hocamızın da belirttiği gibi, bir an için hem ortayogun hem de yogun değişkenlerinin istatistiksel olarak anlamlı olduğunu varsayalım.

Bu hipotetik durumda, katsayılar şu şekilde yorumlanırdı:

En Kritik Yorumlama Kuralı: Karşılaştırmalar Sadece Referans Grubuna Karşı Yapılır

Hocamızın bu dersin özeti olarak önemle vurguladığı gibi, regresyon modelindeki kukla değişkenlerin yorumlanmasında asla unutulmaması gereken temel kural şudur:

Modele dahil edilen kukla değişkenlerin katsayıları, birbirleriyle doğrudan karşılaştırılamaz.

Yani, ortayogun değişkeninin katsayısının (B=0.128), yogun değişkeninin katsayısından (B=-0.012) daha büyük olduğuna bakarak, “orta yoğun kentte yaşamak, yoğun kentte yaşamaktan daha fazla gelir getirir” denilemez.