Veri Analizi Okulu - 25 Şubat 2026

SPSS Syntax Kullanarak Çok Kategorili Değişken İçin Kukla Değişkenlerin Oluşturulması
Kırsal Alanın Diğer Yerleşim Yerlerine Kıyasla Etkisinin İncelenmesi
Yoğun Kentin Diğer Yerleşim Yerlerine Kıyasla Etkisinin İncelenmesi
Kentleşme Durumunun Gelir Üzerindeki Bağımsız Etkisinin Yokluğu
Çok Kategorili Kukla Değişkenler ve Referans Grubu Mantığı

SPSS Syntax Kullanarak Çok Kategorili Değişken İçin Kukla Değişkenlerin Oluşturulması

Modelin son aşaması olan “Kentleşme Durumu” değişkeninin analize dahil edilebilmesi için, bu üç kategorili (degurba) değişkenin, regresyon modelinin yorumlayabileceği sayısal bir formata dönüştürülmesi gerekmektedir. Bu bölümde, degurba değişkeninden üç adet yeni kukla (dummy) değişken, SPSS Syntax editörü kullanılarak oluşturulmuştur.

Kukla Değişken Oluşturma Syntax Kodu

Aşağıdaki kod bloğu, orijinal degurba değişkenini (1=Kırsal, 2=Orta Yoğun Kent, 3=Yoğun Kent) temel alarak kirsal, ortayogun ve yogun adında üç yeni kukla değişken oluşturmak ve etiketlemek için kullanılmıştır.

* --- Kentleşme Durumu için Kukla Değişkenlerin Oluşturulması ---.

RECODE degurba (1=1) (2,3=0) INTO kirsal.
RECODE degurba (2=1) (1,3=0) INTO ortayogun.
RECODE degurba (3=1) (1,2=0) INTO yogun.
EXECUTE.

* --- Yeni Değişkenlere Etiket Atanması ---.

VALUE LABELS kirsal
    1 'Kırsal'
    0 'Kırsal Değil'.
VALUE LABELS ortayogun
    1 'Orta Yoğun'
    0 'Orta Yoğun Değil'.
VALUE LABELS yogun
    1 'Yoğun Kent'
    0 'Yoğun Kent Değil'.
EXECUTE.

* --- Kontrol için Frekans Analizi ---.

FREQUENCIES VARIABLES=degurba kirsal ortayogun yogun.

Syntax Komutlarının Teknik Açıklaması

RECODE Komutu: Bu komut, her bir kategoriyi temsil eden yeni ikili (0/1) değişkenleri yaratır.

kirsal Değişkeni için: (1=1) (2,3=0) ifadesi, orijinal degurba değişkeninde “1” (Kırsal) koduna sahip olanların yeni kirsal değişkeninde 1 değerini, diğer tüm kategorilerin (2 ve 3) ise 0 değerini almasını sağlar.
ortayogun Değişkeni için: Benzer mantıkla (2=1) (1,3=0) ifadesi, sadece “Orta Yoğun Kent” kategorisindekilerin 1, diğerlerinin 0 olmasını sağlar.
yogun Değişkeni için: (3=1) (1,2=0) ifadesi de sadece “Yoğun Kent” kategorisindekilerin 1, diğerlerinin 0 olmasını sağlar.

VALUE LABELS ve FREQUENCIES Komutları: Cinsiyet değişkeninde olduğu gibi, bu komutlar da sırasıyla yeni oluşturulan 0/1 değişkenlerine anlaşılır etiketler atamak ve yeniden kodlama işleminin doğruluğunu (orijinal ve yeni değişkenlerdeki vaka sayılarının eşleştiğini) kontrol etmek için kullanılmıştır.

Sonuç ve Regresyona Geçiş İçin Temel Kuralın Tekrarı

Hocamızın da gösterdiği gibi, kodun doğruluğu teyit edildikten sonra TEMPORARY komutu kaldırılarak yeni kukla değişkenler (kirsal, ortayogun, yogun) veri setine kalıcı olarak kaydedilmiştir.

Bu kritik adımın tamamlanmasıyla birlikte, hocamızın da altını önemle çizdiği temel kuralı bir kez daha hatırlamak gerekir: K sayıda kategoriden oluşturulan K adet kukla değişkenin tamamı aynı anda modele dahil edilemez. Regresyon modeline, bu kukla değişkenlerden en fazla K-1 tanesi eklenebilir. Bu durumda, 3 kategoriden oluşturduğumuz 3 kukla değişkenden en fazla 2 tanesini aynı anda modele koyabiliriz. Dışarıda bırakılan kategori, modeldeki diğer kentsel yoğunluk kategorilerinin karşılaştırılacağı referans kategorisi olacaktır.

Kırsal Alanın Diğer Yerleşim Yerlerine Kıyasla Etkisinin İncelenmesi

“Kentleşme Durumu” için kukla değişkenler oluşturulduktan sonra, analizin bu aşamasında yerleşim yerinin gelir üzerindeki etkisinin olup olmadığı bir regresyon modeli ile test edilecektir. Hocamızın da belirttiği gibi, bu ilk modelde, bilinçli bir metodolojik sadeleştirmeye gidilerek, oluşturulan üç kukla değişkenden yalnızca kirsal değişkeni bağımsız değişken olarak modele dahil edilmiştir.

Bu yaklaşımda, “Orta Yoğun Kent” ve “Yoğun Kent” kategorileri birleştirilerek kirsal değişkeninin “0” (Kırsal Değil) kodunu alan bir referans grubu oluşturulmaktadır. Dolayısıyla, bu basit regresyon analizi, spesifik olarak “kırsal bir bölgede yaşamanın (kirsal=1), kırsal olmayan bir bölgede (orta yoğun veya yoğun kent) yaşamaya (kirsal=0) kıyasla” gelir seviyesi üzerinde istatistiksel olarak anlamlı bir etkisi olup olmadığını test edecektir. Bu analiz, daha karmaşık olan nihai modele geçmeden önce, kır/kent ayrımının temel etkisini görmek için önemli bir ilk adım niteliğindedir.

Modelin Genel Değerlendirmesi ve Beklenmedik Bulgu

Modelin Anlamlılığı (ANOVA): Yeni modelin ANOVA Sig. değeri < .001 olarak bulunmuş, modelin bir bütün olarak istatistiksel açıdan anlamlı olduğu teyit edilmiştir.
Açıklama Gücü (Model Summary): Yeni modelin R Kare (R²) değeri .309 olarak hesaplanmıştır. Bu değer, bir önceki (%30.9) modelle birebir aynıdır. Bu durum, modele eklenen kirsal değişkeninin, modelin toplam açıklama gücüne herhangi bir ek katkı sağlamadığını göstermektedir.
Katsayıların Anlamlılığı (Coefficients): Coefficients tablosu incelendiğinde, önceki modelde anlamlı olan tüm değişkenlerin (Constant, Eğitim, Yaş, Cinsiyet) istatistiksel olarak anlamlı kalmaya devam ettiği görülmüştür. Ancak modele yeni eklenen kirsal değişkeninin Sig. değeri .550’dir. Bu değer, 0.05 anlamlılık düzeyinden büyük olduğu için, kirsal değişkeninin gelir üzerinde istatistiksel olarak anlamlı bir etkisi olmadığı sonucuna varılmıştır.

Anlamsız Katsayının Doğru Yorumlanması

Hocamızın da altını önemle çizdiği gibi, bu bulgu, “kırsalda yaşamanın gelirle hiçbir ilişkisi yoktur” şeklinde basitçe yorumlanmamalıdır. Regresyon analizinin gücü, değişkenlerin net etkisini göstermesinde yatar. Bu katsayının doğru ve teknik yorumu şöyledir:

“Yaş, eğitim seviyesi ve cinsiyetin etkileri kontrol altına alındığında, kırsalda yaşamanın, kırsal olmayan bir yerde (orta yoğun veya yoğun kent) yaşamaya kıyasla gelir seviyesi üzerinde istatistiksel olarak anlamlı bir etkisi yoktur.”

Hocamızın da belirttiği gibi, ilk bakışta mantığa aykırı görünen bu durumun birkaç olası teknik açıklaması olabilir:

Aracılık Etkisi (Mediation): Kırsalda yaşamanın gelir üzerindeki etkisi, doğrudan bir etki olmayabilir. Modeldeki diğer değişkenler, bu ilişkiye aracılık ediyor olabilir. Örneğin, kırsal bölgelerdeki bireylerin genel olarak daha düşük eğitim seviyelerine sahip olması muhtemeldir. Bu durumda, kırsalda yaşamak, düşük eğitime yol açmakta ve asıl gelir düşüklüğüne neden olan faktör eğitim olmaktadır. Bizim modelimiz zaten eğitimin etkisini doğrudan kontrol ettiği için, kırsalın dolaylı etkisini “emmiş” ve geriye anlamlı bir doğrudan etki bırakmamış olabilir.
Referans Kategorisinin Yapısı: Bu modelde referans kategorisi, “Orta Yoğun Kent” ve “Yoğun Kent” kategorilerinin birleşiminden oluşmaktadır. Hocamızın da değindiği gibi, bu iki grup aslında kendi içlerinde farklı dinamiklere sahip olabilir. Bu heterojen referans grubu, kırsal ile olan farkı net bir şekilde ortaya koymayı engelliyor olabilir.

Bu sonuç, çoklu regresyon analizinde bir değişkenin anlamsız çıkmasının, o değişkenin önemsiz olduğu anlamına gelmediğini; aksine, etkisinin modeldeki diğer güçlü yordayıcılar tarafından zaten açıklanmış olabileceğini gösteren mükemmel bir örnektir.

Yoğun Kentin Diğer Yerleşim Yerlerine Kıyasla Etkisinin İncelenmesi

Bir önceki modelde “kırsal” değişkeninin anlamsız çıkmasının, referans kategorisinin heterojen yapısından kaynaklanıp kaynaklanmadığını test etmek ve yerleşim yeri etkisini farklı bir açıdan incelemek amacıyla, hocamızın da belirttiği gibi, modelde bir değişiklik yapılmıştır. Bu yeni modelde, kirsal kukla değişkeni analizden çıkarılmış ve yerine yogun (Yoğun Kent) kukla değişkeni dahil edilmiştir.

Bu model konfigürasyonunda, “Kırsal” ve “Orta Yoğun Kent” kategorileri birleştirilerek yogun değişkeninin “0” (Yoğun Kent Değil) kodunu alan yeni referans grubu oluşturulmuştur. Dolayısıyla bu analiz, “yoğun bir kentte yaşamanın (yogun=1), yoğun olmayan bir yerde (kırsal veya orta yoğun) yaşamaya (yogun=0) kıyasla” gelir üzerindeki net etkisini test etmektedir.

Model Sonuçları ve Yorumlanması

Modelin Genel Değerlendirmesi: Yeni modelin R Kare (R²) değeri .309 olarak hesaplanmıştır. Bu değerin, bir önceki modelle (%30.9) birebir aynı kalması, modele eklenen yogun değişkeninin de modelin toplam açıklama gücüne herhangi bir ek katkı sağlamadığını göstermektedir.
Katsayıların Anlamlılığı (Coefficients): Coefficients tablosu incelendiğinde, temel değişkenlerin (Eğitim, Yaş, Cinsiyet) istatistiksel olarak anlamlı kalmaya devam ettiği görülmüştür. Ancak modele yeni eklenen yogun değişkeninin Sig. değeri .631’dir. Bu değer, 0.05 anlamlılık düzeyinden büyük olduğu için, tıpkı kirsal değişkeni gibi, yogun değişkeninin de gelir üzerinde istatistiksel olarak anlamlı bir etkisi olmadığı sonucuna varılmıştır.

Nihai Sonuç ve Genel Yorum

Her iki alternatif modelin de benzer sonuçlar vermesi, bulguları daha da güçlendirmektedir:

Yaş, eğitim seviyesi ve cinsiyet gibi temel sosyo-demografik ve ekonomik faktörler kontrol altına alındığında, bireylerin yaşadığı yerin kentsel yoğunluğunun (ister kırsal ister yoğun kent olsun), gelir seviyesi üzerinde istatistiksel olarak anlamlı, bağımsız bir ek etkisi bulunmamaktadır.

Hocamızın da sorguladığı gibi, bu durum, yerleşim yerinin gelirle ilişkisiz olduğu anlamına gelmez. Bu, yerleşim yerinin gelir üzerindeki etkisinin büyük olasılıkla dolaylı olduğu ve etkisinin modeldeki diğer güçlü değişkenler (özellikle eğitim) tarafından zaten açıklandığı anlamına gelir. Yani, kentte yaşamanın getirdiği gelir avantajı, büyük ölçüde kentlerin sunduğu daha yüksek eğitim olanaklarından kaynaklanıyor olabilir. Modelde eğitim zaten kontrol edildiği için, yerleşim yerinin tek başına ek bir açıklama gücü kalmamaktadır.

Kentleşme Durumunun Gelir Üzerindeki Bağımsız Etkisinin Yokluğu

Analizin bu son aşamasında, yaş, eğitim ve cinsiyet gibi temel faktörlerin gelir üzerindeki etkisi kontrol altına alındıktan sonra, “Yoğun Kent”te yaşamanın ek, bağımsız bir etkisi olup olmadığını test etmek amacıyla çoklu regresyon modeli kurulmuştur.

Model Sonuçları ve Yorumu

Bu modelde bağımsız değişken olarak yaş, eğitim, cinsiyet (female) ve yogun kukla değişkeni kullanılmıştır. Coefficients (Katsayılar) tablosu incelendiğinde, temel bulgular şunlardır:

Yaş, eğitim ve cinsiyet değişkenleri, önceki modellerde olduğu gibi, gelir üzerinde istatistiksel olarak anlamlı yordayıcılar olmaya devam etmiştir (tüm Sig. değerleri < .001).
Ancak, modele en son eklenen yogun değişkeninin Sig. değeri .631 olarak bulunmuştur. Bu değer, genel kabul gören 0.05 anlamlılık eşiğinden çok daha büyük olduğu için, yogun değişkeninin istatistiksel olarak anlamlı olmadığı sonucuna varılır.

Anlamsızlığın Teknik Anlamı

Bu bulgunun doğru ve teknik yorumu şudur:

Yaş, eğitim seviyesi ve cinsiyet gibi güçlü yordayıcıların etkileri istatistiksel olarak kontrol altına alındığında, bireyin yoğun bir kentte yaşayıp yaşamamasının, gelir seviyesi üzerinde ek, anlamlı ve bağımsız bir etkisi kalmamaktadır.

Hocamızın önceki analizlerde de değindiği gibi, bu sonuç, kentte yaşamanın gelirle ilişkisiz olduğu anlamına gelmez. Bu bulgu, kentte yaşamanın gelir üzerindeki potansiyel etkisinin, büyük olasılıkla, modeldeki diğer temel değişkenler (özellikle eğitim) tarafından zaten açıklandığını ve bu değişkenler aracılığıyla dolaylı bir şekilde gerçekleştiğini göstermektedir. Model, eğitimin güçlü etkisini zaten hesaba kattığı için, “yoğun kentte yaşama” bilgisinin tek başına, gelir tahminine ek bir açıklama gücü katmadığı görülmektedir. Bu durum, çoklu regresyon analizinin, bir değişkenin diğer faktörler kontrol altındayken sahip olduğu net ve özgün katkıyı ortaya çıkarma gücünü göstermesinin mükemmel bir örneğidir.

Çok Kategorili Kukla Değişkenler ve Referans Grubu Mantığı

Analizin bu son aşamasında, modelin en kapsamlı halini test etmek amacıyla, üç kategorili “Kentleşme Durumu” değişkeninden türetilen iki kukla değişken (ortayogun ve yogun) modele dahil edilmiştir. Bu model, çok kategorili bir değişkenin regresyon analizinde nasıl yorumlanması ve yorumlanmaması gerektiğine dair temel kuralları anlamak için kritik bir öneme sahiptir.

Model Kurulumu ve Fiili Sonuçlar

Model Kurulumu: Nihai modelde bağımsız değişken olarak yaş, eğitim, cinsiyet (male), ortayogun ve yogun kukla değişkenleri kullanılmıştır.
Referans Kategorisi: Bu modelde K-1 kuralı gereği, kentleşme durumunu temsil eden üç kukla değişkenden ikisi (ortayogun ve yogun) modele dahil edilmiştir. Modelin dışında bırakılan kirsal kukla değişkeni, bu analiz için “referans kategorisi” haline gelmiştir.
Fiili Sonuçlar: Analiz sonucunda, yaş, eğitim ve cinsiyetin istatistiksel olarak anlamlı yordayıcılar olmaya devam ettiği görülmüştür. Ancak, hem ortayogun (Sig. = .636) hem de yogun (Sig. = .955) değişkenlerinin istatistiksel olarak anlamlı olmadığı bulunmuştur. Bu durum, önceki bulguları teyit ederek, temel faktörler kontrol edildiğinde yerleşim yerinin gelir üzerinde net bir etkisinin kalmadığını göstermektedir.

Yorumlama Metodolojisi: Hipotetik Bir Senaryo

Katsayıların doğru yorumlama mantığını kavramak için, hocamızın da belirttiği gibi, bir an için hem ortayogun hem de yogun değişkenlerinin istatistiksel olarak anlamlı olduğunu varsayalım.

Bu hipotetik durumda, katsayılar şu şekilde yorumlanırdı:

Orta Yoğun Kent (B = 0.128): Diğer tüm değişkenlerin etkisi kontrol edildiğinde, orta yoğun bir kentte yaşamak, kırsalda yaşamaya (referans kategorisi) kıyasla, beklenen ortalama gelir seviyesinde 0.128 birimlik bir artışa neden olmaktadır.
Yoğun Kent (B = -0.012): Diğer tüm değişkenlerin etkisi kontrol edildiğinde, yoğun bir kentte yaşamak, kırsalda yaşamaya (referans kategorisi) kıyasla, beklenen ortalama gelir seviyesinde 0.012 birimlik bir azalışa (veya anlamlı bir fark yaratmamaya) neden olmaktadır.

En Kritik Yorumlama Kuralı: Karşılaştırmalar Sadece Referans Grubuna Karşı Yapılır

Hocamızın bu dersin özeti olarak önemle vurguladığı gibi, regresyon modelindeki kukla değişkenlerin yorumlanmasında asla unutulmaması gereken temel kural şudur:

Modele dahil edilen kukla değişkenlerin katsayıları, birbirleriyle doğrudan karşılaştırılamaz.

Yani, ortayogun değişkeninin katsayısının (B=0.128), yogun değişkeninin katsayısından (B=-0.012) daha büyük olduğuna bakarak, “orta yoğun kentte yaşamak, yoğun kentte yaşamaktan daha fazla gelir getirir” denilemez.

Neden? Çünkü her bir katsayı, sadece tek bir noktaya, yani modelin dışında bırakılan referans kategorisine (kirsal) olan mesafeyi ve farkı ölçer. İki farklı kategorinin birbirine olan göreli etkisini ölçmezler.
Doğru Yaklaşım: Eğer “Orta Yoğun Kent” ile “Yoğun Kent” arasında anlamlı bir fark olup olmadığını test etmek istiyorsak, hocamızın da belirttiği gibi, modeli yeniden kurmamız gerekir. Bu yeni modelde, referans kategorisini değiştirmemiz gerekir. Örneğin, modele kirsal ve ortayogun değişkenlerini dahil edip yogun değişkenini dışarıda bırakarak “Yoğun Kent”i yeni referans kategorisi yapabilir ve diğerlerinin ona kıyasla etkisini görebiliriz.

Veri Analizi Okulu - 25 Şubat 2026

SPSS’de Lineer Regresyon Uygulamaları (TGSS- 2024 Veri Seti ile)

Veri Analizi Okulu - İsmail Cüneyt VARİLCİ

23 May 2026

SPSS Syntax Kullanarak Çok Kategorili Değişken İçin Kukla Değişkenlerin Oluşturulması

Kırsal Alanın Diğer Yerleşim Yerlerine Kıyasla Etkisinin İncelenmesi

Yoğun Kentin Diğer Yerleşim Yerlerine Kıyasla Etkisinin İncelenmesi

Kentleşme Durumunun Gelir Üzerindeki Bağımsız Etkisinin Yokluğu

Çok Kategorili Kukla Değişkenler ve Referans Grubu Mantığı