TGSS 2024 Veri Setimizi Açıyoruz.

TGSS 2024 veri setimizin SPSS’e yükleme adımları grafik olarak aşağıda gösterilmiştir.

Data View Ekranı

Variable View Ekranı

Yaş ve Eğitim Seviyesinin Bireysel Gelir Üzerindeki Etkisinin Çoklu Regresyon Analizi ile İncelenmesi

Analizin Yol Haritası

Bu çalışmanın temel amacı, yaş ve eğitim seviyesinin bireylerin gelir düzeyi üzerindeki etkisini çoklu regresyon analizi ile ortaya koymaktır. Analizimizde bireysel gelir bağımlı değişken; yaş ve eğitim seviyesi ise temel bağımsız değişkenler olarak belirlenmiştir. Modelin açıklayıcılığını artırmak ve sonuçların güvenirliğini sağlamak amacıyla cinsiyet ve yaşanılan yerin kentsel yoğunluğu (köy, orta yoğun, yoğun kent) gibi sosyo-demografik faktörler de kontrol değişkeni olarak analize dahil edilecektir.

Çoklu regresyon modellemesine geçmeden önce, hocamızın da belirttiği üzere, veriyi hazırlama ve tanıma aşaması kritik öneme sahiptir. Bu doğrultuda, SPSS programında Analyze > Descriptive Statistics menüsü altında yer alan betimsel analizlerle işe başlanacaktır. Hocamızın özellikle vurguladığı gibi, sayısal değişkenler için minimum, maksimum ve standart sapma gibi değerler incelenirken, değişkenin türü ne olursa olsun (sayısal veya kategorik) mutlaka frekans dağılımlarına bakılarak kategorilerde bir anormallik olup olmadığı kontrol edilmelidir.

Bu analitik yaklaşımın ilk adımı olarak, araştırmamızın bağımlı değişkeni olan bireysel gelirin dağılımı incelenmektedir.

Hocamızın direktifleri doğrultusunda, regresyon modeline dahil edilecek temel değişkenlerin frekans tabloları incelenerek ilk değerlendirmeler yapılmıştır.

Bireysel Gelir: Bağımlı değişken olan gelirin frekans tablosu incelendiğinde, ilk ve en dikkat çekici bulgu, “Hiç gelirim yok” kategorisindeki yoğunlaşmadır. Geçerli cevapların %22.5’ini oluşturan 574 kişilik bu yığılma, hocamızın da belirttiği gibi, normal dağılım beklentisinden önemli bir sapmaya işaret etmektedir. Normal bir dağılımda, uç değerlerde daha az, orta değerlerde ise daha fazla gözlem bulunması beklenirken, gelir değişkeninin en alt kategorisinde bu denli yüksek bir frekansın olması, dağılımın simetrisini bozmakta ve normallik varsayımının karşılanmasını en baştan zorlaştırmaktadır.

Yaş ve Eğitim: Bağımsız değişkenler olan yaş ve eğitim seviyesinin frekans tabloları da hızlı bir görsel taramadan geçirilmiştir. Yaş değişkeninde ilk bakışta belirgin bir anormallik gözlenmezken, eğitim seviyesi dağılımında lise ve üniversite mezunlarında bir yığılma olduğu görülmektedir.

Bu ilk tablo incelemelerinin bulgularını teyit etmek ve değişkenlerin dağılım yapılarını daha net bir şekilde görselleştirmek amacıyla, hocamızın belirttiği sonraki adımı takip ederek, SPSS’te Analyze > Descriptive Statistics > Frequencies menüsü altındaki Charts seçeneği kullanılarak her bir değişken için birer histogram grafiği oluşturulması hedeflenmektedir.

Histogramların Yorumlanması ve Varsayımların Değerlendirilmesi

Oluşturulan histogramlar aracılığıyla değişkenlerin dağılımları görsel olarak incelenmiştir. Bu inceleme, özellikle bağımlı değişkenin regresyon varsayımlarını karşılama durumunu değerlendirmek için kritik bir adımdır.

Bireysel Gelir: Gelir değişkeninin histogramı, dağılımda önemli bir anormallik olduğunu açıkça göstermektedir.

Hocamızın da dikkat çektiği gibi, dağılımın en solunda, “sıfır gelir” kategorisinde yer alan aşırı yığılma, verinin normal dağılım göstermesini engellemektedir. Bu durum, çoklu doğrusal regresyon gibi parametrik istatistiklerin temel varsayımlarından biri olan normallik şartının bu değişken için karşılanmadığı anlamına gelir.

Normal şartlar altında bu sapma, modelin güvenirliğini etkileyeceğinden, analize devam etmeden önce veri üzerinde bir dönüşüm (transformation) işlemi yapılmasını gerektirirdi.

Ancak, hocamızın belirttiği üzere, bu çalışmanın eğitimsel amacına hizmet etmesi ve analizin takip edilebilirliğini kolaylaştırmak adına, bu varsayım ihlali bu aşamada göz ardı edilerek analize devam edilecektir.

Yaş: Yaş değişkeninin histogramında, 18 yaşın altında gözlem olmamasından kaynaklanan keskin bir başlangıç (sol-kesik dağılım) görülmektedir. Bu durum istatistiksel bir anormallik değil, veri toplama sürecinin bir sonucudur; zira anket, 18 yaş ve üzeri bireyleri kapsayacak şekilde tasarlanmıştır.

Eğitim Seviyesi: Eğitim değişkeninin dağılımı da incelenmiş olup, bu değişkenin yıl olarak değil, kategorik eğitim seviyeleri (ilkokul, lise vb.) olarak ölçüldüğü unutulmamalıdır. Bu nedenle, dağılımı normal dağılım beklentisiyle değil, kategoriler arasındaki frekans yoğunlukları açısından değerlendirilmiştir.