Görsel analizlerimizi tamamladıktan sonra,
Eğitim Seviyesi ile Gelir Seviyesi arasındaki
ilişkiyi sayısal ve çıkarımsal bir çerçevede değerlendirmek için
bivariate (iki değişkenli) korelasyon analizini
gerçekleştiririz. Bu analiz, bize sadece örneklemimizdeki ilişkiyi
değil, bu ilişkinin daha geniş bir popülasyona genellenebilir olup
olmadığı hakkında da kritik bilgiler sunar.
1. Korelasyon Matrisini Anlamak
SPSS gibi istatistik programlarının ürettiği korelasyon matrisi, iki veya daha fazla değişken arasındaki ikili ilişkileri özetler. Tablo şu şekilde yapılandırılmıştır:
Simetrik Yapı: Tablo simetriktir. “Eğitim”in “Gelir” ile korelasyonu (üst sağdaki hücre), “Gelir”in “Eğitim” ile korelasyonuyla (alt soldaki hücre) tamamen aynı değeri verir.
Diyagonal Değerler: Bir değişkenin kendisiyle olan
korelasyonu her zaman mükemmeldir (r=1). Bu değerler
tablonun ana diyagonali (sol üstten sağ alta) üzerinde yer alır.
Her bir ilişki hücresinde üç temel bilgi sunulur:
Pearson Correlation: Korelasyon katsayısı (r).
Sig. (2-tailed): İstatistiki anlamlılık değeri (p-değeri).
N: Analize dahil edilen geçerli gözlem sayısı.
2. Korelasyon Tablosunu Yorumlama Adımları: Öncelik Sırası
Bir korelasyon tablosunu yorumlarken izlenmesi gereken değişmez bir kural ve öncelik sırası vardır:
Adım 1 (En Kritik Adım): İstatistiki Anlamlılığı (p-değeri) Kontrol Etmek
Bakılacak Değer: Sig. (2-tailed)
satırı.
Temel Soru: Bu ilişki “gerçek” mi, yoksa sadece bizim örneklemimize özgü bir “tesadüf” mü?
Karar Kuralı: Genel kabul görmüş alfa (α) eşik değeri 0.05’tir.
Eğer p < 0.05 ise: Gözlemlediğimiz ilişkinin rastlantısal olma ihtimali çok düşüktür. Bu durumda “ilişki istatistiksel olarak anlamlıdır” deriz ve yorumlamanın bir sonraki adımına geçeriz.
Eğer p ≥ 0.05 ise: İlişkinin tamamen şans eseri ortaya çıkmış olma olasılığı göz ardı edilemeyecek kadar yüksektir. Bu durumda “ilişki istatistiksel olarak anlamlı değildir” denir ve yorumlama burada durdurulur. Korelasyon katsayısının büyüklüğünün veya yönünün artık pratik bir anlamı kalmaz, çünkü bu değerlerin tesadüfi olma ihtimali yüksektir.
Teknik Not: Boş Hipotez (Null Hypothesis) Testi
Bu p-değeri, aslında Boş Hipotez (H₀) adı verilen
bir hipotezi test eder. Boş hipotez, evrende (popülasyonda) iki değişken
arasında hiçbir ilişki olmadığını (r=0) varsayar. Bizim
bulduğumuz p < .001 değeri, “Eğer gerçekte eğitim ve
gelir arasında hiçbir ilişki olmasaydı, bizim örneklemimizde
gözlemlediğimiz bu 0.324’lük korelasyonu bulma ihtimalimiz
binde birden bile azdır” anlamına gelir. Bu ihtimal çok düşük olduğu
için, Boş Hipotezi reddederiz ve alternatif hipotezi
(yani, “değişkenler arasında bir ilişki vardır”) kabul ederiz.
Adım 2: Korelasyonun Yönünü Yorumlamak
Anlamlılık testini geçtikten sonra, Pearson Correlation
değerinin işaretine bakarız.
İşaret: Değerin önünde eksi işareti olmadığı için ilişki pozitiftir.
Yorum: Eğitim seviyesi arttıkça, gelir seviyesi de artma eğilimindedir.
Adım 3: Korelasyonun Gücünü (Büyüklüğünü) Yorumlamak
Son olarak, Pearson Correlation değerinin mutlak
büyüklüğünü yorumlarız.
Değer: 0.324
Genel Kural:
Yorum: 0.324 değeri orta düzey
aralığına girmektedir.
3. Nihai Sonuç ve Regresyona Geçişin Temelleri
Tüm bu adımları birleştirdiğimizde, tam yorumumuz şu şekilde olur:
“Eğitim seviyesi ile gelir seviyesi arasında, istatistiki olarak anlamlı, pozitif yönde ve orta düzeyde bir korelasyon bulunmaktadır (r = 0.324, p < .001).”
Bu sonuç, bir sonraki adım olan regresyon analizi için sağlam bir zemin oluşturur. Artık biliyoruz ki:
Bu iki değişken arasında modellemeye değer, “gerçek” bir ilişki var.
Bu ilişkinin temel sayısal özeti (korelasyon)
0.324’tür.
Daha önce serpilme diyagramından elde ettiğimiz regresyon
denklemi (y = 2.69 + 0.99x), bu 0.324’lük
orta düzey korelasyona sahip ilişkinin matematiksel modelidir.
Şimdi bu bilgiler ışığında, regresyon çıktılarının bu korelasyon
bulgusunu nasıl daha derinlemesine açıkladığını ve
0.324’lük korelasyonun, modelin açıklama
kapasitesine (R-Kare) nasıl dönüştüğünü inceleyeceğiz.
degree (eğitim seviyesi) ile income (gelir seviyesi) arasında basit lineer regresyon analizi yapıyoruz.
Basit Doğrusal Regresyon Analizi: SPSS Çıktılarının Yorumlanması
Korelasyon analizi ile Eğitim Seviyesi ve
Gelir Seviyesi arasında istatistiksel olarak anlamlı,
pozitif ve orta düzeyde bir ilişki olduğunu tespit ettikten sonra, bu
ilişkiyi matematiksel bir modelle ifade etmek ve tahmin gücünü ölçmek
için Basit Doğrusal Regresyon analizi gerçekleştiririz.
SPSS’in ürettiği çıktılar, bu modelin farklı yönlerini açıklayan birkaç
temel tablodan oluşur. Bu tablolar, belirli bir öncelik sırasıyla
yorumlanmalıdır.
1. İlk Adım: Modelin Genel Anlamlılığının Değerlendirilmesi (ANOVA Tablosu)
Regresyon analizinde bakılması gereken ilk ve en önemli tablo, ANOVA (Varyans Analizi) tablosudur. Bu tablo, kurulan regresyon modelinin, bağımlı değişkeni tahmin etmede “hiçbir şey yapmamaktan” (yani sadece ortalamayı tahmin etmekten) istatistiksel olarak daha iyi olup olmadığını test eder.
Bakılacak Değer: Sig. (Significance /
p-değeri) sütunu.
Değer: <.001
Karar Kuralı: Eğer p < 0.05 ise,
modelin bir bütün olarak istatistiksel açıdan anlamlı bir açıklama
kapasitesine sahip olduğu sonucuna varılır.
Yorum: p değerimiz
.001’den bile küçük olduğu için, kurduğumuz regresyon
modelinin istatistiksel olarak anlamlı olduğunu
söyleyebiliriz. Bu sonuç, bize diğer tabloları güvenle yorumlama izni
verir. Eğer bu değer 0.05’ten büyük olsaydı, model anlamsız
kabul edilir ve analiz burada durdurulurdu.
2. İkinci Adım: Tahmin Denkleminin Oluşturulması (Coefficients Tablosu)
Modelin genel olarak anlamlı olduğunu teyit ettikten sonra, bize tahmin formülünü veren Katsayılar (Coefficients) tablosunu inceleriz.
Bakılacak Sütun:
Unstandardized Coefficients B sütunu.
Bileşenler:
(Constant) Satırı: Bu, modelin
sabit değeri (Intercept, β₀)’dir. Değeri
2.688’dir (yuvarlak olarak 2.69).
Bağımsız Değişken Satırı (“Bitirdiğiniz en yüksek eğitim seviyesi nedir?”): Bu, eğim katsayısı (Slope, β₁)’dır. Değeri 0.995’tir (yuvarlak olarak 0.99).
Anlamlılık Kontrolü: Bu katsayıların kendi başlarına
da istatistiksel olarak anlamlı olup olmadığını Sig.
sütunundan kontrol ederiz. Her iki katsayı için de
p < .001 olduğu için, hem sabit değerin hem de eğitim
seviyesinin katsayısının modelde anlamlı bir rol oynadığını görürüz.
Regresyon Denklemi: Bu katsayıları birleştirerek, daha önce serpilme diyagramında gördüğümüz tahmin formülünü oluştururuz:
Beklenen Gelir Seviyesi = 2.69 + 0.99 (Eğitim Seviyesi)
Yorum: Bu denklem, Eğitim Seviyesi
bilindiğinde Gelir Seviyesi’ni tahmin etmemizi sağlar. Buna
göre, eğitim seviyesindeki her 1 birimlik artış, gelir seviyesinde
ortalama 0.99 birimlik bir artışa yol açmaktadır.
3. Üçüncü Adım: Modelin Açıklama Kapasitesinin Ölçülmesi (Model Summary Tablosu)
Son olarak, modelimizin bağımlı değişkendeki değişkenliği ne ölçüde açıkladığını anlamak için Model Özeti (Model Summary) tablosunu inceleriz.
Bakılacak Değer: R Square (R-Kare veya
Belirleme Katsayısı).
Değer: .105
Yorum: R Square = 0.105 değeri, bağımlı
değişkenimiz olan Gelir Seviyesindeki toplam
varyansın (farklılıkların) %10.5’inin, modelimize dahil
ettiğimiz bağımsız değişken olan Eğitim Seviyesi
tarafından istatistiksel olarak açıklanabildiğini gösterir.
R-Kare’nin Kaynağı ve Anlamı:
Bu .105 değeri tesadüfi değildir ve önceki
analizlerimizle doğrudan ilişkilidir.
Korelasyonun Karesi: Bu değer, daha önce
Eğitim ve Gelir arasında bulduğumuz
Pearson Korelasyon katsayısının r =
0.324 karesi** alınarak elde edilir:
(0.324)² ≈ 0.105
Gözlemlenen ve Beklenen Değerler Arasındaki
Korelasyon: Alternatif olarak, kurduğumuz regresyon denklemini
kullanarak her bir birey için bir “tahmin edilen gelir seviyesi”
hesaplayabiliriz. Ardından, bireylerin gerçekte beyan ettikleri
gelir seviyeleri ile bu tahmin edilen gelir
seviyeleri arasında yeni bir korelasyon hesaplarsak,
bulacağımız sonuç yine 0.324 olacak ve bunun karesi de
0.105’i verecektir.
Nihai Özet: Bu analizler sonucunda,
Eğitim Seviyesi’nin Gelir Seviyesi üzerinde
istatistiksel olarak anlamlı ve pozitif bir etkiye sahip olduğunu, ancak
tek başına gelirdeki farklılıkların sadece %10.5’ini
açıklayabildiğini söyleyebiliriz. Bu, geliri etkileyen ve modelimizde
henüz yer almayan başka birçok faktörün var olduğuna işaret eder ve daha
kapsamlı modeller (Çoklu Regresyon) kurma ihtiyacını ortaya koyar.