SPSS’de Korelasyon ’a Bakalım

Çıkarımsal İstatistik ve Korelasyon Matrisinin Yorumlanması

Görsel analizlerimizi tamamladıktan sonra, Eğitim Seviyesi ile Gelir Seviyesi arasındaki ilişkiyi sayısal ve çıkarımsal bir çerçevede değerlendirmek için bivariate (iki değişkenli) korelasyon analizini gerçekleştiririz. Bu analiz, bize sadece örneklemimizdeki ilişkiyi değil, bu ilişkinin daha geniş bir popülasyona genellenebilir olup olmadığı hakkında da kritik bilgiler sunar.

1. Korelasyon Matrisini Anlamak

SPSS gibi istatistik programlarının ürettiği korelasyon matrisi, iki veya daha fazla değişken arasındaki ikili ilişkileri özetler. Tablo şu şekilde yapılandırılmıştır:

Simetrik Yapı: Tablo simetriktir. “Eğitim”in “Gelir” ile korelasyonu (üst sağdaki hücre), “Gelir”in “Eğitim” ile korelasyonuyla (alt soldaki hücre) tamamen aynı değeri verir.

Diyagonal Değerler: Bir değişkenin kendisiyle olan korelasyonu her zaman mükemmeldir (r=1). Bu değerler tablonun ana diyagonali (sol üstten sağ alta) üzerinde yer alır.

Her bir ilişki hücresinde üç temel bilgi sunulur:

  1. Pearson Correlation: Korelasyon katsayısı (r).

  2. Sig. (2-tailed): İstatistiki anlamlılık değeri (p-değeri).

  3. N: Analize dahil edilen geçerli gözlem sayısı.

2. Korelasyon Tablosunu Yorumlama Adımları: Öncelik Sırası

Bir korelasyon tablosunu yorumlarken izlenmesi gereken değişmez bir kural ve öncelik sırası vardır:

Adım 1 (En Kritik Adım): İstatistiki Anlamlılığı (p-değeri) Kontrol Etmek

Bakılacak Değer: Sig. (2-tailed) satırı.

Temel Soru: Bu ilişki “gerçek” mi, yoksa sadece bizim örneklemimize özgü bir “tesadüf” mü?

Karar Kuralı: Genel kabul görmüş alfa (α) eşik değeri 0.05’tir.

Eğer p < 0.05 ise: Gözlemlediğimiz ilişkinin rastlantısal olma ihtimali çok düşüktür. Bu durumda “ilişki istatistiksel olarak anlamlıdır” deriz ve yorumlamanın bir sonraki adımına geçeriz.

Eğer p ≥ 0.05 ise: İlişkinin tamamen şans eseri ortaya çıkmış olma olasılığı göz ardı edilemeyecek kadar yüksektir. Bu durumda “ilişki istatistiksel olarak anlamlı değildir” denir ve yorumlama burada durdurulur. Korelasyon katsayısının büyüklüğünün veya yönünün artık pratik bir anlamı kalmaz, çünkü bu değerlerin tesadüfi olma ihtimali yüksektir.

Teknik Not: Boş Hipotez (Null Hypothesis) Testi

Bu p-değeri, aslında Boş Hipotez (H₀) adı verilen bir hipotezi test eder. Boş hipotez, evrende (popülasyonda) iki değişken arasında hiçbir ilişki olmadığını (r=0) varsayar. Bizim bulduğumuz p < .001 değeri, “Eğer gerçekte eğitim ve gelir arasında hiçbir ilişki olmasaydı, bizim örneklemimizde gözlemlediğimiz bu 0.324’lük korelasyonu bulma ihtimalimiz binde birden bile azdır” anlamına gelir. Bu ihtimal çok düşük olduğu için, Boş Hipotezi reddederiz ve alternatif hipotezi (yani, “değişkenler arasında bir ilişki vardır”) kabul ederiz.

Adım 2: Korelasyonun Yönünü Yorumlamak

Anlamlılık testini geçtikten sonra, Pearson Correlation değerinin işaretine bakarız.

İşaret: Değerin önünde eksi işareti olmadığı için ilişki pozitiftir.

Yorum: Eğitim seviyesi arttıkça, gelir seviyesi de artma eğilimindedir.

Adım 3: Korelasyonun Gücünü (Büyüklüğünü) Yorumlamak

Son olarak, Pearson Correlation değerinin mutlak büyüklüğünü yorumlarız.

Değer: 0.324

Genel Kural:

  • 0.1 - 0.29: Zayıf ilişki
  • 0.3 - 0.59: Orta düzey ilişki
  • 0.6 ve üstü: Güçlü ilişki

Yorum: 0.324 değeri orta düzey aralığına girmektedir.

3. Nihai Sonuç ve Regresyona Geçişin Temelleri

Tüm bu adımları birleştirdiğimizde, tam yorumumuz şu şekilde olur:

“Eğitim seviyesi ile gelir seviyesi arasında, istatistiki olarak anlamlı, pozitif yönde ve orta düzeyde bir korelasyon bulunmaktadır (r = 0.324, p < .001).”

Bu sonuç, bir sonraki adım olan regresyon analizi için sağlam bir zemin oluşturur. Artık biliyoruz ki:

  1. Bu iki değişken arasında modellemeye değer, “gerçek” bir ilişki var.

  2. Bu ilişkinin temel sayısal özeti (korelasyon) 0.324’tür.

  3. Daha önce serpilme diyagramından elde ettiğimiz regresyon denklemi (y = 2.69 + 0.99x), bu 0.324’lük orta düzey korelasyona sahip ilişkinin matematiksel modelidir.

Şimdi bu bilgiler ışığında, regresyon çıktılarının bu korelasyon bulgusunu nasıl daha derinlemesine açıkladığını ve 0.324’lük korelasyonun, modelin açıklama kapasitesine (R-Kare) nasıl dönüştüğünü inceleyeceğiz.

12. SPSS’de Basit Lineer Regresyon Analizi (Giriş Dersi Olması Sebebi ile)

degree (eğitim seviyesi) ile income (gelir seviyesi) arasında basit lineer regresyon analizi yapıyoruz.

Basit Doğrusal Regresyon Analizi: SPSS Çıktılarının Yorumlanması

Korelasyon analizi ile Eğitim Seviyesi ve Gelir Seviyesi arasında istatistiksel olarak anlamlı, pozitif ve orta düzeyde bir ilişki olduğunu tespit ettikten sonra, bu ilişkiyi matematiksel bir modelle ifade etmek ve tahmin gücünü ölçmek için Basit Doğrusal Regresyon analizi gerçekleştiririz. SPSS’in ürettiği çıktılar, bu modelin farklı yönlerini açıklayan birkaç temel tablodan oluşur. Bu tablolar, belirli bir öncelik sırasıyla yorumlanmalıdır.

1. İlk Adım: Modelin Genel Anlamlılığının Değerlendirilmesi (ANOVA Tablosu)

Regresyon analizinde bakılması gereken ilk ve en önemli tablo, ANOVA (Varyans Analizi) tablosudur. Bu tablo, kurulan regresyon modelinin, bağımlı değişkeni tahmin etmede “hiçbir şey yapmamaktan” (yani sadece ortalamayı tahmin etmekten) istatistiksel olarak daha iyi olup olmadığını test eder.

Bakılacak Değer: Sig. (Significance / p-değeri) sütunu.

Değer: <.001

Karar Kuralı: Eğer p < 0.05 ise, modelin bir bütün olarak istatistiksel açıdan anlamlı bir açıklama kapasitesine sahip olduğu sonucuna varılır.

Yorum: p değerimiz .001’den bile küçük olduğu için, kurduğumuz regresyon modelinin istatistiksel olarak anlamlı olduğunu söyleyebiliriz. Bu sonuç, bize diğer tabloları güvenle yorumlama izni verir. Eğer bu değer 0.05’ten büyük olsaydı, model anlamsız kabul edilir ve analiz burada durdurulurdu.

2. İkinci Adım: Tahmin Denkleminin Oluşturulması (Coefficients Tablosu)

Modelin genel olarak anlamlı olduğunu teyit ettikten sonra, bize tahmin formülünü veren Katsayılar (Coefficients) tablosunu inceleriz.

Bakılacak Sütun: Unstandardized Coefficients B sütunu.

Bileşenler:

(Constant) Satırı: Bu, modelin sabit değeri (Intercept, β₀)’dir. Değeri 2.688’dir (yuvarlak olarak 2.69).

Bağımsız Değişken Satırı (“Bitirdiğiniz en yüksek eğitim seviyesi nedir?”): Bu, eğim katsayısı (Slope, β₁)’dır. Değeri 0.995’tir (yuvarlak olarak 0.99).

Anlamlılık Kontrolü: Bu katsayıların kendi başlarına da istatistiksel olarak anlamlı olup olmadığını Sig. sütunundan kontrol ederiz. Her iki katsayı için de p < .001 olduğu için, hem sabit değerin hem de eğitim seviyesinin katsayısının modelde anlamlı bir rol oynadığını görürüz.

Regresyon Denklemi: Bu katsayıları birleştirerek, daha önce serpilme diyagramında gördüğümüz tahmin formülünü oluştururuz:

Beklenen Gelir Seviyesi = 2.69 + 0.99 (Eğitim Seviyesi)

Yorum: Bu denklem, Eğitim Seviyesi bilindiğinde Gelir Seviyesi’ni tahmin etmemizi sağlar. Buna göre, eğitim seviyesindeki her 1 birimlik artış, gelir seviyesinde ortalama 0.99 birimlik bir artışa yol açmaktadır.

3. Üçüncü Adım: Modelin Açıklama Kapasitesinin Ölçülmesi (Model Summary Tablosu)

Son olarak, modelimizin bağımlı değişkendeki değişkenliği ne ölçüde açıkladığını anlamak için Model Özeti (Model Summary) tablosunu inceleriz.

Bakılacak Değer: R Square (R-Kare veya Belirleme Katsayısı).

Değer: .105

Yorum: R Square = 0.105 değeri, bağımlı değişkenimiz olan Gelir Seviyesindeki toplam varyansın (farklılıkların) %10.5’inin, modelimize dahil ettiğimiz bağımsız değişken olan Eğitim Seviyesi tarafından istatistiksel olarak açıklanabildiğini gösterir.

R-Kare’nin Kaynağı ve Anlamı:

Bu .105 değeri tesadüfi değildir ve önceki analizlerimizle doğrudan ilişkilidir.

  1. Korelasyonun Karesi: Bu değer, daha önce Eğitim ve Gelir arasında bulduğumuz Pearson Korelasyon katsayısının r = 0.324 karesi** alınarak elde edilir:

    (0.324)² ≈ 0.105

  2. Gözlemlenen ve Beklenen Değerler Arasındaki Korelasyon: Alternatif olarak, kurduğumuz regresyon denklemini kullanarak her bir birey için bir “tahmin edilen gelir seviyesi” hesaplayabiliriz. Ardından, bireylerin gerçekte beyan ettikleri gelir seviyeleri ile bu tahmin edilen gelir seviyeleri arasında yeni bir korelasyon hesaplarsak, bulacağımız sonuç yine 0.324 olacak ve bunun karesi de 0.105’i verecektir.

Nihai Özet: Bu analizler sonucunda, Eğitim Seviyesi’nin Gelir Seviyesi üzerinde istatistiksel olarak anlamlı ve pozitif bir etkiye sahip olduğunu, ancak tek başına gelirdeki farklılıkların sadece %10.5’ini açıklayabildiğini söyleyebiliriz. Bu, geliri etkileyen ve modelimizde henüz yer almayan başka birçok faktörün var olduğuna işaret eder ve daha kapsamlı modeller (Çoklu Regresyon) kurma ihtiyacını ortaya koyar.