2. Signal ve Noise Kavramı: İstatistiksel Anlamlılığın Temeli

Noise (Gürültü): Veride zaten var olan doğal varyasyon, rastgele dalgalanma ve örneklem hatasıdır. Örneğin boy değişkenindeki standart sapma ve bireyler arasındaki doğal farklılıklar “noise”u oluşturur. Bu, veride beklenen ve kaçınılmaz olan “cızırtı” veya “esneklik”tir.

Signal (Sinyal): Noise’un ötesinde, rastgele varyasyondan ayrı olarak ortaya çıkan sistematik bir örüntü, pattern veya gerçek grup farkıdır. Gözlemlenen bir ayrışma, sadece gürültüden ibaret değil de bunun ötesinde belirgin bir yapı (signal) taşıyorsa, o zaman istatistiksel olarak anlamlı bir farktan söz ederiz.

Kısacası:

Signal’in noise’dan güçlü şekilde ayrışması, bulgularımızın tesadüfi olmadığını ve popülasyonda da gerçek bir farklılığın bulunduğunu gösterir. Bu kavram, ileride göreceğimiz tüm hipotez testleri, güven aralıkları ve p-değeri yorumlarının temel mantığını oluşturur.

2.1 Signal ve Noise Kavramı ile Effect Size (Etki Büyüklüğü)

Az önceki grafiklere bakar isek;

Hocamız, signal (sinyal) ve noise (gürültü) kavramlarını iki error bar grafiği üzerinden çok net bir şekilde karşılaştırmıştır.

Kentleşme grafiğinde (Kırsal – Orta Yoğun Kent – Yoğun Kent): Ortalamalar arasında küçük farklar olsa da %95 güven aralıkları büyük ölçüde örtüşmektedir. Bu, gözlenen farkların noise (verideki doğal rastgele varyasyon ve örneklem hatası) kaynaklı olduğunu gösterir. Noise’un ötesinde belirgin bir pattern (sinyal) yoktur.

Cinsiyet grafiğinde (Erkek – Kadın): Güven aralıkları hiç kesişmemektedir. Bu net ayrışma, farkın noise’un ötesinde olduğunu, yani gerçek bir signal (sistematik pattern) bulunduğunu gösterir.

Parametrik çıkarımsal istatistik tam da bu ayrım üzerine kuruludur:

Noise = veride zaten var olan doğal dalgalanma ve varyans

Signal = bu gürültünün ötesindeki gerçek, sistematik fark

Hocamızın vurguladığı kritik soru şudur:“Gruplar farklı görünüyor, peki ne kadar farklı?”

Bu sorunun cevabı Effect Size (etki büyüklüğü / etki oranı) kavramıdır. Effect size, sinyalin noise’a (standart sapmaya) oranını ölçer ve gruplar arasındaki farkın pratik önemini ve büyüklüğünü sayısal olarak ifade eder.

Çıkarımsal istatistikte standart hata, noise’un pratik bir ölçüsü olarak kabul edilir. İki grup ortalaması arasındaki fark, standart hatanın kaç katı uzaklıkta ise (örneğin 1 noise, 2 noise, 3 noise…), sinyal o kadar güçlü kabul edilir.

Kısacası: Effect size, sadece “fark var mı?” sorusuna değil, “fark ne kadar büyük ve pratik olarak ne kadar anlamlı?” sorusuna da cevap verir. Bu sayede hem istatistiksel anlamlılığı (statistical significance) hem de farkın büyüklüğünü (practical significance) birlikte değerlendirebiliriz.

2.2 Kentleşme Grupları Arasında Boy Ortalamalarının İstatistiksel Olarak Farklı Olup Olmadığının Test Edilmesi

Şimdi hocamız, error bar grafiğinde görsel olarak değerlendirdiğimiz üç grup (Kırsal – Orta Yoğun Kent – Yoğun Kent) için asıl önemli soruyu ortaya koyuyor:

“Bu üç grubun boy ortalamaları istatistiksel olarak birbirinden farklı mıdır?”

Grafikteki güven aralıklarının büyük ölçüde örtüşmesi bize “fark yok gibi görünüyor” dedirtmişti. Ancak bu sadece sezgisel bir değerlendirmedir. Çıkarımsal istatistikte nihai ve güvenilir bir karara varmak için resmi hipotez testi yapmamız gerekir.

Bu sorunun cevabını verebilmek için SPSS’te bir sonraki adıma geçeceğiz ve gruplar arası ortalama farklarını istatistiksel olarak test edeceğiz. Böylece sadece “fark var mı?” değil, bu farkın noise’un ötesinde gerçek bir signal olup olmadığını (yani istatistiksel anlamlılık düzeyinde farklılık olup olmadığını) bilimsel olarak belirleyeceğiz.

2.2.1 Analiz Yönteminin Belirlenmesi

Hocamız şimdi, kentleşme grupları arasındaki farkı görsel olarak değerlendirdikten sonra asıl analize geçiyor ve şöyle diyor:

Hemen bunun analizini yapalım. Burada neyi kıyaslıyoruz?

Kırsalda yaşayanların, orta yoğun kentte yaşayanların ve yoğun kentte yaşayanların boy ortalamaları birbirinden farklı mı, değil mi?

Dolayısıyla yaptığımız şey üç grup arasında ortalama kıyaslamasıdır.

Peki bu karşılaştırma istatistikte nasıl yapılır?

Hocamız burada çok önemli bir noktaya dikkat çekiyor:

Değişkenlerin tipini (ölçek türü) bilmek son derece önemlidir. Çünkü hangi analiz yöntemini kullanacağımıza (t-testi, ANOVA, non-parametrik test vb.) tam olarak bu değişken tiplerine bakarak karar veririz.

Değişkenlerin tipini (ölçek düzeyini) bilmek, hangi analiz yöntemini seçeceğimizi belirlemede kritik öneme sahiptir. Çünkü yapacağımız analiz doğrudan değişkenlerin niteliğine göre şekillenir.

  • İki nominal/kategorik değişken arasındaki ilişkiye bakıyorsak → çapraz tablo ve Ki-kare testi,

  • İki sayısal (sürekli) değişken arasındaki ilişkiye bakıyorsak → korelasyon analizi (Pearson korelasyonu),

  • Bir sayısal değişken ile bir kategorik değişken arasındaki ilişkiye bakıyorsak → ortalama kıyaslaması yaparız.

İstatistikçiler, kategorik değişkenin içerdiği grup sayısına göre ortalama kıyaslaması için farklı yöntemler geliştirmiştir:

  • Kategorik değişken 2 grup içeriyorsa → Independent Samples T-Test,

  • Kategorik değişken 3 veya daha fazla grup içeriyorsak → One-Way ANOVA (Analysis of Variance) kullanılır.

Örneğin kadın ve erkeklerin boy ortalamalarını karşılaştırırken T-Test, kırsal – orta yoğun kent – yoğun kent olmak üzere üç gruplu bir karşılaştırma yaparken ise One-Way ANOVA testi uygularız.

2.2.2 Üç Gruplu Ortalama Kıyaslaması: Kentleşme Durumuna Göre Boy Ortalamalarının Analizi (Mean Comparison)

Şimdi ise elimizdeki üç gruplu (Kırsal – Orta Yoğun Kent – Yoğun Kent) sayısal değişken (boy) üzerinden ortalama kıyaslamasına (Mean Comparison) geçiyoruz.

Daha önceki değişkenlerin tamamen temizlenmesi için RESET tuşuna tıklayarak temizleyelim.

Hocamız, Analyze → Compare Means → Means prosedürüyle elde edilen tabloyu yorumlamıştır:

Kırsal: Ortalama boy = 168.19 cm (N = 276)

Orta Yoğun Kent: Ortalama boy = 167.60 cm (N = 267)

Yoğun Kent: Ortalama boy = 167.21 cm (N = 1158)

Üç grubun ortalama boyları arasında küçük farklar olduğu görülmektedir. Ancak çıkarımsal istatistikte bu farkların örnekleme özgü rastgele varyasyon (noise) mu, yoksa popülasyonda gerçekten var olan sistematik bir fark (signal) mı olduğunu bilmek isteriz.

Bu soruyu cevaplamak için hipotez testi yapmamız gerekir. Hipotez testi, çıkarımsal istatistiğin temel mekanizmasıdır.

2.3 Hipotez Testi: Boş Hipotez (H₀) ve Alternatif Hipotez (H₁)

Hipotez testi, çıkarımsal istatistiğin temel taşıdır. Bu testte iki temel hipotez kurulur:

Boş Hipotez (Null Hypothesis – H₀): Gruplar arasında boy ortalaması bakımından hiçbir fark yoktur. Yani kırsal, orta yoğun kent ve yoğun kentte yaşayan bireylerin popülasyon ortalamaları (μ) eşittir.

Alternatif Hipotez (Alternative Hypothesis – H₁): Gruplar arasında en az bir grup açısından ortalama farkı vardır.

İstatistiksel testlerde genellikle önce boş hipotez (H₀) test edilir. Çünkü H₀’ı reddetmek, alternatif hipotezin (H₁) lehine güçlü kanıt sunar. Boş hipotez reddedilebildiğinde “gruplar arasında istatistiksel olarak anlamlı bir fark vardır” sonucuna varılır.

Hocamızın şu andaki temel sorusu şudur:“Means tablosunda gördüğümüz bu küçük ortalama farkları gerçekten noise (rastgele örneklem varyasyonu) mu yaratıyor, yoksa signal (gerçek sistematik fark) mi taşıyor? Bu farkın noise’dan kaynaklanma ihtimali nedir?”

Bu ihtimal p-değeri ile ölçülür. p-değerini bulmak için şimdi One-Way ANOVA hipotez testine geçeceğiz.

2.3.1 One-Way ANOVA ile Kentleşme Düzeyine Göre Boy Ortalamalarının Karşılaştırılması

Bizim durumumuzda kentleşme durumu değişkeni üç grup içerdiği için (Kırsal – Orta Yoğun Kent – Yoğun Kent), gruplar arası ortalama farklarını test etmek üzere One-Way ANOVA analizini çalıştıracağız.

Karşımıza gelen Number of Cases ve Standart Deviation ’a ihtiyacımız olmadığı için tıklayıp sol tuş ile yana atmayı unutmayınız bize sadece Mean lazım olduğu için onu yalnız bıraktık. Son durum aşağıdaki gibidir.

Continue ve OK’yı tıklayınca karşımıza aşağıdaki sonuç gelir.

One-Way ANOVA Sonuçlarının Yorumu: p-Değeri (Sig.) ve İstatistiksel Anlamlılık

ANOVA Tablosunda Sig. = 0.337 (p = 0.337) olarak görülmektedir.

Bu p-değeri bize şunu söyler:

Boş hipotez (H₀) doğruysa (yani kentleşme grupları arasında popülasyon ortalamalarında gerçekten hiçbir fark yoksa), gözlenen bu ortalama farkları (veya daha büyük farkları) rastgele örneklem varyasyonundan (noise) kaynaklı olarak bulma ihtimalimiz %33,7’dir.

İstatistikte geleneksel anlamlılık eşiği %5 (p < 0.05) olarak kabul edilir.

p-değerimiz 0.337 > 0.05 olduğu için boş hipotez (H₀) reddedilemez.

Dolayısıyla, “Kırsal, orta yoğun kent ve yoğun kent gruplarının boy ortalamaları arasında istatistiksel olarak anlamlı bir fark yoktur” sonucuna varıyoruz. Gözlenen küçük farklar büyük olasılıkla rastgele örneklem hatasından (noise) kaynaklanmaktadır; gerçek popülasyonda sistematik bir sinyal (fark) olduğuna dair yeterli kanıt bulunmamaktadır.

Özet kural:

p-değeri ne kadar küçük olursa (özellikle 0.05’in altına inerse), boş hipotezi reddetme gücümüz o kadar artar ve “gruplar arasında anlamlı fark vardır” diyebiliriz.

2.3.2 One-Way ANOVA ile Kentleşme Düzeyine Göre Kilo Ortalamalarının Karşılaştırılması

Options’da daha evvel Anova kısmı halen aktif olduğu için direk OK’yi tıklıyoruz.

One-Way ANOVA ile Kentleşme Düzeyine Göre Kilo Ortalamalarının Karşılaştırılması One-Way ANOVA testi sonucunda, kentleşme düzeyine (kırsal – orta yoğun kent – yoğun kent) göre kilo ortalamaları arasında istatistiksel olarak anlamlı bir fark bulunmamıştır (p = 0.835 > 0.05). Gözlenen küçük farklar tamamen rastgele örneklem varyasyonundan (noise) kaynaklanmaktadır.

2.3.3 One-Way ANOVA ile Medeni Duruma (Evlilik Durumuna) Göre Kilo Ortalamalarının Karşılaştırılması

Options’da daha evvel Anova kısmı halen aktif olduğu için direk OK’yi tıklıyoruz.

Medeni Duruma (Evlilik Durumuna) Göre Kilo Ortalamalarının One-Way ANOVA ile Karşılaştırılması One-Way ANOVA testi sonucunda Sig. (p) < 0.001 olarak bulunmuştur. Bu değer, gözlenen ortalama farkların rastgele örneklem varyasyonundan (noise) kaynaklanma ihtimalinin binde birden daha düşük olduğunu göstermektedir.

Dolayısıyla boş hipotez (H₀) reddedilir ve şu sonuca varılır:

Medeni durum grupları arasında kilo ortalaması bakımından istatistiksel olarak anlamlı bir fark vardır. En az bir grup diğerlerinden farklıdır.

2.3.3.1 Medeni Duruma Göre Kilo Ortalamalarının Error Bar Grafiği ile Görsel Değerlendirilmesi

Hocamız, One-Way ANOVA testiyle medeni durum grupları arasında istatistiksel olarak anlamlı bir fark tespit ettikten sonra, bu farkı daha sezgisel ve görsel olarak yorumlamak istiyor.

Bu amaçla SPSS’teki Graphs → Error Bar menüsüne geçerek medeni durum değişkenine göre kilo ortalamalarının ve her grubun %95 güven aralıklarının (error bars) yer aldığı grafiği oluşturacaktır.

Böylece tabloda gördüğümüz farkların ne kadar belirgin olduğunu, güven aralıklarının ne ölçüde örtüştüğünü ve hangi grupların birbirinden ayrıştığını tek bakışta değerlendirebileceğiz.

Medeni Duruma Göre Kilo Ortalamalarının Error Bar Grafiği ile Görsel Değerlendirmesi >Hocamız, One-Way ANOVA’da elde edilen istatistiksel anlamlı farkı (p < 0.001) daha sezgisel bir şekilde yorumlamak için Error Bar grafiğini incelemiştir.

Grafikte en belirgin ayrışma “Evli, eşiyle birlikte yaşayan” grubunda görülmektedir (ortalama ≈ 76.5 kg). Bu grubun %95 güven aralığı, diğer medeni durum gruplarının (“Hiç evlenmedi”, “Evli, eşiyle birlikte yaşamıyor”, “Evli değil ama birlikte yaşayan”, “Boşandı”, “Eşi öldü”) güven aralıklarıyla kesişmemekte veya çok az kesişmektedir.

Diğer grupların güven aralıkları ise büyük ölçüde birbirini kapsamakta ve örtüşmektedir. Hocamızın da vurguladığı gibi, “Evli, eşiyle birlikte yaşayan” grubu çıkarıldığında büyük olasılıkla istatistiksel olarak anlamlı bir fark kalmayacaktır.

Ayrıca “Evli değil ama birlikte yaşayan” grubunun hata çubuğu oldukça geniştir. Bunun nedeni bu grubun örneklem sayısının çok küçük olmasıdır. Küçük örneklem, standart hatayı artırır ve güven aralığını genişleterek gruplar arasındaki ayrışmayı zorlaştırır.

Kısacası grafik, ANOVA’da bulunan anlamlı farkın temelde “evli ve eşiyle birlikte yaşayan” grubundan kaynaklandığını görsel olarak net bir şekilde ortaya koymaktadır. Bu sayede hangi grubun diğerlerinden ayrıştığını ve farkın kaynağını tek bakışta anlayabiliyoruz.