4 Verinin Anatomisini Okumak: Dağılım Ölçüleri (Değişkenlik Ölçüleri)

Sadece merkezi eğilim ölçülerine (ortalama, mod, medyan) bakarak bir veri setinin doğasını tam olarak kavradığını düşünmek büyük bir yanılgıdır. Skorların merkezin etrafında gerçekte nasıl kümelendiğini, birbirleri arasındaki uzaklığı ifade eden dağılım ölçüleri (Measures of Spread) hesaba katılmadan analiz eksik kalır.

Tahmin modellerinin temeli, verideki varyansı (sapmaları) anlayabilmek üzerine kuruludur.

Standart Sapma ve Varyans Hesaplamasının Anatomisi

Verinin merkezinden olan dağılımını tek bir parametreyle rafine eden en hayati kavram “Standart Sapma”dır (Standard Deviation). En yalın tanımıyla: “Ortalamadan uzaklıkların ortalamasıdır.”

Standart sapma formülü, artı/eksi birbirini götürmesi sorununu çözmek için karesel bir standardizasyon kullanır:

\[ \sigma = \sqrt{\frac{\sum(X - \mu)^2}{N}} \]

Standart sapma sadece bir rakam değil, standartlaştırılmış bir ölçü birimidir. Borsa hisseleri, ürün fiyat esneklikleri veya mühendislikte kanat esnemesi gibi durumlarda doğal varyans limitlerini belirler; sapmalar bu birim üzerinden hesaplanır.