3 Parametrik Analizlerin Başlangıç Noktası: Merkezi Eğilim Ölçüleri

Veri setlerini özetleme ve anlamlandırma sürecinin tam kalbinde, tüm verinin ortak yönelimini bulma amacı yatar. Bu amaca hizmet eden metrikler “Merkezi Eğilim Ölçüleri” (Measures of Central Tendency) olarak adlandırılır. Parametrik istatistiğin felsefesinde tüm işlemler, hesaplamalar ve modellemeler “orta”dan başlar. Veri setinin yapısal özelliğine göre üç temel merkezi eğilim ölçüsünden faydalanılmaktadır.

3.1 Mod (Tepe Değer)

Bir veri setinde frekansı en yüksek olan, yani en çok tekrar eden gözlem birimine veya grubuna mod adı verilir. Dağılım bir grafiğe döküldüğünde en yüksek tepeyi oluşturan değer moddur. Herhangi bir matematiksel işleme gerek duymaksızın veri setinin genel algısını en basit yansıtan ölçüdür. Aynı frekansa sahip birden fazla tepe değer bulunduğunda dağılım iki modlu (bimodal distribution) olarak nitelendirilir.

3.2 Medyan (Ortanca)

Medyan, dağılımın iki ucu arasında devasa uçurumların bulunduğu veya aşırı ekstrem değerlerin aritmetik ortalamayı saptırdığı durumlarda başvurulan en sağlıklı merkezi eğilim ölçüsüdür. Medyanı bulmak için eldeki tüm veriler en küçükten en büyüğe doğru matematiksel bir sıraya dizilir ve serinin tam ortasında kalan değer medyan olarak kabul edilir (çift sayıda veri varsa ortadaki iki değerin ortalaması alınır).

Medyanın önemi, verideki aşırı uç değerlerin (outliers) aritmetik ortalama üzerinde yarattığı yanılsamaları gidermektir. Örneğin, birkaç teknoloji milyarderinin yaşadığı bir eyalette gelirlerin aritmetik ortalaması, orta sınıfın gerçek gelirini çok yüksek göstererek illüzyon yaratır. Bu tür çarpık dağılımlarda medyan, genel halkın sosyo-ekonomik durumunu çok daha adil ve güçlü bir şekilde temsil eder.

3.3 Aritmetik Ortalama (Mean)

Parametrik istatistikte ve ileri düzey modellemelerde en merkezde duran kavram aritmetik ortalamadır. Tüm gözlemlerin toplanıp toplam gözlem sayısına (N) bölünmesi işlemiyle elde edilir. Tüm verilerin ağırlığını taşıdığı için güçlüdür ancak tam da bu sebeple ekstrem (aykırı) değerlere karşı son derece kırılgan olup saptırılma riski taşır.