Veri Analizi ve Çıkarımsal İstatistik Temel Kavramları

İstatistik temel olarak iki ana gruba ayrılır: Betimleyici (Descriptive) istatistik ve Çıkarımsal (Inferential) istatistik. Betimleyici istatistik, elimizdeki verinin tamamına hakim olduğumuzda (örneğin bir okuldaki tüm öğrencilerin verisi) bu değişkenlerin dağılımlarını tanımlamak için kullanılır. Çıkarımsal istatistik ise bütün evrene dair bilgimizin olmadığı durumlarda evrenin bir kesitini (örneklemini) alarak o kesit üzerinden geneli tahmin etmeye dayalıdır. Türkiye Genel Sosyal Saha Araştırması 2024 veri setinde yer alan 2615 kişilik örneklem ile 84 milyonluk Türkiye nüfusunun özelliklerinin tahmin edilmeye çalışılması çıkarımsal istatistiğe bir örnektir.

Çıkarımsal istatistik her zaman ihtimale dayalıdır ve ulaşılan sonuçların gerçekten popülasyondaki bir farkı mı yansıttığı yoksa olağan bir varyansın (dalgalanmanın) sonucu mu olduğu test edilmek zorundadır.

1. TGSS 2024 Veri Setimizi Açıyoruz.

TGSS 2024 veri setimizin SPSS’e yükleme adımları grafik olarak aşağıda gösterilmiştir.

Data View Ekranı

Variable View Ekranı

Hocamızın Bugünkü Derse Giriş Anlatımı: Elimizde, Türkiye Genel Sosyal Araştırması 2024 (TGSS 2024) veri seti yer almaktadır. Bu veri seti, Türkiye genelinde rastgele örnekleme yöntemiyle seçilmiş 2615 bireyden oluşmakta ve Türkiye nüfusunun (yaklaşık 84 milyon toplam nüfus veya 18 yaş üstü yaklaşık 60 milyon yetişkin) parametrelerini temsil etme iddiasıyla tasarlanmış bir örneklemdir. Amacımız, bu örneklemden hareketle Türkiye genelindeki bazı popülasyon parametrelerini (örneğin ortalamalar, oranlar veya regresyon katsayıları) tahmin etmek ve anlamlandırmaktır.

Dolayısıyla, Türkiye’nin tamamı veya belirli altgruplar (sosyal gruplar, yaş grupları, eğitim seviyeleri, coğrafi bölgeler ya da sağlık durumuna göre sınıflandırmalar) hakkında yapacağımız her türlü çıkarım, örneklem istatistiklerine dayalı tahmini çıkarımlar (point estimation ve interval estimation) niteliğinde olacaktır. Bu tahmini çıkarımları yaparken temel istatistiksel ilke, gözlenen farklılıkların (örneğin grup ortalamaları arasındaki farkların) gerçekten popülasyondaki parametre farklarını yansıtıp yansıtmadığını, yani örneklem varyansı ve örneklem büyüklüğü dikkate alınarak hipotez testi (örneğin t-testi, ANOVA, ki-kare testi) veya güven aralıkları ile belirlemektir: bulgularımız, altgruplar arasındaki gerçek (popülasyon düzeyindeki) farklılıklara hangi istatistiksel güven düzeyinde ve ne ölçüde işaret etmektedir?