Veri Tipi ve Görselleştirme İlişkisi

Veri görselleştirme, istatistiksel analiz, kodlama ve veri dönüştürme süreçlerinin her aşamasında vazgeçilmez bir unsurdur. Bu süreçlerin en temel ve kritik bilgisi, çalışılan verinin tipini, değişkenlerin veri türlerini (kategorik ya da sayısal), veri yapısını ve verinin bilgisayarda/dosyada nasıl kaydedildiğini tam olarak bilmektir. Bu bilgi, uygun görselleştirme tekniklerinin seçilmesini, istatistiksel modellerin belirlenmesini, analizlerin gerçekleştirilmesini, sonuçların güvenilir yorumlanmasını ve SPSS, R ya da Python gibi yazılımların sunduğu olanakları veya kısıtlamaları doğrudan etkiler. Gerektiğinde veri tipi dönüşümleri (type conversion) yapılarak, başlangıçta mümkün olmayan analiz ve görselleştirmeler uygulanabilir hâle getirilir.

Değişken Tipine Göre Görselleştirme Seçimi

Görselleştirme tekniklerinin seçimi büyük ölçüde değişken tipine bağlıdır:

  • Tek değişkenli kategorik değişken (örneğin cinsiyet dağılımı) için yaygın olarak çubuk grafik (bar plot) veya pasta grafiği (pie chart) kullanılır.

  • İki sayısal değişken arasındaki ilişkiyi incelemek istediğimizde saçılım grafiği (scatter plot) tercih edilir.

  • Tek bir sayısal değişkenin dağılımını göstermek amacıyla ise histogram en uygun yöntemdir.

Bu temel prensip, veri görselleştirme sürecinde tutarlı ve etkili sonuçlar elde etmenin anahtarıdır.

1: SPSS ile Temel Görselleştirme Mantığı

TGSS 2024 Veri Setimizi Açıyoruz.

TGSS 2024 veri setimizin SPSS’e yükleme adımları grafik olarak aşağıda gösterilmiştir.

Data View Ekranı

Variable View Ekranı

R diline geçmeden önce arka planın daha iyi oturması için SPSS üzerinden görselleştirme mantığı kavranmalıdır. Grafikler, X (yatay) ve Y (dikey) eksenlerinden oluşan koordinat sistemine yerleştirilir. Aksine bir araştırma nedeni yoksa, bağımsız değişken X eksenine (zaman/eğitim), bağımlı değişken Y eksenine (değişim/gelir) konur.