www.medyanistdanismanlik.com
info@medyanistdanismanlik.com

İstatistiksel Veri Türleri

İstatistiksel veri türlerini anlamak, uygun analiz tekniklerini seçmek ve sonuçları doğru yorumlamak için önemlidir. İstatistiksel veriler sürekli ve kesikli olarak iki ana kategoriye ayrılabilir ve bu kategoriler dört türe (nominal, ordinal, aralık ve oran) bölünebilir. Bu bölümde sürekli ve kesikli veri kavramları ile diğer veri türleri açıklanmış ve R kullanılarak nasıl görselleştirileceği gösterilmiştir.

1. Nominal Veri

Nominal veriler, herhangi bir sıralama içermeyen kategoriler veya etiketlerdir. Bu tür veriler niteliktir ve yalnızca sayılabilir, sıralanamaz veya ölçülemez.

  • Örnekler:
    • Cinsiyet (Erkek, Kadın)
    • Kan grubu (A, B, AB, O)
    • Göz rengi (Mavi, Yeşil, Kahverengi)

Nominal Verilerin Görselleştirilmesi

Bar grafikleri ve pasta grafikleri nominal verileri görselleştirmek için yaygın olarak kullanılır.

# Örnek veri
tablo_nominal <- data.frame(
  Kategori = c("Erkek", "Kadın"),
  Sayı = c(45, 50)
)

# Bar grafiği
barplot(tablo_nominal$Sayı, names.arg = tablo_nominal$Kategori, 
        main = "Nominal Veri: Cinsiyet Dağılımı",
        xlab = "Cinsiyet", ylab = "Sayı")

# Pasta grafiği
pie(tablo_nominal$Sayı, labels = tablo_nominal$Kategori, 
    main = "Nominal Veri: Cinsiyet Dağılımı")

2. Ordinal Veri

Ordinal veriler, sıralama içeren kategorileri ifade eder ancak değerler arasındaki aralıklar eşit değildir.

  • Örnekler:
    • Eğitim seviyesi (Lise, Lisans, Yüksek Lisans)
    • Müşteri memnuniyeti dereceleri (Kötü, Orta, İyi, Çok İyi)

Ordinal Verilerin Görselleştirilmesi

Sıralı kategoriler içeren bar grafikleri ordinal veriler için uygundur.

# Örnek veri
tablo_ordinal <- data.frame(
  Memnuniyet = factor(c("Kötü", "Orta", "İyi", "Çok İyi"),
                        levels = c("Kötü", "Orta", "İyi", "Çok İyi")),
  Sayı = c(10, 15, 30, 45)
)

# Bar grafiği
barplot(tablo_ordinal$Sayı, names.arg = tablo_ordinal$Memnuniyet,
        main = "Ordinal Veri: Müşteri Memnuniyeti",
        xlab = "Memnuniyet", ylab = "Sayı")

3. Aralık (Interval) Veri

Aralık verileri, anlamlı aralıklar içeren nicel verilerdir ancak gerçek bir sıfır noktasına sahip değildir.

  • Örnekler:
    • Sıcaklık (Celsius veya Fahrenheit)
    • IQ skorları

Aralık Verilerin Görselleştirilmesi

Histogramlar ve çizgi grafikleri aralık verileri için yaygın görselleştirme yöntemleridir.

# Örnek veri
set.seed(123)
aralik_veri <- data.frame(
  Sicaklik = rnorm(100, mean = 20, sd = 5)
)

# Histogram
hist(aralik_veri$Sicaklik, 
     main = "Aralık Veri: Sıcaklık Dağılımı",
     xlab = "Sıcaklık (°C)", ylab = "Frekans")

# Çizgi grafiği
plot(sort(aralik_veri$Sicaklik), type = "l",
     main = "Aralık Veri: Sıcaklık Eğilimi",
     xlab = "İndeks", ylab = "Sıcaklık (°C)")

4. Oran (Ratio) Veri

Oran verileri, gerçek bir sıfır noktası içeren nicel verilerdir ve tüm aritmetik işlemler uygulanabilir.

  • Örnekler:
    • Boy
    • Ağırlık
    • Gelir

Oran Verilerin Görselleştirilmesi

Dağılım grafikleri (scatter plot) ve kutu grafikleri (boxplot) oran verileri için uygundur.

# Örnek veri
set.seed(123)
oran_veri <- data.frame(
  Boy = rnorm(100, mean = 170, sd = 10),
  Kilo = rnorm(100, mean = 65, sd = 12)
)

# Dağılım grafiği
plot(oran_veri$Boy, oran_veri$Kilo,
     main = "Oran Veri: Boy ve Kilo Dağılımı",
     xlab = "Boy (cm)", ylab = "Kilo (kg)",
     pch = 19, col = "blue")

# Kutu grafiği
boxplot(oran_veri$Kilo, main = "Oran Veri: Kilo Dağılımı",
        ylab = "Kilo (kg)")

Veri Türlerinin Özeti

Veri Türü Özellikler Örnekler
Nominal Sırasız kategoriler Cinsiyet, Göz rengi
Ordinal Sıralı kategoriler, tutarsız aralıklar Eğitim seviyesi, Memnuniyet
Aralık Sıralı, eşit aralıklar, gerçek sıfır yok Sıcaklık, IQ skorları
Oran Sıralı, eşit aralıklar, gerçek sıfır var Boy, Ağırlık, Gelir

Veri Türlerinin Önemi

Veri türlerini anlamak şunları sağlar: - Doğru istatistiksel testlerin uygulanması - Doğru veri görselleştirme - Anlamlı sonuçların yorumlanması

Örneğin, nominal verilere t-testi uygulamak uygun değildir, çünkü bu test anlamlı farklar içeren nicel veri varsayar. Benzer şekilde, ordinal verileri aralık verileri gibi yorumlamak yanıltıcı sonuçlara yol açabilir.