www.medyanistdanismanlik.com
info@medyanistdanismanlik.com
İstatistiksel veri türlerini anlamak, uygun analiz tekniklerini seçmek ve sonuçları doğru yorumlamak için önemlidir. İstatistiksel veriler sürekli ve kesikli olarak iki ana kategoriye ayrılabilir ve bu kategoriler dört türe (nominal, ordinal, aralık ve oran) bölünebilir. Bu bölümde sürekli ve kesikli veri kavramları ile diğer veri türleri açıklanmış ve R kullanılarak nasıl görselleştirileceği gösterilmiştir.
Nominal veriler, herhangi bir sıralama içermeyen kategoriler veya etiketlerdir. Bu tür veriler niteliktir ve yalnızca sayılabilir, sıralanamaz veya ölçülemez.
Bar grafikleri ve pasta grafikleri nominal verileri görselleştirmek için yaygın olarak kullanılır.
# Örnek veri
tablo_nominal <- data.frame(
Kategori = c("Erkek", "Kadın"),
Sayı = c(45, 50)
)
# Bar grafiği
barplot(tablo_nominal$Sayı, names.arg = tablo_nominal$Kategori,
main = "Nominal Veri: Cinsiyet Dağılımı",
xlab = "Cinsiyet", ylab = "Sayı")
# Pasta grafiği
pie(tablo_nominal$Sayı, labels = tablo_nominal$Kategori,
main = "Nominal Veri: Cinsiyet Dağılımı")
Ordinal veriler, sıralama içeren kategorileri ifade eder ancak değerler arasındaki aralıklar eşit değildir.
Sıralı kategoriler içeren bar grafikleri ordinal veriler için uygundur.
# Örnek veri
tablo_ordinal <- data.frame(
Memnuniyet = factor(c("Kötü", "Orta", "İyi", "Çok İyi"),
levels = c("Kötü", "Orta", "İyi", "Çok İyi")),
Sayı = c(10, 15, 30, 45)
)
# Bar grafiği
barplot(tablo_ordinal$Sayı, names.arg = tablo_ordinal$Memnuniyet,
main = "Ordinal Veri: Müşteri Memnuniyeti",
xlab = "Memnuniyet", ylab = "Sayı")
Aralık verileri, anlamlı aralıklar içeren nicel verilerdir ancak gerçek bir sıfır noktasına sahip değildir.
Histogramlar ve çizgi grafikleri aralık verileri için yaygın görselleştirme yöntemleridir.
# Örnek veri
set.seed(123)
aralik_veri <- data.frame(
Sicaklik = rnorm(100, mean = 20, sd = 5)
)
# Histogram
hist(aralik_veri$Sicaklik,
main = "Aralık Veri: Sıcaklık Dağılımı",
xlab = "Sıcaklık (°C)", ylab = "Frekans")
# Çizgi grafiği
plot(sort(aralik_veri$Sicaklik), type = "l",
main = "Aralık Veri: Sıcaklık Eğilimi",
xlab = "İndeks", ylab = "Sıcaklık (°C)")
Oran verileri, gerçek bir sıfır noktası içeren nicel verilerdir ve tüm aritmetik işlemler uygulanabilir.
Dağılım grafikleri (scatter plot) ve kutu grafikleri (boxplot) oran verileri için uygundur.
# Örnek veri
set.seed(123)
oran_veri <- data.frame(
Boy = rnorm(100, mean = 170, sd = 10),
Kilo = rnorm(100, mean = 65, sd = 12)
)
# Dağılım grafiği
plot(oran_veri$Boy, oran_veri$Kilo,
main = "Oran Veri: Boy ve Kilo Dağılımı",
xlab = "Boy (cm)", ylab = "Kilo (kg)",
pch = 19, col = "blue")
# Kutu grafiği
boxplot(oran_veri$Kilo, main = "Oran Veri: Kilo Dağılımı",
ylab = "Kilo (kg)")
| Veri Türü | Özellikler | Örnekler |
|---|---|---|
| Nominal | Sırasız kategoriler | Cinsiyet, Göz rengi |
| Ordinal | Sıralı kategoriler, tutarsız aralıklar | Eğitim seviyesi, Memnuniyet |
| Aralık | Sıralı, eşit aralıklar, gerçek sıfır yok | Sıcaklık, IQ skorları |
| Oran | Sıralı, eşit aralıklar, gerçek sıfır var | Boy, Ağırlık, Gelir |
Veri türlerini anlamak şunları sağlar: - Doğru istatistiksel testlerin uygulanması - Doğru veri görselleştirme - Anlamlı sonuçların yorumlanması
Örneğin, nominal verilere t-testi uygulamak uygun değildir, çünkü bu test anlamlı farklar içeren nicel veri varsayar. Benzer şekilde, ordinal verileri aralık verileri gibi yorumlamak yanıltıcı sonuçlara yol açabilir.