3.baskı, Seçkin Yayınevi, Ankara.

Bölüm 1. Giriş

Veri Madenciliğinin Gelişimi

Veri madenciliği (data mining) bilgisayar ortamında depolanmış büyük hacimli verilerden değerli bilgilerin çıkartılmasında kullanılan bir bilgi keşfi (knowledge discovery) süreci/yöntemi olarak tanımlanabilir.

Veri Madenciliğinin tarihsel gelişimi aşağıdaki gibi verilebilir.

  • Veri Toplama ve veritabanı oluşturma (1960’lı yıllar)
  • Veritabanı Yönetim Sistemlerinin Gelişimi (1970-1980)
  • Gelişmiş Veritabanı Sistemleri (1980-günümüz)
  • Veri Ambarı ve Veri Madenciliği (1980 yılların sonu-günümüz)
  • Web-tabanlı Veritabanları (1990-Günümüz)
  • Yeni Nesil Bilgi Sistemleri (Günümüzden geleceğe)

Bilgi Keşfi Yöntemleri

  • Yapay Zeka
  • Makine Öğrenmesi
  • Derin Öğrenme
  • Veri Bilimi
  • Veri Madenciliği
  • İstatistik

İstatistik ve Veri Madenciliği

  • Veri madenciliği yöntemleri nispeten daha büyük veri yapılarında kullanılır.
  • Klasik istatistiksel yöntemlerin ihtiyaç duyduğu bir çok varsayım veri madenciliğinde genellikle gerekli değildir.
  • Klasik istatistikte çıkarsama yapmak için hipotezler oluşturulur ve hipotezleri test etmeye uygun veriler toplanır. Veri madenciliğinde ise, gerekli / gereksiz toplanmış verilerden faydalı bilgiler çıkartılmaya çalışılır.
  • Veri madenciliğinde yeni veriler elde edildikçe elde edilen modellerin veya kuralların eğitilmesine devam edilir.
  • İstatistikte yeterli bir örneklem büyüklüğüne dayalı olasılık modelleri kullanılırken veri madenciliğinde genellikle büyük hacimli veriye dayalı öğrenme modelleri kullanılır.

Veri Madenciliğinin Alt Alanları

  • Metin Madenciliği
  • Görsel Madencilik
  • Gen Analizi
  • Web Madenciliği
  • Sosyal Ağ Analizi

Veri Madenciliğinin Kullanım Alanları

  • Müşteri İlişkileri Yönetimi
  • Dolandırıcılık Tespiti
  • Tıbbi Teşhis
  • Fiyat Tahmini
  • Pazar Analizi

Veri Madenciliği Yöntemleri

  • Özellik Seçimi
  • Sınıflandırma
  • Kümeleme
  • Birliktelik