Veri Madenciliği Umut Al umutal@hacettepe.edu.tr BBY 363, 18 Aralık 2013 -1 Veri Madenciliğinin Ortaya Çıkışı “data dredging” “data fishing” Farklı alanların etkisi İstatistik Bilgisayar bilimleri Otomasyon Geleneksel tekniklerin yetersizliği Veri artış hızı BBY 363, 18 Aralık 2013 -2 BBY 363, 18 Aralık 2013 -3 BBY 363, 18 Aralık 2013 -4 BBY 363, 18 Aralık 2013 -5 BBY 363, 18 Aralık 2013 -6 BBY 363, 18 Aralık 2013 -7 BBY 363, 18 Aralık 2013 -8 BBY 363, 18 Aralık 2013 -9 Sorunlar Farklı veri kanalları Veri çeşitliliği Veri kalitesi Veri temizliği Anlık veri Birbiri ile bağlantılı veriler (etkileşimlilik) Veri miktarı * analist sayısı BBY 363, 18 Aralık 2013 - 10 BBY 363, 18 Aralık 2013 - 11 BBY 363, 18 Aralık 2013 - 12 BBY 363, 18 Aralık 2013 - 13 Tahmin ve Tanımlama Fonksiyonu Eldeki verilerle gelecekteki durumu yordama Yoruma açık olmayan kalabalık veri setlerinden yorumlanabilir örüntüleri bulma BBY 363, 18 Aralık 2013 - 14 BBY 363, 18 Aralık 2013 - 15 Kullanım Alanları Bilgi erişim Pazarlama Müşteri ilişkileri yönetimi Haberleşme Sağlık E-ticaret … BBY 363, 18 Aralık 2013 - 16 Veri Madenciliğinde Kullanılan Yöntemler Sınıflandırma Kümeleme Ayırma analizi Regresyon Varyans analizi Yapay sinir ağları Karar ağaçları … BBY 363, 18 Aralık 2013 - 17 BBY 363, 18 Aralık 2013 - 18 - 19 - 20 - 21 - 22 - 23 - 24 Tartışma Bilgi toplumu Bilgi toplumunun özellikleri Sayısal uçurum Verilerin e-devlet uygulamalarındaki rolü Ticarette veri madenciliğinin kullanımı Bilgi ekonomisi BBY 363, 18 Aralık 2013 - 25