ÜNAK 2009 Bilgi Çağında Varoluş: “Fırsatlar ve Tehditler” Sempozyumu 01-02 Ekim 2009 - Yeditepe Üniversitesi, İstanbul Bildiriler Kitabı Editörler Aytaç YILDIZELİ Doç.Dr. Aykut ARIKAN İstanbul, 2011 Arş.Gör. Tolga ÇAKMAK ÜNAK 2009 Bilgi Çağında Varoluş: “Fırsatlar ve Tehditler” Sempozyumu, 01 - 02 Ekim 2009, Yeditepe Üniversitesi, İstanbul - TÜRKİYE, Bildiriler Kitabı. http://www.unak.org.tr/unak099/ Yayıncı: Yeditepe Üniversitesi © ÜNAK, Yeditepe Üniversitesi ve Yazarlar, 2011. Her hakkı saklıdır. Kapak ve Afiş Tasarım: Ersel Yavuz Sayfa Mizanpajı: BULUŞ Tasarım ve Matbaacılık Hizmetleri / ANKARA, Kaan KÖKSAL ISBN: 978-975-307-059-1 ÜNAK 2009 Bilgi Çağında Varoluş:”fırsatlar ve tehditler” Sempozyumu (9.:2009: İstanbul) Bildiriler kitabı / ÜNAK 2009 Bilgi Çağında Varoluş:”Fırsatlar ve Tehditler” Sempozyumu, 01-02 Ekim 2009, Yeditepe Üniversitesi, İstanbul; Ed. Aytaç Yıldızeli, Aykut Arıkan [ve] Tolga Çakmak . – İstanbul: Yeditepe Üniversitesi, 2010. s.; cm. Kaynakça bölüm sonlarında. Konu ve Yazar dizini var. 1. KÜTÜPHANE BİLİMİ - TÜRKİYE - KONGRELER. I. Yıldızeli, Aytaç. II. Arıkan, Aykut. III. Çakmak, Tolga. Z672.5 Un13 2010 II 020 Un13 2010 ÜNAK ‘09 Toplantı Düzenleme ve Program Komitesi Filiz Çermen, Yeditepe Üniversitesi Bilgi Merkezi Aytaç Yıldızeli, ÜNAK Mehmet Boz, ÜNAK İlhan Akçal, ÜNAK Fidan Yavuz, ÜNAK Havva Alkış, ÜNAK Emine Türkoğlu, ÜNAK Erol Gökduman, ÜNAK Bildiri Değerlendirme ve Yayın Kurulu Aykut Arıkan, Yeditepe Üniversitesi Filiz Çermen, Yeditepe Üniversitesi Bilgi Merkezi Aytaç Yıldızeli, ÜNAK Hasan Işın Dener, Çankaya Üniversitesi Berin U. Yurdadoğ, Hacettepe Üniversitesi Nilüfer Tuncer, Hacettepe Üniversitesi Fatoş Subaşıoğlu, Ankara Üniversitesi Bengü Çapar, Başkent Üniversitesi Oya Gürdal Tamdoğan, Ankara Üniversitesi Sacit Arslantekin, Ankara Üniversitesi Mustafa Sağsan, Yakın Doğu Üniversitesi Nilay Alüftekin, Çankaya Üniversitesi Türksel Kaya Bengshir, TODAİE Meral Alakuş, IKM Kanada İlhan Akçal, ÜNAK Mehmet Boz, ÜNAK Hatice Kübra Bahşişoğlu, Muğla Üniversitesi Tolga Çakmak, Hacettepe Üniversitesi III ÜNAK ‘09 İş Süreçlerinin Değişiminde Bilgi Yönetiminin Sihirli Gücü Sevinç GÜLSEÇEN, Necati DÖNMEZ ve Çiğdem EROL ............................................. 82 Toplam Kalite Yönetimi Bilgi Yönetimini Nasıl Tamamlar ve Destekler? Meriç M. AKYOL ve Sevinç GÜLSEÇEN .................................................................... 96 Türkiye’ nin Bilimsel Yayın Performansının Dünya ile Karşılıştırmalı Değerlendirilmesi Elif Aytek GÜRSES ve Serpil YETGİN ..................................................................... 105 Türkiye’ de Elektronik Belge Yönetimine Dönük Koşulların Değerlendirilmesi: 17 Kurumda Gerçekleştirilen Analiz Sonuçları Özgür KÜLCÜ ve Tolga ÇAKMAK .......................................................................... 113 Web Teknolojisinde Yeni Bilgi Fırtınası: Web 3.0 Yalçın YAĞCI ........................................................................................................ 138 Organizasyonlarda Bilgi Yönetimi Sürecinde Veri Madenciliği Yaklaşımı Süreyya ÇANKIRI, Elif KARTAL Kemal YILDIRIM ve Sevinç GÜLSEÇEN ................... 148 Kullanıcı Hakları ve Sorumlulukları Erol YILMAZ .......................................................................................................... 168 Bilgi Profesyonelleri İçin Avrupa Fırsatı: ERASMUS Ülkü Sevil YILMAZ ve Elif İŞEL ............................................................................... 188 Ulusal Bellek ve Elektronik Derleme Selçuk SÜZMETAŞ ve Kadriye SÜZMETAŞ .............................................................. 192 Federe Arama Motorları: Federe Arama Motorlarının Söyledikleri ve Gerçekleri Yusuf YALÇIN ve Halil İbrahim GENÇBÜYÜR ......................................................... 203 Suna Kıraç Kütüphanesi Danışma Hizmetlerinde Bir WEB 2.0 Uygulaması LIBGUIDES Mithat ZENCİR ve Ayla GÜNEL .............................................................................. 210 Kişisel Bilgi Güvenliğinin Sağlanmasında Steganografi Biliminin Kullanılması Yıldıray YALMAN ve İsmail ERTÜRK ...................................................................... 215 Üniversite Kütüphaneleri WEB Sayfalarının Gösterge Bilimsel Açıdan Görsel-İçerik Çözümlemeleri Yücel TEKİN .......................................................................................................... 227 Yazar Dizini ................................................................................................................. 243 Konu Dizini ................................................................................................................. 244 VI ÜNAK ‘09 Organizasyonlarda Bilgi Yönetimi Sürecinde Veri Madenciliği Yaklaşımı Süreyya ÇANKIRI*, Elif KARTAL**, Kemal YILDIRIM*** ve Sevinç GÜLSEÇEN**** Öz Bilgi, birçok alanda olduğu gibi yönetim alanında da ağırlıklı bir role sahiptir. Bilgi ve iletişim teknolojilerindeki hızlı değişim ve ilerleme sürecinde organizasyonlar, ancak ellerindeki bilgiyi doğru yönetirse hizmet ve ürünlerinde verimliliğe ulaşabilir, rakipleri arasında devamlılığını sürdürebilir. Günümüzde bilginin artış ve yayılma hızı tarihin hiçbir döneminde görülmediği kadar artmıştır. Bilgiye erişim süreci de bu hıza bağlı olarak kısalmaktadır. Sorun, bilgi yığınları arasından geçerli / yararlı / istediğimiz bilgiye erişmekte yaşanan zorluklardır. Veri madenciliği, geniş bilgi yığınları arasından istediğimiz bilgiye erişme sürecimizi kısaltan bir yaklaşımdır. Organizasyonlar bilgi yönetiminin her aşamasında bilgiyi kullanır ve bilgi üretirler. Çağdaş iş üretim ve süreçlerinde başarı için verilere en kısa sürede erişmek, erişilen verileri kayıt altına almak, işleyerek bilgiye dönüştürmek ve verimli biçimde kullanmak gerekmektedir. Veri madenciliği kullanılarak bilgi yönetimi süreçlerinde bilgiye erişim hızı artırılabilir. Bu durum, organizasyonlar için, ürün / hizmet üretiminde verimlilik ve rekabet koşulları açısından avantaj sağlayacaktır. Bu bildirinin amacı, veri madenciliğinin organizasyonlarda bilgi yönetimi sürecine olası etkilerini ve katkısını ortaya koymaktır. Giriş Klasik sistem teorisi, canlıların karmaşık sistemler bütünü olduğunu kabul etmekle birlikte, onların bir araya gelerek daha karmaşık sistemler oluşturduğunu ifade etmektedir. Canlıların yaşayabilmek için sistem dışından veri ve bilgi almaları gerektiği açıktır. Enerjinin canlı yaşamı üzerindeki önemi nasıl tartışılmaz boyutta ise, bu enerjinin kullanımı için gereksinim duyulan bilginin önemi de tartışmaya açık bir konu olarak görülmektedir. Bilgi, canlı yaşamının en önemli özelliğidir. Bir canlı için, enerjinin hangi kaynaklardan elde edileceği ve nasıl kullanılacağına ilişkin bilgi yaşamsal öneme sahiptir (İlter, 2003, s.7). Ne şekilde olursa olsun bilgi, insanlık tarihi süresince, tüm zamanlarda toplumların, organizasyonların ve insanların gelişmesinde, onların düşünce ve davranışlarının şekillenmesinde en önemli unsur olmuştur (Uçak, 2000, s.145). Bilgi yönetimi, “geleneksel anlamda düşünüldüğünde, yüzyıllardır bilinen ve uygulanan bir süreçtir. Eski çağların bilge kişileri, bilgiyi aktarmak için hikâyeleri kullanıyorlardı. Üniversiteler 12. yüzyıldan bu yana varlıklarını sürdürmektedir. Eski uygarlıkların çoğunda önemli olaylar kayıtlara geçirilmiş, kitaplar yazılmış ve kütüphaneler oluşturulmuştur. Bu herkesin uyguladığı “olağan bilgi yönetimi”dir. “Olağanüstü bilgi yönetimi” ise ancak iletişime ve birlikte çalışmaya büyük kolaylık getiren yeni teknolojilerin geliştirilmesiyle son yıllarda gündeme gelmiştir. Bu teknoloji, eğer iletişime, paylaşmaya, güvene, işbirliğine ve * İstanbul Üniversitesi Enformatik Bölümü.İstanbul ** Arş. Gör.; İstanbul Üniversitesi Enformatik Bölümü. İstanbul (elifk@istanbul.edu.tr) *** İstanbul Üniversitesi Enformatik Bölümü. İstanbul 148 **** Doç. Dr.;İstanbul Üniversitesi Enformatik Bölümü, İstanbul (gulsecen@istanbul.edu.tr) Süreyya ÇANKIRI, Elif KARTAL, Kemal YILDIRIM ve Sevinç GÜLSEÇEN Geçmişte bilgi depolarının büyük bölümü organizasyonların dışında yer alıyordu ve bilgi depolarından rekabet gücünü arttırmaya yönelik, pazara ilişkin ya da organizasyon dışı teknik, yasal ya da ticari bilgi elde etmek için yararlanılıyordu. Ancak şimdi pek çok organizasyon iç kaynaklı biçimsel bilgi depoları oluşturmaktadır. Organizasyonlarda, ürün bilgisi, pazarlama bilgisi, müşteri bilgisi ya da diğer bilgi türleri için depolar hazırlanmaktadır. Veri madenciliği, özellikle bağlantılar ve dizinlerin belirlenmesinde çok işe yaramaktadır. İnsanlar, ellerinde fazla sayıda değişken bulunması durumunda zorlanırken veri madenciliği araçları aynı anda binlerce farklı değişkenle başa çıkabilir, pek çok insanın isteyerek kabul edeceği yeni bilgileri keşfedebilir (Davenport, 1997, s.184; Skyrme, 1999, s.79; Ağır, 2005, s.132). Veri Madenciliği (Data Mining) İlk bilgisayarın hayatımıza girmesinden itibaren bilgisayarlar her geçen gün biraz daha gelişmiş ve değişmiştir. Kullanıcı gereksinimleri doğrultusunda değerli verilerin depolanması isteği ile veri tabanları ortaya çıkmıştır. Günümüzde hemen hemen bütün organizasyonlar bilgisayar teknolojisi ve internetin de etkisi ile kayıtlarını elektronik veri tabanlarına taşımışlardır. Bu veri tabanlarının boyutları ‘terabayt’larla ifade edilmektedir. Zamanla veri tabanlarında gizli, stratejik ve politik değere sahip olabilecek, işe yarar örüntüler ve şablonlar elde etmenin mümkün olacağı düşüncesi yayılmıştır. Veri Madenciliği, 60’lı yıllarda veri analizi sorunlarının bilgisayar ile çözülmeye başlanması ile ortaya çıkmış olup, ‘Veri Madenciliği’ ismi 90’lı yıllarda bilgisayar mühendisleri tarafından ortaya atılmıştır (Öğüt, 2009, ss.1-9). Veri Madenciliği’ni veri dağları altındaki elmasları, altınları, külçeleri özel yazılımlar ile keşfetmek olarak tanımlamak mümkündür (Özdamar, 2002, ss.1-3). Literatürde yer alan bazı veri madenciliği tanımları ise aşağıda verilmiştir: ¾ Veriden örüntü elde etmek için belirli algoritmaların uygulamasıdır (Fayyad, Shapiro ve Smyth, 1996, s.39). ¾ İstatistiksel modelleri, matematiksel algoritmaları ve makine öğrenmesi (machine learning) modellerini de içeren veri analizi araçlarının kullanımını içermektedir (Surajit, Surajit, Bernhardt ve Fayyad, 2000, s.719). ¾ Daha önceden bilinmeyen örüntüleri ve anlaşılabilir bilgileri geniş veri tabanlarından seçmeyi, keşfetmeyi ve bu bilgileri modellemeyi içerir (Show, Subramaniam, Tan ve Welge, 2001, s.128). ¾ Organizasyonların veri ambarlarındaki çok önemli bilgilere yoğunlaşmasına yardımcı olan, çok büyük veri tabanlarında saklı, akıllı bilgiyi ortaya çıkaran yeni bir teknolojidir (Thealing, 2009). ¾ Veri tabanı, yapay zekâ ve istatistik dünyasını birbirine bağlayan son zamanlarda çıkmış bir alandır (Lindell, Israel ve Pinkas, 2000, s.1). 149 ÜNAK ‘09 ortak sahiplenmeye değer veren bir kültürle birleştirilebilirse mucize gerçekleşmektedir. Bilgi yönetiminin özünü bu şekilde anlayan ve uygulayan organizasyonların elde ettiği sonuçlar ise şaşırtıcı derecede beklentilerin üstündedir” (Barutçugil, 2002, s.49). Organizasyonlarda Bilgi Yönetimi Sürecinde Veri Madenciliği Yaklaşımı ÜNAK ‘09 ¾ Verinin karar almak için kullanılan bilgiye dönüşümü- Bilgi Keşfi’nin (Knowledge Discovery) tetikleyicisidir (Müller ve Lemke, 2000, s.1). ¾ Veri kümeleri içinde akıllı örüntüler keşfetmek için algoritmalar kullanan bir süreçtir (DeRosa, 2004, s.5). Bu tanımlarda da görüldüğü gibi veri madenciliği çok disiplinli bir çalışma alanıdır. Veri tabanı teknolojisi, istatistik, yapay zekâ, matematik, yönetim bilişim sistemleri veri madenciliğinde birlikte çalışmaktadır. Veri madenciliğinin uygulanabilmesi için verilerin birtakım ölçütlere uyması gerekmektedir: tüm verilerin elde edilebilir olması, verilerin hatasız olması, istenilen miktarda verinin bulunması bu ölçütlerden birkaç tanesidir (Oğuzlar, 2003, ss.68-70). Veri madenciliği finans, tıp, borsa, bankacılık, sigortacılık başta olmak üzere birçok alanda kullanılmaktadır. Organizasyonlar ise müşteri hizmetleri, risk yönetimi gibi önem taşıyan alanlarda veri madenciliği tekniklerinden yararlanmaktadır. Veri madenciliğinde uygulanan teknikler aşağıda verilmiştir. Tablo 1: Veri Madenciliği Teknikleri (Artinyan, 2009) Veri Madenciliği; yöneticilere karar verme konusunda önemli ölçüde yardımcı olurken, analiz edilmesi, raporlanması gereken verilere erişim kolaylığı da büyük önem taşımaktadır. Bunu, veri ambarları olanaklı kılmıştır. Veri Ambarları (Data Warehouses) Günümüzde veri tabanları farklı farklı yerlerde bulunurken ve üstelik bunların taşıdıkları verilerin büyüklüleri ‘terabayt’lar ile ifade edilirken gerek duyulan verilerin bir araya toplanması analiz edilmesi ve raporlanması veri ambarları sayesinde gerçekleşmektedir. Veri ambarları, veri tabanları ile diğer bilgi kaynakları arasındaki verilerin entegrasyonunu da sağlamaktadır. 150 Süreyya ÇANKIRI, Elif KARTAL, Kemal YILDIRIM ve Sevinç GÜLSEÇEN ¾ Veri ambarı, yönetimin karar verme süreci desteğinde, konu tabanlı, zamanla değişen ve kalıcı veri koleksiyonudur*****. ¾ Veri ambarı, şirket ile birlikte tüm sınırlı veri içeriğine ve kitleye hitap eden veri ambarı****** kümelerinin yığınıdır*******. Bir veri ambarı sistemini modelleme, inşa etme ve yönetme işlemlerine ise veri ambarcılığı denmektedir. Veri ambarcılığının literatürdeki bazı tanımları aşağıda verilmiştir: ¾ Verileri yaygın bir formatta, birçok faklı kaynaktan, anahtarlar ve alanlar için uygun tanımlamalar ile toplamaktır (Berry ve Linoff, 2004, s.7). ¾ Verileri, bilgi olarak şekillendirmek ve uygulamadan çok, konu tabanlı olarak bu bilgileri depolamaktır (Shahzad, 2009). Bilgi Yönetimi Bilgi yönetimi; bilginin edinilmesi, üretilmesi, düzenlenmesi, geliştirilmesi, korunması, paylaşılması gibi süreç ve yöntemleri içermektedir. Bu süreç çerçevesinde bilgi ve iletişim teknolojilerinin kullanılması - bulunması kaçınılmazdır. Günümüz koşullarının en önemli değer yaratma güçlerinden biri olan bilginin, başarıyla yönetilmesi ve doğru yönlendirilebilmesi için bilgi yönetimine büyük gereksinim duyulmaktadır. Bu nedenle de organizasyonun tüm bilgisinin bir düzen - sistem içerisinde yönetimi büyük önem taşımaktadır. Bilgi yönetimi, en yalın şekilde, “bilgi yaratmak, elde tutmak, paylaşmak ve geliştirmek için kullanılacak yeni radikal yollar olarak tanımlanmaktadır. Bu nedenle, bilginin saklanmasını ve bilinçli bir şekilde gelecek kuşaklara aktarılmasını ifade eden olağan bilgi yönetimini değil, şimdi elimizde olan tüm ileri enformasyon teknolojilerini bilgi yaratmak, elde tutmak, paylaşmak ve geliştirmek için kullanan tümüyle yeni ve radikal yolları ele almak gerekir” (Barutçugil, 2002, s.49). Bilgi yönetimi, “organizasyonel amaçların daha iyi bir şekilde elde edilebilmesi için bireylere, takımlara ve bütün organizasyona bilginin kolektif ve sistematik olarak yaratılması, paylaşılması ve uygulanması için olanak sağlayan yeni bir disiplindir. Bilgi yönetimi, bireyler, takımlar ve organizasyonun bütünü için geçerlidir. Bilginin sistematik olarak yaratılması, paylaşılması ve uygulanmasıdır. Organizasyon çapında bütün düzeylerde bilginin yaratılması önemlidir. Daha sonra olabildiğince çabuk ve uygun ölçüde geniş kapsamlı bir şekilde bu bilginin paylaşılması ve organizasyonun yararına kullanılmasının sağlanması gerekir. Bu, bilginin müşterilerin istediği ürün ve hizmetlere dönüştürülmesiyle gerçekleşir” (Barutçugil, 2002, s.50). ***** http://www.1keydata.com/datawarehousing/inmon-kimball.html Erişim Tarihi: [ 13.07.2009] ****** Buradaki “veri ambarı” terimi aslında dar anlamda kullanılmaktadır. Yani Kimball, “data warehouse”ı tanımlarken, bunun içerik ve hitap edilen kitle açısından daha dar anlamlısı olan “data mart”ı kullanmıştır. ******* http://www.1keydata.com/datawarehousing/inmon-kimball.html Erişim Tarihi: [ 13.07.2009] 151 ÜNAK ‘09 Veri ambarı ile ilgili literatürde iki önemli tanım bulunmakla birlikte, veri ambarları ve veri ambarcılığı ile ilgili yapılan diğer tartışmalar bu tanımlar etrafında şekillenmektedir. Bu önemli tanımlardan ilki veri ambarcılığının babası sayılan Bill Inmon tarafından, ikincisi ise Ralph Kimball tarafından yapılmıştır: Organizasyonlarda Bilgi Yönetimi Sürecinde Veri Madenciliği Yaklaşımı ÜNAK ‘09 Dolayısıyla birer canlı sistem olan organizasyonlarda bilgi yönetimi; yalnızca belgelerde, depolarda değil çalışmalarda, süreçlerde, uygulamalarda ve normlarda da görülebilmektedir. Bundan ötürü organizasyonların sahip olduğu bilgi kaynaklarını belirlemek, değerlendirmek, analiz etmek, bilginin nerede, nasıl, hangi durumda bulunduğunu yine bilginin özelliklerini, değerini, kullanımını ve kapsamını belirlemek, bilgi yönetimi çalışmasının en geçerli işlevi olmaktadır. Bilgi Yönetimi Bağlamında Veri Madenciliğinin Uygulama Alanları Veri madenciliği astronomi, biyoloji, finans, pazarlama, sigorta, tıp ve birçok başka dalda uygulanmaktadır. Günümüzde veri madenciliği teknikleri özellikle organizasyonlarda çeşitli alanlarda başarı ile kullanılmaktadır. Bu uygulamaların başlıcaları ilgili alanlara göre aşağıda özetlenmiştir. Pazarlama Müşteri segmentasyonunda, Müşterilerin demografik özellikleri arasındaki bağlantıların kurulmasında, Çeşitli pazarlama kampanyalarında, Mevcut müşterilerin elde tutulması için geliştirilecek pazarlama stratejilerinin oluşturulmasında, ¾ Pazar sepeti analizinde, ¾ Müşteri ilişkileri yönetiminde, ¾ Satış tahminlerinde, ¾ ¾ ¾ ¾ Bankacılık ¾ ¾ ¾ ¾ ¾ ¾ Farklı finansal göstergeler arasındaki gizli korelâsyonların bulunmasında, Kredi kartı dolandırıcılıklarının tespitinde, Kredi taleplerinin değerlendirilmesinde, Usulsüzlük tespiti, Risk analizleri, Risk yönetimi, Sigortacılık ¾ Yeni poliçe talep edecek müşterilerin tahmin edilmesinde, ¾ Sigorta dolandırıcılıklarının tespitinde, ¾ Riskli müşteri tipinin belirlenmesinde. Perakendecilik ¾ Satış noktası veri analizleri, ¾ Alış-veriş sepeti analizleri, ¾ Tedarik ve mağaza yerleşim optimizasyonu, 152 Süreyya ÇANKIRI, Elif KARTAL, Kemal YILDIRIM ve Sevinç GÜLSEÇEN ÜNAK ‘09 Borsa ¾ Hisse senedi fiyat tahmini, ¾ Genel piyasa analizleri, ¾ Alım-satım stratejilerinin optimizasyonu. Telekomünikasyon ¾ Kalite ve iyileştirme analizlerinde, ¾ Hisse tespitlerinde, ¾ Hatların yoğunluk tahminlerinde, Sağlık ve İlaç ¾ ¾ ¾ ¾ Test sonuçlarının tahmini, Ürün geliştirme, Tıbbi teşhis Tedavi sürecinin belirlenmesinde Endüstri ¾ Kalite kontrol analizlerinde ¾ Lojistik, ¾ Üretim süreçlerinin optimizasyonunda, Bilim ve Mühendislik ¾ Ampirik veriler üzerinde modeller kurarak bilimsel ve teknik problemlerin çözümlenmesi Veri Madenciliği Metodolojisi ve Kullanılan Teknikler Metodoloji Bir veri madenciliği çalışmasında kullanılan metodoloji Şekil 1’de verilmiştir. Standart form içinde verilen veri, öğrenme ve deneme olmak üzere ikiye ayrılır. Her uygulamada kullanılabilecek birden çok teknik vardır ve önceden hangisinin en başarılı olacağını kestirmek olası değildir. Bu yüzden öğrenme kümesi üzerinde L değişik teknik kullanılarak L tane model oluşturulur. Sonra bu L model deneme kümesi üzerinde denenerek en başarılı olanı, yani deneme kümesi üzerindeki tahmin başarısı en yüksek olanı seçilir. 153 ÜNAK ‘09 Organizasyonlarda Bilgi Yönetimi Sürecinde Veri Madenciliği Yaklaşımı Şekil 1: Veri Madenciliği Çalışmasında Kullanılan Metodoloji Eğer bu en iyi model yeterince başarılıysa kullanılır, aksi takdirde başa dönerek çalışma tekrarlanır. Tekrar sırasında başarısız olan örnekler incelenerek bunlar üzerindeki başarının nasıl arttırılabileceği araştırılır. Örneğin, standart forma yeni alanlar ekleyerek programa verilen bilgi arttırılabilir veya olan bilgi değişik bir şekilde kodlanabilir; veya amaç daha değişik bir şekilde tanımlanabilir. Kullanılan Teknikler ¾ İstatistiksel Yöntemler: Veri madenciliği çalışması esas olarak bir istatistik uygulamasıdır. Verilen bir örnek kümesine bir kestirici oturtmayı amaçlar. İstatistik literatüründe son elli yılda bu amaç için değişik teknikler önerilmiştir. Bu teknikler istatistik literatüründe çok boyutlu analiz (multivariate analysis) başlığı altında toplanır ve genelde verinin parametrik bir modelden (çoğunlukla çok boyutlu bir Gauss dağılımından) geldiğini varsayar. Bu varsayım altında sınıflandırma (classification; discriminant analysis), regresyon, öbekleme (clustering), boyut azaltma (dimensionality reduction), hipotez testi, varyans analizi, bağıntı (association; dependency) kurma için teknikler istatistikte uzun yıllardır kullanılmaktadır (Rencher, 1995). ¾ Bellek Tabanlı Yöntemler: Bellek tabanlı veya örnek tabanlı (memory-based, instance-based methods; case-based reasoning) bu yöntemler istatistikte 1950’li yıllarda önerilmiş olmasına rağmen o yıllarda gerektirdiği hesaplama ve bellek yüzünden kullanılamamış ama günümüzde bilgisayarların ucuzlaması ve kapasitelerinin artmasıyla, özellikle de çok işlemcili sistemlerin yaygınlaşmasıyla, kullanılabilir olmuştur. Bu yöntemlere en iyi örnek en yakın k komşu algoritmasıdır (k-nearest neighbor) (Mitchell, 1997). ¾ Yapay Sinir Ağları: 1980’lerden sonra yaygınlaşan yapay sinir ağlarında (artificial neural networks) amaç fonksiyon birbirine bağlı basit işlemci ünitelerinden 154 Süreyya ÇANKIRI, Elif KARTAL, Kemal YILDIRIM ve Sevinç GÜLSEÇEN ¾ Karar Ağaçları: İstatistiksel yöntemlerde veya yapay sinir ağlarında veriden bir fonksiyon öğrenildikten sonra bu fonksiyonun insanlar tarafından anlaşılabilecek bir kural olarak yorumlanması zordur. Karar ağaçları ise veriden oluşturulduktan sonra kökten yaprağa doğru inilerek kurallar (IF-THEN rules) yazılabilir (Mitchell, 1997). Bu şekilde kural çıkarma (rule extraction), veri madenciliği çalışmasının sonucunun geçerlenmesini sağlar. Bu kurallar uygulama konusunda uzman bir kişiye gösterilerek sonucun anlamlı olup olmadığı denetlenebilir. Sonradan başka bir teknik kullanılacak bile olsa karar ağacı ile önce bir kısa çalışma yapmak, önemli değişkenler ve yaklaşık kurallar konusunda bize bilgi verir ve önerilir. Veri Madenciliği Modelleri Veri madenciliğinde kullanılan modeller, tahmin edici (Predictive) ve tanımlayıcı (Descriptive) olmak üzere iki ana başlık altında incelenmektedir (Zhong ve Zhou, 1999, ss.1-3). Tahmin edici modellerde, sonuçları bilinen verilerden hareket edilerek bir model geliştirilmesi ve kurulan bu modelden yararlanılarak sonuçları bilinmeyen veri kümeleri için sonuç değerlerin tahmin edilmesi amaçlanmaktadır. Örneğin, bir banka önceki dönemlerde vermiş olduğu kredilere ilişkin gerekli tüm verilere sahip olabilir. Bu verilerde bağımsız değişkenler kredi alan müşterinin özellikleri, bağımlı değişken değeri ise kredinin geri ödenip ödenmediğidir. Bu verilere uygun olarak kurulan model, daha sonraki kredi taleplerinde müşteri özelliklerine göre verilecek olan kredinin geri ödenip ödenmeyeceğinin tahmininde kullanılmaktadır. Tanımlayıcı modellerde ise karar vermeye rehberlik etmede kullanılabilecek mevcut verilerdeki örüntülerin tanımlanması sağlanmaktadır. 25 yaş altı bekâr kişiler ile 25 yaş üstü evli kişiler üzerinde yapılan ve ödeme performanslarını gösteren bir analiz, tanımlayıcı modellere örnek olarak verilebilir. Veri madenciliği modellerini gördükleri işlevlere göre üç ana başlık altında incelemek mümkündür (Akpınar, 2000, ss.1-22); ¾ Sınıflama (Classification) ve Regresyon (Regression) Modelleri ¾ Kümeleme (Clustering) Modelleri ¾ Birliktelik Kuralları (Association Rules) ve Ardışık Zamanlı Örüntüler (Sequential Patterns). Sınıflama ve regresyon modelleri tahmin edici, kümeleme, birliktelik kuralları ve ardışık zamanlı örüntü modelleri tanımlayıcı modellerdir. Sınıflama ve Regresyon Sınıflama ve regresyon, önemli veri sınıflarını ortaya koyan veya gelecek veri eğilimlerini tahmin eden modelleri kurabilen iki veri analiz yöntemidir. Sınıflama kategorik değerleri tahmin ederken, regresyon süreklilik gösteren değerlerin tahmin edilmesinde kullanılır. 155 ÜNAK ‘09 oluşan bir ağ üzerine dağıtılmıştır (Bishop, 1996). Yapay sinir ağlarında kullanılan öğrenme algoritmaları veriden üniteler arasındaki bağlantı ağırlıklarını hesaplar. YSA istatistiksel yöntemler gibi veri hakkında parametrik bir model varsaymaz yani uygulama alanı daha geniştir ve bellek tabanlı yöntemler kadar yüksek işlem ve bellek gerektirmez. Organizasyonlarda Bilgi Yönetimi Sürecinde Veri Madenciliği Yaklaşımı ÜNAK ‘09 Örneğin, bir sınıflama modeli banka kredi uygulamalarının güvenli veya riskli olmalarını kategorize etmek amacıyla kurulurken, regresyon modeli geliri ve mesleği verilen potansiyel müşterilerin bilgisayar ürünleri alırken yapacakları harcamaları tahmin etmek için kurulabilir (Han ve Kamber, 2000, ss.31-35). Sınıflama ve regresyon modellerinde kullanılan başlıca teknikler şunlardır (Akpınar, 2000, ss.1-22): 1. 2. 3. 4. 5. 6. Karar Ağaçları (Decision Trees) Yapay Sinir Ağları (Artificial Neural Networks) Genetik Algoritmalar (Genetic Algorithms) K-En Yakın Komşu (K-Nearest Neighbor) Bellek Temelli Nedenleme (Memory Based Reasoning) Naive-Bayes Karar ağaçları, veri madenciliğinde kuruluşlarının ucuz olması, yorumlanmalarının kolay olması, veri tabanı sistemleri ile kolayca entegre edilebilmeleri ve güvenilirliklerinin iyi olması nedenleri ile sınıflama modelleri içerisinde en yaygın kullanıma sahip tekniktir. Karar ağacı, adından da anlaşılacağı gibi bir ağaç görünümünde, tahmin edici bir tekniktir (Berry ve Linoff, 1999). Ağaç yapısı ile kolay anlaşılabilen kurallar yaratabilen, bilgi teknolojileri işlemleri ile kolay entegre olabilen en popüler sınıflama tekniğidir. Karar ağacı karar düğümleri, dallar ve yapraklardan oluşur (Han ve Kamber, 2000). Karar düğümü, gerçekleştirilecek testi belirtir. Bu testin sonucu ağacın veri kaybetmeden dallara ayrılmasına neden olur. Her düğümde test ve dallara ayrılma işlemleri ardışık olarak gerçekleşir ve bu ayrılma işlemi üst seviyedeki ayrımlara bağımlıdır. Ağacın her bir dalı sınıflama işlemini tamamlamaya adaydır. Eğer bir dalın ucunda sınıflama işlemi gerçekleşemiyorsa, o dalın sonucunda bir karar düğümü oluşur. Ancak dalın sonunda belirli bir sınıf oluşuyorsa, o dalın sonunda yaprak vardır. Bu yaprak, veri üzerinde belirlenmek istenen sınıflardan biridir. Karar ağacı işlemi kök düğümünden başlar ve yukarıdan aşağıya doğru yaprağa ulaşana dek ardışık düğümleri takip ederek gerçekleşir. Şekil 2: Bir Kredi Kartı Kampanyasında Yeni Bir Örneğin Sınıflandırılması 156 Süreyya ÇANKIRI, Elif KARTAL, Kemal YILDIRIM ve Sevinç GÜLSEÇEN ÜNAK ‘09 Bir kredi kartı kampanyasına hangi özellikteki müşterilerin yanıt verip vermeyeceğini karar ağacı modeli kullanarak bulmaya çalışan yukarıdaki örneği inceleyelim. Şekil 2’ de görüldüğü üzere yüksek geliri olan ‘Bayan X’ kampanyaya yanıt vermemiştir. Bu durumda aşağıdaki (1.1) gibi bir sınıflama kuralı çıkartılabilir: IF Gelir=Yüksek AND Cinsiyet=Bayan THEN Kampanya=Yanıtlamaz (1.1) Kümeleme Kümeleme, veriyi sınıflara veya kümelere ayırma işlemidir (Karypis, Han ve Kumar, 1999, ss. 68-75). Aynı kümedeki elemanlar birbirleriyle benzerlik gösterirlerken, başka kümelerin elemanlarından farklıdırlar. Kümeleme veri madenciliği, istatistik, biyoloji ve makine öğrenimi gibi pek çok alanda kullanılır. Kümeleme modelinde, sınıflama modelinde olan veri sınıfları yoktur (Ramkumar ve Swami, 1998, ss.9-14). Verilerin herhangi bir sınıfı bulunmamaktadır. Sınıflama modelinde, verilerin sınıfları bilinmekte ve yeni bir veri geldiğinde bu verinin hangi sınıftan olabileceği tahmin edilmektedir. Oysa kümeleme modelinde, sınıfları bulunmayan veriler gruplar halinde kümelere ayrılırlar. Bazı uygulamalarda kümeleme modeli, sınıflama modelinin bir önişlemi gibi görev alabilmektedir (Ramkumar ve Swami, 1998, ss.9-14). Marketlerde farklı müşteri gruplarının keşfedilmesi ve bu grupların alışveriş örüntülerinin ortaya konması, biyolojide bitki ve hayvan sınıflandırmaları ve işlevlerine göre benzer genlerin sınıflandırılması, şehir planlanmasında evlerin tiplerine, değerlerine ve coğrafik konumlarına göre gruplara ayrılması gibi uygulamalar tipik kümeleme uygulamalarıdır. Kümeleme aynı zamanda web üzerinde bilgi keşfi için dokümanların sınıflanması amacıyla da kullanılabilir (Seidman, 2001). Veri kümeleme güçlü bir gelişme göstermektedir. Veri tabanlarında toplanan veri miktarının artmasıyla orantılı olarak, kümeleme analizi son zamanlarda veri madenciliği araştırmalarında aktif bir konu haline gelmiştir. Literatürde pek çok kümeleme algoritması bulunmaktadır. Kullanılacak olan kümeleme algoritmasının seçimi, veri tipine ve amaca bağlıdır. Genel olarak başlıca kümeleme yöntemleri şu şekilde sınıflandırılabilir (Han ve Kamber, 2000, ss.31-35): 1- Bölme yöntemleri (Partitioning methods) 2- Hiyerarşik yöntemler (Hierarchical methods) 3- Yoğunluk tabanlı yöntemler (Density-based methods) 4- Izgara tabanlı yöntemler (Grid-based methods) 5- Model tabanlı yöntemler (Model-based methods) Bölme yöntemlerinde, n veri tabanındaki nesne sayısı ve k oluşturulacak küme sayısı olarak kabul edilir. Bölme algoritması n adet nesneyi, k adet kümeye böler (k ≤ n). Kümeler tarafsız bölme kriteri olarak nitelendirilen bir kritere uygun oluşturulduğu için aynı kümedeki nesneler birbirlerine benzerken, farklı kümedeki nesnelerden farklıdırlar (Han ve Kamber, 2000, ss. 3-35). 157 ÜNAK ‘09 Organizasyonlarda Bilgi Yönetimi Sürecinde Veri Madenciliği Yaklaşımı Şekil 3: K-Means Yöntemiyle Kümeleme Örneği En iyi bilinen ve en çok kullanılan bölme yöntemleri k-means yöntemi, k-medoids yöntemi ve bunların varyasyonlarıdır (Fayyad, 1998, ss.41-48). K-means yöntemi, ilk önce n adet nesneden rastgele k adet nesne seçer ve bu nesnelerin her biri, bir kümenin merkezini veya orta noktasını temsil eder. Geriye kalan nesnelerden her biri kendisine en yakın olan küme merkezine göre kümelere dağılırlar. Yani bir nesne hangi kümenin merkezine daha yakın ise o kümeye yerleşir. Ardından her küme için ortalama hesaplanır ve hesaplanan bu değer o kümenin yeni merkezi olur. Bu işlem tüm nesneler kümelere yerleşinceye kadar devam eder (Han ve Kamber, 2000, ss.31-35). Birliktelik Kuralları ve Ardışık Zamanlı Örüntüler Birliktelik kuralları, büyük veri kümeleri arasında birliktelik ilişkileri bulurlar (Han ve Fu, 1999). Toplanan ve depolanan verinin her geçen gün gittikçe büyümesi yüzünden, organizasyonlar veri tabanlarındaki birliktelik kurallarını ortaya çıkarmak istemektedirler. Büyük miktardaki mesleki işlem kayıtlarından ilginç birliktelik ilişkilerini keşfetmek, organizasyonların karar alma işlemlerini daha verimli hale getirmektedir. Birliktelik kurallarının kullanıldığı en tipik örnek market sepeti uygulamasıdır (Market Basket Analysis). Bu işlem, müşterilerin yaptıkları alışverişlerdeki ürünler arasındaki birliktelikleri bularak müşterilerin satın alma alışkanlıklarını analiz eder. Bu tip birlikteliklerin keşfedilmesi, müşterilerin hangi ürünleri bir arada aldıkları bilgisini ortaya çıkarır ve market yöneticileri de bu bilgi ışığında daha etkili satış stratejileri geliştirebilirler. Örneğin bir marketin müşterilerinin süt ile birlikte ekmek satın alma oranı yüksekse, market yöneticileri süt ile ekmek raflarını yan yana koyarak ekmek satışlarını arttırabilirler. 158 Süreyya ÇANKIRI, Elif KARTAL, Kemal YILDIRIM ve Sevinç GÜLSEÇEN A => B [destek = %2, güven = %60] (2.1) Buradaki destek ve güven ifadeleri, kuralın ilginçlik ölçüleridir. Sırasıyla, keşfedilen kuralın kullanışlığını ve doğruluğunu gösterirler. (2.1)’deki Birliktelik Kuralı için %2 oranındaki bir destek değeri, analiz edilen tüm alışverişlerden %2’sinde A ile B ürünlerinin birlikte satıldığını belirtir. %60 oranındaki güven değeri ise A ürününü satın alan müşterilerinin %60’ının aynı alışverişte B ürününü de satın aldığını ortaya koyar (Zaki, 1999, ss.14-25). Kullanıcı tarafından minimum destek eşik değeri ve minimum güven eşik değeri belirlenir ve bu değerleri aşan birliktelik kuralları dikkate alınır. Birliktelik Kuralları ile Ardışık Zamanlı Örüntü modelleri arasındaki fark aşağıda birkaç örnek ile belirtilmiştir (Akpınar, 2000, ss. 1-22). Birliktelik kuralları aşağıda sunulan örneklerde görüldüğü gibi eş zamanlı olarak gerçekleşen ilişkilerin tanımlanmasında kullanılır. ¾ Müşteriler bira satın aldığında, % 75 olasılıkla patates cipsi de alırlar, ¾ Düşük yağlı peynir ve yağsız yoğurt alan müşteriler, %85 olasılıkla diyet süt de satın alırlar. Ardışık zamanlı örüntüler ise aşağıda sunulan örneklerde görüldüğü gibi birbirleri ile ilişkisi olan ancak birbirini izleyen dönemlerde gerçekleşen ilişkilerin tanımlanmasında kullanılır. ¾ X ameliyatı yapıldığında, 15 gün içinde % 45 olasılıkla Y enfeksiyonu oluşacaktır, ¾ İMKB endeksi düşerken A hisse senedinin değeri % 15’den daha fazla artacak olursa, üç iş günü içerisinde B hisse senedinin değeri % 60 olasılıkla artacaktır, ¾ Çekiç satın alan bir müşteri, ilk üç ay içerisinde % 15, bu dönemi izleyen üç ay içerisinde % 10 olasılıkla çivi satın alacaktır. Organizasyonel Bilgi Yönetiminin Önemi ve Bütünleşme Değeri Bilgi yönetimi, rekabetin şiddetlendiği, sürekli değişimin yaşandığı ve belirsizliğin arttığı bir ortamda organizasyonların ayakta kalmak, içinde bulundukları ortama uyum sağlamak ve verimlilik güçlerini artırmak için, potansiyellerinin eşgüdümünü amaçlayan süreçler bütünüdür. Bilgi yönetimi, “organizasyon ortamında sürekli olarak çoğalan bilgi kuvvetini güncelleyen, oluşan bilgileri erişilebilir kılan, gerekli bilgiye erişmek içinse çeşitli uğraşlar sonucunda gereksinim duyulan bilginin organizasyon çalışanlarıyla paylaşılmasını sağlayan bir disiplin alanıdır” (Harrison ve Kessels, 2004, s.39). Bilgi yönetimi kavramının sınırları iş değeri yaratma ve bir verimlilik değeri doğuracak organizasyon bilgisinin yönetilmesine kadar genişletilebilir. Bilgi yönetimi; iletişime ve verime, iş hedeflerinin gerçekleştirilmesine hizmet edecek her tür bilginin uygulamaya konmasına olanak sağlar. Bir başka ifadeyle bilgi yönetimi çekirdek iş yeteneğinden değer yaratma ve daha çok değeri elinde tutma erkidir (Tiwana, 2003, s.18). Bilgi yönetimi, organizasyonel sistemin paylaşım / dağılım alanları içerisinde bilgi akımı ve dolaşımını 159 ÜNAK ‘09 Bir A ürününü satın alan müşteriler aynı zamanda B ürününü da satın alıyorlarsa, bu durum (2.1)’ deki Birliktelik Kuralı ile gösterilir (Zaki, 1999, ss.14-25): Organizasyonlarda Bilgi Yönetimi Sürecinde Veri Madenciliği Yaklaşımı ÜNAK ‘09 olanaklı kılan paylaşımlar sonucu ortaya çıkan bir modeldir. Bilgi yönetimindeki amaç ise, organizasyonel aktiviteler için süreç içerisinde gerekli olanı (bilgiyi) elde etmek ve bu bilginin paylaşılarak kullanımına olanak sağlamaktır. Organizasyonlar için bilgi yönetiminin gücü mükemmelleşme açısından en önemli avantajlardan biridir. Bilgi yönetimi; organizasyonlar açısından olmazsa olmaz derecesinde bir öneme sahiptir. Özellikle organizasyonlar, ürün merkezli olmaktan çıkıp bilgi merkezli olmaya başlayınca kritik bir varlığa dönüşen bilginin çeşitli açılardan desteklenmesi kaçınılmaz olmuştur. İşte bilgi yönetimi de bilgiye bu desteği sağlayabilmektedir. Bilgi yönetiminin gittikçe neden bu kadar önemli olduğunu Tiwana (2003, ss.18-22) Drucker’dan da yararlanarak aşağıdaki dokuz madde altında toplamaktadır: ¾ Organizasyonlar gün geçtikçe sermaye yoğun değil, bilgi yoğun hale gelmektedir. Bilgi, ekonomik kaynakların özü olarak; hızla maddi sermaye, doğal kaynaklar ve emek gücünün yerini almaktadır. Bilgi, organizasyonun köklü değişimlerle başa çıkabilmesine ve cevaplarını keşfetmeden önce, doğru soruları sormasına olanak tanıyan tek girdidir. Bilgi yönetimi, bu bilgiye ulaşmanın ve zamanında kullanmanın tek yoludur. ¾ Kararsız piyasalar ‘organizasyonlu teslimiyet’ gerektirmektedir. Koşullar, organizasyonu yanlış zaman ve yanlış yerde, yanlış ürünle/ hizmetle bir felakete sürükleyebilmektedir. Bu yöntemle, ürün ve hizmetleri yeniden oluşturmaya, çalışmanın verimini düşürecek projelerden ve istenmeyen hatalardan yararlanarak büyüme potansiyelini en üst seviyeye çıkaracak başka projelere yönelmeye olanak tanınmaktadır. ¾ Bilgi yönetimi, değişim sizi yönetmeden, sizin değişimi yönetmenizi sağlamaktadır. Artık hizmet odaklı iş dalları dışındaki organizasyonlar da bilgi yönetimine gereksinim duymaktadır. ¾ Kalıcı olan yalnızca bilgidir. Bilgiye dayalı ekonomide ‘en dayanıklı organizasyon hayatta kalır’ düşüncesinin artık geçerliliği kalmamıştır. Organizasyon açısından hayatta kalmanın en önemli koşulu; eski ve yeni bilginin organizasyon bütünlüğünün içerisinde tutulmasıdır. Bilginin, apaçık var olması yerine, ancak bir farklılık yaratacak şekilde kullanılmasının önemli olduğu vurgulanmaktadır. Bilgi yönetimi ile bu durum, bir gerçeklik haline gelir. ¾ Günümüz iş dünyası ve çalışma sistemleri açısından en önde gelen karmaşıklık, kararsızlık ve belirsizlik vb. konular, işin niteliği ya da türü ne olursa olsun, bilgi yönetimi uygulamasıyla bir avantaja dönüşebilmektedir. ¾ Hiçbir şey bilgi kadar karar oluşturucu değildir. Özellikle geçmiş projeler, girişimler, deneyimler, başarılar ya da başarısızlıklar erişilebilir bilginin yardımıyla karar oluşturmada katkı sağlamaktadır. İşbirliği ve bilgi paylaşımını aktif olarak destekleyen bilgi yönetimi, çözümlerin ve daha iyi kararlar almanın organizasyon açısından ekonomik değerler yaratacak biçimde yürütülmesini sağlamaktadır. ¾ Bilgi; üretimi, paylaşımı ve kullanımı gerektirmektedir. Bu nedenle, bilişim teknolojisinin bu alandaki katkısı yükseltilmeye çalışılmalıdır. 160 Süreyya ÇANKIRI, Elif KARTAL, Kemal YILDIRIM ve Sevinç GÜLSEÇEN ¾ Her geçen gün küreselleşmenin biraz daha yaygınlaşmasıyla başa baş yarışmak ve tehditler ya da fırsatları izleyerek sonuç almak zor ve zaman kaybı olduğundan bilgi yönetimi teknolojisi, doğru kaynaklarla beslenirse, gereksinim duyulan bilgi zamanında sağlanabilir. Özetle, bilgi yönetimi bir paradoks yönetimi olmaktan çıkarılıp, bütün taşların yerli yerine oturduğu bir organizasyonel bütünleşmeye dönüştürülmelidir. Organizasyonlar, ‘şimdi’nin en sağlıklı biçimde yaşanır kılınması için bilgileri en üst düzeyde kullanırken, ‘yarın’ için var olmanın ve büyümenin garantisi olacak bilgileri oluşturma, koruma, yönetme ve geliştirmeyi bir uyum içerisinde sağlayabilecek bir niteliğe kavuşturulmalıdır. Organizasyonların başarısı ya da başarısızlığı buna bağlıdır. Bir başka deyişle herhangi bir organizasyon, mekanik örgüt anlayışından kurtulup farklı kaynaklı bilgiyi / ‘kaynak temelli metaforları’ yakalayabilir, çalışma süreçlerine yayabilir ve doğru yönetebilirse sonsuz kazanımlar elde edebilmektedir. Organizasyonel Bilgi Yönetiminin Yapı Taşları Bir organizasyonun bilgi yönetimi uygulamasını başlatmak ve sürdürmek için gerçekleştireceği bir dizi aktivite bulunmaktadır. Bunlardan bazıları eş zamanlı, bazıları birbirini izleyecek şekilde yerine getirilir. Dönemsel olarak tekrarlananlar olduğu gibi bir kez yapılan aktiviteler de vardır. Durumun gereklerine göre bir aktivitenin farklı uygulamaları ya da tümüyle yeni aktiveler yaratılabilir. Yaklaşımlar esnek olmalı ve organizasyonun önceliklerine, sınırlamalarına, kapasitesine göre değişebilmelidir. Yani, içinde bulunulan duruma ve zamana göre gerekli ve uygun olan yapılmalıdır. İnsanlar, iş ortamı, yönetim anlayışı, organizasyonun ihtiyaçları, müşterileri, tedarikçileri ve diğer paydaşları değiştikçe bilgi yönetimi uygulaması da değişebilmektedir. Sonuç olarak uygulama çözümlerinin niteliği, yönü ve hızı sektörün ve organizasyonun özel durumuna uyarlanacaktır (Barutçugil, 2002, s.134). Bilgi yönetiminin uygulamasındaki adımları üst üste ya da yan yana sırayla konulacak yapı taşlarına benzetebiliriz. Bunlar aşağıda kısaca açıklanmaktadır. Bu yapı taşlarının birlikte uyumlu ve kapsamlı bir bilgi yönetimi uygulamasını oluşturduğu söylenebilir. Ancak bunların organizasyonun karşılaştığı belirli bir durum için uygun yaklaşımı oluşturacak seçilmiş yapı taşları olduğu unutulmamalıdır: ¾ Yönetimin benimsenmesini, inanmasını, kararlı bir şekilde adanmasını sağlamak. Bilgi yönetimi çabalarının başarısı için bu çok önemlidir. Her çalışanın –ve organizasyonun- eyleme geçebilmesi için bilginin birincil ve en önemli itici güç olduğunun anlaşılması. ¾ Bilgi genel tablosunu incelemek ve ortaya koymak. Organizasyonun bilgi varlıklarının, uygulamalarının ve genel durumunun, organizasyonun stratejisi, operasyonları ve pazar koşulları altında güçlü ve zayıf yönlerini, fırsat ve tehlikelerini ortaya koymak (SWOT analizi). ¾ Bilgi stratejisini planlamak. Bilgi yönetiminin organizasyonun veya iş biriminin stratejisini nasıl destekleyeceğini belirlemek ve öncelikleri ortaya koyan bir ön taslak doküman hazırlamak. 161 ÜNAK ‘09 ¾ Söze dökülmeyen (örtük) bilgi gezicidir. Bilgi yönetimi, organizasyonun kritik yetenek ve kapasitelerinin/ örtük bilgilerinin yitirilmesini de önlemektedir. Organizasyonlarda Bilgi Yönetimi Sürecinde Veri Madenciliği Yaklaşımı ÜNAK ‘09 ¾ Bilgi ile bağlantılı alternatifleri ve potansiyel girişimleri tanımlamak. Gelirin iyileşmesini, yeni ürün ve hizmetlerin yaratılmasını, bilgi darboğazlarının giderilmesini sağlayacak gelişme fırsatlarını tanımlamak. ¾ Temel bilgi yönetimi girişimlerinden fayda beklentilerini göz önüne sererek öncelikleri belirlemeyi, uygulamayı, yönetmeyi ve çabaların etkinliğini izlemeyi bu beklentilere göre yapmak. ¾ Organizasyonun ve bilgi yönetiminin stratejisine, net fayda beklentilerine, ihtiyaçlara ve kapasitenin varlığına göre öncelikleri belirlemek. ¾ Temel bilgi ihtiyaçlarını belirlemek. Temel, karmaşık ve kritik bilgi fonksiyonlarında kaliteli iş yapabilmek için gerekli bilgiyi daha ayrıntılı bir biçimde tanımlamak. ¾ Temel bilgiyi elde etmek. Alınan dersler sistemi, işten ayrılanlardan bilgiyi geri alma ve kritik bilgi fonksiyonları için gereken uzman bilgisini geliştirme gibi yöntemler kullanmak. ¾ Bütünleşmiş bilgi transfer programları yaratarak bilgiyi kullanmak. ¾ Bilgi varlıklarının dönüştürülmesini, dağıtılmasını ve uygulanmasını sağlamak. ¾ Bilgi yönetimi alt yapısını kurmak ve güncelleştirmek. Farklı amaçlara uygun olabilecek kapasiteler kurmak ve bunları sürdürmek. ¾ Bilgi varlıklarını yukarıdan aşağı perspektifle yönetmek. ¾ Özendirici programlar oluşturmak. Çalışanları, akıllı davranmaları için motive etmek yani yaratıcı, yenilikçi, işbirlikçi, bilgi paylaşan, bilgi elde etmek için çaba harcayan, zor durumlarda yardım isteyen kişiler olmaları için özendirmek. ¾ Bilgi yönetimi aktivitelerini ve fonksiyonlarını organizasyon çapında koordine etmek. ¾ Bilgi odaklı yönetimi kolaylaştırmak. ¾ Bilgi yönetimi uygulamalarını izlemek. Programların ve aktivitelerin performansları ve gelişmeleri hakkında geribildirim sağlamaktır (Barutçugil, 2002, ss.134-137). Organizasyonlar Açısından Bilgi Yönetiminin İlkeleri Her bir organizasyonda bilginin niteliği; ürünler, hizmetler, politikalar, süreçler, teknolojiler, roller ve ilişkiler çerçevesinde değişmektedir. Herhangi bir organizasyon ise, bilgi yönetimi ile ilgili olarak temel ilkeleri kararlaştırdıktan sonra ayrıntılı yaklaşımları ve planları bu ilkelere dayalı olarak yaratabilir. Dolayısıyla bilgi yönetiminin organizasyonlar açısından yararlı olabilmesi için aşağıdaki ilkelerin dikkate alınması gerekmektedir. Bilgi yönetimi ilkeleri ise şunlardır (Davenport ve Prusak, 2001, s.50; Grey, 1999, ss.1-2; Barutçugil, 2002, ss.84-89; Özgener, 2002, s.486): ¾ Bilgi insanların zekâlarında ortaya çıkar ve orada yaşar. ¾ Bilgi yalnızca kullanıldığı zaman değerlidir. ¾ Bilgi değişimi elde tutmaktadır. 162 Süreyya ÇANKIRI, Elif KARTAL, Kemal YILDIRIM ve Sevinç GÜLSEÇEN Bilgi dil yoluyla seyahat eder. Bilgi dinamik bir sosyal süreçtir. Bilgi paylaşımı güven gerektirir. Bilgi paylaşımı desteklenmeli ve ödüllendirilmelidir. Bilgi karmaşıktır. Yönetimin desteği ve kaynak sağlanması şarttır. Teknoloji yeni bilgi davranışlarının gelişimini kolaylaştırır. Bilgi girişimleri bir pilot program ile başlatılmalıdır. Girişimi değerlendirmek için niteliksel ve niceliksel ölçümler yapılması gerekir. Bilgi yaratıcıdır ve beklenmedik yönlerde gelişmesi desteklenmelidir. Bilgi kendi kendisini organize edebilmektedir. Bilgi yönetimi pahalıdır. Etkili bilgi yönetimi insan ve teknolojinin ortak çözümlerini gerektirir. Bilgi yönetimi ileri derecede politiktir. Bilgi yönetimi bilgi yöneticileri gerektirir. Bilgiyi paylaşmak ve kullanmak genellikle doğal olmayan eylemlerdir. Bilgiye ulaşma yalnızca bir başlangıçtır. Bilgi yönetimi süreklidir, asla bitmez. ÜNAK ‘09 ¾ ¾ ¾ ¾ ¾ ¾ ¾ ¾ ¾ ¾ ¾ ¾ ¾ ¾ ¾ ¾ ¾ ¾ Organizasyonlarda Bilgi Yönetimi Sürecinde Veri Madenciliği Yapılan tahminlere göre dünyadaki bilgi miktarı her 20 ayda bir ikiye katlanmaktadır. (Awad ve Ghaziri, 2004, s. 325). Veri madenciliği, işte bu devasa miktardaki bilgi yığınları arasında işe yarayacak bilgileri keşfetmeyi hedef edinmiştir. Önceki bölümlerde de anlatıldığı gibi bunu çeşitli yöntem ve teknikler kullanarak yapmaktadır. Veri madenciliği ve bilgi yönetimi birbirinden bağımsız olarak geliştirilmiş olmasına rağmen, belirli bazı hedeflerinin aynı noktalarda kesişmesinden dolayı; bilgi yönetimi, veri madenciliğini kullanmaktadır. Bu durumu, Şekil 4’de yer alan bilgi yönetimi sisteminin yedi katmanlı yapısında görebiliriz 163 ÜNAK ‘09 Organizasyonlarda Bilgi Yönetimi Sürecinde Veri Madenciliği Yaklaşımı Şekil 4: Bilgi Yönetim Sistemi’nin 7 Katmanlı Yapısı (Awad ve Ghaziri, 2004, s.102) Bilgi yönetimi sürecini başarıya götüren özelliklerden birisi, devasa bilgi yığınları arasından, karar verme eylemine ve iş süreç yönetimine ‘zekâ’ katabilecek işlevsel veriyi / bilgiyi bulup kullanabilmektir. Bilgi yönetimi konusundaki çalışmalar ve gelişmeler bugünün yeni kavramlarından birisi olan İş Zekâsı (Business Intelligence) kavramının ortaya çıkmasına ve gelişmesine katkı sağlamıştır. Bilgi yönetimi ile veri madenciliğinin kesiştiği bir diğer nokta da burasıdır: Veri madenciliği, İş Zekâsı’nın bir bileşeni olarak kabul edilir (Awad ve Ghaziri, 2004, s. 328) (Şekil 5). Şekil 5: Veri Madenciliği ve İş Zekâsı 164 Süreyya ÇANKIRI, Elif KARTAL, Kemal YILDIRIM ve Sevinç GÜLSEÇEN ÜNAK ‘09 Sonuç Bilindiği gibi veri madenciliği; eldeki bağlantısız-ilişkisiz-anlamsız kısacası yapısız veriden, anlamlı ve kullanışlı bilgiyi çıkarmaya yarayacak tümevarım çalışmalarını yapmaya ve uygulamaya yönelik olan çalışmaların bütünlüğünü içermektedir. Özetle denilebilir ki, veri madenciliğinde amaç; çok büyük miktardaki ham veriden değerli bilginin çıkarılmasıdır. Bilgi yönetimi ise, var olan bilgi ile bilgi kaynaklarının tanımlanması ve birbirleriyle bağlantısını sağlayan bir süreç olarak her zaman için önem taşımaktadır. Bilgi yönetiminin temel işlevi; bilgi ve bilgi kaynaklarının tanımlanmasının, düzenlenmesinin ve erişiminin sağlanmasıdır. Organizasyonlarda bilgi yönetiminin üst seviyelere çıkartılması ve kazanım sağlayacak şekilde devam ettirilebilmesi için veri madenciliği ile arasında bağlantının kurulması gerekmektedir. Organizasyonlarda eğer böyle bir yaklaşım hayat bulabilirse organizasyonun bilgi varlığı-hazinesi büyütülebilir. Sonuç olarak organizasyonların gerekli bilgiye hızla ulaşabilmeleri, amaca uygun bir biçimde hareket yeteneği kazanabilmeleri, veri ambarlarında tutulan çok çeşitli verilere dayanarak daha önce keşfedilmemiş bilgileri ortaya çıkararak hedefleri için kullanabilmelerine bağlıdır. Bu nedenle, bilgi yönetimi sürecinde veri madenciliği yaklaşımının benimsenmesi büyük önem taşımaktadır. Kaynakça Ağır, A. (2005). Bilgi yönetimi sistemleri ve eğitimde bilgi yönetimi sistemi uygulaması. Yayımlanmamış Doktora Tezi. İstanbul: Marmara Üniversitesi Sosyal Bilimler Enstitüsü, Akpınar, H. (2000). Veri tabanlarında bilgi keşfi ve veri madenciliği. İstanbul Üniversitesi İşletme Fakültesi Dergisi, 29(1). Artinyan, E. N. (2009). Veri analizi- veri kalitesi ve bütünlüğü. 13 Temmuz 2009 tarihinde http://www. denetimnet.net/UserFiles/Documents/Makaleler/BT%20Denetim/Veri_Analizi_Veri_Kalitesi_ve_B% C3%BCt%C3%BCnl%C3%BC%C4%9F%C3%BC.pdf adresinden erişildi. Awad, E.M ve Ghaziri, H.M. (2004). Knowledge management. Upper Saddle River, NJ: Prentice Hall. Barutçugil, İ. (2002). Bilgi yönetimi. (2.bs.) İstanbul: Kariyer Yayıncılık. Berry, M.J. ve Linoff, G. (2004). Data mining techniques. Indianapolis: Wiley Pub. Berry, M.J.A. ve Linoff, G.S. (1999). Mastering data mining: The Art and Science of Customer Relationship Management. John Wiley & Sons. Bishop, C. (1996). Neural Networks for Pattern Recognition. Oxford University Press. Davenport, T. (1997). Information Ecology: Mastering the Information and Knowledge Environmnet. Oxford University Press. Davenport, T.H. ve Prusak, L. (2001). İş dünyasında bilgi yönetimi: kuruluşlar ellerindeki bilgiyi nasıl yönetirler. (G. Günay, Çev.). İstanbul: Rota Yayınları. DeRosa, M. (2004). Data mining and data analysis for counterterrorism. Center for Strategic and International Studies (CSIS). 13 Temmuz 2009 tarihinde http://csis.org/files/media/csis/ pubs/040301_data_mining_report.pdf adresinden erişildi. Fayyad, U. (1998). Mining databases: towards algorithms for knowledge discovery. Bulletin of the IEEE Computer Society Technical Committee on Data Engineering, 21(1), 41-48. 165 Organizasyonlarda Bilgi Yönetimi Sürecinde Veri Madenciliği Yaklaşımı ÜNAK ‘09 Fayyad, U.M., Shapiro, G.P. ve Smyth, P. (1996). From data mining to knowledge discovery in databases. AI Magazine 17(3), 37-54. 13 Temmuz 2009 tarihinde http://www.daedalus.es/ fileadmin/daedalus/doc/MineriaDeDatos/fayyad96.pdf adresinden erişildi. Grey, D. (1999). Knowledge management principles. Haskoli Islands: Denham Grey. Han, J. ve Fu, Y. (1999). Mining multiple-level association rules in large databases. IEEE Transactions on Knowledge and Data Engineering, 11(5). Han, J. ve Kamber, M. (2000). Data mining concepts and techniques. San Francisco: Morgan Kaufmann Publishers. Harrison, R. ve Kessels, J. (2004). Human resource development in a knowledge economy. New York: Palgrave Macmillan Pub. İlter, H.K. (2003). Bilgi üzerine notlar. Pivolka, 2 (9), 7-8. Karypis G., Han, E. ve Kumar, V. (1999). Chameleon: hierarchical clustering using dynamic modeling. IEEE Computer, 32(8), 68-75. Lindell, Y., Israel, R. ve Pinkas, B. (2000). Privacy preserving data mining. Journal of Cryptology. 13 Temmuz 2009 tarihinde http://www.aladdin.cs.cmu.edu/workshops/privacy/slides/pdf/linell_ pinkas.pdf adresinden erişildi. Zhong, N. ve Zhou, L. (ed.). (1999). Methodologies for knowledge discovery and data mining. Third Pacific-Asia Conference, Pakdd-99, Beijing, China, April 26-28, 1999 : Proceedings içinde. Almanya:Springer Verlag. Mitchell, T. (1997). Machine learning. McGraw-Hill. Müller, J.A. ve Lemke, F. (2000). Self-Organising data mining. Libri Books on Demand. http://www. knowledgeminer.com/pdf/sodm.pdf adresinden 13.07.2009 tarihinde erişildi. Oğuzlar, A. (2003). Veri önişleme. Erciyes Üniversitesi İktisadi ve İdari Bilimler Fakültesi Dergisi, 21, 67-76. Öğüt, S. (2009). Veri madenciliği kavramı ve erişim süreci. http://www.sertacogut.com/papers/Sertac_ Ogut_-_Veri_Madenciligi_Kavrami_ve_Gelisim_Sureci.pdf adresinden 13.07.2009 tarihinde erişildi. Özdamar, E.Ö. (2002). Veri madenciliğinde kullanılan teknikler ve bir uygulama. Yayımlanmamış Yüksek Lisans Tezi. İstanbul: Mimar Sinan Üniversitesi Fen Bilimleri Enstitüsü İstatistik Anabilim Dalı. Özgener, Ş. (2002). Global ölçekte değer yaratan bilgi yönetimi stratejileri. İ.G. Yumuşak ve M.A. Dönmez (Yay. Haz.). I. Ulusal Bilgi, Ekonomi ve Yönetim Kongresi: 10-11 Mayıs 2002 içinde (ss.483-496). İzmit: Kocaeli Üniversitesi İ.İ.B.F. İktisat ve İşletme Bölümleri. Ramkumar, G.D. ve Swami, A. (1998). Clustering data without distance functions. Bulletin of the IEEE Computer Society Technical Committee on Data Engineering, 21(1), 9-14. Rencher, A.C. (1995). Methods of multivariate analysis. Wiley. Seidman, C. (2001). Data mining with Microsoft SQL Server 2000. Washington: Microsoft Press. Shahzad, M.A. (2009). Datawarehousing with Oracle. http://www.oracular.com/white_paper_pdfs/ DataWarehousingwithOracle.pdf adresinden 13.07.2009 tarihinde erişildi. Show, M.J., Subramaniam, C., Tan, G.W. ve Welge, M.E. (2001). Knowledge management and data mining for marketing. Decision support systems, 31, 127-137. Skyrme, J.D. (1999). Knowledge networking: creating the collabrative enterprise. Butterworth Heinemann. 166 Süreyya ÇANKIRI, Elif KARTAL, Kemal YILDIRIM ve Sevinç GÜLSEÇEN ÜNAK ‘09 Surajit, A.N., Surajit, C., Bernhardt, J. ve Fayyad, U. (2000). Integration of data mining and relational databases, Proceeding of the 26th Conference on Very Large Databases, http://www.tcs-trddc. com/tecs/integration-of-data-mining.pdf adresinden 13.07.2009 tarihinde erişildi. Thealing, K. (2009). Data mining and analytic technologies. 13Temmuz 2009 tarihinde http://www. thearling.com/index.htm adresinden tarihinde erişildi. Tiwana, A. (2003). Bilginin yönetimi. E. Özsayar (Çev.). İstanbul: Dışbank Kitapları. Uçak, N.Ö. (2000). Bilgi üzerine kuramsal bir yaklaşım. Bilgi Dünyası, 1(1), 143-159. Zaki, M.J. (1999). Parallel and distributed association mining: a survey. IEEE Concurrency, Special Issue on Parallel Mechanisms for Data Mining, 7(5), 14-25. 167