T.C. SÜLEYMAN DEMİREL ÜNİVERSİTESİ SOSYAL BİLİMLER ENSTİTÜSÜ İŞLETME ANABİLİM DALI VERİ MADENCİLİĞİ SÜRECİ KULLANILARAK PORTFÖY PERFORMANSININ DEĞERLENDİRİLMESİ VE İMKB HİSSE SENETLERİ PİYASASINDA BİR UYGULAMA DOKTORA TEZİ ENGİN KÜÇÜKSİLLE TEZ DANIŞMANI: PROF.DR.DURMUŞ ACAR ISPARTA, 2009 ii ÖZET VERİ MADENCİLİĞİ SÜRECİ KULLANILARAK PORTFÖY PERFORMANSININ DEĞERLENDİRİLMESİ VE İMKB HİSSE SENETLERİ PİYASASINDA BİR UYGULAMA Engin KÜÇÜKSİLLE Süleyman Demirel Üniversitesi Sosyal Bilimler Enstitüsü, İşletme Anabilim Dalı, Doktora Tezi, 118 sayfa, Mart 2009 Danışman: Prof. Dr. Durmuş ACAR Bu çalışmada, portföy kavramı üzerinde durulmuş ve veri madenciliği süreci kullanılarak 1995 – 2007/06 döneminde İstanbul Menkul Kıymetler Borsası’nda (İMKB) sürekli işlem gören 122 şirketin hisse senetlerinden, Sharpe, Jensen, Treynor portföy performans ölçütleri kullanılarak farklı portföyler oluşturulmuştur. Ardından, bu ölçütlere göre ortaya çıkan portföylerin performansları, aynı dönemin ve 2007/07 – 2008/12 döneminin piyasa (İMKB Ulusal 100 endeksi) performanslarıyla karşılaştırılmıştır. Çalışmanın temelinde portföyün veri madenciliği süreci ile de oluşturulabileceği düşünülmüş ve İMKB hisse senetleri piyasasında uygulama yapılmıştır. Bu doğrultuda İMKB’de hisse senetleri işlem gören 122 adet işletmenin 1995 – 2007/06 dönemindeki aylık ortalama getirileri kullanılarak genetik algoritma yardımıyla farklı portföyler oluşturulmuştur ve şu sonuca ulaşılmıştır. Bu dönem içinde 122 şirketin hisse senetlerinden oluşturulabilecek farklı portföylerin Sharpe, Treynor ve Jensen performansları piyasanın (İMKB Ulusal 100 endeksi) üzerinde gerçekleşmiştir. Bunun temel nedeni, bu dönem içerisinde piyasanın risksiz faiz oranının altından getiri sağlamasıdır. Aynı portföyler 2007/07 – 2008/12 döneminde ise piyasanın altında performans göstermişlerdir. Anahtar Kelimeler: Portföy, Veri Madenciliği, Genetik Algoritma, Performans Ölçüleri iii ABSTRACT THE EVALUATION OF PORTFOLIO PERFORMANCE BY USING DATA MINING PROCESS AND AN APPLICATION IN ISE STOCKS MARKET Engin KÜÇÜKSİLLE Süleyman Demirel University Social Science Institute, Department of Business Administration, Ph.D., 118 pages, March 2009 Supervising Professor: Durmuş ACAR In this study, it has been mentioned the portfolio concept and formed different portfolios by using data mining process and Sharpe, Treynor and Jensen portfolio performance measures from 122 different stocks which were traded in Istanbul Stock Exchange (ISE) in the period of 1995 – 2007/06 permanently. Following, the performances of the portfolios’ formed by using data mining process has been compared with the performance of the market (ISE National 100 Indices) in the same period and the period of 2007/07 – 2008/12. In the base of this study, it has been thought that a portfolio could be formed by using data mining process and made an application in ISE Stock Market. In the application process, it has been formed different portfolios by using genetic algorithm and the average monthly return of 122 different companies’ stocks in the period of 1995 – 2007/06. The result of the application is the following: The Sharpe, Treynor and Jensen performances of the different portfolios were higher than the market did. That is why the average monthly return of the market is lower than the risk free rate in this period. However these portfolios showed lower performance than the market in the period of 2007/07 – 2008/12. Key Words: Portfolio, Data Mining, Genetic Algorithms, Performance Measures iv İÇİNDEKİLER ÖZET………………………………………………………………………………....... ii ABSTRACT…………………………………………………………………………… iii İÇİNDEKİLER……………………………………………………….. ……………….iv KISALTMALAR DİZİNİ……………………………………………..…………….. vii ŞEKİLLER DİZİNİ……………………………………………………..…………... viii ÇİZELGELER DİZİNİ………………………………………………………………. ..ix BİRİNCİ BÖLÜM 1. Giriş ................................................................................................................................ 1 1.1. Çalışmanın Konusu ................................................................................................. 1 1.2. Çalışmanın Amacı ................................................................................................... 3 1.3. Çalışmanın Önemi ................................................................................................... 3 İKİNCİ BÖLÜM 2. Genel Olarak Portföy ve Portföy Yönetimi ................................................................... 6 2.1. Portföy Kavramı ...................................................................................................... 6 2.2. Portföy Yönetimi Kavramı ve Portföy Yönetimi Yaklaşımları .............................. 8 2.2.1. Geleneksel Portföy Yönetim Yaklaşımı .......................................................... 8 2.2.2. Modern Portföy Yaklaşımı............................................................................... 9 2.3. Portföy Oluşturmada Risk ve Beklenen Getiri Unsurları ..................................... 12 2.3.1. Portföy Riski .................................................................................................. 13 2.3.2. Portföyün Beklenen Getirisi........................................................................... 17 2.4. Portföy Performansının Değerlendirilmesi ........................................................... 18 2.4.1. Sharpe Oranı .................................................................................................. 19 2.4.2. Treynor Performans Ölçüsü ........................................................................... 20 2.4.3. Jensen Performans Ölçüsü ............................................................................. 22 2.4.4. Diğer Portföy Performans Değerleme Yöntemleri ........................................ 23 ÜÇÜNCÜ BÖLÜM 3.Veri Madenciliği ........................................................................................................... 28 3.1. Veri Madenciliği Süreci ........................................................................................ 31 3.1.1.İşin Kavranması .............................................................................................. 32 3.1.2.Verinin Kavranması ........................................................................................ 33 3.1.3.Verinin Hazırlanması ...................................................................................... 33 3.1.4.Modelleme ...................................................................................................... 34 3.1.5.Değerlendirme ................................................................................................. 34 3.1.6.Yayılım............................................................................................................ 35 3.2. Veri Madenciliği Teknikleri.................................................................................. 35 3.2.1. Kümeleme ...................................................................................................... 36 3.2.2. Birliktelik Kuralı ........................................................................................... 37 3.2.3. Sınıflama ve Regresyon ................................................................................. 38 3.2.3.1. Karar Ağaçları ......................................................................................... 38 3.2.3.2. Yapay Sinir Ağları .................................................................................. 40 v 3.2.3.3. Gemetik Algoritmalar ................................................................................. 41 3.2.3.4. Tahminleme Modelleri ................................................................................ 41 3.2.3.5. Zaman Serilerindeki Örüntü........................................................................ 42 3.3. Veri Madenciliğinin Uygulama Alanları .............................................................. 42 DÖRDÜNCÜ BÖLÜM 4. Genetik Algoritmalar ................................................................................................... 46 4.1. Genetik Algoritma Kavramı .................................................................................. 46 4.2. Genetik Algoritmaların Çalışma Süreci ................................................................ 48 4.2.1. Gösterim (Kodlama) ...................................................................................... 49 4.2.2. Başlangıç Popülasyonunun Oluşturulması ..................................................... 50 4.2.3. Uyum Değeri .................................................................................................. 50 4.2.4. Seçim .............................................................................................................. 51 4.2.5. Genetik Operatörler........................................................................................ 51 4.2.5.1.Çaprazlama ............................................................................................... 51 4.2.5.2.Mutasyon .................................................................................................. 53 4.2.6. Uygunluk Değerinin Hesaplanması ............................................................... 54 4.2.7. Bitiş Koşulu Kontrolü .................................................................................... 54 4.2.8. Sonucun Elde Edilmesi .................................................................................. 54 4.3. Genetik Algoritmaların Uygulama Alanları.......................................................... 54 4.3.1 Genel Uygulama Alanları ............................................................................... 55 4.3.1.1.Optimizasyon ........................................................................................... 55 4.3.1.2.Otomatik Programlama ve Bilgi Sistemleri ............................................. 56 4.3.2 İşletmelerdeki Uygulama Alanları .................................................................. 56 4.3.2.1.Finans ....................................................................................................... 56 4.3.2.2.Pazarlama ................................................................................................. 57 4.3.2.3.Üretim ...................................................................................................... 58 BEŞİNCİ BÖLÜM 5. Uygulama ..................................................................................................................... 59 5.1. İşin Kavranması .................................................................................................... 59 5.2. Verinin Kavranması .............................................................................................. 59 5.3. Verinin Hazırlanması ............................................................................................ 59 5.4. Modelleme............................................................................................................. 64 5.5. Değerlendirme ....................................................................................................... 68 5.6. Yayılım.................................................................................................................. 83 SONUÇ ............................................................................................................................ 84 KAYNAKÇA ................................................................................................................... 88 EKLER ............................................................................................................................. 94 EK-1 Programa Ait Kodlar ......................................................................................... 94 EK-2 1995 – 2008 Bankaların Yıllık Ortalama Mevduat Faizi Oranları (Risksiz Faiz Oranları) ............................................................................................................. 112 vi EK-3 Portföylere Seçilebilecek Hisse Senetlerinin ve İMKB 100 Bileşik Endeksinin 1995 – 2007/06 Dönemindeki Aylık Ortalama Getiri Oranları ve Beta Katsayları ................................................................................................................... 113 EK-4 Portföylere Seçilen Hisse Senetlerinin ve İMKB 100 Bileşik Endeksinin 2007/07 – 2008/12 Dönemindeki Aylık Ortalama Getiri Oranları ve Beta Katsayları ................................................................................................................... 116 ÖZGEÇMİŞ ................................................................................................................. 118 vii KISALTMALAR DİZİNİ a.g.e. : Adı Geçen Eser a.g.m. : Adı Geçen Makale a.g.t. : Adı Geçen Tez BSE : Bombay Stock Exchange CART : Classification and Regression Trees CHAID : Chi-Square Automatic Interaction Detector CMIE : Centre for Monitoring Indian Economy CML : Capital Market Line COV : Covariance CRISP-DM : Çapraz Endüstri Veri Madenciliği Standart Süreci ÇDA : Çoklu Diskriminant Analizi DTH : Döviz Tevdiat Hesabı FVFM : Finansal Varlık Fiyatlama Modeli FX : Foreign Exchange GA : Genetik Algoritma İMKB : İstanbul Menkul Kıymetler Borsası KOBİ : Küçük ve Orta Büyüklükte İşletme MAPE : Mean Absolute Percentage Error MAR : Minimal Acceptable Return MSPE : Mean Square Percentage Error RMSE : Root Mean Squared Error SPDY : Sharpe Performans Değerleme Yöntemi S&P : Standard & Poor's SPD : Sermaye Piyasası Doğrusu TPDY : Treynor Performans Değerleme Yöntemi USA : United States of America VM : Veri Madenciliği Üni. : Üniversite Vol. : Volume Yay. : Yayınları YSA : Yapay Sinir Ağları viii ŞEKİLLER DİZİNİ Sayfa No Şekil 2.1. Sharpe Performans Ölçüsüne Göre Portföylerin Karşılaştırılması… 20 Şekil 2.2. Şekil 3.1. Treynor Performans Ölçüsüne Göre Portföylerin Karşılaştırılması ……………………………………………… Jensen Portföy Performans Ölçüsüne Göre Portföylerin Karşılaştırılması ………………………………………………... CRISP-DM Veri Madenciliği Süreci…………………………… Şekil 5.1. Proje İçin Tasarlanan Veri Tabanı……………………………… 64 Şekil 5.2. Uygulamada kullanılan kromozomun genel yapısı…………….. 65 Şekil 5.3. Örnek bir kromozom yapısı…………………………………….. 65 Şekil 5.4. Sharpe Performans Ölçüsü Hesaplamasının Program Görünümü 69 Şekil 5.5. Treynor Performans Ölçüsü Hesaplamasının Program Görünümü………………………………………………………. Jensen Performans Ölçüsü Hesaplamasının Program Görünümü 72 75 Şekil 2.3. Şekil 5.6. 21 23 32 ix ÇİZELGELER DİZİNİ Çizelge 3.1. Veri Madenciliğinin Kullanım Süreci………………………….. Sayfa No 30 Çizelge 4.1. Genetik Algoritmaların Çalışma Adımları……………………... 48 Çizelge 5.1. 10, 15 ve 25 Hisse Senedinden Oluşan Portföylerin SHARPE Performansları ve Aylık Ortalama Getirileri………………………………………………………… 10, 15 ve 25 Hisse Senedinden Oluşan Portföylerin TREYNOR Performansları ve Aylık Ortalama Getirileri………………………………………………………… 10, 15 ve 25 Hisse Senedinden Oluşan Portföylerin JENSEN Performansları ve Aylık Ortalama Getirileri………………………………………………………… 1995 – 2007/6 Döneminde Oluşturulan Portföyün 2007/07 – 2008/12 dönemindeki Sharpe Performansı ve Piyasa Performansıyla Kıyaslaması……………………………………. 1995 – 2007/6 Döneminde Oluşturulan Portföyün 2007/07 – 2008/12 dönemindeki Treynor Performansı ve Piyasa Performansıyla Kıyaslaması……………………………………. Çizelge 5.2. Çizelge 5.3. Çizelge 5.4. Çizelge 5.5. Çizelge 5.6. 1995 – 2007/6 Döneminde Oluşturulan Portföyün 2007/07 – 2008/12 dönemindeki Jensen Performansı ve Piyasa Performansıyla Kıyaslaması………………………………. 70 73 76 78 80 82 1 BİRİNCİ BÖLÜM 1. GİRİŞ 1.1.Çalışmanın Konusu Bireysel ve kurumsal yatırımcılar ellerindeki fonları değerlendirmek amacıyla bir takım yatırım araçlarına yönelirler. Genel olarak bu yatırım araçlarından oluĢan gruba “portföy” denilmektedir. Portföy kavramı piyasalardaki yatırım araçlarının çeĢitleri ve sayıları arttıkça daha da karmaĢık bir hal almıĢ ve üzerine birçok araĢtırma yapılan bir konu haline gelmiĢtir. Bunun sonucunda optimal portföy oluĢturulması üzerine bir çok portföy yönetimi yaklaĢımı ortaya çıkmıĢtır. Bu yaklaĢımlardan geleneksel portföy yönetim yaklaĢımında menkul kıymetler arası iliĢkiye dikkat edilmeden aĢırı çeĢitlendirmeye gidilerek portföyün riski azaltılmaya çalıĢılarak portföy oluĢturulurken, modern portföy yaklaĢımında ortalama-varyans modeliyle menkul kıymet seçimi yapılarak portföy oluĢturulmaktadır. Her iki yaklaĢımın amacı, yatırımcının yatırımından sağlayacağı faydayı maksimum yapmaktır. Bu yaklaĢımlara göre yatırımcının risk tercihlerini minimum ve getiriye iliĢkin fayda tercihlerini maksimum yapacak bir portföyü seçeceği kabul edilmektedir. Markowitz‟in çalıĢması portföy yönetimine çeĢitli katkılar sağlamıĢtır: Bu katkıların birincisi, aynı getiriyi sağlayan portföylerden riski düĢük olan portföyün, aynı risk düzeyindeki portföylerden de getirisi en yüksek portföyün tercih edilmesi gereğidir. Yatırımcı en yüksek beklenen getiri ve en düĢük risk düzeyini gösteren etkin sınır üzerinde kendi risk düzeyine göre bir portföy bileĢimi oluĢturabilmektedir. Ġkincisi, uygun bir çeĢitlendirme ile portföyün riski portföyü oluĢturan menkul kıymetlerin riskinden daha düĢük olabilmekte, hatta risk yok edilebilmektedir. Bu nedenledir ki birbirleriyle yüksek korelasyon konulmasından kaçınılmaktadır. içinde bulunan menkul kıymetlerin portföye 2 Menkul kıymet sayısındaki artıĢın, optimal portföylerin beklenen getirisi ve varyansının belirlenmesinde neden olduğu zorluklar da Sharpe‟in geliĢtirdiği Tek Ġndeks Modeli ve Perold‟ın Çoklu Endeks Modelleri ile aĢılmıĢtır. Ortalama – varyans modeli üzerindeki çalıĢmalar modelin hem matematiksel, hem de mantıksal bir uzantısı olan Finansal Varlıkları Fiyatlandırma Modelini (FVFM) ortaya çıkarmıĢtır. Sharpe, Lintner ve Mossin Markowitz‟in etkin sınırından hareketle risksiz bir finansal varlığı modele ilave etmiĢlerdir. Portföy yönetimiyle ilgili yaklaĢımlarda matematiksel model kurmanın ve bu modeller ile ilgili kısıtları tanımlamanın zor ve çok fazla zaman alması nedeni ile son zamanlarda yapay zeka yöntemleri daha fazla kullanılır hale gelmiĢtir. Bu yöntemlerden bir tanesi de veri madenciliği sürecidir. Teknolojinin hızlı geliĢimi ile birlikte hem bilgi depolama maliyetlerinin azalması hem de bilgisayarların hızlanması veri madenciliği sürecinin uygulamalardaki kullanımını artırmıĢtır ve artırmaya da devam etmektedir. Veri madenciliği sürecinin modelleme aĢamasında optimuma en yakın çözüme ulaĢmak amacıyla Genetik, Karınca Kolonisi, Tabu Search, Memetik gibi hevristik algoritmalar kullanılmaktadır. Bu çalıĢmada optimum çözüme ulaĢmak amacı ile genetik algoritma kullanılmıĢtır. Genetik algoritmalar, ilk defa Michigan Üniversitesi‟nde John Holland ve çalıĢma arkadaĢları tarafından geliĢtirilmiĢtir. Holland, araĢtırmalarını, arama ve optimumu bulma için, doğal seçme ve genetik evrimden yola çıkarak yapmıĢtır. ĠĢlem boyunca, biyolojik sistemde bireyin bulunduğu çevreye uyum sağlayıp daha uygun hale gelmesi örnek alınmıĢ, optimum bulma ve makine öğrenme problemlerinde, bilgisayar yazılımları geliĢtirilmiĢtir. Genetik algoritmaların ülkemizde daha çok mühendislik ve fen bilimleri alanında uygulandığı finans alanında kısıtlı kaldığı görülmektedir. YurtdıĢında ileri boyutta çalıĢılan genetik algoritma yönteminin ve diğer evrimsel algoritmaların varlık tahmini, kredi derecelendirme, portföy optimizasyonu, müĢteri profilinin belirlenmesi, risk değerlemesi, ekonomik modelleme, finansal zaman serileri analizi ve satıĢ tahmini gibi finansal konularda baĢarılı uygulamaları görülmüĢtür. 3 1.2. Çalışmanın Amacı ÇalıĢmanın temel amacı; veri madenciliği sürecini kullanarak, Sharpe, Treynor ve Jensen portföy performans ölçütleri kullanılarak farklı hisse senedi portföyleri oluĢturmak ve oluĢturulan portföyleri piyasa performansıyla kıyaslamaktır. 1.3. Çalışmanın Önemi Veri madenciliğinin finans alanındaki kullanımı teknolojinin de geliĢmesine bağlı olarak hızla artmaktadır. Bu alanda yapılan çalıĢmalardan bazıları Ģu Ģekilde özetlenebilir: Genetik algoritmaların (GA) iĢletme finansı alanında farklı uygulamaları bulunmaktadır. Bunlardan bir tanesi de karlılık tahminidir. Konuyla ilgili olarak Jiang vd. çalıĢmalarında doğrusal diskriminant analizi temelli genetik algoritmaların tahmin kabiliyetini değerlendirmiĢler ve sonuçları olasılıksal sinir ağları ve karar ağacı modelleriyle karĢılaĢtırmıĢlardır 1. GA‟nın hisse baĢına karı tahmin etmede sinir ağları ve karar ağaçları modellerinden daha üstün bir performans gösterdikleri ortaya çıkmıĢtır. GA‟ın finansla ilgili bir diğer uygulaması Varetto‟nun (1998) çalıĢmasıdır 2. Varetto‟nun bu çalıĢmasında, Çoklu Diskriminant Analizi (ÇDA) tahminlerinin GA‟ların tahminlerinden daha isabetli olduğu bulgusuna ulaĢılmakla birlikte, GA‟ların sonuçlara daha az veriyle, çok daha kısa sürede ulaĢtıkları tespit edilmiĢtir. Genetik algoritmaların iĢletme finansındaki diğer bir uygulama alanı da portföy seçimiyle ve hisse senetleri piyasasıyla ilgilidir. Akay vd. , kısıtlara sahip portföy seçimi probleminin çözümü için bir karar destek sistemi geliĢtirmiĢtir 3. Karar destek sisteminin geliĢtirilmesinde genetik algoritmaları kullanmıĢlardır. ÇalıĢmada teknik göstergelerden de faydalanılarak karar vericinin risk ve getiri kriterlerine uygun portföyleri kolay bir Ģekilde oluĢturulabileceği gösterilmiĢtir. OluĢturulan modelde yalnız aĢırı alım ve aĢırı 1 Yanxia JIANG, Dagang KE, Yongjun WANG, Lida Xu, Using Genetic Algorithms to Predict Financial Performance, 2007, 3225-3229. 2 Franco VARETTO, Genetic Algorithms Applications in the Analysis of Insolvency Risk, Journal of Banking and Finance, 22, 1998, s. 1421-1439. 3 Diyar AKAY, Tahsin ÇETĠNYOKUġ ve Metin DAĞDEVĠREN, Portföy Seçimi Problemi Ġçin KDS/GA YaklaĢımı, Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, 17(4), 2002, s. 125-138. 4 satım bölgelerinin tespiti ile elde edilen portföyün güvenilirliğinin arttırılması için kısa vadede hareket eden William‟s %R teknik göstergesi kullanılmıĢtır. Subramanian vd. , portföy seçiminde genetik algoritmaların kullanımını göstermek amacıyla yaptıkları çalıĢmada Hindistan‟ın 1999-2003 yılları arasındaki 4 yıllık CMIE-BSE-100 ve BSE Sensex hisse senedi verilerinden faydalanmıĢlardır 4. Modellerinde Markovitz‟in risk-getiri yaklaĢımına bağlayarak 0.1, 0.5 ve 0.9 risk seviyeleri için test etmiĢlerdir. ÇalıĢmanın sonucunda istenilen dönem için uygunluk değerinin ulaĢtığı en iyi değer alınarak yatırım portföyünü seçmiĢlerdir. Samanta ve Bordoloi, çalıĢmalarında Hindistan hisse senedi piyasası getirisinin tahmininde yapay sinir ağlarından ve yapay sinir ağlarının optimal yapısının bulunmasında genetik algoritmalardan faydalanmıĢlardır 5. BSE-Sensex, BSE-100 ve S&P CNX 50 gibi Hindistan‟da bulunan alternatif hisse senedi fiyat endekslerinden ve bunların 1999-2000 yılları arası günlük getiri verilerini kullanarak elde ettikleri zaman serilerini genetik algoritma yoluyla en iyi yapay sinir ağları yapısının bulunmasında kullanmıĢlardır. Hisse senedi fiyat tahmininde AAE, RMSE ve Rbar-kare, hisse senedi fiyatı getiri tahmininde AAE, MAPE, RMSE, MSPE ve Rbar-kare göstergelerinden faydalanılarak yapay sinir ağları ve rassal yürüyüĢ performanslarının belirlenmesine çalıĢılmıĢtır. Genetik algoritmalarla yapılandırılan yapay sinir ağlarının rassal yürüyüĢe göre daha iyi performans gösterdiği bulunmuĢtur. Koyuncugil, hisse senetleri piyasası iĢlem akıĢıyla örtüĢen bir uyarı sistemi oluĢturmuĢtur 6. Bu sistemde veri madenciliği yöntemlerinden K-ortalamalar Kümeleme Analizi, FANNY Bulanık Kümeleme Algoritması, Bulanık Hedefli CHAID Karar Ağaçları algoritması ve Önsel birliktelik kuralları algoritmalarını ardıĢık olarak kullanmıĢtır. Bu sistemle manipülasyon yapılan hisse senetlerini, manipülasyonu yapan 4 5 6 S. SUBRAMANIAN, M.Sitaram VENUGOPAL ve U.Srinivas RAO, Usefulness of Genetıc Algorithm Model for Dynamic Portfolio Selection, Journal of Financial Management and Analysis, 17(1), 2004, s. 45-53. G. P. SAMANTA, S. BORDOLOI, Predicting Stock Market- an Application of Artificial Neurol Network Technique through Genetic Algorithm, Finance India, 19(1), 2005, s.173-188. Ali Serhan KOYUNCUGĠL, Bulanık Veri Madenciliği ve Sermaye Piyasalarına Uygulanması, YayınlanmamıĢ Doktora Tezi, Ankara Üni. FBE, Ġstatistik Anabilim Dalı, Ankara, 2006. 5 aracı kuruluĢları ve yatırımcıları sırasıyla tespit etmeye çalıĢmıĢtır. Tasarladığı sistemi, manipülasyon yapılmıĢ bir hisse senedinin verileriyle test etmiĢ ve sistemin baĢarıyla çalıĢtığı görülmüĢtür. ÖzgülbaĢ ve Koyuncugil, çalıĢmalarında veri madenciliği süreci kullanarak Ġstanbul Menkul Kıymetler Borsasında (ĠMKB) 2000-2005 yılları arasında iĢlem gören küçük ve orta büyüklükteki iĢletmelerin (KOBĠ) finansal yönden zayıf ve güçlü yönlerini belirlemeye çalıĢmıĢlarıdır 7. Uygulamada Chi-Square Automatic Interaction Detector (CHAID) karar ağacı algoritmasını kullanmıĢlardır. ÇalıĢmanın sonucunda KOBĠ‟ler 19 farklı finansal profilde sınıflandırılmıĢ ve finansal açıdan güçlü ya da zayıf olduklarının, öz kaynak ve varlıkların verimliliğine, maddi duran varlıkların finansmanına ve likidite yönetimine iliĢkin stratejiler ile belirlendiği sonucuna ulaĢılmıĢtır. Bu çalıĢmada diğer çalıĢmalardan farklı olarak, verilerin hazırlanmasında ve veriler arasındaki tutarlılığın sağlanmasında veri madenciliği süreci kullanılmıĢtır. Genetik algoritmada kullanılan kromozom yapısı diğer çalıĢmalardan farklı olarak oluĢturulmuĢtur. Son olarak da bu çalıĢmada gerçek bir uygulama ortamı geliĢtirilmiĢtir ve yeni verilerin programa girilmesi sağlanarak sistemin güncel bir Ģekilde çalıĢması sağlanmıĢtır. Bu yolla da veri madenciliği sürecinin yayılım süreci gerçek anlamda yerine getirilmiĢtir. 7 Nermin ÖZGÜLBAġ, A. Serhan KOYUNCUGĠL, ĠMKB‟de ĠĢlem Gören KOBĠ‟lerin Veri Madenciliği Karar Ağaçları Algoritmalarından Chaid ile Profillendirilmesi ve KüreselleĢtirme Sürecinde Güçlü ve Zayıf Yönlerinin Belirlenmesi, http://www.finansbilim.com/ufs2006/Makaleler/IMKBDEISLEMGOREN.pdf, (01.01.2008) 6 İKİNCİ BÖLÜM 2. Genel Olarak Portföy ve Portföy Yönetimi Bu bölümde portföy ve portföy yönetimi kavramları, portföy yönetimi yaklaĢımları, portföy oluĢturmada risk ve beklenen getiri unsurları ile portföy performansının ölçülmesinde kullanılan yöntemler hakkında bilgi verilecektir. 2.1. Portföy Kavramı Portföy en geniĢ ifade ile bireylerin sahip oldukları varlıkların toplamıdır. Menkul kıymet açısından portföy ise; bireysel ya da kurumsal yatırımcıların ellerinde bulundurdukları hisse senedi, tahvil, finansman ya da hazine bonosu ve diğer menkul kıymetlerin toplamını ifade etmektedir 8. Para ve sermaye piyasalarının geliĢmesiyle birlikte yatırım araçlarının sayısı da artmaktadır. Bu durum yatırımcıların yatırım seçeneklerini artırmaktadır. Portföyler; sadece hisse senedinden, sadece tahvillerden ya da finansman ve hazine bonolarından oluĢabileceği gibi, diğer yatırım araçlarından ya da bunların bileĢiminden oluĢabilmektedir. Bilinen en klasik portföylerden birisi hisse senedi portföyleridir. Yatırımcının portföyünü sadece hisse senetlerinden oluĢturması, yatırımcı açısından büyük bir risk taĢımaktadır. Çünkü hisse senetleri sistematik ve sistematik olmayan risk kaynaklarından çok kolay ve hızlı bir Ģekilde etkilenebilmektedir. Bu nedenle hisse senedi portföyü oluĢturacak olan yatırımcıların, hisse senetleri piyasalarının yanında güncel iç ve dıĢ ekonomik ve politik geliĢmeleri, hisse senetleri iĢlem gören Ģirketlerle ilgili haberleri sürekli takip etmeleri ve Ģirketlerin mali tablolarını inceleyerek karar vermeleri gerekmektedir. Bu tür takip iĢlemlerini yapamayan ya da eksik yapan yatırımcıların beklentilerini gerçekleĢtirmeleri güçleĢmekte ya da yatırımcılar beklentilerinin tam tersi bir durumla karĢılaĢabilmektedir. Bu tür portföylerin, ülkede 8 Gültekin RODOPLU, Para ve Sermaye Piyasaları, Tuğra Ofset, Isparta, 2001, s.345. 7 ekonomik ve politik istikrarın olduğu dönemlerde uygulanması yararlı olabilmektedir. Ancak riskli yatırım aracı olmaları nedeniyle yüksek getiri potansiyeline sahip olmaları, üçer aylık dönemlerle mali tablolarını açıklamaları dolayısıyla sürekli bir beklenti yaratmaları hisse senetlerinin cazibelerini korumalarını sağlamaktadır. Bir diğer portföy türü de tahvillerden oluĢan portföylerdir. Bu tür portföyler özellikle risk almayı sevmeyen, finans piyasalarını sürekli takip etmeyen ve bununla birlikte düĢük getiriye razı olan yatırımcıların tercih edebilecekleri portföy türüdür. Yatırımcılar, farklı vadelerdeki devlet ve Ģirket tahvillerinden, hazine ve finansman bonolarından bir portföy oluĢturarak düĢük getirili ve düĢük riskli portföy oluĢturabilmektedirler. Bu tür portföyler daha çok ülke ekonomisinin yavaĢladığı dönemlerde ya da ekonomik belirsizliğin arttığı dönemlerde oluĢturulmaktadır. Hisse senedi ve tahvil dıĢındaki menkul kıymetlerle de portföy oluĢturulabilir. Bu menkul kıymetleri; gelir ortaklığı senetleri, mevduat ve mevduat sertifikaları, repo, karzarar ortaklığı belgeleri, opsiyon sözleĢmeleri, vadeli kontratlar, banka bonoları, banka garantili bonolar, varlığa dayalı menkul kıymetler, konut sertifikaları, döviz tevdiat hesapları (DTH), menkul kıymet yatırım fonları, yatırım ortaklığı sertifikaları Ģeklinde sıralanabilir. Yatırımcının hisse senedi ve tahvil dıĢındaki menkul kıymetlerden oluĢturacağı portföy, yatırımcının riske karĢı tutumuyla ilgilidir. Örneğin; kar-zarar ortaklığı belgeleri ve A tipi yatırım fonundan oluĢturulacak bir portföyün riski, mevduat, repo ve döviz tevdiat hesabından oluĢturulacak bir portföyün riskinden daha fazla olacaktır. Bu nedenle yatırımcının bu menkul kıymetlerden bir portföy oluĢtururken hangi yatırımlardan daha fazla verim alabileceğini iyi hesaplaması gerekmektedir. Yatırımcı diğer menkul kıymetlerden oluĢturabileceği portföyün içine hisse senetleri ve tahvilleri de ekleyebilir. Bu sayede de karma bir portföy oluĢturulmuĢ olur. Portföydeki menkul kıymet çeĢitliliğinin artırılması portföyün toplam riskinin düĢmesine neden olacaktır. Ekonominin durgunluk ve belirsizliğin yüksek olduğu dönemlerde, riski düĢük menkul kıymetlerden (mevduat, repo, hazine bonosu, devlet tahvili, DTH, B tipi likit fon, vb.) bir portföy oluĢturulabilecekken, ekonomik büyümenin yüksek ve 8 istikrarlı olduğu dönemlerde daha riskli menkul kıymetlerden( hisse senetleri, A tipi yatırım fonları, kar-zarar ortaklığı belgeleri) de portföyler oluĢturulabilir. 2.2. Portföy Yönetimi Kavramı ve Portföy Yönetimi Yaklaşımları Ülke ve dünya ekonomisindeki geliĢmeler menkul kıymet fiyatlarını olumlu ya da olumsuz yönde etkilemektedir. Dolayısıyla oluĢturulan portföylerin ekonomik geliĢmeler doğrultusunda sıklıkla değiĢtirilmesi gerekmektedir. Portföy yönetimi, ekonomik geliĢmeler doğrultusunda portföy oluĢturmayı ve oluĢturulan bu portföyü değiĢen koĢullara göre oluĢturulan portföydeki menkul kıymetleri ya da menkul kıymet oranlarını değiĢtirmeyi ifade etmektedir. Dolayısıyla portföy yönetimi sürekli değiĢen bir süreci ifade etmektedir. Portföy yönetimi sürecinde portföy yöneticisinin karĢılaĢtığı en büyük sorun; değiĢen koĢullar karĢısında hangi menkul kıymetleri hangi oranlarda portföye sokması gerektiğidir. Portföy yönetimiyle ilgili temel iki yaklaĢımdan bahsedilebilir. Bunlar Geleneksel Portföy Yönetim YaklaĢımı ve Modern Portföy Yönetim YaklaĢımıdır. 2.2.1. Geleneksel Portföy Yönetim Yaklaşımı Geleneksel Portföy Yönetimi yaklaĢımında yatırımcıların faydalarını maksimize edecekleri bir portföyü tercih edecekleri kabul edilmektedir. Bunu gerçekleĢtirebilmek için de yatırımcıların öncelikle yatırım yapmayı düĢündükleri menkul kıymet getirilerini, ardından da portföy getirilerine göre oluĢabilecek riskleri hesaplamaları gerekmektedir 9. Riski dağıtmak portföy oluĢturmanın asıl amacı olduğu için yatırımcılar tek bir menkul kıymetten oluĢacak portföy oluĢturmaktan kaçınacaklar, portföylerindeki menkul kıymet sayısını artırmaya çalıĢacaklardır 10. Geleneksel Portföy Yönetimi yaklaĢımına göre portföydeki menkul kıymet sayısının fazlalığıyla portföy riski arasında ters orantılı bir iliĢki vardır. Bir baĢka deyiĢle, yatırımcı portföyüne alacağı menkul kıymet sayısını sürekli artırmaya çalıĢacak, dolayısıyla oluĢturduğu portföyün de riski azalmıĢ olacaktır. 9 Jong Soo KIM, Yong Chan KIM, Ki Young SHIN, An Algorithm for Portfolio Optimization Problem, Informatica, Vol. 16, No.1, 2005, s. 93. 10 Ali CEYLAN, Turhan KORKMAZ, “Borsada Uygulamalı Portföy Yönetimi”, Ekin Kitabevi Yay., 3. Baskı, Bursa, 1998, s. 123-124. 9 2.2.2. Modern Portföy Yaklaşımı Geleneksel Portföy YaklaĢımına göre yatırımcılar, farklı risklerle karĢı karĢıya olduklarının farkında olmalarına rağmen, bu riski matematiksel olarak nasıl ölçecekleri konusunda bilgi sahibi olmamaktadırlar. Harry Markowitz, belli varsayımlara dayanarak portföyün beklenen getirilerinin varyansının, portföyün riskini ölçebilecek bir ölçü olduğunu ortaya koymuĢ ve portföyün varyansının formülünü ortaya çıkarmıĢtır. Bu formül hem portföy riskinin nasıl düĢürülebileceğini hem de iyi bir çeĢitlendirmenin nasıl olması gerektiğini belirtmektedir. Geleneksel Portföy YaklaĢımında, portföye alınacak hisse senedi sayısındaki artıĢa bağlı olarak riskin düĢeceği ve çeĢitlendirmenin baĢarısının artacağı görüĢüne karĢıt olarak Markowitz, çeĢitlendirmenin rastgele değil, hisse senetleri getirileri arasındaki korelasyona dayandırılması gerektiğini ve belli bir hisse senedi sayısından sonra artık portföye hisse senedi eklenmesinin, portföyün riskinin düĢmesini sağlamayacağı görüĢünü savunmuĢtur. Örneğin; Evans ve Archer yaptıkları çalıĢmada 10 hisse senedinin çeĢitlendirme için yeterli olduğu sonucuna varmıĢlardır. Ancak daha sonra yapılan çalıĢmalarda 30 hatta 40 hisse senedinin portföye eklenmesiyle portföy riskinin düĢürülebileceği belirtilmiĢtir 11. Yatırımcılar beklenen getirilerin yüksek olmasını ve bu beklenen getiriden sapmaların yanında riskin de düĢük olmasını isterler. Ancak risk ve getiri birbirleriyle doğru orantılı oldukları için böyle bir durumun gerçekleĢmesi mümkün değildir. Markowitz, bu konuyu belli bir getiri seviyesinde riskin minimizasyonu, ya da belli bir risk seviyesinde getirinin maksimizasyonu Ģeklinde açıklamıĢtır. Böylece, oluĢturulacak portföyün amacı riski minimum yapmak yada getiriyi maksimum yapmak değil, yatırımcının beklenen faydasının maksimize edilmesini sağlamaktır 12. Markowitz Modern portföy yaklaĢımını ortaya koyarken; 11 Gürel KONURALP, “Sermaye Piyasaları, Analizler, Kuramlar ve Portföy Yönetimi”, Alfa Yay., 2. Baskı, Ġstanbul, 2005, s. 313-314. 12 Gürel KONURALP, a.g.e. , s.315. 10 - Yatırımcıların Menkul Kıymet Borsalarında istedikleri kadar hisse senedi alabilme imkanına sahip olduklarını, - Yatırımcıların rasyonel davranmaya çalıĢtıklarını ve temel amaçlarının sağlamayı düĢündükleri faydayı maksimum yapmak olduğunu, - Yatırımcıların, menkul kıymetlerin beklenen getiri ve risklerini göz önünde bulundurarak yatırım kararı verdiklerini ve beklenen getiri ölçüsü olarak portföyde yer alacak menkul kıymetlerin beklenen getirilerinin ortalamasını, risk ölçüsü olarak da portföy getirilerinin varyansını almaları, dolayısıyla yatırımcıların tümü menkul kıymetlerin beklenen getirileri, standart sapmaları ve korelasyonuna iliĢkin aynı beklentiye sahip olacaklarını, - Yatırımcıların hemen hepsinin aynı risk düzeyinde daha fazla getiri elde etmeyi tercih edeceğini, - Yatırımcıların, aynı zaman ufkuna sahip olacağını, - Yatırımcıların piyasaya ait bilgilere eĢ zamanda ulaĢmasının mümkün olduğunu, çünkü, piyasa bilgilerinin hızlı bir Ģekilde ve doğru olarak menkul kıymet fiyatlarına yansıdığı ve bilgi akıĢına ait bir kısıtlama olmadığı, varsayımlarına dayanmaktadır 13. 1956 yılında Markowitz‟in geliĢtirdiği ortalama - varyans modeli ve ardından 1956‟da Wolfe‟nin bulduğu etkin çözüm, modern portföy yönetimi yaklaĢımının temelini oluĢturmaktadır. Modern portföy yönetimi yaklaĢımı, yatırımcının kabul ettiği belli bir risk seviyesinde yapmıĢ olduğu yatırımdan beklediği getiriyi ifade etmektedir. BaĢka bir ifadeyle modern portföy yaklaĢımı, tüm yatırımcıların belli bir risk düzeyinde en yüksek getiriye ve aynı getiri seviyesinde ise en düĢük riske sahip olma istekleri üzerine geliĢtirilmiĢ bir portföy yönetim modelidir 14. 13 14 Niyazi BERK, Finansal Yönetim, Türkmen Kitabevi, 2. Baskı, Ġstanbul, Mayıs, 1995, s.217. Nihat BOZDAĞ, ġenol ALTAN, Sibel DUMAN, Minimaks Portföy Modeli ile Markowitz OrtalamaVaryans Modelinin KarĢılaĢtırılması, http://www.ekonometridernegi.org/bildiriler/o24s1.pdf, (30.10.2007) 11 Markowitz portföy optimizasyonu modelini oluĢtururken 2 kural koymuĢtur. Ġlk olarak yatırımcı beklenen getiriyi maksimum yapmalıdır, ikinci olarak da yatırımcının beklenen getiriyi arzu edilen, getirinin varyansını ise arzu edilmeyen bir durum olarak görmesi gerekir. Bu kuralların sonucunda etkin portföy kavramı ortaya çıkmaktadır. Markowitz, portföy optimizasyon modelinde risk ölçütünü varyans olarak kabul etmiĢ ve modelin amacını da bir portföyün varyansını minimum yapan varlıkların portföydeki ağırlıklarını bulmak ve beklenen getiriden daha büyük ya da aynı getiride bir portföy ortaya çıkarmak olarak belirlemiĢtir. N varlıktan oluĢan bir minimizasyon matematiksel model de Ģu Ģekilde ifade etmiĢtir 15: n n ij xi x j i 1 j 1 n rj x j pM 0 j 1 n xj = M0 j 1 0 xj ij uj j = 1…….n i ve j menkul kıymetleri arasındaki kovaryans, x j = j menkul kıymetine yapılan yatırım miktarı, r j = dönem baĢına j menkul kıymetinden beklenen getiri, p = yatırımcı tarafından istenen en düĢük beklenen getiri oranı parametresi, M 0 = toplam yatırım miktarı, u j = j menkul kıymetine yatırım yapılabilecek maksimum para miktarı. 15 Ali Argun KARACABEY, Is Mean Variance Efficient Than MAD in Ġstanbul?, International Research Journal of Finance and Economics, Issue 3, 2006, s. 114. 12 Ortalama varyans analizi, portföydeki varlık dağılımı konusu için çok önemli bir yapı oluĢturmaktadır. Bununla birlikte tüm analitik tekniklerde olduğu gibi uygulamada dikkat edilmesi gereken unsurlar bulunmaktadır 16: Markowitz‟in modeli; popülasyon parametresi olarak beklenen getiriler, standart sapmalar ve korelasyonlardan oluĢmaktadır. Uygulamada bu parametrelerin yerine istatistiksel tahminlerin kullanılması gerekmektedir. Tahminler sonucu yapılan hatalar da optimizasyon sonucunu değiĢtirebilmekte ve hatta tahminlerde yapılacak küçük hatalar büyük sapmalara neden olabilmektedir. Uygulamada çıkabilecek diğer bir sorun da, çıkan sonuçların güvenilmez olmasıdır. Etkin sınır üzerinde oluĢacak küçük bir hareket, varlık dağılımında büyük farklılıklara neden olabilmektedir. Bu durum genellikle birbirine benzer varlıkların portföye alınmasında ortaya çıkmaktadır. Ancak tüm bu olumsuz durumlara rağmen, ortalama varyans analizi uygulayıcılar arasında geniĢ çapta kabul görmektedir. 2.3. Portföy Oluşturmada Risk Ve Beklenen Getiri Unsurları Yatırımcılar açısından yatırım kararı vermek, sadece hangi menkul kıymetlere yatırım yapacağını belirlemek anlamına gelmemektedir. Yatırımcılar tek menkul kıymete yatırım yapmak yerine, bunlardan bir portföy oluĢturmaya da karar verebilmektedirler. Bu noktada yatırımcının amacı sadece portföy oluĢturmak değil, optimal portföyü oluĢturmaktır. Bunun için portföyün risk ve getirisinin hesaplanması gerekmektedir 17. 16 Paul D. KAPLAN, Asset Allocation Models Using The Markowitz Approach, http://corporate.morningstar.com/ib/documents/MethodologyDocuments/IBBAssociates/Marko witzApproach.pdf, (01.01.2008). 17 Ali CEYLAN – Turhan KORKMAZ, a.g.e. , s. 94. 13 2.3.1. Portföy Riski Her oluĢturulan portföy aynı risk derecesine sahip değildir. Portföyler farklı menkul kıymetlerden ya da aynı menkul kıymetlerden farklı oranlarda oluĢturulduğunda riskleri de farklı olmaktadır. Ülke ve dünya ekonomisinde yaĢanan değiĢmeler yatırımcıların risk konusuna daha fazla önem vermelerini gerektirmektedir 18. Bu konuda risk unsurlarından; kovaryans, korelasyon katsayısı, beta katsayısı, varyans, ve standart sapma kavramlarına değinilecektir. Kovaryans Kovaryans, değiĢkenler arasındaki değiĢimler sonucunda bu değiĢkenlerin ortalama değerden sapma derecesini gösteren bir ifadedir. Portföyde iki veya daha fazla menkul kıymet söz konusu olduğunda risk kovaryans ile ölçülür. Toplam risk yatırımlar arasındaki kovaryansa bağlıdır. Matematiksel olarak ise; değiĢkenlerin almıĢ oldukları değerlerin ortalama değerden sapmalarının çarpımının ağırlıklı ortalamasına eĢittir. Bu tanımlama formül olarak Ģu Ģekilde gösterilebilir 19: Cov(i, k ) = 1 N 1t N Rit E Ri Rkt E Rk 1 veya Cov ri , r j = pi , j i j Rit = i menkul kıymetinin t dönemindeki getirisi, E Ri = i menkul kıymetinin beklenen getirisi, Rkt = k menkul kıymetinin t dönemindeki getirisi, E Rk = k menkul kıymetinin beklenen getirisi, 18 19 Gültekin RODOPLU, a.g.e, s.360. Murat UĞUZ, Menkul Kıymet Seçimi ve Yatırım Yönetimi, Ġstanbul, 1990, s.139-141. 14 N = Portföydeki menkul kıymet sayısı, i ve j menkul kıymetleri arasındaki korelasyon katsayısı, ri , j i j = i ve j menkul kıymetlerinin getirilerinin standart sapmalarının çarpımları. Eğer varlıklar arasındaki kovaryans pozitif (+) bir değer almıĢsa, varlıkların ortalamalarından sapmalarının aynı yönde olduğu, Eğer varlıklar arasındaki kovaryans negatif (-) bir değer almıĢsa, varlıkların ortalamalarından sapmalarının zıt yönde olduğu, Eğer varlıklar arasındaki kovaryans değeri 0‟a yaklaĢırsa ya da 0 olursa, varlıkların sapma değerleri arasında anlamlı bir iliĢki olmadığı anlaĢılır. Korelasyon Katsayısı Korelasyon katsayısı; portföye dahil edilecek menkul kıymetlerin getirileri arasındaki iliĢkinin yönünün belirlenmesinde kullanılır. Korelasyon katsayısı, menkul kıymetler arasındaki kovaryansın menkul kıymetlerin getirilerinin standart sapmalarının çarpımına oranı olarak ifade edilebilir. Formül olarak göstermek gerekirse 20: r AB = Cov AB A * B r AB = A ve B menkul kıymetlerinin getirileri arasındaki korelasyon katsayısı, Cov AB = A ve B menkul kıymetlerinin getirileri arasındaki kovaryans değeri, A = A menkul kıymetinin getirisinin standart sapması, B = B menkul kıymetinin getirisinin standart sapması. Korelasyon katsayısı -1 ile +1 arasında bir değer alır. Portföye alınacak menkul kıymetler arasındaki korelasyon katsayısı -1‟e ne kadar yakınsa belli bir getiri düzeyinde risk o kadar azaltılabilmektedir. Hatta uç durum olan tam negatif korelasyonla risk sıfıra 20 Murat UĞUZ, a.g.e. , s. 142-143. 15 eĢitlenebilmektedir. Menkul kıymetler arasındaki korelasyon katsayısının +1‟e yaklaĢması durumunda ise portföy riski artmaktadır. Eğer korelasyon katsayısı 0 ya da 0‟a yakınsa menkul kıymetlerin getirileri arasında anlamlı bir iliĢki olmadığı söylenir. Beta Katsayısı Beta katsayısı, piyasanın getirisi ile bir menkul kıymetin getirisi arasındaki iliĢkiyi gösterir. BaĢka bir deyiĢle bir menkul kıymetin portföyün getirisine ve riskine katkısı, bu menkul kıymetin beta katsayısı ile ölçülür. 21. Beta katsayısı, bir menkul kıymetin portföy içindeki payının bir birim artırılması sonucu, portföyün varyans değerinde meydana gelen değiĢmeyi ifade etmektedir. Beta katsayısı, istatistiksel olarak bir menkul kıymetin sağladığı getiri (j) ile piyasa getirisi (m) arasındaki kovaryansın piyasa getirisinin varyansına oranıdır. Beta katsayısı aĢağıdaki formülle gösterilebilir 22: j j = Cov (j, m) / Var (m) = Hisse senedinin betası, Cov (j, m) = Hisse senedi getirisi ile piyasa getirisi arasındaki kovaryans, Var (m) = Piyasa getirisinin varyansı Portföye alınacak menkul kıymetlerin seçiminde beta katsayısından sıkça faydalanılır. Hisse senedi piyasasının beta katsayısı 1 alınır ve hisse senetlerinin beta katsayıları bu değerle kıyaslanır. > 1 ise portföyün getirisinin, piyasa getirisi ile aynı yönde ve daha büyük bir değiĢme gösterdiği anlaĢılır. 21 22 Mehmet Fuat BEYAZIT, ĠMKB Betaları, Korelasyon Tahmini ve DeğiĢkenlik, Doğuş Üniversitesi Dergisi, 6 (1), 2005, s.28. Mustafa KIRLI, Halka Açık Olmayan ġirketlerde Sistematik Risk Ölçütü Beta Katsayısının Tahmin Edilmesi, Celal Bayar Üni., Yönetim ve Ekonomi Dergisi, Cilt:13, Sayı:1, s.123. 16 1 koĢulunda, portföyün getirisinin, piyasa getirisinden pozitif ya da 1 negatif yönde (beta katsayısının artı ya da eksi oluĢuna göre) daha küçük bir değiĢim göstereceği anlamına gelir. -1 ise, portföyün getirisinin, piyasa getirisi ile ters yönde ve daha küçük bir değiĢme göstereceği anlaĢılır. Varyans ve Standart Sapma Portföy oluĢtururken göz önünde bulundurulan risk ölçülerinden birisi de varyans ya da standart sapmadır. Varyans ya da standart sapma, gerçekleĢen getirilerin beklenen getirilerden ne kadar saptığını gösteren risk ölçülerinden birisidir. Dolayısıyla yatırımcılar, aynı getiri seviyesinde varyansı ya da standart sapması küçük olan portföyü diğerlerine tercih edecektir. Standart sapma, varyansın kareköküne eĢittir. Varyans en basit Ģekilde aĢağıdaki Ģekilde ifade edilebilir: 2 Rİ 2 Rİ = 1 N N Rit E Ri 2 t 1 = i portföyünün varyansı, Rit = t. dönemde i portföyünün getirisi, E Ri = i portföyünün beklenen getirisi, N = dönem sayısı. Bir portföydeki menkul kıymetlerin oranı sadece getirilerin ortalamalarına ve varyanslarına bağlı değildir, aynı zamanda kovaryanslarına da bağlıdır. Bu nedenle portföy optimizasyonu yapılırken gerek ortalama getiriler, gerekse menkul kıymetlerin 17 getirilerinin varyansları ve kovaryansları da hesaplanmalıdır. AĢağıda iki menkul kıymetten oluĢan bir portföyün varyans formülü verilmiĢtir 23: n 2 p n = i j xi x j pij i 1 j 1 2 p = Portföyün varyansı, p ij = i ve j menkul kıymetleri arasındaki korelasyon katsayısı, i j = i ve j menkul kıymetlerinin getirilerinin standart sapmalarının çarpımı, x i x j = i ve j menkul kıymetlerinin portföydeki ağırlıkları. 2.3.2. Portföyün Beklenen Getirisi Markowitz modeli ile yatırım kararı verirken yatırımcı, elde tutma dönemi sonunda servetinin hangi düzeyde olacağı ile ilgilenir ve bunu da yatırım döneminin baĢında kesin olarak bilemez. Dolayısıyla yatırımcılar, portföyler arasındaki tercihlerini, dönem sonundaki servetini nasıl etkileyeceklerine bakarak belirleyeceklerdir. Dönem sonundaki servetlerine etkisini de söz konusu portföylerin beklenen getiri ve riskleri ile ölçebilirler 24. Portföyün beklenen getirisi, portföyde yer alan menkul kıymetlerin getirilerinin ağırlıklı ortalamasına eĢittir. n sayıda menkul kıymetten oluĢan bir portföyün beklenen getirisi aĢağıdaki formülle hesaplanabilir: 25 Kˆ i n K i Pi i 1 K̂ i = Portföyün beklenen getirisi, 23 Mehmet HORASANLI, Neslihan FĠDAN, Portfolio Selection by Using Time Varying Covariance Matrices, Journal of Economic and Social Research, 9(2), 2007, s.4. 24 KONURALP, a.g.e , s. 323. 25 Gültekin RODOPLU, a.g.e., s. 366-367. 18 K i = (i)‟nci olası getiriler, Pi = (i)‟nci getirinin gerçekleĢme olasılığı, n = Olası getirilerin sayısı. 2.4. Portföy Performansının Değerlendirilmesi Portföy performansı yapılan yatırımın ne derecede baĢarılı olduğunu gösterir. Bu nedenle portföy performansı ölçülerek, baĢarısızlığın nedenleri de bulunabilir. OluĢturulan portföyün baĢarısı ya da performansı portföyün getirisinin ve riskinin ayrı ayrı ölçülüp kıyaslanması ile hesaplanabilir. Portföyün getirisi kısaca toplam getirinin, yatırım tutarına bölünmesiyle hesaplanabilir. Ancak portföy performansının ölçülmesinde sadece getirinin hesaplanması yeterli olmayacaktır. Getirilerin riske göre düzeltilmesi gereklidir 26. 1960‟tan önce yatırım baĢarısını belirlemede riskin çok önemli bir değiĢken olduğu bilinmesine rağmen yatırımcılar, portföy performansını değerlendirirken hemen hemen tamamen getiri oranını göz önünde bulunduruyorlardı. Bunun temel nedeni riskin henüz nasıl ölçüleceğinin tam olarak bilinmemesiydi. 1960‟lı yılların baĢında Modern Portföy Teorisinin geliĢtirilmesiyle birlikte risk, beta katsayısı ya da standart sapmayla ölçülebilir hale geldi ve portföy performansını değerleme sürecine dahil edildi 27. Ortalama getiri ve varyans temeline dayanan riske göre düzeltilmiĢ portföy performans ölçümleri, finansal varlıkları fiyatlama modeli ile aynı zamanda ortaya atılmıĢtır. Bu konuda öncülüğü yapan araĢtırmacılar Sharpe, Treynor ve Jensen‟ dır. Doğal olarak, riske göre düzeltilmiĢ bir performans ölçümü geliĢtirmek için risk ile getiri arasında iliĢkinin hesaplanması gerekmektedir 28. 26 Güray KÜÇÜKKOCAOĞLU, Portföy ve Performans Ölçümleri, http://www.baskent.edu.tr/~gurayk/investendeksmodelleri.pdf, (01.01.2008) 27 Cudi T. GÜRSOY, Y. Ömer ERZURUMLU, Evaluation of Portfolio Performance of Turkish Investment Funds, DoğuĢ Üni. Dergisi, 2001/4, s.44. 28 Öcal USTA, İşletme Finansı ve Finansal Yönetim, Detay Yayıncılık, 2.Baskı, Ankara, 2005, s.333. 19 2.4.1. Sharpe Oranı Portföy performansını ölçmek için sadece portföyde yer alan menkul kıymetlerin getirilerini değil, aynı zamanda risklerini de göz önünde bulundurmak gerekir 29. Sharpe oranı fazla kar ya da getirinin ortalamasının, bu fazla getiri ya da karın standart sapmasına bölünmesiyle hesaplanır. Burada fazla kar ya da getiri, bir menkul kıymetin getirisinin, o dönemki risksiz faiz oranından fazla olan kısmıdır 30. BaĢka bir ifadeyle Sharpe oranı, risk priminin toplam riske bölünmesidir. Toplam risk ise, aynı dönemde sistematik ve sistematik olmayan risklerden oluĢan risk toplamını ifade etmektedir 31. SPDY = (R p - R f )/ p SPDY = Sharpe Performansı Değerleme Yöntemi , R p = p portföyünün getirisi, R f = Risksiz faiz oranı, p = p portföyünün getirisinin standart sapması. Sharpe‟nin performans değerleme yöntemi olarak kullandığı endeks, yatırımcıların risksiz faiz oranı üstünde bekledikleri getiriyi gösterir. Sharpe endeksi, portföy performansını riskine göre düzelterek ölçmektedir 32. Sharpe oranı yorumlanırken dikkate alınan unsur “sermaye piyasası doğrusu”dur. Sermaye piyasası doğrusu (SPD), çeĢitlendirilmiĢ portföyler için beklenen getiri ve toplam risk arasındaki dengeyi ortaya koyan bir doğrudur. Bu doğru risksiz getiri oranından baĢlar ve pazar portföyüne doğru uzanır. Bu doğru sermayenin en iyi dağılıma sahip olduğu doğrudur. 29 KONURALP, a.g.e., s.346. Mark CHOEY, Andreas S. WEIGEND, Nonlinear Trading Models Through Sharpe Ratio Maximization, Working Paper, Decision Technologies for Financial Engineering, 1997, s.4. 31 USTA, a.g.e., s.333. 32 Özgür DEMĠRTAġ, Zülal GÜNGÖR, , Portföy Yönetimi ve Portföy Seçimine Yönelik Uygulama, Havacılık ve Uzay Teknolojileri Dergisi, Cilt 1, Sayı 4, 2004, s. 106. 30 20 Eğimi SPD‟den fazla olan portföylerin piyasaya göre iyi performans gösterdiği, az olan portföylerin ise piyasaya göre kötü performans gösterdiği söylenebilir. Bunun sonucu olarak portföy sıralamasında en büyük eğime sahip portföy en iyi performansı gösteren portföy kabul edilir 33. Bu durum ġekil 2.1.‟de gösterilmektedir. Ortalama Getiri C B A SA SB SC rf Standart Sapma Şekil 2.1. Sharpe Performans Değerleme Yöntemine Göre Portföylerin Karşılaştırılması Kaynak: Güner KONURALP, Sermaye Piyasaları, Analizler, Kuramlar ve Portföy Yönetimi, Alfa Basım Yayın, İstanbul, 2005, s. 347. ġekilde görüldüğü gibi, Sharp endeksi, risk-getiri diagramı üzerinde, risksiz faiz oranını her bir portföye birleĢtiren doğrunun eğimini göstermektedir. ġekle göre C portföyü B‟den, B portföyü de A‟dan daha iyi performans göstermiĢtir. Portföylerin farklı getirilere ve risklere sahip olmaları, Sharp indeksiyle karĢılaĢtırmalarında bir engel değildir. 2.4.2. Treynor Performans Değerleme Yöntemi Sharpe endeksi portföyün toplam riskini dikkate alırken, Treynor endeksinin hesaplanmasında ise portföyün sistematik riski yani betası ( 33 ) dikkate alınır. Bu AyĢe YILDIZ, A Tipi Yatırım Fonları Performanslarının ĠMKB ve Fon Endeksi Bazında Değerlendirilmesi, Muğla Üniversitesi SBE Dergisi, 2005, Sayı 14, s.188. 21 endeks, “sistematik risk birimi baĢına getiri”yi vermektedir 34. Treynor tarafından ortaya konulan endeks aĢağıdaki Ģekilde ifade edilebilir. 35 TPDY = (R p - R f )/ p TPDY = Treynor performans değerleme yöntemi, R p = p portföyünün beklenen getirisi, R f = Risksiz faiz oranı, p = p portföyünün beta katsayısı. Treynor endeksinin değeri ne kadar yüksek olursa, portföyün getirisi de o kadar iyi performans göstermiĢ olur. Bundan dolayı, portföy için hesaplanan endeks değeri, piyasa için hesaplanan endeks değerinden daha büyük ise, bu durum portföyün piyasanın üzerinde getiri sağladığını gösterir 36. Ortalama Getiri P Q Tp rf TQ Standart Sapma Şekil 2.2. Treynor Performans Değerleme Yöntemine Göre Portföylerin Karşılaştırılması Kaynak: Ali CEYLAN, Turhan KORKMAZ, Borsada Uygulamalı Portföy Yönetimi, 3. Baskı, Ekin Kitabevi, s. 264. 34 Mehmet ARSLAN, A Tipi Yatırım Fonlarında Yöneticilerin Zamanlama Kabiliyeti ve Performans ĠliĢkisi Analizi: 2002-2005 Dönemi Bir Uygulama”, Gazi Üni. Ticaret ve Turizm Eğitim Fak. Der., Sayı 2, 2005, s. 9. 35 Güven SEVĠL, Mehmet ġEN, Aktif Portföy Yönetimi Çerçevesinde Kâr Payı Verimi Temeline Göre OluĢturulan Portföylerin Performansının Belirlenmesinde Information Oranının Kullanımı: 1990 – 1998 ĠMKB Uygulaması, İktisat, İşletme ve Finans Dergisi, Yıl: 16, Sayı 178, Ocak, 2001, s. 45. 36 a.g.m., s. 45. 22 ġekil 2.2.‟de görüldüğü gibi, P portföyü, Q portföyüne nazaran daha iyi bir performansa, dolayısıyla daha iyi bir getiriye sahiptir. 2.4.3. Jensen Performans Değerleme Yöntemi Jensen oranı, menkul kıymet piyasa doğrusunu temel alan bir yaklaĢımdır. Buna göre Jensen oranı, portföy menkul kıymet piyasa doğrusu üzerinde yer alması durumunda beklenen getirinin alacağı değer ile portföyün getirisi arasındaki fark olarak tanımlanmaktadır 37. Jensen endeksi, aĢağıdaki denklemde alfa ( Ri ,t i R f ,t = i i Rm,t ) katsayısına karĢılık gelmektedir 38: R f ,t = Jensen endeksi, Ri ,t = i portföyünün t dönemindeki ortalama ( piyasa ) getirisi, R f ,t = t dönemindeki risksiz faiz oranı, i = Sistematik risk ölçüsü, Rm,i = t dönemindeki piyasa portföyünün ortalama ( piyasa ) getirisi. Eğer portföy, pozitif Jensen endeksine sahipse hisse senedi pazar doğrusunun üzerinde, negatif endekse sahipse hisse senedi pazar doğrusunun altında bir yerde demektir. Bu durumda bir portföyün performansı Jensen endeksine göre o portföyün, hisse senedi pazar doğrusunun üzerinde yer alıp almamasına göre değiĢmektedir. Ancak Jensen Endeksine göre, hisse senedi pazar doğrusu üzerinde yer alan her portföy, portföy yöneticilerinin aynı derecede baĢarılı olduklarını kabul etmektedir. Bu endekste sadece 37 38 USTA, a.g.m, s.335. A. Tuna TANER, Koray KAYALIDERE, 1995-2000 Döneminde ĠMKB‟de Anomali AraĢtırması, Celal Bayar Üni. Yönetim ve Ekonomi Der., Cilt 9, Sayı 1-2, 2002, s. 12. 23 portföy yöneticisinin risksiz faiz oranı üzerinde elde ettiği getiri dikkate alınmakta, bu getiri düzeyine kaç menkul kıymetle ulaĢıldığı önem taĢımamaktadır 39. Sonuç olarak, Jensen‟e göre, portföy, finansal varlık pazar doğrusunun ne kadar üzerinde yer alıyorsa, yani taĢıdığı riske göre sağlaması gerekenden ne kadar fazla getiri sağlıyorsa, performansı o kadar yüksek demektir. ġekil 2.3.‟de A, B ve C portföylerinin performansları görülmektedir. Rp – Rf C B A [Rm - Rf] p Şekil 2.3. Jensen Portföy Performans Ölçüsüne Göre Portföylerin Karşılaştırılması Kaynak: Ali CEYLAN, Turhan KORKMAZ, a.g.e., s. 266. 2.4.4.Diğer Portföy Performans Değerleme Yöntemleri Bu çalıĢmanın uygulama aĢamasında yukarıda değinilen 3 performans ölçütü kullanılmıĢtır. Bu performans değerleme yöntemlerinden farklı olarak kullanılan yöntemler de bulunmaktadır. Bu yöntemler: Sortino Oranı, T2 Performans Ölçütü, M2 Performans Ölçütü, Fama Ölçütü, Değerleme Oranıdır. 39 KONURALP, a.g.e., s.355. 24 Sortino Oranı Portföy riskini ölçmede en çok kullanılan biri de varyanstır. Varyans bir yatırımın getirilerinin yatırımların ortalamasından sapmalarını ifade eder. Varyansı hesaplarken yukarı/pozitif ve aĢağı/negatif yönde herhangi bir kısıtlama yapılmamıĢtır. Bu yüzden, aylık %-5 ve %+5 getirilere sahip olan bir yatırım, bir ay sabit ve sonraki ay %+10 getiriye sahip olan bir diğer yatırımla aynı varyansa sahip olacaktır. Dolayısıyla Sharpe oranı, riski ayarlamak için oynaklığı ölçmede dolaylı olarak taraflı bir ölçü olan standart sapmayı kullandığından bu soruna çözüm bulmak için Sortino oranı geliĢtirilmiĢtir. Sortino yukarı ve aĢağı yöndeki hareketlerden kaynaklanan oynaklığı ayırt etmektedir. Yukarı yöndeki oynaklık arzu edilen bir durumdur ve oynaklık içinde hesaba katılmamaktadır 40. Sortino oranında birim risk baĢına düĢen getiri miktarı portföy performansını göstermektedir. Oranın yükselmesi daha iyi portföy performansını ifade etmektedir 41. Sortino Oranına göre, standart sapma yerine aĢağı yönde sapma kullanılır. Bu Ģekilde getiri dağılımlarının asimetrik olma problemine çözüm yaratılmıĢ olur. O halde bu yöntem, ortalama getirinin risksiz faiz oranını aĢan kısmının, aĢağı yönde olan altvaryansa oranıdır. Formül bir baĢka ifade ile42: rP - MAR SR = T t 1 (rpt MAR ) 2 T r pt sadece MAR> r pt olduğu durumlarda hesaplamaya girer. SR = Sortino oranını, r pt = portföyün t zamanındaki getirisini, 40 Youlvie MOUSTAFA, Portföy Yönetimi ve Finansal Varlık Fiyatlama Modelinde Risk Getiri İlişkisi, D.E.Ü. SBE ĠĢletme Anabilim Dalı, Yüksek Lisans Tezi, 2007, s.88. 41 a.g.t., s.88. 42 Suat TEKER, Emre KARAKURUM, Osman TAV, Yatırım Fonlarının Risk Odaklı Performans Değerlemesi, Doğuş Üni. Dergisi, 9 (1), 2008, s. 94. 25 rp = portföyün ortalama getirisini, T = incelenen gün sayısını, MAR = minimum kabul edilebilir değeri (kazancı) ifade etmektedir. Sortino oranında, risk ölçüsü olarak standart sapma yerine kısmi standart sapma kullanılır. Kısmi standart sapma, MAR‟ın altında kalan getiri sapmalarını ölçmektedir. Bir çok yatırım kararlarında, bazı belirlenen hedefleri gerçekleĢtirmek için minimum düzeyde kazanılması gereken bir getiri seviyesi vardır. Bu, oluĢan bazı kötü sonuçlardan korunmak için minimum seviyede kazanılması gereken getiridir ki “minimum kabul edilebilir getiri” (minimal acceptable return – MAR) olarak adlandırılır 43. M2 Performans Ölçütü M2 performans ölçütü, risk ölçütü olarak toplam riski ele alır fakat, karĢılaĢtırma yöntemine (benchmark) göre portföy performansı daha kolay yorumlanabilir. M2 Performans Ölçütü aĢağıdaki Ģekilde formüle edilebilir 44: M2 = R f Ra Rf * rm veya M2 = R f ( SharpeOranı* rm ) a rm = KarĢılaĢtırma ölçütünün getirilerinin standart sapması, R f = Risksiz faiz oranını göstermektedir. M2 hesaplanırken performansı ölçülecek portföylerin risklerinin piyasa portföyünün riskine eĢitlenmesi sağlanır. Bu nedenle de portföyü hem yüksek riskli, hem de düĢük riskli (devlet tahvili, hazine bonosu gibi) menkul kıymetlerden oluĢturmak gereklidir 45. 43 MOUSTAFA, a.g.t., s.88. Turhan KORKMAZ, Hasan UYGURTÜRK, Türkiye‟deki Emeklilik Fonları ile Yatırım Fonlarının Performans KarĢılaĢtırması ve Fon Yöneticilerinin Zamanlama Yetenekleri, Kocaeli Üni. SBE Dergisi (15), 2008, s. 118. 45 KONURALP, a.g.e., s.349. 44 26 Değerleme Oranı Değerleme oranı, Jensen ve Treynor endeksinin hesaplanmasında dikkate alınmayan sistematik olmayan riski göz önünde bulunduran bir yöntemdir. Bu yönteme göre Jensen oranı sistematik olmayan riske bölünerek, Jensen oranında sistematik olmayan riskin de kullanılması sağlanmıĢtır. Değerleme oranı aĢağıdaki Ģekilde formüle edilmiĢtir 46: AR = p ur p = Portföyün Jensen alfa değeri, = sistematik olmayan riski, ifade etmektedir. ur T2 Performans Ölçütü T2 Performans Ölçütü, Treynor oranını yüzde getiriye dönüĢtüren bir yöntemdir. Bu yöntemde portföye hazine bonosu eklendiği varsayılarak risk düzeltmesi yapılır. Bu metot aĢağıdaki Ģekilde formüle edilebilir: T2 = Treynor – (r m - r f ) Fama Performans Ölçütü Fama performans ölçütü fonların çeĢitlendirilmesi ve fon yöneticilerinin yüksek getiri sağlayan hisseleri toplama becerilerini ölçmeye yarayan bir yöntemdir. Tam olarak çeĢitlendirilmiĢ bir portföy sistematik olmayan risk içermez, çeĢitleme ölçütü sıfır (0) olacaktır. Pozitif bir değer, fonun ekstra getiri sağlaması için fon için gereken çeĢitlendirme eksikliğini belirtmektedir. ÇeĢitlendirme Ģu Ģekilde formüle edilebilir 47: ÇeĢitlendirme = R f Rm Rf i Rf Rm Rf i m 46 47 Suat TEKER, Emre KARAKURUM, Osman TAV, a.g.m., s.96. Farid ABDERREZAK, The Performance of Islamic Equity Funds A Comparison to Conventional, Islamic and Ethical Benchmarks, Maastricht Univ., Master Thesis, 2008, s. 30. 27 Rf = Aylık ortalama risksiz faiz oranı, Rm = Piyasanın ortalama getirisi, i = i fonunun standart sapması, m = piyasanın standart sapması, i = i fonunun beta katsayısı. Seçicilik, bir portföyde sermaye varlıklarını fiyatlama modelinin beklenen getirisi üzerinde ekstra bir getiri sağlamak için fon yöneticisinin becerisini tahmin eder. Sonucun pozitif olması, fon yöneticisinin iyi hisse senedi seçme becerisi olduğunu gösterir. Seçicilik ölçütü aĢağıdaki gibi gösterilebilir 48: Seçicilik = Ri 48 Rf ABDERREZAK, a.g.t., s. 30. i Rm Rf = Jensen performans ölçütü. 28 ÜÇÜNCÜ BÖLÜM 3.Veri Madenciliği Veri madenciliği büyük veri setlerindeki değiĢkenler arasında önemli iliĢkileri araĢtıran ve farklı disiplinlerce kullanılan bir süreçtir 49. Veri madenciliği, büyük veritabanlarında gizlenmiĢ bilgilerin çıkarımı olarak da tanımlanabilir. Bu yöntem iĢletmelerin veri depolarındaki en önemli bilgilerine odaklanmalarını sağlayan yeni bir süreçtir. Veri madenciliği araçları gelecekteki davranıĢ ve trendleri tahmin ederek iĢletmelerin etkin kararlar almalarında büyük rol oynar. Aynı zamanda bu araçlar, çözümü çok zaman gerektiren iĢletme sorunlarına da yanıt bulabilmektedir 50. Veri madenciliği; veri ambarlarındaki çeĢitli verileri kullanarak yeni bilgileri ortaya çıkarmak ve bu bilgileri karar verme ve uygulama aĢamasında kullanma sürecidir. Veri Madenciliği kendi baĢına bir çözüm üretmemekte, ancak çözüm için gerekli bilgileri sağlamakta ve karar verme aĢamasında yardımcı olmaktadır 51. Veri madenciliği istatistiğin kullanıldığı bir yöntemdir. Bu nedenle iĢletmelerde geniĢ bir kullanım alanı bulunmaktadır. Veri madenciliğinin amacıyla istatistiğin amacı aynı doğrultuda yer almaktadır. Ġstatistik verilerin toplanması, sınıflandırılması, özetlenmesi, grafik ve tablolarla sunulması, analiz edilerek ana kütle hakkında anlamlı bilgiler elde edilmesi ve yorumlar yapılmasıdır. Bir baĢka ifadeyle;”verilerden yeni bilgiye ulaĢmak” anlamına gelmektedir. Her iki teknikte de temel unsurlar veri ve bilgidir 52. 49 ġenol Zafer ERDOĞAN, Mehpare TĠMOR, A Data Mining Application in a Student Database, Journal of Aeronautics and Space Technologies, Vol. 2, N. 2, 2005, s. 53. 50 K. THEARLING, An Introduction to Data Mining, http://thearling.com/text/dmwhite/dmwhite.htm, (15.08.2008) 51 ġule ÖZMEN, ĠĢ Hayatı Veri Madenciliği Ġle Ġstatistik Uygulamalarını Yeniden KeĢfediyor, http://idari.cu.edu.tr/sempozyum/bil38.htm, (01.012008) 52 ÖZMEN, a.g.e. 29 Veri bulundurarak madenciliğinin gelecekteki amacı, olası geçmiĢte davranıĢların yapılan çalıĢmaları tahminine yönelik göz önünde karar verme mekanizmaları yaratmaktır. Veri madenciliği, William Frawley ve Gregory PiatetskyShapiro tarafından, “Verideki gizli, önceden bilinmeyen ve potansiyel olarak faydalı enformasyonun önemsiz olmayanlarının açığa çıkarılması” biçiminde tanımlanmıĢtır 53. Veri Madenciliğinin Ortaya Çıkışı Veri madenciliği teknikleri uzun bir araĢtırma ve ürün geliĢtirme sürecinin sonucunda ortaya çıkmıĢtır. Bu geliĢim iĢletme verilerinin ilk olarak bilgisayarlara depolanmasıyla baĢlamıĢ, veri giriĢlerinin geliĢimiyle devam etmiĢtir ve veri madenciliği günümüzde de kullanıcılara verilerini yönetme olanağı sağlayan bir süreç haline gelmiĢtir. Veri madenciliği günümüzde iĢletmeler tarafından uygulanabilecek bir yöntemdir, çünkü yeterince geliĢmiĢ 3 teknoloji; Büyük miktarda veri toplama, Güçlü çok iĢlemci bilgisayarlar, Veri Madenciliği Algoritmaları, tarafından desteklenmektedir 54. 53 Nermin ÖZGÜLBAġ, A. Serhan KOYUNCUGĠL, a.g.m., http://www.finansbilim.com/ufs2006/Makaleler/IMKBDEISLEMGOREN.pdf, (01.01.2008) 54 K. THEARLING, a.g.m. 30 Kullanıcının bakıĢ açısından veri madenciliğinin tarihi geliĢim süreci dört adımda incelenebilir 55. Bu dört adım çizelge 3.1‟deki gibidir. Çizelge 3.1 Veri Madenciliğinin Kullanım Süreci Gelişim Adımı İşletme Sorusu Ürün Teknolojiler Özellikler Sağlayıcılar 1. ADIM Veri Toplama (1960‟lı yıllar) “Son beĢ yıldaki toplam gelirim Bilgisayarlar, GeçmiĢe ait, IBM, CDC diskler statik veri ne?” 2. ADIM Veri GiriĢi (1980‟li yıllar) dağıtımı “Geçen Martta Ġngiltere‟deki satıĢ miktarı ne?” Ġlgili veri Oracle, Sybase, Kayıt tabanları Informix, IBM, seviyesinde Microsoft geçmiĢe ait, (RDMBS, SQL,ODBC) dinamik veri dağıtımı 3. ADIM 4. ADIM Veri Depolama “Geçen Martta Çok boyutlu Pilot, Comshare, Farklı ve Karar Ġngiltere‟deki veri tabanları, Arbor, Cognos, seviyelerde Destekleme satıĢ miktarı ne? veri depoları Microstrategy geçmiĢe ait, (1990‟lı yıllar) Boston‟u geçti dinamik veri mi?” dağıtımı Veri “Gelecek ay GeliĢmiĢ Madenciliği Boston‟daki algoritmalar, (Günümüzde satıĢ miktarı ne çoklu iĢlemci GeliĢmekte) olabilir? bilgisayarlar, Neden?” büyük veri Pilot, Lockheed, IBM, SGI Muhtemel ve etkin veri dağıtımı tabanları Kaynak: K. THEARLING, An Introduction http://thearling.com/text/dmwhite/dmwhite.htm 55 K. THEARLING, a.g.m., to Data Mining, 31 3.1. Veri Madenciliği Süreci Veri madenciliği süreçlerinden en yaygın olarak kullanılanı, VM araçlarını satan firmalardan bazılarının ve VM uygulamalarını iĢletme faaliyetlerine uyarlayan ilk kuruluĢların oluĢturduğu bir konsorsiyum tarafından geliĢtirilen CRISP-DM (Çapraz Endüstri Veri Madenciliği Standart Süreci)‟dir. Daimler-Chrysler (sonradan DaimlerBenz AG, Almanya), NCR Sistem Mühendisliği Kopenhag (Danimarka), SPSS (England) ve OHRA Verzegeringen en Bank Groep B.V (Hollanda) isimli firmalar CRISP-DM‟i (Çapraz Endüstri Veri Madenciliği Standart Süreci) geliĢtirmiĢlerdir. CRISP-DM, bilgi keĢfi için veri madenciliğinin temel adımlarını tanımlayan kademeli bir süreçtir. Bu sürecin adımları; 1. İşin Kavranması – iĢletme açısından amaçları anlama ve bu bilgiyi bir VM problemine dönüĢtürme, 2. Verinin Kavranması – veri kalitesini belirleme, verinin ilk kez anlaĢılmasının keĢfi için veri toplamayla baĢlama, 3. Verinin Hazırlanması – son veri setini oluĢturmak için tüm faaliyetlerin kapsama alınması, 4. Modelleme – değiĢik modelleme tekniklerinin seçilip, uygulanması ve ayarlanması, 5. Değerleme – Modelin kalitesinin değerlendirilmesi, 6. Yayılım – Karar verme sürecine yardım etmek için “güncel” bir model organizasyonda uygulanması, adımlarından oluĢur56. 56 Irma B. FERNANDEZ, , Stelios H. ZANAKIS, Steven WALCZAK, “ Knowledge Discovery Techniques for Predicting Country Investment Risk” Computers& Industrial Engineering, No: 43, 2002, s. 788-790. 32 CRISP-DM, veri madenciliğinin temel adımlarını tanımlayan bir süreçtir. Bu sürecin adımları ġekil 3.1.‟de gösterilmiĢtir. Şekil 3.1. CRISP-DM Veri Madenciliği Süreci Kaynak: A. Serhan KOYUNCUGİL, Bulanık Veri Madenciliği ve Sermaye Piyasalarına Uygulanması, Ankara Üni., FBE, İstatistik Anabilim Dalı, Doktora Tezi, 2006, s. 52. 3.1.1.İşin Kavranması Veri Madenciliği sürecinin ilk aĢaması olan iĢin kavranması; Bir iĢletmenin bakıĢ açısından proje amaçlarının anlaĢılması ve amaçlara ulaĢabilmek için bu bilginin bir baĢlangıç planına ve veri madenciliği problem tanımına dönüĢtürülmesidir 57. 57 Irma B. FERNANDEZ, , Stelios H. ZANAKIS, Steven WALCZAK, a.g.m., s. 790. 33 3.1.2. Verinin Kavranması Veri Madenciliğinin ikinci adımı verinin kavranmasıdır. Veriyi kavrama safhası veri toplanması ile baĢlar ve veri kalitesi sorunlarını tanımlamak, verinin ilk kavranıĢını keĢfetmek ya da gizli bilgilere ulaĢmak için ilginç alt kümeler ortaya çıkarma amaçlı faaliyetlerle devam eder 58. Ayrıca bu adımda veri kalitesi belirlenir ve veri içerisindeki ilk anlayıĢlar ortaya çıkarılır. ĠĢin kavranması ve verinin kavranması arasında çok yakın bir bağlantı bulunmaktadır. VM probleminin formülasyonu ve proje planı en azından var olan verinin kavranmasını gerektirir 59. 3.1.3. Verinin Hazırlanması Veri madenciliğinde üçüncü adım verinin hazırlanmasıdır. Veri hazırlama; veri temizleme, veri dönüĢümü ve özellik seçimi Ģeklinde gerçekleĢtirilir. Veri temizleme iĢleminin amacı, veriler içindeki uygun olmayan veya hatalı girilmiĢ verileri ayıklamaktır. Bu iĢleme örnek olarak; eksik verilerin o alandaki verilerin ortalaması ile doldurulması ve sayısal alanlardaki bilginin normal dağılıma uyduğunun farz edilerek normal dağılım dıĢında değere sahip olan kayıtların silinmesi gösterilebilir 60. Veri temizlendikten sonra, elimizdeki kaynak veri farklı formatlara veya değerlere dönüĢtürülmektir. Örneğin, bazı veri madenciliği algoritmaları sadece sayısal veriler üzerinde çalıĢmaktadırlar. Bu durumda eldeki sözel verilerin sayısal veriye dönüĢtürülmesi gerekmektedir. Özellik seçimi ise bir değeri tahmin etmede etkin parametrelerin belirlenmesini amaçlamaktadır. Örneğin, bir değeri tahmin etmek için çok fazla sayıda özellik belirlenmiĢ olabilir. Bütün belirlenen bilgileri toplamak her zaman kolay değildir. Bu durumda etkin özellikler belirlenerek bilgilerin kolay ve hızlı toplanması sağlanabilir. 58 Rüdiger WIRTH, Jochen HIPP, “CRIPS-DM : Towards a Standard Process Model for Data Mining”, http://sunwww.informatik.uni-tuebingen.de/forschung/papers/padd00.pdf, (01.01.2008) 59 Rüdiger WIRTH, Jochen HIPP, a.g.m. , 2008. 60 FERNANDEZ, ZANAKĠS, WALCZAK, a.g.m. , s. 790. 34 3.1.4. Modelleme Bu aĢamada daha önce hazırlanmıĢ olan veriler kullanılarak modelleme gerçekleĢtirilir. Modelleme Ģu adımları içermektedir 61: a. Veriye uygun hale getirilmeye çalıĢılan modelin seçimi, b. Veriyle ilgili farklı modelleri değerlendiren fonksiyonların seçimi, c. Sonuç fonksiyonunu optimize etmek için algoritmaların ve hesaplama metotlarının belirtilmesi. Bu bileĢenler kullanılacak veri madenciliği algoritmasını belirlemek için birleĢtirilir. Bu bileĢenler belirli bir algoritmada önceden de derlenebilirler. Diğer bir ifade ile veri analizi açısından yüksek kaliteye sahip görünen bir ya da daha fazla model oluĢturulur. 3.1.5. Değerlendirme Modelin yayılma aĢamasına geçmeden önce iĢletmenin amaçlarını tam olarak gerçekleĢtirdiğinden emin olmak için modelin eksiksiz bir Ģekilde değerlendirilmesi ve modeli gerçekleĢtirmek için oluĢturulan adımların gözden geçirilmesi önemli bir adımdır. Temel amaç, yeteri derecede dikkate alınmayan bir iĢletme sorununun olup olmadığını belirlemektir. Bu evrenin sonunda veri madenciliği sonuçlarının kullanımıyla ilgili bir karara ulaĢılabilir 62. Değerlendirme aĢamasında kullanılabilecek çeĢitli araçlar mevcuttur. Örneğin, tahmine yönelik sayısal veriler varsa ve kullanılan modelin doğruluğu test edilmek isteniyorsa MAPE (Mean Absolute Percentage Error) veya R2 (Belirlilik Katsayısı) kullanılabilir 63. 61 Padhraic SMYTH, Breaking Out of the Black Box: Research Challenges in Data Mining, http://www.cs.cornell.edu/johannes/papers/dmkd2001-papers/p2_smythe.pdf, (30.10.2008) 62 WIRTH, HIPP, a.g.m. 63 FERNANDEZ, ZANAKĠS, WALCZAK, a.g.m. , s. 790. 35 3.1.6. Yayılım Modelin oluĢturulması çoğunlukla projenin sonu anlamına gelmemektedir. Genellikle elde edilen bilginin müĢterinin kullanabileceği Ģekilde düzenlenmesi ve sunulması gerekir. Ġhtiyaçlara bağlı olarak bir rapor oluĢturma kadar basit ya da tekrar edebilen bir veri madenciliği sürecini uygulamak kadar karmaĢık olabilir. Bir çok durumda yayılma adımlarını gerçekleĢtirecek olan bir veri analisti değil, kullanıcı olacaktır. OluĢturulan modellerin gerçek anlamda kullanılabilmesi için hangi iĢlemlerin gerçekleĢtirilmesi gerektiğini kavramak önemlidir 64. 3.2. Veri Madenciliği Teknikleri Veri madenciliğinde kullanılan modeller tahmin edici ve tanımlayıcı modeller olmak üzere ikiye ayrılır. Tahmin edici modellerde amaç, sonuçları bilinen verileri kullanarak bir model geliĢtirmek ve bu model yardımıyla sonuçları bilinmeyen veri kümeleri ile sonuçların tahmin edilmesini sağlamaktır. Örneğin; bir banka daha önceden verdiği kredilerin ödenme durumlarını inceleyerek (sonuçları bilinen veriler), müĢteri tiplerine göre vereceği kredilerin sonuçlarını tahmin edebilir. Bu sayede baĢvuru yapan müĢterilerin nasıl davranacakları tahmin edilebilir. Modelin bir diğer kullanım yeri de veri tabanındaki boĢ alanların diğer alanlar ve eski kayıtlar kullanılarak tahmin edilmesidir 65. Sınıflama (classification), gerileme (regression) ve sapma (deviation) madenciliği tahmin edici tekniklerin bazılarıdır. Tanımlayıcı modellerde ise amaç; karar vermeye yardım edebilecek mevcut verilerin tanımlanmasını sağlamaktır. Kümeleme (clustering), birliktelik kuralı (association rule) ve ardıĢıl örüntü (sequential pattern) madenciliği tanımlayıcı tekniklerden bazılarıdır 66. 64 WIRTH, HIPP, a.g.m. Emrah YILMAZ, Kütahya İlinde Sosyal Sınıfların Belirlenmesi ve Veri Madenciliği İle Tüketici Profilinin Çıkarılmasına Yönelik Bir Uygulama, Dumlupınar Üni. Sosyal Bil. Ens. Yüksek Lisans Tezi, Kütahya, 2006, s.91. 66 F. CEMAL ÖZÇAKIR,, Müşteri İşlemlerindeki Birlikteliklerin Belirlenmesinde Veri Madenciliği Uygulaması, Marmara Üni. Fen Bil. Ens. Yüksek Lisans Tezi, Ġstanbul, 2006, s.15. 65 36 3.2.1. Kümeleme Kümeleme analizi, benzer özelliklere sahip bireylerin belirlenip gruplandığı çok değiĢkenli bir çözümleme tekniğidir. Kümeleme analizi sayesinde dağılımdaki yoğun ve seyrek alanlar belirlenebilir ve farklı dağılım örnekleri uygulanabilir 67 Kümeleme analizi benzer nesnelerin aynı grupta toplanması olarak da tanımlanabilir. Bu modelde dikkat edilmesi gereken unsur, hangi kriterleri kullanarak kümeleme yapılacağıdır. Bu iĢlemler konunun uzmanı olan kiĢiler tarafından tahmin edilir. Veriler kümeleme iĢleminde aynı sınıfta ya da farklı gruplarda yer alabilir. Genellikle nüfus bilimi ve astronomi alanında kullanılmaktadırlar 68. Veri tabanlarında toplanan veri miktarındaki artıĢla, kümeleme analizi son zamanlarda veri madenciliği araĢtırmalarında aktif bir konu haline gelmiĢtir 69. Kümeleme tekniği çok sayıda kayıt içeren veritabanlarında iyi bir Ģekilde uygulanabilir. Bu tür veritabanlarında her bir kayıt belirli bir grupta bir üye olarak sunulur. Kümeleme algoritması aynı gruplara uyan tüm üyeleri bulur. Bu üyeler içerisinde herhangi bir gruba uymayan üyeler de olabilir. Bu üyeler gürültü olarak nitelendirilir. Gürültüler kümeleme algoritmasının gücü açısından önemlidir. Örneğin veritabanında bir sigorta Ģirketinin müĢteri bilgileri tutulduğunu varsayılsın ve benzer davranıĢlara göre bu müĢteriler kümelenecek olsun. Bir gürültü farklı davranıĢlar gösteren bir müĢteriyi belirtecektir. Bu gibi bir durumda örneğin Ģirkete karĢı yapılabilecek olası bir dolandırıcılık giriĢimi gizlenebilir ve daha ileride araĢtırılmaya gerek duyulabilir. Bu aĢamada kümeleme dolandırıcılık tespiti yapmak için kullanılabilir 70. 67 68 69 70 ġenol Zafer ERDOĞAN, Mehpare TĠMOR, a.g.m., s. 53. Ersin KAYA, Mustafa BULUN, Ahmet ARSLAN, Tıpta Veri Ambarları OluĢturma ve Veri Madenciliği Uygulamaları, http://ab.org.tr/ab03/tammetin/96.doc, (01.07.2008) Mevlüt UYAN, Tayfun ÇAY, Mekansal Uygulamalar için Veri Madenciliği YaklaĢımı, http://www.uzalcbs2008.org/pdf/77.pdf, (01.10.2008) Emine TUĞ, Genetik Algoritmalar ile Tıbbi Veri Madenciliği, Selçuk Üni. FBE, YayınlanmamıĢ Yüksek Lisans Tezi, 2005, s.30. 37 3.2.2. Birliktelik Kuralı Birliktelik kurallarının amacı, büyük veri kümeleri arasından birliktelik iliĢkilerini bulmaktır. Depolanan verilerin sürekli artması nedeniyle Ģirketler, veritabanlarındaki birliktelik kurallarını ortaya çıkarmak isterler. Büyük miktarda depolanan verilerden değiĢik birliktelik iliĢkileri bulmak, Ģirketlerin karar alma süreçlerini olumlu etkilemektedir. Birliktelik kuralları için verilebilecek örnek market sepeti uygulamasıdır. Bu kural, müĢterilerin satın alma alıĢkanlıklarını analiz etmek için, müĢterilerin satın aldıkları ürünler arasındaki iliĢkileri bulur. Bu tür iliĢkilerin analizi sonucunda, müĢterilerin satın alma davranıĢları öğrenilebilir ve yöneticiler de öğrenilen bilgiler sonucunda daha etkili satıĢ stratejileri geliĢtirebilirler. Örneğin bir müĢterinin süt ile birlikte ekmek satın alma olasılığı nedir? Elde edilen müĢteri bilgilerine dayanarak rafları düzenleyen market yöneticileri ürünlerindeki satıĢ oranlarını arttırabilirler. Örneğin bir marketin müĢterilerinin sütün yanında ekmek satın alma oranı yüksekse, market yöneticileri süt ile ekmek raflarını yan yana koyarak ekmek satıĢlarını arttırabilirler 71. Sepet analizi farklı ürünlerin satılması, mağazanın düzenlemesi, ürün kataloglarının düzenlenmesi ve promosyon çalıĢmalarında kullanılabilir. Sepet analizi modeli çok kullanılıĢlı olmasına rağmen yorumlanırken bazı problemler ortaya çıkabilmektedir. Örneğin bir mağazadan ekmek alanların %30‟unun süt aldığının bilinmesi önemli bir bilgidir. Eğer bu mağazada yapılan toplam alıĢveriĢlerin %30'unun süt olduğuna dikkat edilirse bu bağlantının tamamen rastlantısal olduğu anlaĢılabilir. Hatta eğer toplam alıĢveriĢlerin %50'sini süt oluĢturuyorsa, bu iki ürünün birbirleriyle birlikte alınmadıkları sonucuna bile ulaĢılabilir. Günümüzde yapılan sepet analizi araĢtırmalarının çoğunda bu rastlantısal iliĢkiler dikkate alınmadan sonuçlar çıkartılmaktadır 72. 71 Serhat ÖZEKES, Veri Madenciliği Modelleri ve Uygulama Alanları, İstanbul Ticaret Üni. Dergisi, s. 76. 72 Emrah YILMAZ, a.g.t., s. 94. 38 3.2.3. Sınıflama ve Regresyon Sınıflama ve regresyon, önemli veri sınıflarını belirten ve gelecekteki veri sonuçlarını tahmin eden modeller kuran veri analiz yöntemleridir. Sınıflama kategorik değerlerin, regresyon ise süreklilik gösteren değerlerin tahmininde kullanılır 73. Sınıflama kuralı üç adımdan oluĢur 74: Adım 1: Bulunan model eğitim veri kümesine dayanır. Eğitim kümesini oluĢturan verilere eğitim veri kümesi denir. Bunlar tüm veri seti üzerinden rastgele seçilirler. Adım 2: Eğitim veri seti sonucunda bulunan model sınıflama için kullanılır. Bulunan modele dayanılarak modelin tahmin gücü belirlenir. Deney veri kümesi seti de tüm veri seti içerisinden rastgele seçilir. Adım 3: Eğer test veri seti üzerinde yapılan denemeler sonucunda modelin doğruluğu yeterli görülürse, bulunan model yeni sonuçları bulmakta kullanılır. Sınıflama modelinde kullanılan baĢlıca teknikler Ģunlardır: 1. Karar Ağaçları 2. Yapay Sinir Ağları 3. Genetik Algoritmalar 4. Tahminleme Modelleri 3.2.3.1 Karar Ağaçları Karar ağaçları kuruluĢlarının ucuz olması, kolay yorumlanabilmeleri, veri tabanı sistemleri ile kolayca entegre edilebilmeleri nedenleri ile veri madenciliği sınıflama modelleri içerisinde en yaygın kullanılan tekniktir. Karar ağaçları tahmin etmede kullanılan bir tekniktir. Karar ağaçları aynı zamanda kural çıkarma algoritmalarıdır. Bu 73 74 ÖZEKES, a.g.m., s. 68. YILMAZ, a.g.t., s. 96-97. 39 algoritmalar bir veri kümesinden kullanıcıların çok kolay anlayabileceği “eğerdoğruysa” (IF-THEN) türündeki kuralları bir ağaç yapısında türetebilirler 75. Ağacın her dalı bir kural ve yaprakları da bu kuralın sağlanması durumunda dahil olunacak sınıfı gösterir. Karar ağaçları kolayca anlaĢılabilir kurallar çıkarması nedeniyle çok kullanılan bir tekniktir. Bu teknikte dikkat edilmesi gereken nokta; ağacın tek bir kayıt kalana kadar büyümesidir. Bu durumdan kuralları oluĢturma sırasında çok fazla zaman gerektireceği için mümkün olduğunca kaçınılmalıdır 76. Ağaç ile ilgili temel özellikleri; • Verinin herhangi bir kayba yol açmadan her bir dala ayrılabilmesi, • Modelin nasıl yapılandırıldığının çok kolay anlaĢılması, (Sinir ağları veya standart istatistik modellerinin tersine). • OluĢturulan modelin kolayca kullanılması, ayrıca bazı sezgilerin de modelde yapılandırılmasının mümkün olması, • Karar ağaçlarının iç içe geçmiĢ eğer / doğruysa (if / then) kurallarının dizisi olması, görsel olması nedeniyle oldukça kolay anlaĢılması ve aynı zamanda kolaylıkla SQL sorgusuna dönüĢtürülebilir olması, • DeğiĢken tiplerine göre, farklı yöntemler kullanılabilmesi Ģeklinde sıralanmaktadır 77. Son yıllarda çok sayıda karar ağacı öğrenim metodu geliĢtirilmiĢtir ve kredi baĢvurularında risk değerlendirmesi gibi bankacılık uygulamalarında baĢarılı olarak kullanılmaktadır. Her bir karar ağacı insanın okuyabileceği eğer-doğruysa kuralıdır 78. GeliĢtirilen karar ağaçları yöntemleri kredi baĢvuruları, risk değerlendirmesi gibi uygulamalarda sıklıkla kullanılmaktadır. En sık kullanıma sahip karar ağacı modelleri 75 Mevlüt UYAN, Tayfun ÇAY,a.g.e. ÖZGÜLBAġ, KOYUNCUGĠL, a.g.m., s.5. 77 Ali Serhan KOYUNCUGĠL, Bulanık Veri Madenciliği ve Sermaye Piyasalarına Uygulanması, Ankara Üni. , FBE, Ġstatistik Anabilim Dalı, YayınlanmamıĢ Doktora Tezi, Ankara, 2006, s. 71. 78 a.g.t. , s. 72. 76 40 ID3 ve daha geliĢmiĢ modeli C4.5, Sınıflandırma ve Regresyon Ağaçları (Classification and Regression Trees-CART) ve Otomatik Ki-kare EtkileĢim KeĢfedicisi (Dedektörü)OKEK(D)(Chi-Square Automatic Interaction Detector- CHAID) dir 79. CHAID ile diğer yöntemler arasındaki en önemli farklılıklarından birisi, ağaç türetim biçimidir. ID3, C4.5 ve CART ikili ağaçlar türetirken, CHAID ikili olmayan çoklu ağaçlar türetir. CHAID sayısal ve sözel tüm değiĢken tipleriyle çalıĢabilmektedir. Bununla beraber, sayısal tahmin edici değiĢkenler otomatik olarak analizin amacına uygun olarak sınıflandırılmaktadır. CHAID, Ki-Kare yöntemi vasıtasıyla, ilgi düzeyine göre farklılık içeren grupları ayrı ayrı sınıflamaktadır. Dolayısıyla, ağacın yaprakları, ikili değil, verideki farklı yapı sayısı kadar dallanmaktadır 80. 3.2.3.2. Yapay Sinir Ağları Bu yöntem, belirli bir profile uyuĢması için kalıp düzenlerini kontrol etmektedir ve bu süreç içerisinde belli bir öğrenme faaliyeti gerçekleĢtirerek sistemi geliĢtirmektedir. Yapay sinir ağlarında kullanılan öğrenme algoritmaları, veriden üniteler arasındaki bağlantı ağırlıklarını hesaplar. Yapay Sinir Ağları istatistiksel yöntemler gibi veri hakkında parametrik bir model varsaymaz yani uygulama alanı daha geniĢtir ve bellek tabanlı yöntemler kadar yüksek iĢlem ve bellek gerektirmez 81. YSA (Yapay Sinir Ağı), insan beyninin çalıĢma ilkelerinden ilham alınarak geliĢtirilmiĢ, ağırlıklı bağlantılar denilen tek yönlü iletiĢim kanalları vasıtası ile birbirleriyle haberleĢen, her biri kendi hafızasına sahip birçok iĢlem elemanından (nöronlardan) oluĢan paralel ve dağıtık bilgi iĢleme yapılarıdır. YSA‟lar gerçek dünyaya ait iliĢkileri tanıyabilir, sınıflandırma, kestirim ve iĢlev uydurma gibi görevleri yerine getirebilirler. Desen tanıma (Pattern recognition) tekniğinin gerekliliği, gerçek dünya ile 79 ÖZGÜLBAġ, KOYUNCUGĠL, a.g.m. , s.6. a.g.m., s. 6. 81 Kaan YARALIOĞLU, Veri Madenciliği, http://www.deu.edu.tr/userweb/k.yaralioglu/dosyalar/ver_mad.doc, (31.11.2007) 80 41 bilgisayar iliĢkisinin baĢlaması ile ortaya çıkmıĢtır. Bu durum YSA‟nın çok güçlü örnek tanıma tekniği olarak ortaya çıkmasına ve geliĢmesine neden olmuĢtur82. Yapı kurulduktan sonra sinir ağacının eğitilmesine sıra gelir. GiriĢ verileri verilir ve çıkıĢ değeri alınır. Bu değer gerçek değer ile karsılaĢtırılır ve ağın içerisindeki nöron fonksiyonlarının bu sonuçtaki hata miktarına göre ayarlanması sağlanır. Bu Ģekilde birçok değer ağa verilir ve ağın elimizdeki verinin yapısını öğrenmesi sağlanır. Öğrenme iĢlemi tamamlandıktan sonra sinir ağımız kullanıma hazır hale gelir 83. 3.2.3.3. Genetik Algoritmalar Diğer veri madenciliği algoritmalarını geliĢtirmek için kullanılan optimizasyon teknikleridir. Sonuç model veriye uygulanarak gizli kalmıĢ kalıpları ortaya çıkarılmakta ve bu sayede tahminler yapılabilmektedir. Doğrudan postalama, risk analizi ve perakende analizlerinde kullanılabilir 84. Genetik algoritma konusuna bir sonraki bölümde geniĢ olarak yer verilecektir. 3.2.3.4. Tahminleme Modelleri Bu madencilik fonksiyonu bir nesneler kümesinin belirli özelliklerinin değer dağılımını veya bazı eksik verilerin muhtemel değerlerini tahmin eder. Ġlgi özelliğine bağlı özellikler kümesini bulmayı (örneğin, bazı istatistiksel analizler) ve seçilen nesne(ler) benzer veri kümesine dayalı veri dağılımını tahmin etmeyi içerir. Örneğin, bir çalıĢanın potansiyel maaĢı Ģirketteki benzer çalıĢanların maaĢ dağılımına dayalı olarak tahmin edebilir. Genellikle regresyon analizi, genelleĢtirilmiĢ lineer model, korelasyon analizi ve karar ağaçları kalite tahmininde yararlı olacaktır. Genetik algoritmalar ve sinir ağı modelleri de tahminde popüler olarak kullanılır. Tahmin yöntemlerine85: • Doğrusal regresyon, 82 O. Ayhan ERDEM, Emre UZUN, Yapay Sinir Ağları ile Türkçe Times New Roman, Arial ve Elyazısı Karakterleri Tanıma, Gazi Üniv. Müh. Mim. Fak. Der., Cilt 20, No 1, 2005, s.13. 83 YILMAZ, a.g.t., s. 104. 84 YARALIOĞLU, a.g.m. 85 YILMAZ, a.g.t., s. 104-105. 42 • Doğrusal olmayan regresyon, • GenelleĢtirilmiĢ doğrusal regresyon, • Lojistik regresyon, örnek olarak gösterilebilir. 3.2.3.5. Zaman Serilerindeki Örüntü Zaman serilerindeki örüntü, belirli bir süreçte belli sıklıkta gerçekleĢen olayları ifade etmektedir. Belli sıklıkla tekrarlanan bu olaylar zaman serileriyle yapılan veri madenciliği algoritmaları kullanılarak bulunabilir. Örneğin, her yıl yaz mevsiminin baĢlangıcından sonbahara kadar geçen zaman içinde güneĢ kremi ve güneĢ yağı alımlarında artıĢ olması her yıl belli zaman aralığında tekrarlanan bir örüntüyü temsil etmektedir 86. 3.3. Veri Madenciliğinin Uygulama Alanları Veri madenciliği hem özel hem de kamu iĢletmelerinde farklı amaçlarla kullanılabilmektedir. Bankacılık, sigortacılık, ilaç sanayi ve perakende sektörü maliyetleri azaltmak ve satıĢları artırmak amacıyla veri madenciliğini kullanmaktadırlar. Örneğin sigortacılık ve bankacılık sektörü veri madenciliği uygulamalarını risk değerlemesine yardımcı olması ve sahtekarlıkları ortaya çıkarmak amacıyla kullanırlar. Uzun yıllar boyunca toplanan müĢteri verileri kullanılarak, iĢletmeler bir müĢterinin kredi riskini tahmin eden modeller geliĢtirebilirler. Ġlaç sanayi bazen bir ilacın etkinliğini tahmin etmede veri madenciliğini kullanabilir 87. Veri Madenciliğinin bazı uygulama alanları Ģu Ģekilde özetlenebilir 88: Bilimsel ve mühendislik verileri: Günümüzde çok sayıda bilimsel veri üretilmektedir. Veri Madenciliği bu verilerin anlamlı bir hale getirilebilmesini sağlamaktadır. Buna örnek olarak; çimento deneylerinde elde edilen verilerden 86 ÖZÇAKIR, a.g.t., s. 18. Jeffrey W. SEIFERT, Data Mining: An Overview, CRS Report for Congress, 2004, s.3. 88 Adil BAYKASOĞLU, Veri Madenciliği ve Çimento Sektöründe Bir http://ab.org.tr/ab05/tammetin/171.pdf, (30.11.2007) 87 Uygulama, 43 mukavemet analizi, üretim sistemlerinin benzetiminden elde edilen verilerden sistem performansını etkileyen faktörlerin elde edilmesi, deprem verilerinin analizi ile deprem ve etkilerinin tahmini, kalite kontrol uygulamaları verilebilir. Sağlık verileri: Veri madenciliği sağlık alanında da sıklıkla uygulanmaktadır. Veri madenciliğinin sağlık alanında kullanılmasına; yapılan testlerinden elde edilen sonuçları kullanarak çeĢitli kanserlerin ön tanısının konulması, kalp krizi riskinin tespiti örnek olarak verilebilir. İş verileri: ĠĢ süreçleri boyunca çok sayıda veri üretilir. Bu veriler yönetimin her kademesinde karar verme aĢamasında kullanılabilir. Personele ait verilerin analizi sonucunda çalıĢanların performanslarına etki eden faktörler belirlenebilir ve yeni personel alımında yeni kurallar oluĢturulabilir. MüĢteri veri tabanlarının analizi ile reklam ve promosyon ile ilgili pek çok faydalı bilgiye de ulaĢılabilir. Perakendecilik – marketçilik verileri: Bu alanda en çok kullanılan yöntem sepet analizi yaklaĢımıdır. Sepet analizi yaklaĢımında amaç müĢterilerin satın aldıkları ürünler arasında iliĢkiler kurmak ve bu iliĢkilerden yola çıkarak iĢletmenin satıĢ miktarını ve karını artırmaktır. Bankacılık, finans ve borsa verileri: Bankacılık sektöründe kredi riski tahminlerinde, likidite riskinin değerlendirilmesinde, müĢteri eğilim analizlerinde, kar analizi gibi alanlarda veri madenciliği kullanılmaktadır. Finans ve borsa kuruluĢları ise stok fiyat tahminlerinde, portföy yönetimi gibi alanlarda veri madenciliği yöntemlerini kullanabilirler. Eğitim sektörü verileri: Öğrenci veri tabanlarından elde edilebilecek veriler analiz edilerek öğrencilerin baĢarı ve baĢarısızlık nedenleri, öğrencilerin baĢarılarının arttırılması için neler yapılabileceği, üniversiteye giriĢ puanları ile okul baĢarısı arasındaki iliĢkiler analiz edilerek, eğitim kalitesi artırılabilir. Internet (Web) verileri: Web ortamındaki verilerin sayısı da sürekli ve hızlı bir Ģekilde artmaktadır. Web veri madenciliği, internetten faydalı bilgilerin bulunması olarak tanımlanabilir. Web veri madenciliği birçok web sunucusu veya online servisten 44 kullanıcı taleplerinin analizi için kullanılır. Örneğin, internet üzerinden kitap satan Amazon Ģirketi BookMatcher adlı programıyla müĢterilerin satın alma alıĢkanlıklarını analiz ederek yeni kitap alan müĢterilerine tavsiyede bulunmaktadır. Bu uygulamalara aĢağıdaki alanları da ekleyebiliriz89: Pazarlama : • MüĢterilerin satın alma örüntülerinin (pattern) belirlenmesi, • MüĢterilerin demografik özellikleri arasındaki bağlantıların bulunması, • Posta kampanyalarında cevap verme oranının artırılması, • Mevcut müĢterilerin elde tutulması, yeni müĢterilerin kazanılması, • MüĢteri iliĢkileri yönetimi (Customer Relationship Management), • MüĢteri değerleme (Customer Value Analysis), • SatıĢ tahmini (Sales Forecasting). Bankacılık : Farklı finansal göstergeler arasında gizli korelasyonların bulunması, Kredi kartı dolandırıcılıklarının tespiti, Kredi kartı harcamalarına göre müĢteri gruplarının belirlenmesi, Kredi taleplerinin değerlendirilmesi. Sigortacılık : • Yeni poliçe talep edecek müĢterilerin tahmin edilmesi, • Sigorta dolandırıcılıklarının tespiti, • Riskli müĢteri örüntülerinin belirlenmesi. 89 Haldun AKPINAR, Veri Tabanlarında Bilgi KeĢfi ve Veri Madenciliği, İstanbul Üniversitesi İşletme Fakültesi Dergisi, Cilt:29, Sayı:1, 2000, s. 80-81. 45 Bunların dıĢında da veri madenciliğinin faydalı olabileceği ve kullanılabileceği diğer bazı alanlar; • TaĢımacılık ve ulaĢım, • Turizm ve otelcilik, • Telekomünikasyon, • Belediyeler, Ģeklinde sıralanabilir. 46 DÖRDÜNCÜ BÖLÜM 4. Genetik Algoritmalar GeçmiĢte, araĢtırmacılar problemleri çözerken parametre sayısının artıĢ sorunuyla karĢılaĢmıĢlar ve bu durum problemlerde çözüme ulaĢamamaya ya da elde edilen sonucun yorumlanamamasına neden olmuĢtur. Bu tür problemleri çözebilmek için yeni teknikler bulunmaya çalıĢılmıĢ ve yapay zeka kavramı ortaya çıkmıĢtır. Yapay zeka, insanların düĢünme ve davranma Ģekillerine benzetilmiĢ bir problem çözme modelidir 90. Bu bölümde da yapay zeka tekniklerinden doğal olayları modelleyen bir optimizasyon tekniği olan Genetik Algoritmalar(GA) anlatılacaktır. 4.1. Genetik Algoritma Kavramı Genetik algoritmalar yapay zekanın bir dalı olan evrimsel hesaplama tekniğinin bir parçasıdır ve Darwin‟in evrim teorisinden esinlenerek oluĢturulmuĢtur. John Holland, öğrencileri ve arkadaĢları 1960‟lı yıllarda Rechenberg‟in “Evrim Stratejileri” isimli kitabında bahsettiği evrimsel hesaplama kavramını geliĢtirmiĢlerdir. Holland evrim sürecini kullanarak, bilgisayarlara farklı çözüm tekniklerinin öğretilebileceği fikrini öne sürmüĢtür91. 1960‟lı yılların ortalarında John Holland mutasyon iĢlemine eĢleĢme ve çaprazlama iĢlemlerini eklemiĢ ve doğal seçim problemleri için yeni bir programlama metodu geliĢtirmiĢtir. Bu çalıĢması onun “genetik algoritma”nın kurucusu sayılmasına neden olmuĢtur. Ardından tüm dünyada bu konu üzerinde yeni çalıĢmalar yapılıp geliĢtirilmiĢ ve genetik algoritmalar farklı alanlarda uygulanmaya baĢlanmıĢtır 92. 90 BarıĢ GÜRSU, Melih Cevdet ĠNCE, Genetik Algoritmalar ile Yüksek Gerilim Ġstasyonlarında Optimum Topraklama Ağı Tasarımı, Fırat Üni. , Fen ve Müh. Bil. Der. , 19 (4), 2007, s. 517. 91 Mustafa KURT, Cumali SEMETAY, Genetik Algoritma ve Uygulama Alanları, http://www.mmo.org.tr/muhendismakina/arsiv/2001/ekim/Genetik_Algoritma.htm, (30.05.2008) 92 Hayrettin GENEL, Genetik Algoritmalarla Portföy Optimizasyonu, Ankara Üni. , SBE, ĠĢletme Anabilim Dalı, YayınlanmamıĢ Yüksek Lisans Tezi, Ankara, 2004, s. 24. 47 Evrimsel algoritmalar, evrim yöntemlerini temel alan bilgisayar tabanlı problem çözme ve optimizasyon tekniklerinden oluĢmaktadır. BaĢlıca teknikler; evrimsel algoritma teknikleri, genetik algoritmalar, genetik programlama, evrim stratejileri, sınıflandırma sistemleri ve evrimsel programlama olarak sıralanabilir. Bu tekniklerden en yaygın olarak kullanılan yöntem “genetik algoritmalar”dır 93. Genetik algoritmalar çözüme ulaĢmak için rassal arama tekniklerini kullanır ve değiĢken kodlama esasına dayalı bir tekniktir. Genetik algoritmalar, farklı poblemlere göre doğru parametreler ile çalıĢıldığı takdirde optimuma yakın çözümler verir. Bu noktada amaç, doğal sistemlerin uyum sağlama özelliğini dikkate alarak yapay sistemlerini oluĢturmaktır 94. Bilinen optimizasyon yöntemleri ile çözülemeyen ya da çözümü çok zaman gerektiren problemler için kullanılan GA optimal ya da optimale yakın çözüm vermektedir. BaĢlangıçta doğrusal olmayan optimizasyon problemlerine uygulanan GA sonraları gezgin satıcı, karesel atama, yerleĢim, çizelgeleme, tasarım gibi optimizasyon problemlerinde baĢarıyla uygulanmıĢtır 95. GA, diğer geleneksel yöntemlerden dört temel özelliği ile farklılık 96 göstermektedir : a. GA değiĢkenlerle değil, değiĢkenlerin kodları ile çözüm arar. b. GA çözüm uzayında tek bir noktadan değil, bir noktalar grubu üzerinden arama yaparak en iyiyi sonucu bulmaya çalıĢır. c. GA amaç fonksiyonu (uyum fonksiyonu), kısıtlar gibi temel verileri kullanır, bunların türevleri ya da diğer yardımcı bilgilere ihtiyaç duymaz. d. GA aramayı sebep-sonuç iliĢkileriyle değil, olasılıklı geçiĢ kuralları ile yapar. 93 a.g.t., s. 24. Orhan ENGĠN, Alpaslan FIĞLALI, AkıĢ Tipi Çizelgeme Problemlerinin Genetik Algoritma Yardımı ile Çözümünde Uygun Çaprazlama Operatörünün Belirlenmesi, Doğuş Üni. Dergisi, 2002/6, s. 28. 95 Tuğba SARAÇ, FeriĢtah ÖZÇELĠK, Alternatif Rotaların Varlığında Üretim Hücrelerinin Genetik Algoritma Kullanılarak OluĢturulması, Endüstri Müh. Der., Cilt 17, Sayı 4, s. 26. 96 a.g.m. , s. 27. 94 48 Genetik Algoritmaların Avantajları Genetik algoritmalar, genellikle aĢağıdaki özelliklerden bir ya da daha fazla özelliği taĢıyan karmaĢık problemlerin çözümünde optimal ya da optimale yakın sonuçlar çıkaran etkili optimizasyon teknikleridir. GA‟nın genel olarak avantajları Ģu Ģekilde sıralanabilir 97; Sürekli ve ayrık parametreleri optimize eder, Türevsel bilgiler gerekmez, Maliyet fonksiyonunu geniĢ bir spektrumda araĢtırır, Çok sayıda parametrelerle çalıĢma imkanı vardır, Paralel bilgisayarlar kullanılarak çalıĢtırılabilir, Global optimum değeri bulabilir, Birden fazla parametrenin optimum çözümlerini elde edebilir. 4.2. Genetik Algoritmaların Çalışma Süreci Tipik bir genetik algoritma, genetik algoritmalara özel süreçleri içeren bazı adımlardan oluĢur. Örnek bir genetik algoritmanın çalıĢma adımları aĢağıdaki çizelgede verilmiĢtir. Çizelge 4.1. – Genetik Algoritmaların Çalışma Adımları Sıra No Yapılan İşlem 1 Gösterim (kodlama) yönteminin belirlenmesi 2 BaĢlangıç populasyonunun (ilk nesil) oluĢturulması 3 BaĢlangıç populasyonundaki her bireyin performansının amaç fonksiyonuna göre hesaplanması 97 4 Yeni neslin oluĢturulmasında kullanılacak bireylerin seçilmesi 5 SeçilmiĢ bireylere genetik iĢlemlerin uygulanarak yeni neslin elde edilmesi Mehmed ÇELEBĠ, Genetik Algoritma ile Yağlı Bir Trafonun Maliyet Optimizasyonu, C.B.Ü. Fen Bilimleri Der., 3.1., 2007, s. 42. 49 6 Yeni neslin bireylerinin performanslarının uygunluk fonksiyonuna göre hesaplanması 7 BitiĢ koĢulu sağlanmamıĢsa 4. adıma dönülmesi 8 BitiĢ koĢulu sağlanmıĢsa en iyi bireyin sonuç olarak dönülmesi Tabloda gösterilen genetik algoritma adımları genel olarak verilmiĢtir. Bu adımlar değiĢik problemler için değiĢik Ģekilde uygulanabilir. Ancak her durumda, bu adımlar genetik algoritmaların temel bileĢenlerine dayanmaktadır. 4.2.1. Gösterim (Kodlama) Genetik algoritma uygulamalarında ilk adım kodlamadır. Kodlama safhasında parametreler, problemlerin çözümüne yardımcı bilgileri taĢıyan yapılara (kromozom) kodlanır. Genelde kodlama yapısı 0 ve 1‟lerden oluĢmuĢ ikili dizilerden oluĢur. Kodlanan parametrelerin sıralanması sonucunda kromozomlar elde edilir. Çok boyutlu problemlerin çözümünde ikili kodlama her zaman iĢe yaramayabilir 98. AĢağıda farklı kodlama tiplerine değinilmiĢtir 99: a. İkili Kodlama: Kodlama türlerinin en basit olanıdır. Bu tür kodlamada her kromozom 1,0 değerlerinden oluĢmuĢ dizilerden oluĢur. b. Permütasyon Kodlaması: Bu kodlama türü sıralama problemlerinde sıklıkla kullanılır. Travelling Salesman Problem (TSP) ve iĢ sıralaması (task order) bunlara örnek olabilir. Her kromozom bir sayı dizisidir. c. Değer Kodlama: Daha çok karmaĢık sayılarda kullanılan bir kodlama çeĢitidir. Bu kodlamada her kromozom bir değer dizisidir, özel çarprazlama ve mutasyon gerektirir. 98 A. Pervin AKYOL, Doğrusal Olmayan Ekonometrik Modellerin Genetik Algoritma YaklaĢımı ile Parametre Tahmini, Gazi Üni. SBE, YayınlanmamıĢ Yüksek Lisans Tezi, 2006, s.7. 99 Ufuk OKUYUCU, “Genetik Algoritmalar”, http://www.bilmuh.gyte.edu.tr/BIL523/presentations/ufuk/GenetikAlgoritmalarRapor.doc, (01.01.2008) 50 d. Ağaç Kodlama: Ağaç kodlaması, ifadesel çözümler gerektiren problemlerde kullanılır, her kromozom bir nesnenin ağacıdır. Bu bir fonksiyon ya da bir programlama dilinde yazılmıĢ koddur. Ağaç olarak gösterilebilen çözümler için iyidir, bunun içinde LISP dili iyi bir seçimdir. 4.2.2. Başlangıç Popülasyonunun Oluşturulması BaĢlangıç popülasyonu; problemin çözümü için ilk olarak rastgele oluĢturulan ve içerisinde problemin değiĢkenlerinin kodlarının bulunduğu bir gen havuzudur100. Gen havuzu, kromozomların uygunluklarının kontrol edildiği ve kopyalama iĢleminin yapıldığı yerdir 101. GA‟da ilk adım kromozomların veya çözümlerin baĢlangıç popülasyonlarının oluĢturulmasıdır. Kromozomların popülasyonları rastgele seçilmektedir. Genetik algoritmada kullanılacak popülasyon büyüklüğünün belirlenmesi için net kurallar yoktur. Popülasyon büyüklüğü problemin yapısına göre belirlenmelidir. Genelde bu sayı 100 ile 200 arasındadır. Ancak, popülasyonun büyük olması daha çok çeĢitlilik sağlayarak daha sağlam sonuçlar verirken, genetik algoritmanın çalıĢması için ihtiyaç duyulan kaynak gereksinimini artıracaktır. Genetik algoritmanın çalıĢmasında sonraki adımların daha verimli olabilmesi için, baĢlangıç popülasyonunun olası çözümlerin önemli bir bölümünü kapsayacak Ģekilde farklı çözümler barındıracak kadar geniĢ olması gereklidir 102. 4.2.3. Uyum Değeri BaĢlangıç popülasyonu oluĢturulduktan sonraki ilk adım, popülasyondaki her üyenin uygunluk değerini hesaplama adımıdır. Çözümü aranan her problem için bir uygunluk fonksiyonu mevcuttur. Verilen belirli bir kromozom için uygunluk fonksiyonu, o kromozomun temsil ettiği çözümün kullanımıyla veya yeteneğiyle orantılı olan sayısal bir uygunluk değeri verir. Bu bilgi, 100 Muhammet YAMAN, Genetik Algoritma ile Kardan Mili Tasarımı, Gazi Üni. FBE, YayınlanmamıĢ Yüksek Lisans Tezi, 2007, s. 13. 101 Paki TURĞUT, Abdussamet ARSLAN, Sürekli Bir KiriĢte Maksimum Momentlerin Genetik Algoritmalar ile Belirlenmesi, DEÜ Fen ve Müh. Der., Cilt 3, Sayı 3, 2001, s. 3. 102 Adrian E. DRAKE , Robert E. MARKS, Genetic algorithms in economics and finance: Forecasting stock market prices and foreign exchange- A review, In Shu-Heng Chen (Ed.), Genetic Algorithms and Genetic Programming in Computational Finance, 2000, s. 36. 51 her kuĢakta daha uygun çözümlerin seçiminde yol göstermektedir. Bir çözümün uygunluk değeri ne kadar yüksekse, yaĢama ve çoğalma Ģansı o kadar fazladır ve bir sonraki kuĢakta temsil edilme oranı da o kadar yüksektir 103. 4.2.4. Seçim Seçim, mevcut popülasyondaki hangi bireylerin genetik iĢlemlere tabi tutularak yeni nesillerin oluĢturulmasında kullanılacağını belirler. Mevcut popülasyon içerisinden seçilen bu bireyler yeni neslin ataları olmaktadır. Farklı seçim metotları bulunmaktadır. Bunlardan ilki Holland‟ın adayları bir olasılık dağılımına göre seçtiği yöntemdir. Bir adayın seçilme olasılığı, onun tüm popülasyondaki performansına bağlıdır. Bu sayede daha iyi performans gösteren adaylara seçim için daha büyük bir Ģans verilmiĢ olur. Bu metot rulet tekerleği metodu olarak bilinmektedir, ancak küçük popülasyonlar için uygun değildir 104. 4.2.5. Genetik Operatörler Mevcut popülasyon üzerine uygulanan iĢlemler genetik operatörler olarak adlandırılır. Bu operatörlerin amacı daha iyi özelliğe sahip yeni nesiller üretmek ve arama algoritmasının alanını geniĢletmektir 105. Farklı uygulamalarda farklı operatörler kullanılmakla birlikte genetik algoritmada 2 standart operatör kullanılır. Bu operatörler: -Çaprazlama (Crossover), -Mutasyon (Mutation)„dur. 4.2.5.1. Çaprazlama Çaprazlama operatöründe amaç, iyi uygunluk değerine sahip iki bireyin iyi özelliklerini birleĢtirerek daha iyi sonuçlar elde etmektir. Ancak hangi özelliklerin iyi performans sağladığı bilinmediğinden, özelliklerin takas edilmesi Ģeklinde bir birleĢim 103 104 105 Özgür YENĠAY, “An Overview of Genetic Algorithms”, Anadolu Üniversitesi Bilim ve Teknoloji Dergisi, Cilt: 2, Sayı: 1, 2001, s. 38-39. Robert PEREIRA, Genetic Algorithm Optimisation for Finance and Investment, Latrobe University School of Business Discussion Papers, 2000, s. 5-6. Öznur ĠġÇĠ, Serdar KONUKOĞLU, Genetik Algoritma YaklaĢımı ve Yöneylem AraĢtırmasında Bir Uygulama, Celal Bayar Üni. , Yönetim ve Ekonomi Dergisi, Cilt:10, S. 2, s. 195. 52 rassal olarak gerçekleĢtirilir 106. Çaprazlamada iki çözümün yapıları kullanılarak yeni ve daha iyi bir çözüme ulaĢılmaya çalıĢılır 107. Çaprazlama tek nokta, iki nokta ve üniform çaprazlama olarak sınıflandırılır. Genel olarak küçük popülasyonlar için üniform çaprazlama, büyük popülasyonlar için ise tek ve iki nokta çaprazlama kullanılmaktadır 108. Bu operatörler kısaca Ģu Ģekilde ifade edilebilir 109: Tek Noktalı Çaprazlama Tek noktalı çaprazlama operatörü, bir kromozomdan rastgele bir çaprazlama noktası seçen ve ardından ve iki yeni yavru elde etmek için bu noktada iki ana kromozomu değiĢtiren bir operatördür. (-) imleci rastgele seçilen çaprazlama noktasını belirtmektedir. Ana Kromozom 1 : 11001-010 Ana Kromozom 2 : 00100-111 Çaprazlama noktasında ana kromozomlar değiĢtirildiğinde aĢağıdaki yavrular elde edilir: Yavru 1 : 11001- 111 Yavru 2 : 0100 -010 İki Noktalı Çaprazlama Ġki noktalı çaprazlama operatörü öncelikle bir kromozomda rastgele iki çaprazlama noktası seçer ve ardından iki yeni yavru üretmek için bu noktalar arasında iki ana kromozomu değiĢtirir. Ġki ana kromozomun çaprazlama için seçildiğini varsayalım. (-) imleci rastgele seçilen çaprazlama noktalarını belirtmektedir. 106 Hakan ER, M. Koray ÇETĠN, Emre ĠPEKÇĠ ÇETĠN, Finansta Evrimsel YaklaĢımlar: Genetik Algoritma Uygulamaları, Akdeniz İİBF Der. (10), 2005, s. 76. 107 Öznur ĠġÇĠ, Serdar KORUKOĞLU, a.g.m. , s. 195. 108 Aysun COġKUN, Genetik Algoritma Kullanılarak Kimyasal Maddelerin Deriden Geçiş Katsayılarının ve Molekül Yapılarının Bulunması, Gazi Üni. , FBE, Doktora Tezi, 2006, s. 65. 109 Genetic Server/Library, “Crossover”, http://www.nd.com/products/genetic/crossover.htm, (01.01.2008). 53 Ana Kromozom 1 : 110-010-10 Ana Kromozom 2 : 001-001-11 Ana kromozomları çaprazlama noktaları arasında değiĢtirdikten sonra aĢağıdaki yavrular üretilir: Yavru 1 : 110-001-10 Yavru 2 : 001-010 -11 Uniform Çaprazlama Uniform operatörü, yavru kromozomlardaki gen değerlerine hangi ana kromozomun katılacağına karıĢma oranı adı verilen bir olasılıkla karar veren operatördür. Bu operatör ana kromozomların bölünme sırasından çok gen seviyesinde karıĢtırılmalarına izin verir. Örneğin karıĢma oranı 0.5 ise; yaklaĢık olarak yavrudaki genlerin yarısı 1. ana kromozomdan, diğer yarısı da 2. kromozomdan gelecektir. 4.2.5.2. Mutasyon Mutasyon, kromozom dizisindeki tek bir elemanın değerinin rastgele değiĢmesidir. Mutasyon iĢleminde amaç, var olan bir kromozomun genlerinin yerlerini değiĢtirerek yeni kromozom oluĢturmaktır. Yeni nesillerin üretimi sonucunda bir süre sonra nesildeki kromozomlar birbirini tekrarlar hale gelebilir ve bunun sonucunda farklı kromozom üretimi durabilir veya artık çok az sayıda farklı kromozomlar üretilmeye baĢlanır. Bu nedenle kromozomların çeĢitliliğini arttırmak için kromozomlardan bazıları mutasyona uğratılır. Yapay sistemlerde mutasyon iĢlemi sırasında gen sayısında bir değiĢiklik olmaz. Doğal popülasyonlarda mutasyon oranı oldukça düĢüktür. Mutasyon frekansının büyüklüğü Genetik Algoritmanın performansını etkiler. Mutasyon iĢlemi bir tek kromozom üzerinde yapılır. Mutasyon frekansına göre, mutasyona uğratılacak sayıdaki 54 diziler popülasyondan rassal olarak seçilir ve belirlenen mutasyon yöntemine göre değiĢime uğratılır 110. Mutasyon genetik algoritma iĢlemlerinde ikincil bir rol oynamaktadır. Mutasyon iĢlemi gereklidir, çünkü çaprazlama bazı potansiyel yararı olan genetik materyallerin kaybına neden olabilmektedir. Yapay genetik sistemlerde mutasyon operatörü böyle bir kaybı önlemektedir 111. 4.2.6. Uygunluk Değerinin Hesaplanması Bu adımda, her bir kromozom için daha önceden belirlenmiĢ olan uygunluk fonksiyonu kullanılarak uygunluk değeri hesaplanır. 4.2.7. Bitiş Koşulu Kontrolü Bu adımda, bitiĢ koĢulunun sağlanıp sağlanmadığı kontrol edilir. BitiĢ koĢulu iterasyon sayısı olabildiği gibi, optimizasyon türüne göre ulaĢılmak istenilen minimum veya maksimum değer de olabilir. 4.2.8. Sonucun Elde Edilmesi BitiĢ koĢulu sağlandıktan sonra gerçekleĢen bu son adımda, elde edilen en iyi birey kullanıcıya sonuç olarak verilir. 4.3. Genetik Algoritmaların Uygulama Alanları Genetik algoritmalar karmaĢık problemleri hızlı ve optimale yakın olarak çözebilmektedirler. KarmaĢık problemlerin geleneksel yöntemlerle çözülmeye çalıĢılması çok fazla zaman harcanmasına neden olmaktadır. Ancak bu tür problemler genetik algoritma yardımıyla kısa sürede çözülebilmektedirler 112. 110 Serkan KAYA, Operasyonel Sabit İş Çizelgeleme Problemlerinin Genetik Algoritma ile Çözümü, Selçuk Üni., FBE, Yüksek Lisans Tezi, 2006, s. 25-26. 111 David M. TATE, Alice E. SMITH, Expected Allele Coverage and the Role of Mutation in Genetic Algorithms”, http://reference.kfupm.edu.sa/content/e/x/expected_allele_coverage_and_the_role_of_529189.pdf , (01.01.2008) 112 G. Gökay EMEL, Çağatan TAġKIN, Genetik Algoritmalar ve Uygulama Alanları, Uludağ Üni. , İİBF Dergisi, Cilt XXI, Sayı 1, 2002, s. 138. 55 Genetik algoritmalar günümüzde pek çok alanda uygulanmaktadır. Genetik algoritmaların uygulama alanları genel uygulama alanları ve iĢletmelerdeki yaygın uygulama alanları olmak üzere iki sınıfa ayrılabilir. 4.3.1 Genel Uygulama Alanları Genetik algoritmaların genel uygulama alanları aĢağıdaki gibi verilebilir: 4.3.1.1 Optimizasyon Genetik algoritmalar, farklı alanlardaki optimizasyon problemlerini çözmede kullanılmaktadır. Genetik algoritmaların uygulandığı optimizasyon problemleri, sayısal optimizasyon ve birleĢik optimizasyon altında toplanabilir. Genetik algoritma uygulamalarının bir çoğu sayısal optimizasyon ile ilgilidir. Genetik algoritmalar, geleneksel optimizasyon tekniklerine göre zor, süreksiz ve gürültü içeren fonksiyonları çözmede daha etkindirler. BirleĢik optimizasyon problemleri sınırlı kaynakların (iĢgücü, tedarik, bütçe vb.) etkin tahsis edilmesiyle ilgilidir. Burada geçen "birleĢik" kelimesi, belirli sayıda uygun çözümün olmasını ifade eder. BirleĢik optimizasyon kısaca belirli bir problem için bir ya da daha fazla optimal çözüm bulma sürecidir. Bu tür problemler iĢletme biliminin birçok dalında da (finans, pazarlama, üretim, stok kontrolü, veritabanı yönetimi vb.) ortaya çıkmaktadır. Gezgin satıcı problemi, araç rotalama problemi, Çinli postacı problemi, iĢ atölyesi çizelgeleme problemi, atama problemi, yerleĢim tasarımı problemi ve sırt çantası problemleri birleĢik optimizasyon problemlerine örnek olarak verilebilir. BirleĢik optimizasyon problemlerinde, incelenen değiĢken sayısının artması, problemin çözüm süresini artırmaktadır. Çözüm uzayının tamamının taranmasını gerektiren geleneksel çözüm yöntemlerinde problem çözümü değiĢken sayısının artmasıyla imkansız hale gelebilirken, genetik algoritmalar kullanılarak ulaĢılabilmektedir 113. 113 G. Gökay EMEL, Çağatan TAġKIN, a.g.m., s. 138-139. çözüme daha kısa sürede 56 4.3.1.2 Otomatik Programlama ve Bilgi Sistemleri Genetik Algoritmalar, belirli uygulamalar için bilgisayar programları ve belli amaçlar doğrultusunda tasarlanmıĢ sürekli öğrenen etmenleri geliĢtirmede de kullanılabilir 114. 4.3.2 İşletmelerdeki Uygulama Alanları Genetik algoritmaların iĢletmelerdeki kullanım alanlarını Ģu Ģekilde ifade edebiliriz: 4.3.2.1 Finans Genetik algoritmalar karmaĢık finans problemlerini çözmek için çok geçerli bir tekniktir. Genetik algoritmaların finansal piyasalardaki bazı uygulamaları: getirilerin tahmini, portföy optimizasyonu ve iĢlem kurallarının keĢfedilmesidir 115. Getirilerin Tahmin Edilmesi Genetik algoritmalar iĢletmelerde yatırım yöneticilerince getirileri tahmin etmede kullanılmaktadır. Örneğin Leinweber ve Arnott, genetik algoritmayı kendi varlık dağılımı modellerinde uygulayarak, fonlarının performansını önemli ölçüde artırdıklarını belirtmiĢlerdir 116. Bununla birlikte, Mahfoud, Mani ve Reigel stratejik varlık dağılımında faydalı olan bireysel hisselerin getiri tahmininde genetik algoritmaların nasıl kullanılabileceğini göstermiĢlerdir 117. Bu çalıĢmalarının sonucunda, doğrusal metotlara göre genetik algoritmaların ne kadar önemli bir tahmin yeteneklerinin olduğunu ortaya koymuĢlardır. Portföy Optimizasyonu Yatırım yönetiminde bir diğer önemli fonksiyon da bir portföydeki menkul kıymetlerin ağırlıklarını belirlemektir. Bu süreç portföy optimizasyonu olarak 114 Emine TUĞ, a.g.t., s.17. Robert PEREIRA, a.g.m., s. 19-20. 116 David J. LEINWEBER, Robert D. ARNOTT, Quantitative and Computational Innovation in Investment Management, The Journal of Portfolio Management, 1995, 21, 8-15. 117 Samir MAHFOUD, G. MANI and S. REIGEL, Nonlinear versus Linear Techniques for Selecting Individual Stocks, Decision Technologies for Financial Engineering, World Scientific, 1997, 65-75. 115 57 adlandırılır. Özellikle büyük bir çözüm uzayıyla karĢı karĢıya kalındığında bir portföydeki menkul kıymetlerin ağırlıklarını bulmak için genetik algoritmalar kullanılabilir. İşlem Kurallarının Keşfi Genetik algoritmalar, karlı iĢlem kurallarını bulmak için de kullanılmaktadırlar. Örneğin Bauer, Amerikan hisse senetleri ve tahvil piyasaları için genetik algoritma kullanarak bir iĢlem kuralı geliĢtirmiĢtir. Bu kurallar finansal piyasalar ve ekonomi arasındaki iliĢkiyi ortaya çıkarmak için aylık makroekonomik verilerin kullanılmasını ifade etmektedir. Sonuçlar olumlu çıkmıĢ ve küçük karlar elde edilmiĢtir. Ancak bu karların istatistiksel önemi araĢtırılmamıĢtır. Daha sonra bu metodoloji döviz piyasasına uygulanmıĢ ve ümit verici sonuçlar ortaya çıkmıĢtır 118. Genetik algoritmaların yukarıda sayılanların dıĢında uygulama alanları da mevcuttur. Bunlar kısaca; hisse senedi fiyatlarındaki değiĢimleri tahmin etmek ve bulmak, kaynak dağılımı ve uluslararası sermaye dağılımı stratejilerini belirlemek, endeks takibi, çok dönemli portföy yönetim sistemlerinin kurulması, yine minimum iĢlem lotlu portföy seçimi problemlerinin çözümü, daha yüksek getiriler elde etmek için FX (Foreign Exchange) piyasalarındaki iĢlem kuralları geliĢtirmek, müĢterilerinin kredi değerliliğini ölçmek, yatırım araçlarının performansını belirlemek, iĢletmelerdeki mali kayıpların araĢtırılması, finansal opsiyonların geliĢtirilmesi, kredi kartı puanlama, piyasalar ile ilgili tahminleri ve Ģirketlerdeki iflas tahminlerini yapmak olarak sıralanabilir 119. 4.3.2.2 Pazarlama Pazarlamanın en önemli fonksiyonları; tüketicilere ait verileri analiz etmek, çeĢitli tüketici davranıĢlarını ortaya çıkarmak ve bu davranıĢları göz önünde bulundurarak pazarlama stratejileri uygulamak olarak sıralanabilir. Tüketicilerin profilleri çıkarılarak, belirli satın alma davranıĢları ortaya çıkabilmektedir. Ancak bu davranıĢları ortaya çıkarabilmek için çok sayıda verinin önce veri tabanlarına iĢlenmesi 118 119 Robert PEREIRA, a.g.m., s. 20. G. Gökay EMEL, Çağatan TAġKIN, a.g.m., s. 141-142. 58 ve bu veri tabanlarının da iĢletme amaçları doğrultusunda hızlı ve etkin biçimde kullanılması gerekmektedir. Burada kullanılacak yöntem veri madenciliği sürecidir. Pazarı ve tüketiciyi tanımada veri madenciliği çok önemli bir rol oynar, önce veriyi bilgiye bilgiyi de güvenli kararlara dönüĢtürür. Veri madenciliği müĢteri tatmini ve rekabet edebilme yeteneği gibi iĢletme açısından hayati konularda kullanım alanına sahiptir. Veri madenciliğinde kullanılan tekniklerden birisi de genetik algoritmadır. Genetik algoritmalar kullanılarak veri yığınlarından modeller elde edilmekte ve pazarlama alanının farklı dallarında sıklıkla kullanılmaktadır 120. 4.3.2.3 Üretim Genetik algoritmalar üretim alanında da sıklıkla uygulanmaktadırlar. Üretim alanında uygulama alanları Ģu Ģekilde sıralayabiliriz: Montaj hattı dengeleme, çizelgeleme, tesis yerleĢim, atama, hücresel üretim, sistem güvenilirliği, taĢıma, gezgin satıcı, araç rotalama, minimum yayılan ağaç problemlerinin çözümü. 120 a.g.m., s. 142. 59 BEŞİNCİ BÖLÜM 5.Uygulama Bu bölümde ikinci bölümde anlatılan CRISP-DM veri madenciliği sürecinin gerçekleĢtirilen uygulamada nasıl hayata geçirildiği hakkında bilgi verilecektir. 5.1. İşin Kavranması Bu çalıĢmada amaç; 1995 – 2007/6 döneminde Ġstanbul Menkul Kıymetler Borsa‟sında sürekli olarak iĢlem gören hisse senetlerinin aylık getirileri göz önünde bulundurularak, seçilecek portföy performansı ölçütü, portföyde bulundurulmak istenen hisse senedi sayısı, hisse senetlerine ayrılacak minimum ve maksimum ağırlık değerleri kısıtları çerçevesinde veri madenciliği yardımı ile optimale en yakın portföyün belirlenmesini sağlamaktır. 5.2. Verinin Kavranması Bu aĢamada ilk olarak Ġstanbul Menkul Kıymetler Borsası‟nda iĢlem gören tüm hisse senetlerinin ele alınması düĢünülmüĢ ve 1995 yılında 205, 2007 yılında 319, günümüzde ise 340 adet hisse senedinin iĢlem gördüğü tespit edilmiĢtir. Daha sonra, bu durumda tüm hisse senetlerine ait eĢit sayıda veriye sahip olunamayacağı, bazı hisse senetlerinin belli bir süre iĢlem gördükten sonra tahtasının iĢleme kapatıldığı ve bazı hisse senetlerinin de ele alınan dönem içerisinde farklı bir tarihte iĢlem görmeye baĢlaması gibi sebepler göz önünde bulundurularak 1995 – 2007/6 döneminde kesintisiz olarak iĢlem gören 122 adet hisse senedinin uygulamada kullanılmasına karar verilmiĢtir. Belirlenen amaca ulaĢabilmek için her bir hisse senedine ait 1995 – 2007/6 arasındaki aylık getiri, istenen performans ölçütlerinin hesaplanabilmesi için ĠMKB 100 endeksi ve her yıla ait risksiz faiz oranı bilgilerine ihtiyaç duyulduğu belirlenmiĢtir. 5.3. Verinin Hazırlanması Belirlenen 122 adet hisse senedinin her birine ait 1995 – 2007/6 yılları arasındaki aylık getiri verileri Microsoft Excel formatında Ġstanbul Menkul Kıymetler Borsası web 60 sitesinden elde edilmiĢtir. Yine 1995 – 2007/6 yılları arasında ĠMKB 100 bileĢik endeksine ait aylık endeks verileri yine Ġstanbul Menkul Kıymetler Borsası web sitesinden, yine aynı yıllara ait risksiz faiz oranları ise TC Merkez Bankası web sitesinden elde edilmiĢtir. Risksiz faiz oranları göz önünde bulundurulurken hazine bonosu faiz oranları ya da repo faiz oranları kullanılmamıĢtır. Bu oranların yerine bankaların uyguladıkları mevduat faiz oranları kullanılmıĢtır. Bunun nedeni; farklı tarihlerde ihraç edilen hazine bonolarının vadelerinin farklı olması ve repo faiz oranlarının kriz dönemlerinde %5000‟lere kadar çıkması ve volatilitenin çok fazla olmasıdır. Yıllar itibariyle bankaların uyguladıkları mevduat faizi oranları TC Merkez Bankası web sitesinden, bankaların dönem içerisinde uyguladıkları maksimum ve minimum faiz oranlarının ortalaması bulunarak hesaplanmıĢtır. Ardından bu oranların geometrik ortalaması bulunarak 1995 – 2007/6 döneminde aylık ortalama risksiz faiz oranı hesaplanmıĢtır. Formül hesaplamalarında bu oran r f (risksiz faiz oranı) olarak kullanılmıĢtır. Hisse senetleri için aylık getiriler bir hisse senedinin bir ay boyunca elde tutulması sonucunda elde edilen getiriyi göstermekte olup aĢağıdaki formüle göre hesaplanmıĢtır. Gi = Fi * ( BDL BDZ 1) R * BDL T Fi 1 Fi 1 G i = i ayına ait getiri, F i = i ayına ait en son kapanıĢ fiyatı, BDL = Ay içinde alınan bedelli hisse adedi, BDZ = Ay içinde alınan bedelsiz hisse adedi, R = Rüçhan hakkı kullanma fiyatı, T = Ay içinde 1 TL nominal değerli bir hisse senedine ödenen temettü tutarı, Fi 1 = i ayından bir önceki aya ait en son kapanıĢ fiyatı. 61 Ardından hisse senetlerinin ve ĠMKB 100 bileĢik endeksinin ortalama getirileri hesaplanmıĢtır. Bu hesaplamada aritmetik ortalama yerine negatif getirilerin hesaplamayı yanıltmaması için geometrik ortalama kullanılmıĢtır. Geometrik ortalama aĢağıdaki Ģekilde formüle edilmiĢtir. n 1 + rt = (1 rt ) n t 1 rt = n dönemin ortalama getirisi, n = dönem sayısı, r t = t. dönemin getirisi. 122 hisse senedinin geometrik ortalama yöntemine göre bulunan aylık ortalama getirileri EK-3 ve EK-4‟te sunulmuĢtur. Portföy performans ölçüleri hesaplanırken Ģu adımlar izlenmiĢtir: Sharpe Performans Değerleme Yöntemi Öncelikle 122 adet hisse senedinin 1995–2007/6 dönemindeki aylık getirileri alınmıĢ ve bu getirilerin 150 aylık geometrik ortalaması alınarak aylık ortalama getirileri hesaplanmıĢtır. Hazırlanan program; verilen kısıtlar doğrultusunda öncelikle portföye alınacak hisse senetlerinin ortalama getirileri ile programın bu hisse senetlerine verdiği ağırlıkları çarpıp toplayarak portföyün ortalama getirisini hesaplayacak, ardından bu getiriyi risksiz faiz oranından çıkaracak ve çıkan sonucu portföyün standart sapmasına bölecektir. SPÖ = (R p - R f )/ p SPÖ = Sharpe performans değerleme yöntemi, R p = p portföyünün getirisi, R f = Risksiz faiz oranı, p = p portföyünün getirisinin standart sapması. 62 Treynor Performans Değerleme Yöntemi Treynor performans değerleme yöntemi hesaplanırken, Sharpe oranının hesaplanmasındaki adımlar uygulanmıĢtır. Ancak burada portföyün standart sapması yerine, hisse senetlerinin beta katsayıları kullanılmıĢtır. Beta katsayıları hesaplanırken öncelikle hisse senetlerinin 1995-2007/6 dönemindeki getirileri ve ĠMKB 100 endeksinin getirileri dikkate alınarak korelasyon katsayıları hesaplanmıĢ, ardından bulunan katsayılar hisse senetleri ve ĠMKB 100 bileĢik endeksinin standart sapmasıyla çarpılarak kovaryanslar hesaplanmıĢ, son olarak da bulunan kovaryanslar endeksin varyansına bölünerek her bir hisse senedinin beta katsayıları hesaplanmıĢtır. Treynor performans değerleme yönteminin hesaplanmasında kullanılacak beta katsayısı ise; portföye alınacak hisse senetlerinin beta katsayılarının basit ağırlıklı ortalamasıdır. Hisse senetlerinin beta katsayıları EK-3 ve EK-4‟te sunulmuĢtur. TPÖ = (R p - R f )/ p TPÖ = Treynor performans değerleme yöntemi, R p = p portföyünün beklenen getirisi, R f = Risksiz faiz oranı, p = p portföyünün beta katsayısı. Ancak Treynor performans değerleme yöntemi hesaplanırken dikkat edilmesi gereken bazı hususlar bulunmaktadır. Örneğin; eğer portföyün ortalama getirisi risksiz faiz oranından küçükse ve aynı zamanda portföye alınan hisse senetlerinin ortalama betası da negatif bir değer alırsa sonuç pozitif bir sayı çıkabilir. Hatta çıkan sonuç çok yüksek değerler alabilir. Bu durum bizim performansı yanlıĢ yorumlamamıza neden olacaktır. Bu nedenle geliĢtirilen program bu olasılığı yok edecek Ģekilde hazırlanmıĢtır. Dikkat edilmesi gereken bir baĢka durum da portföyün ortalama getirisinin risksiz faiz oranından büyük olması, ancak portföye alınan hisse senetlerinin basit ağırlıklı ortalama beta değerlerinin negatif bir değer almasıdır. Bu durumda da performans negatif bir değer alacak ve yine bizim sonuçları yanlıĢ yorumlamamıza neden olacaktır. 63 Treynor performans değerleme yöntemi hesaplanırken bu tür olumsuzluklardan korunmak için portföyden kabul edilebilir minimum getiri oranının hesaplanması ve bu getiri oranıyla portföyün ortalama getiri oranının karĢılaĢtırılması gerekmektedir. Bir baĢka ifade ile eğer ki portföyün kabul edilebilir minimum getiri oranı portföyün ortalama getiri oranından küçükse performans değeri negatif çıksa dahi portföyün performansının arzulanan bir düzeyde olduğu yorumu yapılacaktır. Portföyden kabul edilebilir minimum getiri oranı Ģu Ģekilde hesaplanmaktadır: E(r p ) = r f + p (r m -r f ) E(r p ) = Portföyün kabul edilebilir minimum getiri oranı, r f = Risksiz faiz oranı, p = Portföyün ağırlıklı ortalama beta değeri, rm = Piyasanın (ĠMKB 100) ortalama getirisi. Jensen Performans Değerleme Yöntemi Jensen performans değerleme yöntemi hesaplanırken yine portföye alınacak hisse senetlerinin beta değerleri kullanılmıĢtır. Jensen performans ölçütünün formülü; Ri ,t i R f ,t = i i Rm,t R f ,t = Jensen Ölçütü Ri ,t = i portföyünün t dönemindeki ortalama ( piyasa ) getirisi, R f ,t = t dönemindeki risksiz faiz oranı, i = Sistematik risk ölçüsü, Rm,t = t dönemindeki piyasa portföyünün ortalama ( piyasa ) getirisi. biçimindedir. 64 Jensen performans ölçütünün pozitif bir değer alması, portföyün piyasa performansından daha iyi bir performans gösterdiğinin göstergesidir. Çünkü piyasanın betası 1‟dir ve piyasanın Jensen performans değeri sıfır (0)‟dır. Bu verilerin elde edilmesinden sonra verilerin gerçekleĢtirilen uygulamada kullanılacağı düĢünülerek SQL Server 2005 Veri Tabanı Yönetim Sistemi‟nde ġekil 5.1 de gösterilen veri tabanı tasarlanmıĢ ve uygulanmıĢtır. Aylik Endeks MenkulKodu Yıl Tarih Endeks AylıkGetiri Sharp Treynor Jensen Sıra Şekil 5.1. Proje İçin Tasarlanan Veri Tabanı SQL Server 2005 üzerinde uygulanan veri tabanına daha önce internetten elde edilen Microsoft Excel formatındaki veriler aktarılmıĢtır. Bu çalıĢmada uygunluk değeri olarak portföylerin portföy performansı seçilmiĢtir ve bu değer genetik programlama uygulanırken hesaplanmıĢtır. Bu programlara ait kodlar EK-1‟de verilmiĢtir. 5.4. Modelleme Bu aĢamada optimale en yakın portföyü oluĢturabilmek için genetik algoritmalar kullanılmıĢtır. 65 Genetik algoritma ile optimizasyon yapılması sırasındaki ilk iĢlem kromozom yapısının belirlenmesidir. Bu çalıĢmadaki kromozom uzunluğu seçilen portföy sayısına göre değiĢkenlik göstermektedir. ÇalıĢmada kullanılan kromozom yapısı ġekil 5.2‟de gösterilmiĢtir. yi ri yi+1 ……. ri+1 ……. ……. ……. z Şekil 5.2. Uygulamada kullanılan kromozomun genel yapısı yi : i. Hisse senedine verilen ağırlık ri : Portföye dahil edilen i. hisse senedinin ortalama getirisi z : portföyün getirisi ġekil 5.2‟deki yapıya uygun olarak 6 hisse senedinden oluĢan bir kromozom yapısı ġekil 5.3‟de gösterilmiĢtir. Burada kromozom içerisinde i. hisse senedi, o hisse senedinin tek bir dönemdeki getirisini değil, incelenen tüm dönemlerdeki ortalama getirisini göstermektedir. 13 r5 20 r105 19 r85 11 r60 20 r30 17 r12 0.05 Şekil 5.3. Örnek bir kromozom yapısı Kromozom yapısı belirlendikten sonra sırada amaç fonksiyonun belirlenmesi vardır. Bu uygulamada kullanılan amaç fonksiyon aĢağıda verilmiĢtir. gi : i. Hisse senedinin aylık getiri ortalaması yi : i. Hisse senedine verilen ağırlık z : portföyün getirisi Bilindiği gibi genetik algoritmalarda iki adet operatör kullanılmaktadır. Bunlardan birincisi çaprazlama operatörüdür. Bu uygulamada çaprazlanacak bireylerin 66 belirlenmesinde rulet tekerleği algoritmasından faydalanılmıĢtır. Bu çalıĢmada kullanılan rulet tekerleği seçimi yöntemi aĢağıda açıklanmıĢtır 121: Tüm bireylerin uygunluk değerleri bir tabloya yazılır. Bu değerler toplanır. Tüm bireylerin uygunluk değerleri toplama bölünerek [0,1] aralığında sayılar elde edilir. Bu sayılar bireylerin seçilme olasılıklarıdır. Sayıların hepsi bir tabloda tutulur. Seçilme olasılıklarının tutulduğu tablodaki sayılar birbirine eklenerek rastgele bir sayıya kadar ilerlenir. Bu sayıya ulaĢıldığında ya da geçildiğinde son eklenen sayının ait olduğu çözüm seçilmiĢ olur. Bu yönteme rulet tekerleği seçimi ismi, bir daireyi, çözümlerin uygunluklarına göre dilimleyip çevirdiğimizde olacakların benzeĢimi olduğu için verilmiĢtir. Rulet tekerleği seçimi çözümlerin uygunluk değerlerinin negatif olmamasını gerektirir. Çünkü olasılıklar negatif olursa bu çözümlerin seçilme Ģansı yoktur. Çoğunluğunun uygunluk değeri negatif olan bir toplumda yeni nesiller belli noktalara takılıp kalabilir. Ayrıca tek noktadan çaprazlama yapılmıĢtır. Çaprazlama iĢleminde öncelikle rastgele bir çaprazlama noktası belirlenmekte ve bu noktadaki hisse senetleri karĢılıklı olarak bireyler arasında yer değiĢtirmektedir. AĢağıda çaprazlama iĢlemine ait bir örnek gösterilmiĢtir. 1. Birey: 13 5 20 105 19 85 11 60 20 30 17 12 0.05 20 96 11 72 20 22 16 11 13 10 0.1 2.Birey: 20 121 8 Selim DÖNMEZ, “Regresyon Analizi ve Genetik http://yilmazeray.googlepages.com/selim_dergimakalesi.doc, (15.08.2008) Algoritmanın Esasları”, 67 Çaprazlama ĠĢlemi Sonucunda OluĢan Bireyler: 13 5 20 105 19 85 11 60 20 11 17 12 0.08 20 8 20 96 11 72 20 22 16 30 13 10 0.15 Genetik algoritmada uygulanan ikinci operatör ise mutasyon operatörüdür. Mutasyon iĢleminde öncelikle kromozom içerisinde rastgele bir nokta belirlenmekte bu noktadaki hisse senedi yeni bir hisse senedi ile rastgele olarak değiĢtirilmektedir. Bireyin mutasyon operatörü uygulanmadan önceki durumu: 13 5 20 105 19 85 11 60 20 30 17 12 0.05 12 0.06 Bireyin mutasyon operatörü uygulandıktan sonraki durumu: 13 5 20 105 19 85 11 55 20 30 17 Ayrıca bu çalıĢmada kullanılan genetik algoritma adımları aĢağıda verilmiĢtir. 1. Adım: Kullanıcı, bir hisse senedine yapılabilecek yatırımın minimum ve maksimum yüzde değerlerini belirler. 2. Adım: Kullanıcı, hangi portföy performans ölçütünün kullanılacağını belirler. 3. Adım: Kullanıcı, yapılacak olan iterasyon sayısını veya ulaĢmak istediği kar yüzdesini belirler. 4. Adım: Kullanıcı, portföyün kaç hisse senedinden oluĢacağını belirler. 5. Adım: Kullanıcının belirlediği kısıtlar dahilinde genetik algoritma çalıĢmaya baĢlar. 6. Adım: Ġlk olarak belirtilen kısıtlar dahilinde 100 adet baĢlangıç kromozomu oluĢturulur. OluĢturulan her kromozomda hisse senetlerinin kodları, o hisse senedine yapılan yatırımın yüzde değeri ve en son sütunda da bu portföyün getirisi yer alır. 68 7. Adım: OluĢturulan kromozomlar son sütundaki getiri değerlerine göre büyükten küçüğe doğru sıralanır. Yani problem bir maksimizasyon problemidir. Sıralama sonucunda ilk 20 eleman alınır. Çünkü genetik algoritmada en iyiler hayatta kalır prensibi geçerlidir. 8. Adım: Rulet Tekerleği metodu kullanılarak çaprazlamada (cross over) kullanılacak bireyler seçilir. 9. Adım: Çaprazlama iĢlemi gerçekleĢtirilerek yeni oluĢan bireyler ilk 20 kromozomun sonuna eklenir. Çaprazlama iĢleminde rastgele seçilen bir noktadaki hisse senetleri iki kromozomda karĢılıklı olarak yer değiĢtirir. 10. Adım: Mutasyon iĢlemi gerçekleĢtirilir. Elde edilen yeni bireyler 9.adımda elde edilen bireylerin sonuna eklenir. 11. Adım: OluĢan yeni popülasyon yine son sütundaki getiri değerlerine göre büyükten küçüğe doğru sıralanır. 12. Adım: UlaĢılmak istenen getiri değerine veya iterasyon sonucuna ulaĢılıp ulaĢılmadığına bakılır. Eğer ulaĢıldıysa algoritma sonlandırılır ulaĢılmadıysa 8. Adıma geri gidilir. 5.5 Değerlendirme Bir önceki aĢamada oluĢturulan modele uygun olarak c# programlama dilinde bir program geliĢtirilmiĢtir ve bu program yardımıyla portföy oluĢturulup yorumlanmıĢtır. Uygulama aĢamasında geliĢtirilen programdan 10, 15 ve 25 hisse senedinden oluĢan, hisse senetlerinin ağırlıklarının % 2 ile % 20 arasında değiĢebileceği ve 50 iterasyon sonucunda ulaĢılabilecek performans türlerine (Sharpe, Treynor, Jensen) göre portföy oluĢturması istenmiĢ ve aĢağıdaki sonuçlar elde edilmiĢtir. Bilindiği üzere her yatırımcının risk alma düzeyi aynı değildir. ÇalıĢmadaki kısıtlar rastgele verilmiĢtir. GeliĢtirilen programda her yatırımcı kendi risk alma seviyesine göre kısıtları değiĢtirebilmektedir. 69 Sharpe Performans Değerleme Yöntemi Sonuçları Şekil 5.4. 10 Hisse Senedinden Oluşturulan Portföyün Sharpe Performans Değerleme Yöntemi Hesaplamasının Program Görünümü Yukarıdaki Ģekilde 10 hisse senedinden oluĢturulan portföyün Sharpe performans değerleme yöntemi hesaplamasının program görünümü verilmiĢtir. Aynı uygulama 15 ve 25 hisse senedinden oluĢan portföyler için de gerçekleĢtirilmiĢtir. Burada portföyleri farklı sayılardaki hisse senedinden oluĢturmadaki amaç; her yatırımcının portföyünde farklı sayıda hisse senedi bulundurmak isteyeceği ve farklı sayıdaki hisse senedinden oluĢan portföylerin aylık ortalama getiri ve performans kıyaslamalarını yapabilmektir. AĢağıdaki tabloda 10, 15 ve 25 hisse senedinden oluĢturulan portföylerin aylık ortalama getirileri ve Sharpe performansları gösterilmiĢtir. 70 Çizelge 5.1. 10, 15 ve 25 Hisse Senedinden Oluşan Portföylerin SHARPE Performansları ve Aylık Ortalama Getirileri Hisse Kodu CIMSA KENT HURGZ IZOCM FFKRL UNYEC DOHOL AKBNK MIGRS GARAN EGPRO PNSUT TUPRS MRDIN ADANA YKBNK FROTO ASELS AYGAZ FINBN ASLAN FMIZP KENT ISCTR PINSU SISE TRKCM GENTS EREGL ECZYT ANACM CIMSA BUCIM Aylık Ortalama Getiri (%) 4.08 4.08 4.18 4.24 4.15 4.15 4.04 4.16 4.20 4.12 4.61 4.65 4.27 4.76 4.49 4.14 4.55 3.92 4.07 4.69 3.99 3.75 4.08 4.69 4.05 3.81 3.93 3.56 3.87 3.81 3.60 4.08 3.87 PORTFÖYÜN AYLIK ORT. GET. İMKB 100 AYLIK ORT. GET. PORTFÖYÜN SHARPE PERFORMANSI İMKB 100 SHARPE PERFORMANSI 10 Çeşit Hisse Senedinden Oluşan Portföydeki Payı (%) 4 4 14 16 6 3 16 20 11 6 15 Çeşit Hisse Senedinden Oluşan Portföydeki Payı (%) 25 Çeşit Hisse Senedinden Oluşan Portföydeki Payı (%) 3 7 3 10 4 6 2 7 2 2 4 12 4 3 4 17 6 2 20 6 5 6 2 3 7 11 2 4.15 3.54 4.46 3.54 2 2 2 3 8 6 2 2 2 2 2 5 2 4.24 3.54 8.701320 3.142823 1.782852 -0.0069 -0.0069 -0.0069 71 Yukarıdaki tabloda, genetik algoritma yardımıyla 10, 15 ve 25 hisse senedinden oluĢan, ağırlıkları %2 ile %20 arasında değiĢen, Sharpe performans değerleme yöntemine göre farklı portföyler oluĢturulmuĢ ve çizelgedeki sonuçlar elde edilmiĢtir. OluĢturulan portföylerin aylık ortalama getirileri de yukarıdaki çizelgede verilmiĢtir. Çıkan sonuca göre 10, 15, 25 hisse senedinden oluĢan portföylerin Sharpe oranları sırasıyla 8,70132, 3,142823, 1,782852 ve aylık ortalama getirileri de sırasıyla %4,15, %4,46 ve %4,24‟tür. Bu sonuçtan da anlaĢılmaktadır ki, 1995-2007/6 döneminde ĠMKB 100 bileĢik endeksinin Sharpe performansı, verilen kısıtlar dahilinde çalıĢmada ele alınan 122 hisse senedinden oluĢturulabilecek portföy performansından daha düĢüktür. Bunun temel sebebi, incelenen dönem sonucunda ortaya çıkan aylık ortalama ĠMKB 100 bileĢik endeksinin getirisinin (%3,54), ortalama risksiz faiz oranından (%3,65) düĢük olmasıdır. Çünkü formülde bu değerler yerlerine konulduklarında formülün pay kısmının eksi ( - ) bir değer almasına, sonuçta da performansın da eksi bir değer almasına neden olmaktadır. Genetik algoritma yardımıyla oluĢturulan portföylerin Sharpe oranlarının piyasa performansından bu derece yüksek çıkmasının nedeni ise; yöntemin, oluĢturacağı portföylere alacağı hisse senetlerinin getirilerinin öncelikle risksiz faiz oranından yüksek çıkmasını göz önünde bulundurmasıdır. Risksiz faiz oranından daha yüksek getiriye sahip hisse senetlerine bakıldığında da ortalama getirilerinin çok fazla bir sapma göstermediği görülmektedir. Portföyler kendi aralarında kıyaslandığında ise sonuçlar Ģu Ģekilde yorumlanabilir; 10 hisse senedinden oluĢturulan portföyün Sharpe performansı daha yüksek çıktığı için, portföyü 10 hisse senedinden oluĢturmak rasyonel bir davranıĢ olacaktır. Çünkü 10 hisse senedinden oluĢan portföyün aylık ortalama getirisi diğer portföylerden düĢük olmasına rağmen, birim risk baĢına düĢen getiri oranı diğer portföylerin oldukça üzerindedir. 72 Treynor Performans Değerleme Yöntemi Sonuçları Sharpe performans değerleme yönteminde yapılan uygulama bu kez Treynor performans değerleme yöntemine aĢağıdaki Ģekilde uygulanmıĢtır ve sonuçlar Ģu Ģekildedir: Şekil 5.5. Treynor Performans Hesaplamasının Program Görünümü Yukarıdaki Ģekilde 10 hisse senedinden oluĢturulan portföyün Treynor performans değerleme yöntemi hesaplamasının program görünümü verilmiĢtir. Aynı uygulama 15 ve 25 hisse senedinden oluĢan portföyler için de gerçekleĢtirilmiĢtir. AĢağıdaki tabloda 10, 15 ve 25 hisse senedinden oluĢturulan portföylerin aylık ortalama getirileri ve Treynor performansları gösterilmiĢtir. 73 Çizelge 5.2. 10, 15 ve 25 Hisse Senedinden Oluşan Portföylerin TREYNOR Performansları ve Aylık Ortalama Getirileri Hisse Kodu BUCIM IZOCM ECZYT YKFIN FFKRL PINSU DOGUB EGPRO TIRE ADANA KCHOL MIGRS CIMSA GENTS KENT SONME ASELS UNYEC DEVA USAK ISCTR MIPAZ UCAK TSKB KONYA GARAN PKENT TEKST ECILC PETKM FROTO ALCAR BAGFS EREGL TUPRS MUTLU HURGZ VKFYT Aylık Ortalama Getiri (%) 3.87 4.24 3.81 3.24 4.15 4.05 1.87 4.61 3.29 4.49 3.19 4.20 4.08 3.56 4.08 2.77 3.92 4.15 3.54 1.28 4.69 3.15 3.70 3.58 3.41 4.12 3.06 3.58 3.94 2.63 4.55 3.15 3.37 3.87 4.27 3.16 4.18 2.67 10 Çeşit Hisse Senedinden Oluşan Portföydeki Payı (%) 10 19 5 11 4 16 2 9 14 10 15 Çeşit Hisse Senedinden Oluşan Portföydeki Payı (%) 25 Çeşit Hisse Senedinden Oluşan Portföydeki Payı (%) 11 2 3 3 2 4 8 4 3 12 2 7 15 5 3 9 3 11 10 8 2 3 3 2 4 3 6 17 2 3 2 4 4 3 4 74 Hisse Kodu ASLAN FMIZP CELHA ADNAC MRDIN Aylık Ortalama Getiri (%) 10 Çeşit Hisse Senedinden Oluşan Portföydeki Payı (%) 15 Çeşit Hisse Senedinden Oluşan Portföydeki Payı (%) 3.99 3.75 2.65 3.17 4.76 PORTFÖYÜN AYLIK ORT. GETİRİSİ İMKB 100 AYLIK ORT. GETİRİSİ PORTFÖYÜN TREYNOR PERFORMANSI İMKB 100 TREYNOR PERFORMANSI 25 Çeşit Hisse Senedinden Oluşan Portföydeki Payı (%) 5 2 2 2 2 3.92 3.91 3.80 3.54 3.54 3.54 1.374460 0,762067 0,191878 -0.0011 -0.0011 -0.0011 Treynor performans değerleme yöntemi bilindiği üzere portföyün birim sistematik riski baĢına getirisini ifade etmektedir. Portföylerin Treynor performansları ve aylık ortalama getirileri kıyaslandığında ise Ģu sonuçlar ortaya çıkmaktadır: 10 hisse senedinden oluĢturulan portföyün aylık ortalama getirisi % 3,92, 15 hisse senedinden oluĢturulan portföyün aylık ortalama getirisi % 3,91 ve 25 hisse senedinde oluĢturulan portföyün ortalama getirisi % 3,80 çıkmıĢtır. Sonuç olarak aylık ortalama getirisi en yüksek olan portföy 10 hisse senedinden oluĢan portföydür. Portföylerin Treynor performansları ise Ģu Ģekildedir: 10 hisse senedinden oluĢan portföyün performansı 1,374460, 15 hisse senedinde oluĢan portföyün performansı 0,762067 ve 25 hisse senedinden oluĢan portföyün performansı da 0,191878‟dir. Bu sonuçlara göre birim sistematik risk baĢına en yüksek getiriyi sağlayan portföy 10 hisse senedinden oluĢan portföydür. ĠMKB 100 endeksinin Treynor performansı ise yine endeks getirisinin risksiz faiz oranından düĢük çıkması nedeniyle negatif bir değer almıĢtır. Bilindiği üzere piyasanın betası 1‟dir. 75 Sonuç olarak; genetik algoritma yardımıyla 10, 15 ve 25 hisse senedinden oluĢturulan portföyler piyasanın üzerinde performans göstermiĢtir. Jensen Performans Değerleme Yöntemi Jensen performans değerleme yöntemine göre sonuçlar aĢağıdaki gibidir: Şekil 5.6. Jensen Performans Hesaplamasının Program Görünümü Yukarıdaki Ģekilde 10 hisse senedinden oluĢturulan portföyün Jensen performans hesaplamasının program görünümü verilmiĢtir. Aynı uygulama 15 ve 25 hisse senedinden oluĢan portföyler için de gerçekleĢtirilmiĢtir. AĢağıdaki tabloda 10, 15 ve 25 hisse senedinden oluĢturulan portföylerin aylık ortalama getirileri ve Jensen performansları gösterilmiĢtir. 76 Çizelge 5.3. 10, 15 ve 25 Hisse Senedinden Oluşan Portföylerin JENSEN Performansları ve Aylık Ortalama Getirileri Hisse Kodu PARSN MMART BRSAN FROTO EGEEN EGPRO DOHOL SNPAM PINSU TRKCM FINBN MIPAZ GUSGR TUPRS ASELS PNSUT ISCTR UNYEC ATLAS MIGRS DITAS MAALT FFKRL HURGZ IZOCM ECZYT KORDS AKBNK Aylık Ortalama Getiri (%) 4.00 3.06 3.11 4.55 3.86 4.61 4.04 2.69 4.05 3.93 4.69 3.15 3.63 4.27 3.92 4.65 4.69 4.15 3.32 4.20 3.43 3.57 4.15 4.18 4.24 3.81 3.30 4.16 PORTFÖYÜN AYLIK ORT. GETİRİSİ İMKB 100 AYLIK ORT. GETİRİSİ PORTFÖYÜN JENSEN PERFORMANSI İMKB 100 JENSEN PERFORMANSI 10 Çeşit Hisse Senedinden Oluşan Portföydeki Payı (%) 10 14 3 10 16 12 8 2 12 13 15 Çeşit Hisse Senedinden Oluşan Portföydeki Payı (%) 7 10 4 3 4 12 15 6 2 2 11 12 3 3 6 25 Çeşit Hisse Senedinden Oluşan Portföydeki Payı (%) 2 4 7 9 4 16 2 4 5 6 5 2 2 4 2 2 3 4 2 3 2 2 3 3 2 3.92 3.80 4.00 3.54 3.54 3.54 0.017366 0.015027 0.014257 0 0 0 77 Portföylerin aylık ortalama getirileri ve Jensen performansları hesaplandığında ise Ģu sonuçlar elde edilmiĢtir: 10 hisse senedinden oluĢan portföyün aylık ortalama getirisi % 3,92, 15 hisse senedinden oluĢan portföyün aylık ortalama getirisi % 3,80 ve 25 hisse senedinden oluĢan portföyün aylık ortalama getirisi de % 4,00 çıkmıĢtır. Bu sonuçlara göre ortalama getirisi en yüksek olan portföy 25 hisse senedinden oluĢan portföydür. Jensen performansları ise Ģu Ģekilde yorumlanabilir; bilindiği gibi bir portföyün Jensen performansının pozitif olması, o portföyün piyasanın üzerinde bir performans gösterdiğinin göstergesidir. Genetik algoritma yardımıyla ortaya çıkan portföylerden 10 hisse senedinden oluĢan portföyün performansı 0,017366, 15 hisse senedinden oluĢan portföyün performansı 0,015027 ve 25 hisse senedinden oluĢan portföyün performansı da 0,014257 çıkmıĢtır. Dolayısıyla 10 hisse senedinden oluĢan portföy, diğer portföylere tercih edilecektir. Farklı Performans Değerleme Yöntemlerine Göre Bulunan Portföylerin 2007/07 – 2008/12 Dönemi Piyasa Verileriyle Karşılaştırılması 1995 – 2007/6 döneminde farklı performans ölçütlerine göre oluĢturulan portföylerin 2007/07 – 2008/12 dönemindeki getirileri ve performansları piyasa getirisi ve performansıyla kıyaslanmıĢtır. Bu noktada dikkat edilmesi gereken nokta; bu dönem içerisinde küresel mali krizin hisse senetleri piyasalarını olumsuz etkilemesidir. Bu dönem içerisinde hisse senetleri piyasaları olumsuz beklentiler neticesinde negatif getiriler sağlamıĢlardır. Bu negatif getirilerin sonucu olarak da portföy performansları negatif çıkmıĢtır. Bir baĢka ifade ile bu dönemde hisse senetleri yerine risksiz faiz oranı veren hazine bonosu, devlet tahvili ya da banka mevduatına yatırım yapmak rasyonel bir yatırım davranıĢıdır. AĢağıda yer alan tablolarda 1995 – 2007/6 döneminde farklı performans ölçütlerine göre oluĢturulan portföyler, 2007/07 – 2008/12 dönemindeki getirileri ve performansları piyasa getirisi ve performansıyla kıyaslanmaktadır. 78 Sharpe Performans Değerleme Yöntemi Çizelge 5.4. 1995 – 2007/6 Döneminde Oluşturulan Portföyün 2007/07 – 2008/12 dönemindeki Sharpe Performansı ve Piyasa Performansıyla Kıyaslaması Hisse Kodu CIMSA KENT HURGZ IZOCM FFKRL UNYEC DOHOL AKBNK MIGRS GARAN EGPRO PNSUT TUPRS MRDIN ADANA YKBNK FROTO ASELS AYGAZ FINBN ASLAN FMIZP ISCTR PINSU SISE TRKCM GENTS EREGL ECZYT ANACM BUCIM 2007/07-2008/12 Aylık Ortalama Getiri (%) -5.07 -3.06 -5.8 -3.34 -4.59 -5.04 -5.1 -2.13 -2.41 -2.96 -4.35 -4.20 -3.03 -2.58 -5.84 -1.82 -5.08 -3.98 -3.72 -1.25 -0.54 -2.30 -2.06 -4.98 -4.31 -5.67 -3.08 -1.80 -4.28 -3.97 -2.32 PORTFÖYÜN AYLIK ORT. GET. İMKB 100 AYLIK ORT. GETİRİSİ PORTFÖYÜN SHARPE PERFORMANSI İMKB 100 SHARPE PERFORMANSI 10 Çeşit Hisse 15 Çeşit Hisse 25 Çeşit Hisse Senedinden Senedinden Senedinden Oluşan Portföydeki Oluşan Portföydeki Oluşan Portföydeki Payı (%) Payı (%) Payı (%) 4 4 14 16 6 3 16 20 11 6 5 3 7 3 10 4 6 2 7 2 2 4 12 4 3 4 17 6 2 20 6 5 6 2 3 7 11 2 -3.78 -3.07 -3.61 -3.07 2 2 3 8 6 2 2 2 2 2 2 -4.18 -3.07 -0.039490 -0.035830 -0.03994 -0.00374 -0.00374 -0.00374 1995 – 2007/06 döneminde genetik algoritma yardımıyla Sharpe performans değerleme yöntemine göre oluĢturulan 10, 15 ve 25 hisse senedinden oluĢturulan 79 portföyün, 2007/07 – 2008/12 dönemindeki aylık ortalama getirileri sırasıyla -%3,78, %3,61 ve -%4,18 çıkmıĢtır. Bu dönem içerisinde ĠMKB 100 bileĢik endeksinin aylık ortalama getirisi -%3,07 çıkmıĢtır. Bu sonuçlarda negatif getirisi en düĢük olan portföy, geçmiĢ dönemde olduğu gibi 15 hisse senedinden oluĢturulan portföy çıkmıĢtır. Diğer portföylerin getirileri kıyaslandığında ise 10 hisse senedinden oluĢan portföyün getirisi, 25 hisse senedinden oluĢan portföyün getirisinden daha yüksektir. Portföylerin performansları kıyaslandığında ise Ģu sonuçlara ulaĢılmaktadır: 10, 15 ve 25 hisse senedinden oluĢan portföylerin performansları sırasıyla -0.039490, 0.035830 ve -0.03994‟tür. Bu dönem içerisinde tüm hisse senetlerinin getirileri negatif olduğu için portföy performansları da negatif bir değer almıĢtır. Bu dönem içerisinde risksiz faiz oranı ise %1,39 olarak hesaplanmıĢtır. Portföy performanslarının negatif değerler alması, hiçbir portföyün seçilmemesini gerektirir. Ancak, portföylerimiz sadece hisse senetlerinden oluĢmaktadır ve dönem içerisinde hisse senetlerinin ortalama getirileri negatiftir. ĠMKB 100 bileĢik endeksinin Sharpe performansı ise -0,00374 çıkmıĢtır. Sonuç olarak önceki dönemde oluĢturulan portföyler piyasanın altında bir Sharpe performansı göstermiĢlerdir. Bunun temel nedenleri; ĠMKB 100 endeksinde oluĢturduğumuz portföylerden daha fazla hisse senedinin bulunması, bir baĢka deyiĢle çeĢitlendirmenin fazla olması, önceki dönemde oluĢturulan portföyde yer alan hisse senetlerinin büyük oranda mali sektör, taĢ ve toprağa dayalı sanayi ve otomotiv sektöründen oluĢmasıdır (%53). Bilindiği üzere küresel mali krizin en fazla etkilediği sektörler mali sektör, inĢaat ve otomotiv sektörüdür. Bunun yanında portföylerde yer alan bazı firmaların üretime ara vermeleri ve Doğan Grubuna bağlı firmaların (MIPAZ, DOHOL, HURGZ, vb.) hisse senetleri fiyatlarının, Doğan Holding Yönetim Kurulu BaĢkanının hükümete karĢı olumsuz tutumundan dolayı hızlı değer kayıplarının da göz önünde bulundurulması gerekmektedir. Portföyde bu senetlerin oranının fazla olması portföy performanslarının piyasa performansının altında kalmasına neden olmuĢtur. Treynor Performans Değerleme Yöntemi Çizelge 5.5.‟te Treynor portföy performansları verilmektedir. 80 Çizelge 5.5. 1995 – 2007/6 Döneminde Oluşturulan Portföyün 2007/07 – 2008/12 dönemindeki Treynor Performansı ve Piyasa Performansıyla Kıyaslaması Hisse Kodu BUCIM IZOCM ECZYT YKFIN FFKRL PINSU DOGUB EGPRO TIRE ADANA KCHOL MIGRS CIMSA GENTS KENT SONME ASELS UNYEC DEVA USAK ISCTR MIPAZ UCAK TSKB KONYA GARAN PKENT TEKST ECILC PETKM FROTO ALCAR BAGFS EREGL TUPRS MUTLU HURGZ VKFYT ASLAN FMIZP 2007/07-2008/12 Aylık Ortalama Getiri (%) -2.32 -3.34 -3 -5.13 -4.59 -4.98 -3.08 -4.35 -1.64 -5.84 -3.04 -2.41 -5.07 -3.08 -3.06 -8.23 -3.98 -5.04 -4.73 -7.17 -2.06 -8.83 -4.07 -3.11 -2.48 -2.96 -0.18 -7.82 -4.27 -3.61 -5.08 -5.04 2.42 -1.80 -3.03 -5.23 -4.83 -4.16 -0.54 -2.30 10 Çeşit Hisse Senedinden Oluşan Portföydeki Payı (%) 10 19 5 11 4 16 2 9 14 10 15 Çeşit Hisse Senedinden Oluşan Portföydeki Payı (%) 25 Çeşit Hisse Senedinden Oluşan Portföydeki Payı (%) 11 2 3 3 2 4 8 4 3 12 2 7 15 5 3 9 3 11 10 8 2 3 3 2 4 3 6 17 2 3 2 4 4 3 4 5 2 81 Hisse Kodu CELHA ADNAC MRDIN Aylık Ortalama Getiri (%) 10 Çeşit Hisse Senedinden Oluşan Portföydeki Payı (%) 15 Çeşit Hisse Senedinden Oluşan Portföydeki Payı (%) -0.76 -4.49 -2.58 PORTFÖYÜN AYLIK ORT. GETİRİSİ İMKB 100 AYLIK ORT. GETİRİSİ PORTFÖYÜN TREYNOR PERFORMANSI İMKB 100 TREYNOR PERFORMANSI 25 Çeşit Hisse Senedinden Oluşan Portföydeki Payı (%) 2 2 2 -3.83 -3.07 -4.03 -3.07 -3.45 -3.07 -0.093769 -0.106200 -0.0915 -0.0446 -0.0446 -0.0446 1995 – 2007/06 döneminde genetik algoritma yardımıyla Treynor performans değerleme yöntemine göre oluĢturulan 10, 15 ve 25 hisse senedinden oluĢturulan portföyün, 2007/07 – 2008/12 dönemindeki aylık ortalama getirileri sırasıyla -%3,83, %4,03 ve -%3,45 çıkmıĢtır. Bu dönem içerisinde ĠMKB 100 bileĢik endeksinin aylık ortalama getirisi -%3,07‟dir. Bu sonuçlarda negatif getirisi en düĢük olan portföy 25 hisse senedinden oluĢturulan portföy çıkmıĢtır. Diğer portföylerin getirileri kıyaslandığında ise 10 hisse senedinden oluĢan portföyün getirisi, 15 hisse senedinden oluĢan portföyün getirisinden daha yüksektir. Portföylerin performansları kıyaslandığında ise Ģu sonuçlara ulaĢılmaktadır: 10, 15 ve 25 hisse senedinden oluĢan portföylerin performansları sırasıyla -0.093769, 0.1062 ve -0.0915‟tir. Bu dönem içerisinde tüm hisse senetlerinin getirileri negatif olduğu için portföy performansları da negatif bir değer almıĢtır. Önceden de değinildiği üzere bir portföyün Treynor performansının negatif çıkması o portföyün düĢük performanslı bir portföy olduğunu ifade etmemektedir. Bu durumda portföyün kabul edilebilir minimum getirinin üzerinde olup olmadığına bakılmaktadır. Ancak önceki dönemde oluĢturulan portföylerin yeni dönemdeki getirileri negatif oldukları için bu portföylerin hiçbirinin kabul edilmemesi gerekir. ĠMKB 100 bileĢik endeksinin Treynor performansı ise -0,0446 çıkmıĢtır. Sonuç olarak önceki dönemde oluĢturulan portföyler piyasanın altında bir Treynor performansı göstermiĢlerdir. Treynor performansı sonucunda oluĢturulan portföylerdeki mali sektör, 82 taĢ ve toprağa dayalı sanayi ve otomotiv sektöründen %48,83 oranında hisse senedi bulunmaktadır. Jensen Performans Değerleme Yöntemi Çizelge 5.6. 1995 – 2007/6 Döneminde Oluşturulan Portföyün 2007/07 – 2008/12 dönemindeki Jensen Performansı ve Piyasa Performansıyla Kıyaslaması Hisse Kodu PARSN MMART BRSAN FROTO EGEEN EGPRO DOHOL SNPAM PINSU TRKCM FINBN MIPAZ GUSGR TUPRS ASELS PNSUT ISCTR UNYEC ATLAS MIGRS DITAS MAALT FFKRL HURGZ IZOCM ECZYT KORDS AKBNK 2007/07-2008/12 Aylık Ortalama Getiri (%) -6.3 -6.74 -2.65 -4.56 -5.71 -4.35 -5.1 -7.47 -4.98 -5.67 -1.25 -8.83 -2.40 -3.03 -3.98 -4.20 -2.06 -5.04 -4.80 -2.41 -3.62 -6.81 -6.36 -4.83 -3.34 -4.28 -5.54 -2.13 PORTFÖYÜN AYLIK ORT. GET. İMKB 100 AYLIK ORT. GET. PORTFÖYÜN JENSEN PERF. İMKB 100 JENSEN PERF. 10 Çeşit Hisse Senedinden Oluşan Portföydeki Payı (%) 10 14 3 10 16 12 8 2 12 13 -5.44 -3.07 -0.038110 0 15 Çeşit Hisse Senedinden Oluşan Portföydeki Payı (%) 7 10 4 3 4 12 15 6 2 2 11 12 3 3 6 -5.18 -3.07 -0.038210 0 25 Çeşit Hisse Senedinden Oluşan Portföydeki Payı (%) 2 4 7 9 4 16 2 4 5 6 5 2 2 4 2 2 3 4 2 3 2 2 3 3 2 -4.54 -3.07 -0.025006 0 83 1995 – 2007/06 döneminde genetik algoritma yardımıyla Jensen performans değerleme yöntemine göre oluĢturulan 10, 15 ve 25 hisse senedinden oluĢturulan portföyün, 2007/07 – 2008/12 dönemindeki aylık ortalama getirileri sırasıyla -%5,44, %5,18 ve -%4,54 çıkmıĢtır. Bu dönem içerisinde ĠMKB 100 bileĢik endeksinin aylık ortalama getirisi -%3,07‟dir. Bu sonuçlarda negatif getirisi en düĢük olan portföy 25 hisse senedinden oluĢturulan portföy çıkmıĢtır. Diğer portföylerin getirileri kıyaslandığında ise 15 hisse senedinden oluĢan portföyün getirisi, 10 hisse senedinden oluĢan portföyün getirisinden daha yüksektir. Portföylerin performansları kıyaslandığında ise Ģu sonuçlara ulaĢılmaktadır: 10, 15 ve 25 hisse senedinden oluĢan portföylerin performansları sırasıyla -0.03811, 0.03821 ve -0.025006‟dır. Bu dönem içerisinde tüm hisse senetlerinin getirileri negatif olduğu için portföy performansları da negatif bir değer almıĢtır. Portföy performansları negatif değerler aldıkları için, bir baĢka deyiĢle piyasa performansının (sıfır) altında değer aldıkları için kabul edilmeyeceklerdir. ĠMKB 100 bileĢik endeksinin Jensen performansı betası 1 olduğu için 0‟dır. Jensen performansı sonucunda oluĢturulan portföylerdeki mali sektör, taĢ ve toprağa dayalı sanayi ve otomotiv sektöründen %42,85 oranında hisse senedi bulunmaktadır. 5.6 Yayılım Değerlendirme aĢamasında geliĢtirilen uygulama yazılımı kullanıma sunulmuĢtur . 84 SONUÇ Gerek bireysel gerekse kurumsal yatırımcılar ellerindeki fazla fonları çeĢitli yatırım araçlarında değerlendirirler. Bu yatırım araçları; hisse senetleri, tahviller, hazine bonoları, altın, vb. içerir. Tüm yatırımcıların ortak amacı ise bu yatırım araçlarından elde ettikleri getirinin piyasanın üzerinde olmasını sağlamaktır. Bir baĢka ifadeyle oluĢturdukları portföylerin getirilerini, piyasa getirisiyle kıyaslarlar. Genel olarak piyasa getirisi, risksiz faiz oranıdır. Bir baĢka deyiĢle, yatırımcıların belli bir vadenin sonunda kesin olarak sağlayacakları getiri oranıdır. Genellikle bu oran, o dönemdeki hazine bonolarının ortalama faiz oranı olarak tanımlanabilir. Bunun yanında repo faiz oranları ya da bankaların mevduat faiz oranları da risksiz faiz oranı olarak değerlendirilebilir. Yatırımcılar oluĢturdukları portföyleri iĢte bu risksiz faiz oranıyla kıyaslamaktadırlar. Portföyleri bu oranın üzerinde getiri sağladığında yüksek performanslı, altında getiri sağladığında ise düĢük performanslı olarak değerlendirilir. Piyasa kavramı yatırım çeĢitlerine göre değiĢiklik göstermektedir. Eğer portföy sadece hisse senetlerinden oluĢuyorsa piyasa kavramı, o ülkenin temel hisse senedi piyasası endeksidir. Ülkemizde ise bu endeks ĠMKB 100 bileĢik endeksidir. Portföyü farklı menkul kıymetlerden bir çeĢitlendirme yapmadan, sadece hisse senetlerinden oluĢturmak oldukça riskli bir durumdur. Çünkü hisse senedi piyasaları sistematik ve sistematik olmayan risk unsurlarından daha fazla ve hızlı etkilenmektedir. Dolayısıyla portföyünü sadece hisse senetlerinden oluĢturacak yatırımcıların performans kıyaslaması hem risksiz faiz oranını hem de o ülkenin hisse senedi piyasası temel göstergesi (ĠMKB 100) olacaktır. Eğer oluĢturulan portföy, risksiz faiz oranı ve ĠMKB 100 bileĢik endeksi getiri ortalamasının üzerindeyse yüksek performanslı, altındaysa düĢük performanslı portföyler olarak tanımlanacaktır Bu çalıĢmada genetik algoritma yardımıyla sadece hisse senetlerinden oluĢan portföyler oluĢturulmuĢ kıyaslanmıĢtır. ve portföy performansları piyasa performanslarıyla 85 AraĢtırma sonuçlarına göre verilen kısıtlar dahilinde Sharpe oranına göre oluĢturulan 10, 15 ve 25 hisse senedinden oluĢan portföylerin performansları ve ortalama getirileri, piyasanın üzerinde çıkmıĢtır. Bu portföylerden 15 hisse senedinden oluĢturulan portföyün ortalama getirisi daha yüksek çıkmasına rağmen, 10 hisse senedinden oluĢan portföy diğer portföylerden daha yüksek performans göstermiĢtir. Burada en dikkat çekici sonuç; piyasanın (ĠMKB 100) ortalama getirisinin risksiz faiz oranının ortalama getirisinden düĢük çıkması ve sonucunda da Sharpe performansının negatif çıkmasıdır. Treynor Performans Değerleme Yöntemine göre oluĢturulan portföy performansları da piyasa performansının üzerinde çıkmıĢtır. Portföyler kendi aralarında kıyaslandığında ise yine 10 hisse senedinden oluĢturulan portföyün hem ortalama getiri bakımından hem de performans bakımından en yüksek performansa sahip olduğu görülmektedir. Jensen Performans Değerleme Yöntemine göre oluĢturulan portföy performansları yine piyasa performansının üzerinde çıkmıĢtır. Portföyler kendi aralarında kıyaslandığında ise yine 10 hisse senedinden oluĢturulan portföyün en yüksek performansa sahip olduğu görülmektedir. En yüksek getiriye sahip portföy ise 25 hisse senedinden oluĢturulan portföydür. 1995 – 2007/06 dönemindeki veriler sonucunda farklı performans ölçütlerine göre oluĢturulan portföyler, 2007/07 – 2008/12 döneminde gerçekleĢen verilerle kıyaslandığında ise Ģu sonuçlara ulaĢılmıĢtır: Sonraki dönemde oluĢturulan portföyler küresel mali kriz nedeniyle negatif performans göstermiĢlerdir. Negatif performans göstermelerinin nedenleri kriz nedeniyle Ģirketlerin gelecek dönemlerdeki beklentilerinin olumsuza dönmesi, bazı iĢletmelerin belli süreliğine üretimlerini durdurmaları, krizin özellikle mali sektör, inĢaat sektörü ve otomotiv sektörünü çok olumsuz etkilemesi ve önceki dönem için oluĢturulan portföylerde bu sektörlerde faaliyet gösteren iĢletmelerin oranlarının yüksek olması gibi etkenler gösterilebilir. Bu sonuçlar da göstermektedir ki; özellikle kriz dönemlerinde hisse senetlerine yatırım yapmak yerine hazine bonosu, repo ya da mevduat faizi gibi yatırım araçlarına yönelinmelidir. 86 1995 – 2007/06 dönemi incelendiğinde de 1998‟de Asya krizi, 2000 ve 2001 yıllarında yine özellikle de mali sektörü çok olumsuz etkileyen krizler yaĢanmasına rağmen, uzun vadede hisse senetlerinin risksiz faiz oranının üzerinde getiri ve performans sağlayabileceği görülmektedir. Sharpe perfomans ölçütüne göre oluĢturulan portföylerde HURGZ, IZOCM, DOHOL ve MIGRS hisse senetleri 10, 15 ve 25 hisse senetlerinden oluĢturulan portföylerin tamamında yer alırken, FFKRL hisse senedi 10 ve 15 çeĢit hisse senedinden oluĢturulan portföylerde, EGPRO, PNSUT, TUPRS, MRDIN, ADANA, FROTO ve AYGAZ hisse senetleri de 15 ve 25 çeĢit hisse senedinden oluĢturulan portföylerde yer almıĢtır. Treynor perfomans ölçütüne göre oluĢturulan portföylerde IZOCM ve FFKRL hisse senetleri 10, 15 ve 25 hisse senetlerinden oluĢturulan portföylerin tamamında yer alırken, EGPRO hisse senedi 10 ve 25 çeĢit hisse senedinden oluĢturulan portföylerde, KCHOL ve ISCTR hisse senetleri de 15 ve 25 çeĢit hisse senedinden oluĢturulan portföylerde yer almıĢtır. Treynor perfomans ölçütüne göre oluĢturulan portföylerde PARSN, MMART, BRSAN, FROTO, EGEEN, EGPRO, DOHOL, SNPAM ve TRKCM hisse senetleri 10, 15 ve 25 hisse senetlerinden oluĢturulan portföylerin tamamında yer alırken, PINSU hisse senedi 10 ve 25 çeĢit hisse senedinden oluĢturulan portföylerde, TUPRS, ASELS ve PNSUT hisse senetleri de 15 ve 25 çeĢit hisse senedinden oluĢturulan portföylerde yer almıĢtır. Performans ölçütlerinin birlikte analizi durumunda her performans ölçütünde portföylerde yer alan tek hisse senedi EGPRO‟dur. IZOCM, DOHOL, FFKRL, PNSUT, TUPRS ve FROTO hisse senetleri ise Sharpe ve Treynor performans ölçütlerinin uygulaması sonucunda oluĢturulan portföylerde yer almıĢlardır. Bu çalıĢmada yatırımcıya, tercihine göre seçeceği performans ölçüsünü kullanarak kendi portföyünü oluĢturma imkanı sunulmuĢtur. Aynı zamanda genetik algoritma kullanılarak geliĢtirilen program yardımıyla, gelecekte de veriler veri tabanına 87 girilerek programın güncel olması sağlanmıĢtır. Bu sayede yatırımcılar gelecekte de programı aktif olarak kullanabilecektir. 88 KAYNAKÇA Kitaplar: BERK, N., Finansal Yönetim, Türkmen Kitabevi, 2. Baskı, Ġstanbul, Mayıs, 1995. CEYLAN, A. ve T. KORKMAZ, Borsada Uygulamalı Portföy Yönetimi, Ekin Kitabevi Yayınları, 3. Baskı, Bursa, 1998. JIANG, Y., KE, D., WANG, Y. ve L. Xu, Using Genetic Algorithms to Predict Financial Performance, 2007, 3225-3229. KONURALP, G., Sermaye Piyasaları Analizler, Kuramlar ve Portföy Yönetimi, Alfa Kitapevi, 2.Baskı, Ġstanbul, Mart 2005. RODOPLU, G., Para ve Sermaye Piyasaları, Tuğra Ofset, Isparta, 2001. UĞUZ, M., Menkul Kıymet Seçimi ve Yatırım Yönetimi, Ġstanbul, 1990. USTA, Ö., İşletme Finansı ve Finansal Yönetim, Detay Yayıncılık, 2.Baskı, Ankara, 2005. Makaleler: AKAY, D., ÇETĠNYOKUġ, T. ve M. DAĞDEVĠREN,, “Portföy Seçimi Problemi Ġçin KDS/GA YaklaĢımı”, Gazi Üniv. Müh. Mim. Fak. Der. Cilt 17, No 4, 2002. AKPINAR, H., “Veri Tabanlarında Bilgi KeĢfi ve Veri Madenciliği”, İstanbul Üniversitesi İşletme Fakültesi Dergisi, Cilt:29, Sayı:1, 2000. ARSLAN, M., “A Tipi Yatırım Fonlarında Yöneticilerin Zamanlama Kabiliyeti ve Performans ĠliĢkisi Analizi: 2002-2005 Dönemi Bir Uygulama”, Gazi Üni. Ticaret ve Turizm Eğitim Fak. Der., Sayı 2, 2005. BEYAZIT, M. F., “ĠMKB Betaları, Korelasyon Tahmini ve DeğiĢkenlik”, Doğuş Üniversitesi Dergisi, 6 (1), 2005. CHOEY, M. ve A. S. WEIGEND, “Nonlinear Trading Models Through Sharpe Ratio Maximization”, Working Paper, Decision Technologies for Financial Engineering, 1997. ÇELEBĠ, M., “Genetik Algoritma ile Yağlı Bir Trafonun Maliyet Optimizasyonu”, C.B.Ü. Fen Bilimleri Der., 3.1., 2007. DEMĠRTAġ, Ö. ve Z. GÜNGÖR, “Portföy Yönetimi ve Portföy Seçimine Yönelik Uygulama”, Havacılık ve Uzay Teknolojileri Dergisi, Cilt 1, Sayı 4, Temmuz 2004. DRAKE, A. E. ve R. E. MARKS, “Genetic Algorithms in Economics and Finance: Forecasting Stock Market Prices and Foreign Exchange- A Review”, In Shu- 89 Heng Chen (Ed.) Genetic Algorithms and Genetic Programming in Computational Finance, 2000. EMEL, G. G. ve Ç. TAġKIN, “Genetik Algoritmalar ve Uygulama Alanları”, Uludağ Üni. İİBF Dergisi, Cilt XXI, Sayı 1, 2002. ENGĠN, O. ve A. FIĞLALI, “AkıĢ Tipi Çizelgeme Problemlerinin Genetik Algoritma Yardımı ile Çözümünde Uygun Çaprazlama Operatörünün Belirlenmesi”, Doğuş Üni. Dergisi, 2002/6. ERDEM, O. A. ve E. UZUN, “Yapay Sinir Ağları ile Türkçe Times New Roman, Arial ve Elyazısı Karakterleri Tanıma”, Gazi Üniv. Müh. Mim. Fak. Der., Cilt 20, No 1, 2005. ERDOĞAN, ġ. Z. ve M. TĠMOR, “A Data Mining Application in a Student Database”, Journal of Aeronautics and Space Technologies, Vol. 2, N. 2, 2005. FELDMAN, K. ve P. TRELEAVEN, “Intelligent Systems in Finance”, Applied Mathematical Finance, Vol 1, No. 2, December, 1994. FERNANDEZ, I. B., ZANAKĠS, S. H. ve S. WALCZAK, “ Knowledge Discovery Techniques for Predicting Country Investment Risk”, Computers& Industrial Engineering, No: 43, 2002. GÜRSU, B. ve M. C. ĠNCE, “Genetik Algoritmalar ile Yüksek Gerilim Ġstasyonlarında Optimum Topraklama Ağı Tasarımı”, Fırat Üni. Fen ve Müh. Bil. Der. , 19 (4), 2007. GÜRSOY, C. T. ve Y. Ö. ERZURUMLU, Evaluation of Portfolio Performance of Turkish Investment Funds, Doğuş Üni. Dergisi, 2001/4. HORASANLI, M. ve N. FĠDAN, Portfolio Selection by Using Time Varying Covariance Matrices, Journal of Economic and Social Research, 9(2), 2007. ĠġÇĠ, Ö. ve S. KONUKOĞLU, “Genetik Algoritma YaklaĢımı ve Yöneylem AraĢtırmasında Bir Uygulama”, Celal Bayar Üni. Yönetim ve Ekonomi Dergisi, Cilt:10, S. 2. KARACABEY, A., A., “Is Mean Variance Efficient Than MAD in Ġstanbul?”, International Research Journal of Finance and Economics, Issue 3, 2006. KIM, J. S., KIM, Y. C. ve K. Y. SHIN, “An Algorithm for Portfolio Optimization Problem”, Informatica, Vol. 16, No.1, 2005. KIRLI, M., “Halka Açık Olmayan ġirketlerde Sistematik Risk Ölçütü Beta Katsayısının Tahmin Edilmesi”, Celal Bayar Üni., Yönetim ve Ekonomi Dergisi, Cilt:13, Sayı:1. KORKMAZ, T. ve H. UYGURTÜRK, “Türkiye‟deki Emeklilik Fonları ile Yatırım Fonlarının Performans KarĢılaĢtırması ve Fon Yöneticilerinin Zamanlama Yetenekleri”, Kocaeli Üni. SBE Dergisi (15), 2008. 90 LEINWEBER, D. J. ve R. D. ARNOTT, Quantitative and Computational Innovation in Investment Management, The Journal of Portfolio Management, 1995, 21, 8-15. MAHFOUD, S., MANI G. ve S. REIGEL, Nonlinear versus Linear Techniques for Selecting Individual Stocks, Decision Technologies for Financial Engineering, World Scientific, 1997, 65-75. ÖZEKES, S., “Veri Madenciliği Modelleri ve Uygulama Alanları”, İstanbul Ticaret Üni. Dergisi. PEREIRA, R., “Genetic Algorithm Optimisation for Finance and Investment”, Latrobe University School of Business Discussion Papers, 2000. SAMANTA, G. P. ve S. BORDOLOI, “Predicting Stock Market- an Application of Artificial Neurol Network Technique through Genetic Algorithm”, Finance India, 19(1), 2005. SARAÇ, T. ve F. ÖZÇELĠK, “Alternatif Rotaların Varlığında Üretim Hücrelerinin Genetik Algoritma Kullanılarak OluĢturulması”, Endüstri Müh. Der., Cilt 17, Sayı 4. SEVĠL, G. ve M. ġEN, “Aktif Portföy Yönetimi Çerçevesinde Kâr Payı Verimi Temeline Göre OluĢturulan Portföylerin Performansının Belirlenmesinde Information Oranının Kullanımı: 1990 – 1998 ĠMKB Uygulaması”, İktisat, İşletme Ve Finans Dergisi, Yıl: 16, S. 178, Ocak, 2001 SUBRAMANIAN, S., VENUGOPAL, M. S. ve U. S. RAO, “Usefulness of Genetıc Algorithm Model for Dynamic Portfolio Selection”, Journal of Financial Management and Analysis, 17(1), 2004. TANER, A. T. ve K. KAYALIDERE, “1995-2000 Döneminde ĠMKB‟de Anomali AraĢtırması”, Celal Bayar Üni. Yönetim ve Ekonomi Der., Cilt 9, Sayı 1-2, 2002. TEKER, S., KARAKURUM, E. ve O. TAV, ”Yatırım Fonlarının Risk Odaklı Performans Değerlemesi”, Doğuş Üni. Dergisi, 9 (1), 2008. TURĞUT, P. ve A. ARSLAN, “Sürekli Bir KiriĢte Maksimum Momentlerin Genetik Algoritmalar ile Belirlenmesi”, DEÜ Fen ve Müh. Der., Cilt 3, Sayı 3, 2001. VARETTO, F., “Genetic Algorithms Applications in the Analysis of Insolvency Risk”, Journal of Banking and Finance, 22, 1998, s. 1421-1439. WIRTH, R. ve J. HIPP, “CRIPS-DM : Towards a Standard Process Model for Data Mining”, In Proceedings of the 4th International Conference on the Practical Applications of Knowledge Discovery and Data Mining, Manchester, UK, 2000. YENĠAY, Ö., “An Overview of Genetic Algorithms”, Anadolu Üniversitesi Bilim ve Teknoloji Dergisi, Cilt: 2, Sayı: 1, 2001. 91 YILDIZ, A., “A Tipi Yatırım Fonları Performanslarının ĠMKB ve Fon Endeksi Bazında Değerlendirilmesi”, Muğla Üniversitesi SBE Dergisi, 2005, Sayı 14. Tezler: AKYOL, A. P., Doğrusal Olmayan Ekonometrik Modellerin Genetik Algoritma Yaklaşımı ile Parametre Tahmini, Gazi Üni. SBE, YayımlanmamıĢ Yüksek Lisans Tezi, Ankara, 2006. ABDERREZAK, F., The Performance of Islamic Equity Funds A Comparison to Conventional, Islamic and Ethical Benchmarks, Maastricht Uni., Master Thesis, 2008. COġKUN, A., Genetik Algoritma Kullanılarak Kimyasal Maddelerin Deriden Geçiş Katsayılarının ve Molekül Yapılarının Bulunması, YayınlanmamıĢ Doktora Tezi, Gazi Üni. , FBE, 2006. GENEL, H., Genetik Algoritmalarla Portföy Optimizasyonu, YayınlanmamıĢ Yüksek Lisans Tezi, Ankara Üni. , SBE, ĠĢletme Anabilim Dalı, Ankara, 2004. KAYA, S., Operasyonel Sabit İş Çizelgeleme Problemlerinin Genetik Algoritma ile Çözümü, YayınlanmamıĢ Yüksek Lisans Tezi, Selçuk Üni., FBE, 2006. KOYUNCUGĠL, A. S., Bulanık Veri Madenciliği ve Sermaye Piyasalarına Uygulanması, YayınlanmamıĢ Doktora Tezi Ankara Üni. , FBE, Ġstatistik Anabilim Dalı, Ankara, 2006. MOUSTAFA, Y., Portföy Yönetimi ve Finansal Varlık Fiyatlama Modelinde Risk Getiri İlişkisi, YayınlanmamıĢ Yüksek Lisans Tezi, D.E.Ü. SBE ĠĢletme Anabilim Dalı, 2007. ÖZÇAKIR, F. C., Müşteri İşlemlerindeki Birlikteliklerin Belirlenmesinde Veri Madenciliği Uygulaması, YayınlanmamıĢ Yüksek Lisans Tezi, Marmara Üni. Fen Bil. Ens. , Ġstanbul, 2006. TUĞ, E., Genetik Algoritmalar ile Tıbbi Veri Madenciliği, Selçuk Üni. FBE, YayınlanmamıĢ Yüksek Lisans Tezi, Konya, 2005. YAMAN, M., Genetik Algoritma ile Kardan Mili Tasarımı, YayınlanmamıĢ Yüksek Lisans Tezi, Gazi Üni. FBE, 2007. YILMAZ, E., Kütahya İlinde Sosyal Sınıfların Belirlenmesi ve Veri Madenciliği İle Tüketici Profilinin Çıkarılmasına Yönelik Bir Uygulama, YayınlanmamıĢ Yüksek Lisans Tezi, Dumlupınar Üni. Sosyal Bil. Ens. , Kütahya, 2006. 92 Diğer: İnternet Kaynakları: BAYKASOĞLU, A., Veri Madenciliği ve Çimento Sektöründe Bir Uygulama, <http://ab.org.tr/ab05/tammetin/171.pdf>, (30.11.2007). BOZDAĞ, N., ALTAN, ġ. ve S. DUMAN, Minimaks Portföy Modeli ile Markowitz Ortalama-Varyans Modelinin Karşılaştırılması, <http://www.ekonometridernegi.org/bildiriler/o24s1.pdf>, (30.10.2007). DÖNMEZ, S. “Regresyon Analizi ve Genetik Algoritmanın Esasları”, <http://yilmazeray.googlepages.com/selim_dergimakalesi.doc>, (15.08.2008). Genetic Server/Library, Crossover, <http://www.nd.com/products/genetic/crossover.htm>, (01.01.2008). KAPLAN, P. D., Asset Allocation Models Using The Markowitz Approach, <http://corporate.morningstar.com/ib/documents/MethodologyDocuments/I BBAssociates/MarkowitzApproach.pdf>, (01.01.2008). KAYA, E., BULUN, M. ve A. ARSLAN, Tıpta Veri Ambarları Oluşturma ve Veri Madenciliği Uygulamaları, <http://ab.org.tr/ab03/tammetin/96.doc>, (01.07.2008). KURT, M. ve C. SEMETAY, Genetik Algoritma ve Uygulama Alanları, <http://www.mmo.org.tr/muhendismakina/arsiv/2001/ekim/Genetik_Algorit ma.htm>, (30.05.2008). KÜÇÜKKOCAOĞLU, G., Portföy ve Performans Ölçümleri, <http://www.baskent.edu.tr/~gurayk/investendeksmodelleri.pdf>, (01.01.2008). OKUYUCU, U., Genetik Algoritmalar, <http://www.bilmuh.gyte.edu.tr/BIL523/presentations/ufuk/GenetikAlgorit malarRapor.doc>, (01.01.2008). ÖZGÜLBAġ, N. ve A. S. KOYUNCUGĠL, İMKB’de İşlem Gören KOBİ’lerin Veri Madenciliği Karar Ağaçları Algoritmalarından Chaid ile Profillendirilmesi ve Küreselleştirme Sürecinde Güçlü ve Zayıf Yönlerinin Belirlenmesi, <http://www.finansbilim.com/ufs2006/Makaleler/IMKBDEISLEMGOREN. pdf>, (01.01.2008). ÖZMEN, ġ., İş Hayatı Veri Madenciliği İle İstatistik Uygulamalarını Yeniden Keşfediyor, <http://idari.cu.edu.tr/sempozyum/bil38.htm>, (01.01.2008). SMYTH, P., Breaking Out of the Black Box: Research Challenges in Data Mining, <http://www.cs.cornell.edu/johannes/papers/dmkd2001papers/p2_smythe.pdf>, (30.10.2008). 93 TATE, D. M. ve A. E. SMITH, Expected Allele Coverage and the Role of Mutation in Genetic Algorithms, http://reference.kfupm.edu.sa/content/e/x/expected_allele_coverage_and_the _role_of_529189.pdf, (01.01.2008). THEARLING, K., An Introduction to Data <http://thearling.com/text/dmwhite/dmwhite.htm>, (15.08.2008). Mining, UYAN, M. ve T. ÇAY, Mekansal Uygulamalar için Veri Madenciliği Yaklaşımı, <http://www.uzalcbs2008.org/pdf/77.pdf>, (01.10.2008). YARALIOĞLU,K.,Veri Madenciliği, <http://www.deu.edu.tr/userweb/k.yaralioglu/dosyalar/ver_mad.doc>, (31.11.2007). Raporlar: SEIFERT, J. W., Data Mining: An Overview, CRS Report for Congress, 2004. 94 EKLER EK-1 Programa Ait Kodlar using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; using System.Drawing; using System.Text; using System.Windows.Forms; using System.Threading; namespace HisseOptimizasyon { public partial class Form1 : Form { decimal[,] kromozomi; decimal[,] kromozom; decimal fitnesstoplam = new decimal(); int toplam = 0; decimal optdeger = new decimal(); DataTable gidecek; public Form1() { InitializeComponent(); } private void button1_Click(object sender, EventArgs e) { toplam = 0; dataGridView1.DataSource = null; int dizisiniri = ((int)udhisseayi.Value * 2); int altsinir = (int)udaltsinir.Value; int ustsinir = (int)udustsinir.Value; kromozomi = new decimal[100, (dizisiniri + 1)]; kromozom = new decimal[80, (dizisiniri + 1)]; genetic yeni = new genetic(dizisiniri+1,altsinir,ustsinir,cmbolcut.Text.Trim()); label6.Text = "BaĢlangıç Kromozomları OluĢturuluyor"; Application.DoEvents(); for (int i = 0; i < 100; i++) { 95 decimal[,] donen=new decimal[1,(dizisiniri + 1)]; if (cmbolcut.Text != "Treynor") donen = yeni.genolustur(); else { while (donen[0, dizisiniri] == 0) { donen = yeni.genolustur(); } } for (int j = 0; j <dizisiniri ;j += 2) { kromozomi[i, j] = donen[0,j]; kromozomi[i, j + 1] = donen[0, j+1]; } kromozomi[i, dizisiniri] = donen[0, dizisiniri]; Thread.Sleep(50); MessageBox.Show(i.ToString()); } label6.Text = "Sıralama ĠĢlemi Yapılıyor"; Application.DoEvents(); yeni.sirala(kromozomi); //Ģimdi ilk 20 eleman alinarak kromozom dizisine aktarilacak for (int i = 0; i < 20; i++) { for (int j = 0; j < dizisiniri; j+=2) { kromozom[i, j] = kromozomi[i,j]; kromozom[i, j + 1] = kromozomi[i, j+1]; } kromozom[i,dizisiniri] = kromozomi[i, dizisiniri]; } if (textBox1.Text == "") { for (int i = 0; i < (int)uditerasyon.Value; i++) { toplam += 1; fitnesstoplam = yeni.fitnesstoplam(kromozom); yeni.RouletteSelection(kromozom, fitnesstoplam); yeni.crossover(kromozom); yeni.mutation(kromozom); yeni.sirala(kromozom); Array.Clear(kromozom, (dizisiniri + 1) * 20, kromozom.Length ((dizisiniri + 1) * 20)); label6.Text = toplam.ToString() + "." + " iterasyon"; 96 Application.DoEvents(); } } else { while(kromozom[0,dizisiniri]<=optdeger) { toplam += 1; fitnesstoplam = yeni.fitnesstoplam(kromozom); yeni.RouletteSelection(kromozom, fitnesstoplam); yeni.crossover(kromozom); yeni.mutation(kromozom); yeni.sirala(kromozom); Array.Clear(kromozom, (dizisiniri + 1) * 20, kromozom.Length ((dizisiniri + 1) * 20)); label6.Text = toplam.ToString() + "." + " iterasyon"; Application.DoEvents(); if (toplam == 3000) { label6.Text = "Ġstenilen Sonuca UlaĢılamadı. Lütfen Tekrar Deneyiniz"; kromozom[0, dizisiniri] = optdeger; break; } } } string[,] sonuc = yeni.isimolustur(kromozom); DataTable dt = new DataTable("Sonuclar"); for (int i = 1; i <= dizisiniri+1; i++) { if (i % 2 == 1 && i!= (dizisiniri + 1)) dt.Columns.Add("Yüzde" + i.ToString(), System.Type.GetType("System.String")); if (i % 2 == 0 && i!= (dizisiniri + 1)) dt.Columns.Add("Hisse"+i.ToString() , System.Type.GetType("System.String")); if(i==(dizisiniri+1)) dt.Columns.Add("Portföy Performansı", System.Type.GetType("System.String")); } for (int i = 0; i < 20; i++) { DataRow dr = dt.NewRow(); 97 for (int j = 0; j < (dizisiniri+1); j++) { dr[j] = sonuc[i,j]; } dt.Rows.Add(dr); } dataGridView1.DataSource = dt; gidecek = dt; } private void label1_Click(object sender, EventArgs e) { } private void numericUpDown1_ValueChanged(object sender, EventArgs e) { } private void dataGridView1_CellClick(object sender, DataGridViewCellEventArgs e) { try { optdeger = Convert.ToDecimal(dataGridView1.Rows[e.RowIndex].Cells[e.ColumnIndex].Value.T oString()); textBox1.Text = dataGridView1.Rows[e.RowIndex].Cells[e.ColumnIndex].Value.ToString(); } catch (Exception ee) { } } private void button2_Click(object sender, EventArgs e) { Sonuc frm = new Sonuc(gidecek,(int)udhisseayi.Value); frm.ShowDialog(); frm = null; } 98 } } using System; using System.Collections.Generic; using System.Text; using System.Data.SqlClient; namespace HisseOptimizasyon { class genetic { private string[] hisseadi; private decimal[] sharp; private decimal[] beta; private int[] rula; private int[] rulb; private decimal[,] kromozomcross; private decimal[,] kromozommutation; private int hisseadedi; private int uzunlukdizi; private int altsinirilk; private int ustsinirilk; private string secolcut; public genetic(int diziuzun,int gelen,int gelen1,string olcut) { secolcut = olcut; altsinirilk = gelen; ustsinirilk = gelen1; hisseadedi = (diziuzun - 1) / 2; uzunlukdizi = diziuzun; kromozomcross = new decimal[40, diziuzun]; kromozommutation = new decimal[40, diziuzun]; SqlConnection con = new SqlConnection(@"Data Source=TUNCAYPC\SQLEXPRESS;Initial Catalog=engin;User ID=sa;Password=q"); hisseadi = new string[122]; sharp = new decimal[122]; beta = new decimal[122]; try { con.Open(); string sorgu = ""; 99 if(olcut=="Sharp") sorgu="select menkulkodu,sharp from sharporan order by menkulkodu"; if(olcut=="Treynor") sorgu="select menkulkodu,sharp,beta from sharporan order by menkulkodu"; if(olcut=="Jensen") sorgu="select menkulkodu,sharp,beta from sharporan order by menkulkodu"; SqlCommand cmd = new SqlCommand(sorgu,con); SqlDataReader dr = cmd.ExecuteReader(); int sayi = 0; while (dr.Read()) { hisseadi[sayi] = dr.GetString(0); sharp[sayi] = dr.GetDecimal(1); if (olcut == "Treynor" || olcut=="Jensen") beta[sayi] = dr.GetDecimal(2); sayi++; } dr.Close(); con.Close(); } catch (Exception e) { con.Close(); System.Windows.Forms.MessageBox.Show(e.Message); } } public int[] rulaogren { get { return rula; } set { rula = value; } } public int[] rulbogren { get { 100 return rulb; } set { rulb = value; } } public int[] yuzdeolustur(int hissesay,int altsinir,int ustsinir) { int[] dizi = new int[hissesay]; Random rnd = new Random(); int toplam = 0; int ara = 0; int sayi = 0; int deger = 0; bool oldu = false; int stoplam = 0; for (int i = 0; i < hissesay; i++) { dizi[i] = rnd.Next(altsinir, rnd.Next(altsinir + 1, ustsinir + 2)); toplam += dizi[i]; } ara = toplam - 100; if (ara == -1) { while (oldu == false) { deger = rnd.Next(0, hissesay); if (dizi[deger] + 1 <= ustsinir) { dizi[deger] += 1; oldu = true; } } } else if (ara < -1) { bool araoldu = false; while (oldu == false) { if (ara <= -ustsinir) sayi = rnd.Next(0, 10); else sayi = rnd.Next(0, 10); deger = rnd.Next(0, hissesay); 101 if (ara == -1) { while (araoldu == false) { deger = rnd.Next(0, hissesay); if (dizi[deger] + 1 <= ustsinir) { dizi[deger] += 1; araoldu = true; } } ara = 0; } if (ara != 0) { if (dizi[deger] + sayi <= ustsinir && toplam + sayi <= 100 && ara + sayi <= 0) { dizi[deger] += sayi; ara += sayi; toplam += sayi; } } if (toplam == 100 || ara == 0) oldu = true; } } else if (ara == 1) { while (oldu == false) { deger = rnd.Next(0, hissesay); if (dizi[deger] - 1 >= altsinir) { dizi[deger] -= 1; oldu = true; } } } else if (ara > 1) { 102 bool araoldu = false; while (oldu == false) { if (ara <= ustsinir) sayi = rnd.Next(0, 10); else sayi = rnd.Next(0, 10); deger = rnd.Next(0, hissesay); if (ara == 1) { while (araoldu == false) { deger = rnd.Next(0, hissesay); if (dizi[deger] - 1 >= altsinir) { dizi[deger] -= 1; araoldu = true; } } ara = 0; } if (ara != 0) { if (dizi[deger] - sayi >= altsinir && toplam - sayi >= 100 && ara - sayi >= 0) { dizi[deger] -= sayi; ara -= sayi; toplam -= sayi; } } if (toplam == 100 || ara == 0) oldu = true; } } return dizi; } public int[] hisseolustur(int hsay) { int[] dizi = new int[hsay]; Random rnd = new Random(); bool buldu = false; int sonuc = 0; 103 int sayi = 0; for (int i = 0; i < hsay; i++) { sayi = rnd.Next(1, 123); buldu = false; while (buldu == false) { sayi = rnd.Next(1, 123); sonuc = Array.IndexOf(dizi, sayi); if (sonuc == -1) { dizi[i] = sayi; buldu = true; } } } return dizi; } public double GetAverage(double[] data) { int len = data.Length; if (len == 0) throw new Exception("No data"); double sum = 0; for (int i = 0; i < data.Length; i++) sum += data[i]; return sum / len; } public double GetVariance(double[] data) { int len = data.Length; // Get average double avg = GetAverage(data); double sum = 0; for (int i = 0; i < data.Length; i++) sum += Math.Pow((data[i] - avg), 2); return sum / len; } public double GetStdev(double[] data) { return Math.Sqrt(GetVariance(data)); } 104 public decimal[,] genolustur() { decimal[,] dizi = new decimal[1, uzunlukdizi]; int[] yuzde=yuzdeolustur(hisseadedi,altsinirilk,ustsinirilk); int[] hisseler = hisseolustur(hisseadedi); double[] ecirhesap = new double[hisseadedi]; int artis=0; decimal toplam = 0; decimal betatoplam = 0; for (int i = 0; i < (uzunlukdizi-1); i+=2) { dizi[0, i] = yuzde[artis]; dizi[0, i + 1] = hisseler[artis]; toplam += (sharp[hisseler[artis] - 1]/100) * yuzde[artis]/100; if(secolcut=="Sharp") ecirhesap[artis] = (double)(sharp[hisseler[artis] - 1]/100); if(secolcut=="Treynor") betatoplam += (beta[hisseler[artis] - 1] * yuzde[artis] / 100); if (secolcut == "Jensen") betatoplam += (beta[hisseler[artis] - 1] * yuzde[artis] / 100); artis++; } decimal shp=new decimal(); if (secolcut == "Sharp") { shp = (toplam - (decimal)(3.65 / 100)) / (decimal)GetStdev(ecirhesap); dizi[0, (uzunlukdizi - 1)] = shp; } if (secolcut == "Treynor") shp = (toplam - (decimal)(3.65 / 100)) / betatoplam; decimal arasonuc = new decimal(); if (secolcut == "Treynor" && betatoplam > 0 && shp > 0) { if (arasonuc < toplam) dizi[0, (uzunlukdizi - 1)] = shp; } if (secolcut == "Treynor" && betatoplam < 0 && shp < 0) { arasonuc = (decimal)(3.65 / 100) + betatoplam * ((decimal)(3.54 - 3.65) / 100); if(arasonuc<toplam) dizi[0, (uzunlukdizi - 1)] = shp; } 105 if (secolcut == "Jensen") { shp = (toplam - (decimal)(3.65 / 100)) - (betatoplam * (decimal)((3.55 - 3.65) / 100)); dizi[0, (uzunlukdizi - 1)] = shp; } return dizi; } public void sirala(decimal[,] gelen) { decimal[,] gecici = new decimal[1, gelen.GetLength(1)]; for (int i = 0; i < gelen.GetLength(0); i++) { for (int j = i; j < gelen.GetLength(0); j++) { if (gelen[j, gelen.GetLength(1) - 1] > gelen[i, gelen.GetLength(1) - 1]) { for (int k = 0; k < gelen.GetLength(1); k++) { gecici[0, k] = gelen[i, k]; } for (int k = 0; k < gelen.GetLength(1); k++) { gelen[i, k] = gelen[j, k]; } for (int k = 0; k < gelen.GetLength(1); k++) { gelen[j, k] = gecici[0, k]; } } } } } public decimal fitnesstoplam(decimal[,] gelen) { decimal sumfitness = new decimal(); for (int i = 0; i < 20; i++) sumfitness += Math.Abs(gelen[i, (uzunlukdizi-1)]); return sumfitness; } public void RouletteSelection(decimal[,] gelenkromozom,decimal toplamfitness) { 106 decimal[] olasiliklar = new decimal[20]; decimal[,] gecici = new decimal[20, 2]; rula = new int[20]; rulb = new int[20]; Random rnd = new Random(DateTime.Now.Millisecond); for (int i = 0; i < 20; i++) olasiliklar[i] = Math.Abs(gelenkromozom[i, (uzunlukdizi-1)]) / toplamfitness; for (int i = 0; i < 20; i++) { for (int j = 0; j < 20; j++) { gecici[j, 1] = rnd.Next() * olasiliklar[j] * 1000; gecici[j, 0] = j; } sirala(gecici); rula[i] = (int)gecici[0, 0]; } Array.Clear(gecici, 0, gecici.Length); for (int i = 0; i < 20; i++) { for (int j = 0; j < 20; j++) { gecici[j, 1] = rnd.Next() * olasiliklar[j] * 1000; gecici[j, 0] = j; } sirala(gecici); rulb[i] = (int)gecici[0, 0]; } } private decimal fitnesshesapla(decimal[,] gelen,int satir) { decimal sonuc = new decimal(); decimal toplam = new decimal(); double[] ecirhesap = new double[hisseadedi]; decimal betatoplam = 0; int artis = 0; for (int i = 1; i < (uzunlukdizi - 1); i += 2) { toplam += (sharp[(int)gelen[satir, i] - 1] / 100) * gelen[satir, i - 1] / 100; if (secolcut == "Sharp") ecirhesap[artis] = (double)(sharp[(int)gelen[satir, i] - 1] / 100); 107 if (secolcut == "Treynor" || secolcut=="Jensen") betatoplam += (beta[(int)gelen[satir, i] - 1] * gelen[satir, i - 1] / 100); artis++; } if (secolcut == "Sharp") sonuc = (toplam - (decimal)(3.65 / 100)) / (decimal)GetStdev(ecirhesap); if (secolcut == "Treynor") sonuc = (toplam - (decimal)(3.65 / 100)) / betatoplam; if (secolcut == "Jensen") sonuc = (toplam - (decimal)(3.65 / 100)) - (betatoplam * (decimal)((3.55 3.65) / 100)); return sonuc; } public void crossover(decimal[,] gelenkromozom) { int secilen=-1; bool oldu = false; int var, var1; Random rnd = new Random(DateTime.Now.Millisecond); int satir = 0; for (int i = 0; i < 20; i++) { oldu = false; while(oldu==false) { secilen = rnd.Next(0,(uzunlukdizi-1)/2)*2+1; var = 0; var1 = 0; for (int k = 1; k < (uzunlukdizi-1); k+=2) { if (gelenkromozom[rula[i], secilen] == gelenkromozom[rulb[i], k] && k!=secilen) { var = 1; break; } } for (int k = 1; k <(uzunlukdizi-1); k += 2) { if (gelenkromozom[rulb[i], secilen] == gelenkromozom[rula[i], k] && k != secilen) { var1 = 1; break; 108 } } if (var == 0 & var1 == 0) oldu = true; } for (int j = 0; j <(uzunlukdizi-1); j ++) { if (j != secilen) { kromozomcross[satir, j] = gelenkromozom[rula[i], j]; kromozomcross[satir + 1, j] = gelenkromozom[rulb[i], j]; } else { kromozomcross[satir, j] = gelenkromozom[rulb[i], j]; kromozomcross[satir + 1, j] = gelenkromozom[rula[i], j]; } } kromozomcross[satir,(uzunlukdizi-1)]=fitnesshesapla(kromozomcross,satir); kromozomcross[satir + 1, (uzunlukdizi-1)] = fitnesshesapla(kromozomcross, satir+1); satir += 2; } for (int i = 0; i < 40; i++) { for (int j = 0; j <= (uzunlukdizi-1); j++) { gelenkromozom[20 + i, j] = kromozomcross[i, j]; } } Array.Clear(kromozomcross, 0, kromozomcross.Length); Array.Clear(rula, 0, rula.Length); Array.Clear(rulb, 0, rulb.Length); } public void mutation(decimal[,] gelenkromozom) { int secilen = -1, var=-1; Random rnd = new Random(DateTime.Now.Millisecond); int sayi = -1; for (int i = 0; i < 20; i++) { secilen = rnd.Next(0, (uzunlukdizi - 1) / 2) * 2 + 1; bool oldu = false; while (oldu == false) 109 { sayi = rnd.Next(1, 123); var = 0; for (int k = 1; k < (uzunlukdizi-1); k += 2) { if (gelenkromozom[i, k] ==sayi ) { var = 1; break; } } if (var == 0) oldu = true; } for (int j = 0; j <(uzunlukdizi-1); j++) { if (j != secilen) kromozommutation[i, j] = gelenkromozom[i, j]; else kromozommutation[i, j] = sayi; } kromozommutation[i, (uzunlukdizi-1)] = fitnesshesapla(kromozommutation, i); } for (int i = 0; i < 20; i++) { for (int j = 0; j <= (uzunlukdizi-1); j++) { gelenkromozom[60 + i, j] = kromozommutation[i, j]; } } Array.Clear(kromozommutation, 0, kromozommutation.Length); } public string[,] isimolustur(decimal[,] gelen) { string[,] sonucdizi=new string[20,uzunlukdizi]; for (int i = 0; i < 20; i++) { for (int j = 0; j <= (uzunlukdizi - 1); j++) { if (j % 2 == 1 && j != (uzunlukdizi - 1)) sonucdizi[i, j] = hisseadi[(int)gelen[i, j]-1]; else sonucdizi[i, j] = gelen[i, j].ToString(); 110 } } return sonucdizi; } } } using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; using System.Drawing; using System.Text; using System.Windows.Forms; using System.Data.SqlClient; namespace HisseOptimizasyon { public partial class Sonuc : Form { DataTable dt; int hissesay; public Sonuc(DataTable gelen,int gelen1) { InitializeComponent(); dt = gelen; hissesay = gelen1; } private void Sonuc_Load(object sender, EventArgs e) { DataSet ds = new DataSet(); SqlDataAdapter da = new SqlDataAdapter("Select menkulkodu,sharp from sharporan order by menkulkodu",sqlConnection1); da.Fill(ds); DataTable sonuc = new DataTable("Sonucson"); sonuc.Columns.Add("Hisse_Kodu", System.Type.GetType("System.String")); sonuc.Columns.Add("Payi", System.Type.GetType("System.String")); sonuc.Columns.Add("Getirisi", System.Type.GetType("System.String")); int say = 0; double gergetiri = new double(); for (int i = 0; i < hissesay; i++) 111 { DataRow dr = sonuc.NewRow(); dr[1] = dt.Rows[0][say]; dr[0] = dt.Rows[0][say + 1]; DataRow[] getiri = ds.Tables[0].Select("menkulkodu='"+dr[0].ToString()+"'"); dr[2] = getiri[0][1]; sonuc.Rows.Add(dr); gergetiri += (Convert.ToDouble(dr[1].ToString()) / (double)100) * (Convert.ToDouble(dr[2].ToString()) / (double)100); say = say + 2; } textBox1.Text = dt.Rows[0][hissesay * 2].ToString(); textBox2.Text=gergetiri.ToString(); dataGridView1.DataSource = sonuc; } } } 112 EK-2 1995 – 2008 Bankaların Yıllık Ortalama Mevduat Faizi Oranları (Risksiz Faiz Oranları) FAİZ ORANLARI YILLAR (%) 1995 92 1996 95 1997 84 1998 94 1999 93 2000 44 2001 71 2002 50 2003 39 2004 23 2005 18 2006 18 2007 18 2008 18 113 EK-3 Portföylere Seçilebilecek Hisse Senetlerinin ve İMKB 100 Bileşik Endeksinin 1995 – 2007/06 Dönemindeki Aylık Ortalama Getiri Oranları ve Beta Katsayları Hisse Senedi ABANA ADANA ADNAC AFYON AKALT AKBNK AKIPD AKSA ALARK ALCAR ALTIN ANACM ARCLK ASELS ASLAN ATLAS AYCES AYGAZ BAGFS BEKO BOLUC BRISA BRSAN BUCIM BURCE CELHA CEMTS CIMSA CMENT DARDL DENCM DEVA DITAS DOGUB DOHOL DOKTS ECILC ECZYT EDIP EGEEN Aylık Ortalama Getiri (%) 1.9048 4.4919 3.165 3.7872 2.21 4.1635 1.8986 2.2985 2.9441 3.1548 2.9603 3.5984 3.5531 3.9215 3.9928 3.3199 3.676 4.0698 3.3691 2.8123 3.7715 3.4806 3.1061 3.8737 2.9553 2.6535 3.3018 4.0797 2.9143 0.8814 2.2953 3.5434 3.4298 1.8738 4.0436 3.6933 3.9361 3.8083 2.6107 3.8576 Beta -10.1496 -10.1932 -6.11754 3.076416 11.59601 3.34792 5.664295 8.704862 3.264614 2.541046 7.025327 -1.00626 -3.11064 3.101769 3.531954 4.970329 -0.64688 -2.65329 2.496778 1.712317 -4.93501 5.712982 16.64291 -3.12507 -5.09358 -7.3366 -1.75448 1.865224 8.104801 5.267257 9.045968 -8.05343 10.38207 -2.09472 16.0365 4.980545 1.187954 3.502518 0.894176 11.93301 114 EGGUB EGPRO EGSER EPLAS EREGL FENIS FFKRL FINBN FMIZP FROTO GARAN GENTS GOODY GUBRF GUSGR HEKTS HURGZ IHLAS INTEM ISCTR IZMDC IZOCM KARTN KAVPA KCHOL KENT KERVT KLBMO KONYA KORDS KRTEK KUTPO LUKSK MAALT MAKTK MERKO MIGRS MIPAZ MMART MRDIN MRSHL MUTLU NETAS NTHOL NTTUR OKANT 3.433 4.614 1.6451 2.3833 3.8689 3.0546 4.1541 4.6872 3.7502 4.5457 4.116 3.5595 2.7195 2.8734 3.6349 3.2239 4.1814 1.3597 2.8863 4.6917 2.7616 4.24 3.0629 2.23 3.1898 4.0796 2.0663 1.458 3.4057 3.3016 2.4564 2.3801 2.7182 3.5744 -0.0191 1.3256 4.1999 3.1522 3.062 4.7578 3.1627 3.1551 1.8792 2.0313 2.7189 0.5231 -1.48652 18.65042 5.658744 0.553578 -0.81169 11.91389 2.331676 4.170357 -8.4379 8.220326 -2.02611 -1.95627 4.676282 9.728431 5.928517 -6.54874 5.912387 10.31311 13.3488 -4.10641 -3.68528 -3.22579 9.722346 -1.10127 -6.17378 -7.11746 18.09729 17.60575 -4.49423 8.989504 -3.81958 3.61668 -6.49552 10.71556 -1.20471 4.403352 8.073742 12.62876 24.64414 -5.42824 -0.64934 2.198519 9.822739 13.01267 8.848508 -12.6157 115 OLMKS PARSN PETKM PIMAS PINSU PKENT PNSUT PRKAB PTOFS SARKY SISE SNPAM SONME TATKS TBORG TEKST THYAO TIRE TKBNK TOASO TRKCM TRNSK TSKB TUDDF TUKAS TUPRS UCAK UNYEC USAK VAKFN VESTL VKFYT VKING YKBNK YKFIN YUNSA İMKB 100 2.9691 4.0042 2.6323 3.0572 4.0516 3.0642 4.6485 2.6499 3.4227 2.9842 3.8109 2.6881 2.7697 2.0306 2.2247 3.5768 2.3883 3.2871 2.5121 2.7489 3.9348 0.5227 3.5788 3.3119 1.4026 4.2703 3.6967 4.1532 1.2815 1.9214 3.0349 2.6716 2.7973 4.1388 3.2436 2.6112 3.54 11.9228 13.24526 -2.57152 14.84728 9.648883 5.646546 4.24614 11.836 -21.0064 2.479058 -0.54594 18.8161 -2.6784 4.260032 16.67367 -2.46995 -13.4862 3.9767 -12.039 9.058074 12.13936 3.791742 -2.4268 4.086205 -27.2242 5.665421 2.395181 5.14911 -2.61782 -1.08671 -5.99478 -17.6239 -2.46459 -3.77885 -18.7175 7.114505 1 116 EK-4 Portföylere Seçilen Hisse Senetlerinin ve İMKB 100 Bileşik Endeksinin 2007/07 – 2008/12 Dönemindeki Aylık Ortalama Getiri Oranları ve Beta Katsayları Hisse Senedi ADANA ADNAC AFYON AKBNK ALCAR ANACM ASELS ASLAN ATLAS AYGAZ BAGFS BOLUC BRISA BRSAN BUCIM CELHA CIMSA CMENT DEVA DITAS DOGUB DOHOL ECILC ECZYT EGEEN EGPRO EREGL FFKRL FINBN FMIZP FROTO GARAN GENTS GUSGR HEKTS HURGZ INTEM ISCTR IZOCM KAVPA Aylık Ortalama Getiri (%) -5.84 -4.49 -5.2 -2.13 -5.04 -3.97 -3.98 -0.54 -4.8 -3.72 2.42 -4.61 -3.85 -2.65 -2.32 -0.76 -5.07 -2.46 -4.73 -3.62 -3.48 -5.1 -4.27 -4.28 -5.71 -4.35 -1.8 -6.36 -1.25 -2.3 -5.08 -2.96 -3.08 -2.4 -3.27 -4.83 -3.93 -2.06 -3.34 -0.69 Beta 0.842919 -0.041041 0.059310 1.4222000 0.069240 0.002411 -0.015032 0.808760 -0.216176 0.801868 -0.348014 0.141440 0.593755 0.595524 0.158170 0.281233 1.184842 0.021808 0.056505 0.109021 0.780318 0.841850 -0.052615 0.523828 0.903315 0.629941 -0.271970 1.388672 0.477667 0.127897 0.810197 1.374330 0.093050 -0.178697 -0.266558 3.700727 -0.026986 1,174,791 0.649564 -0.226199 117 KCHOL KENT KONYA KORDSA MAALT MIGRS MIPAZ MMART MRDIN MUTLU PARSN PETKM PIMAS PINSU PKENT PNSUT PTOFS SISE SNPAM SONME TEKST TIRE TRKCM TSKB TUDDF TUPRS UCAK UNYEC USAK VESTL VKFYT VKING YKBNK YKFIN İMKB 100 -3.04 -3.06 -2.48 -5.54 -6.81 -2.41 -8.83 -6.74 -2.58 -5.23 -6.3 -3.61 -3.81 -4.98 -0.18 -4.2 -3.11 -4.31 -7.47 -8.23 -7.82 -1.64 -5.67 -3.11 -6.4 -3.03 -4.07 -5.04 -7.17 -7 -4.16 -9.47 -1.82 -5.13 -3.07 -0.014456 0.732770 0.045273 0.102483 -0.216966 0.372760 -0.043842 0.933759 0.679708 0.091755 1.027155 0.152801 0.281732 0.659222 0.062314 1.022234 1.018054 0.105201 1.138848 -0.009778 -0.147560 -0.005413 0.988603 0.060518 0.578059 0.790548 0.048384 0.769525 0.104816 1.113515 -0.212994 -0.128890 1.188603 0.718996 1 118 ÖZGEÇMİŞ Kişisel Bilgiler: Adı ve Soyadı: Engin KÜÇÜKSİLLE Doğum Yeri: ISPARTA Doğum Yılı: 1978 Medeni Hali: BEKAR Eğitim Durumu: Lise: Isparta Anadolu Lisesi 1989-1995 Lisans: İstanbul Üniversitesi İşletme Fakültesi (İng.) 1996-2001 Yüksek Lisans: S.D.Ü. SBE. İşletme Anabilim Dalı 2002-2004 Yabancı Diller: İngilizce (İleri Düzey) İş Deneyimi Bilimsel Yayınlar ve Çalışmalar