ĠSTANBUL TEKNĠK ÜNĠVERSĠTESĠ FEN BĠLĠMLERĠ

advertisement
ĠSTANBUL TEKNĠK ÜNĠVERSĠTESĠ  FEN BĠLĠMLERĠ ENSTĠTÜSÜ
TEMĠZLĠK KAĞITLARI SEKTÖRÜNDE
YAPAY SĠNĠR AĞLARI ĠLE TALEP TAHMĠNĠ
YÜKSEK LĠSANS TEZĠ
Mihriban YÜCESOY
Anabilim Dalı : Endüstri Mühendisliği
Programı : Endüstri Mühendisliği
HAZĠRAN 2011
ĠSTANBUL TEKNĠK ÜNĠVERSĠTESĠ  FEN BĠLĠMLERĠ ENSTĠTÜSÜ
TEMĠZLĠK KAĞITLARI SEKTÖRÜNDE
YAPAY SĠNĠR AĞLARI ĠLE TALEP TAHMĠNĠ
YÜKSEK LĠSANS TEZĠ
Mihriban YÜCESOY
(507081121)
Tezin Enstitüye Verildiği Tarih : 06 Mayıs 2011
Tezin Savunulduğu Tarih : 08 Haziran 2011
Tez DanıĢmanı : Doç. Dr. Tufan Vehbi KOÇ (ĠTÜ)
Diğer Jüri Üyeleri : Prof. Dr. Nahit SERARSLAN (ĠTÜ)
Doç. Dr. Alev GÜMÜġ (YTÜ)
HAZĠRAN 2011
Aileme,
iii
iv
ÖNSÖZ
Rekabet koşullarının arttığı, günümüz endüstrilerinde müşterinin seçiciliğini ve
davranışlarını yorumlayabilen, üretime konu olacak ürünlerin piyasadaki
hareketlerini doğru tahmin edebilen işletmeler hayatta kalabileceklerdir. Doğru talep
tahmini bu aşamada başarının anahtarı olarak gösterilebilir.
Talep tahminini gerçekleştirebilmek ise talebi belirleyen unsurların ortaya konulması
ve her birinin talep üzerindeki etkisinin tespit edilmesi ile mümkündür. Talebi
etkileyen iç ve dış koşullar düşünüldüğünde bir çok unsurun var olması ve bu
unsurların talep miktarını ne şekilde etkileyeceğinin belirlenmesi, süreci oldukça
zorlu hale getirmektedir. Bu noktada doğru talep tahmin yönteminin seçilmesi
oldukça kritik bir karardır.
Bu çalışmada yapay sinir ağları ile Türkiye‟de temizlik kağıdı sektöründe
parametrelere dayalı talep tahmini için model oluşturulmuş ve modelin test edilmesi
sonrasında gelecek ile ilgili değerlendirmeler yapılmıştır. Ayrıca her bir
parametrenin talebe olan etkisi gösterilmiş, diğer talep yöntemleri ile karşılaştırma
yapılmıştır.
Çalışmam sırasında bana destek olan aileme, hocam Doç. Dr. Tufan Vehbi Koç‟a ve
her zaman yanımda olan arkadaşlarıma teşekkürlerimi sunarım.
Ayrıca yüksek lisans eğitimim süresince bana maddi anlamda büyük destek sağlayan
Tübitak Bilim İnsanı Destekleme Daire Başkanlığı‟na teşekkürlerimi sunmayı bir
borç bilirim.
Mihriban Yücesoy
Haziran 2011
(Endüstri Mühendisi)
v
vi
ĠÇĠNDEKĠLER
Sayfa
ÖNSÖZ ....................................................................................................................v
KISALTMALAR .................................................................................................. xi
ÇĠZELGE LĠSTESĠ ............................................................................................ xiii
ġEKĠL LĠSTESĠ.................................................................................................... xv
ÖZET.................................................................................................................. xvii
SUMMARY ..........................................................................................................xix
1. GĠRĠġ ...............................................................................................................1
2. TALEP TAHMĠNĠ ..........................................................................................3
2.1 Tahmin İhtiyacı .............................................................................................. 3
2.2 Talep Tahmin Kavramı ................................................................................... 4
2.3 Talebi Etkileyen Faktörler .............................................................................. 5
2.4 Talep Tahmin Varsayımları ve Özellikleri ...................................................... 5
2.5 Talep Tahmin Araştırmasının Adımları........................................................... 6
3. TALEP TAHMĠN YÖNTEMLERĠ ................................................................9
3.1 Nitel Tahmin Yöntemleri ................................................................................ 9
3.1.1 Uzman görüşü yöntemi .............................................................................9
3.1.2 Delphi tekniği ...........................................................................................9
3.1.3 Anket yöntemi ........................................................................................ 10
3.1.4 Satış gücü birleşimi ................................................................................ 11
3.1.5 Yaşam eğrisi benzeşimi .......................................................................... 11
3.2 Nicel Tahmin Yöntemleri ..............................................................................12
3.2.1 Zaman serileri analizi ............................................................................. 13
3.2.1.1 Yalın yaklaşım………………………………………………………………… 15
3.2.1.2 Aritmetik ortalama yöntemi………………………………………………… 15
3.2.1.3 Hareketli ortalamalar yöntemi……………………………………………… 15
3.2.1.4 Ağırlıklı hareketli ortalamalar yöntemi……………………………………16
3.2.1.5 Üssel ağırlıklandırılmış hareketli ortalama yöntemi…………………… 16
3.2.1.6 Basit üssel düzgünleştirme yöntemi……………………………….............. 17
3.2.1.7 Holt lineer metodu…………………………………………………………….. 18
3.2.1.8 Holt winter trend ve mevsimsellik metodu………………………………. 19
3.2.2 Nedensel yöntemler ................................................................................ 19
3.2.2.1 Regresyon analizi………………………………………………………………19
3.2.2.2 Korelasyon analizi……………………………………………………………. 21
3.3 Box Jenkins Yöntemleri ................................................................................22
3.3.1 Otoregresif modeller – AR(p) modelleri ................................................. 23
3.3.2 Hareketli ortalamalar – MA(q) modelleri ................................................ 23
3.3.3 Otoregresif hareketli ortalama yöntemi – ARMA(p,q) ............................ 23
3.3.4 Durağan olmayan otoregresif hareketli ortalama yöntemi - ARIMA (p,d,q)
........................................................................................................................ 23
3.4 Yapay Zekâ Çözümleri ..................................................................................25
vii
3.4.1 Bulanık mantık ....................................................................................... 25
3.4.2 Yapay sinir ağları ................................................................................... 27
3.5 Tahmin Yöntemlerinin Doğruluğunun Ölçülmesi .......................................... 27
3.5.1 Ortalama hata (ME)................................................................................ 27
3.5.2 Ortalama mutlak hata (MAE) ................................................................. 28
3.5.3. Ortalama hata kare kriteri (MSE)........................................................... 28
3.5.4 Ortalama mutlak hata yüzdesi (MAPE) .................................................. 28
3.5.5 Theil U istatistigi (U) ............................................................................. 28
3.5.6 İzleme sinyali ......................................................................................... 29
4. YAPAY SĠNĠR AĞLARI METODOLOJĠSĠ ............................................... 31
4.1 Yapay Zekâ Kavramı .................................................................................... 31
4.2 Yapay Sinir Ağlarına Giriş ............................................................................ 32
4.2.1 Yapay sinir ağlarının tanımı ................................................................... 32
4.2.2 Yapay sinir ağlarının tarihsel gelişimi .................................................... 33
4.2.2.1 1970 öncesi YSA ile ilgili çalışmalar ……………………………………... 33
4.2.2.2 1970 sonrası YSA ile ilgili çalışmalar ……………………………………. 35
4.2.3 Yapay sinir ağlarının avantajları ............................................................. 36
4.2.4 Yapay sinir ağlarının dezavantajları........................................................ 38
4.2.5 Yapay sinir ağlarının kullanım alanları ................................................... 39
4.3 Yapay Sinir Ağlarının Yapısı ve Temel Elemanları ....................................... 40
4.3.1 Biyolojik sinir hücresi ............................................................................ 40
4.3.2 Yapay sinir hücresi ................................................................................. 43
4.3.2.1 Girdiler………………………………………………………………………….. 44
4.3.2.2 Ağırlıklar………………………………………………………………………. 44
4.3.2.3 Toplama fonksiyonu………………………………………………................. 44
4.3.2.4 Aktivasyon fonksiyonu……………………………………………................ 45
4.3.2.4 Çıktı……………………………………………………………………………… 47
4.3.3 Yapay sinir hücresinin çalışma prensibi .................................................. 47
4.3.4 Yapay sinir ağının yapısı ve sınıflandırılması ......................................... 48
4.3.4.1 Katman sayısına göre sınıflandırma………………………………………. 48
4.3.4.2 Bağlantı yapılarına göre sınıflandırma…………………………………… 49
4.3.4.3 Öğrenme stratejilerine göre sınıflandırma……………………………….. 50
4.3.5 Yapay sinir ağlarının eğitimi ve öğrenme kuralları ................................. 51
4.3.5.1 Çevrimiçi öğrenme…………………………………………………………… 53
4.3.5.2 Çevrimdışı Öğrenme…………………………………………………………. 53
4.3.5.3 Öğrenme kuralları………………………………………………….................. 53
4.3.6 Çok katmanlı algılayıcılar ...................................................................... 54
4.3.6.1 İleri besleme aşaması…………………………………………………………. 56
4.3.6.2 Geri yayılma aşaması………………………………………………………… 58
4.3.6.3 ÇKA ağının genelleştirilmiş delta öğrenme kuralı ile eğitimi……….. 61
Çıkış Katmanının Bağlantı Ağırlıklarının Ayarlanması……………………... 63
Gizli Katman 2‟nin Bağlantı Ağırlıklarının Ayarlanması……………………66
Gizli Katman 1‟in Bağlantı Ağırlıklarının Ayarlanması…………………….. 68
4.3.6.4 Öğrenmenin devamı ve toplam hata fonksiyonu……………………….. 68
4.3.6.5 ÇKA ağlarında öğrenme performansının arttırılması…………………. 69
Dinamik Öğrenme Hızı Ayarlaması…………………………………….............. 69
Momentum Terimi ve Öğrenme Performansına Etkisi……………………… 71
4.3.6.6 Öğrenme ve ezberleme arasındaki fark……………………………………73
4.2.6.7 ÇKA ağlarında öğrenmeyi etkileyen faktörler ………………………….. 73
4.3.6.8 ÇKA ağlarında kullanılacak verilerin ölçeklendirilmesi……………… 76
viii
TALEP TAHMĠNĠ UYGULAMASI ............................................................ 79
5.1 Talep Tahmini Probleminin Tanımlanması ....................................................79
5.2 Yapay Sinir Ağı Mimarisi ..............................................................................81
5.2.1 Momentum katsayısının belirlenmesi ...................................................... 82
5.2.2 Öğrenme katsayısının belirlenmesi ......................................................... 82
5.2.3 Çevrim sayısının belirlenmesi ................................................................. 83
5.2.4 Gizli hücre sayısının belirlenmesi ........................................................... 84
5.3 Yapay Sinir Ağının Eğitilmesi .......................................................................84
5.4 Sonuçların Test Edilmesi ve Değerlendirilmesi ..............................................87
5.5 YSA Yönteminin Diğer Talep Yöntemleriyle Karşılaştırılması ......................90
5.5.1 Basit regresyon yöntemiyle talep tahmini ............................................... 90
5.5.2 Çoklu regresyon yöntemiyle talep tahmini .............................................. 91
6. SONUÇ VE DEĞERLENDĠRME ................................................................ 93
KAYNAKLAR ...................................................................................................... 95
EKLER .................................................................................................................. 99
ÖZGEÇMĠġ ........................................................................................................ 115
5.
ix
KISALTMALAR
ADALINE : Adaptif Doğrusal Eleman
AR
: Otoregresif
ARIMA
: Bütünlesik Otoregresif Hareketli Ortalama
ARMA
: Otoregresif Hareketli Ortalama
ÇKA
: Çok Katmanlı Algılayıcı
MA
: Hareketli Ortalama
MADALINE : Çoklu Adaptif Doğrusal Eleman
MAE
: Ortalama Mutlak Hata
MAPE
: Ortalama Mutlak Hata Yüzdesi
ME
: Ortalama Hata
MSE
: Ortalama Hata Kare
U
: Theil-U İstatistiği
UMN
: University of Minnesota
YSA
: Yapay Sinir Ağları
YZ
: Yapay Zeka
xi
ÇĠZELGE LĠSTESĠ
Sayfa
Çizelge 3.1: Nitel yöntemlerin karşılaştırılması.......................................................11
Çizelge 4.1: Beynin bölgelere göre fonksiyonları . ..................................................41
Çizelge 4.2: Biyolojik sinir ağı ve yapay sinir ağının karşılaştırılması. ....................43
Çizelge 4.3: Toplama fonksiyonu örnekleri ............................................................45
Çizelge 4.4: Aktivasyon fonksiyonu örnekleri ........................................................46
Çizelge 4.5: Geri yayılma ile hatanın minimizasyonu ve döngü kavramı. ................60
Çizelge 5.1: Momentum katsayısının farklı değerleri için tahmin değerleri. ............82
Çizelge 5.2: Öğrenme katsayısının farklı değerleri için tahmin değerleri. ................83
Çizelge 5.3: Çevrim sayısının farklı değerleri için tahmin değerleri. .......................83
Çizelge 5.4: Çevrim sayısının farklı değerleri için tahmin değerleri. .......................83
Çizelge 5.5: Gizli hücre sayısının farklı değerleri için tahmin değerleri...................84
Çizelge 5.6: Yapay sinir ağı katman ve hücre sayısı. ...............................................84
Çizelge 5.7: Yapay sinir ağı parametreleri. .............................................................85
Çizelge 5.8: 2010 yılı gerçekleşen ve tahmin edilen değerlerin kıyaslanması. .........87
Çizelge 5.9: Çevrim Sayısı=1000‟e göre gerçekleşen/tahmin edilen değerler. .........87
Çizelge 5.10: Gizli hücre sayısı=12‟ye göre gerçekleşen/tahmin edilen değerler. ....87
Çizelge 5.11: Gizli hücre sayısı=2‟ye göre gerçekleşen/tahmin edilen değerler. ...... 88
Çizelge 5.12: Basit regresyon modeli ağırlık değerleri. ...........................................90
Çizelge 5.13: Basit regresyon modeline göre tahmin/gerçekleşen kıyaslaması. .......90
Çizelge 5.14: Model-1 regresyon analizi ağırlıkları. ................................................91
Çizelge 5.15: Model-2 regresyon analizi ağırlıkları. ................................................91
Çizelge 5.16: Regresyon analizi ile tahmin edilen değerlerin gerçek değer ile
karşılaştırılması. ...............................................................................92
Çizelge A.1: Yıllık temizlik kâğıdı üretim miktarı (ton/yıl) ........................................102
Çizelge A.2: Yıllık temizlik kâğıdı ithalat miktarı (ton/yıl) …………………...........103
Çizelge A.3: Toptan eşya fiyat endeksi (1981=100) değerleri ……………………...104
Çizelge A.4: Kişi başına düşen yıllık GSYİH değerleri (TL) …………………........105
Çizelge A.5: Yıllık genel nüfus değerleri ………………….........................................106
Çizelge A.6: Yıllık kent nüfusu değerleri………………………………………………107
Çizelge A.7: Yıllık okuryazar oranı değerleri (%) ....................................................108
Çizelge A.8: Türkiye‟de temizlik kâğıdı yıllık satış miktarı (ton) …………………109
xiii
xiv
ġEKĠL LĠSTESĠ
Sayfa
ġekil 2.1: Tahmin alanlarının etkileşimi. .................................................................. 3
ġekil 3.1: İlişkisel tahmin yöntemi akışı .................................................................12
ġekil 3.2: Zaman serileri tahmin yöntemi akışı . .....................................................13
ġekil 3.3: Zaman serilerini etkileyen bileşenler. ......................................................14
ġekil 3.4: En küçük kareler yöntemi. ......................................................................20
ġekil 3.5: Box Jenkins Metodolojisi. ......................................................................22
ġekil 3.6: Bulanık mantığın elemanları ve çalışması. ..............................................26
ġekil 3.7: Üyelik fonksiyonu örneği. .......................................................................26
ġekil 4.1: İnsan beyni. ............................................................................................41
ġekil 4.2: Biyolojik sinir hücresinin yapısı. .............................................................42
ġekil 4.3: Sinir hücreleri arası bilgi alışverişi. .........................................................42
ġekil 4.4: Yapay sinir hücresinin yapısı. .................................................................44
ġekil 4.5: Sigmoid fonksiyonunun şekilsel gösterimi. .............................................46
ġekil 4.6: Bir yapay sinir hücresinin çalışma örneği. ...............................................47
ġekil 4.7:Yapay sinir ağlarında katmanların birbirleri ile ilişkileri. .........................49
ġekil 4.8: İleri ve geri beslemeli ağ yapıları. ...........................................................50
ġekil 4.9: Örnek bir ÇKA ağı..................................................................................56
ġekil 4.10: Geri besleme bağlantıları ve hatanın geri yayılması. ..............................59
ġekil 4.11: Genelleştirilmiş delta öğrenme kuralının uygulanacağı ÇKA. ...............62
ġekil 4.12: Parametre uzayında optimal ağırlığa yakınsama süreci. a) düşük öğrenme
hızı. b) yüksek öğrenme hızı. c) yüksek öğrenme hızı + momentum terimi
...............................................................................................................72
ġekil 4.13: Örnek hacminin genelleme üzerindeki etkisi. ........................................74
ġekil 4.14: Gizli katman sayısının öğrenme ve genelleme üzerindeki etkisi. ...........75
ġekil 5.1: EasyNN programı katman ve hücre sayısının tanımlanması. ...................84
ġekil 5.2: EasyNN programı parametre tanımlama ekranı. ......................................85
ġekil 5.3: Kullanılan ÇKA ağ yapısı. ......................................................................85
ġekil 5.4: Öğrenme grafiği. .....................................................................................86
ġekil 5.5: Tahmin grafiği. .......................................................................................86
ġekil 5.6: Duyarlılık analizi. ...................................................................................88
ġekil 5.7: Girdi parametrelerinin önem dereceleri. ..................................................89
ġekil B.1: Model-1 çoklu regresyon program çıktısı……………………………...................111
ġekil B.2: Model-2 çoklu regresyon program çıktısı……………………………...............112
xv
TEMĠZLĠK KÂĞITLARI SEKTÖRÜNDE YAPAY SĠNĠR AĞLARI ĠLE
TALEP TAHMĠNĠ
ÖZET
Rekabet koşullarının arttığı, ürün yaşam sürelerinin kısaldığı günümüz
endüstrilerinde müşterinin seçiciliğini ve davranışlarını yorumlayabilen, üretime
konu olacak ürünlerin piyasadaki hareketlerini doğru tahmin edebilen işletmeler
hayatta kalabileceklerdir. Doğru talep tahmini bu aşamada başarının anahtarı olarak
gösterilebilir.
Sanayinin bu değişen yapısı beraberinde firmalara müşterinin isteyeceği malı,
isteyeceği miktarda önceden sunma ve bunun için gerekli hazırlığı yapma
zorunluluğu getirmektedir. Bunun için firmalar talep tahmin yöntemlerine
yönelmişlerdir ve bu yönelim ile birlikte birçok yöntem gelişmiştir.
Yargısal metotlar, nedensel yöntemler, zaman serileri yöntemleri ve stokastik
yöntemlerin yanı sıra yapay zekâ tabanlı tahmin modelleri özellikle son yıllarda öne
çıkmıştır. Gelişen teknolojiye paralel olarak artan işleme ve hesaplama gücü ile
birlikte, karmaşık simülasyonların yapılması ve gelişmiş yapay zeka teknolojilerini
kullanarak temel kriterlere dayalı tahmin modellemelerinin gerçekleştirmesi mümkün
hale gelmiştir. Bu modellemelerin gerçekleştirilmesini sağlayan önemli bir uygulama
alanı ise “Yapay Sinir Ağları”dır. Yapay sinir ağları insan beyninin özelliklerinden
olan öğrenme yolu ile yeni bilgiler türetebilme ve keşfedebilme gibi yetenekleri
herhangi bir yardım almadan otomatik olarak gerçekleştirmek amacı ile geliştirilen
bilgisayar sistemleri olarak tanımlanabilir.
Bu çalışmada, yapay sinir ağları ile parametrelere dayalı tahmin modeli
oluşturulmuştur. Çalışmada öncelikle talep tahmini ve yapay sinir ağları kavramları
açıklanmıştır. Uygulama bölümünde ise Türkiye‟de temizlik kağıtları sektöründe
yıllık temizlik kağıdı satışları ile ilgili bir model kurulup uygulanmıştır. Ayrıca basit
ve çoklu regresyon modeli ile de temizlik kağıdı talep tahmini yapılmış ve sonuçlar
karşılaştırılmıştır. Uygulama sonucunda yapay sinir ağı yönteminin etkin bir talep
tahmini yöntemi olduğu gösterilmiştir.
xvii
xviii
SALES FORECASTING WITH ARTIFICIAL NEURAL NETWORKS IN
TISSUE PAPER SECTOR
SUMMARY
In today‟s industries which has hard competition and short product lifecycle,
companies who understand behaviour and choices of customers‟ and forecast the
motion of products properly will be alive in the future. Forecast with little error is the
key factor of the success in this way.
With this improvement of the industry, companies have to forecast what their
customers wants and how much they need to produce before customer demands. So
companies bended demand forecasting methods and because of this lot‟s of
forecasting method and tools improved.
In recent years forecasting based on artificial intelligence models has become
prominent besides other judgmental, causal, time series and stochastic methods.
Along with the processing and computation power increasing parallel with the
developing technology, performing complex simulations and establishing forecasting
models using developed artificial intelligence technologies based on the main
criterions have been rendered possible. One important application field ensuring the
possibility of these models is “Artificial Neural Networks”. Artificial Neural
Networks can be defined as computer systems developed for the purpose of
practicing the competencies such as producing and exploring new data by learning,
which is a characteristic of human brain, automatically without any help.
In this study, a forecasting model with parameters is implemented with using
artificial neural networks. First, artificial neural network and demand predictions
concepts are explained. In application part of this study, artificial neural networks
sales forecasting model for tissue paper in Turkey is builded and implemented. On
the other hand, prediction models are builded for simple and multiple regresion
analysis. In conclusion, results are compared and shown that artificial neural
networks is an efficient tool for forecasting.
xix
xx
1. GĠRĠġ
Gelecek, insanlar için olduğu gibi işletmeler için de belirsizlikler ile doludur. Dolayısıyla,
rekabetin arttığı ve ürün yaşam sürelerinin kısaldığı günümüz koşullarında piyasayı doğru bir
şekilde analiz eden ve talep tahminini doğruya yakın yapmayı başaran işletmeler,
faaliyetlerini minimum hata ile planlama olanağına sahip olacaklardır. İşletmelerde her
düzeyde alınan yönetimsel kararlar, doğrudan ya da dolaylı olarak gelecek hakkında yapılan
tahminlere bağlı olmaktadır.
Artan rekabet ortamında yaşanan hızlı gelişmeler, işletmelerin gün geçtikçe daha isabetli,
daha az sapma gösteren tahminlere ihtiyacını arttırmaktadır. Bu ihtiyacı, belirlenen amaç ve
zaman faktörüne göre karşılayacak farklı talep tahmin yöntemleri bulunmaktadır. Talep
tahmininde kullanılan yöntemler temel olarak “nitel yöntemler” ve “nicel yöntemler” olmak
üzere ikiye ayrılır (Eski, 2006).
Nitel yöntemler, daha çok bireysel tecrübelere ve
değerlendirmelere dayanır. Nicel yöntemler ise, istatistiksel ve matematiksel verilere
dayanan yöntemlerdir. Uygulamada genellikle, bu iki yöntemin karması tercih edilir
( Heizer ve Render, 2004).
Yapay sinir ağları yöntemi istatistiksel verileri kullanması yönüyle nicel yöntemlere,
faktörler arasındaki ilişki ve derecelerini öğrenmesi yönüyle nitel yöntemlere
benzemektedir ve etkin bir talep tahmin yöntemi olarak son yıllarda öne çıkmaktadır
(Adıyaman, 2007).
Çalışmada, Türkiye‟de büyümekte olan temizlik kağıtları sektöründe talep tahmini
yapay sinir ağları kullanılarak yapılmış ve yapay sinir ağlarının talep tahmininde
etkin bir yöntem olarak kullanılabileceği gösterilmeye çalışılmıştır.
İkinci ve üçüncü bölümde, talep tahmini ve talep tahmin yöntemleri hakkında bilgi
verilmiştir. Nicel ve nitel yöntemler ile birlikte yapay sinir ağlarının alternatif bir
yöntem olarak talep tahmininde kullanılmasına değinilmiştir.
Dördüncü bölümde, yapay sinir ağları konusunda genel bilgi verilerek bu tez
kapsamında kullanılacak ÇKA (Çok Katmanlı Algılayıcı) modeli ayrıntılı olarak
açıklanmıştır.
1
Beşinci bölümde, uygulama modeli ve bu kapsamda yapılan çalışmalar ayrıntılı bir
şekilde anlatılmıştır. Yapay sinir ağları kullanılarak talep tahmini yapılmış ve
sonuçları incelenmiştir. Ayrıca çoklu regresyon modeli ile de talep tahmini yapılmış
ve sonuçlar karşılaştırılmıştır.
2
2. TALEP TAHMĠNĠ
2.1 Tahmin Ġhtiyacı
Tahmin, yönetimin karar verme aktivitelerinin bir parçasıdır. Organizasyonun
değişikliklere karşı bağımlılığının azalması ve çevresi ile daha bilimsel ilişkiler
kurabilmesi için etkin tahminlere ihtiyaç vardır. Bir organizasyon içerisindeki tüm
bölümlerin diğer bölümler ile etkileşim halinde olduğu düşünüldüğünde iyi ya da
kötü yapılan bir tahmin doğru orantılı olarak tüm organizasyonu etkileyecektir
(Makridakis ve diğ.,1998).
LOJİSTİK
MALİYETİ
BÜTÇELEME
SATIŞLAR
SATIŞ
TAHMİNLERİ
ENVANTER
MALİYETİ
REKLAM
SATIŞ GÜCÜ
ÜRETİM
MALİYETİ
SERMAYE
GİDERLERİ
ÜRETİM
MALİYET
KAYNAK
KULLANIMI
NAKİT
TALEPLERİ
BORÇ
MALİYETİ
NAKİT AKIŞI
ALTERNATİF
MALİYET
NAKİT
GEREKSİNİMİ
ġekil 2.1: Tahmin alanlarının etkileşimi (Makridakis ve diğ.,1998).
Bir organizasyon içerisindeki tahmin alanlarının birbirleri ile etkileşimleri şematik
olarak Şekil 2.1 „de gösterilmiştir.
Tahmini, bir yönetim prosesi olarak gören firmalar daha başarılı olabilirler. Bu
firmalar üretim ya da pazarlama departmanlarından bağımsız olarak çalışan ve
tahmin yapmak ile görevli ayrı departmanlara sahiptirler. Tahminin önemini
3
kavramış olan bu tür firmalar organizasyonel yapılarını da bu prosesi yönetecek
şekilde oluşturmuşlardır (Moon ve diğ., 2003).
Tahminler, işletmelerde alınan bütün seviyedeki kararların temelini oluşturur. Her
karar gelecekte bir yerlerde hayata geçecektir, dolayısı ile gelecekte oluşacak
koşullar düşünülerek tahmin yapılmalıdır. Bunun yanı sıra tahminlemede önemli bir
konu ise sürekliliğin sağlanmasıdır. Zaman içerisinde tahminin etkisi ve performansı
ölçülerek tahminler güncellenmeli, kararlar değiştirilmeli ve bu süreç sürekli olarak
devam etmelidir (Arsham, 1994).
2.2 Talep Tahmin Kavramı
Talep, tüketicilerin bir ürün veya hizmeti belirli bir fiyat seviyesinden almaya hazır
oldukları miktara denir (Tekin, 1996). Talep tahmini ise, üretilen mal ve hizmetlerin
piyasada bulunan tüketiciler tarafından ne ölçüde talep edileceğinin önceden
kestirilmesi sürecini ifade etmektedir. Talep tahmini, işletmelerde üretim planlama
ve kontrol sistemi için temel girdiyi oluşturmaktadır.
Ekonomik istikrarın sağlandığı ortamlarda, piyasa koşullarındaki değişimler yüksek
seviyelerde olmamaktadır. Böyle ortamlarda ürünlere olan talep miktarları da çok
fazla
dalgalanma
göstermediğinden,
talep
tahminlerine
fazla
bir
ihtiyaç
duyulmamaktadır. Ancak ekonomik istikrarsızlığın yüksek olduğu ortamlarda piyasa
koşullarının nasıl olacağının, ürünlerin ne ölçüde ve hangi fiyattan talep edileceğinin
tahmin edilmesi çok büyük önem taşımaktadır (Eski, 2006).
Başarılı bir tahmin ile hammaddelerin doğru zaman ve miktarda alınması sağlanarak
maliyetler düşürülebilir. Aynı şekilde lojistik departmanı daha uzun vadeli
sözleşmeler yaparak maliyetlerini düşürebilir. Bu tür sözleşmeler ancak talep başarılı
bir şekilde öngörülebilir ise uygulanabilir. En önemlisi ise iyi bir tahmin firmanın
stok seviyesinin belirlenmesinde önemli rol oynayacaktır. Tahminlerdeki doğruluk
seviyesi istenen miktarlarda değil ise stok seviyelerinde bu riski azaltacak güvenlik
stokları oluşturulacaktır. Başarılı bir tahmin ile daha az stok bulundurulabilir ve stok
taşıma maliyeti azaltılabilir (Moon ve diğ., 1998).
Firmalar, birçok stratejik kararı verirken sistematik ve bilimsel tahminlere ihtiyaç
duyarlar. Tahmin sürecinin her bir adımı kritik önem taşımaktadır ve talep
tahminleri, çoğu kez tek bir yöntem ile yapılamamaktadır. İyi bir talep tahmini için,
4
öncelikle talebi etkileyen faktörlerin belirlenmesi ve bu faktörlerin talebe olan
etkilerinin açıklanması gereklidir.
2.3 Talebi Etkileyen Faktörler
Ürünün özellikleri ve talep modeli, yapılacak tahmin tipi ve kapsayacağı zaman
süresini etkiler. Eğer ürüne olan talep hemen hemen sabit ise, tahminin zaman süresi
daha kısa olabilir. Planlama, talebin daima aynı düzeyde kalacağı kabulüne dayanır.
Böyle durumlarda var olan kapasite genellikle talep hacminin çoğunu karşılayabilir.
Tahmini artırmak çok gerekli değildir (Şengör, 2002).
Ürüne olan talep dalgalanmalar gösteriyorsa, tahmin hiç olmazsa bir dönemi
kapsamına almalıdır. Tercih edilen tahmin, iki tepe noktası arasındaki süreyi içine
alır. Bu süre, maksimum talebi karşılamak için daha iyi üretim ve stok planlama
imkânları sağlar. Eğer talepte dönemsel değişiklikler varsa, talebi karşılamak için
fazla mesai ve/veya ek stok gerekli olabilir (Şengör, 2002).
Talepte uzun bir devrede gittikçe artan bir eğilim (trend) bekleniyorsa, zorunlu
olacak genişleme veya donanımın sağlanmasını planlamaya imkân veren bir zaman
süresi için tahmin yapmak gereklidir. Bu zaman aralığı birkaç aydan, birkaç yıla
kadar değişebilir (Şengör, 2002).
Bazı ürünler için talep değerleri mevsimlere göre azalır veya çoğalır. Böyle
durumlarda öncelikle talepteki mevsimsel değişmelerin nedenini iyi belirlemek
gerekir. Eğer talebin bazı mevsimlerde fazla, bazılarında az olmasını gerektiren
geçerli nedenler varsa o zaman mevsimsel tahmin yöntemleri kullanılabilir (Şengör,
2002).
2.4 Talep Tahmin Varsayımları ve Özellikleri
Talep tahmini yaparken göz önüne alınması ve kabul edilmesi gereken önemli
unsurlar bulunur. Bu unsurları özetlemek gerekirse;

Tahminler
genellikle
yanlıştır,
çünkü
tahmin
yapılan
dönemde
öngörülemeyen durumlar meydana gelebilir. Planlama sistemi tahmin
hatalarına karşı hazırlıklı olmalıdır.
5

İyi bir tahmin sadece rakamdan ibaret değildir. Tahminler belli bir rakam
değil, bir geçerlilik aralığı olarak veya bir tahmin hatası dağılımı ile
verilmelidir.

Grup tahminleri daha doğrudur. Bir grup için yapılan tahminin hata payı,
bireysel tahminlerin hata payından daha küçüktür.

Tahminlerin doğruluğu, tahmin süresiyle ters orantılıdır ( Heizer ve Render,
2004).
Yapılan varsayımlarla birlikte iyi bir tahminin özellikleri;

Zamanı dikkate almalı. Gereken değişiklikler için yeterli zaman
verilmelidir.

İsabetli olmalı ve isabet derecesi belirtilmelidir.

Güvenilir olmalı.

Anlamlı birimler şeklinde ifade edilmeli.

Yazılı olmalı.

Anlamada ve kullanımda kolaylık sağlamalı.

Tahmin maliyeti, sağlanan faydadan daha az olmalıdır (Stevenson, 2005).
2.5 Talep Tahmin AraĢtırmasının Adımları
Talep tahminlerinin gerçekleştirilmesinde izlenmesi gereken süreç beş aşamadan
oluşmaktadır:
1. Talep Tahminin Amacının Belirlenmesi: Yapılacak olan tahminlerin hangi
amaçla kullanılacağının ve ne zaman gerekli olacağının belirlenmesi aynı
zamanda
talep
tahmininin
ne
kadar
ayrıntılı
olması
gerektiğini
göstermektedir. Tahmin amacı dikkate alınarak, gerekli olan iş gücü, süre,
donanım ve benzeri ihtiyaçlar ortaya konmalı ve tahminin ne kadar hassas
olacağı belirlenmelidir (Eski, 2006).
2. Talep Tahmin Döneminin Belirlenmesi: Talep araştırması sonuçlarının
kullanılış amacı ile periyodun uzunluğu arasında yakın bir ilişki vardır.
Örneğin, günlük iş emirlerinin hazırlanmasında yararlanılacak tahminlerin
aylık dönemler için yapılması son derece yanıltıcı sonuçlar verebilir. Çünkü
6
günlük değerlerdeki oynamalar, aylık dönemlerde tamamen kaybolur (Tekin,
1996).
3. Verilerin Toplanması: Talep tahminlerinin yapılabilmesi için, bu süreçte
temel alınacak verilerin toplanması ve derlenmesi gerekmektedir. Toplanan
veriler, aynı zamanda kullanılacak talep tahmin yönteminin ne olması
gerektiği konusunda yol gösterici olmaktadır. Yapılacak olan tahminlerin
doğruluğu ve geçerliliği, eldeki verilerin doğruluğuna ve güvenilirliğine
bağlıdır. Eksik veya olması gerekenden daha ayrıntılı veriler, araştırmanın
maliyetini ve tahmin sonuçlarını elde etme süresini arttırdığı gibi sonuçların
duyarlılığını da, olumsuz olarak etkilemektedir (Eski, 2006).
4. Tahmin Yönteminin Seçilmesi ve Talebin Tahmin Edilmesi: Yapılacak olan
tahminin amacı ve eldeki verilerin niteliğine bağlı olarak en uygun talep
tahmin yöntemi seçilmelidir. Toplanan bilgilerin belirsizlik, duyarlık, değişim
biçimi gibi nitelikleri ile uygulama amaçları kullanılacak yöntemin seçiminde
göz önüne alınması gereken faktörlerdir (Şengör, 2002).
5. Tahmin Sonuçlarının Başarısının İzlenmesi: Tahmin sonuçlarının gerçek
değerlerle karşılaştırılması gerekir. Belirgin bir sapma gözleniyorsa,
kullanılan yöntemin özellikleri ve varsayımları ile verilerin doğruluğu gözden
geçirilmelidir.
7
8
3. TALEP TAHMĠN YÖNTEMLERĠ
Üretilen mal ve hizmetler ile birlikte tüketici davranışları da birbirinden farklı
olduğundan dolayı tek bir tahmin yönteminden bahsetmek mümkün değildir.
Günümüze kadar birçok tahmin yöntemi geliştirilmiş ve farklı şekillerde
gruplandırılmıştır. Tahmin yöntemleri zaman aralıklarına, mevcut durumdaki karar
ölçütlerine, sağlanabilir veriye ve daha pek çok ölçüte bağlı olarak çeşitlenmektedir.
Talep tahmin yöntemleri temel olarak Nitel ve Nicel Tahmin Yöntemleri olmak
üzere ikiye ayrılmaktadır.
3.1 Nitel Tahmin Yöntemleri
Elde yeterli veri olmadığında veya istatistiksel verileri derleyip analiz edecek kadar
süre veya kaynak bulunmadığında, alanlarında deneyimli ve uzman kişilerin
görüşlerine
ve
bireysel
yargılarına
dayanan
nitel
talep
tahminlerine
başvurulmaktadır. Bu yöntemlerin en önemli avantajı, istatistiksel tahmin
yöntemlerine dâhil edilemeyen sezgisel yargıların talep tahmin sürecine dâhil
edilebilmesidir (Hoang, 2006).
3.1.1 Uzman görüĢü yöntemi
Mali işler, satın alma, üretim, yönetim kurulu gibi kurullardaki idari görevlilerin ve
yöneticilerin tecrübelerine ve bilgilerine dayanılarak yapılan tahminlerdir. Bazı
dönemlerde özellikle kısa zamanda karar verilmesi gerekiyorsa verilerle ve
formüllerle uğraşmaktansa bu yöntem kullanılabilir. Elbette sorumluluk, kararı
birlikte verenlerin olacaktır. Bu yöntemin avantajları basit, uygulaması kolay ve
düşük maliyetli olmasıdır. Yöntemin en büyük zayıflığı ise yöntemin tamamen
kişisel yargılara ve düşüncelere dayanmasıdır.
3.1.2 Delphi tekniği
Delphi tekniği, bir ürüne ait gelecekte oluşması beklenen talebin tahmin edilmesi
amacıyla, uzman kişilerin yüz yüze görüşmeler ve bir arada tartışmalar yapmadan
9
talebin gelecekte ne olacağı hakkında karar vermelerine ve uzlaşmalarına imkân
sağlayan bir yöntemdir (Eski, 2006). Bu yöntem, 1950'lerde Rand firmasında çalışan
Olaf Helmer ve Norman Dalkey adındaki iki araştırmacı tarafından geliştirilmiştir.
Delphi yönteminin mantığı, birden fazla anket formunun gönderilmesi sonucunda
“geri besleme” yoluyla grup üyelerinin ortak bir görüş birliğine varmalarını
sağlamaktır (Seaton ve Bennet, 1996).
Bu karar verme tekniğinde önce konunun uzmanı olan kişilere probleme bakış
açıları, çözüm önerileri ve gelecek ile ilgili tahminleri hakkında yazılı bir form
gönderilir. Formlar uzman kişiler tarafından doldurulduktan sonra geri gönderilir.
Tüm grup üyelerinin görüş ve önerileri sınıflandırılır, ortalamadan çok uzakta olan
uç görüşler çıkarılır ve geriye kalan tüm bilgiler tekrar yazılı olarak kendilerine
gönderilir. Bu işlem, karar alınıncaya ve uzlaşma gerçekleşinceye kadar devam eder.
Dalkey (1972) Delphi tekniğinin 3 ana özellik üzerine kurulu olduğunu belirtmiştir.
Birinci önemli özellik tekniğin katılımda gizlilik ilkesine dayanmasıdır. Bu özellik
Delphi'nin başarısının anahtarı olarak görülmektedir. Araştırma süresince öne
sürülen düşüncelerin kime ait olduğu gizli tutulur. Bireylerden çok fikirlerin öne
çıkması bu şekilde sağlanır. Grup içinde çok iyi tanınan, saygı duyulan kişilerin
görüşlerine koşulsuz onay bu şekilde engellenir. Hiçbir çekince olmadan değişik,
yeni fikirlerin herkesten gelmesi, katılımda gizlilik özelliği ile güvence altına alınır.
İkinci özellik grup tepkisinin istatistiksel analizidir. Her bir Delphi anketi
uygulandıktan sonra istatistiksel olarak analiz edilir. Bu analizlerde kullanılan
istatistiklerin neyi ifade ettiği katılımcılar tarafından iyi bilinmelidir.
Son olarak teknik, kontrollü geri besleme üzerine kuruludur. Delphi tekniğinde
ardışık anketler kullanılır. Anketlerin istatistiksel analizi tamamlandıktan sonra
analiz sonuçları, yani anketi yanıtlayanların genel eğilimleri bir sonraki anketle
birlikte katılımcılara iletilir. Bu şekilde bireyler düşüncelerini kendilerine iletilen
sonuçlarla, farklı görüş ve yaklaşımlarla karşılaştırarak yeniden gözden geçirirler.
3.1.3 Anket yöntemi
Yeni bir ürün piyasaya sürülürken veya var olan bir ürün için farklılaştırma çalışması
yapılırken talebin tahmin edilmesi amacıyla hedef tüketicilere anket yapma yöntemi
kullanılmaktadır.
10
Anket yöntemi, gelişmiş ülkelerde pazarlama araştırması yöntemleri içerisinde en
çok kullanılanı yöntem olmasına rağmen en az bilimsel olanıdır. Bu yöntemlerle elde
edilen bilgilerin, büyük ölçüde, objektiflik ve güvenilir olmaktan yoksun oluşu
cevaplayıcıların istenen bilgileri vermeyişi veya vermek istemeyişi, haberleşme
hataları söz konusu yöntemin değerini azaltmaktadır. Ancak pazarlama araştırması
için gerekli olan bilgileri soru sormak suretiyle sağlama olanağı, anket yöntemini çok
yönlü ve sık kullanılır yöntem haline getirmektedir (Makridakis ve diğ., 1998).
3.1.4 SatıĢ gücü birleĢimi
Satış elemanlarının kendi bölgelerine ait satışların ne olabileceğini tahminlemelerine
dayalı bir yaklaşımdır. Bu tahminler, satıcıların geçmiş öngörülerinde görülen
eğilimleri de göz önüne alınarak düzeltilir. Daha sonra birleştirilerek toplam tahmin
elde edilir. Ancak henüz oturmamış bir satış örgütünde eğitilmemiş ve tecrübesi az
elemanların görüşlerinin toplanması halinde bu yöntem sakıncalıdır (Heizer ve
Render, 2004).
3.1.5 YaĢam eğrisi benzeĢimi
Piyasalarda genel olarak ürünlerin belli bir yaşamı olduğu ve bu yaşamın belli
aşamalardan geçtiği kabul edilmektedir. Bunlar tanınma, büyüme, olgunluk,
doygunluk ve gerileme aşamalarıdır. Gerileme aşamasından sonra ürünün piyasadaki
yaşamı sona erer. Bu yöntemde genellikle piyasaya yeni çıkacak bir ürünün talep
tahminleri piyasadaki benzer ürünlerin yaşam eğrisinden esinlenerek yapılır
(Armstrong, 2001).
Çizelge 3.1: Nitel yöntemlerin karşılaştırılması (Armstrong, 2001).
Yöntem
Uzman
Görüşü
Anket
Yöntemi
Delphi
Tekniği
Kullanım Alanları
*toplam satışlar
*spesifik ürünler
*toplam satışlar
*spesifik ürünler
*ürün grupları
*uzun dönemli satış
*kapasite planlama
*teknolojik tahmin
Kısa
Dönem
Güvenilirlik
Orta
Dönem
Uzun
Dönem
Maliyet
zayıf-orta
zayıf-orta
zayıf-orta
düşük
çok iyi
iyi
orta
yüksek
orta-iyi
orta-iyi
orta-iyi
orta
11
Çizelge 3.1(devam) : Nitel yöntemlerin karşılaştırılması (Armstrong, 2001).
*uzun dönemli satış
Yaşam
Eğrilerinin *yeni ürün
Benzeşimi *tesis planlam
Satış Gücü
*toplam satışlar
Birleşimi
zayıf-orta
orta-iyi
orta-iyi
orta
zayıf-orta
orta-iyi
zayıf-orta
orta
3.2 Nicel Tahmin Yöntemleri
Nicel tahmin yöntemleri, geçmiş zaman dönemlerinde gerçekleşen talep değerlerini
temel alan ya da talebin oluşumuna etki eden faktörler ile talep miktarı arasındaki
ilişkilerin gelecekte de aynı şekilde devam edeceği varsayımına dayanan ve
istatistiksel hesaplama gerektiren yöntemlerdir. Bu yöntemler kendi içerisinde zaman
serileri analizi ve nedensel modeller olmak üzere iki gruba ayrılmaktadır.
Nedensel tahminler sistem girdileri ve çıktıları arasında bir neden sonuç ilişkisi
olduğu varsayımına dayanır. Nedensel tahminler doğru bir neden sonuç ilişkisi
kurarak girdilerdeki değişimlerin çıktılar üzerindeki etkisinin tahmin edilebileceği
varsayıma dayanır. Sistem, çıktıların gözlemleri ve sistem girdileri arasındaki neden
sonuç ilişkisini kurar (Makridakis ve diğ., 1998).
ġekil 3.1: İlişkisel tahmin yöntemi akışı (Makridakis ve diğ., 1998).
Nedensel yöntemlerin aksine zaman serisi yöntemleri, sistemi bir kara kutu olarak
görür ve sistemin davranışına etki eden faktörler ile ilgilenmez. Yöntemin sistemi bu
şekilde görmesinin iki ana nedeni vardır. Öncelikle yöntem sistemin mantığını
anlamak üzerine kurgulanırsa aradaki ilişkilerin kurulması ve ölçülmesinin
zorlaşacağı göz önünde bulundurulmaktadır. İkinci önemli neden, sistemin sadece
çıktıların ne olacağına odaklanması ve neden olduğu ile ilgilenmemesidir
(Makridakis ve diğ., 1998).
12
ġekil 3.2: Zaman serileri tahmin yöntemi akışı (Makridakis ve diğ., 1998).
3.2.1 Zaman serileri analizi
Zaman serisi, zaman sırasına konmuş gözlem değerleri kümesi olarak tanımlanabilir.
Zaman serisinde ilgilenilen özellik bir değişkendir. Bu değişken zaman içerisinde
çeşitli nedenlere bağlı olarak farklı değerler alır. Dolayısıyla zaman serisi, zaman
sırasına konmuş değişken değer kümesi olarak ifade edilebilir. Zaman aralıkları her
seride farklıdır. Saatlik, günlük, haftalık, aylık, üç aylık, yıllık veya daha farklı
zaman aralıklarına göre değer almış zaman serileri olabilir. Bir zaman serisinde
bağımsız değişken t, zaman devresini, 𝑌𝑡 ise değişkenin t dönemindeki gözlem
değerini gösterir (Kutay, 1989).
Zaman serileri analizinde gelecekteki tahmin miktarının geçmişte gerçekleşmiş talep
miktarlarının bir fonksiyonu olduğu varsayıldığı için analiz sürecinin başında
gerçekleşen talep miktarlarını gösteren veriler incelenir ve geçmişte talebin nasıl bir
davranış gösterdiği, seyrinin nasıl olduğu belirlenmeye çalışılır (Eski, 2006). Zaman
serileri analizinde geçmişe ilişkin talep miktarlarının dört bileşenin etkisi altında
olabileceği varsayılmaktadır. Bu bileşenler;

Trend (T)

Mevsimsel dalgalanmalar (S)

Devresel dalgalanmalar (C)

Düzensiz hareketler (I)
Trend, zaman serisindeki belirli bir dönemdeki sürekli artış ya da azalış eğilimidir.
Trend zaman serisinde görülen düzenli bir değişimdir. Bir zaman serisinde trend
belirlenebilir ise işletmeler trendlerin kırılma noktalarını kestirebilir ve böylelikle
doğru hamleleri yapabilirler (Chatfield, 2000).
Mevsimsel dalgalanmalar, zaman serilerinde en fazla bir yıllık dönem içerisinde belli
dönemlerde hava durumu, insan alışkanlıkları ve davranışları, gelenekler ve benzeri
sosyo-ekonomik etkiler nedeniyle meydana gelen talep miktarındaki oynamalardır.
Bu hareketler, belli bir süre içerisinde her defasında aynı veya benzer bir şekilde
13
tekrarlanırlar. Kış aylarında ısıtma cihazı satışlarının artması, hediyelik eşya
satışlarının özel günler öncesinde artması, gün içerisinde saate göre satılan sinema
bileti sayısının değişmesi mevsimsel hareketlere örnek olarak gösterilebilir.
Devresel dalgalanmalar, bir yıldan daha uzun sürelerde serinin benzer özellikler
göstermesi ya da kendini tekrar etmesidir. Mevsimsel dalgalanma ile benzeşirler
ancak devresel dalgalanmaların kendini tekrar etme periyodu her zaman aynı
olmayabilir. Devresel dalgalanmaları, seriden trendin, mevsimselliğin ve tesadüfi
hareketlerin çıkarılması sonucu kalan hareketler olarak da tanımlamak mümkündür.
Düzensiz hareketler, zaman serilerinde herhangi bir sistematik ile açıklanamayan,
tesadüflerden veya arızi durumlardan meydana gelen değişimlerdir. Arızi olaylara
örnek olarak seçim, savaş, grev veya kriz gibi olaylar örnek olarak verilebilir.
Düzensiz hareketleri, çoğunlukla tahmin etmek veya önlemek mümkün değildir. Bu
nedenle, seride arızi veya tesadüfi olaylardan dolayı sıçrama veya alçalmalar varsa
bunları analiz dışı bırakmak en uygun yoldur (Chatfield, 2000).
ġekil 3.3: Zaman serilerini etkileyen bileşenler.
Zaman serileri analizinde, talep verileri ile dört bileşen arasında toplamsal ta da
çarpımsal bir ilişki olduğu varsayılmaktadır. Talep miktarı Y ile gösterilirse, bu iki
tür ilişki matematiksel olarak aşağıdaki şekilde gösterilmektedir:
Toplamsal İlişki  Y = T + S + C + I
(3.1)
Çarpımsal İlişki  Y = T * S * C * I
(3.2)
14
3.2.1.1 Yalın yaklaĢım
Bu yöntemin temel varsayımı, hiçbir şeyin değişmeyeceği ve geleceğin bugünün
aynısı olduğudur. Bu yöntemde, bir zaman serisi değişkeninin son dönemde aldığı
değer, bir sonraki dönemin tahmini olarak kullanılır. Tahmin, şu formülle ifade
edilir:
𝐹𝑡+1 = 𝑦𝑡
(3.3)
Formülde 𝐹𝑡+1 , t+1 dönemindeki tahmini 𝑦𝑡 ise, t dönemindeki gerçekleşen talebi
göstermektedir.
3.2.1.2 Aritmetik ortalama yöntemi
Bu varsayım geleceğin, geçmişte olanların ortalamasına doğru eğilim göstereceğine
dayanmaktadır. Metot gelecek dönem tahmini için geçmiş dönem verilerinin
toplamının
ortalamasını
alır.
Metot
tüm
dönemleri
kullanarak
tahminde
düzgünleştirme sağlar.
𝐹𝑡+1 =
𝑛 𝑦
𝑡=1 𝑡
(3.4)
𝑛
Aritmetik ortalama yöntemi, trend ve mevsimsel dalgalanmaların etkisinin olmadığı,
gerçekleşen talep miktarlarının fazla değişim göstermediği, değişim aralıklarının dar
olduğu zaman serileri için uygundur (Eski, 2006).
3.2.1.3 Hareketli ortalamalar yöntemi
Bu metot da aritmetik ortalama metodu gibi kendisinden önceki dönemlerin
ortalamasının bir sonraki dönemin ortalamasına eşit olacağı varsayımı üzerine
kuruludur. Ancak bu metot yakın geçmişin tahminlerde daha ağırlıklı olacağını göz
önüne alır ve belirlenen n adet dönemin ortalamasını alarak yalnızca bir dönem
tahmini yapar.
𝐹𝑡+1 =
𝑦 𝑡 +𝑦𝑡−1 +⋯+𝑦𝑡−𝑛 −1
(3.5)
𝑛
Hareketli ortalamalar yöntemlerinde seçilecek n dönemin belirlenmesi çok önemlidir.
Bu dönem sayısı arttıkça seride düzgünleştirme sağlanacaktır, dönem sayısının az
seçilmesi durumunda ise tahmin son dönem taleplerinden gereğinden fazla
etkilenebilir.
15
Zaman serilerini oluşturan talep değerleri belirgin bir trende sahip ise bu durumda
basit hareketli ortalamalar yönteminin kullanılmasının bazı sakıncaları vardır.
Örneğin gerçekleşen talep değerleri yükselen bir trend gösteriyor ise, bu durumda
basit hareketli ortalamalar yöntemi ile bulunacak olan tahmin değerleri olması
gerekenden küçük olacaktır. Eğer gerçekleşen talep değerleri alçalan bir trend
gösteriyor ise, bu durumda basit hareketli ortalamalar yöntemi ile bulunacak olan
tahmin değerleri olması gerekenden büyük olacaktır. Bu sebeplerden dolayı, basit
hareketli ortalamalar yönteminin, zaman serisini oluşturan veriler üzerinde belirgin
bir trend ve mevsimsel dalgalanmanın olmadığı durumlarda kullanılması daha
doğrudur (Heizer ve Render, 2004).
3.2.1.4 Ağırlıklı hareketli ortalamalar yöntemi
Bu yöntemde de basit hareketli ortalamalar yönteminde kullanılan sistem geçerlidir.
Ancak basit hareketli ortalama alınırken değerlerin etkisi eşitken bu yöntemde
değerlere ağırlıklar verilerek etkileri farklılaştırılır. Eğer ürünün talebinde son
dönemlerde gerçekleşen değişimlerin etkisinin büyük olduğu düşünülüyorsa son
dönemlere daha büyük ağırlıklar verilerek etkisi güçlendirilir. Bunun yanı sıra zaman
serisini oluşturan veriler arasından uç değerler yani genel ortalamanın çok üstünde ve
altında değerler bulunuyorsa bu değerlerin ağırlıkları düşürülerek tahmin değeri
üzerindeki etkisinin azaltılması sağlanabilir.
𝐹𝑡+1 =
𝑤 1 ∗𝑦 𝑡 +𝑤 2 ∗𝑦𝑡−1 +⋯+𝑤 𝑛 ∗𝑦 𝑡−𝑛 −1
𝑤 1 +𝑤 2 +⋯+𝑤 𝑛
(3.6)
𝑤𝑛 , n. dönemde gerçekleşen talebe verilen ağırlık olmak üzere bu yöntemde
belirlenecek ağırlık değerleri de önem taşımaktadır. Ağırlık değerleri doğrusal olarak
belirlenebilir. Bu durumda verilen ağırlıklar, geçmiş taleplere doğru düzgün bir
azalış gösterecektir. Son dönemlerin farklı ağırlıklarda olacağının düşünülmesi ya da
belirli dönemlerin etkisinin daha fazla olacağının düşünülmesi durumunda bu
ağırlıklar sezgisel olarak da verilebilir.
3.2.1.5 Üssel ağırlıklandırılmıĢ hareketli ortalama yöntemi
Bu metot geçmiş zamandaki taleplere belirli ağırlıklar vermek yerine geçmiş
dönemlere ait ortalama talep ile mevcut döneme ait talebi belirli oranlarda tekrar
ağırlıklandırarak bir sonraki dönemin talebini hesaplar.
16
Bu metodun üç temel özelliği (Holt, 2004);

Veri eskidikçe daha az ağırlık vermektedir.

Hesaplaması kolay bir yöntemdir.

Yüksek oranda veri gereksinimi yoktur.
Metodun kullanılabilmesi için geçmiş dönemlerin talep ortalaması ve mevcut
dönemin talep değeri yeterlidir.
𝑋=
1
𝑛
2
𝐹𝑡+1 =
(3.7)
−1
1−𝑋 ∗
𝑡−1 𝑦
𝑛 =1 𝑛
𝑛
+ 1 − 𝑋 ∗ 𝑦𝑡
(3.8)
X değeri en son dönem ile önceki dönemler arasındaki ağırlıklandırmayı belirleyen
katsayıdır. Metot en son dönem ağırlığını önceki dönemlerden ayrı tutarak iki kez
ağırlıklandırma yapmaktadır.
3.2.1.6 Basit üssel düzgünleĢtirme yöntemi
Basit üssel düzgünleştirme yöntemi, basit ve ağırlıklı hareketli ortalamalar
yöntemlerinden farklı olarak herhangi bir döneme ilişkin tahmini talep miktarının bu
dönemden önce gelen tüm dönemlerde gerçekleşmiş olan talep miktarlarına bağlı
olarak belirlenmesini öngörmektedir (Eski, 2006).
Basit üssel düzgünleştirme yöntemi, herhangi bir döneme ait tahmini talep miktarını
bulurken, bu dönemden önce gelen dönemlerin talep miktarlarına, gerçekleştikleri
zamanla ters orantılı ağırlıklar vermektedir. Böylelikle en yakın geçmişte
gerçekleşen talep miktarı, yapılan tahmini en çok etkileyen veri olurken, en uzak
geçmişte gerçekleşen talep miktarı da yapılan tahmini en az etkileyen veri olacaktır.
Basit üssel düzgünleştirme yöntemi aşağıdaki şekilde ifade edilebilir;
𝐹𝑡+1 = 𝐹𝑡 + 𝛼 𝑦𝑡 − 𝐹𝑡
(3.9)
Bu formülde farklı olan, 𝛼 katsayısı 0 ile 1 arasında değer alan düzgünleştirme
katsayısını ifade etmektedir. Burada 𝛼
değeri dönemlere verilen ağırlığı
etkilemektedir. 𝛼 büyüdükçe son dönemlere daha fazla ağırlık verilmektedir.
𝑦𝑡 − 𝐹𝑡 ifadesi bir önceki döneme ait tahminin hata değeridir. Eğer bu hata pozitif
ise gerçekleşen, tahminden daha büyüktür ve düzgünleştirme bir sonraki tahmini
17
arttırıcı yönde etki yapacaktır. Tersi durumda hata değeri negatif olur ise tahmin
gerçekleşenden fazla olduğundan düzgünleştirme katsayısı tahmini azaltacak yönde
çalışır (Mann, 1995).
Basit üssel düzgünleştirme yönteminde düzgünleştirme katsayısının belirlenmesi,
yapılan tahminlerin doğruluğu açısından önem taşımaktadır. 𝛼
katsayısının
belirlenmesine yönelik literatürde önerilen iki yöntem aşağıdaki gibidir (Eski, 2006):
a) n, zaman serisini oluşturan veri sayısını göstermek üzere, düzgünleştirme
katsayısı;
𝛼=
2
(3.10)
𝑛+1
b) 𝛼 değerinin tahmini için en basit yöntem, farklı 𝛼 değerleri ile deneyler yapıp
en uygununu bulmaktır. Uygulamada önerilen, 𝛼 değerinin 0,05 ile 0,30
arasında seçilmesidir. Kısa dönemli dalgalanmaların yaşandığı ortamlarda 𝛼
değeri daha büyük olarak seçilebilir.
3.2.1.7 Holt lineer metodu
Basit üssel düzgünleştirme yöntemi, zaman serisinin bir trende sahip olması
durumunda uygun olmayan bir yöntemdir. Böyle durumlarda, gelecek dönemlere
yönelik tahmin yapmak için Holt Lineer Metodu (Çift Üssel Düzgünleştirme
Yöntemi) kullanılmaktadır. Metot, Holt tarafından 1957 yılında basit üssel
düzgünleştirme yöntemine trend bileşeninin eklenmesiyle geliştirilmiştir.
Holt Lineer metodunun cebirsel ifadesi şöyledir;
𝐹𝑡+𝑚 = 𝐿𝑡 + 𝑇𝑡 𝑚
(3.11)
𝐿𝑡 = 𝛼𝑦𝑡 + 1 − 𝛼 𝐿𝑡−1 + 𝑇𝑡−1
(3.12)
𝑇𝑡 = 𝛽 𝐿𝑡 − 𝐿𝑡−1 + 1 − 𝛽 𝑇𝑡−1
(3.13)
Bu yöntemde 𝛼 düzgünleştirme faktörü ile 𝛽 trend için düzgünleştirme faktörü
kullanılmaktadır. 𝛽 faktörü de 0 ile 1 arasında değer alır ve büyüklüğü karar verici
tarafından belirlenir.
𝐿𝑡 zaman serisinin t anındaki seviyesini ifade eder ve bir önceki dönemin seviye
değeri ile trend değerini düzgünleştirir. Böylelikle 𝐿𝑡 değeri geçmiş dönemin trend
bileşenini de içerir (Aksoy, 2008).
18
𝑇𝑡 ise zaman serisinin t anındaki eğimini göstermektedir. Son iki dönemin seviye
değerleri arasındaki farkı düzgünleştirerek, oluşan fark üzerinden trend bileşenini
hesaplar.
𝐹𝑡+𝑚 , trende sahip olduğu düşünülen zaman serisinin t+m dönemindeki tahmin
değerini ifade eder, t anında hesaplanan seviye ve trend bileşenleri kullanılarak
hesaplanır. Formüldeki m değeri, t anından itibaren periyot sayısını ifade eder. Bu
durumda, 𝐹𝑡+𝑚 tahmin değeri t anındaki seviye bileşenine dönem sayısı kadar trend
bileşeni eklenmesi ile bulunur.
3.2.1.8 Holt winter trend ve mevsimsellik metodu
Zaman serisinin trend bileşeni ile birlikte mevsimsellik de içerdiği durumlarda
kullanılır. Bu durumda talep, doğrusal bir yapı göstermeyecektir. Tahmin eşitliği de
seviye ve trend bileşenleri ile birlikte mevsimsellik bileşeni de içerecektir (Aksoy,
2008).
𝐹𝑡+𝑚 = 𝐿𝑡 + 𝑇𝑡 𝑚 + 𝑆𝑡−𝑠+𝑚
(3.14)
𝐿𝑡 = 𝛼 𝑦𝑡 − 𝑆𝑡−𝑠 + 1 − 𝛼 𝐿𝑡−1 + 𝑇𝑡−1
(3.15)
𝑇𝑡 = 𝛽 𝐿𝑡 − 𝐿𝑡−1 + 1 − 𝛽 𝑇𝑡−1
(3.16)
𝑆𝑡 = 𝜆 𝑦𝑡 − 𝐿𝑡 + 1 − 𝜆 𝑆𝑡−𝑠
(3.17)
3.2.2 Nedensel yöntemler
Nedensel yöntemler, tahmin edilmek istenen bir etkeni, kendisini etkileyen faktörler
ile ilişkilendirerek, tahminlerin bu faktörlerdeki değişmelere bağlı olarak yapılmasını
amaçlayan yöntemlerdir (Eski, 2006). Nedensel modellerde sistemin çıktıları
sistemin girdilerinin matematiksel formülasyonu olarak ifade edilir, talep ile talebi
etkileyen faktörler arasında neden-sonuç ilişkisi kurulur.
Nedensel yöntemler arasında en çok tercih edilen metotlar, regresyon analizi ve
korelasyon analizidir.
3.2.2.1 Regresyon analizi
Regresyon analizi bir değişken ile ona bağlı diğer değişkenler arasındaki ilişkiyi
incelemektedir. Sistem çıktısı, tahmin değeri 𝑌𝑥 ile sistem girdileri 𝑋1 , 𝑋2 , … 𝑋𝑛
arasındaki ilişkiyi inceler. Burada 𝑌𝑥 bağımlı değişken 𝑋1 , 𝑋2 , … 𝑋𝑛 ise bağımsız
19
değişkenlerdir. Bağımlı değişken ile bağımsız değişkenler arasındaki ilişki doğrusal
ya da eğrisel olabilir (Wei, 1990). Temel olarak basit doğrusal regresyon, çoklu
doğrusal regresyon ve eğrisel regresyon denklemleri vardır.
Basit doğrusal regresyon modeli, bağımlı değişkenin yalnızca bir bağımsız değişkene
bağlı olduğu regresyon modelidir.
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝜀𝑖
𝑖 = 0,1, … 𝑛
(3.18)
(3.18)‟de 𝑌𝑖 tahmin değeri, 𝑋𝑖 bağımsız değişkeninin doğrusal bir fonksiyonu olarak
gösterilmektedir. 𝛽0 , doğrunun 𝑌 eksenini kestiği noktayı 𝛽1 , doğrunun eğimini 𝜀𝑖 ise
𝑖. gözleme ait hata bileşenini vermektedir. Formüldeki 𝛽0 ve 𝛽1 değerleri, en küçük
kareler yöntemi ile bulunmaktadır.
En küçük kareler yöntemine göre, bir zaman serisine en iyi uyan başka bir deyişle bir
değerler serisini en iyi ifade eden doğru veya eğri, geçmiş yıllara ait gerçek
değerlerle formülün uygulanması ile bulunacak teorik değerler arasındaki farkların
karelerinin toplamını (sapmaların kareleri toplamını) minimum yapan doğru veya
eğridir (Makridakis ve diğ., 1998).
ġekil 3.4: En küçük kareler yöntemi.
𝜀𝑖 hata bileşenlerinin karesini minimum yapan doğru denkleminin bulunması ile
sonraki dönemlerin talep tahmini yapılabilir. 𝛽0 ve 𝛽1 değerleri aşağıdaki
hesaplamalar
𝛽1 =
𝛽0 =
𝑛
𝑋𝑌 −
𝑛
𝑌
𝑛
𝑋2−
− 𝛽1
ile
𝑋
𝑌
𝑋 2
bulunur.
(3.19)
𝑋
(3.20)
𝑛
20
Çoklu doğrusal regresyon modelinde bağımlı değişken 𝑌𝑖 birden çok bağımsız
değişkenin doğrusal formülasyonu olarak ifade edilir. Modelin genel gösterimi şu
şekildedir:
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋1 + 𝛽2 𝑋2 + 𝛽3 𝑋3 + ⋯ + 𝛽𝑛 𝑋𝑛 + 𝜀𝑖
(3.21)
Regresyon denkleminde bağımlı değişken bağımsız değişkenlerin eğrisel bir
fonksiyonu olarak da ifade edilebilir. Bu durumda denklemin genel gösterimi
aşağıdaki gibidir:
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋1 + 𝛽2 𝑋 2 + ⋯ + 𝛽𝑛 𝑋 𝑛 + 𝜀𝑖
(3.22)
3.2.2.2 Korelasyon analizi
Korelasyon analizi ile değişkenler arasındaki ilişkinin derecesi ortaya konur.
Korelasyon analizi bir talep tahmin yöntemi olarak kullanılabileceği gibi birçok
yöntemin oluşturulması ve sonuçların rassallıklarının ortaya konmasında da
kullanılır.
Korelasyon katsayısı R ile simgelenir ve iki değişken arasındaki doğrusal ilişkinin
derecesini belirler. Korelasyon katsayısı -1 ve +1 arasında değerler alır ve bu değere
bakılarak ilişki yorumlanır. Eğer değişkenler arasında doğrusal ilişki yoksa R=0 çıkar
(Anderson ve diğ., 2005).
𝑅=
𝑛
𝑛
𝑥𝑖 𝑦 𝑖 − 𝑥𝑖
𝑥2−
𝑥
2
𝑛
𝑦𝑖
𝑦 2− 𝑦
(3.23)
2
Korelasyon katsayısı pozitif ise ilişki doğru orantılı, negatif ise ters orantılıdır.
Değerin 0 veya 1‟e yaklaşması aralarındaki ilişkinin kuvvetli veya zayıf olduğunu
göstermektedir. Korelasyon değeri +1 veya -1 çıkar ise gerçek değer ile regresyon
denklemi ile bulunan değer birebir birbirini tutar.
Korelasyon katsayısının aldığı değerler aşağıdaki şekilde yorumlanır (Tekin, 1996):
0.90 -1.00 : Çok yüksek korelasyon
0.70 - 0.90 : Yüksek korelasyon
0.40 - 0.70 : Normal korelasyon
0.20 - 0.40 : Düşük korelasyon
0.00 - 0.20 : Çok düşük korelasyon
21
3.3 Box Jenkins Yöntemleri
Box-Jenkins metodu tek değişkenli bir model olarak, geleceği tahmin etme
metotlarından biridir. Kısa dönem tahmininde oldukça başarılı olan bu metodun
uygulandığı serinin, eşit zaman aralıklarıyla elde edilen gözlem değerlerinden oluşan
kesikli ve durağan bir seri olması bu metodun önemli bir varsayımıdır (Bircan ve
Karagöz, 2003).
Zaman serisinin durağan olduğunun söylenebilmesi için, ortalamasında ve varyansında
sistematik bir değişim olmaması gerekir. Bir seri sabit bir büyüme ya da genel bir trend
gösteriyorsa ya da bir seviyeden bir başka seviyeye geri dönüyorsa, bu yapıdaki seriler
durağan bir seriye dönüştürülmeden modellenemezler (Box ve Jenkins, 1976).
Box Jenkins modellerinin metodolojisi şu şekilde gösterilmektedir:
Serinin Durağan Hale
Getirilmesi
Modelin Belirlenmesi
Model Parametrelerinin
Hesaplanması
Model Uygunluk Kontrolü
Olumlu
Olumsuz
Tahmin
ġekil 3.5: Box Jenkins metodolojisi.
Box – Jenkins modelleri, otoregresif modeller (AR), hareketli ortalama yöntemleri
(MA), Otoregresif hareketli ortalama yöntemleri (ARMA) ve durağan olmayan
serilerde uygulanan (ARIMA) modellerinden oluşmaktadır.
22
3.3.1 Otoregresif modeller – AR(p) modelleri
Bu modellerin genel gösterimi AR(p) sekindedir. Burada p değeri geçmiş dönem
sayısını verir. Model, geçmiş p dönemdeki zaman serisi değerlerinin ağırlıklı
toplamının ve rassal hata değerinin bir fonksiyonudur. AR(p) modelinin genel
gösterimi aşağıdaki gibidir:
𝑌𝑡 = 𝜇 + Φ1 𝑌𝑡−1 + Φ2 𝑌𝑡−2 + ⋯ + Φp 𝑌𝑡−𝑝 + 𝜀
(3.24)
Formülde μ değeri serinin ortalamasını verirken, Φ1 , … , Φp otoregresif parametreleri
göstermektedir. 𝜀 değişkeni ise serinin hata değişkenini temsil etmektedir.
3.3.2 Hareketli ortalamalar – MA(q) modelleri
MA(q) modelinde 𝑌𝑡 değeri, serinin geriye doğru q dönem geçmiş hata terimlerinin
ve ortalamasının doğrusal fonksiyonudur (Kutlar, 2000). MA(q) modelinin genel
gösterimi aşağıdaki gibidir:
𝑌𝑡 = 𝜀𝑡 −Θ1 𝜀𝑡−1 − Θ2 𝜀𝑡−2 − ⋯ − Θq 𝜀𝑡−𝑞
(3.25)
Formül üzerinde 𝜀𝑡 , 𝜀𝑡−1 , … , 𝜀𝑡−𝑝 hata terimlerini, Θ1 , Θ2 , … , Θq değerleri de hata
terimlerinin katsayılarını göstermektedir.
3.3.3 Otoregresif hareketli ortalama yöntemi – ARMA(p,q)
ARMA modelleri en genel durağan stokastik süreç olup, geçmiş gözlemlerin ve
geçmiş hata terimlerinin doğrusal bir fonksiyonudur (Önder ve Hasgül, 2009).
ARMA (p,q) modelleri genel olarak aşağıdaki gibi gösterilebilir:
𝑌𝑡 = 𝜇 + Φ1 𝑌𝑡−1 + ⋯ + Φp 𝑌𝑡−𝑝 + 𝜀𝑡 −Θ1 𝜀𝑡−1 − ⋯ − Θq 𝜀𝑡−𝑞
(3.26)
Model, zaman serisinin t anındaki tahmininin p adet önceki dönem gözlem değeri ile
q adet önceki dönem hata değerinin bileşiminden meydana gelir. Tahmin p sayıda
içsel bağımlılık parametresi (Φ1 , Φ2 , … , Φp ) ve q sayıda hata parametresi
Θ1 , Θ2 , … , Θq içerir.
3.3.4 Durağan olmayan otoregresif hareketli ortalama yöntemi - ARIMA (p,d,q)
Eğer bir zaman serisi durağan değil ise yani zaman içerisinde artan ya da azalan bir
eğilim gösteriyor ise bu durumda ARMA modellerinin kullanılabilmesi öncelikle
serinin durağanlaştırılması gerekir. Durağanlaştırma işlemi serinin farkının alınması
23
ile elde edilir. Eğer zaman serisinin eğilimi doğrusal ise bir kez fark alınması ile seri
durağanlaşacaktır. Eğer serinin eğilimi eğrisel ise bu durumda ikinci farkı almak
gereklidir. Bu tür modeller ARIMA(p,d,q) seklinde ifade edilir. Modeldeki d
parametresi serinin kaç kez farkının alındığını belirtir (Aksoy, 2008). Fark işlemi
aşağıdaki şekilde ifade edilir:
Δ𝑌𝑡 = 𝑍𝑡 = 𝑌𝑡 − 𝑌𝑡−1
(3.27)
Eşitlikte Δ fark alma operatörünü ifade eder. 𝑍𝑡 ise farkı alınmış serinin t anındaki
tahminini simgeler. Eğer yukarıdaki işlem sonucunda elde edilen 𝑍𝑡 değerleri
durağan bir seri oluşturuyor ise bu durumda d=1 olarak gösterilir. Eğer elde edilen
seri durağanlaşmamış ise bu durumda bir kez daha fark alınır. Bu işlem aşağıdaki
şekilde gösterilir:
Δ2 𝑌𝑡 = 𝑊𝑡 = 𝑍𝑡 − 𝑍𝑡−1
(3.28)
Δ2 𝑌𝑡 = 𝑊𝑡 = 𝑌𝑡 − 𝑌𝑡−1 − 𝑌𝑡−1 − 𝑌𝑡−2
(3.29)
Box Jenkins modellerinde uygun modelin belirlenmesi yani (p,q,d) parametrelerine
karar verilmesi önemli bir süreçtir. Bu değerler arasından d değerini elde etmek
kolaydır. Serinin artan ya da azalan bir yapısı var ise bu yapının doğrusal olması
durumunda d=1, eğrisel 6 olması durumunda d=2‟dir. Ancak p ve q değerlerinin
belirlenmesi otokorelasyon ve kısmi otokorelasyon fonksiyonları ile belirlenebilir.
Otokorelasyon fonksiyonu zaman serisindeki iki nokta arasındaki tüm noktaların
ilişkisini inceler. Otokorelasyon fonksiyonu şu şekilde gösterilebilir;
𝑚=
𝜌=
𝑇 𝑌
𝑡=1 𝑡
(3.30)
𝑇
𝑇 −𝑘 (𝑌 −𝑚)(𝑌
𝑡−𝑘 −𝑚)
𝑡=1 𝑡
𝑇 (𝑌 −𝑚)2
𝑡=1 𝑡
(3.31)
m değeri serinin ortalamasını vermektedir. Korelasyon değeri (𝜌) de k dönemin
ilişkisini tanımlamaktadır.
Kısmi otokorelasyon fonksiyonu ise zaman serisindeki iki nokta arasındaki diğer
noktaları arındırır ve sadece seçilen iki nokta arasındaki ilişkiyi belirler. Kısmi
otokorelasyon, otokorelasyondan türetilebilir.
24
3.4 Yapay Zekâ Çözümleri
İlk defa 1950‟li yıllarda ortaya atılan yapay zeka terimi zaman içinde oldukça yoğun
ilgi görmüş ve 40-50 yıllık bir zaman diliminde hayatın vazgeçilmez parçası olan
sistemlerin doğmasına sebep olmuştur (Öztemel, 2003). Talep tahmini kavramının
değişken ve belirsiz yapısı da yapay zekâ yöntemlerinin talep tahmin problemlerinin
çözümünde gelişmesini sağlamıştır. Talep tahmininde en çok kullanılan yapay zekâ
çözümleri, bulanık mantık ve yapay sinir ağlarıdır.
3.4.1 Bulanık mantık
Bulanık mantık, klasik küme mantığının dışında yeni bir yaklaşım getirmektedir.
Klasik küme mantığında nesnelerin üyelik dereceleri {0,1} olarak ifade edilmektedir.
Bu durumda bir nesne bir kümeye üyedir ya da üye değildir. Örneğin 4 rakamının,
5‟ten küçük sayılar kümesine üyelik derecesi 1‟dir, 5‟ten büyük sayılar kümesine
üyeliği ise 0‟dır. Bu mantık matematik, fizik gibi temel bilimlerde geçerli olan ve
kullanılan bir mantıktır (Aksoy, 2008). Ancak doğal olaylar ve günlük hayatta
karşılaşılan durumlar incelendiğinde farklı üyelik derecelerinden söz edilebilir.
Örneğin farklı sıcaklık değerlerinin “Sıcak Hava” kümesine üyeliğini {0,1} şeklinde
ifade etmek mümkün değildir. 18̊ sıcaklık değerinin bu gruba üyelik derecesi [0,1]
aralığında değer alır. Aynı şekilde 5̊, 15̊, 30̊ değerlerinin de küme üyelik dereceleri
[0,1] aralığında farklı değerler almaktadır.
Bulanık mantık kavramı ilk kez 1965 yılında Zadeh tarafından yapılan çalışmalar ile
ortaya atılmıştır. Zadeh bu çalışmasında girdi verilerinin farklı kümelerdeki farklı
üyelik derecelerinden bahsetmiş ve girdinin çıktıya dönüşümünün bu kümeler
aracılığı ile yapılabileceğinden söz etmiştir. Bu çalışmalar önceleri pek değer
kazanmasa da zaman içerisinde önem kazanmış ve bulanık mantık araştırmaları
genişletilmiştir. Yöntem özellikle deneyimlere dayalı verilerde ya da sayısal olarak
ifade edilemeyen verilerin yorumlanmasında kullanılmaktadır.
Bulanık mantık, Şekil 3.6‟ da gösterilen sürece göre çalışmaktadır.
25
Fuzzifikasyon
(Bulanıklaştırma)
Bulanık Önermeyi İşleme
Defuzzifikasyon
(Netleştirme)
ġekil 3.6: Bulanık mantığın elemanları ve çalışması (Öztemel, 2003).
Bulanıklaştırma, çözülecek problem ile ilgili bulanık önerme değişkenlerinin ve
karar verme kurallarının belirlenmesi ve üyelik fonksiyonunun oluşturulması
işlemidir. Örneğin, hava sıcaklığının normal olması durumunda değişkenin adı
“normal” olabilir. Üyelik fonksiyonu ise herhangi bir sıcaklık değerinin “normal”
olma üyeliğini gösterir. Üyelik değeri 0-1 aralığında bir değerdir. 1 değeri, tam
üyelik durumunu 0 ise üye olmama durumunu gösterir. 18̊ sıcaklığın normal olma
değeri 1 ise, bu değeri olasılık değeri yerine mümküniyet değeri olarak görmek
gerekir (Öztemel, 2003). Normal değişkeninin üyelik fonksiyonu Şekil 3.7‟de
gösterilmektedir.
ġekil 3.7: Üyelik fonksiyonu örneği.
26
Bulanık önerme işleme, belirlenen bulanık önerme değişkenlerinin kurallarını
kullanarak problemin çözüm alanını belirleme işlemidir. Genellikle üyelik
fonksiyonlarının
üst
üste konulması
sonucu
kurallara göre ortak alanın
belirlenmesidir. Eğer kurallar AND (VE) bağlacı ile bağlanmış ise üyelik
fonksiyonlarının en küçük değeri, OR (VEYA) bağlacı ile bağlanmış ise o zaman
üyelik fonksiyonlarının büyük değerlerini alarak alan oluşturulur (Öztemel, 2003).
Netleştirme ise bulunan çözüm alanından tek bir değer elde edilmesi işlemidir.
3.4.2 Yapay sinir ağları
Yapay sinir ağları (YSA), talep tahmininde çok yoğun olarak kullanılan bir
yöntemdir. Bu çalışmada, yapay sinir ağları kullanılarak temizlik kâğıtları sektöründe
talep tahmin problemi çözülmüştür. YSA, 4. bölümde ayrıntılı olarak işlenecektir.
3.5 Tahmin Yöntemlerinin Doğruluğunun Ölçülmesi
Hangi yöntem kullanılırsa kullanılsın tahminler ile gerçekleşen değerler birebir
örtüşmez. Yapılan tahminde mutlaka belli bir hata oranı oluşur. Bu nedenle
kullanılan yöntemin denetimi gereklidir. Denetim süreci en az tahmin süreci kadar
önemlidir (Kobu, 1996).
Tahmin hatası belirli bir t periyotta talep ile tahmin arasında oluşan farkı ifade
etmektedir.
𝑒𝑡 = 𝑌𝑡 − 𝐹𝑡
(3.32)
𝑌𝑡 , t anında gerçeklesen talebi 𝐹𝑡 ise t anındaki tahmini göstermektedir. Tahmin
hatası talepten tahminin çıkartılması ile bulunur. Genel olarak amaç tahmin hatasını
en aza indirecek yöntemin ve parametrelerin seçilmesidir. Tahmin hatasından yola
çıkarak tahmin yöntemlerinin doğruluğunun belirlenmesinde birçok yöntem
geliştirilmiştir.
3.5.1 Ortalama hata (ME)
Ortalama hata oluşan hata değerlerinin aritmetik ortalamasını alır. Hata değerlerinin
negatif ya da pozitif değerler almasına izin verir. Ortalama hata metodu, hata
değerleri kullanan en basit doğruluk metodudur. ME (Mean Error) ifadesi ile
gösterilir.
27
1
𝑛
𝑖=1 𝑒𝑖
𝑀𝐸 = 𝑛
(3.33)
3.5.2 Ortalama mutlak hata (MAE)
Ortalama mutlak hata yöntemi ortalama hata yöntemine benzer şekilde hesaplanır
ancak hata değerlerinin mutlak değerleri alınarak işaretlerden arındırılır. Böylelikle
hata değerleri talep değerlerine uzaklıkları ile hesaplanmış olur. MAE (Mean
Absolute Error) ile gösterilir.
1
𝑛
𝑖=1
𝑀𝐴𝐸 = 𝑛
𝑒𝑖
(3.34)
3.5.3. Ortalama hata kare kriteri (MSE)
Hata kareleri ortalaması talep tahminlerinin doğruluk hesaplamasında sıklıkla
kullanılır.
Bu yöntem de tıpkı ortalama mutlak hata gibi hataları işaretlerden arındırır ve sadece
büyüklüklerine bakar. MSE( Mean Square Error) ile ifade edilir.
1
𝑛
2
𝑖=1 𝑒𝑖
𝑀𝑆𝐸 = 𝑛
(3.35)
3.5.4 Ortalama mutlak hata yüzdesi (MAPE)
Ortalama mutlak hata yüzdesi yöntemi oluşan hataları yüzdesel olarak ifade eder.
Böylelikle hataların birbirleri ile kıyaslanmasını sağlar. MAPE (Mean Absolute
Percentage Error) ile ifade edilir.
1
𝑀𝐴𝑃𝐸 = 𝑛
𝑒𝑖
𝑛
𝑖=1 𝑦
𝑖
× 100
(3.36)
3.5.5 Theil U istatistigi (U)
Theil tarafından 1978 yılında geliştirilen bir metottur. Bu metot hesaplanan hata
değerlerini, yakınlaştıkça arttırır. Böylelikle istatistiksel olarak yakın dönemde
gerçeklesen hatalar ağırlıklandırılmış olur. Farklı tahmin ufuklarındaki yaklaşımların
karşılaştırılmasında sıklıkla kullanılır. U ile gösterilir.
𝑈=
1
𝑛
1
𝑛
𝑛 𝑒 2
𝑖=1 𝑖
𝑛 𝑦 2
𝑖=1 𝑖
(3.37)
28
3.5.6 Ġzleme sinyali
İzleme sinyali hata değerlerinin genel yapısını inceler. İyi bir tahmin negatif ve
pozitif hatalar içerir. Sonuç olarak bu hataların toplamı bir başka deyişle talepten
sapmalarının toplamı 0 elde edilmeye çalışılır.
İzleme sinyalinde alt ve üst kontrol limitleri mevcuttur. İzleme sinyalinin istenen
değeri 0, alt kontrol limiti -3 ve üst kontrol limiti +3‟tür. İzleme sinyali aşağıdaki
şekilde gösterilir.
İ𝑧𝑙𝑒𝑚𝑒 𝑆𝑖𝑛𝑦𝑎𝑙𝑖 =
1
𝑛
𝑛
𝑖=1 𝑒 𝑖
𝑛
𝑖=1 𝑒 𝑖
(3.38)
29
30
4. YAPAY SĠNĠR AĞLARI METODOLOJĠSĠ
4.1 Yapay Zekâ Kavramı
Her insan doğuştan belirli bir zekâya sahiptir. Zekâ, belirli bir konuda çalışılarak,
öğretilerek, eğitilerek, edinilen bilgi ve birikimlerle, deneyimlere dayalı becerilerle
geliştirilebilir. İlk kez karşılaşılan ya da ani olarak gelişen bir olaya uyum
sağlayabilme, anlama, öğrenme, analiz yeteneği, beş duyunun, dikkatin ve
düşüncenin yoğunlaştırılması zekâ ile gerçekleştirilebilmektedir. Zekâ, yazılım veya
tümleşik parçalarla taklit edilebilmektedir. Bu durumda zekâ 'Yapay Zekâ' olarak
adlandırılmaktadır (Elmas, 2003).
Yapay zekâ (YZ); zekâ ve düşünme gerektiren işlemlerin bilgisayarlar tarafından
yapılmasını sağlayacak araştırmaların yapılması ve yeni yöntemlerin geliştirilmesi
hususunda çalışılan bilim dalıdır. YZ; “düşünme, anlama, kavrama, yorumlama ve
öğrenme yapılarının programlamayla taklit edilerek problemlerin çözümüne
uygulanması” olarak da ifade edilebilir. Daha geniş anlamda YZ;

bilgisayarların bilgi edinme, algılama, görme, düşünme ve karar verme gibi
insan zekasına özgü kapasitelerle donatılması bilimi,

insanın düşünme yapısını anlama, bunun benzerini ortaya çıkaracak
bilgisayar işlemlerini geliştirmeye çalışma,

programlanmış bir bilgisayarın düşünme girişimi olarak da tarif edilmektedir
(Sağıroğlu ve diğ., 2003).
İnsan beyni ve işleyişinin insanoğlunun ilgisini çekmesi çok eskilere dayansa da bu
konuda pratiğe yönelik bilimsel çalışmalar 19. yüzyılın sonlarında yapılmaya
başlanmıştır. 1956 yılında Dartymouth College‟de yapılan ve pek çok bilim adamının
katıldığı iki aylık bir konferansta YZ‟nin temellerini oluşturan çalışmalar bilim
adamlarınca tartışılmış ve yapay zeka ismi ilk kez kullanılmıştır.
YZ‟nin yaygın bir şekilde araştırma ve uygulama alanı bulan belli başlı alt dalları
şöyle özetlenebilir (Elmas, 2003);
31
Uzman Sistemler, temelde insan düşüncelerini geliştirmek amacıyla bilgisayar
tarafından işlenen yazılımlardır. Uzman sistemler geliştirilirken, belirli bir konuda
uzmanlaşmış olan insanların bilgi ve deneyimlerinin bilgisayara aktarılması
amaçlanır.
Bulanık Mantık, bulanık küme teorisine dayanan matematiksel bir disiplindir.
Bulanık mantık; bilgisayarın, sadece bir durumun ya da karşıtının olabileceğini kabul
eden mantığının yerine, insan mantığındaki gibi ara değerleri de hesaba katarak karar
vermesini sağlar. Örneğin bir bilgisayar için sadece uzun-kısa ya da sıcak-soğuk
olabilen bir durum, bulanık mantık kullanılarak uzun-ortadan uzun-orta-ortadan kısakısa ya da sıcak-ılık-az soğuk-soğuk-çok soğuk gibi ara değerlere sahip olabilir.
Genetik algoritma, Darwin‟in evrim kuramı “doğada en iyinin yaşaması” kuralından
esinlenerek oluşturulan, bir veri kümesinden özel bir veriyi bulmak için kullanılan
bir arama yöntemidir. Genetik algoritmalar, geleneksel yöntemlerle çözümü zor veya
imkansız olan problemleri sanal olarak evrimden geçirerek en iyi çözümü elde
etmeyi amaçlamaktadır.
Yapay sinir ağları, insan beyninde bulunan sinir ağlarının işleyişini modelleyen
tekniklerdir. Yapay sinir ağlarına, ilgili olaya ait bilgiler örnekler üzerinde eğitilerek
verilmektedir. Böylelikle, örnekler sayesinde açığa çıkarılmış özellikler üzerinde
çeşitli genelleştirilmeler yapılarak, daha sonra ortaya çıkacak ya da o ana kadar hiç
rastlanmamış olaylara da çözümler üretilmektedir..
4.2 Yapay Sinir Ağlarına GiriĢ
Çalışmanın bu bölümünde, talep tahmininde kullanılacak olan, Yapay Sinir Ağları
(YSA) metodolojisi genel olarak tanıtılacak ve bu çalışmada talep tahmini için
kullanılan Geri Yayılma Ağları‟nın (Backpropagation Networks) teorik altyapısı
incelenmeden önce, yapay sinir ağları hakkında genel bilgilere değinilecektir.
4.2.1 Yapay sinir ağlarının tanımı
Pek çok tanımı bulunan yapay sinir ağları basit olarak, beyindeki sinirlerin
çalışmasından esinlenilerek sistemlere öğrenme, hatırlama, bilgiler arasında ilişkiler
oluşturma gibi yetenekleri kazandırmayı amaçlayan bilgi işleme algoritmalarıdır.
Literatürde karşılaşılan tanımlamalara aşağıda yer verilmektedir.
32
Yapay Sinir Ağları (YSA), en kısa ve basit şekilde, bir örnekler kümesi yardımıyla
parametrelerin uyarlanabilmesini sağlayacak bir matematiksel formül için yazılan
bilgisayar programı olarak tanımlanabilir. Bu tanım, YSA‟nın en basit şekilde ve
teknik detaya girilmeksizin ifade etmektedir (Yurtoğlu, 2005).
YSA, insan beyninin özelliklerinden olan öğrenme yolu ile yeni bilgiler türetebilme,
oluşturabilme, keşfedebilme gibi yetenekleri herhangi bir yardım almadan otomatik
olarak gerçekleştirmek amacı ile geliştirilen bilgisayar sistemleridir (Öztemel, 2003).
Yapay sinir ağları, paralel bağlı çok sayıdaki basit elemanın, gerçek dünyanın
nesneleriyle biyolojik sinir sisteminin benzeri yolla etkileşim kuran hiyerarşik bir
organizasyondur (Kohonen, 1987).
Haykin (1999) tarafından verilen daha kapsamlı ve genel kabul gören bir tanıma
göre ise bir sinir ağı, basit işlem birimlerinden oluşan, deneyimsel bilgileri
biriktirmeye yönelik doğal bir eğilimi olan ve bunların kullanılmasını sağlayan
yoğun bir şekilde paralel dağıtılmış bir işlemcidir. Bu işlemci iki şekilde beyin ile
benzerlik göstermektedir:
1. Bilgi, ağ tarafından bir öğrenme süreciyle çevreden elde edilir.
2. Elde edilen bilgileri biriktirmek için sinaptik ağırlıklar olarak da bilinen nöronlar
arası bağlantı ağırlıkları kullanılır.
4.2.2 Yapay sinir ağlarının tarihsel geliĢimi
Yapay sinir ağlarının tarihçesi nörobiyoloji konusuna insanların ilgi duyması ve elde
ettikleri bilgileri bilgisayar bilimine uygulamaları ile başlamaktadır. YSA ile ilgili
çalışmaları 1970 öncesi ve sonrası olarak ikiye ayırmak gerekmektedir. Çünkü 1970
yılında bu bilimin tarihinde önemli bir dönüm noktası başlamış ve o zamana kadar
olmaz diye düşünülen bir çok sorun çözülerek yeni bir süreç başlamıştır (Öztemel,
2003).
4.2.2.1 1970 öncesi YSA ile ilgili çalıĢmalar
İlk yapay sinir ağı modeli 1943 yılında, bir nörolog olan Warren McCulloch ve bir
matematikçi olan Walter Pitts tarafından geliştirilmiştir (Elmas, 2003). McCulloch ve
Pitts, insan beyninin hesaplama yeteneğinden esinlenerek, elektrik devreleriyle basit
bir sinir ağını modellemişlerdir.
33
Donald Hebb (1949) tarafından yayımlanan “The Organization of Behavior” adlı
kitabı ile öğrenebilen ve uyum sağlayabilen sinir ağları modeli için temel olacak
Hebb Kuralı‟nı ortaya koymuştur. Hebb kuralı, sinir ağlarının bağlantı sayısının
değiştirilebilmesi durumunda ağın öğrenebileceğini ileri sürer (Mehrotra ve diğ.,
1997).
Farley ve Clark (1954) tarafından rassal ağlar (random networks) ile uyarlanabilir
tepki üretme kavramı ortaya atılmıştır. Bu kavram 1958 yılında Rosenblatt ve 1961
yılında Caianiello tarafından geliştirilmiştir.
Özellikle Rosenblatt (1958) tarafından geliştirilen “Perceptron” yapay sinir
ağlarındaki çalışmaları hızlandırmıştır. Perceptron (Algılayıcı), örüntü (şekil) tanıma
amacıyla geliştirilen tek katmanlı, eğitilebilen ve tek çıkışa sahip olan bir yapay sinir
ağıdır. Perceptron‟un daha sonra geliştirilecek ve yapay sinir ağları çalışmalarında
devrim kabul edilen çok katmanlı yapay sinir ağlarının temelini oluşturması
açısından tarihsel önemi vardır.
Widrow ve Hoff (1959), ADALINE (Adaptive Linear Neuron) modelini ortaya
atmışlardır. Yapay sinir ağlarının mühendislik uygulamalarında kullanılmaya
başlanması için atılan ilk adımlardan biri sayılmaktadır. Bu model, Rosenblatt‟ın
algılayıcı modeli ile benzer özelliklere sahip olup sadece öğrenme algoritması daha
gelişmiş bir modeldir. 1970‟lerin sonlarında ortaya çıkan ve ADALINE modelinin
çok katmanlı hali olan MADALINE‟nın temelini oluşturur ve telefon hatlarında
oluşan yankıları yok eden bir sistem olarak kullanılması ile de gerçek dünya
sorunlarına uyarlanmış ilk yapay sinir ağı unvanını alır (Öztemel, 2003).
1960‟lı yılların sonunda yapay sinir ağı çalışmaları duraklama devrine girdi. Yapay
zekâ çalışmalarının o devirde önde gelen isimleri Minsky ve Pappert (1969)
yayımladıkları “Perceptrons” adlı kitaplarında algılayıcı modelin (perceptron)
bilimsel
bir
değerinin
olmadığını,
doğrusal
olmayan
problemlere
çözüm
üretemediğini vurgulamışlar ve buna ispat olarak XOR (exclusive-or) probleminin
perceptron ile çözülememesini örnek göstermişlerdir. Bu örnek, pek çok kişiyi tatmin
etti ve çalışmalar bir anda kesildi. Perceptron‟un XOR problemini çözemeyişi, bütün
bilimsel çevreleri yapay bir sinir ağı yapılamayacağına inandırmış ve yapay sinir
ağları alanındaki araştırmaların bir anda durmasına neden olmuştur. Amerika
Birleşik Devletleri‟nde araştırma ve geliştirme çalışmalarını yürüten ve destek
34
sağlayan DARPA, yapay sinir ağları araştırmalarına verdiği desteği durdurmuş ve
diğer yapay zekâ araştırmalarına yönelmiştir (Öztemel, 2003).
4.2.2.2 1970 sonrası YSA ile ilgili çalıĢmalar
Çalışmaların 1969 yılında sekteye uğraması ve gerekli finansal desteğin
sağlanmamasına rağmen bazı bilim adamları YSA ile ilgili çalışmalarına devam
ettiler.
Kohonen (1972), Korelasyon Matris Belleği‟ni (Correlation Matrix Memories)
geliştirmiştir. Bu model özellikle örüntü tanıma ve sınıflandırma gibi verideki benzer
davranışların analizi ve veri yapısının ortaya çıkarılması gibi problemlerde
kullanılmaktadır.
Fukushima, 1980‟lerin başında görsel şekil ve yapıları tanımla amacıyla geliştirdiği
NEOCOGNITRON
modelini
tanıtmıştır.
Bu
model,
önceleri
öğretmensiz
(unsupervised) öğrenme için geliştirildiyse de daha sonra öğretmenli (supervised)
öğrenme yapabilecek düzenlemelere gidilmiştir. Fukushima‟nın çalışmaları, bu
alandaki mühendislik uygulamalarının sayısını arttırmıştır.
1982 ve 1984 yıllarında John Hopfield tarafından yayımlanan çalışmalar, farklı
tipteki yapay sinir ağlarının matematiksel modellerini üretmiş ve özellikle geleneksel
bilgisayar programlama ile çözülemeyen problemlerin yapay sinir ağları ile
çözülebileceğini göstermiştir. Bu çalışmaların pratikte uygulanabilirliği yapay sinir
ağlarına olan ilginin yeniden artmasına neden olmuştur. Bu çalışmadan yola çıkarak
Hinton ve arkadaşları Boltzman makinesini geliştirmiştir.
1982 yılında Kohonen “kendi kendine öğrenme nitelik haritaları (selforganizing
feature maps-SOM)” konusundaki çalışmasını yayımlayarak öğretmensiz öğrenme
modelinin gelişmesine ciddi katkıda bulunmuştur.
1986‟da Rummelhart, Hinton, Williams ve McClelland‟ın ortaya attıkları, “Geri
Yayılma Algoritması” (Backpropagation Algorithm) tekniğiyle, birden çok katmanlı
ağların, tek katmanlı ağların çözemeyeceği problemleri çözebildiğini ortaya
koymuşlar ve XOR Problemini, bir geri yayılma ağı ile çözerek, yapay sinir ağları
araştırmalarının önündeki tüm engelleri ortadan kaldırmışlardır.
1988‟de Broomhead ve Lowe, Radyal Tabanlı Fonksiyonlar (Radial Basis Functions
– RBF) modelini geliştirmişlerdir. Broomhead ve Lowe (1988) makalelerinde radyal
35
tabanlı fonksiyon temelli yapay sinir ağlarını, çok katmanlı ağlara alternatif olarak
geliştirdiklerini belirtmişlerdir. Radyal tabanlı ağlar özellikle filtreleme ve veri
sıkıştırma problemlerinde kullanılmıştır.
1990‟ da Daniel Specth Olasılıksal Sinir Ağları‟nı (Probabilistic Neural Networks PNN) geliştirmiştir. Olasılıksal sinir ağları, radyal tabanlı fonksiyonlar modelinin
daha gelişmiş bir türüdür. Çalışmalarını sürdüren Specht, 1991 yılında,
Genelleştirilmiş Regresyon Ağları‟nı (Generalized Regression Neural Networks GRNN) geliştirmiştir.
1990‟lı yılların başlarından itibaren sayısız çalışma ve uygulamalar geliştirilmiş,
özellikle yapay sinir ağlarını eğitmek için gerekli süreleri kısaltmak, yeni ve daha
verimli öğrenme algoritmaları geliştirmek, zamana bağlı olarak değişen modellere
karşılık verebilen ağlar ve silikon sinir ağları geliştirmek, yapılan araştırmaların en
önemli amaçlarını oluşturmaktadır.
4.2.3 Yapay sinir ağlarının avantajları
Yapay sinir ağları metodolojisi, özellikleri ve yapabildikleri sayesinde önemli
avantajlar sunmaktadır. Bu bölümde, YSA‟ların farklılık ve avantaj sağladığı
noktalar incelenmektedir.
Doğrusal olmayan yapı: Yapay sinir ağlarının en önemli özelliklerinden birisi gerçek
hayatta karşılaşılan doğrusal olmayan yapıları da dikkate alabilmeleridir. Özellikle
ekonomik veriler gibi yapıları gereği doğrusal olmayan veriler ile ilgili analizler
tahmin zorlukları nedeniyle genellikle lineer yöntemlerle gerçekleştirilmektedir.
Hâlbuki bu durum, muhtemel bir doğrusal olmayan yapı içerilmesi durumunda yanlış
sonuçlara yol açabilmektedir ya da en azından analizi yapılan sistemde
açıklanamayan bileşenler kalabilmektedir. Sonuç olarak, analiz konusunun içerdiği
veri setinin doğrusal veya doğrusal olmayan yapı içeriyor olması, analiz sonuçlarını
etkileyecek önemli bir faktördür. Bu yüzden, doğrusal olmayan yapıları dikkate
alabilmesi YSA‟ların önemli bir özelliğidir (Yurtoğlu, 2005).
Paralellik: Günümüzde kullanılan bilgi işleme yöntemleri genelde seri işlemlerden
oluşmaktadır. Yapay sinir ağları ise paralel işlemci kullanmaktadır. Seri işlemcilerde
herhangi bir birimin yavaş olması tüm sistemi yavaşlatırken, yapay sinir ağlarında
yavaş bir birimin etkisi az olmaktadır. Bu durum yapay sinir ağlarının daha hızlı ve
güvenilir olması sonuçlarını doğurmaktadır.
36
Öğrenme:
YSA‟ların
diğer
bir
önemli
avantajı
en
önemli
özelliğinden
kaynaklanmaktadır. Esin kaynağı insan beyninin çalışma sistemi olan bu yöntem,
eğitme veya başlangıç tecrübesi sayesinde veriyi kullanarak öğrenme yeteneğine
sahiptir. Bu özelliği sayesinde ise geleneksel teknikler için çok karmaşık kalan
problemlere çözüm sağlayabilmektedirler. Ayrıca, insanların kolayca yapabildiği
ama geleneksel metotların uygulanamadığı basit işlemler için de oldukça
uygundurlar (Yurtoğlu, 2005).
Dağıtılmış Hafıza: Yapay sinir ağlarında bilgi, ağa yayılmış durumdadır ve
hücrelerin birbirleri ile bağlantılarının değerleri ağın bilgisini gösterir. Diğer
programlarda olduğu gibi veriler bir veri tabanında veya programın içinde gömülü
değildir. Tek bir bağlantının herhangi bir anlamı yoktur ve ağın tamamı, öğrendiği
olayın bütününü karakterize etmektedir. Bu nedenle yapay sinir ağlarının dağıtılmış
bellekte bilgi saklayabildikleri söylenebilir (Öztemel, 2003).
Gerçek
Zamanlı
İşlem
Yapabilme:
YSA
hesaplamaları
paralel
olarak
yürütülebildiğinden gerçek zamanlı işlem yapabilirler. Özellikle suçluların akıllı
kameralar kullanılarak belirlenmesi gibi zamanın hayati önem taşıdığı problemlerde,
yapay sinir ağları klasik uzman sistemlerden çok daha hızlı tepki verebilirler. Bunun
nedeni YSA‟nın dağıtılmış paralel yapıları sayesinde, birim zamanda çok daha fazla
veriyi işleyebilmeleridir (Çelik, 2008).
Genelleme: YSA, öğrenme yeteneği sayesinde bilinen örnekleri kullanarak daha
önce karşılaşılmamış durumlarda genelleme yapabilmektedirler. YSA‟lar, gürültülü
(noisy) veya kayıp veriler için çözüm üretebilmektedirler. Çoğu klasik yöntem eksik
ve gürültülü veri söz konusu olduğunda, etkinliklerini büyük oranda kaybetmektedir
fakat yapay sinir ağları, bu gibi olumsuz durumlarda dahi çok iyi bir performansla
çalışabilirler (Yurtoğlu, 2005).
Kendi İlişkisini Oluşturma: Yapay sinir ağları, bilgilere (verilere) göre kendi
ilişkilerini oluştururlar ve denklem içermezler. Bununla birlikte sistemin içinde ne
olduğu tam olarak analiz edilemez. Yapay sinir ağları, bu özellikleri sayesinde,
verilen bilgilerden ilişkiler ortaya çıkarabilen bir “akıllı karakutu” olarak
tanımlanabilirler (Tenti, 1996).
Sınırsız Sayıda Değişken ve Parametre: Yapay sinir ağları modelleri sınırsız sayıda
değişken ve parametre ile çalışabilmektedir. Bu sayede mükemmel bir öngörü
37
doğruluğu ile genel çözümler sağlanabilmektedir. Yapay sinir ağları, sonsuz sayıda
değişkeni, her biri sadece gerektiği anda, gerektiği kadar kullanabilecek şekilde
eğitilebilirler (Yurtoğlu, 2005).
Dereceli bozulma: Ağlar bir eksik ve problem ile karşılaştıklarında hemen
bozulmazlar. Hata toleransına sahip oldukları için dereceli bir şekilde bozulurlar
(Öztemel, 2003).
4.2.4 Yapay sinir ağlarının dezavantajları
Yapay Sinir Ağlarının yukarıda belirtilen birçok avantajlarının yanında bazı
dezavantajları da vardır.
Elektronik Kısıtlar: YSA‟nın donanım bağımlı çalışmaları önemli bir sorun olarak
görülebilir. YSA yöntemiyle etkin bir analiz yapılabilmesi için çok hızlı paralel
işlemcilere ihtiyaç duyulmaktadır. Özellikle tepki süresinin hayati önem taşıdığı
uygulamalarda, yapay sinir ağlarının üzerlerinde çalıştıkları bilgisayar sistemlerinin
çok hızlı olmasının yanında, kullanılan yazılımın da günümüzde kullanılan çok
çekirdekli işlemcilere göre programlanmış olması büyük bir avantaj sağlayacaktır
(Öztemel, 2003).
Probleme Uygunsuzluk: Probleme uygun ağ yapısının belirlenmesi genellikle
deneme yanılma yoluyla yapılmaktadır ve bu da önemli bir problemdir. Çünkü eğer
problem için uygun bir ağ modeli oluşturulamaz ise çözümü olan bir problemin
çözülememesi veya performansı düşük çözümlerin elde edilmesi durumu söz konusu
olabilir. Ayrıca diğer bir konu, YSA, kabul edilebilir çözümler üretir ve optimum
çözümü garanti etmez (Öztemel, 2003).
Problem Mimarisi: Problem çözümü için kullanılacak olan yapay sinir ağında nöron
sayısı, katman sayısı, öğrenme algoritması gibi değişkenlerin seçimi sübjektif olarak
yapıldığından, seçilen mimarinin en iyi çözümü verebileceğinin garantisi yoktur
(Çelik, 2008).
Problemin Ağa Gösterimi: YSA, sadece nümerik verilerle çalışır ve problemin
nümerik gösterime dönüştürülmesi gerekmektedir. Bu ise, kullanıcının becerisine
bağlıdır. Uygun bir gösterim mekanizmasının oluşturulamaması problemin
çözümünü engelleyebilir veya performansı düşük bir çözüme sebep olabilir
(Öztemel, 2003).
38
Eğitim Problemi: YSA eğitilirken, eğitimin nerede durdurulacağı kesin olarak belli
değildir. Eğitim kabul edilebilir bir hata oranına gelindiğinde durdurulur ve bu karar
sübjektif olarak verilmektedir. Eğitimin erken bitirilmesi durumunda öngörü
performansının düşük olması, geç bitirilmesi durumunda ezberleme (overfitting –
aşırı uyum) problemi ortaya çıkmaktadır. Overfitting veya Overoptimizing; herhangi
bir öngörü sisteminin, örneklem için başarılı sonuçlar vermesi fakat aynı zamanda
örneklem dışı veriler söz konusu olduğunda tahmin yeteneğinin bulunmaması
durumunu tanımlamaktadır (Pardo, 1992).
Yorumlama Problemi: Geleneksel istatistiksel tekniklerden alınan sonuçlar bir takım
testlerle yorumlanabilmesine ve kararlılık analizleri yapılabilmesine rağmen, YSA
için böyle bir imkân bulunmamaktadır. Ağın kendi verdiği çıktıya nasıl ulaştığı
bilinememektedir. Özellikle öngörülerin hayati önem taşıdığı uygulamalarda, YSA‟
nın bu özelliği çok büyük bir problem oluşturmaktadır. Örneğin; biyolojik bir
uygulamada, kanserle ilgili bir araştırmada kullanılan yapay sinir ağının, ulaştığı
çıktılara nasıl ulaştığının analiz edilememesi, bu tekniğe olan güvenin azalmasına
neden olacaktır (Çelik, 2008).
4.2.5 Yapay sinir ağlarının kullanım alanları
YSA‟lar gerçek hayatta karşılaşılan problemlerde oldukça geniş bir uygulama alanı
kazanmışlardır. Bugün, birçok endüstride başarılı şekilde kullanılmaktadırlar.
Uygulama alanları için bir sınır yoktur fakat öngörü, modelleme ve sınıflandırma
gibi bazı alanlarda ağırlıklı olarak kullanılmaktadır. Bugün, YSA‟lar birçok ciddi
problem üzerinde uygulanmaktadır ve bu problemlerin sayısı giderek artmaktadır
(Yurtoğlu, 2005).
Başarılı uygulamalar incelendiğinde YSA‟ların, doğrusal olmayan, çok boyutlu,
gürültülü, karmaşık, kesin olmayan, eksik, kusurlu, hata olasılığı yüksek verilerin
olması ve problemin çözümü için özellikle bir matematiksel modelin ve algoritmanın
bulunmaması hallerinde yaygın olarak kullanıldığı söylenebilir, Bu amaçla
geliştirilen ağlar genel olarak şu fonksiyonları yerine getirmektedir (Öztemel, 2003):

Muhtemel fonksiyon kestirimleri

Sınıflandırma

İlişkilendirme veya örüntü eşleştirme

Zaman serileri analizi
39

Sinyal filtreleme

Veri sıkıştırma

Örüntü tanıma

Doğrusal olmayan sistem modelleme

Optimizasyon
4.3 Yapay Sinir Ağlarının Yapısı ve Temel Elemanları
4.3.1 Biyolojik sinir hücresi
Yapay sinir ağları, biyolojik sinir sisteminden esinlenerek geliştirilmiştir. Bu nedenle
öncelikle biyolojik sinir sistemi hakkında bilgi verilecektir.
Beyinin çalışma sistemi, hala tam olarak çözülememiş bir sırdır. Özellikle, vücudun
diğer organlarındaki hücrelerden farklı olarak yenilenebilme özelliği olmayan
beynin, insana hatırlama, düşünme ve her hareketinde geçmiş deneyimlere başvurma
yeteneğini sağlayan en temel elemanı olan sinir hücrelerinin çalışma sistemi hala
gizliliğini büyük ölçüde korumaktadır. İnsan beyninde ortalama 1010 sinir hücresi ve
bunların da 6𝑥1010 „ten fazla bağlantısı olduğu bilinmektedir. Beynin gücü bu çok
sayıdaki sinir hücresi ve aralarındaki bağlantılardan, genetik yapıları ile öğrenme
yeteneklerinden kaynaklanmaktadır (Anderson and McNeill, 1992).
Biyolojik sinir ağları, insan beyninin çalışmasını sağlayan en temel taşlardan
birisidir. İnsanın bütün davranışlarını ve çevresini anlamasını sağlarlar. Biyolojik
sinir ağları beş duyu organından gelen bilgiler ışığında algılama ve anlama
mekanizmalarını çalıştırarak olaylar arasındaki ilişkileri öğrenir (Öztemel, 2003).
Şekil 4.1 ve Çizelge 4.1 insan beynini ve temel fonksiyonlarını göstermektedir.
40
ġekil 4.1: İnsan beyni.
Çizelge 4.1: Beynin bölgelere göre fonksiyonları (Bilim ve Teknik, 2006).
Bölge
Fonksiyon
1
Prefrontal Korteks: Zekâ, öğrenme, kişilik
2
Motor Bölge: Karmaşık hareketlerin eşgüdümü ve istemli
hareketler
3
Duyusal Bölge: Dokunma duyusu bilgilerinin işlenmesi
4
Tat bölgesi
5
Görme bölgesi
6
Beyincik: Denge bölgesi
7
Genel yorumlama bölgesi
8
Omurilik
9
Dil Bölgesi
10
İşitsel Bölge
11
Konuşma Merkezi: Konuşmanın üretiminden sorumlu Broca
Bölgesi buradadır.
Duyu organlarından gelen bilgiler (sinyaller) beyin sinir sistemi sayesinde beyine
taşınır ve beynin oluşturduğu kararlar da yine sinir sistemi tarafından vücudun
organlarına eylem olarak gönderilir. Bir sinir hücresinin genel yapısı Şekil 4.2‟ de
gösterilmektedir.
41
ġekil 4.2: Biyolojik sinir hücresinin yapısı.
Bir sinir hücresi, bir hücre gövdesi ile dendrit ve akson adı verilen uzantılardan
meydana gelir. Sinir hücresi, dendrit adı verilen bir kısım uzantılarla diğer sinir
hücrelerinden aldığı işaretleri hücre gövdesine taşır ve hücre gövdesinde toplanan bu
işaretler değerlendirilerek bir çıkış işareti üretilir ve bu işaretler akson adı verilen
uzantılar vasıtasıyla diğer sinir hücresine gönderilir. Bir sinir hücresinde birçok
dendrit olmasına karşın tek bir akson vardır. Yani bir sinir hücresinde birçok giriş
bulunmasına rağmen tek bir çıkış vardır. İki sinir hücresi arasında birinin dendriti ile
diğerinin aksonu arasında bir bağlantı vardır ve bu bağlantı yerine sinaps adı verilir.
(Efe ve Kaynak, 2000). İki hücrenin birbiri ile bilgi alışverişi sinaptik bağlantılarda
neurotransmitter‟ler yolu ile sağlanmaktadır. Şekil 4.3‟ te sinaptik boşluktaki
hücreler arası bilgi alışverişi gösterilmektedir.
ġekil 4.3: Sinir hücreleri arası bilgi alışverişi.
42
4.3.2 Yapay sinir hücresi
Biyolojik sinir ağlarının sinir hücrelerinden oluşması gibi, yapay sinir ağları da
yapay sinir hücrelerinden meydana gelmektedir. Yapay sinir hücreleri ayrıca düğüm
(node),
birim
(unit)
veya
işlemci
eleman
(processing
unit)
olarak
da
adlandırılmaktadır. Bir yapay sinir ağı, birbiriyle bağlantılı çok sayıda yapay sinir
hücresinden meydana gelmektedir. Yapay sinir hücreleri biyolojik sinir hücrelerinin
basit bir modelidir (Efe ve Kaynak, 2000)
Çizelge 4.2:Biyolojik sinir ağı ve yapay sinir ağının karşılaştırılması.
Biyolojik Sinir Ağı
Yapay Sinir Ağı
Sinir Sistemi
Sinirsel Hesaplama Sistemi
Sinir Hücresi (Nöron)
Sinaps
İşlemci Eleman (Yapay Sinir Hücresi,
Düğüm)
İşlemci Elemanlar Arasındaki Bağlantı
Ağırlıkları
Dendrit
Toplama Fonksiyonu
Hücre Gövdesi
Aktivasyon Fonksiyonu
Akson
İşlemci Eleman Çıktısı
Yapay sinir ağlarının içinde bulunan tüm sinir hücreleri bir veya birden fazla girdi
alırlar ve tek bir çıktı verirler. Bu çıktı yapay sinir ağının dışına verilen bir çıktı
olabileceği gibi başka bir yapay sinir hücresine girdi olarak da verilebilir. Bir yapay
sinir hücresi genel olarak beş temel bileşenden oluşmaktadır.

Girdiler

Ağırlıklar

Toplama fonksiyonu

Aktivasyon fonksiyonu

Çıktı
43
ġekil 4.4: Yapay sinir hücresinin yapısı.
4.3.2.1 Girdiler
Bir yapay sinir hücresine dış dünyadan gelen bilgilerdir. Bunlar ağın öğrenmesi
istenen örnekler tarafından belirlenir. Yapay sinir hücresine dış dünyadan olduğu gibi
başka hücrelerden veya kendi kendisinden de bilgiler gelebilir. (Öztemel, 2003).
4.3.2.2 Ağırlıklar
Ağırlıklar, yapay sinir hücresi tarafından alınan girişlerin sinir üzerindeki etkisini
belirleyen uygun katsayılardır. Her bir giriş kendine ait bir ağırlığa sahiptir. Bir
ağırlığın değerinin büyük olması, o girişin yapay sinire güçlü bağlanması ya da
önemli olması, küçük olması zayıf bağlanması ya da önemli olmaması anlamına
gelmemektedir (Elmas, 2003).
4.3.2.3 Toplama fonksiyonu
Bu fonksiyon, hücreye gelen net girdiyi hesaplar. Bunun için değişik fonksiyonlar
kullanılmaktadır. En yaygın olanı ağırlıklı toplamı bulmaktır. Burada her gelen girdi
değeri kendi ağırlığı ile çarpılarak toplanır. Böylece ağa gelen net girdi bulunmuş
olur. Şu şekilde formülize edilmektedir:
𝑁𝐸𝑇 =
𝑛
𝑖=1 𝐺𝑖 𝐴𝑖
(4.1)
Burada G girdileri, A ağırlıkları, n ise hücreye gelen toplam girdi sayısını
göstermektedir. Yapay sinir ağlarında daima bu fonksiyonun kullanılması şart
değildir. Çizelge 4.3‟te literatürde kullanılan toplama fonksiyonlarına örnekler
verilmektedir.
44
Çizelge 4.3: Toplama fonksiyonu örnekleri (Öztemel, 2003).
Net GiriĢ
Açıklama
Çarpım
Ağırlık değerleri, girdiler ile çarpılır ve daha
sonra bulunan değerler birbirleri ile
çarpılarak net girdi hesaplanır.
𝑵
𝑵𝒆𝒕 𝑮𝒊𝒓𝒅𝒊 =
𝑮𝒊 𝑨𝒊
𝒊=𝟏
Maksimum
𝑵𝒆𝒕 𝑮𝒊𝒓𝒅𝒊 = 𝑴𝒂𝒙(𝑮𝒊 𝑨𝒊 ) ,
i=1…N
Minimum
𝑵𝒆𝒕 𝑮𝒊𝒓𝒅𝒊 = 𝑴𝒊𝒏(𝑮𝒊 𝑨𝒊 ),
i=1…N
N adet girdi içinden ağırlıklar ile
çarpıldıktan sonra en büyüğü yapay sinir
hücresinin net girdisi olarak kabul edilebilir.
N adet girdi içinden ağırlıklar ile
çarpıldıktan sonra en küçüğü yapay sinir
hücresinin net girdisi olarak kabul
edilebilir.
N adet girdi içinden ağırlıklar ile
çarpıldıktan sonra pozitif ve negatif
olanların sayısı bulunur. Büyük olan sayı,
hücrenin net girdisi olarak kabul edilebilir.
Çoğunluk
𝑵
𝑵𝒆𝒕 𝑮𝒊𝒓𝒅𝒊 =
𝒔𝒈𝒏(𝑮𝒊 𝑨𝒊 )
𝒊=𝟏
Kümülatif Toplam
Hücreye gelen bilgiler ağırlıklı olarak
toplanır ve daha önce gelen bilgilere
eklenerek hücrenin net girdisi hesaplanır.
𝒏
𝑵𝒆𝒕 𝑮𝒊𝒓𝒅𝒊 = 𝑵𝒆𝒕 𝒆𝒔𝒌𝒊 +
𝑮𝒊 𝑨𝒊
𝒊=𝟏
Görüldüğü gibi, bazı durumlarda gelen girdilerin değeri dikkate alınırken bazı
durumlarda ise gelen girdilerin sayısı önemli olabilmektedir. Bir problem için en
uygun toplama fonksiyonunu belirlemek için bulunmuş bir formül yoktur. Genellikle
deneme yanılma yolu ile toplama fonksiyonu belirlenmektedir. Bir yapay sinir
ağında bulunan sinir hücrelerinin tamamının aynı toplama fonksiyonuna sahip
olmaları gerekmez. Her sinir hücresi bağımsız olarak farklı bir toplama fonksiyonuna
sahip olabilecekleri gibi hepsi aynı toplama fonksiyonuna da sahip olabilir (Öztemel,
2003).
4.3.2.4 Aktivasyon fonksiyonu
Aktivasyon fonksiyonu, toplama fonksiyonundan gelen girdiyi işleyerek yapay sinir
hücresinin çıkışını belirler. Transfer fonksiyonu olarak da adlandırılan aktivasyon
fonksiyonu çeşitli tiplerde ve genellikle doğrusal olmayan bir fonksiyondur.
Doğrusal fonksiyonların tercih edilmemesinin nedeni, doğrusal fonksiyonlarda girdi
ile çıktının doğru orantılı olmasıdır. Bu durum ilk yapay sinir ağları denemelerinin
başarısızlıkla sonuçlanmasının temel nedenidir (Minsky and Papert, 1969).
45
Uygun aktivasyon
fonksiyonunun
seçimi
tasarımcının
farklı
fonksiyonları
denemeleri sonucunda belirlenmektedir. Ancak çok katmanlı algılayıcılar gibi bazı
modeller aktivasyon fonksiyonunun, türevi alınabilir bir fonksiyon olmasını şart
koşmaktadır. Ayrıca fonksiyonun seçimi, yapay sinir ağının verilerine ve neyi
öğrenmesinin istendiğine de bağlıdır. Aktivasyon fonksiyonu olarak en çok
kullanılanlar sigmoid fonksiyon ve hiperbolik tanjant fonksiyonlarıdır.
Günümüzde en yaygın olarak kullanılan çok katmanlı algılayıcı modelinde genel
olarak aktivasyon fonksiyonu olarak sigmoid fonksiyonu kullanılmaktadır. Bu
fonksiyon şu formül ile gösterilmektedir (Öztemel, 2003).
1
𝐹 𝑁𝐸𝑇 = 1+𝑒 −𝑁𝑒𝑡 𝐺𝑖𝑟𝑑𝑖
(4.2)
Sigmoid fonksiyonunun şekilsel gösterimi Şekil 4.5‟te verilmektedir. Çizelge 4.4‟te
ise aktivasyon fonksiyonu olarak kullanılan diğer
fonksiyonlara örnekler
verilmektedir.
ġekil 4.5: Sigmoid fonksiyonunun şekilsel gösterimi.
Çizelge 4.4: Aktivasyon fonksiyonu örnekleri (Öztemel, 2003).
Aktivasyon Fonksiyonu
Açıklama
Lineer Fonksiyon
𝑭 𝑵𝑬𝑻 = 𝑵𝑬𝑻
Step Fonksiyonu
𝑭 𝑵𝑬𝑻 = 𝟏 𝒊𝒇 𝑵𝑬𝑻 > 𝑒ş𝑖𝑘 𝑑𝑒ğ𝑒𝑟
𝟎 𝒊𝒇 𝑵𝑬𝑻 ≤ 𝒆ş𝒊𝒌 𝒅𝒆ğ𝒆𝒓
Gelen girdiler, olduğu gibi hücrenin
çıktısı olarak kabul edilir.
Gelen NET girdi değerinin belirlenen bir
eşik değerinin altında veya üstünde
olmasına göre hücrenin çıktısı 1 veya 0
olarak belirlenir.
Öğrenilmesi düşünülen olayların sinüs
fonksiyonuna uygun dağılım gösterdiği
durumlarda kullanılır.
Sinüs Fonksiyonu
𝑭 𝑵𝑬𝑻 = 𝐬𝐢𝐧⁡
(𝑵𝑬𝑻)
46
Çizelge 4.4 (devam): Aktivasyon fonksiyonu örnekleri (Öztemel, 2003).
EĢik Değer Fonksiyonu
𝟎
𝒊𝒇 𝑵𝑬𝑻 ≤ 𝟎
𝑭 𝑵𝑬𝑻 =
𝑵𝑬𝑻
Gelen bilgilerin 0 veya 1‟den büyük
olmasına göre bir değer alır.
𝒊𝒇 𝟎 < 𝑁𝐸𝑇 < 1
𝟏
𝒊𝒇 𝑵𝑬𝑻 ≥ 𝟏
Hiperbolik Tanjant Fonksiyonu
𝒆𝑵𝑬𝑻 + 𝒆−𝑵𝑬𝑻
𝑭 𝑵𝑬𝑻 = 𝑵𝑬𝑻
𝒆
− 𝒆−𝑵𝑬𝑻
Gelen NET girdi değerinin tanjant
fonksiyonundan
geçirilmesi
ile
hesaplanır.
4.3.2.4 Çıktı
Aktivasyon fonksiyonu tarafından belirlenen çıktı değeridir. Bu değer ya başka bir
yapay sinir hücresine girdi olarak ya da dış ortama gönderilmektedir. Bir işlemci
elemanın birden fazla girdisi olmasına rağmen tek bir çıktısı olmaktadır.
4.3.3 Yapay sinir hücresinin çalıĢma prensibi
Bir yapay sinir hücresinin çalışma prensibi, aşağıdaki örnek üzerinden özetlenecektir.
Bir yapay sinir hücresine gelen bilgiler ve ağırlıklar Şekil 4.6‟da verildiği gibi
varsayılsın. Görüldüğü gibi hücrenin 5 girdisi ve 5 ağırlık değeri bulunmaktadır.
ġekil 4.6: Bir yapay sinir hücresinin çalışma örneği.
Hücreye gelen NET bilgi, ağırlıklı toplam alınarak şu şekilde hesaplanır:
𝑁𝐸𝑇 = 0,55 ∗ −0,25 + 0,34 ∗ 0,74 + 0,72 ∗ 0,15 + 0,85 ∗ −0,44 + 0,95 ∗
−0,63
(4.3)
𝑁𝐸𝑇 = −0,1375 + 0,2516 + 0,1080 − 0,3740 − 0,5985
(4.4)
𝑁𝐸𝑇 = −0,7504
(4.5)
47
Hücrenin çıktısı, sigmoid fonksiyonuna göre hesap edilirse;
Ç𝐼𝐾𝑇𝐼 =
1
(4.6)
1+𝑒 0,7504
Ç𝐼𝐾𝑇𝐼 = 0,321
(4.7)
4.3.4 Yapay sinir ağının yapısı ve sınıflandırılması
4.3.4.1 Katman sayısına göre sınıflandırma
Yapay sinir hücreleri bir araya gelerek yapay sinir ağını meydana getirirler. Sinir
hücreleri, ağ yapısı içerisinde katman halinde ve her katman içinde paralel olarak bir
araya gelerek ağı meydana getirirler. Katman sayısına göre yapay sinir ağları şu
şekilde sınıflandırılır:
1. Tek Katmanlı Yapay Sinir Ağları: Sadece girdi ve çıktı katmanlarından oluşan,
doğrusal sistemlerin modellenmesinde başarılı olan ancak doğrusal olmayan
problemlerin çözümünde başarısız olan, literatürde geliştirilen ilk yapay sinir
ağlarıdır. Tek katmanlı yapay sinir ağlarının en önemlileri Basit Algılayıcı Modeli
(Perceptron), Adaptif Doğrusal Eleman (Adaptive Linear Element - ADALINE) ve
Çoklu
Adaptif
Doğrusal
Eleman
(Multiple
Adaptive
Linear
Element
-
MADALINE)‟dır.
2. Çok Katmanlı Yapay Sinir Ağları: En az 1 gizli katman içeren, doğrusal olmayan
problemlerin çözümü için geliştirilen ağlardır. Çalışmanın devamında kullanılacak
olan ağ yapısı, bu kapsamdadır. Bu tip ağ yapıları, tek katmanlı ağ yapılarına göre
daha karmaşık problemleri çözebilmektedir. Ancak çok katmanlı ağların eğitilmesi,
tek katmanlı ağların eğitilmesine göre oldukça zordur. Buna rağmen birçok
problemin çözümünde çok katmanlı ağların eğitimi, tek katmanlı ağların eğitimine
göre daha başarılı olabilmektedir. Bunun nedeni, tek katmanlı ağların problemin
çözümü için yetersiz kalmalarından kaynaklanmaktadır (Fausett, 1994).
Şekil 4.7‟de çok katmanlı yapay sinir ağlarında katmanlar arasındaki ilişki
gösterilmektedir.
48
YAPAY SİNİR AĞI
ġekil 4.7:Yapay sinir ağlarında katmanların birbirleri ile ilişkileri (Öztemel, 2003).
 Girdi Katmanı: Dışarıdan girdileri alan nöronları içerir. Ayrıca, önemli olan bir
nokta,
girdi
tabakasındaki
nöronların
girdi
değerler
üzerinde
bir
işlem
uygulamamasıdır. Sadece girdi değerleri bir sonraki tabakaya iletirler ve bu yüzden
de bazı araştırmacılar tarafından ağların tabaka sayısına dâhil edilmezler (Yurtoğlu,
2005).
 Gizli Katman: Girdilerin belirli işlemlere tabi tutulduğu bölgedir. Seçilen ağ
yapısına göre işlem katmanının yapısı ve fonksiyonu da değişebilir. Tek bir
katmandan oluşabileceği gibi birden fazla katmandan da oluşabilir (Chaudhury ve
dig., 1994) .
 Çıktı Katmanı: Bu katmandaki yapay sinir hücreleri, gizli katmandan gelen bilgileri
işleyerek ağın girdi katmanından sunulan girdi seti (örnek) için üretmesi gereken
çıktıyı üretirler. Üretilen çıktı ise dış dünyaya gönderilir (Öztemel, 2003).
4.3.4.2 Bağlantı yapılarına göre sınıflandırma
Bağlantı yapılarına göre YSA, ileri beslemeli ağlar ve geri beslemeli ağlar olmak
üzere iki bölümde ifade edilebilir.
1. İleri Beslemeli Ağlar: İleri beslemeli bir ağda işlem elemanları genellikle
katmanlara ayrılmıştır. İşlemci elemanlar, bir katmandan diğer bir katmandaki tüm
işlem elemanlarıyla bağlantı kurarlar ancak işlem elemanlarının aynı katman
içerisinde kendi aralarında bağlantıları bulunmaz. İleri beslemeli ağlarda bilgi akışı,
49
girdi katmanından gizli katmana, gizli katmandan da çıktı katmanına doğru geri
besleme olmaksızın tek yönde yapılmaktadır (Zhang, 2003).
2. Geri Beslemeli Ağlar: Geri beslemeli bir yapay sinir ağında, işlem elemanları
arasında dönüşler ya da geri besleme bağlantıları bulunmaktadır. Geri beslemeli
ağlarda herhangi bir hücrenin çıktısı direkt olarak girdi katmanına gönderilerek
tekrar girdi olarak kullanılabilir (Zhang, 2003). Geri beslemeli ağların kullanımı ile
ileri beslemeli ağlara göre daha zengin dinamiklere sahip modeller geliştirilebilir.
Ancak belirtmek gerekir ki, ileri beslemeli ağlar, geri beslemeli ağlara göre akademik
ve pratik alanda daha çok uygulanmaktadır. Bunun nedeni; geri beslemeli ağların
pratikte uygulanabilirliğinin zor olmasıdır. Özellikle geri beslemeli ağların birçok
farklı yapıyla oluşturulabilmesi belirli bir model yapısında uzmanlaşmayı
engelleyebilmekte ve eğitim algoritmalarının tutarsız olması nedeniyle eğitiminin
güç olmasına neden olabilmektedir (Zhang, 2003).
Şekil 4.8‟de ileri ve geri beslemeli ağ yapısına örnek verilmektedir.
ġekil 4.8: İleri ve geri beslemeli ağ yapıları (Yurtoğlu, 2005).
4.3.4.3 Öğrenme stratejilerine göre sınıflandırma
Öğrenme stratejilerine göre yapay sinir ağları, danışmanlı öğrenme (supervised
learning), danışmansız öğrenme (unsupervised learning) ve destekleyici öğrenme
(reinforcement learning) olmak üzere üç bölümde ifade edilebilir.
1. Danışmanlı Öğrenme: Danışmanlı öğrenme algoritmalarında, ağın eğitimi için ağa
örnek olarak girdi değerlerinden ve hedef çıktı değerlerden oluşan bir örnek veri seti
verilir (MacKay, 2003). Verilen hedef çıktı değerleri, YSA literatüründe danışman ya
50
da öğretmen olarak adlandırılır. Danışmanlı öğrenme algoritmalarında, genellikle
hataların hesaplanması için Ortalama Mutlak Hata ve Hata Kareleri Ortalamasının
Karekökü performans ölçütleri kullanılır. Bu performans ölçütleri yardımıyla ağın,
kendi ürettiği çıktılar ile hedef çıktılar arasında oluşan hata sinyallerini dikkate alarak
kıyaslama yapması sağlanır. Ağın ürettigi çıktılar ile hedef çıktılar arasındaki hata
sinyallerini minimize etmek amacıyla, işlem elemanları arasındaki bağlantı ağırlıkları
düzenlenir. Diğer bir deyişle, danışmanlı öğrenme ile YSA, örnek girdiyi işleyerek
kendi çıktısını üretir ve gerçek çıktı ile karşılaştırır. Öğrenme metodu sayesinde,
hatayı en aza indirgemek için bağlantı ağırlıkları yeniden düzenlenerek YSA‟nin
danışmana benzemesi amaçlanır (Haykin, 1999). Böylece hedef çıktı değerlerine en
yakın
çıktı
değerleri
YSA
tarafından
üretilebilir.
Danışmanlı
öğrenme
algoritmalarına Delta Kuralı ve Genelleştirilmiş Delta Kuralı örnek olarak verilebilir.
2. Danışmansız Öğrenme: Danışmansız öğrenmede, öğrenme süresince ağa sunulan
bilgiler
yalnızca
girdi
vektörlerinden
oluşmakta
ve
hedef
çıkışlar
ağa
sunulmamaktadır. Bu nedenle, ağın üretmiş olduğu çıktıları karsılaştırarak kontrol
işlevini gerçekleştireceği bir danışmanı bulunmamaktadır. Danışmansız öğrenmede
ağ, hedef çıktı olmaksızın giriş bilgilerinin özelliklerine göre gruplama yapmak için
ağırlık değerlerini ayarlar. Ardından ağ, her küme için örnek bir vektör üretir
(Fausett, 1999). Bu tür öğrenmeye örnek olarak; Hebb, Hopfield ve Kohonen
öğrenme kuralları verilebilir.
3. Destekleyici Öğrenme: Bu tür bir eğitimde, ağa bir danışman yardımcı olur. Fakat
danışman, her girdi seti için üretilmesi gereken çıktı setini sisteme göstermek yerine,
sistemin kendisine gösterilen girdilere karşılık çıktısını üretmesini bekler ve üretilen
çıktının doğru veya yanlış olduğunu gösteren bir sinyal üretir. Sistem, danışmandan
gelen bu sinyali dikkate alarak öğrenme sürecini devam ettirir. Bu öğrenme
yönteminin kullanıldığı ağlara örnek olarak; Learning Vector Quantization Modeli
verilebilir (Öztemel, 2003).
4.3.5 Yapay sinir ağlarının eğitimi ve öğrenme kuralları
Öğrenme, ağın başlangıçta rastgele olarak atanan ağırlık değerlerinin belirlenmesi
işlemidir. Ağ, gördüğü her örnek için bu ağırlık değerlerini değiştirir. Bu işlem ağın
doğru ağırlık değerlerine ulaşması, bir başka deyişle, örneklerin temsil ettiği olayla
ilgili genelleme yapabilecek duruma gelmesi ile son bulur. Ağırlık değerlerinin
51
değiştirilmesi işlemi, kullanılan öğrenme stratejisine göre değişen ve öğrenme kuralı
olarak adlandırılan belli bazı kurallara göre yürütülür (Efe ve Kaynak, 2000).
İnsan beyni, doğumdan sonraki gelişme sürecinde çevresinden duyu organlarıyla
algıladığı davranışları yorumlar ve bu bilgileri diğer davranışlarında kullanır.
Yaşadıkça beyin gelişir ve tecrübelenir. Artık olaylar karşısında nasıl tepki
göstereceğini çoğu zaman bilmektedir. Fakat hiç karşılaşmadığı bir olay karşısında
yine tecrübesiz kalabilir. YSA‟ nın öğrenme sürecinde de, tıpkı dış ortamdan gözle
veya vücudun diğer organlarıyla uyarıların alınması gibi dış ortamdan girişler alınır.
Bu girişlerin beyin merkezine iletilerek burada değerlendirilip tepki verilmesi gibi
YSA da aktivasyon fonksiyonundan geçirilerek bir tepki çıkışı üretilir. Bu çıkış yine
tecrübeyle
verilen
çıkışla
karşılaştırılarak
hata
bulunur.
Çeşitli
öğrenme
algoritmalarıyla hata azaltılıp gerçek çıkışa yaklaşılmaya çalışılır. Bu çalışma
süresince yenilenen, YSA ağırlıklarıdır. Ağırlıklar her bir çevrimde yenilenerek
amaca ulaşılmaya çalışılır. Amaca ulaşmanın veya yaklaşmanın ölçüsü de yine
dışarıdan verilen bir değerdir. Eğer YSA verilen giriş-çıkış çiftleriyle amaca ulaşmış
ise ağırlık değerleri saklanır. Ağırlıkların sürekli yenilenip istenilen sonuca ulaşılana
kadar geçen zamana öğrenme adı verilir ve YSA için en önemli kavramlardan
birisidir. YSA öğrendikten sonra daha önce verilmeyen girişler verilip, sinir ağı
çıkışıyla gerçek çıkışın yaklaşımı incelenir. Eğer yeni verilen örneklere de doğru
yaklaşıyorsa sinir ağı işi öğrenmiş demektir. Sinir ağına verilen örnek sayısı
optimum değerden fazla ise sinir ağı işi öğrenmemiş ezberlemiştir. Genelde eldeki
örneklerin yüzde sekseni ağa verilip ağ eğitilir, daha sonra geri kalan yüzde yirmilik
kısım verilip ağın davranışı incelenir diğer bir deyişle ağ böylece test edilir (Öztemel
2003).
Genel olarak ifade etmek gerekirse YSA‟ lar da bir bebeğin beyninin öğrenmesi gibi
deneme yanılmayla, hata yaparak öğrenir. Eğitim sırasındaki amaç, bulunması
gereken doğru sonuçlara en yakın çıktıyı üretebilmektir. Bu sebeple ağ, verilen
girdilere göre kendi mimarisine de uygun olarak işlem yaptıktan sonra bir çıktı üretir.
Çıktı ile hedef değerler arasındaki fark, hatadır. Ağ, bu hatayı kabul edilebilir sınırlar
arasına indirebilmek için işlemi tekrarlar. Eğitim setinin ağ içinde bir kez işlemden
geçirilmesine devir (epoch) denir. Devir sayısının çok olması ağın öğrenme
sürecinde önemli bir etkendir. Fakat devir sayısının yüksek seçilmesi de performansı
düşüren bir etkendir. Bu durumda ağın mimarisi, aktivasyon fonksiyonu, öğrenme
52
yöntemi ve devir sayısı seçilirken optimizasyonun iyi bir şekilde yapılması gerekir
(Keleşoğlu, 2005).
Yapay sinir ağlarında kullanılan öğrenme stratejileri, Bölüm 4.2.4.3‟te anlatılmıştı.
Burada dikkat edilmesi gereken nokta, öğrenme stratejilerinden hangisi uygulanırsa
uygulansın eğitimin belli kurallara göre gerçekleştirileceğidir. Bu kuralların bazıları
çevrimiçi, bazıları ise çevrimdışı çalışmaktadır.
4.3.5.1 Çevrimiçi öğrenme
Bu kurallar gerçek zamanlı çalışabilmektedirler. Bu kurallara göre öğrenen sistemler
gerçek zamanda çalışırken bir taraftan fonksiyonlarını yerine getirmekte diğer
taraftan ise öğrenmeye devam etmektedir. Kohonen öğrenme kuralı, bu sınıfa örnek
olarak verilebilir (Öztemel, 2003).
4.3.5.2 ÇevrimdıĢı Öğrenme
Çevrimdışı öğrenme kurallarına dayalı öğrenen sistemler kullanıma alınmadan önce
örnekler üzerinde eğitilirler. Bu kuralları kullanan sistemler eğitildikten sonra gerçek
hayatta kullanıma alındığında artık öğrenme olmamaktadır. Sistemin öğrenmesi
gereken yeni bilgiler söz konusu olduğunda sistem kullanımdan çıkarılmakta ve
çevrimdışı olarak yeniden eğitilmektedir. Eğitim tamamlanınca sistem tekrar
kullanıma alınmaktadır. YSA‟nda yaygın olarak kullanılan Delta öğrenme kuralı, bu
sınıfa örnek olarak verilebilir (Öztemel, 2003).
4.3.5.3 Öğrenme kuralları
Öğrenme işlemini kolaylaştırmak için birçok öğrenme kuralı (algoritması)
geliştirilmiştir. En bilinen ve en yaygın olarak kullanılan öğrenme kuralları şunlardır:
 Hebb Kuralı: Öğrenme kuralları arasında en çok bilinen bu kural, Ponald Hebb
tarafından geliştirilmiş ilk öğrenme kuralıdır. Bu kural, Hebb‟ in 1949 yılında
yayınlanan The Organization of Behavior adlı kitabında ilk kez tanımlanmıştır. Bu
kuralın temel tanımı şöyle yapılmıştır: Eğer bir nöron diğer bir nörondan girdi
aldığında bu iki nöron yüksek aktivitede ise yani matematiksel olarak aynı işarete
sahip ise, nöronlar arasındaki ağırlık güçlendirilmelidir (Hebb, 1949). Diğer bir
deyişle, eğer ağ içerisinde birbirine bağlı iki hücre (nöron) aynı anda “on”
durumunda ise, bu anda bu iki ünite arasındaki ağırlık değerlerinin artması beklenir
53
ve sinapsislerin gerilimlerinin (ağırlıklarının) ayarlanması ile öğrenmenin oluşacağını
ön görür ( Elmas, 2003).
 Hopfield Kuralı: Hebb kuralına benzer bir kuraldır ancak bir istisnası vardır.
Hopfıeld kuralına göre, ağırlıkların güçlendirilmesi işleminde güçlendirme veya
zayıflatma için bir büyüklük tanımlamak gerekmektedir. İstenen çıktı ve girdinin her
ikisi de aktif veya pasifse, bağlantı ağırlığı öğrenme oranı kadar artırılır. Tersi
durumda ise bağlantı ağırlığı öğrenme oranı kadar azaltılır. Hopfield kuralı, Hebb
kuralından farklı olarak YSA elemanlarının bağlantılarının ne kadar güçlendirilmesi
ya da zayıflatılması gerektiğini de belirler. Eğer beklenen çıktıların ve girdilerin her
ikisi de aktif veya pasif ise, öğrenme katsayısı kadar ağırlık değerlerini de güçlendirir
veya zayıflatır. Ağırlıkların güçlendirilmesi ya da zayıflatılması, öğrenme
katsayısının yardımıyla gerçekleşir. Öğrenme katsayısı, genellikle 0 ile 1 arasında
kullanıcı tarafından belirlenen sabit pozitif bir değerdir (Tebelkis, 1995).
 Kohonen Kuralı: Bu kural, Kohonen tarafından 1982 yılında geliştirilmiştir. Bu
kuralda sinir hücreleri ağırlıkları değiştirmek için birbirleri ile yarışırlar. En büyük
çıktıyı üreten hücre kazanan hücre olur ve bağlantı ağırlıklarını değiştirir. Kazanan
hücre, yakınındaki hücrelere göre daha kuvvetli hale gelmektedir (Öztemel, 2003).
Böylece kazanan hücrenin komşularına bağlantı ağırlıklarını güncellemeleri için izin
verilir. Bağlantı ağırlıklarını daha fazla güncelleyebilmek, en büyük çıktıyı
üretebilme denemelerindeki şansı artırdığı için, kazanan bir hücre, komşu hücrelerin
bağlantı ağırlıklarının güncellenmesine izin vererek onların da şanslarını artırmış
olur.
 Delta Kuralı: Bu kurala göre hedef çıktı ile elde edilen çıktı arasındaki farkı
azaltmak için YSA elemanlarının bağlantılarının ağırlık değerleri sürekli yeniden
hesaplanır. Amaç hedef çıktı ile elde edilen çıktı arasındaki hata karelerinin
ortalamasını en aza indirebilmektir. Hatalar en son katmandan geriye doğru ardışık
iki katman arasındaki bağlantı ağırlıklarına dağıtılır (Çorumluoğlu, 2000).
4.3.6 Çok katmanlı algılayıcılar
Çok Katmanlı Algılayıcılar (ÇKA), katmanları arasında tam bağlantı (full connected)
bulunan, ileri beslemeli (feedforward) ve danışmanlı (supervised) olarak eğitilen, çok
katmanlı (multilayer) ağlardır (Crochat ve Franklin, 2003).
54
ÇKA ağları, danışmanlı öğrenme stratejisine göre çalışırlar. Yani, bu ağlara eğitim
sırasında hem girdiler hem de o girdilere karşılık üretilmesi gereken (beklenen)
çıktılar gösterilir. Ağın görevi her girdi için o girdiye karşılık gelen çıktıyı
üretmektir. ÇKA ağının öğrenme kuralı ise, en küçük kareler yöntemine dayalı
genelleştirilmiş delta kuralıdır. Genelleştirilmiş delta kuralı iki safhadan oluşur
(Öztemel, 2003):
1. İleri Besleme (Feedforward)
2. Geri Yayılma (Backpropagate)
İleri besleme aşamasında, ağın dış dünyadan aldığı girdiler, çıkış katmanına kadar
ileri doğru transfer edilirken (forward), geri yayılma aşamasında ise; ağın çıktısı 𝑦
ile istenen çıktı ( y ) arasındaki fark 𝑒𝑡 , çıkış katmanından başlayarak geriye doğru
giriş katmanına kadar transfer edilir (backward). Bu hata; ağın sinaptik ağırlıklarının
değiştirilerek hatanın minimize edilmesi için kullanılır.
ÇKA ağları birçok uygulamada kullanılmış olan, en yaygın öğrenme algoritmasıdır
ve özellikle iyi tanımlanamayan problemler ve doğrusal olmayan yapı gösteren
ilişkilerin analizi için çok iyi bir seçimdir. Geri yayılmalı öğrenme kuralı ağ
çıkışındaki mevcut hata düzeyine göre her bir katmandaki ağırlıkları yeniden
hesaplamak için kullanılmaktadır. Bir ÇKA modelinde; giriş katmanı, gizli katman
ve çıkış katmanı olmak üzere en az üç katman bulunmakla birlikte, problemin
özelliklerine göre gizli katman sayısını artırabilmek mümkündür. Gizli katmanların
sayısını sınırlandıran herhangi bir teorik limit yoktur fakat tipik olarak bir veya iki
gizli katman birçok uygulama için yeterli olabilmektedir. Kimi çalışmalar ise geri
yayılma ağında kullanılacak olan katman sayısının en az dört (3 gizli katman + çıkış
katmanı) olması gerektiğini savunmaktadırlar (DACS,1992). Katman sayısının
artması ağın hatırlama yeteneğini arttırırken, öğrenme süresini uzatır.
ÇKA ağları hiyerarşik yapıda ağlardır. Bir katmandaki sinirler sadece kendilerinden
bir sonra gelen katmana veri gönderebilirler. Bir katmanının atlanarak diğer katmana
veri gönderilmesi bu tip ağlarda mümkün değildir. Giriş katmanındaki her bir sinir,
kendinden sonra gelen gizli katmandaki her bir sinire, eğer birden çok gizli katman
bulunuyorsa bir gizli katmandaki her bir sinir kendinden sonra gelen gizli
katmandaki her bir sinire, çıkış katmanından önce gelen gizli katmandaki her bir sinir
ise çıkış katmanındaki her bir sinire bağlıdır. Bir katmandaki hiçbir sinir kendi
55
katmanındaki bir sinire bağlı olamaz. Her katmanın çıkış değeri bir sonra gelen
katmanın giriş değeridir. Bu şekilde dış dünyadan alınan verinin, her katmanda
aktive edilerek ağın içinde hiyerarşik bir yapıda çıkış katmanına kadar iletilmesine
ileri besleme (feedforward) denir.
ġekil 4.9: Örnek bir ÇKA ağı.
4.3.6.1 Ġleri besleme aĢaması
Örnek bir ÇKA ağı Şekil 4.9‟ da gösterilmiştir. Şekilde, giriş katmanındaki her bir
nöron, gizli katman 1 deki her bir nörona 𝑤𝑖,𝑗 bağlantı ağırlıklarıyla bağlıdır. Ayrıca
giriş katmanında bulunan hiçbir nörondan, gizli katman 1‟den bir sonraki gizli
katmana (gizli katman 2‟ye) veya çıkış katmanına bağlantı bulunmamaktadır
(hiyerarşik yapı). Burada giriş katmanında bulunan nöronların çıktı değerleri, gizli
katman 1‟de bulunan sinirlerin girdi değerlerini oluşturmaktadır.
Bu ifadelere göre; gizli katman 1‟de bulunan
𝑁1,1
nöronuna ulaşan
ağırlıklandırılmış net girdi, (4.8)‟de verilen ifadeye eşit olacaktır.
𝑣1,1 =
3
𝑖=1 𝑥𝑖,𝑡
𝑤𝑖,1 = 𝑥1,𝑡 𝑤1,1 + 𝑥2,𝑡 𝑤2,1 + 𝑥3,𝑡 𝑤3,1
(4.8)
Yine gizli katman 1‟de bulunan 𝑁1,2 nöronuna gelen net girdi ise (4.9)‟da
gösterilmiştir.
𝑣1,1 =
3
𝑖=1 𝑥𝑖,𝑡
𝑤𝑖,2 = 𝑥1,𝑡 𝑤1,2 + 𝑥2,𝑡 𝑤2,2 + 𝑥3,𝑡 𝑤3,2
(4.9)
Bu aşamadan sonra 𝑁1,1 ve 𝑁1,2 nöronları kendilerine gelen girdileri aktive
edeceklerdir. Bu örnek için seçilen aktivasyon fonksiyonları (4.10)‟da verilmiştir.
56
1
𝑦𝑖,𝑗 = 𝑓 𝑣𝑖,𝑗 = 1+𝑒 −𝑣𝑖,𝑗
(4.10)
Bu açıklamaya göre, birinci katmanda bulunan 𝑁1,1 ve 𝑁1,2 nöronlarının çıktıları
(4.11) ve (4.12)‟de gösterilmektedir.
1
𝑦1,1 = 𝑓 𝑣1,1 = 1+𝑒 −𝑣1,1
(4.11)
1
𝑦1,2 = 𝑓 𝑣1,2 = 1+𝑒 −𝑣1,2
(4.12)
Birinci katmanda bulunan nöronlar, (𝑁1,1 ve
𝑁1,2 ) ikinci katmanda bulunan
nöronlara (𝑁2,1 , 𝑁2,2 ve 𝑁2,3 ) 𝑎𝑖,𝑗 sinaptik ağırlıkları ile bağlıdırlar. Bu durumda
ikinci katmanda bulunan 𝑁2,1 , 𝑁2,2 ve 𝑁2,3 nöronlarının girdileri (4.13), (4.14),
(4.15)‟de gösterilmektedir.
𝑣2,1 =
2
𝑖=1 𝑦1,𝑖
𝑎𝑖,1 = 𝑦1,1 𝑎1,1 + 𝑦1,2 𝑎2,1
(4.13)
𝑣2,2 =
2
𝑖=1 𝑦1,𝑖
𝑎𝑖,2 = 𝑦1,1 𝑎1,2 + 𝑦1,2 𝑎2,2
(4.14)
𝑣2,3 =
2
𝑖=1 𝑦1,𝑖
𝑎𝑖,3 = 𝑦1,1 𝑎1,3 + 𝑦1,2 𝑎2,3
(4.15)
Gizli katman 2‟de bulunan nöronlar da kendi üzerlerine gelen net girdileri aktive
edecek ve kendi çıktıları olan 𝑦2,1 , 𝑦2,2 ve 𝑦2,3 ‟ü oluşturacaklardır. Her bir nöronun
aktivasyon fonksiyonu aynı olmak zorunda değildir ve hangi nöronda hangi
aktivasyon fonksiyonunun kullanılacağı uygulayıcının kendi seçimidir. Aktivasyon
fonksiyonları nöron bazlı olarak seçilebileceği gibi, katman bazlı da seçilebilir
(örneğin 1. katmanda sigmoid, 2.katmanda hiperbolik tanjant, çıktı katmanında
doğrusal gibi). Bununla birlikte çoğu uygulamada her katmandaki (dolayısıyla tüm
ağdaki) nöronların aktivasyon fonksiyonu aynı olarak seçilmektedir. Gizli katman 2
için seçilen aktivasyon fonksiyonu (4.16)‟da verilmiştir.
1
𝑦𝑖,𝑗 = 𝑓 𝑣𝑖,𝑗 = 1+𝑣
(4.16)
𝑖,𝑗
Buna göre gizli katman 2‟de bulunan nöronların çıktıları ise aşağıda verildiği gibidir.
1
𝑦2,1 = 𝑓 𝑣2,1 = 1+𝑣
(4.17)
2,1
1
𝑦2,2 = 𝑓 𝑣2,2 = 1+𝑣
(4.18)
2,2
1
𝑦2,3 = 𝑓 𝑣2,3 = 1+𝑣
(4.19)
2,3
57
Gizli katman 2‟de bulunan; 𝑁2,1 , 𝑁2,2 ve 𝑁2,3 nöronları ise, 𝑏𝑖,𝑗 sinaptik ağırlıkları
ile çıkış katmanına bağlıdırlar. Dolayısıyla gizli katman 2‟nin çıktı değerleri olan;
𝑦2,1 ,
𝑦2,2 ve
𝑦2,3 çıkış
katmanının
girdilerini oluşturacaktır.
çerçevesinde çıkış katmanına gelen ağırlıklandırılmış
net
Bu
açıklama
girdi, (4.20)‟de
gösterilmektedir.
2
𝑖=1 𝑦2,𝑖
𝑣3,1 =
𝑏𝑖,1 = 𝑦2,1 𝑏1,1 + 𝑦2,2 𝑏2,1 + 𝑦2,3 𝑏3,1
(4.20)
Son bir işlem olarak, çıkış katmanı, üzerine gelen ağırlıklandırılmış net girdiyi aktive
edecek ve nihai sonucu (ağın tahmin değeri) dış dünyaya gönderecektir. Çıkış
katmanı
için
seçilen
fonksiyonun,
(4.21)‟de
gösterilen
fonksiyon olduğu
düşünülürse;
e v 3,1 −e −v 3,1
yt = f v3,1 = e v 3,1 +e −v 3,1
(4.21)
Şekil 4.9‟da gösterilen örnek yapay sinir ağının nihai çıktısı; yt olacaktır.
4.3.6.2 Geri yayılma aĢaması
ÇKA ağında hatalar, aktivasyon fonksiyonun türevi tarafından, ileri besleme için
yapılan
bağlantılar
üzerinden
çıkış
tabakasından
giriş
tabakasına
doğru
yayılmaktadır. ÇKA ağında hatayı geriye yayma işleminin kullanılabilmesi için,
kullanılan aktivasyon fonksiyonunun türevlenebilir olması gerek ve yeter şarttır.
ÇKA ağları genelde öğrenme kuralı olarak genelleştirilmiş delta öğrenme kuralını
kullanırlar.
Öğrenme esnasında bağımsız değişkenler (𝑥1,𝑡 , 𝑥2,𝑡 , 𝑥3,𝑡 …𝑥𝑛,𝑡 ) ağa sırasıyla sunulur.
Ağ, giriş tabakasından aldığı verileri gizli tabakaya iletir. Başlangıçta rastgele olarak
atanan bağlantı ağırlıklarıyla çarpıp, ağırlıklandırılmış net girdiler, gizli tabakada
aktivasyon fonksiyonuyla aktive edilirler (𝑓 𝑣𝑖,𝑗 ). Daha sonra gizli tabaka da çıkış
değeri olan 𝑦𝑖,𝑗 ‟yi eğer önünde gizli tabaka varsa ona, yoksa çıkış tabakasına
gönderir. Çıkış tabakası da 𝑦𝑖,𝑗 ‟yi gizli tabaka ve çıktı tabakası arasındaki bağlantı
ağırlıklarıyla çarpıp toplayarak (ağırlıklandırılmış net girdiyi bularak) nihai çıktı olan
yt ‟yi üretir. Bağımsız değişkenlerden oluşan veri, ağ içinde ileri yönde hareket
etmektedir.
Hesaplanan çıktı yt olması gereken çıktıyla 𝑦𝑡 karşılaştırılarak hata terimi
Ɛ𝑡 bulunur. Hata teriminin matematiksel ifadesi (4.22)‟de verilmektedir.
58
Ɛ𝑡 = 𝑦𝑡 − yt
(4.22)
Bulunan hata terimi, katmanlar arası bağlantı ağırlıklarının ayarlamasında
kullanılmak üzere, çıkış katmanından bir önce gelen gizli tabakaya (geri besleme
bağlantıları aracılığıyla) iletilir. Burada ifade edilen geri besleme bağlantıları aslında
katmanlar arası sinaptik bağlantılarla aynı bağlantılardır. Bu bağlantılar; veriyi
iletmek için kullanıldığında katmanlar arası bağlantı, hatayı geri iletmek aracılığıyla
kullanıldığında,
geri
besleme
bağlantısı
(feedforward
connection)
olarak
adlandırılırlar.
ġekil 4.10: Geri besleme bağlantıları ve hatanın geri yayılması.
Şekil
4.10‟da
çıkış
tabakası
hatayı,
gizli
katman
2„ye
( 𝑁2,1 , 𝑁2,2 ve
𝑁2,3 nöronlarına), gizli katman 2 ise gizli katman 1„e ( 𝑁1,1 , 𝑁1,2 nöronlarına) ve son
olarak gizli katman 1‟de girdi tabakasına iletmektedir. Şekil 4.9 ve Şekil 4.10
karşılaştırılırsa, veriyi ileriye ileten bağlantılarla (katmanlar arası bağlantı), hatayı
geri ileten bağlantıların(geri besleme bağlantıları) aslında aynı bağlantılar olduğu
ifade edilebilir. Burada sadece hatanın ve verinin gidiş yönleri değişmektedir.
Şekil 4.10‟da gösterilen geri yayılma ağında, çıkış katmanındaki hata kullanılarak
gizli katman 2‟in bağlantı ağırlıkları, gizli katman 2„deki hata kullanılarak, gizli
katman 1‟in bağlantı ağırlıkları, gizli katman 1 „deki hatalar kullanılarak ise giriş
katmanının bağlantı ağırlıklarında ayarlama yapılacaktır.
59
İlk ayarlamadan sonra, açıklayıcı değişkenleri(𝑥1,𝑡+1 , 𝑥2,𝑡+1 , 𝑥3,𝑡+1 …𝑥𝑛,𝑡+1 ) ağa
girdi olarak sunulacak ve ağ kendi çıktısı olanyt+1 ile gerçek değer 𝑦𝑡 ‟i
karşılaştırarak, bağlantı ağırlıklarını bir kez daha güncelleyecektir. Daha sonra
(𝑥1,𝑡+2 , 𝑥2,𝑡+2 , 𝑥3,𝑡+2 …𝑥𝑛,𝑡+2 )
açıklayıcı değişkenleri ağa verilecek ve bu döngü
„toplam ağ hatası‟ en aza indirilene kadar devam edecektir.
Eğitim için kullanılan veri setinde 5 adet örnek (n=5) bulunduğu düşünülsün. Bu
durumda ilk olarak (𝑥1,1 , 𝑥2,1 , 𝑥3,1 ), (𝑥1,2 , 𝑥2,2 , 𝑥3,2 ), (𝑥1,3 , 𝑥2,3 , 𝑥3,3 ), (𝑥1,4 , 𝑥2,4 ,
𝑥3,4 ), (𝑥1,5 , 𝑥2,5 , 𝑥3,5 ) bağımsız değişken üçlülerinin sırasıyla ağa sunulacağı ifade
edilmişti. Ağ, her bağımsız ve bağımlı değişken ikililerinin sunulmasından sonra
bağlantı ağırlıklarını güncelleyecektir. Son veri de işlendiğinde başa dönülecek ve
(𝑥1,1 , 𝑥2,1 , 𝑥3,1 ) verisi tekrar ağa sunulacaktır. Daha sonra ise sırayla diğer veriler de
((𝑥1,2 , 𝑥2,2 , 𝑥3,2 ), (𝑥1,3 , 𝑥2,3 , 𝑥3,3 ), (𝑥1,4 , 𝑥2,4 , 𝑥3,4 ), (𝑥1,5 , 𝑥2,5 , 𝑥3,5 )) eğitimin devamı
için ağa girdi olarak verilecek ve tekrar başa dönülecektir. Bu olayların her birine
“Döngü” (epoch) denilmektedir. Ağ, her bir döngü boyunca birçok kez bağlantı
ağırlıklarını ayarlayacak ve toplam ağ hatasını minimize etmeye çalışacaktır. Ağın
sinaptik ağırlıklarının başlangıç değerleri genellikle (-1,1) aralığında seçilen rassal
değişkenler olup, döngüler ilerledikçe ağırlık parametrelerinin en uygun düzeye
doğru yakınsamasına çalışılacaktır.
Çizelge 4.5: Geri yayılma ile hatanın minimizasyonu ve döngü kavramı.
t=iterasyon
Epoch
(Döngü)
Bağımsız DeğiĢkenler
Bağımlı
DeğiĢken
Sinaptik
Hata
Ağırlık
DeğiĢimi
1
0
𝑥1,1 , 𝑥2,1 , 𝑥3,1
𝑦1
Ɛ1
Evet
2
0
𝑥1,2 , 𝑥2,2 , 𝑥3,2
𝑦2
Ɛ2
Evet
3
0
𝑥1,3 , 𝑥2,3 , 𝑥3,3
𝑦3
Ɛ3
Evet
4
0
𝑥1,4 , 𝑥2,4 , 𝑥3,4
𝑦4
Ɛ4
Evet
5
0
𝑥1,5 , 𝑥2,5 , 𝑥3,5
𝑦5
Ɛ5
Evet
1
1
𝑥1,1 , 𝑥2,1 , 𝑥3,1
𝑦1
Ɛ6
Evet
2
1
𝑥1,2 , 𝑥2,2 , 𝑥3,2
𝑦2
Ɛ7
Evet
3
1
𝑥1,3 , 𝑥2,3 , 𝑥3,3
𝑦3
Ɛ8
Evet
4
1
𝑥1,4 , 𝑥2,4 , 𝑥3,4
𝑦4
Ɛ9
Evet
60
Çizelge 4.5 (devam): Geri yayılma ile hatanın minimizasyonu ve döngü kavramı.
5
1
𝒙𝟏,𝟓 , 𝒙𝟐,𝟓 , 𝒙𝟑,𝟓
𝒚𝟓
Ɛ𝟏𝟎
Evet
1
2
𝑥1,1 , 𝑥2,1 , 𝑥3,1
𝑦1
Ɛ11
Evet
2
2
𝑥1,2 , 𝑥2,2 , 𝑥3,2
𝑦2
Ɛ12
Evet
3
2
𝑥1,3 , 𝑥2,3 , 𝑥3,3
𝑦3
Ɛ13
Evet
4
2
𝑥1,4 , 𝑥2,4 , 𝑥3,4
𝑦4
Ɛ14
Evet
5
2
𝑥1,5 , 𝑥2,5 , 𝑥3,5
𝑦5
Ɛ15
Evet
t
n
𝑥1,𝑡 , 𝑥2,𝑡 , 𝑥3,𝑡
𝑦𝑡
Ɛ𝑡
Evet
Geri yayılma mantığına göre, yapay sinir ağı her döngüden (epoch) sonra toplam ağ
hatasını biraz daha azaltacaktır buna göre;
𝑡
2
𝑡=1 Ɛ𝑛,𝑡
<
𝑡
2
𝑡=1 Ɛ𝑛 −1,𝑡
<
𝑡
2
𝑡=1 Ɛ𝑛−2,𝑡
…<
𝑡
2
𝑡=1 Ɛ𝑛 −𝑛,𝑡
(4.23)
ÇKA ağının toplam hatayı minimize etme ilkesi, (4.23)‟de matematiksel olarak ifade
edilmiştir. Bu ifadeye göre; ÇKA ağlarında her bir döngüden sonraki toplam ağ
hatasının, bir önceki döngüdeki toplam hataya göre daha küçük olması
beklenmektedir. Bu durumda toplam hata minimize edilene kadar veya kabul
edilebilir bir sınıra gelene kadar döngü çalıştırılacaktır.
4.3.6.3 ÇKA ağının genelleĢtirilmiĢ delta öğrenme kuralı ile eğitimi
Çalışmanın bu bölümünde; ÇKA ağlarında, genelleştirilmiş delta öğrenme kuralı
kullanılarak, ağın toplam hatasının her bir döngüde nasıl azaltılabileceği teorik olarak
anlatılmaya çalışılacaktır.
Şekil 4.11‟ de yapılacak analiz için kullanılacak olan örnek yapay sinir ağı modeli
gösterilmektedir. Kullanılacak olan ağ, 2 gizli katman içeren ve 3 – 2 – 3 – 1
düzeninde seçilen bir ÇKA ağıdır.
Ağ mimarisinde kullanılacak değişken ve tanımları şu şekildedir:
𝑋1,𝑡 : Birinci bağımsız değişken (t:zaman)
𝑋2,𝑡 : İkinci bağımsız değişken (t:zaman)
𝑋3,𝑡 : Üçüncü bağımsız değişken (t:zaman)
𝑦𝑡 : Bağımlı değişken (t:zaman)
𝑦𝑡 : 3 – 2 – 3 – 1 düzenindeki ÇKA ağının bağımlı değişken tahmin değeri
61
ġekil 4.11: Genelleştirilmiş delta öğrenme kuralının uygulanacağı ÇKA.
Bu tanımlamalardan sonra, örnek yapay sinir ağı için kullanılacak olan değişkenler
arasında (4.24)‟de ifade edilen bir ilişkinin olduğu varsayılacaktır.
𝑦𝑡 = 𝑓(𝑋1,𝑡 , 𝑋2,𝑡 , 𝑋3,𝑡 )
(4.24)
Ɛ𝑡 = 𝑦𝑡 − 𝑦𝑡 : Ağın t anındaki hatası
Ɛ𝑡𝑜𝑝 : Tüm eğitim çiftleri bittikten sonra (1 epoch sonra) toplam ağ hatası
𝑁𝑖,𝑗 : i. katmandaki j. nöron
𝑤𝑖,𝑗 , 𝑎𝑖,𝑗 , 𝑏𝑖,𝑗 : i. nöronun j. sinaptik ağırlık (bağlantı ağırlığı) değeri
𝑣𝑖,𝑗 : i. katmandaki j. nörona gelen ağırlıklandırılmış net girdi
𝑦𝑖,𝑗 : i. katmandaki j. nöronun çıkış değeri 𝑦𝑖,𝑗 = 𝑓 𝑣𝑖,𝑗
1 döngü (epoch) sonraki toplam ağ hatası olarak tanıtılan Ɛ𝑡𝑜𝑝
ifadesinin açılımı
(4.25)‟de verilmektedir.
1
Ɛ𝑡𝑜𝑝 = 2
𝑡
𝑖=1
𝑦𝑡 − 𝑦𝑡
2
(4.25)
(4.25)‟de verilen toplam ağ hata fonksiyonunun değeri, bir döngü (epoch) içindeki
hata kareler toplamının yarısına eşit olmaktadır. Bir döngü ile kastedilen ifade, tüm
açıklayıcı değişkenlerin sırasıyla ağa veri olarak sunulduğu (bu sırada ağ
parametreleri yani bağlantı ağırlıkları sürekli olarak güncellenmekte ve ağ
eğitilmektedir) ve tekrar başa dönme sırasının geldiği noktadır.
62
Katmanlar arası bağlantı ağırlıkları, bir iterasyon sonunda her katmanın çıkış hatası,
bir öncekinden düşük bir değer alacak şekilde güncellenecektir. Dolayısıyla
Ɛ𝑡𝑜𝑝 ifadesi de bir önceki döngüde aldığı değerden daha düşük bir değer alacaktır. Bu
minimizasyon işlemi herhangi bir iterasyondaki ağ hatasının (Ɛt ) ağ sinaptik
ağırlıklarına göre kısmi türevinin negatif bir oranına göre, ağırlıkları değiştirerek
sağlanabilecektir. Bu şekilde izlenecek ağırlık güncelleme kuralına genelleştirilmiş
delta öğrenme kuralı denilmektedir.
Genelleştirilmiş delta öğrenme kuralına göre katmanlar arası bağlantı ağırlıkları
güncellenirken, bağlantı ağırlıkları ayarlanacak olan katmanın çıkış katmanı veya
gizli katman olması durumuna göre ayarlama işlemi değişikliğe uğramaktadır.
Çıkış Katmanının Bağlantı Ağırlıklarının Ayarlanması
Bu bölümde; Şekil 4.11‟de gösterilen örnek yapay sinir ağının çıkış katmanındaki
bağlantı ağırlıklarının (𝑏𝑖,𝑗 ) nasıl ayarlanması gerektiği açıklanacaktır. Çıkış katmanı
ile gizli katman 2 arasındaki bağlantıların ağırlıkları, çıkış katmanının bağlantı
ağırlıkları olarak kabul edilmektedir.
Genelleştirilmiş delta kuralına göre çıkış katmanındaki 𝑏𝑖,𝑗 bağlantı ağırlıklarının
ayarlanması için gerekli kısmi türev (4.26)‟da verilmektedir.
𝜕Ɛ𝑡𝑜𝑝
𝜕𝑏 𝑖,1
i=1…3
(4.26)
Örnek YSA‟nın çıkış katmanında 1 adet nöron bulunmaktadır. Bu yüzden
𝑏𝑖,𝑗 bağlantı ağırlıkları için, katmandaki hangi nöron ile ilgili işlem yapıldığını
gösteren j indisi kaldırılmış ve bunun yerine; „1‟ indisi kullanılmıştır. Toplam hata
fonksiyonu (Ɛ𝑡𝑜𝑝 ), (𝑏𝑖,1 ) sinaptik ağırlıklarının bir fonksiyonu olmadığından (4.26)
türevi direkt olarak alınamamaktadır.
(4.26)‟da verilen ifade ağın toplam hata fonksiyonundaki değişmenin, çıkış
katmanındaki bağlantı ağırlıklarına göre türevi şeklinde ifade edilebilir. Bu ifade,
çıkış katmanındaki bağlantı ağırlıklarını (hata fonksiyonunu minimize edebilecek
şekilde) ne kadar değiştirmemiz gerektiğine dair en önemli parametredir. (4.26)‟da
ifade edilen türevin bulunabilmesi için matematikte “zincir kuralı” olarak bilinen bir
dönüşümden yararlanılacaktır. Bu dönüşüm (4.27)‟de gösterilmiştir.
63
𝜕Ɛ𝑡𝑜𝑝
=
𝜕𝑏 𝑖,1
𝜕Ɛ𝑡𝑜𝑝
𝜕𝑦 𝑡
𝜕𝑦 𝑡
𝜕𝑏 𝑖,1
i=1…3
(4.27)
(4.27)‟de verilen ifade genişletilirse
𝜕Ɛ𝑡𝑜𝑝
𝜕𝑏 𝑖,1
=
𝜕Ɛ𝑡𝑜𝑝
𝜕𝑦 𝑡
𝜕𝑦 𝑡
𝜕𝑏 𝑖,1
=
𝜕Ɛ𝑡𝑜𝑝
𝜕
𝜕𝑦 𝑡
𝜕𝑏 𝑖,1
3
𝑖=1 𝑏𝑖,1 𝑦2,𝑖
3
𝑖=1 𝑏𝑖,1 𝑦2,𝑖
𝑣3,1 =
(4.28)
(4.29)
(4.28)‟e ulaşılacaktır. (4.28)‟de parantez içinde ifade edilen diferansiyel, çıktı
katmanında bulunan nörona gelen ağırlıklandırılmış net girdideki değişmenin, gizli
katman 2 ile çıkış katmanı arasındaki bağlantı ağırlıklarındaki değişmeye göre
türevidir. Bu türev ise;
𝜕
3
𝑖=1 𝑏𝑖,1 𝑦2,𝑖
𝜕𝑏 𝑖,1
= 𝑦2,𝑖
(4.30)
(4.30)‟da ifade edildiği gibi 𝑦2,𝑖 ‟ye eşit olacaktır. (4.28)‟de verilen diferansiyelin
parantez içindeki kısmı hesaplandığına göre bu aşamadan sonra geriye kalan ifade
(4.31)‟deki diferansiyeldir.
𝜕Ɛ𝑡𝑜𝑝
(4.31)
𝜕𝑦 𝑡
Bu türevin alınabilmesi için 𝑦𝑡 ‟nin hangi değere eşit olduğu bilinmelidir. 𝑦𝑡 ‟nin
matematiksel eşitliği (4.32)‟de verilmektedir.
𝑦𝑡 = 𝑓 𝑣3,1
(4.32)
YSA’nın nihai çıktısı olan 𝑦𝑡 , çıkış katmanındaki nörona gelen ağırlıklandırılmış
net
girdinin
(𝑣3,1 )
aktivasyon
fonksiyonundan
𝑓 𝑣𝑖,𝑗 geçirilmesiyle
elde
edilmektedir. Bu durumda (4.32) ifadesi, (4.33)‟deki gibi yeniden düzenlenerek
yazılabilir.
𝜕Ɛ𝑡𝑜𝑝
𝜕𝑦 𝑡
=
𝜕Ɛ𝑡𝑜𝑝
(4.33)
𝜕𝑓 𝑣3,1
Son olarak ulaşılan diferansiyel de direkt olarak hesaplanamayacağından (toplam
hata fonksiyonu, aktivasyon fonksiyonu ile ilgili bir parametre içermediğinden)
zincir kuralı yardımıyla (4.34)‟e ulaşılır.
64
𝜕Ɛ𝑡𝑜𝑝
𝜕𝑓 𝑣3,1
=
𝜕Ɛ𝑡𝑜𝑝
𝜕𝑦 𝑡
𝜕𝑦 𝑡
(4.34)
𝜕𝑓 𝑣3,1
Bu noktadan sonra gerekli türevler hesaplanabilir duruma gelmiştir.
𝜕Ɛ𝑡𝑜𝑝
𝜕 𝑦𝑡
ifadesi,
ağın toplam hatasındaki değişmenin, ağ çıktısındaki değişmeye göre türevi
olduğundan; bu ifadenin türevi,
𝜕Ɛ𝑡𝑜𝑝
= 𝑦𝑡 − 𝑦𝑡 = Ɛ𝑡
𝜕𝑦 𝑡
𝜕 𝑦𝑡
𝜕𝑓 𝑣3,1
(4.35)
diferansiyeli ise ağın nihai çıktısının, kullanılan aktivasyon fonksiyonuna
göre türevi olduğundan bu ifadenin türevi,
𝜕𝑦 𝑡
𝜕𝑓 𝑣3,1
= 𝑓′ 𝑣3,1
(4.36)
(4.36) ifadesine eşit olacaktır. (3.46)‟da gösterilen 𝑓′ 𝑣3,1
ifadesi, ağın çıktı
katmanında kullanılan aktivasyon fonksiyonun türevidir. Daha önceden de
değinildiği gibi, ağın her nöronunda ya da her katmanında farklı aktivasyon
fonksiyonları kullanılabilir. Burada her bir bağlantı ağırlığı değişiminde, ilgili
aktivasyon fonksiyonun türevine ulaşmak gerekmektedir. Bu açıklamalardan sonra,
kullanılan aktivasyon fonksiyonunun niçin türevlenebilir olması gerektiği de açığa
kavuşmaktadır. Bağlantı ağırlıklarının değiştirilebilmesi için, ilgili aktivasyon
fonksiyonun türevine ihtiyaç duyulmaktadır. Aktivasyon fonksiyonu olarak süreksiz
bir fonksiyon seçildiğinde, bu türev hesaplanamayacağından genelleştirilmiş delta
öğrenme kuralı kullanılamaz.
(4.30), (4.35) ve (4.36) ifadeleri birleştirilerek başlangıçta hesaplanması gereken
diferansiyelin değerine ulaşılacaktır. Bu ifade, (4.37)‟de gösterilmektedir.
𝜕Ɛ𝑡𝑜𝑝
𝜕𝑏 𝑖,1
= 𝑦2,𝑖 Ɛ𝑡 𝑓 ′ 𝑣3,1
i=1…3
(4.37)
(4.37)’de yer verilen ifadenin Ɛ𝑡 𝑓 ′ 𝑣3,1 kısmına, genelleştirilmiş delta eğitim
kuralı yazınında δ (delta) hatası denilmektedir. Bu dönüşüme göre (4.37) ifadesinden
aşağıdaki ifadeye ulaşılmaktadır.
𝜕Ɛ𝑡𝑜𝑝
𝜕𝑏 𝑖,1
= 𝛿𝑦2,𝑖
i=1…3
65
(4.38)
𝑏𝑖,1 bağlantı ağırlıklarının hatayı minimize etmek üzere değiştirilmesi için gereken
diferansiyel bulunduğuna göre, bu aşamadan itibaren değişim kuralının ne olacağına
değinilebilir. Bu kural (4.39)‟da gösterilmektedir.
𝜕Ɛ𝑡𝑜𝑝
∆𝑏𝑖,1 = 𝜂 𝜕𝑏 = 𝜂𝛿𝑦2,𝑖
𝑖,1
i=1…3
(4.39)
Denklemdeki 𝛿 (delta) ifadesi, 𝑏𝑖,1 yani 𝑏1,1 , 𝑏2,1 ve 𝑏3,1 bağlantı ağırlıklarının kaç
birim değiştirilmesi gerektiğini ifade etmektedir.
(4.39)‟de gösterilen 𝜂 ifadesi ise; yapay sinir ağları yazınında öğrenme oranı veya
katsayısı olarak bilinen bir sabittir. Bu ifade ilgili bağlantı ağırlığının, 𝛿 hatasının kaç
katıyla değiştirileceğini göstermektedir. Öğrenme oranı uygulamada 0< 𝜂 <1 olarak
seçilmektedir. Katsayının pozitif olması sistemin tutarlılığını sağlarken, 1 den küçük
olması ise sistemin yakınsamasını sağlamaktadır (Elmas, 2003). Öğrenme
katsayısının çok büyük olarak seçilmesi (0,80 veya 0,90 gibi) ağın yerel çözümler
arasında salınmasına ve en iyi çözüme yakınsayamamasına neden olurken, çok küçük
olarak seçilmesi ise (0,01 veya 0,05 gibi) ağın ilişkileri öğrenebilmesi için gereken
döngü sayısının dolayısıyla zamanın artmasına neden olmaktadır (Öztemel, 2003).
Fakat zamanın artmasının öğrenme üzerinde hiçbir olumsuz etkisi olmadığı gibi,
öğrenme oranının küçük olarak seçilmesi öğrenmenin çok daha hassas bir şekilde
gerçekleşmesini sağlayacaktır. Öğrenme oranının doğru bir şekilde seçilmesi, yapay
sinir ağları yöntem biliminde önemli bir yer tutmaktadır. Öğrenme oranı, ağın
ilişkileri ortaya çıkarabilme derecesi üzerinde direkt bir etkisi bulunmaktadır. Genel
bir
kural olarak,
modellenmesi
gereken zaman serileri arasındaki
ilişki
karmaşıklaştıkça, öğrenme oranının azaltılması yani küçük seçilmesi daha yerinde
olacaktır.
Bu açıklamalardan sonra çıkış katmanındaki 𝑁3,1 nöronunun yeni bağlantı
ağırlıklarının değeri (4.40)‟da verilmiştir.
𝑏𝑖,1 𝑦𝑒𝑛𝑖 = 𝑏𝑖,1 𝑒𝑠𝑘𝑖 + ∆𝑏𝑖,1
i=1…3
(4.40)
Gizli Katman 2’nin Bağlantı Ağırlıklarının Ayarlanması
Bu bölümde gizli katman 2‟in bağlantı ağırlıklarının nasıl ayarlanacağı ele
alınacaktır. (Gizli katman 2 ile gizli katman 1 arasındaki bağlantıların ağırlıkları,
gizli katman 2‟nin bağlantı ağırlıkları olmaktadır.)
66
Gizli katmanların çıkış değerleri (𝑦𝑖,𝑗 ) için 𝑦𝑡 gibi hedeflenen bir çıktı değeri
olmadığından, gizli katman için herhangi bir hata da söz konusu değildir. Dolayısıyla
gizli katmanların bağlantı ağırlıklarının ayarlanması için ağ toplam hata
fonksiyonundan yararlanılacaktır.
Gizli katman 2‟nin yeni bağlantı değerlerinin (𝑎𝑖,𝑗 ) hesaplanabilmesi için gereken
diferansiyel (4.41)‟de verilmektedir.
𝜕Ɛ𝑡𝑜𝑝
i=1…2 ; j=1…3
𝜕𝑎 𝑖,𝑗
(4.41)
𝑎𝑖,𝑗 ağırlıklarının yeni değerlerinin hesaplanması için gereken diferansiyel; ağın
toplam hata fonksiyonundaki değişmenin, gizli katman 2‟nin bağlantı ağırlıklarındaki
değişmeye göre kısmi türevi olacaktır. Bu kısmi türev de, çıkış katmanındaki
bağlantı ağırlıkların değiştirilmesi için kullanılan yöntemle hesaplanırsa, (4.42)
ifadesine ulaşılır.
𝜕Ɛ𝑡𝑜𝑝
𝜕𝑎 𝑖,𝑗
= 𝑓 ′ 𝑣2,𝑗 𝑏𝑗 ,1 𝛿çı𝑘ış
i=1…2 ; j=1…3
(4.42)
(4.42)‟de verilen 𝛿çı𝑘ış ifadesi, daha önce çıkış tabakası için hesapladığımız 𝛿
hatasıdır. Bu parametre, gizli katman 2 ‘deki nöronların bağlantı ağırlıklarını
ayarlayabilmek için de gerekmektedir. Son olarak ulaşılan ifadelere; 2. Katmanı
belirtmek için ‘2’, katmandaki nöronu belirtmek için ‘j’, değişecek bağlantı
ağırlığını belirlemek için ise ‘k’ indisini kullanarak;
𝛿2,𝑗 = 𝑓 ′ 𝑣2,𝑗 𝑏𝑗 ,1 𝛿çı𝑘ış
∆2,𝑗 ,𝑘 = 𝜂𝑦1,𝑘 𝛿2,𝑗
j=1…3
j=1…3 ; k=1…2
(4.43)
(4.44)
önce (4.43)‟e, daha sonra da gizli katman 2‟deki nöronların bağlantı ağırlıklarının
değişim kuralı olan (4.44)‟e ulaşılır.
Buna göre gizli katman 2‟nin bağlantı ağırlıklarının yeni değerleri (4.45)‟deki gibi
hesaplanır.
𝑎𝑗 ,𝑘 𝑦𝑒𝑛𝑖 = 𝑎𝑗 ,𝑘 𝑒𝑠𝑘𝑖 + ∆2,𝑗 ,𝑘
j=1…3 ; k=1…2
67
(4.45)
Gizli Katman 1’in Bağlantı Ağırlıklarının Ayarlanması
Kısmi türev yöntemi burada da geçerli olacak ve gizli katman 1’in bağlantılarının
ayarlanabilmesi için gereken kısmi türev ağın toplam hata fonksiyonundaki
değişmenin, gizli katman 1‟in sinaptik ağırlıklarındaki değişmeye göre kısmi türevi
olacaktır. Bu ifadenin matematiksel gösterimi ise (4.46)‟da yapılmıştır.
𝜕Ɛ𝑡𝑜𝑝
(4.46)
𝜕𝑤 𝑖,𝑗
(4.46)‟da
verilen
diferansiyel,
zincir
kuralı
arkaya
arkaya
kullanılarak
hesaplandığında (4.47) ifadesine ulaşılmıştır.
𝜕Ɛ𝑡𝑜𝑝
𝜕𝑤 𝑖,𝑗
= 𝑓 ′ 𝑣1,𝑗
2
𝑚 =1
3
𝑗 =1 𝑎𝑚 ,𝑗
𝛿2,𝑗
j=1…3 ; k=1…2
(4.47)
(4.47)‟de verilen 𝛿2,𝑗 ifadesi, daha önce gizli katman 2‟de bulunan her bir nöron için
hesaplanan 𝛿 parametreleridir ve gizli katman 1‟deki nöronların bağlantı ağırlıklarını
değiştirilebilmek için de gerekmektedir. Son olarak ulaşılan ifadelere; 1. katmanı
belirtmek için ‘1’, ilgili katmandaki kaçıncı nöron olduğunu belirtmek için ‘r’,
değişecek bağlantı ağırlığı belirlemek için ise ‘p’ indisini kullanarak;
𝛿1,𝑟 = 𝑓 ′ 𝑣1,𝑗
∆1,𝑟,𝑝 = 𝜂𝑥𝑝,𝑡 𝛿1,𝑟
2
𝑚 =1
3
𝑗 =1 𝑎𝑚 ,𝑗
𝛿2,𝑗
j=1…3; m=1…2; r=1…2
r=1…2; p=1…3; t=zaman
(4.48)
(4.49)
önce (4.48)‟e daha sonra da gizli katman 1‟de bulunan nöronların bağlantı
ağırlıklarının değişim kuralı olan (4.49)‟a ulaşılacaktır.
Gizli katman 1‟in bağlantı ağırlıklarının yeni değerleri ise (4.50)‟de gösterilmiştir.
𝑤𝑟,𝑝 𝑦𝑒𝑛𝑖 = 𝑤𝑟,𝑝 𝑒𝑠𝑘𝑖 + ∆1,𝑟,𝑝
r=1…2; p=1…3
(4.50)
4.3.6.4 Öğrenmenin devamı ve toplam hata fonksiyonu
Önceki bölümde 1 iterasyon sonucunda, ağın bağlantı ağırlıklarının nasıl
güncelleneceği açıklanmıştı. İterasyon, eğitim verisindeki bağımlı ve bağımsız veri
çiftleri bitene kadar devam ettirilecek ve son veri çifti ağa verilip ağırlıklar tekrar
güncellendiğinde, bir döngü (epoch) de sona ermiş olacaktır. Bir döngü bittikten
sonra tekrar en başa dönülecek, eğitim verileri en baştan başlayarak tekrar ağa
verilmeye devam edilecek ve bağlantı ağırlıkları sürekli güncellenmeye devam
68
edilecektir. Bu şekilde her bir döngüden sonra, ağın toplam hata fonksiyonunun
değeri, bir önceki döngüye göre daha düşük olacak ve fonksiyonun değeri minimize
edilene kadar döngüler ve güncellemeler sürekli devam edecektir.
Eğitim için kullanılan veri setinde (bağımsız değişkenler ve bağımlı değişken) n adet
örnek olduğu varsayılsın. Her bir veri sırasıyla ağa girdi olarak verilecek ve ağın
bağlantı ağırlıkları ayarlanacak, iterasyon sayısı örneklem hacmine eşitlendiğinde bir
döngü tamamlanmış olacak ve başa dönülerek yeni bir döngü başlatılacaktır.
𝑛
𝑖=1 𝐺ü𝑛𝑐𝑒𝑙𝑙𝑒𝑚𝑒
n=örnek hacmi; i=iterasyon
= 1 𝐷ö𝑛𝑔ü
(4.51)
ve her bir döngüden sonra;
𝜀𝑡𝑜𝑝 ,𝑛 < 𝜀𝑡𝑜𝑝 ,𝑛−1 < 𝜀𝑡𝑜𝑝 ,𝑛 −2 < ⋯ < 𝜀𝑡𝑜𝑝 ,0
n=döngü sayısı
(4.52)
olacaktır. Bu süreç (4.53)‟de verilen duruma gelininceye kadar devam ettirilecek ve
bu noktadan itibaren ağ bağlantı ağırlıkları sabitlenecektir.
𝒛: 𝜀𝑡𝑜𝑝 ,𝑛 = min⁡
(𝜀𝑡𝑜𝑝 )
n=döngü sayısı
(4.53)
4.3.6.5 ÇKA ağlarında öğrenme performansının arttırılması
Bu bölümde, ÇKA‟larda öğrenme performansı ve yakınsama süresinin nasıl
azaltılabileceği anlatılacaktır. Bu performans düzeltmesi için izlenebilecek yollar;

Dinamik Öğrenme Hızı Ayarlaması

Momentum Terimi ve Öğrenme Performansına Etkisi
şeklindedir.
Dinamik Öğrenme Hızı Ayarlaması
Genelleştirilmiş delta öğrenme kuralına göre, ağ bağlantı ağırlıklarının değerleri
güncellenirken, ağın toplam hata fonksiyonu olan 𝜀𝑡𝑜𝑝 ‟un, her bir katmandaki ağırlık
matrislerine göre (𝑤𝑖,𝑗 , 𝑎𝑖,𝑗 , 𝑏𝑖,𝑗 ) kısmi türevlerinden yararlanılmaktadır. Bu durum
beraberinde şu sorunu getirmektedir. Bağlantı ağırlıkları, en uygun ağırlıklardan çok
uzak bir noktada bulunuyorsa ve ağ parametrelerine (bağlantı ağırlıklarına) göre
alınan kısmi türevler çok küçük bir genlikte ise (değişimleri çok düşük miktarlarda
ise), yapay sinir ağının öğrenme süresi (döngü sayısı) çok uzun bir zaman almaktadır
(Efe ve Kaynak, 2000). Bu problem, özellikle öğrenme hızının (𝜂) düşük bir değer
seçildiği durumlarda ortaya çıkmaktadır.
69
Bu sorunun çözümü için kullanılan yaklaşımlardan biri dinamik öğrenme hızı
ayarlamasıdır. (4.54)‟de ağın toplam hata fonksiyonunun değeri verilmektedir.
𝜀𝑡𝑜𝑝 =
1
𝑡
𝑖=1
2
𝑦𝑡 −𝑦𝑡
2
t=zaman
(4.54)
(4.54)‟de verilen toplam hata fonksiyonundan hareketle (4.55) ve (4.56) ifadeleri
yazılmıştır.
𝜀𝑡𝑜𝑝 ,𝑛 =
1
2
𝜀𝑡𝑜𝑝 ,𝑛+1 =
𝑡
𝑖=1
1
2
𝑦𝑡 −𝑦𝑡
𝑡
𝑖=1
2
𝑦𝑡 −𝑦𝑡
n=döngü sayısı; t=zaman
2
n=döngü sayısı; t=zaman
(4.55)
(4.56)
(4.55)‟de n. döngü sonrasında, (4.56)‟da ise (n+1). döngü sonrasında ağ toplam hata
fonksiyonun aldığı değere yer verilmiştir. Hata fonksiyonun (n+1). döngüde aldığı
değer ile n. döngüde aldığı değer arasındaki farkı ifade eden ∆𝜀𝑡𝑜𝑝 ifadesi (4.57)‟de
gösterilmiştir.
∆𝜀𝑡𝑜𝑝 = 𝜀𝑡𝑜𝑝,𝑛+1 − 𝜀𝑡𝑜𝑝,𝑛
n=döngü sayısı
(4.57)
Dinamik öğrenme hızı ayarlaması; (4.57)‟de yer verilen ifadenin pozitif veya negatif
değerler alması durumunda, öğrenme oranının (𝜂) her bir döngüden sonra uygun
şekilde güncellenmesi şeklinde açıklanabilir.
∆𝜀𝑡𝑜𝑝 ifadesinin negatif değer alması şu şekilde yorumlanabilir. (n+1). döngüde
toplam hata fonksiyonun aldığı değer, n. döngüde aldığı değerden daha düşüktür ve
fonksiyonun minimizasyonu için girilen yol doğrudur. Öyleyse bu yolda daha hızlı
ilerlemek (başka bir deyişle daha hızlı öğrenmek) için öğrenme hızının (η) değeri
arttırılmalıdır.
İfadenin pozitif değer alması ise; (n+1). döngüde toplam hata fonksiyonun aldığı
değer, n. döngüde aldığı değerden daha büyüktür ve toplam hata fonksiyonun
minimizasyonu için başka çözümler aranmalıdır. Dolayısıyla öğrenme daha
hassaslaştırılarak, fonksiyonun minimizasyonu için gereken yol daha dikkatli
aranmalıdır. Bu yolun daha dikkatli aranabilmesi için ise, öğrenme hızının değeri
azaltılmalıdır, şeklinde yorumlanabilir.
Öğrenme hızını arttırıp azaltmak için seçilebilecek sınırsız sayıda kural
oluşturulabilir. Dikkat edilmesi gereken nokta ∆𝜀𝑡𝑜𝑝 ifadesi negatif değer aldığında
öğrenme hızı (oranı) arttırılmalı, tersi durumda ise azaltılmalıdır. (4.58)‟de dinamik
70
öğrenme hızı ayarlaması için kullanılabilecek bir sistem verilmiştir (Samarasinghe,
2006).
+γ ∆𝜀𝑡𝑜𝑝 < 0
Δη = −βη ∆𝜀𝑡𝑜𝑝 > 0
0
∆𝜀𝑡𝑜𝑝 = 0
(4.58)
(4.58)‟de öğrenme hızının her bir döngüden sonra nasıl güncelleştirileceğini ifade
eden bir sistem gösterilmiştir. Bu sistemde Δη ifadesi, öğrenme hızının hangi oranda
değiştirileceğini ifade etmektedir. (4.58)‟de yer alan sisteme göre Δη‟ nün değeri
bulunduktan sonra, öğrenme oranının (η) yeni değeri (4.59) ifadesine eşit olacaktır.
𝜂 𝑦𝑒𝑛𝑖 = 𝜂𝑒𝑠𝑘𝑖 + Δη
(4.59)
Bu yaklaşım sayesinde öğrenme hızı her döngü sonunda toplam hata fonksiyonun
aldığı değere göre değiştirilecektir. Hata fonksiyonundaki değişme pozitif ise
öğrenme hızı azaltılarak öğrenme hassaslaştırılacak, negatif ise arttırılarak hatanın
sıfıra yakınsama süresi (dolayısıyla döngü sayısı) azaltılmış olacaktır. γ ve β‟ nın
nasıl seçileceği hakkında bir kısıtlama olmamakla beraber 0.00001 ≤ 𝛾 ≤ 0.001 ve
0.01 ≤ 𝛽 ≤ 0.1 aralıklarında seçilmesi uygundur (Orr ve diğ., 1999).
Momentum Terimi ve Öğrenme Performansına Etkisi
Genelleştirilmiş delta öğrenme kuralının işleyebilmesi için gereken kısmi
diferansiyeller kanalıyla oluşabilecek bir diğer sorun ise bu diferansiyellerin her bir
iterasyonda
çok
kararsızlaşmasıdır.
yüksek
Bağlantı
değişkenlik
göstermesi
ağırlıklarının
çok
nedeniyle
küçük
ağ
yapısının
değerlerde
seyrettiği
durumlarda, sistem en uygun bağlantı ağırlıklarına çok yakın olsa dahi, kısmi
türevlerin genliklerinin büyük olması (türev sonuçlarının aşırı derecede büyük
çıkması), bağlantı ağırlıklarında çok büyük değişmelere yol açacak ve sistem aniden
en uygun noktadan büyük bir sapma gösterecektir. Kısmi türevlerde oluşan bu tür
sıçramalar‘Momentum Terimi’ olarak bilinen bir terimin, katmanlar arası bağlantı
ağırlıkları güncelleme kuralına dâhil edilmesiyle engellenebilir (Efe ve Kaynak,
2000).
Momentum teriminin açıklanması için, Şekil 4.11‟de gösterilen örnek yapay sinir
ağının çıkış katmanındaki bağlantı ağırlıklarının ayarlanma kuralı örnek olarak
seçilmiştir. Bu kural (4.60)‟da yer almaktadır.
71
𝜕Ɛ𝑡𝑜𝑝
∆𝑏𝑖,1 = 𝜂 𝜕𝑏 = 𝜂𝛿𝑦2,𝑖
𝑖,1
i=1…3
(4.60)
Momentum terimi yaklaşımına göre, herhangi bir katmandaki herhangi bir nöronun
bağlantı ağırlıkları güncellenirken, güncelleme kuralına, ∆𝑏𝑖,1 ifadesinin, bir önceki
iterasyonda aldığı değerin belirli bir oranı eklenmeli ve diferansiyel kaynaklı olası
sıçrama ve dengeden uzaklaşma durumu engellenmelidir. (4.61)‟de bu ifadenin
matematiksel açılımı yapılmıştır.
∆ 𝑏𝑖,1 𝑦𝑒𝑛𝑖 = ∆𝑏𝑖,1 𝑒𝑠𝑘𝑖 + 𝜇∆𝑏𝑖,1,𝑡−1
t=zaman
(4.61)
(4.61)‟de momentum teriminin kullanılmasına yer verilmiştir. ∆𝑏𝑖,1 𝑒𝑠𝑘𝑖 değişkeni, ilk
adımda hesaplanan değişim oranıdır. Daha başka bir deyişle bu değişken aslında
(4.60)‟da verilen ifadeye eşittir. ∆𝑏𝑖,1,𝑡−1 ise değişim miktarının (t-1) anında aldığı
değeri ifade etmektedir. Buradaki (t) indisi döngü sayısını değil, zamanı
göstermektedir. Örneğin (𝑥𝑡 , 𝑦𝑡 ) çifti ağa girdiğinde bu ifadenin değeri ∆𝑏𝑖,1,𝑡 ise
(𝑥𝑡−1 , 𝑦𝑡−1 ) değişkenleri analiz için ağa girdiğinde bu ifadenin (t-1) anındaki değeri
göreceli olarak ∆𝑏𝑖,1,𝑡−1 olacaktır. (t-1) indisi, bu ifadenin bir döngü önceki değerini
değil, bir eğitim çifti önceki değerini göstermektedir.
𝜇 (mü) sabiti ise; “Momentum Terimi” olarak bilinen ve uygulamada çoğunlukla
𝜇 ≥ 0.6 olarak seçilen bir katsayı olup bir önceki bağlantı ağırlığı değişim
miktarının hangi oranda yeni ağırlığı etkileyeceğini göstermektedir.
Şekil 4.12‟de bir ÇKA ağının parametre (ağırlık) uzayında, en uygun bağlantı
ağırlıklarına yakınsama süreci gösterilmektedir.
ġekil 4.12: Parametre uzayında optimal ağırlığa yakınsama süreci. a) düşük öğrenme
hızı. b) yüksek öğrenme hızı. c) yüksek öğrenme hızı + momentum
terimi (Kröse ve Smagt,1996).
72
Şekil 4.12‟de öğrenme hızının küçük seçilmesi (a), sistemin yakınsama süresini
dolayısıyla da döngü sayısı ve öğrenme zamanının arttırırken, büyük seçilmesi ise
(b), en uygun çözüme doğru yakınsarken salınımlara (osilasyon) neden olmakta ve
sistemi kararsızlığa itmektedir. Öğrenme kuralına momentum terimi eklendiğinde ise
(c), sistem hem kararlı bir biçimde en uygun çözüme yaklaşmakta hem de
yakınsamanın sağlanabilmesi için geçen zaman kısalmaktadır.
4.3.6.6 Öğrenme ve ezberleme arasındaki fark
Yapay sinir ağları eğitilirken genellikle seride bulunan veri hacminin (n) belirli bir
yüzde oranını ağı eğitmek için, geri kalanı ise ağı test etmek için kullanılır. Örneğin
100 veri bulunan bir sette (n=100), oranlar %80 ve %20 olarak belirlenirse, ilk 80
veri ağı eğitmek için, geriye kalan 20 veri ise ağı test etmek için kullanılır. (n1=80 ve
n2=20) Yapay sinir ağları eğitilirken böyle bir yol seçilmesinin nedeni ağı test veri
setiyle eğittikten sonra, eğitim dışı verileri kullanarak performansı gözlemek ve ağın
genelleme yeteneğini ortaya çıkarmaktır.
Yapay sinir ağları eğitim setleriyle eğitilirken, eğitimin en uygun noktada
durdurulması gerekmektedir. Eğer belirli bir noktadan sonra ağ eğitilmeye devam
edilirse, genelleme yapma özelliğini kaybedecek ve eğitim çiftlerini ’ezberlemeye’
başlayacaktır. Bu durum başka bir deyişle ifade edilirse; ağ aşırı eğitildiğinde
kullanılan eğitim serisinin kitle içinden seçilen bir örnek olduğunu değil, kitlenin
kendisi olduğunu zannedecektir. Bu durumda eğitim veri seti (n1) için çok hassas
tahminler veren ağ, eğitim dışı veri seti için (n2) anlamsız tahminler vermeye
başlayacaktır. Çünkü ağ aşırı eğitimden dolayı, ilk örneği (n1=80) kitle zannederek
ezberleyecek ve aynı kitleye dahil olan ikinci örneği (n2=20) başka bir kitle gibi
değerlendirecektir. Yapay sinir ağları yazınında aşırı eğitim (overtraining) sonucu
yapay sinir ağının genelleme yeteneğini kaybetmesi ve dolayısıyla ağ tahmin
değerlerinin etkinliklerini kaybetmeleri durumuna ezberleme etkisi (memorizing
effect) denmektedir (Hansel ve diğ., 1992). Ezberleme etkisi sadece aşırı eğitim
sonucu ortaya çıkmamaktadır. Eğitim için kullanılan test veri setinin hacminin
yeterince büyük olarak seçilmemesinden ve buna bağlı olarak yapay sinir ağının veri
setleri arasındaki ilişkileri tam olarak ortaya koyamamasından da oluşabilmektedir.
4.2.6.7 ÇKA ağlarında öğrenmeyi etkileyen faktörler
Öğrenmeyi ve genellemeyi etkileyen faktörler şu şekilde sıralanabilir:
73
a) Öğrenme Algoritması ve Döngü Sayısı: Bu parametrelerin eğitim veri serisi
için toplam ağ hata fonksiyonun en hızlı biçimde minimize edilebilmesi ve
ağın ezberleme (memorizing) yerine genelleyebilmesi üzerinde etkileri vardır.
b) Eğitim Veri Setinin Hacmi ve Niteliği: Bu parametreler ise yapay sinir ağının
gerçek fonksiyona (kitle fonksiyonuna) yakınsayabilme yeteneği üzerinde
etkileri vardır.
c) Gizli Katman Sayısı: Gizli katmanlar bir yapay sinir ağının en büyük gücünü
oluşturmaktadırlar
(Kröse ve Smagt,
1996). Yumuşak
ve kolayca
modellenebilen fonksiyonların (veya ilişkilerin) modellenmesinde az sayıda
gizli katman kullanılabilirken, değişkenlik gösteren fonksiyonlar veya
ilişkinin net olarak ortaya koyulması zor olan değişkenler için daha fazla
sayıda gizli katman gerekmektedir. En uygun gizli katman sayısının nasıl
belirleneceği hakkında teorik bir sınır yoktur ve yapay sinir ağı analizinde
kullanılacak gizli katman sayısı sadece araştırmacı veya uygulayıcının
seçimine bağlıdır.
İlk olarak eğitim için kullanılacak eğitim veri setinin hacminin, genelleme üzerindeki
etkisine değinilecektir. Bu durumun incelenmesi için, Şekil 4.13 kullanılacaktır.
ġekil 4.13: Örnek hacminin genelleme üzerindeki etkisi.
Şekil 4.13‟te yer alan panelin (A) ile simgelenen parçasında, y fonksiyonun
modellenmesi için ileri beslemeli bir geri yayılma ağının 𝑛1 = 4 hacmindeki eğitim
seti ile eğitildiği durum gösterilmektedir. Şekilde kesikli çizgi ile ifade edilen
fonksiyon, ağa öğretilmek istenilen fonksiyonun (𝑦 = 𝑓(𝑥)) gerçek değeriyken,
sürekli çizgi ile gösterilen fonksiyon, yapay sinir ağının y fonksiyonu için vermiş
olduğu tahmin değerlerini (𝑦) ifade etmektedir Yapay sinir ağının eğitimi için
74
kullanılan örneklem, y fonksiyonunun üzerinde içi boş daireler şeklinde
gösterilmektedir.
Şekil 4.13‟ün (A) ile gösterilen parçası 𝑦 = 𝑓 𝑥 fonksiyonunu modelleyebilmesi
için 4 adet x değeriyle eğitilen YSA‟nın ürettiği tahmin değerlerini göstermektedir.
Bu şekilde eğitilen ağın ürettiği tahmin değerleri y fonksiyonunu açıklayabilmekten
çok uzak kalmış ve y fonksiyonunu genellemeyi başaramamıştır. Şeklin (B)
parçasında ise 𝑛1 = 20 örneklem (x değeri) ile eğitilen YSA’nın aynı fonksiyon
için ürettiği tahmin değerleri gösterilmiştir. 20 adet x değeri ile eğitilen ağ,
fonksiyonu mükemmel bir şekilde modelleyebilmektedir.
Sonuç olarak örneklem hacminin 4‟den 20‟ye yükseltilmesi, ağın 𝑦 = 𝑓 𝑥
fonksiyonunu öğrenerek genelleyebilmesini sağlamıştır.
İkinci aşamada gizli katman sayısının, öğrenme ve genelleme üzerindeki etkileri
araştırılacaktır. Bunun için Şekil 4.14 kullanılacaktır.
ġekil 4.14: Gizli katman sayısının öğrenme ve genelleme üzerindeki etkisi.
Şekil 4.14‟ün (A) ile simgelenen parçasında, 5 adet gizli katman içeren ileri
beslemeli bir geri yayılma ağının
𝑦=𝑓 𝑥
fonksiyonunu modellenmesi için
𝑛1 = 12 hacmindeki veri ile eğitildiği durum gösterilmiştir. Şekilde kesikli çizgi ile
ifade edilen fonksiyon, ağa öğretilmek istenilen fonksiyonun 𝑦 = 𝑓 𝑥
gerçek
değeriyken, sürekli çizgi ile gösterilen fonksiyon yapay sinir ağının y fonksiyonu için
vermiş olduğu tahmin değerlerini (𝑦) ifade etmektedir. Yapay sinir ağının eğitimi
için kullanılan örneklem, y fonksiyonunun üzerinde içi boş daireler şeklinde
gösterilmektedir.
75
Şekil 4.14‟ün (B) kısmında yer alan ileri beslemeli ağ ise 20 adet gizli katman içeren
ileri beslemeli bir geri yayılma ağıdır. Bu YSA, şeklin (A) kısmında gösterilen ve
𝑛1 = 12 hacmindeki veri ile eğitilen YSA ile aynı örneklem kullanılarak eğitilmiştir.
Kısaca (A) ve (B) ile gösterilen her iki YSA da aynı örneklem hacmi ve örneklerle
eğitilmiştir. İki YSA’nın arasındaki tek fark, mimarilerinde kullanılan gizli katman
sayısıdır.
Şekil 4.14‟e göre, (B) kısmındaki ağın mimarisinde gerekenden fazla gizli katman
kullanıldığı için, ağın genelleme yeteneği ortadan kalkmıştır. Şekil 4.14‟ün (B)
parçasında gösterilen YSA, eğitim seti için kullanılan 12 hacmindeki örneklemin x
değerlerine karşılık gelen y değerlerini çok iyi bir şekilde tahmin edebilmesine
rağmen, daha önce hiç karşılaşmadığı test veri setindeki x değerlerine karşılık gelen
y değerlerini etkin bir şekilde tahmin edememiştir.
4.3.6.8 ÇKA ağlarında kullanılacak verilerin ölçeklendirilmesi
Girdi ve çıktıların ölçeklendirilmesi (normalizasyonu), ağın performansını yakından
etkileyen bir faktördür. Ölçeklendirme, örnek değerlerinin dağılımını düzenli hale
getirir. Problem için örnekler toplanırken, farklı ölçekler kullanılan ortamlardan
toplanmış olabilir. Bu durumda hepsinin aynı ölçek üzerine indirgenmesi
gerekecektir. Bazı durumlarda da problemin girdileri arasında aşırı büyük veya
küçük değerler olabilir. NET girdiler hesaplanırken bu değerler, aşırı büyük ve küçük
değerlerin doğmasına sebep olarak ağı yanlış yönlendirebilir. Bütün girdilerin belirli
aralıkta (çoğunlukla 0-1 aralığında) ölçeklendirilmesi hem farklı ortamlardan gelen
bilgilerin aynı ölçek üzerine indirgenmesine hem de yanlış girilen değerlerin
etkisinin ortadan kalkmasına yardımcı olur (Öztemel, 2003).
Ölçeklendirme değişik şekillerde yapılmaktadır. Bazı araştırmacılar girdi vektörünü
normalize etmektedirler. Yani her değeri girdi vektörünün değerine bölerek yeni
değerleri bulmaktadırlar. Formülizasyonu aşağıda verilmektedir.
𝑥′ =
𝑥
(4.61)
𝑋
Burada 𝑥 girdi değerini, 𝑥 ′ ölçeklendirilmiş yeni girdi değerini, 𝑋 ise girdi
vektörünün büyüklük değerini göstermektedir (Öztemel, 2003).
Ölçeklendirme için bir diğer yol ise (4.62)‟de verilmektedir.
76
𝑥′ =
𝑥−𝑥 𝑚𝑖𝑛
(4.62)
𝑥 𝑚𝑎𝑥 −𝑥 𝑚𝑖𝑛
Burada 𝑥 girdi değerini, 𝑥 ′ ölçeklendirilmiş yeni girdi değerini, 𝑥𝑚𝑎𝑥 girdi setindeki
en büyük değeri, 𝑥𝑚𝑖𝑛 ise girdi setindeki en küçük değeri göstermektedir.
Verilen yöntemler ile birlikte üzerinde durulması gereken nokta, ölçeklendirmede
hangi yöntemin kullanılacağından çok girdiler içerisindeki olumsuzlukları giderecek
şekilde ölçeklendirme yapmaktır. Her problem için farklı bir ölçeklendirme yöntemi
olabileceği gibi problem çözücü kullanacağı yaklaşımı kendisi de geliştirebilir
(Öztemel, 2003).
77
78
5. TALEP TAHMĠNĠ UYGULAMASI
Talep tahmini uygulaması, Türkiye‟de gelişmekte olan temizlik kâğıdı sektörü yıllık
satış verilerinden yola çıkılarak yapılmıştır. Temizlik kâğıdı satışını etkileyen
faktörlerin belirlenmesi aşamasında uzman görüşü olarak Türkiye Selüloz ve Kağıt
Sanayii Vakfı yöneticileri, Lila Kağıt Tic. A.Ş. Genel Müdür, Satış ve Pazarlama
Müdürü‟nün görüşlerine başvurulmuştur.
İlerleyen kısımlarda temizlik kâğıdı yıllık talep tahmini probleminin çözüm
aşamaları verilmiştir. Yapay sinir ağları ile yapılan tahmin, çoklu regresyon analizi
ile karşılaştırılarak tahminleme performansı test edilmiştir.
5.1 Talep Tahmini Probleminin Tanımlanması
Bu çalışma ile Türkiye‟de tuvalet kâğıdı, kâğıt havlu, peçete ve mendil gibi tüketim
malzemelerinin yer aldığı temizlik kâğıdı yıllık satışlarının yapay sinir ağları
kullanılarak tahmin edilmesi ve bu ürün grubunun talebini etkileyen faktörlerin
belirlenmesi amaçlanmaktadır.
Türkiye Selüloz ve Kâğıt Sanayi Vakfı yöneticileri, Lila Kağıt Tic. A.Ş. Genel
Müdür, Satış ve Pazarlama Müdürü ile yapılan görüşmelerde sektöre olan talebi
etkileyen parametrelerin aşağıdaki gibi olduğu tespit edilmiştir.
Üretim Miktarı: Temizlik kâğıdı sektörünün büyüyen bir pazar olduğu ve temizlik
alışkanlıklarının değişmesi ile birlikte üretim kapasitesi artışının satışı arttıracağı
öngörülmektedir.
İthalat Miktarı: Üretim miktarı ile birlikte pazara sunulan hacmi arttıracağından
ithalat tonajının da yıllık talebi olumlu etkileyeceği düşünülmektedir.
Kâğıt ve Basım Sanayi Toptan Eşya Fiyat Endeksi (TEFE): Makro ekonomik bir
gösterge olarak TEFE‟nin temizlik kâğıdı satışlarına etkisi olduğu düşünülmektedir.
Gayrı Safi Yurtiçi Hâsıla: Gayrı Safi Yurtiçi Milli Hâsıla‟nın halkın alım gücünü
arttırmasıyla temizlik kâğıdı satışlarını da etkilediği düşünülmektedir.
79
Genel Nüfus: Nüfusun yıllara göre artışının temizlik kâğıdı tüketimini dolayısıyla
satışını arttırdığı düşünülmektedir.
Kent Nüfusu: Genel nüfusun yanı sıra kentlileşme oran artışının alışkanlıkları da
değiştirmesi sebebiyle temizlik kâğıdına olan talebe olumlu etkisinin olduğu
düşünülmektedir.
Okuryazar Oranı: Bilinç ve gelişmişlik göstergesi olarak okuryazar oranı artışının
kişi başı temizlik kâğıdı kullanım oranını arttırdığı düşünülmektedir. Bu tezi
desteklemesi için, 2009 verilerine göre ABD‟de yıllık kişi başına düşen temizlik
kâğıdı tüketiminin 25 kg iken Türkiye‟de bu rakamın 2,5 kg olması gösterilebilir.
1981-2010 arasında yıllık bazda veriler toplanmış, 1981-2009 arasındaki veriler
eğitim amaçlı 2010 yılı verisi ise test amaçlı kullanılmıştır. Veriler girdi ve çıktı
verileri olarak aşağıdaki gibi toplanmıştır:
Girdi verileri olarak aşağıdaki yedi veri toplanmıştır:
1. Üretim Miktarı: 1981-2010 yılları arasında temizlik kâğıdı grubunda üretim
miktarı ton/yıl bazında toplanmıştır. (Çizelge A.1)
2. İthalat Miktarı: 1981-2010 yılları arasında temizlik kâğıdı grubunda ithalat
miktarı ton/yıl bazında toplanmıştır. (Çizelge A.2)
3. Kâğıt ve Basım Sanayi Toptan Eşya Fiyat Endeksi (TEFE): 1981-2010 yılları
arasındaki TEFE değerleri (1981=100) endeksine göre toplanmıştır. (Çizelge A.3)
4. Gayrı Safi Yurtiçi Hâsıla: 1981-2010 yılları arasında kişi başına düşen yıllık
gayrı safi yurtiçi hâsıla değerleri TL/yıl bazında toplanmıştır. (Çizelge A.4)
5. Genel Nüfus: 1981-2010 yılları arasında yıllık nüfus verileri TÜİK aracılığıyla
toplanmıştır. (Çizelge A.5)
6. Kentli Nüfus: 1981-2010 yılları arasında yıllık toplam kent nüfusu verileri TÜİK
aracılığıyla toplanmıştır. (Çizelge A.6)
7. Okuryazar Oranı: 1981-2010 arasında okuryazar oranı verileri yıllık bazda
toplanmıştır. (Çizelge A.7)
Çıktı verisi olarak 1981-2010 arasında temizlik kağıdı grubuna giren tuvalet kağıdı,
kağıt havlu, peçete ve mendil satış miktarı yıllık ton bazında verilmiştir. (Çizelge
A.8)
80
Girdi ve çıktı değerleri ağa verilmeden önce normalize edilmelidir. Verileri [0 1]
aralığı yerine [0.1 0.9] aralığına gelecek şekilde normalleştirmek yapay sinir
ağlarında etkin kullanılan bir yöntemdir. (Tang ve Fishwick, 1993)
Çalışmadaki veriler 0.1 ile 0.9 değerleri arasında normalleştirilmiştir. Normalizasyon
işlemi bir X verisi için aşağıdaki şekilde formül kullanılarak gerçekleştirilmiştir. 𝑋′
normalize değer; 𝑋𝑖 gerçek değer olmak üzere;
𝑋−min 𝑋 𝑖
𝑋 𝑖 −min 𝑋 𝑖
𝑋 ′ = 𝑚𝑎𝑘
∗ 0,8 + 0,1
(5.1)
5.2 Yapay Sinir Ağı Mimarisi
Talep tahmininde en çok kullanılan yöntem Çok Katmanlı Algılayıcılar (geri yayılım
algoritması) yöntemidir. Talep tahmininde ağırlıkların fonksiyonu olarak da en
yaygın kullanılan sigmoid fonksiyonudur. Bu çalışmada öğrenme için Çok Katmanlı
Algılayıcı yöntemini ve sigmoid fonksiyonunu kullanılan bir program olan EasyNN
programı seçilmiştir.
1981-2009 arasındaki 29 adet veri, ağın eğitimi amaçlı kullanılmıştır. Bunlardan 24
tanesi eğitim, 5 tanesi doğrulama için seçilmiştir. Yapay sinir ağ yapısı için birçok
talep tahmininde kullanıldığı gibi biri gizli katman olmak üzere üç katmanlı yapı
seçilmiştir. Girdi katmanı 7 hücreden, çıktı katmanı ise 1 çıktı hücreden
oluşmaktadır. Gizli katmanda ise herhangi bir sayıda hücre bulunabilir ancak
genellikle girdi sayısının iki katını geçmez (Denton, 1995).Yapay sinir ağ yapısında
gizli katmandaki hücre sayısının belirlenmesinde piramit kuralı denilen bir yöntem
kullanılır. Piramit kuralı, hücre sayısının bir piramide benzer şekilde girdilerden
çıktılara doğru azalması gerektiği varsayımına dayanır. Girdi hücre sayısının n ve
çıktı hücre sayısının m olduğu bir yapay sinir ağı için geometrik piramit kuralına
göre gizli hücre sayısı;
𝑚∗𝑛
(5.2)
denklemi ile elde edilir. (Yoon ve diğ.,1993).
Çalışmada girdi hücre sayısı 7, çıktı hücre sayısı 1 olduğu için parametrelerin
belirlenmesi aşamasında ilk denemeler için,
7 ∗ 1 ≈ 3 değeri kabul edilmiştir.
Daha sonra 1 hücre sayısından girdi sayısının 2 katı olan 14 hücreye kadar deneme
yapılmıştır.
81
5.2.1 Momentum katsayısının belirlenmesi
Momentum katsayısı da öğrenmenin performansını etkiler. Momentum katsayısı bir
önceki iterasyondaki değişimin belirli bir oranının yeni değişim miktarına
eklenmesidir. Momentum katsayısı yerel çözümlere takılan ağların bir sıçrama ile
daha iyi sonuçlar bulmasını sağlar. Bu değerin küçük olması yerel çözümlerden
kurtulmayı zorlaştırırken çok büyük olması tek bir çözüme ulaşmakta sorun
çıkartabilir. Tecrübeler bu değerin 0.6-0.8 arasında seçilmesinin uygun olacağını
göstermektedir. (Öztemel, 2003). Öğrenme katsayısı programın varsayılan değeri
olan 0,60 bırakılarak, 1000 çevrim için momentum katsayıları değiştirilerek en
uygun momentum katsayısı bulunmaya çalışılmıştır. Aşağıdaki tabloda 2010 yılı
verileri için gerçekleşen değerler ile momentum katsayısının farklı değerlerine göre
tahmin edilen değerler kıyaslanmıştır. Buna göre en uygun momentum katsayısının
0,6 olacağına karar verilmiştir.
Çizelge 5.1: Momentum katsayısının farklı değerleri için tahmin değerleri.
5.2.2 Öğrenme katsayısının belirlenmesi
Öğrenme katsayısının belirlenmesi de ağın öğrenme performansı açısından oldukça
önemlidir. Öğrenme katsayısı ağırlıkların değişim miktarını belirler ve eğer büyük
değerler seçilirse yerel çözümler arasında ağın dolaşması, küçük değerler seçilirse
öğrenme zamanının artması söz konusu olur. Tecrübeler genellikle 0.2- 0.4
arasındaki değerlerin kullanıldığını göstermektedir (Öztemel, 2003). Momentum
katsayısı 0,6 alınarak 1000 çevrim için öğrenme katsayıları değiştirilerek en uygun
öğrenme katsayısı bulunmaya çalışılmıştır. Aşağıdaki tabloda 2010 yılı verileri için
gerçekleşen veriler ile öğrenme katsayılarının farklı değerlerine göre tahmin edilen
veriler kıyaslanmıştır. Bu çalışma için en uygun öğrenme katsayısının 0,5 olduğu
görülmüştür.
82
Çizelge 5.2: Öğrenme katsayısının farklı değerleri için tahmin değerleri.
5.2.3 Çevrim sayısının belirlenmesi
Belirli bir iterasyondan sonra ağın öğrenmesinin durduğu gözlemlenir. Bu durum
ağın daha fazla öğrenemeyeceği ve daha iyi bir sonuç bulamayacağı anlamına gelir.
(Öztemel, 2003) Momentum katsayısı 0.6, öğrenme katsayısı 0.5 alınmış, çevrim
sayıları değiştirilerek en uygun çevrim sayısı bulunmaya çalışılmıştır. Aşağıdaki
tabloda 2010 yılı verileri için gerçekleşen veriler ile çevrim sayısının farklı
değerlerine göre tahmin edilen veriler kıyaslanmıştır. Öncelikle çevrim sayıları
250‟şer artırılmıştır. En uygun çevrim sayısının 250 civarında olduğu görülmektedir.
Çizelge 5.3: Çevrim sayısının farklı değerleri için tahmin değerleri.
Daha net değeri bulabilmek için çevrim sayısı değerleri 250 civarında 50‟şer
arttırılmıştır. Bu durumda da en uygun çevrim sayısı değerinin 250 olduğu
görülmüştür.
Çizelge 5.4: Çevrim sayısının farklı değerleri için tahmin değerleri.
83
5.2.4 Gizli hücre sayısının belirlenmesi
Momentum katsayısı 0.6, öğrenme katsayısı 0.5 ve 250 çevrim ile gizli hücre sayısı
1‟den giriş hücre sayısının iki katı olan 14‟e kadar deneme yapılmıştır. En iyi hücre
sayısının 3 olduğu görülmüştür.
Çizelge 5.5: Gizli hücre sayısının farklı değerleri için tahmin değerleri.
5.3 Yapay Sinir Ağının Eğitilmesi
Ağın eğitilmesi için EasyNN programı kullanılmıştır. Parametreler ise aşağıdaki
şekilde oluşturulmuştur.
Çizelge 5.6: Yapay sinir ağı katman ve hücre sayısı.
Girdi Hücre Sayısı
7
Çıktı Hücre Sayısı
1
Gizli Katman Sayısı
1
Gizli Hücre Sayısı
3
Eğitim Veri Sayısı
24
Test Veri Sayısı
5
ġekil 5.1: EasyNN programı katman ve hücre sayısının tanımlanması.
84
Çizelge 5.7: Yapay sinir ağı parametreleri.
Momentum Katsayısı
0,6
Öğrenme Katsayısı
0,5
Çevrim Sayısı
250
Hata Oranı
1%
ġekil 5.2: EasyNN programı parametre tanımlama ekranı.
Kullanılan ağ yapısı aşağıdaki gibi oluşturulmuştur.
ġekil 5.3: Kullanılan ÇKA ağ yapısı.
85
Ağın öğrenme grafiği Şekil 5.4‟te verilmektedir.
ġekil 5.4: Öğrenme grafiği.
Ağın tahmin grafiği ise aşağıdaki gibi gerçekleşmiştir.
ġekil 5.5: Tahmin grafiği.
86
5.4 Sonuçların Test Edilmesi ve Değerlendirilmesi
Ağın eğitilmesinin ardından 2010 yılı gerçekleşen satış değeri ile tahmin edilen değer
karşılaştırılmıştır. Buna göre % 98,89 başarıyla 2010 yılı toplam satış değeri tahmin
edilebilmiştir.
Çizelge 5.8: 2010 yılı gerçekleşen ve tahmin edilen değerlerin kıyaslanması.
Gerçekleşen Değer
Tahmin Edilen Değer
0,9
0,89
Normalleştirilmiş Değer
Hata%
1,11%
Gerçek Satış
Değeri(ton)
335774
331636
Karşılaştırma amacıyla tahmin edilen en iyi değere yakın ağ yapılarının
performanslarına baktığımızda aşağıdaki sonuçları elde edebiliriz.
Çizelge 5.9: Çevrim Sayısı=1000‟e göre gerçekleşen/tahmin edilen değerler.
Varsayımlar
Normalleştirilmiş Değer
Momentum Katsayısı
0,6
Öğrenme Katsayısı
0,5
Çevrim Sayısı
1000
Gizli Hücre Sayısı
3
Gerçekleşen Değer
Tahmin Edilen Değer
0,9
0,889
Gerçek Satış
Değeri(ton)
Hata%
1,22%
335774
331222
Çizelge 5.10: Gizli hücre sayısı=12‟ye göre gerçekleşen/tahmin edilen değerler.
Varsayımlar
Normalleştirilmiş Değer
Momentum Katsayısı
0,6
Öğrenme Katsayısı
0,5
Çevrim Sayısı
250
Gizli Hücre Sayısı
12
Gerçekleşen Değer
Tahmin Edilen Değer
0,9
0,8876
Gerçek Satış
Değeri(ton)
Hata%
1,38%
335774
330643
87
Çizelge 5.11: Gizli hücre sayısı=2‟ye göre gerçekleşen/tahmin edilen değerler.
Varsayımlar
Momentum Katsayısı 0,6
Normalleştirilmiş Değer
Öğrenme Katsayısı
0,5
Çevrim Sayısı
250
Gizli Hücre Sayısı
2
Gerçekleşen Değer
Tahmin Edilen Değer
0,9
0,887
1,44%
Gerçek Satış
Değeri(ton)
Hata%
335774
330395
Temizlik kâğıdı yıllık satış miktarı, belirlenen parametrelere göre tahmin edilmek
istendiğinden bu noktada duyarlılık analizi devreye girmektedir. Duyarlılık analizi,
verideki değişmenin sonuç üzerinde
yarattığı değişimin
izlenmesi olarak
tanımlanabilir. EasyNN programında girdi değerlerinin tamamı medyan değerlerine
ayarlandıktan sonra bir veri en küçük değerden en büyük değere kadar değiştirilerek çıktı
üzerindeki değişimi ölçülmektedir.
Temizlik kağıdı için talebin girdi parametre değerlerine göre duyarlılığı Şekil 5.6‟da
verilmektedir.
ġekil 5.6: Duyarlılık analizi.
Girdi parametrelerinin önem dereceleri ise Şekil 5.7‟de verilmektedir.
88
ġekil 5.7: Girdi parametrelerinin önem dereceleri.
Temizlik kâğıdı yıllık satış miktarını en çok etkileyen parametrenin üretim kapasitesi
ve miktarı olduğu görülmektedir. Üretim miktarının minimum ve maksimum
değerleri ile yıllık satış miktarı arasında pozitif bir uyum olduğu söylenebilir. Yani
üretim miktarının yıllara göre artışı temizlik kâğıdı satışlarını da arttırmaktadır. Bu
durum, Türkiye‟ye temizlik kâğıdı pazarının henüz doymamış bir pazar olması ve
dünya tüketim ortalaması ile karşılaştırıldığında kat edilecek çok yol olması ile
açıklanabilir.
Üretim miktarından sonra ithalat miktarı duyarlılıkta ikinci önemli parametre olarak
görülmektedir. Bu durum da, üretim miktarı ile birlikte pazara giren toplam tonajı
arttırdığından satış miktarı ile pozitif bir uyum göstermesi beklenen bir durumdur.
Diğer parametrelerin duyarlılıktaki etki dereceleri göreli olarak üretim ve ithalat
miktarına göre daha az olmak ile birlikte okur-yazar oranının bilinç ve alışkanlık
değişimi göstergesi olarak temizlik kâğıdı satışlarını olumlu yönde etkilediği
görülmektedir. Bu çalışmaya başlanırken görüşüne başvurulan uzmanlar, özellikle
Doğu ve Güneydoğu Anadolu Bölgesi‟ndeki satışların 20 yıllık süreçte okuryazar
oranının artışından oldukça fazla etkilendiği yönde fikirlerini beyan etmişlerdi. Bu
durum, onları haklı çıkarmaktadır.
Genel nüfus artışının temizlik kâğıdı talep miktarını arttırması beklenen bir
durumdur. Nüfus artışı ile birlikte toplam kullanım miktarının artması pazarı ve
dolayısıyla talebi arttırıcı yönde etki yapmaktadır.
GSYİH değeri, yıllık makro bir gösterge olarak halkın alım gücünü göstermektedir.
GSYİH değerinin artması, duyarlılıkta beşinci etki düzeyinde olmak ile birlikte
temizlik kağıdı satışlarını arttırıcı yönde etki yaratmaktadır.
89
Kâğıt ve basım sanayi toptan eşya fiyat endeksi (TEFE)‟nin artışı üretime konu olan
maliyetler dolayısıyla fiyatlar genel seviyesinin artışını temsil ettiğinden normal
koşullar altında ilgili ürün grubunun satışını düşürücü yönde etkisi olacağı
düşünülmektedir. Ancak kâğıdın ana hammaddesi ve ana maliyet kalemi olan, ithal
selülozun
fiyat
artışlarının
pazardaki
rekabet
dolayısıyla
ürün
fiyatlarına
yansıtılamaması bu genellemenin piyasa koşullarında uygulanabilir olmadığını
göstermektedir. Bu durum da, TEFE‟nin temizlik kâğıdı talep miktarının değişimine
duyarlılık anlamında az etki göstermesi ile paralellik arz etmektedir.
Son olarak kentli nüfusun temizlik kâğıdı satışlarına etkisine bakıldığında pozitif
yönde ancak düşük duyarlıkta etki yarattığı söylenebilir. Bu durumun sebebinin,
temizlik kağıdı talep değişkenliğinin daha yüksek oranda genel nüfus değişimi ile
açıklanması ve bu nedenle kentli nüfusun daha az etki yaratması olarak gösterilebilir.
5.5 YSA Yönteminin Diğer Talep Yöntemleriyle KarĢılaĢtırılması
Gerçek veriler kullanılarak aşağıdaki yöntemler ile talep tahmini yapılarak sonuçlar
karşılaştırılmıştır.
5.5.1 Basit regresyon yöntemiyle talep tahmini
Basit regresyon yöntemi kullanılarak sadece geçmiş satış verilerinden yola çıkılarak
tahmin yapılması sağlanmıştır. Bağımsız değişken (X) yıl olmak üzere 𝑌 = 𝑎0 +
𝑎1 𝑋 denklemindeki katsayılar aşağıdaki şekilde bulunmuştur.
Çizelge 5.12: Basit regresyon modeli ağırlık değerleri.
a0
-1,68E+07
Toplam Satış
a1
8461,748
Hesaplanan ağırlıklara göre 2010 yılı tahmin edilerek gerçekleşen değer ile
karşılaştırılmıştır. Buna göre 2010 yılı temizlik kâğıdı talebinin tahmin edilmesinde
%61,98 başarı elde edilmiştir.
Çizelge 5.13: Basit regresyon modeline göre tahmin/gerçekleşen kıyaslaması.
Tahmin
Gerçekleşen Değer Edilen
Hata%
Başarı %
38,020%
61,980%
Değer
Toplam Satış Değeri(ton) 335774
208113
90
5.5.2 Çoklu regresyon yöntemiyle talep tahmini
Çoklu regresyon analizinde öncelikle tüm parametrelerin bağımsız değişken olarak
yer aldığı Model-1 analiz edilmiş; sonrasında YSA duyarlılık analizinde en etkili
girdiler olarak belirlenen üretim ve ithalat miktarlarının bağımsız değişken olarak yer
aldığı Model-2 çalıştırılmıştır.
X girdi verilerini (bağımsız değişkenler) ve Y çıktı verisini (bağımlı değişken)
temsil etmek üzere;
𝑎0 = sabit değer
𝑋1 = üretim miktarı
𝑋2 = ithalat miktarı
𝑋3 = TEFE
𝑋4 = GSYİH
𝑋5 = Genel Nüfus
𝑋6 = Kentli Nüfus
𝑋7 = Okuryazar oranı
Y = a0 + a1 X1 + a2 X2 + a3 X3 + a4 X4 + a5 X5 + a6 X6 + a7 X7
(5.3)
formülüne göre SPSS 18.0 istatiktik programı kullanılarak bulunan ağırlıklar
aşağıdaki gibidir.
Çizelge 5.14: Model-1 regresyon analizi ağırlıkları.
Çizelge 5.15: Model-2 regresyon analizi ağırlıkları.
Toplam Satış
a0
-3552,739
a1
0,829
a2
0,313
Model-1 ve Model-2 çalıştırılarak çoklu regresyon analizi sonucu çıkan ağırlıklar
kullanılarak 2010 yılı tahmin edilmiş ve gerçekleşen verilerle aşağıdaki tabloda
kıyaslanmıştır. Model-1‟e göre tüm parametrelerin Çizelge 5.11‟deki ağırlıklar ile yer
aldığı denklem kullanılarak 2010 yılı tahmini %92,985 başarı ile gerçekleştirilmiştir.
91
Bunun yanı sıra, sadece üretim miktarı ve ithalat miktarı bağımsız değişkenlerinin yer
aldığı Model-2‟ye göre yapılan 2010 yılı tahmin başarı oranı %91,742 çıkmıştır.
Çizelge 5.16: Regresyon analizi ile tahmin edilen değerlerin gerçek değer ile
karşılaştırılması.
92
6. SONUÇ VE DEĞERLENDĠRME
Bu çalışma özellikle talep tahmininde uygulanan bir yöntem olan yapay sinir
ağlarının parametreye bağlı tahminde etkin sonuçlar verdiğini göstermek amacıyla
hazırlanmıştır. Türkiye‟de alışkanlıkların değişmesi ve çeşitli faktörlerin de etkisiyle
gelişmekte olan bir sektör olan temizlik kâğıtları alanında son 30 yılın verilerinden
yola çıkılarak talep tahmini yapılmaya çalışılmıştır.
1981-2010 yılları arasında yıllık temizlik kâğıdı satış verileri ton bazında
toplanmıştır. Yıllık satışları etkileyen faktörler, çalışma öncesinde görüşülen uzman
kişiler ve yapılan araştırmalar neticesinde ortaya konulmuş, gerekli bilgiler çeşitli
kurum kaynaklarından (TÜİK, SKSV vb.) elde edilmiştir. Toplanan veriler, (0.1 0.9)
aralığında normalleştirilerek eğitim ve test amacıyla ağa sunulmuştur.
Yapay sinir ağlarının uygun mimarisini elde etmek için kaynaklardan yararlanmakla
birlikte parametreler analiz edilmiş ve en uygun ağ mimarisi bulunmuştur. 1981-2009
yılları arasındaki veriler ağın eğitilmesi ve doğrulama yapılması için kullanılmış, 2010
ise sonucun testi için ayrılmıştır. Yapılan tahmin sonucunda %1,11‟lik bir hatayla
%98,89 başarı elde edilmiştir.
Ayrıca tahmin performansının ölçülmesi amacıyla basit ve çoklu regresyon modelleriyle
de talep tahmini yapılmıştır. Basit regresyon modelinde temizlik kâğıdı talebinin yıllara
göre değiştiği varsayımından yola çıkılarak bağımsız değişken, zaman olarak alınmıştır.
Bu model ile yapılan tahmin sonucunda %61,89‟luk bir başarı elde edilmiştir. Çoklu
regresyonda iki model oluşturularak başarı test edilmek istenmiştir. Model-1‟de YSA
ağında girdi hücresi olarak alınan tüm faktörler bağımsız değişken olarak kabul edilmiş
olup yapılan tahmin neticesinde %92,985‟lik başarı elde edilmiştir. Model-2‟de ise
YSA‟da yapılan duyarlık analizi sonucunda en etkili faktörler olarak çıkan üretim
miktarı ve ithalat miktarı değerleri bağımsız değişken olarak alınıp talep tahmini
yapılmıştır. Bu model ile yapılan tahmin sonucunda ise %91,74 başarı elde edilmiştir.
Çoklu regresyon analizi yapılırken bağımsız değişkenler arasında korelasyon
olmadığı varsayımı yapılmıştır. Basit regresyon modelinde ise talebin sadece
zamandaki değişimden etkilendiği varsayılmıştır. Yapay sinir ağları modelinde ise
93
herhangi bir varsayıma ihtiyaç duyulmadan veriler arasındaki ilişkileri ve ağırlıkları ağın
kendisi öğrenmiştir. Yapılan tahmin sonucunda da en başarılı sonucu ortaya çıkarmıştır.
Bu çalışma makro seviyede Türkiye‟deki toplam temizlik kağıdı talebinin değişimini
yıllık bazda almıştır. Bu konu ile ilgili kurumların yapmış olduğu çalışmalarda veriler
yıllık analiz edildiğinden toplam bazda aylık verilere ulaşılamamıştır. Ayrıca 1980
öncesinin
verilerine
sağlıklı
bir
şekilde
ulaşılamadığı
için
zaman
aralığı
sınırlandırılmıştır. Çalışmanın geliştirilmesi ve detaylandırılması için veriler aylık bazda
ve daha geniş bir tarih aralığını kapsayacak şekilde derlenmelidir. Makro parametreler,
temizlik kağıtları sektöründe şirket bazında talep tahmini yaparken de dikkate alınmalı
ve bu sayede modelin genelden özele indirgenmesi sağlanmalıdır. Ayrıca yapay sinir
ağlarında model parametrelerinin bulunması aşamasında yapılan denemelerin sayısı ve
hassasiyeti arttırılarak ilgili aralıklarda daha az tahmin hatası içeren sonuçlara
ulaşılabilir.
94
KAYNAKLAR
Adıyaman, F., 2007. Talep Tahmininde Yapay Sinir Ağlarının Kullanılması, Yüksek
Lisans Tezi, İTÜ Fen Bilimleri Enstitüsü, İstanbul.
Aksoy, S. Z., 2008. Kurumsal Kaynak Planlaması Yazılımlarında Talep Tahmin
Yöntemleri ve Uygulamaları, Yüksek Lisans Tezi, İstanbul
Üniversitesi Fen Bilimleri Enstitüsü, İstanbul.
Anderson, D., and McNeill, G., 1992: Artificial Neural Networks Technology.
Kaman Sciences Corporation, New York.
Anderson, D. R., Sweeney, D. J., and Williams, T. A., 2005: An Introduction to
Management Science. BookMasters Inc., USA.
Armstrong, J., 2001: Principles of Forecasting: A Handbook for Researchers and
Practitioners. Kluwer Academic Publishers, Hingham, MA.
Bircan, H. ve Karagöz, Y., 2003: Box-Jenkins Modelleri ile Aylık Döviz Kuru
Tahmini Üzerine Bir Uygulama. Kocaeli Üniversitesi Sosyal Bilimler
Enstitüsü Dergisi, (6), pp.49-62.
Bolt, G., 1994: Market and Sales Forecasting : a total approach. Kogan Page,
Londra.
Box, G. E. P., and Jenkins, J. M., 1976: Time Series Analysis: Forecasting and
Control. Holden-Day, San Francisco, CA.
Broomhead, D., and Lowe, S., 1988. Radial Basis – Functions, Multi – Variable
Functional Interpolation and Adaptive Networks, Royal Signals and
Radar Establishment Memorandum, No.4148.
Chatfield, C., 2000: Time-series forecasting. Chapman & Hall/CRC, USA.
Chaudhury, A., Stahl, D. O., and Whinston, A. B., 1994: The Economic
Foundation for Neural Computing Systems in, Advances in AI in
Economics, Finance and Management. Eds. Johnson J.D.. Whinston
A.B.. JAI Pres Inc.
Crochat, P., and Franklin, D., 2003: Backpropagation Neural Network Tutorial.
Fromhttp://ieee.uow.edu.au/~daniel/software/libneural/BPN_tutorial/
BPN_English/BPN_English/
Çelik, B., 2008. Yapay Sinir Ağları Metodolojisi İle Zaman Serisi Analizi: Teori ve
Uygulama, Yüksek Lisans Tezi, Marmara Üniversitesi Sosyal Bilimler
Enstitüsü, İstanbul.
Çorumluoğlu Ö., ve Özbay Y., 2005. GPS Yüksekliklerinden Ortometrik
Yüksekliklerin Elde Edilmesinde Yapay Sinir Ağı (YSA) Tekniğinin
Kullanımı, İTÜ Har. ve Kad. Müh.Odası, Mühendislik Ölçmeleri STB
Komisyonu 2. Mühendislik Ölçmeleri Sempozyumu, İTÜ, İstanbul, 2325 Kasım.
95
Dalkey, N. C., 1972: Studies In the Quality Of Life: Delphi and Decision Making.
Lexington Books, Lexington, MA.
Data and Analysis Center for Software , 1992. Detailed Artificial Neural Networks
Technology,
Network
Selection,
F30602-89-C-0082,
from
https://www.dacs.dtic.mil/techs/neural/neural6.php
Denton, J. W., 1995: How good are neural networks for casual forecasting?. The
Journal of Business Forecasting Methods&Systems, vol.14, no.2 ,
pp.17.
Efe M. Ö., ve Kaynak O., 2000: Yapay Sinir Ağları ve Uygulamaları. Boğaziçi
Üniversitesi Yayınevi, İstanbul.
Elmas Ç., 2003: Yapay Sinir Ağları (Kuram, Mimari, Eğitim, Uygulama). Seçkin
Yayıncılık, Ankara.
Eski, H., ve Armaneri, Ö., 2006: Mühendislik Ekonomisi. Gazi Kitabevi, Ankara.
Farley, B. G., and Clark, W. A., 1954: Simulation of Self - Organizing Systems by
Digital Computers. IEE Transactions of Professional Group of
Information Theory, (PGIT-4), pp.76-84.
Fausett, L., 1994: Fundamentals of Neural Networks. Prentice Hall, USA.
Hansel, D., Mato, G., and Meunier, C., 1992: Memorization Without
Generalization in a Multilayered Neural Network. Centre de Pysique
Theorique, Ecole Polytechnique, Europhysics Letters, vol.20, no.5,
pp.471–476.
Haykin, S., 1999: Neural Networks: A Comprehensive Foundation. Prentice Hall,
New Jersey.
Hebb, D.O., 1949: The Organization of Behaviour, A Neuropsychological Theory.
John Wiley & Sons Inc, New York.
Hoang P., 2006: Springer Handbook of Engineering Statistics. Springer- Verlag
London Limited, Germany.
Holt, C. C., 2004: Forecasting seasonals and trends by exponentially weighted
moving averages. International Journal of Forecasting, vol.20, no.1,
pp.5-10.
Hossein A., 1994. Time-Critical Decision Making for Business Administration,
University Of Baltimore, from http://home.ubalt.edu/ntsbarsh/statdata/Forecast.htm
Hyndman, R. J., Koehler, A. B., Snyder, R. D., and Simone G., 2002: A state
space framework for automatic forecasting using exponential
smoothing methods. International Journal of Forecasing, vol.18,
no.3, pp.439-454.
KeleĢoğlu Ö., Ekinci C.E., and Fırat A., 2005: The Using Of Artificial Neural
Networks In Insulation Computations. Journal of Engineering and
Natural Sciences, vol.3, pp.58-66.
Kobu, B., 1996: Üretim Yönetimi. Avcıol Basım-Yayın, İstanbul.
Kohonen, T., 1987: State Of The Art In Neural Computing. IEEE First International
Conference on Neural Networks, vol.1, pp.79-90.
96
Kohonen, T., 1972: Correlation Matrix Memories. IEEE Transactions on
Computers, vol.21, pp.353-359.
Kröse, B., and Smagt, P., 1996: An Introduction to Neural Networks, 8th.Edition.
The University of Amsterdam, Holland.
Kutay F., 1989: Zaman Serilerinde Kestirim Teknikleri ve Box-Jenkins Modelleri.
Gazi Üniversitesi Yayınları, Ankara.
Kutlar, A., 2000: Ekonometrik Zaman Serileri Teori ve Uygulama. Gazi Kitabevi,
Ankara.
Mackay, D. J. C., 2003: Information Theory, İnference and Learning Algorithms.
Cambridge University Press, UK.
Makridakis, S., Wheelwrıght S.C., and McGee V. E., 1998: Forecasting: Methods
and Applications. John Wiley & Sons Inc., USA.
Mann, P. S., 1995: Statistics for Bussiness and Economics. John Wiley & Sons Inc,
USA.
Moon, M., A., Mentzer, J., T., Smith, C., D., and Garver, M., S., 1998: Seven
Keys to Better Forecasting. Business Horizons, vol. 41, no.5, pp.4452.
Moon, M., A., Mentzer, J., T., and Smith, C., D., 2003: Conducting A Sales
Forecasting Audit. International Journal of Forecasting, vol. 19, no.1,
pp.5-25.
Mehrotra K., Mohan C.K., and Ranka S., 1997: Elements of Artificial Neural
Networks. MIT Press, London.
Minsky, M., and Pappert, S., 1969: Perceptrons, An Introdution to Computatioanal
Geometry. MIT Press, Cambridge.
Orr G., Schraudolph N., and Cummins F., 1999. CS – 449 Neural Network,
Willamatte
University,
from
http://www.willamette.edu/~gorr/classes/cs449/intro.html
Önder, E., ve Hasgül, Ö., 2009: Yabancı Ziyaretçi Sayısının Tahmininde Box
Jenkins Modeli, Winters Yöntemi ve Yapay Sinir Ağlarıyla Zaman
Serisi Analizi. İstanbul Üniversitesi İşletme İktisadı Enstitüsü Dergisi,
sy.62, syf.42-63.
Öztemel, E., 2003: Yapay Sinir Ağları. Papatya Yayınevi, İstanbul.
Pardo, R., 1992: Design Testing and Optimization of Trading Systems, 1.Basım.
John Wiley & Sons Inc, USA.
Rosenblatt, B., 1958: The Perceptron : A Probabilistic Model for Information
Storage and Organization in the Brain. Psychoanalytic Review, no.65,
pp.386 -408.
Sağıroğlu ġ., BeĢdok E., ve Erler M., 2003: Mühendislikte Yapay Zeka
Uygulamaları I: Yapay Sinir Ağları. Ufuk Kitap Kırtasiye-Yayıncılık,
Kayseri.
Samarasinghe, S., 2006: Neural Networks for Applied Sciences and Engineering:
From Fundementals to Complex Pattern Recognition. CRC Pres,
USA.
97
Seaton A.V. and Bennet M. M., 1996: Marketing Tourism Products – Concepts,
Issues, Cases. International Thomson Business Pres, London.
Stevenson, W. J. 2005: Operations Management. McGraw-Hill Irwin, Boston.
Tang, Z., and Fishwick, P., 1993: Feed-Forward Neural Nets as Models for Time
Series Forecasting. ORSA Journal of Computing, vol.5, no.4, pp. 374386.
Tebelkis J., 1995. Speech Recognition using Neural Networks, Thesis (PhD), School
of Computer Science Carnegie Mellon University, Pennsylvania.
Tekin, M., 1996: Üretim Yönetimi. Arı Ofset Matbaacılık, Konya.
Tenti, P., 1996: Forecasting Foreign Exchange Rates Using Recurrent Neural
Networks. Applied Artificial Intelligence, vol.10, pp. 567-581.
Wei, W. W. S., 1990: Time Series Analysis: Univariate and Multivariate Methods.
Addison-Wesley Publishing Co. Inc., New York.
Widrow, B., and Hoff, M.E., 1960. Adaptive Switching Circuits, IRE WESCON
Convention Record, IV, pp. 96-104, August.
Yoon, Y., Swales, G., and Margavio, T.M., 1993: A Comparison of Discriminant
Analysis Versus Artificial Neural Networks. Journal of Operational
Research, vol.44, no.1, pp.51-60.
Yurtoğlu, H., 2005. Yapay Sinir Ağları ile Öngörü Modellemesi : Bazı
Makroekonomik Değişkenler İçin Türkiye Örneği, DPT Yayınları,
(DPT-2683), 8, Ankara.
Zhang, P. G., 2003: Neural Networks in Business Forecasting. Idea Group
Publishing, USA.
98
EKLER
EK A : Kullanılan Veriler
99
Çizelge A.1: Yıllık temizlik kâğıdı üretim miktarı (ton/yıl) (www.sksv.org.tr).
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
Üretim Miktarı (ton)
11300
10218
8153
14934
16789
22543
20119
22660
31669
37452
41520
60462
61008
57774
58466
65377
72199
79098
85311
108394
115597
146015
165714
167868
195472
238438
270668
322500
354205
372045
100
NormalleĢtirilmiĢ
Değerler
0,106918536
0,104539809
0,1
0,11490772
0,118985853
0,13163576
0,126306706
0,131892979
0,151698856
0,164412518
0,173355831
0,214998956
0,216199312
0,20908951
0,210610841
0,22580436
0,240802216
0,255969354
0,269628351
0,320375276
0,336210744
0,403083332
0,446390687
0,451126158
0,511812296
0,606271091
0,67712728
0,791077572
0,860779572
0,9
Çizelge A.2: Yıllık temizlik kâğıdı ithalat miktarı (ton/yıl) (www.sksv.org.tr).
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
Ġthalat Değerleri (ton)
0
0
0
1370
3368
950
0
1430
1112
1739
554
862
4747
4164
4014
2612
2078
2424
3643
5895
6145
8394
11991,68
14624
12818
16036
12392
7559
7840
10140
101
NormalleĢtirilmiĢ
Değerler
0,10000
0,10000
0,10000
0,16835
0,26802
0,14739
0,10000
0,17134
0,15548
0,18675
0,12764
0,14300
0,33682
0,30773
0,30025
0,23031
0,20367
0,22093
0,28174
0,39409
0,40656
0,51876
0,69824
0,82956
0,73946
0,90000
0,71821
0,47710
0,49112
0,60586
Çizelge A.3: Toptan eşya fiyat endeksi (1981=100) değerleri (www.tuik.gov.tr).
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
TEFE (1981=100)
100
136,9
187,2
275,2
391,1
536,2
783,3
1499,8
2545,7
3342,5
5853,2
10658,5
20512,4
41742,8
65126,4
87272,7
156563,2
232233,6
404517,7
543368,0
1038684,8
1282870,6
1304648,4
1361206,1
1281756,2
1596626,9
1458242,4
1629740,5
1628219,5
1735151,4
102
NormalleĢtirilmiĢ
Değerler
0,1
0,100017014
0,100040206
0,100080781
0,100134221
0,100201124
0,100315057
0,100645422
0,101127667
0,101495057
0,102652694
0,104868328
0,109411779
0,119200722
0,129982459
0,140193702
0,172142273
0,207032497
0,286469506
0,35049077
0,578872169
0,691461717
0,701503051
0,727580732
0,690947859
0,836128922
0,772322386
0,851396963
0,850695683
0,9
Çizelge A.4: Kişi başına düşen yıllık GSYİH değerleri (TL) (www.tuik.gov.tr).
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
KiĢi BaĢına
GSYĠH (TL)
1.158
1.170
1.198
1.247
1.268
1.327
1.422
1.421
1.394
1.487
1.472
1.531
1.624
1.508
1.588
1.671
1.803
1.830
1.720
1.761
1.601
1.704
1.775
1.904
2.037
2.134
2.251
2.237
2.101
2.259
107
NormalleĢtirilmiĢ
Değerler
0,10000
0,10855
0,12888
0,16446
0,17968
0,22266
0,29145
0,29069
0,27108
0,33900
0,32804
0,37076
0,43818
0,35386
0,41227
0,47235
0,56825
0,58792
0,50788
0,53787
0,42205
0,49625
0,54785
0,64192
0,73831
0,80899
0,89371
0,88411
0,78517
0,90000
Çizelge A.5: Yıllık genel nüfus değerleri (www.tuik.gov.tr).
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
Nüfus (x1000)
45.540
46.688
47.864
49.070
50.306
51.480
52.370
53.268
54.192
55.120
56.055
56.986
57.913
58.837
59.756
60.671
61.582
62.464
63.364
64.252
65.133
66.008
66.873
67.723
68.566
69.395
70.215
71.095
72.050
73.003
108
NormalleĢtirilmiĢ
Değerler
0,10000
0,13344
0,16770
0,20283
0,23883
0,27303
0,29896
0,32512
0,35203
0,37907
0,40630
0,43342
0,46043
0,48734
0,51411
0,54077
0,56731
0,59300
0,61921
0,64508
0,67075
0,69623
0,72143
0,74619
0,77075
0,79490
0,81879
0,84442
0,87224
0,90000
Çizelge A.6: Yıllık kent nüfusu değerleri (www.tuik.gov.tr).
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
Kentli Nüfus (x1000)
20821
22195
23626
25114
26865
27877
29119
30403
31728
33326
34613
36111
37664
39267
39987
40753
41552
42574
43200
44006
45555
47479
48774
49876
50641
51286
52482
53605
54807
55605
109
NormalleĢtirilmiĢ
Değerler
0,10000
0,13160
0,16451
0,19874
0,23901
0,26228
0,29085
0,32038
0,35085
0,38760
0,41720
0,45166
0,48737
0,52424
0,54080
0,55842
0,57679
0,60030
0,61470
0,63323
0,66886
0,71311
0,74289
0,76824
0,78583
0,80067
0,82817
0,85400
0,88165
0,90000
Çizelge A.7: Yıllık okuryazar oranı değerleri (%) (www.tuik.gov.tr).
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
Okur-Yazar Oranı
(%)
66,9
68,8
70,1
70,9
72,4
73,2
74,4
76,5
78,1
78,4
79,9
82
85
84,4
85,2
85,1
85,3
85,9
86,3
86,4
86,3
87,5
88,3
87,4
88,1
88,1
87,9
86,71
87,8
88
110
NormalleĢtirilmiĢ
Değerler
0,10000
0,17103
0,21963
0,24953
0,30561
0,33551
0,38037
0,45888
0,51869
0,52991
0,58598
0,66449
0,77664
0,75421
0,78411
0,78037
0,78785
0,81028
0,82523
0,82897
0,82523
0,87009
0,90000
0,86636
0,89252
0,89252
0,88505
0,84056
0,88131
0,88879
Çizelge A.8: Türkiye‟de temizlik kâğıdı yıllık satış miktarı (ton) (www.sksv.org.tr).
Toplam SatıĢ (ton)
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
11186
9418
4735
15258
18497
18826
18119
15340
21415
25893
30906
39892
46755
39779
44658
52314
57695
63789
64234
80554
88645
110703
125516
142093
168212
205393
235399
263348
294574
335774
111
NormalleĢtirilmiĢ
Değerler
0,117336912
0,112585453
0,100000000
0,128280317
0,136985054
0,137869234
0,135969188
0,12850069
0,144827111
0,156861632
0,170333953
0,194483618
0,212927771
0,194179933
0,207292132
0,227867454
0,242328766
0,258706249
0,259902176
0,303761796
0,325506169
0,38478653
0,424596123
0,469146424
0,539340628
0,639263699
0,719904124
0,79501641
0,878935558
0,90000000
EK B : SPSS 18.0 Program Görüntüleri
112
ġekil B.1: Model-1 çoklu regresyon program çıktısı.
113
ġekil B.2: Model-2 çoklu regresyon program çıktısı.
114
ÖZGEÇMĠġ
Ad Soyad: Mihriban Yücesoy
Doğum Yeri ve Tarihi: Kırcaali / 30.11.1985
Adres: Emniyetevleri Mah. Çelebi Mehmet Sok. No:13 D:2 Kağıthane / İstanbul
Lisans Üniversite: Dokuz Eylül Üniversitesi
115
Download