Destek Vektör Makineleri Kullanarak Arazi Örtüsünün - UZAL-CBS

advertisement
2. Uzaktan Algılama ve Coğrafi Bilgi Sistemleri Sempozyumu UZAL-CBS 2008, Kayseri.
http://www.uzalcbs2008.org
35
DESTEK VEKTÖR MAKİNELERİ KULLANARAK ARAZİ ÖRTÜSÜNÜN
SINIFLANDIRILMASI: GEBZE ÖRNEĞİ
İ. Çölkesen1, T. Kavzoğlu2
Gebze Yüksek Teknoloji Enstitüsü, Jeodezi ve Fotogrametri Mühendisliği Bölümü,
1
icolkesen@gyte.edu.tr, 2kavzoglu@gyte.edu.tr
ÖZET
Arazi kullanım şekillerinin belirlenmesi, çevresel değişiklerin izlenmesi ve doğal kaynaklara ait envanterlerin çıkarılması gibi geniş
ölçekli birçok çalışmada yeryüzüne ait bilgilere ihtiyaç duyulmaktadır. Uzaktan algılama teknolojileri farklı konumsal ve zamansal
çözünürlüklerde yeryüzünü görüntüleyebilme kabiliyetine sahip olduğundan bu önemli bilgilerin elde edilmesinde önemli bir kaynak
durumundadır. Bu nedenle uydu görüntüleri yardımıyla arazi örtüsünün ve arazi kullanımının sınıflandırılması uzaktan algılama
uygulamalarının önemli bir parçası olmuştur. Günümüze kadar uzaktan algılanmış görüntülerin sınıflandırılmasında birçok yöntem
geliştirilmiş ve kullanılmıştır. Destek vektör makineleri (DVM) istatistiksel öğrenme prensibine dayanan yeni nesil bir kontrollü
öğrenme algoritmasıdır. Uzaktan algılanan görüntülerin sınıflandırılmasında son yıllarda kullanılmaya başlayan destek vektör
makineleri birçok alanda başarıyla kullanılan bir sınıflandırma yöntemidir. DVM’nin sınıflandırma doğruluğu kernel fonksiyonu
seçimi ve kernel parametrelerinin belirlenmesi gibi birkaç faktöre bağlı olarak değişmektedir. Bu çalışmada, destek vektör makineleri
ile farklı tarihlerde algılanmış Landsat ETM+ ve Terra ASTER uydu görüntüleri kullanılarak Gebze ve çevresindeki arazi
kullanımının tespiti hedeflenmiştir. Bu veri setinin DVM ile sınıflandırılmasında Polinom ve Radyal Tabanlı Kernel fonksiyonları
kullanılmış ve bu fonksiyonlar için en uygun parametreler belirlenerek sonuçlar analiz edilmiştir. Son olarak yöntemin sınıflandırma
performansı, popüler sınıflandırma yöntemlerinden olan Yapay Sinir Ağları ve En Çok Benzerlik sınıflandırma yöntemlerinin
performanslarıyla karşılaştırılmıştır. Elde edilen sonuçlar, önemli avantajlara sahip destek vektör makinelerinin uzaktan algılanmış
görüntülerin sınıflandırılmasında yüksek doğruluklu sonuçlar ürettiği ve bu yüzden diğer metotlara iyi bir alternatif olduğunu
göstermiştir.
Anahtar Sözcükler: Arazi Örtüsü, Sınıflandırma, Destek Vektör Makineleri, Yapay Sinir Ağları, En Çok Benzerlik.
ABSTRACT
LAND COVER CLASSIFICATION USING SUPPORT VECTOR MACHINES: GEBZE CASE
Information about the Earth surface is required in many wide-scale applications, including the determination of land cover/land use,
monitoring of environmental changes and inventory mapping of natural hazards. Having a capability of monitoring the Earth surface
at various spatial and temporal scales, the remote sensing technology is an invaluable source providing such information. Therefore,
land cover/land use classification using remotely sensed images is one of the most common applications in the remote sensing field.
Many algorithms have been developed and applied in the literature for the classification of remotely sensed images. Support vector
machines (SVMs) are supervised learning algorithms based on statistical learning theory. SVMs are a group of classification
algorithms that have been recently used in the classification of remote sensing images and successfully applied to many other
applications. The classification accuracy produced by SVMs varies depending on the choice of the Kernel function and its
parameters. In this study, SVMs were used for land cover classification of Gebze district using Landsat ETM+ and Terra Aster
satellite images acquired at different dates. Polynomial and radial basis kernel functions were used for the classification of the data
sets. Optimum parameters of the kernel functions were determined and the results were analyzed. In conclusion, classification
performance of SVMs was compared with two popular classification methods, namely artificial neural networks and maximum
likelihood classifier. Results produced in this research show that support vector machines having important advantages over the
other techniques can produce high classification accuracies; thus, they appear to be a good alternative to conventional techniques.
Keywords: Land Cover, Classification, Support Vector Machines, Artificial Neural Networks, Maximum Likelihood.
35
2. Uzaktan Algılama ve Coğrafi Bilgi Sistemleri Sempozyumu UZAL-CBS 2008, Kayseri.
http://www.uzalcbs2008.org
36
1. GİRİŞ
Küresel ve çevresel değişimlerin belirlenmesi amacıyla yapılan çalışmalarda yeryüzüne ait bilgilerin elde edilmesi
önemli bir aşamadır. Yersel çalışmaların aksine uydu görüntüleri ile çalışmak zaman ve maliyet açısından büyük
avantajlar sağlamaktadır (Kavzoğlu ve Çetin, 2005). Uzaktan algılama sistemlerinin farklı genişlikteki alanları farklı
zamanlarda görüntüleyebilme özelliği, bu sistemleri yeryüzüne ait bilgilerin elde edilmesinde önemli bir kaynak haline
getirmiştir. Bu nedenle arazi örtüsü veya kullanım şekillerinin belirlenmesi amacıyla yapılan çalışmalarda uydu
görüntülerinin sınıflandırılması önemli bir aşamadır.
Uzaktan algılanmış görüntüler ile arazi örtüsünün haritalanması, her bir pikselin yansıtma ve parlaklık değerlerini
kullanarak bu pikselleri belirli arazi örtüsü sınıflarından birine atanması işlemini içermektedir (Huang et al., 2001).
Başka bir ifadeyle, görüntüdeki pikselleri arazide karşılık geldikleri sınıflar veya temalar içine atamak veya
yerleştirmektir. Çeşitli arazi örtülerinin spektral yansıma karakteristikleri uydu sensörlerinin çeşitli dalga boylarında veri
elde etmesi durumunda arazi örtüsü tipinin belirlenmesinin mümkün olabileceğini göstermiştir (Richards, 1993).
Görüntü sınıflandırma kullanıcının ilgi duyduğu objeler veya çeşitli sınıflar ile objelere ait spektral imzalar arasındaki
ilişkiyi kurarak görüntüler üzerinden tematik bilgilerin çıkarıldığı bir görüntü işleme bileşenidir.
1970 yılların başında ilk Landsat uydu görüntüsünün elde edilmesinden itibaren birçok sınıflandırma algoritmaları
geliştirilmiş ve sınıflandırmada kullanılmıştır (Townshend, 1992; Hall et al., 1995; Lu and Weng, 2007). Bunlar arasında
en çok kullanılanları en çok benzerlik sınıflandırıcısı ve yapay sinir ağları sınıflandırıcılarıdır. Destek vektör makineleri
(DVM) istatistiksel öğrenme prensibine dayanan yeni nesil bir kontrollü öğrenme algoritmasıdır. Uzaktan algılanan
görüntülerin sınıflandırılmasında son yıllarda kullanılmaya başlayan destek vektör makineleri birçok alanda başarıyla
kullanılan bir sınıflandırma yöntemidir (Melgani and Bruzzone, 2004; Mathur and Foody, 2008; Waske and Linden,
2008; Gautam et al., 2008).
Bu çalışmada, destek vektör makineleri ile farklı zamanlı Landsat ETM+ ve Terra ASTER uydu görüntüleri kullanılarak
Gebze ve çevresindeki arazi kullanımının tespiti amaçlanmıştır. DVM’nin sınıflandırma performansı, en popüler yapay
sinir ağı modeli olan çok katmanlı perceptron ve en çok benzerlik gibi diğer popüler sınıflandırma yöntemleri ile
karşılaştırılarak analiz edilmiştir.
2. ÇALIŞMA ALANI
Gebze, Marmara bölgesinde Kocaeli ilinin kuzeybatısında, İstanbul'un 45 kilometre doğusunda yer alan bir ilçedir.
Türkiye sanayisinin %15'ini, Kocaeli'nin endüstrisinin büyük bölümün barındıran Gebze, Marmara bölgesinin en büyük
ikinci ilçesidir. Yaklaşık olarak yüz ölçümü 772 km² olan ilçe, coğrafi konumu itibariyle 40 o 45’ 08’’ ile 41o 02’ 38’’
kuzey enlemleriyle 29o 19’ 56’’ ile 29o 45’ 14’’ doğu boylamları arasında yer almaktadır (Şekil 1). Doğusunda İzmit,
batısında İstanbul, kuzeyinde Şile, güneyinde (İzmit Körfezi) ile sınırlanan Gebze, yayla görünümünde bir düzlüğün
üzerinde kurulmuştur (URL–1, 2008).
36
2. Uzaktan Algılama ve Coğrafi Bilgi Sistemleri Sempozyumu UZAL-CBS 2008, Kayseri.
http://www.uzalcbs2008.org
37
Şekil1. Gebze ilçe sınırları
3. MATERYAL VE YÖNTEM
Bu çalışmada, arazi örtüsünün sınıflandırılması için çalışma alanını kapsayan 1997 yılında kaydedilmiş Landsat ETM+
ile 2002 yılında kaydedilmiş Terra ASTER görüntüleri kullanılmıştır. Uydu görüntülerinin geometrik düzeltmesinde
bölgeye ait 1/25.000 ölçekli haritalardan yararlanılmıştır. Sayısal olarak bilgisayar ortamına aktarılan 1/25.000 ölçekli
haritalar ERDAS/Imagine yazılımı ile UTM koordinat sisteminde tanımlanarak haritalar mozaik haline getirilmiştir.
Ayrıca, uydu görüntülerinin sınıflandırılması amacıyla eğitim alanlarının belirlenmesinde farklı tarihlerde çekilmiş hava
fotoğrafları (1996, 1999 ve 2003) ve Gebze orman bölge şefliğine ait meşcere haritalarından yararlanılmıştır. Bunların
yanı sıra arazide görsel olarak da alanlara ait konumlar el GPS aletleriyle tespit edilmiştir.
Uydu görüntülerinin farklı veri gruplarıyla beraber değerlendirilebilmesi için aynı koordinat sisteminde olmaları
gerekmektedir (Mather, 1987). Uydu görüntülerinin geometrik dönüşümü için, UTM projeksiyon sisteminde sayısal
ortama aktarılmış topoğrafik haritalardan faydalanılmıştır. Koordinat dönüşümünde yer kontrol noktalarının tüm çalışma
alanına homojen olarak dağılmasına dikkat edilmiştir. Uydu görüntülerine birinci derece Afin dönüşümü kullanılarak
UTM projeksiyon sisteminde yaklaşık 0.5 piksel karesel ortalama hata ile geometrik düzeltme getirilmiştir. Uydu
görüntülerinin yeniden örneklenmesinde orijinal değerleri koruduğundan en yakın komşu yöntemi tercih edilmiştir.
Yapılan ön çalışmalar neticesinde çalışma alanında altı temel sınıfın mevcut olduğu belirlenmiştir. Belirlenen bu sınıflar
deniz, yerleşim, toprak-taş, bozkır, iğne yapraklı orman ve geniş yapraklı orman sınıflarıdır.
4. SINIFLANDIRILMA YÖNTEMLERİ
Ham halde elde edilen uydu görüntülerinden yeryüzüne ait bilgilerin elde edilmesi için çeşitli istatistiksel analizler ve
istatistiksel yorumlama teknikleri kullanılmaktadır. Verileri bilgiye dönüştürebilmek için en yaygın yöntem görüntü
sınıflandırmadır. Uzaktan algılamada sınıflandırma, cisimlerin farklı spektral yansıtma değerleri esasına dayanarak
orijinal görüntüdeki her görüntü elemanını ait olduğu özellik grubuna ayırma işlemidir. Sınıflandırmada amaç, yeryüzü
üzerinde aynı spektral özellikleri taşıyan nesnelerin gruplandırılmasıdır. Sınıflandırma sonucu elde edilen görüntü
tematik harita olarak adlandırılmaktadır. Sınıflandırma işleminde genel olarak kontrollü ve kontrolsüz sınıflandırma
olarak adlandırılan iki yaklaşım vardır. Bu çalışmada, belirlenen altı sınıfın uydu görüntüleri üzerinde sınıflandırılması
işleminde kontrollü sınıflandırma teknikleri olan destek vektör makineleri, yapay sinir ağları (çok katmanlı perceptron)
ve en çok benzerlik yöntemleri kullanılmıştır.
4.1. En Çok Benzerlik Sınıflandırma Yöntemi
En çok benzerlik yöntemi literatürde en yaygın olarak kullanılan etkili bir sınıflandırma yöntemidir. Bu yöntemde
ortalama değer, varyans ve kovaryans gibi istatistiki değerlerin tümü dikkate alınır. Kontrol alanlarını oluşturan sınıflar
için olasılık fonksiyonları hesaplanmakta ve buna göre her bir pikselin hangi sınıfa daha yakın olduğuna karar
verilmektedir. Bir pikselin hangi sınıfa ait olduğu her bir sınıfa ait olma olasılıklarının hesabından sonra en yüksek
olasılıklı grubu atama şeklinde yapılır. Bu noktada kullanıcı tarafından tespit edilecek bir eşik değer sınıflandırılacak
pikselin belirlenen sınıflardan veya bu sınıfların dışında bir sınıftan olduğunun tespitinde kullanılır. Bu yöntemde, sınıf
kontrol verilerini oluşturan noktalar kümesindeki dağılımın, Normal dağılım olduğu kabul edilir. Sınıfların ilk
olasılıkları hakkında bilgi mevcut değilse, hepsi eşit olasılıklı olarak kabul edilir. Yöntem, pikselleri sadece parlaklık
değerlerine göre değil, her sınıf için ayrım oluşturacak varyans-kovaryans matris değerine göre oluşturur. Böylece örnek
piksellerin özellik uzayındaki dağılımları da dikkate alınmış olur. En çok benzerlik yönteminde kullanılan formül (1)
eşitliği ile ifade edilebilir.

D  ln ac   0.5 * ln  Covc
 0.5 * X  M c T *  Covc 1  * X  M C 


(1)
Bu eşitlikte; D, uzaklık ağırlıklı olasılık değerini; C, örnek bir sınıfı; X, aday pikselin ölçüm vektörünü; M c , C örnek
sınıfının ortalama vektörünü; a c , aday pikselin C sınıfına ait olma yüzdesini, Cov c , C örnek sınıfındaki piksellerin
varyans-kovaryans matrisini göstermektedir.
4.2. Yapay Sinir Ağları
37
2. Uzaktan Algılama ve Coğrafi Bilgi Sistemleri Sempozyumu UZAL-CBS 2008, Kayseri.
http://www.uzalcbs2008.org
38
Yapay sinir ağları (YSA) son yıllarda görüntü sınıflandırma uygulamalarında kullanılan sınıflandırma metotları arasında
teorik olarak daha gelişmiş ve güçlü bir sınıflandırma yöntemidir (Paola and Schowengerdt, 1995; Atkinson and Tatnall,
1997; Kavzoğlu, 2001). YSA, eğitim verileri aracılıyla problemi öğrenme ve daha sonra yeni bir verinin tanımlanmasını
yapabilme özelliğine sahip olduğundan sezgisel bir algoritmadır. Bu sistemler basit bir biçimde insan beyninde bulunan
nöron ağlarına benzer bir şekilde tasarlanmışlardır. Blamire (1996) ve Foody (1995), YSA’nın sınıf karakteristiklerinin
belirlenmesinde daha az eğitim verisi kullanarak geleneksel metotlara göre daha iyi sonuçlar verdiğini bildirmişlerdir.
Belirtilen avantajlarına karşın YSA’nın kullanımında bazı parametrelerin belirlenmesi gerekir. Dış ve iç parametreler
olarak ele alınabilecek bu parametrelerden; dış parametreler, giriş verisinin karakteristikleri ve çalışma ölçeğini, iç
parametreler ise, uygun ağ yapısının seçimi, ağ parametrelerinin başlangıç değerlerinin belirlenmesi, iterasyon sayısı,
aktivasyon fonksiyon tipi ve öğrenme oranının belirlenmesi gibi sınırlamaları içermektedir (Kavzoglu and Mather,
1999). Bu sınırlamaların sonucu olarak YSA davranışını yorumlamak güçleşmektedir. Bu nedenle YSA modelleri
genellikle kara-kutu metotlar olarak adlandırılırlar.
Eğitim veri kümesindeki örnekleri kullanarak karar sınırlarının belirlenmesi işlemi öğrenme veya eğitim olarak
adlandırılır. İstatistiksel sınıflandırma algoritmalarında karar fonksiyonlarının temelini oluşturan istatistiksel
varsayımlara ait parametrelerin belirlenmesi gerekir. Bu parametreler eğitim veri kümesi kullanılarak belirlenir. YSA
tabanlı sınıflandırma algoritmalarının en belirgin özellikleri herhangi bir istatistiksel kabule dayanmamalarıdır. Ayrıca
farklı formattaki verileri de kullanabilmeleri önemli bir avantajlarıdır.
YSA’nda temel eleman insan beynindeki nöronlar gibi çalışan işlem düğümüdür. Her bir işlem düğümü girdi değerlerini
toplar ve bu değerleri düğümlerin çıkış değerlerini oluşturan bir aktivasyon fonksiyonundan geçirir. Bir çok katmanlı
perceptronun yapısı Şekil 2’de gösterildiği gibi bir girdi katmanı, bir veya birden fazla saklı katman ve bir çıktı
katmanından oluşur. Girdi verilerini temsil eden girdi tabakası her bir sınıfa ait değerlerin ağdaki dağılımını tanımlar.
Saklı katmanlar hesaplamalar için kullanılırlar ve her bir düğüme ilişkin değerler girdi düğümü ile bu düğüme gelen
bağlantılara ait ağırlıklarının çarpımının toplamından elde edilir. Çıktı katmanı tanımlanacak sınıfları göstermek için bir
grup koda sahip son işlem katmanıdır. Tüm ara düğüm bağlantıları ağırlıklarla birleştirilir. Bir değer ara bağlantılarından
geçerken ara düğüm bağlantılarıyla birleştirilen ağırlıklarla çarpılır (Kavzoglu and Reis, 2008).
Saklı Katmanlar
Girdi Katmanı
Çıktı Katmanı
Arazi Örtüsü
Sınıfları
Şekil 2. Dört tabakalı ileri beslemeli basit bir yapay sinir ağı yapısı
Bir veri setinin karakteristiklerinin belirlenmesi için öğrenme algoritmaları kullanılır. Bu öğrenme algoritması
ağırlıkların eğitim döngüleri veya evreleri arasında nasıl ayarlanacağını belirler. YSA uygulamalarında, ağ yapısının
tasarlanması ve seçilen algoritmaya ait parametrelerin kullanıcı tarafından belirlenmesi en önemli iki adımı
oluşturmaktadır. Saklı katmanın boyutu ve düğüm sayısı ile ilgili özellikler eğitim veri setinin özeliklerinin öğrenilmesi
ve ağ için yeni olan piksellerin tanımlanmasında ağın kapasitesi açısından önemlidir. Buna ağın genelleştirme kabiliyeti
denir. Saklı tabakadaki düğümlerin sayısı yapay ağın gücünü ve karmaşıklığını direkt olarak belirler (Kavzoglu and
Mather, 2003). Ağın eğitim parametrelerinin ayarlanması (öğrenme oranı, momentum, ağırlıklar için başlangıç değerleri,
vb.) öğrenme algoritmasının çalışmasını ve eğitilen ağın performansını etkileyen ana unsurdur.
4.3. Destek Vektör Makineleri
Destek vektör makineleri (DVM), Vladimir N. Vapnik tarafından ortaya konulan istatistiksel öğrenme teorisine dayalı
bir kontrollü öğrenme algoritmasıdır (Vapnik, 1995). DVM’nin temel amacı iki sınıf arasında en uygun ayrımı yapabilen
hiper-düzlemi tanımlamaktır (Vapnik, 2000). DVM optik karakterlerin tanımlanması, el yazısı tanımlamaları ve metin
sınıflandırmaları gibi birçok uygulamada kullanılmıştır (Vapnik, 1995; Joachims,1998). Son yıllarda DVM’nin uzaktan
38
2. Uzaktan Algılama ve Coğrafi Bilgi Sistemleri Sempozyumu UZAL-CBS 2008, Kayseri.
http://www.uzalcbs2008.org
39
algılanmış görüntülerin sınıflandırılması konusunda başarıyla kullanımı literatürde bir çok yayında mevcuttur (Huang, et
al., 2002; Foody and Mathur, 2004; Pal and Mather, 2005; Su, et al., 2007; Yao et al., 2008).
DVM öznitelik bilgileri verilen bir test veri setine ait sınıf etiketlerini öğrenebilen veya tahmin edebilen bir model
oluşturmayı amaçlamaktadır. Bu doğrultuda sınıflandırma işleminde, DVM ile eğitim seti içindeki veriler kullanılarak
bir hiper-düzlem belirlenir ve bu oluşturulan düzlemin geçerliliği (genelleme yeteneği) test veri seti olarak adlandırılan
bağımsız veri setleri kullanılarak doğrulanır. K boyutlu bir verinin sınıflandırılmasında DVM ile (K–1) boyutlu bir hiperdüzlem geliştirilir. İkili sınıflandırma probleminde doğrusal olarak ayrılabilen bir veri setinin olduğu düşünülürse, bu
veri setini ayırabilen sonsuz sayıda hiper-düzlem vardır. Ancak, bu düzlemler arasında maksimum sınıra sahip sadece
bir hiper-düzlem bulunmaktadır (Sherrod, 2003). Bu hiper-düzleme en uygun hiper-düzlem ve sınır genişliğini
sınırlandıran noktalara ise destek vektörleri adı verilir.
DVM temelde doğrusal olarak ayırt edilebilen iki sınıflı problemlerin çözümünden yola çıkılarak doğrusal olarak ayırt
edilemeyen veya çoklu sınıf problemlerinin çözümü için genelleştirilebilir (Cortes and Vapnik, 1995). Doğrusal olarak
ayrılabilen iki sınıflı bir sınıflandırma probleminde DVM’nin eğitimini ele alalım ve k sayıda örnekten oluşan eğitim
verisinin { x i , y i }, i = 1, …, k, olduğunu kabul edelim. Burada x  RN olup N-boyutlu bir uzayı, y  {-1, +1} ise sınıf
etiketlerini göstermektedir. Eğer hiper-düzlemin normali (w) ve eğilim değeri (b) belirlenebilirse Şekil 3a’da görüleceği
üzere eğitim örnekleri doğrusal olarak ayrılabilir.
Destek Vektörleri
Sınır
Destek Vektörleri
Sınır
w  x  b  1
w  x  b  1

w
w
Orijin
Optimum Hiper-Düzlem
Orijin
w x  b  0
Optimum Hiper-Düzlem
w x  b  0
(a)
(b)
Şekil 3. (a) Doğrusal olarak ayrılabilen veri setleri için hiper-düzlemin belirlenmesi, (b) Doğrusal
olarak ayrılamayan veri setleri için hiper-düzlemin belirlenmesi.
Şekilde en uygun hiper-düzleme paralel olan iki hiper-düzlem görülmektedir. Bu hiper-düzlemler w  xi  b  1,
şeklinde bir fonksiyon ile tanımlanır. Dolayısıyla bu düzlemler arasındaki sınır 2 / w kadar olur (Foody and Mathur,
2004). Bu durumda en uygun hiper-düzlemin belirlenmesi aşağıdaki sınırlı optimizasyon probleminin çözümünü
gerektirir.
1
2
min  w 
(2)
2

Buna bağlı sınırlamalar ise
yi (w  xi  b)  1  0 ve yi  {1,1}
(3)
şeklinde olur.
Seçilen örnek piksellerle uydu görüntülerinin sınıflandırılmasında olduğu gibi birçok sınıflandırma probleminde
verilerin doğrusal olarak ayrılamaması durumu söz konusudur. Böyle bir problem için Cortes ve Vapnik (1995) sınıf
etiketi ile verilen eğitim verilerin en uygun hiper-düzlem ile aynı tarafta bulunması ile ilgili kısıtlamanın pozitif bir
“arttıran yapay değişken” (  i ) tanımlanması ile yumuşatıldığını ifade etmişlerdir (Şekil 3b). Bu durumu çözmek için
Şekil 4’de görüleceği üzere girdi uzayında doğrusal olarak ayrılamayan veri daha yüksek boyutlu bir uzayda
görüntülenir. Bu uzay özellik uzayı olarak adlandırılır.
39
2. Uzaktan Algılama ve Coğrafi Bilgi Sistemleri Sempozyumu UZAL-CBS 2008, Kayseri.
http://www.uzalcbs2008.org
40
Kernel
Fonksiyonu

Hiper-Düzlem
Girdi Uzayı
Özellik Uzayı
Şekil 4. Kernel fonksiyonu ile verinin daha yüksek bir boyuta dönüşümü
Destek vektör makineleri K ( xi , x j )   ( x)   ( x j ) gibi bir kernel fonksiyonu yardımıyla doğrusal olmayan dönüşümler
yapılabilmekte ve bu şekilde verilerin yüksek boyutta doğrusal olarak ayrılabilmesine imkan sağlamaktadır (Vapnik,
1995; Gunn, 1998; Cristianini and Shawe-Taylor, 2000). Sonuç olarak; doğrusal olarak ayrılamayan iki sınıflı bir
problemde iki sınıfın birbirinden ayrılması ile ilgili karar kuralı (4) eşitliği şeklinde yazılabilir (Osuna et al., 1997).


f ( x)  sign   i yi ( x)   ( xi )  b 




(4)
DVM modelleri Tablo 1’de sunulduğu üzere, lineer, polinom, radyal tabanlı fonksiyon ve sigmoid kernel olmak üzere
dört temel grup altında toplanabilir. Lineer kernel, radyal tabanlı kernelin özel bir hali gibi düşünülebilir. Ayrıca, Keerthi
and Lin (2003) belirli parametreler için sigmoid kernelin radyal tabanlı kernel gibi bir davranış gösterdiğini ifade
etmişlerdir. Literatürde uzaktan algılama uygulamaları için radyal tabanlı kernelin en iyi sonuçları verdiği (Keerthi and
Lin 2003; Melgani and Bruzzone 2004; Foody and Mathur 2004; Pal and Mather 2005) ifade edilmektedir.
KERNEL FONKSİYONU
Lineer Kernel
FORMÜL
K ( x, y)  x  y
Polinom Kernel
K ( x, y)  (( x  y)  1) d
Raydal Tabanlı Kernel
K ( x  y)  e
Sigmoid Kernel
K ( x  y)  tanh(b( x  y)  r )
  ( x  xi )
AÇIKLAMA
d, polinom derecesi
2
 , Gauss Kernelinin boyutu
b, r Kernel parametreleri
Tablo 1. DVM için kullanılan Kernel fonksiyonları
5. UYDU GÖRÜNTÜLERİNİN SINIFLANDIRILMASI VE ANALİZİ
Görüntü sınıflandırma, görüntüyü oluşturan her bir pikselin tüm bantlardaki değerlerinin diğer pikseller ile
karşılaştırılarak benzer piksellerin kullanıcının belirlediği bilgi kategorileri dahilinde sınıflara ayrılması işlemidir
(Campbell, 1996). Objelerin, sınıf olarak adlandırılan kategorilerden birine atanmasına örüntü sınıflandırması denir.
Özel bir örüntü sınıflandırma probleminde bir sınıflandırıcı sınıflandırılmak istenilen nesneleri makul düzeyde bir
doğrulukla sınıflandıracak şekilde oluşturulur. Girdi ve çıktı çiftleri kullanılarak yapılan eğitim yardımıyla
sınıflandırıcılar girdi verilerini verilen sınıflardan birine atamak için karar fonksiyonlarını oluşturur Günümüze kadar
uydu görüntülerinin sınıflandırılmasında birçok yöntem geliştirilmiş ve kullanılmıştır.
Çalışma alanını kapsayan görüntülerin sınıflandırılması işlemi için öncelikle her iki tarihte arazideki durumu en iyi
yansıtacak şekilde belirlenen altı sınıfı kapsayan eğitim alanlarının tespit edildi. Belirlenen eğitim alanlarını kapsayan
görüntü katmanı yazılan bir MATLAB programı yardımıyla rastgele örnekleme prensibinden hareketle örneklendirilerek
eğitim ve test veri setleri oluşturuldu. Eğitim ve test veri setleri belirlenirken tüm sınıflar için eşit sayıda örnek seçilerek
özellikle test verisi için hesaplanan doğruluk değerlerinde oluşabilecek “önyargı” giderildi. Sonuç olarak
sınıflandırmada kullanılmak üzere, Landsat ETM+ görüntüsü için eğitim verisi olarak toplam 3900 piksel, test verisi
40
2. Uzaktan Algılama ve Coğrafi Bilgi Sistemleri Sempozyumu UZAL-CBS 2008, Kayseri.
http://www.uzalcbs2008.org
41
olarak 2100 piksel ve Terra Aster görüntüsü için eğitim verisi olarak toplam 2400 piksel, eğitim verisi olarak toplam
1350 piksel belirlenmiştir.
En çok benzerlik (EÇB) yöntemiyle sınıflandırma işlemi Matlab yazılımında hazırlanan bir program ile
gerçekleştirilmiştir. Sınıflandırma işleminde Landsat ve Aster görüntüleri için test veri seti kullanılarak doğruluk analizi
gerçekleştirilmiştir. Sınıflandırma sırasında piksellerin belirlenen sınıflardan veya bu sınıfların dışında bir sınıftan
olduğunun tespiti için eşik değeri %50 olarak belirlenmiştir. EÇB yöntemiyle yapılan sınıflandırma sonuçlarının genel
doğruluğu Tablo 2’den de görüleceği üzere Landsat ETM+ görüntüsü için yaklaşık %87, Aster uydu görüntüsü için
yaklaşık %88 olarak hesaplanmıştır.
Yapay sinir ağları ile yapılacak sınıflandırma işleminde en önemli adım saklı katmanların ve bu katmanlardaki
düğümlerin sayısının belirlenmesidir (Kavzoglu, 2008). Saklı katmanlardaki düğüm noktalarının sayısı yapay ağ
modelinin gücünü ve karmaşıklığını belirler. Bu çalışmada saklı tabaka düğümleri Garson (1998) tarafından ifade edilen
(5) eşitliği ile belirlenmiştir.
N H  N P /r  ( N i  N 0 )
(5)
Burada Ni, N0 ve NH sırasıyla girdi sayısını (spektral bantlar, çıktı sayısını (sınıflar) ve saklı düğüm sayısını gösterirken,
NP ise eğitim örnekleri sayısını göstermektedir. Aynı formülde r ise kullanıcı tarafından belirlenen bir parametredir ve
verideki gürültü seviyesini göstermektedir. Bu bağlamda Landsat ETM+ ve Terra Aster görüntüleri için ağ tasarımları
yapılmış ve ağlara ait öğrenme oranı, momentum, ağırlıklar için başlangıç değerleri gibi eğitim parametreler ayrı ayrı
belirlenmiştir. Gerek ağ yapısının belirlenmesi gerekse ağın eğitimi için en uygun parametrelerin tespiti uzun bir
değerlendirme ve analiz gerektirdiğinden görüntülerin sınıflandırılması yaklaşık bir gün sürmüştür. YSA
sınıflandırılması elde edilen sınıflandırma doğrulukları Tablo 2’ de gösterildiği üzere Landsat görüntüsü için yaklaşık
%90 iken, Aster uydusu için yaklaşık %91 olarak hesaplanmıştır.
LANDSAT ETM+
TERRA ASTER
Genel Doğruluk
Kappa Değeri
Genel Doğruluk
Kappa Değeri
EÇB
86.95
0.84
88.00
0.86
YSA
90.14
0.88
90.82
0.89
*
DVM–1
90.81
0.89
92.81
0.91
*
DVM–2
90.05
0.88
91.04
0.89
*DVM–1, Radyal tabanlı kernel fonksyonu kullanılarak, DVM–2, polinom kernel fonksiyonu kullanılarak elde
edilen sınıflandırma sonuçlarını göstermektedir.
YÖNTEMLER
Tablo 2. Üç sınıflandırma yöntemi kullanılarak elde edilen sonuçlar
1997 ve 2002 uydu görüntülerinin DVM ile sınıflandırılmasında çoklu sınıflandırma (bire karşı bir) yöntemi
kullanılmıştır. Çoklu sınıflandırmada polinom ve RTF kernel fonksiyonları ile sınıflandırma ayrı ayrı yapılmıştır. DVM
ile yapılan sınıflandırmada karşılaşılan en büyük problem, kullanılacak kernel fonksiyonları için hangi parametre
değerlerinin en iyi sonucu vereceğinin bilinmemesidir (Oommen et al., 2008). Seçilen kernel fonksiyonu ve kernel
parametreleri ise sınıflandırılacak veri setine göre değişiklik göstermektedir (Huang, et al., 2002; Dixon and Candade,
2008). Bu nedenle polinom kernel ( d ve C ) ve RTF kernel (  ve C ) için en uygun parametreler Landsat ETM+ ve
Terra Aster görüntüleri için ayrı ayrı belirlenmiştir. Tablo 2’de DVM ile elde edilen sınıflandırma sonuçları her iki
kernel içinde verilmiştir. Sınıflandırma sonuçlarına göre; Landsat görüntüsün DVM ile sınıflandırılmasında RTF kernel
kullanımı ile yaklaşık %91 ve polinom kernelin kullanımı ile yaklaşık %90 sınıflandırma doğruluğu elde edilmiştir.
Aster görüntüsü için RTF kernel kullanılarak elde edilen sınıflandırma doğruluğu yaklaşık %93 olarak hesaplanırken
polinom kernel ile yaklaşık %91 olarak hesaplanmıştır. Sınıflandırma sonucunda elde edilen tematik haritalara örnek
olarak Şekil 5’ de Aster uydu görüntüsünün DVM (RTF kernel) kullanılarak sınıflandırılması sonucu elde edilen tematik
harita gösterilmiştir. Bu harita incelendiğinde çalışma alanının kuzey-doğusunda özellikle yoğun orman alanlarının
olduğu, şehirleşmenin ise denize yakın ve çalışma alanının orta kısmında yoğunlaştığı açıkça görülmektedir.
41
2. Uzaktan Algılama ve Coğrafi Bilgi Sistemleri Sempozyumu UZAL-CBS 2008, Kayseri.
http://www.uzalcbs2008.org
42
Şekil 5. Aster görüntüsünün DVM (RTF Kernel) ile sınıflandırılması sonucu elde edilen tematik harita
6. SONUÇLAR
Uzaktan algılama teknolojileri geniş alanları görüntüleyebilme kabiliyetine sahip olduğundan yeryüzü üzerindeki
bilgilerin elde edilmesi amacıyla yapılan uygulamalar için önemli bir veri kaynağıdır. Uydu görüntülerinden yeryüzüne
ait bilgilerin elde edilmesinde kullanılan en önemli yöntem sınıflandırmadır. Bu çalışmada DVM’nin uydu
görüntülerinin sınıflandırılmasındaki performansı diğer popüler sınıflandırma yöntemleri olan en çok benzerlik ve
YSA’nın sınıflandırma performansları ile karşılaştırılmıştır.
Bu çalışmada kullanılan sınıflandırma yöntemlerinden en çok benzerlik yöntemi (EÇB) literatürde yaygın kullanımı olan
güçlü bir sınıflandırma yöntemidir. Yapay sinir ağlarının ayrım yapma gücü nedeniyle bu konuda birçok araştırma
yapılmış ve sonuçta çeşitli yapay sinir ağları modelleri geliştirilmiştir. Bunlar arasında çok katmanlı perceptron uzaktan
algılanan görüntülerin sınıflandırılmasında en yaygın olarak kullanılan yapay sinir ağı sınıflandırma yöntemidir. Son
yıllarda uzaktan algılanmış görüntülerin sınıflandırılmasında başarıyla kullanılan destek vektör makineleri (DVM)
parametrik olmayan ve istatistiksel öğrenme teorisine dayalı bir makine öğrenme algoritmasıdır. DVM kernel
fonksiyonları kullanarak doğrusal olarak ayrım yapılamayan verileri daha yüksek boyutlu bir uzayda eşleştirerek
doğrusal ayrımın yapılabilmesine olanak sağlamaktadır.
Landsat ETM+ uydu görüntüsünün üç yöntemle sınıflandırılması sonucunda YSA ve DVM ile elde edilen sınıflandırma
doğrululukları yaklaşık %91 düzeyinde belirlenirken EÇB yöntemi kullanımı ile elde edilen sınıflandırma doğruluğu
yaklaşık %87 seviyelerinde hesaplanmıştır. Terra Aster uydusu için bu sonuçlar DVM ile yaklaşık olarak %93, YSA ile
yaklaşık %91 iken EÇB yöntemi ile %88 olarak hesaplanmıştır. DVM ile yapılan sınıflandırmada seçilen kernel
fonksiyonları dikkate alındığında, Landsat görüntüsü için RTF ve polinom kernel kullanımı ile elde edilen sınıflandırma
doğruluklarının bir birine çok yakın olduğu, Aster görüntüsü için RTF kernelin polinom kernele göre yaklaşık olarak %2
daha doğru sonuç verdiği görülmüştür. Üç yöntemin uydu görüntülerinin sınıflandırmasındaki performansı dikkate
alındığında Landsat görüntüsü için DVM ile YSA’nın %91 doğruluk seviyesinde sonuçlar verdiği belirlenmiştir. Buna
karşın, Aster görüntüsü için sınıflandırma doğruluğun DVM ile özellikle RTF kernel kullanımıyla YSA’na göre yaklaşık
olarak %2 daha iyi olduğu gözlemlenmiştir. Her iki uydu görüntüsünün EÇB yöntemi ile sınıflandırılması sonucunda
diğer iki yönteme göre sınıflandırma doğruluğunun yaklaşık %4 düzeyinde düşük olduğu görülmüştür.
YSA ve DVM sınıflandırıcılarının her ikisi de parametrik olmayan yaklaşımlardır. Buna karşın YSA yapısı itibariyle
daha karmaşık ve daha fazla parametrenin dikkate alınmasını gerektiren bir yaklaşımdır. YSA ile yapılan sınıflandırma
42
2. Uzaktan Algılama ve Coğrafi Bilgi Sistemleri Sempozyumu UZAL-CBS 2008, Kayseri.
http://www.uzalcbs2008.org
43
doğruluğu saklı düğümlerin sayısına ve seçilen algoritmanın parametrelere duyarlıyken, DVM seçilecek Kernel
fonksiyonuna ve Kernel parametrelerine karşı duyarlıdır. YSA ile yapılan eğitimde parametre değişimleri sınıflandırma
doğruluğunu önemli ölçüde değiştirirken, buna karşın DVM ile yapılan eğitimde seçilen kernel fonksiyonu ve kernel
parametrelerindeki değişimlerin sınıflandırma doğruluğu üzerinde daha az etkili olduğu gözlemlenmiştir. Bu nedenle
DVM ile sınıflandırma YSA’ya göre çok daha kısa sürede tamamlanmıştır. Diğer taraftan EÇB yönteminin diğer iki
yönteme göre daha basit ve işlem süresi açısından daha hızlı olduğu görülmüştür. Elde edilen sonuçlar; destek vektör
makinelerinin uzaktan algılanmış görüntülerin sınıflandırılmasında etkili ve alternatif bir yöntem olduğunu ortaya
koymuştur.
KAYNAKLAR
ATKINSON, P. M., TATNALL, A. R. L., (1997), “Neural Networks in Remote Sensing”, International Journal of
Remote Sensing, Vol. 18, (699–709).
BLAMIRE, P. A., (1996), “The Influence of Relative Sample Size in Training Artificial Neural Networks”,
International Journal of Remote Sensing, Vol. 17, (223–230).
CAMPBELL, J.B., (1996). Introduction to Remote Sensing, Second Edition, The Guilford Press, New York, USA.
CORTES, C., VAPNIK, V., (1995), “Support-Vector Network”, Machine Learning, Vol. 20, (273–297).
CRISTIANINI, N., SHAWE-TAYLOR, J., (2000), An Introduction to Support Vector Machines and Other KernelBased Learning Methods, Cambridge University Press, England.
DIXON, B., CANDADE, N., (2008), “Multispectral Land Use Classification Using Neural Networks and Support
Vector Machines: One or the Other, or Both?”, International Journal of Remote Sensing, Vol. 29, (1185–1206).
FOODY, G.M., (1995), “Using Prior Konowledge in Artificial Neural Network Classification with a Minimal Training
Set”, International Journal of Remote Sensing, Vol. 16, (301–312).
FOODY, GM., MATHUR A., (2004), “A Relative Evaluation of Multiclass Image Classification by Support Vector
Machines”, IEEE Transactıons on Geoscience and Remote Sensing, Vol. 42, (1335–1343).
GARSON, G. D., (1998), Neural Networks : An Introductory Guide for Social Scientists, London, U.K.
GAUTAM, R.S., SINGH, D., MITTAL, A., SAJIN, P., (2008), “Application of SVM on Satellite Images to Detect
Hotspots in Jharia Coal Field Region of India”, Advances in Space Research, Vol. 41, (1784–1792).
GUNN, SR., (1998), “Support Vector Machines for Classification and Regression”, Technical Report, University of
Southampton.
GÜZEL, C., (2004), “Uzaktan Algılanmış Görüntüler Kullanılarak Gebze İlçesinin Sınıflandırılmış Haritalarının Elde
Edilmesi”, Yüksek Lisans Tezi, GYTE Mühendislik ve Fen Bilimleri Enstitüsü, Gebze.
HALL, F. G., TOWNSHEND, J. R., ENGMAN, E. T., (1995), “Status of Remote Sensing Algorithms for Estimation
of Land Surface State Parameters”, Remote Sensing of Environment, Vol. 51, (138–156).
HUANG, C., DAVIS, L. S., TOWNSHED, JRG., (2002), “An assessment of support vector machines for land cover
classification”, International Journal of Remote Sensing , Vol. 23, (725–749).
HUANG, C., TOWNSHEND, J.R.G., LIANG, S., KALLURI, S.N.V., DEFRIES, R.S., (2001), “Impact of Sensor’s
Point Spread Function on Land Cover Characterization: Assessment and Deconvolution”, Remote Sensing of
Environment,Vol. 80, (203–212).
JOACHIMS, T., (1998), “Text Categorization with Support Vector Machines—Learning with Many Relevant
Features”, In Proceedings of European Conference on Machine Learning, (137-142).
43
2. Uzaktan Algılama ve Coğrafi Bilgi Sistemleri Sempozyumu UZAL-CBS 2008, Kayseri.
http://www.uzalcbs2008.org
44
KAVZOGLU, T., (2001), "An Investigation of the Design and Use of Feed-Forward Artificial Neural Networks in the
Classification of Remotely Sensed Images", PHD Thesis, Nottingham University.
KAVZOGLU, T., (2008), “Determination of Environmental Degradation Due to Urbanization and Industrialization in
Gebze, Turkey”, Enviromental Engineering Science, Vol. 25, (429–438).
KAVZOGLU, T., MATHER, P.M, (2003), “The Use of Backpropagating Artificial Neural Networks in Land Cover
Classification”, International Journal of Remote Sensing, Vol. 24, 4907–4938.
KAVZOGLU, T., MATHER, P.M., (1999), “Pruning Artificial Neural Networks: An Example Using Land Cover
Classification of Multi-sensor Images”, International Journal of Remote Sensing, Vol. 20, (2787–2803).
KAVZOGLU, T., REIS, S., (2008), “Performance Analysis of Maximum Likelihood and Artificial Neural Network
Classifiers for Training Sets with Mixed Pixels”, GIScience and Remote Sensing, Vol. 45, (330–342).
KAVZOĞLU, T., ÇETİN, M., (2005), "Gebze Bölgesindeki Sanayileşmenin Zamansal Gelişiminin ve Çevresel
Etkilerinin Uydu Görüntüleri İle İncelenmesi", TMMOB Harita ve Kadastro Mühendisleri Odasi, 10. Türkiye Harita
Bilimsel ve Teknik Kurultayı, Ankara.
KEERTHI, S., LIN, C. J., (2003), “Asymptotic Behaviors of Support Vector Machines with Gaussian Kernel”, Neural
Computation, Vol.. 15, (1667–1689).
LU, D., WENG, Q., (2007), “A Survey of Image Classification Methods and Techniques for Improving Classification
Performance”, International Journal of Remote Sensing, Vol. 28, (823–870).
MATHER, P.M., (1987), Computer Processing of Remote-Sensed Images, John Wiley and Sons Inc., New York.
MATHUR A., FOODY, GM., (2008), “Crop Classification by Support Vector Machine With Intelligently Selected
Training Data for An Operational Application”, International Journal of Remote Sensing, Vol. 29, (2227–2240).
MELGANI, F., BRUZZONE, L., (2004), “Classification of Hyperspectral Remote Sensing Images with Support
Vector Machines”, IEEE Transactıons on Geoscience and Remote Sensing, Vol. 42, (1778–1790).
OOMMEN, T., MISRA,D., TWARAKAVI, N. K.C., PRAKASH, A., SAHOO, B., BANDOPADHYAY, S., (2008),
“An Objective Analysis of Support Vector Machine Based Classification for Remote Sensing”, Mathematical
Geosiences, Vol. 40, (409–424).
OSUNA, E. E., FREUND, R., GIROSI, F., (1997), “Support Vector Machines: Training and Applications”,
http://cbcl.mit.edu/cbcl/publications/ai-publications/1500-1999/AIM-1602.ps (10.05.2008).
PAL, M., MATHER, PM., (2005), ”Support Vector Machines for Classification in Remote Sensing”, International
Journal of Remote Sensing, Vol. 26, (1007–1011).
PAOLA, J. D., SCHOWENGERDT, R. A., (1995), “A Detailed Comparison of Back Propagation Neural Network and
Maximum Likelihood Classifiers for Urban Land Use Classification”, IEEE Transactions on Geoscience and Remote
Sensing, Vol. 33, (981–996).
RICHARDS, J.A., (1993), Remote Sensing Digital Image Analysis: An Introduction, Second Edition, Springer-Verlag,
Berlin.
SHERROD, P. H., (2003), “Classification and Regression Trees and Support Vector Machines for Predictive Modeling
and Forecasting”, http://www.dtreg.com/DTREG.pdf (12.06.2008).
SU, L., CHOPPING M.J., RANGO, A., MARTONCHIK, J.V., PETERS, D.P.C., (2007), “Support Vector
Machines for Recognition of Semi-Arid Vegetation Types Using MISR Multi-Angle Imagery”, Remote Sensing of
Environment, Vol. 107, (299–311).
TOWNSHEND, J. R. G., (1992), “Land cover”, International Journal of Remote Sensing, Vol. 13, (1319–1328).
44
2. Uzaktan Algılama ve Coğrafi Bilgi Sistemleri Sempozyumu UZAL-CBS 2008, Kayseri.
http://www.uzalcbs2008.org
45
VAPNIK, V. N., (1995), The Nature of Statistical Learning Theory, Springer-Verlag, New York.
VAPNIK, V.N., (2000), The Nature of Statistical Learning Theory, Second Edition, Springer-Verlag, New York.
WASKE, B., LINDER, S.V.D., (2008), “Classifying Multilevel Imagery from SAR Andoptical Sensors By Decision
Fusion”, IEEE Transactıons on Geoscience and Remote Sensing, Vol. 46, (1457–1466).
YAO, X., THAM, LG., DAI, F.C., (2008), “Landslide Susceptibility Mapping Based on Support Vector Machine: A
Case Study on Natural Slopes of Hong Kong, China”, Geomorphology, (In Press).
URL-1, (2008), http://www.gebze.bel.tr.
45
Download