BAZI TERİMLER, KAVRAMLAR ve VERİ TİPLERİ Orhan Gündüz CBS’de kullanılan veriler iki ana tiptedir: 1. Vektörel veri (Shape data) 2. Hücresel veri (Raster data) Vektörel veri kendi içinde 3 sınıfa ayrılır: 1. Nokta verisi (Point data) 2. Çizgi verisi (Line/Polyline data) 3. Poligon verisi (Polygon data) Noktasal veri: • • • 0-D objelerdir. Bir nokta iki koordinattan (X,Y) oluşur. Genellikle noktasal gösterime uygun veriler için kullanılır. (kuyu, köy, suç mahali, şehirler gibi objeler) Çizgi verisi: • • • • 1-D objelerdir. İki nokta arasındaki en kısa mesafe bir doğrudur. Başlanğıç ve bitiş noktaları vardır. Çizgisel gösterime uygun veriler için kullanılır. (nehirler, yollar, sınırlar gibi objeler) Poligon verisi: • • • 2-D objelerdir. Poligon doğrusal çizgilerle birbirine bağlanan noktalardan oluşan ve başlanıç noktasına geri dönen noktalar kümesidir. Alansal gösterime uygun veriler için kullanılır. (göller, parseller, ülkeler gibi objeler) ÇİZGİ NOKTA (X2,Y2) (X,Y) sol sağ ÇOKLU ÇİZGİ POLİGON (Xn,Yn) dışı (X2,Y2) içi (X1,Y1) (X2,Y2) (X1,Y1) (X1,Y1) (Xn-1,Yn-1) * Poligonu oluştururken saat yönünde ilerleme kolaylık sağlar. Nod: En az 3 çizgi parçasının kesiştiği özel bir tür noktadır. 2 boyutlu uzayda iki koordinattan (X,Y) oluşur. (X1,Y1) (X1,Y1) Piksel: Bir resmin parçalanamaz en küçük elemanıdır (ör. dijital fotoğraflardaki piksel) Grid/Grid hücresi: Sürekli bir yüzeyin bir iki boyutlu bir elemanıdır. (hücresel veri modelinde kullanılır) Sembol: Haritalarda bazı özel objelerin veya özelliklerin gösteriminde kullanılan grafik elemanıdır. Hastane Havalimanı Açıklama (Annotation): Grafik olarak bir objeyi işaretleyen yazı veya etiket ANKARA Gediz Nehri CBS işlemleri 1. İleri veri gösterimi (veriden haritaya) 2. Geri veri gösterimi (haritadan veriye) 3. Poligon içinde nokta analizi (point in polygon) 4. Poligon içinde çizgi analizi (line in polygon) 5. Poligon üsteleme/bindirme (overlay) 6. Tampon bölge analizi (buffer) 7. Tematik haritalama 8. Alan/mesafe hesaplamaları 9. Geokodlama ve adres eşleştirme 10. Ağ (network) analizi 11. Yüzey modelleme Meta-veri kavramı (verinin verisi) : • • • • • “Veri ile ilgili veri” Veri tabanının içeriğini anlatan genel tanımalamalar Veriyi dokümante eden bilgiler Dosya, format, sakalam yeri, kaynağı gibi bilgileri içerir Çok önemlidir!!! CBS’de kullanılan bilgisayar sistemleri 1. Bağımsız sistemler (Standalone systems) (tek PC, yerel veri saklama ve işleme) 2. Ağa bağlı sistemler (Networked systems) (NT, yerel veri işleme, merkezi veri saklama, kimlik bilgisi sorgulamalı) 3. Merkezi sistemler (Centralized systems) (UNIX, merkezi veri saklama ve işleme) CBS Vektör-tabanlı CBS • • • • • • Objeler nokta, çizgi veya poligon olarak saklanır Veri gruplanabilir Tüm verilerin (X,Y) koordinatları içerir Tematik gösterim mümkündür Üsteleme/Bindirme işlemleri zordur Sınırlar kolay gösterilir Hücre-tabanlı CBS • • • • • • Objeler grid olarak saklanır Çözünürlük ne kadar yüksekse o kadar iyidir Sınırların gösterimi zordur Vektör tabanlı objelerin (ör. yol, nehir, çit gibi) gösterimi zordur Üsteleme/bindirme işlemleri için çok uygundur Modellemeye uygundur Topoloji: • • • • • Objeler arasındaki ilişkileri tanımlar Topoloji Doğrultu (Direction) Bağlantı (Connectivity) Komşuluk (Adjacency or contiguity) Yakınlık (Proximity) gibi kavramları çalışan bir matematik dalıdır. Bu sayede bilgisayar, grafik objeler arasındaki ilişkileri bilebilmekte ve işlemleri yapabilmektedir. Topolojik veri yapısı nodlar ve köşelere dayanır. CBS işlemlerinde sıklıkla kullanılır. CBS’de KULLANILAN VERİ SINIFLANDIRMA METOTLARI Orhan Gündüz CBS’de veri aşağıdaki tekniklere göre sınıflandırılabilir : 1. 2. 3. 4. 5. 6. 7. Doğal kesimler (Natural breaks) Nicelikler (Quantiles) Eş alan (Equal area) Eş aralık (Equal interval) Standart sapma (Standart deviation) Süreklilik / süreksizlik Normalizasyon DOĞAL KESİMLER • • • • • Veriler minimumdan maksimuma doğru sıralanır. Ani değişiklik gözlenen yerden kesilir. Tüm kesmeler arasındaki veriler gruplanır. Kesme noktalarının tespiti için istatistiksel teknikler de kullanılabilir. Varyans minimizasyonu bir yöntemdir. NİCELİKLER • • • Veri, her aralığa aynı sayıda data düşecek şekilde bölünür. Doğrusal veri için en uygun yöntemdir. Diğer veriler için hatalı olabilir. EŞİT ALAN • • Poligon verisini sınıflandırmak için kullanılır. Veri eşit alan aralıkları olacak şekilde sınıflandırılır. EŞİT ARALIK • Eşit boyutta aralıklar şeçilerek yapılır Ör: Veri (12…351) aralığındaysa, toplam veri aralığı 339’dur. Bunu 3 eşir aralığa bölersek, her bir aralık 113 büyüklüğünde olur. Buna göre: 12-125 125-238 238-351 aralıkları ortaya çıkar. STANDARD SAPMA • • • • Veri setinin ortalaması hesaplanır Ortalama değerden yukarı ve aşağı olacak şekilde ¼, ½ or 1 standard sapma olacak şekilde kesmeler konur Nüfus gibi veri tiplerine uygun bir sınıflandırma şeklidir. Verinin ortalam etrafındaki dağılımı ve ortalamadan sapmasının görülmesi açısından uygun bir sınıflandırma tekniğidir. Verinin nerde yoğunlaştığını nerede seyrekleştiğini görme imkanı tanır. NORMALİZASYON • • Verinin kendisi yerine normalleştirilmiş bir versiyonu kullanılır. Normalizasyon genellikle veri toplamına veya maksimum veri değerine bölünerek yapılır. Veri değeri / toplam (data) * 100