Veri Düzenleme Grafiksel Gösterimler ve Merkezi Eğilim Ölçüleri • Verilerin İşlenmesi • Yapılan bir araştırmada elde edilen veriler dağınık, düzensiz ve karmaşık bir hal içerir. Bu şekliyle veriden anlamlı bir sonuca ulaşmak mümkün değildir. İstatistik analizin hammaddesi niteliğinde olan bu ham verinin işlenerek düzenli ve anlaşılır hale getirilmesi gerekir. • Çeşitli kaynaklardan derlenmiş ya da bizim tarafımızdan anket, deney ya da gözlem gibi tekniklerle toplanmış olan ham verilerin anlaşılır ve düzenli hale getirilebilmesi için istatistik seriler, tablolar ve grafiklerden faydalanılır. Veri Düzenleme Grafiksel Gösterimler ve Merkezi Eğilim Ölçüleri Veri Düzenleme Zaman Serileri • Bir değişkenin değerlerinin zamanın şıklarına göre (gün, ay, mevsim, yıl vb.) değişimini gösteren serilere zaman serisi denir. Zaman serisi verileri eşit zaman aralıkları ile derlenmiş verilerden oluşur. Yıllar X malı fiyatı 2000 12 2001 18 2002 15 2003 20 2004 27 2005 24 Veri Düzenleme Kalitatif (niteliksel) Veriler ve Dağılışları • Kalitatif (Niteliksel) verileri basit tasnif ya da bileşik tasnif işlemine tabi tutabiliriz. Basit tasnif işlemi sadece bir değişkenin şıklarına göre yapılan tasniftir. Yanda öğrencilerin mezun oldukları lise değişkeninin şıklarına göre dağılışı basit tasnif işlemine örnek gösterilebilir. MYO öğrencilerinin mezun olduğu Lise türüne göre dağılımı Lise türü Frekan Yüzde Kümülatif sı si yüzde Düz lise 143 43,7 43,7 End Meslek 123 37,6 81,3 Ticaret 23 7,1 88,4 Anadolu Fen 5 1,5 88,9 Diğer 33 10,1 100 Toplam 327 100 Veri Düzenleme Niceliksel (Kantitatif- Ölçülebilen) Verilerin İstatistik Bölünme Serileriyle Gösterilmesi • Aşağıdaki tabloda öğrencinin mezun olduğu lise değişkeni ile cinsiyet değişkeninin birlikte değişimi bileşik tasnif işlemi ile gösterilmiştir. MYO öğrencilerinin mezun olduğu Lise ve cinsiyet değişkeninin şıklarına göre dağılışı Lise türü Erkek Kız Toplam Yüzde Düz lise 88 55 143 43,7 End Meslek 95 28 123 81,3 Ticaret 10 13 23 88,4 Anadolu Fen 2 3 5 89,9 Diğer 19 14 33 100,0 Toplam 214 113 327 43,7 Veri Düzenleme Niceliksel (Kantitatif- Ölçülebilen) Verilerin İstatistik Bölünme Serileriyle Gösterilmesi • Niceliksel olarak ifade edilen sayısal olarak ifade edilen ya da ölçülebilir özellik taşıyan değişkenlere ait verilerin istatistik bölünme serileri ile gösterilmesinde basit, tasnif edilmiş ve gruplanmış seriler kullanılır. • Basit Seri: Derlenmiş olan sayısal verilerin küçükten büyüğe doğru sıralanması ile elde edilen serilerdir. • Tasnif edilmiş seri: Tasnif edilmiş serilerde tekrarlayan elemanlar bir araya getirilerek frekanslar şeklinde ifade edilen seridir. • Gruplanmış seri: Belli değer aralıklarına düşen birimler bir araya getirilerek oluşturulan frekanslı serilere gruplanmış seri adı verilir. Veri Düzenleme Niceliksel (Kantitatif- Ölçülebilen) Verilerin İstatistik Bölünme Serileriyle Gösterilmesi • Basit seri örnekleri Notlar Uzunluklar Satışlar 10 143 3 22 147 4 30 155 6 43 160 7 50 167 7 55 170 7 63 176 8 70 185 8 90 191 9 Veri Düzenleme Niceliksel (Kantitatif- Ölçülebilen) Verilerin İstatistik Bölünme Serileriyle Gösterilmesi • Tasnif edilmiş seri örnekleri Notlar (Xi) Öğr.say (fi) 1 2 3 5 160 165 3 5 4 5 1 3 3 4 5 Toplam 8 4 1 21 170 180 190 Toplam 4 2 1 15 6 7 8 Toplam 6 4 2 16 Uzunluk Fert say (Xi) (fi) Satışlar Gün say (Xi) (fi) Veri Düzenleme Niceliksel (Kantitatif- Ölçülebilen) Verilerin İstatistik Bölünme Serileriyle Gösterilmesi • Gruplanmış seri örnekleri Notlar Öğrenci sayısı 0 - 20 Uzunluk Fert sayısı Satışlar Gün sayısı 4 140 – 150 2 10 – 30 1 20 – 40 10 150 – 160 5 30 – 40 4 40 – 60 20 160 – 170 12 40 – 50 7 60 – 80 13 170 – 180 10 50 – 70 6 80 –100 3 180 – 190 6 70 – 100 3 Veri Düzenleme Niceliksel (Kantitatif- Ölçülebilen) Verilerin İstatistik Bölünme Serileriyle Gösterilmesi • Kesikli karakterdeki niceliksel verileri gruplarken sınıf aralıklarında boşluklar oluşur. Yandaki seride KOBİ’lerde çalışan işçi sayısı değişkeni kesikli bir özelliğe sahiptir. Bu değişken tamsayı dışında değerler almaz. Bu sebeple sınıflar arası boşluklar oluşur. Çalışan İşçi KOBİ Sayısı Sayısı 5 – 14 10 15 – 24 20 25 – 34 25 35 – 44 15 45 – 54 5 Veri Düzenleme Niceliksel (Kantitatif- Ölçülebilen) Verilerin İstatistik Bölünme Serileriyle Gösterilmesi • Niceliksel olarak ifade edilen sayısal olarak ifade edilen ya da ölçülebilir özellik taşıyan değişkenlere ait verilerin istatistik bölünme serileri ile gösterilmesinde basit, tasnif edilmiş ve gruplanmış seriler kullanılır. • Basit Seri: Derlenmiş olan sayısal verilerin küçükten büyüğe doğru sıralanması ile elde edilen serilerdir. • Tasnif edilmiş seri: Tasnif edilmiş serilerde tekrarlayan elemanlar bir araya getirilerek frekanslar şeklinde ifade edilen seridir. • Gruplanmış seri: Belli değer aralıklarına düşen birimler bir araya getirilerek oluşturulan frekanslı serilere gruplanmış seri adı verilir. Basit ve tasnif edilmiş serinin Gruplanmış seriye dönüştürülmesi • Basit ve tasnif edilmiş serilerle verinin anlaşılır hale gelmesi mümkün olmuyorsa böyle durumlarda veriyi sınıflara ayırarak gruplanmış seriye dönüştürmek gerekebilir. Veriyi gruplamak için aşağıdaki Sturges sınıf aralığı formülü kullanılabilir. X max X min S 1 3,322 log N • S: Sınıf aralığı • Xmax: Verinin en büyük değeri • Xmin: Verinin en küçük değeri • N: Veri sayısı Bir verinin gruplanmış seriye dönüştürülmesi Öğrencilerin notları 37 67 79 58 51 33 53 95 60 64 43 66 81 58 65 50 64 50 70 25 56 46 40 56 59 51 89 57 77 60 57 63 80 77 59 73 • Xmin: 25 Xmax: 95 95 25 S 11,37 11 1 3,322 log 36 • Serinin sınıf aralıkları 11 birim olacak şekilde gruplanması uygun olacaktır. Bir verinin gruplanmış seriye dönüştürülmesi Notlar Öğrenci sayısı 25 - 36 dan az 2 36 - 47 “ “ 4 47 - 58 “ “ 9 58 - 69 “ “ 12 69 - 80 “ “ 5 80 - 91 “ “ 3 91 - 100 “ “ 1 Çapraz Tablolar • Bazı durumlarda değişkenin iki farklı özelliğinin aynı tabloda eşleştirilmiş olarak gösterilmesi istenebilir. Böyle durumlarda çapraz tablo kullanılır. Tabloda satıra istatistik birimlerin bir özelliği, sütuna diğer özelliği yazılarak ortak eleman sayıları hücrelere yazılmak suretiyle çapraz tablolar oluşturulur. Çapraz tablolar hem niteliksel, hem de niceliksel veriler için oluşturulabilir. Aşağıda MYO öğrencilerinin mezun oldukları lise türü ve öğrenim gördükleri bölümlere göre dağılışı verilmiştir. Bu tablo niteliksel veriler için düzenlenmiş bir tablodur. Çapraz Tablo Örneği Lise Lise Türü Bölümler Çevre Bilgisayar Kalıpçılık Lojistik Makine Mekatronik Düz lise 27 11 16 8 17 9 Anadolu Fen 2 0 0 0 1 0 Ticaret 0 3 5 3 0 2 End. Meslek 0 9 3 5 5 2 Diğer 3 0 3 0 6 3 Toplam 32 23 27 16 29 16 Verilerin Grafiklerle Gösterilmesi •Niteliksel seriler ve Tasnif edilmiş seriler için çubuk diyagramı 1 2 3 Öğrenci sayısı 3 7 10 4 6 5 2 Öğrenci sayısı Notlar Öğrenci sayısının dağılımı 12 10 8 6 4 2 0 1 2 3 Notlar 4 5 Gruplanmış serinin Histogram grafiği Bu grafiğin diğer bir ismi sütun grafiğidir. Grafiğin özelliği sürekli karakterde verilerin grafiği olması sebebiyle histogram sütunların birbirine bitişik olmasıdır Not sınıfları Öğrenci sayısı 26– 37 den az 2 37 – 48 “ “ 4 48 – 59 “ “ 9 59 – 70 “ “ 12 70 – 81 “ “ 5 81 – 92 “ “ 3 92 – 100 “ “ 1 Gruplanmış serinin Histogram grafiği Bu grafiğin diğer bir ismi sütun grafiğidir. Grafiğin özelliği sürekli karakterde verilerin grafiği olması sebebiyle histogram sütunların birbirine bitişik olmasıdır Not sınıfları Öğrenci sayısı 25 – 36 den az 2 36 – 47 “ “ 4 47 – 58 “ “ 9 58 – 69 “ “ 12 69 – 80 “ “ 5 80 – 91 “ “ 3 91 – 100 “ “ 1 Gruplanmış serinin Histogram grafiği • Sınıf aralıkları eşit olmadığı zaman histogramı orijinal seri üzerinden çizmek uygun olmaz. Eğer orijinal seriden hareketle histogram çizilirse olayın dağılışı doğru bir şekilde gösterilemez. Dağılışı daha doğru bir şekilde ortaya koymak için histogram sütunlarının alanını frekansa eşit yapacak şekilde frekansların yeniden ayarlanması yapılır. Yanda öğrenci notları serisi farklı sınıf aralıkları ile verilmiştir Notlar Öğrenci sayısı 0 – 5 den az 10 5 – 7 den az 20 7 – 9 dan az 14 9 - 10 5 Gruplanmış serinin Histogram grafiği Notlar Öğrenci Sınıf Ayarlan sayısı Genişliği mış frek ans 0–5 10 5 10/5 = 2 5–7 20 2 20/2 = 10 7–9 14 2 14/2 = 7 9 - 10 5 1 5/1 = 5 Frekans Eğrisi (Poligonu) Histogram sütunlarının üst orta noktalarından geçen grafiktir. Bu grafik dağılımın şeklini ortaya koymada kullanılan bir grafiktir. Not sınıfları Öğrenci sayısı 25 – 36 den az 2 36 – 47 47 – 58 58 – 69 69 – 80 “ “ “ “ “ “ “ “ 4 9 12 5 80 – 91 “ “ 91 – 100 “ “ 3 1 Dairesel Grafikler • Özellikle niteliksel (sayısal olmayan) değişken değerlerinin grafikle gösterilmesinde kullanılırlar. Dairenin frekanslara açısal olarak paylaştırılması ile elde edilir. Bir birimin açısal karşılığı şöyle bulunur. • 360 360 3 derece Açısal değer Toplam frekans 120 • Her kategorinin frekansı bu 3 ile çarpılarak dairedeki açısal değeri bulunur. Dairesel Grafikler Mezun old. Lise Öğr. sayısı Açısal değer End. Meslek Lis. 50 150 Düz Lise 40 120 20 60 10 30 120 360 Ticaret Lisesi Diğer Liseler Toplam Zaman Serisi Grafiği (Çizgi Grafiği) • Zamana bağlı olarak sabit aralıklarla toplanmış olan verilerin eğilimini ve değişimini izleyebilmek için çizgi grafiklerinden faydalanılır. Grafikte yatay eksen zamanı, dikey eksen ise zaman serisi değerlerini göstermektedir. Zaman serileri artan, azalan, durağan ya da periyodik değişen veya bu özelliklerin bir kısmını içeren verilerden oluşur. Nüfus, gelir, enerji tüketimi, konut sayısı vs. artan zaman serilerine örnek gösterilebilir. Modası geçen, teknolojisi eskiyen ürünlerin satışı azalan zaman serisi niteliğindedir. Konutlarda tüketilen doğalgaz miktarı, meşrubat tüketimi vb. hem eğilimli hem de periyodik değişim gösteren bir özelliğe sahiptir. Artan bir zaman serisi ve grafiği Yıllar X malı fiyatı 2000 12 2001 18 2002 15 2003 20 2004 27 2005 24 Dağılım Grafiği • Aralarında ilişki olduğu düşünülen iki değişkenin birbirine göre nasıl bir değişim gösterdiğini, nasıl bir ilişki içinde olduğunu gösteren grafiklerdir. Genellikle bu değişkenlerden bir etkileyen (bağımsız, açıklayan), diğeri etkilenen (bağımlı, açıklanan) değişken olarak ortaya çıkar. Bir malın fiyatı ile onun talebi arasında ters bir ilişki olduğu düşünülür. Kişilerin gelirleri ile tüketim harcamaları arasında pozitif bir ilişkinin olduğu kabul edilir. Aşağıda öğrencilerin matematik notları ile istatistik notları arasındaki ilişki dağılım grafiği ile gösterilmiştir. Dağılım Grafiği Matematik notu 70 25 40 55 90 15 70 Dağılım Grafiği İstatistik notu İstatistik notu 60 30 50 40 80 20 80 90 80 70 60 50 40 30 20 10 0 0 20 40 60 80 Matematik notu 100 Üç boyutlu grafikler Çapraz tablo şeklindeki verilerin grafikle gösteriminde kullanılır. Bu grafikte dikey eksen frekansları, yatay eksenler ise değişkenin iki özelliğini gösterecek şekilde dizayn edilir. Lise Çevre Bilgisa yar Kalıp çılık Lojis tik Düz lise 17 11 6 8 Ticaret 2 0 0 0 Anadolu 0 3 5 13 EML 0 9 15 5 Diğer 3 0 6 0 KAYNAKLAR 1. Yüksel, İ., ‘İstatistik ve Olasılık Ders Notları’, 2011.