HİSTOGRAM OLUŞTURMA Bir araştırmada elde edilen verilerin küçük gruplara bölünerek sütun grafiğinde incelenmesine histogram denir. Histogram oluştururken, izlenecek adımlar; 1. Veri grubunun açıklığı bulunur. Açıklık, bir veri grubunun en büyük değerinin en küçük değerinden çıkarılması ile bulunur. 2. Veriler kaç gruba ayrılmak isteniyorsa belirlenir. Belirlenmek istenen grup sayısı kişiye özeldir. Herhangi bir grup sayısı belirlenebilir. 3. Grup genişliği bulunur. Grup genişliği, veri grubunun açıklığının, belirlenen grup sayısına bölünmesi ile bulunur. Bulunan sayı ondalık sayı çıkmış ise; ondalık sayıdan büyük, en yakın tam sayı, grup genişliği kabul edilir. 4. Veri grubuna ait tablo oluşturulur. 5. Tabloya göre, veri grubunun sütün grafiği yani histogramı oluşturulur. Örnek ; Bir mağazaya bir ayda gelen günlü müşteri sayısı aşağıdaki gibidir; 19,26,24,18,35,40,16,19,37,12,11,19,11,45,36, 38,23,27, 21,30,12,12,11, 49,48,40,26, 24,27,20 Bu verileri göre mağazaya bir ayda gelen günlük müşteri sayısını gösteren histogramı çiziniz. ÇÖZÜM; Açıklık= en büyük değer – en küçük değer Açıklık = 49-11=38 Grup sayısı keyfi olarak belirlenen. Bu yüzden grup sayısını 10 olarak belirleyelim. Grup genişliği=açıklık : grup sayısı ise grup genişliği= 38:10=3,8 ≅ 4 Grup genişliği yaklaşık 4 olarak belirlendi. Veri grubumuza ait bir tablo oluşturulım; Günlük gelen müşteri genişliği 11-14 15-18 19-22 23-26 27-30 31-34 35-38 39-42 43-46 47-50 Veri sayısı(çetele) IIII I II IIII IIII III 0 IIII II I II Veri sayısı 6 2 5 5 3 0 4 2 1 2 NOT: Tabloyu oluştururken; belirlediğimiz genişliğe dikkat edelim. Grup genişliğini 4 olarak belirledik ve tabloda 11-14, 15-18 gibi arasındaki fark 3 gibi görünen değerler yazdık. Halbuki arasındaki farka balmıyorsunuz. Yazmış olduğumuz genişliğin içindeki sayı miktarına bakıyorsunuz. 11-14 aralığında(genişliğinde) toplam 4 sayı var; 11-12-13-14. Genişliğin anlamı incelediğimiz her bir veri grubudur. NOT: Oluşturduğumuz veri gruplarından en son veri grubunda en büyük değerden daha büyük bir sayı ile bitebilir. En son veri grubundaki hata payı o kadar önemli değil. Şimdi histogramı çizelim; 7 6 5 4 3 2 1 0 11--14 15--18 19--22 23--26 27-30 31-34 35-38 39-42 43-46 47-50 İSTATİSTİKSEL TEMSİL BİÇİMLERİ VE STANDART SAPMA MERKEZİ EĞİLİM ÖLÇÜLERİ: 1. Aritmetik Ortalama: Tüm veri değerlerinin toplanıp, veri sayısına bölünmesine aritmetik ortalama denir. 2. Ortanca : Veri değerlerinin en ortadaki değerine ortanca(medyan) denir. Eğer en ortadaki değer iki sayı olursa, ortanca bu iki değerin aritmetik ortalaması olarak alınır. 3. Tepe Değer: Tüm verilerin arasında en çok tekrar eden değere tepe değer(mod) denir. Verilerin arasında en çok tekrar eden değer bir den fazla olabilir. Bu tür durumda tepe değerimiz birden fazla olarak seçilir. Örnek: 4,5,8,9,6,11,6 sayılarının merkezi eğilim ölçülerini bulunuz. 𝑨𝒓𝒊𝒕𝒎𝒆𝒕𝒊𝒌 𝒐𝒓𝒕𝒂𝒍𝒂𝒎𝒂 = 𝑨𝒓𝒊𝒕𝒎𝒆𝒕𝒊𝒌 𝒐𝒓𝒕𝒂𝒍𝒂𝒎𝒂 = 𝒗𝒆𝒓𝒊 𝒅𝒆ğ𝒆𝒓𝒍𝒆𝒓𝒊𝒏𝒊𝒏 𝒕𝒐𝒑𝒍𝒂𝒎𝚤 𝒗𝒆𝒓𝒊 𝒔𝒂𝒚𝚤𝒔𝚤 𝟒 + 𝟓 + 𝟖 + 𝟗 + 𝟔 + 𝟏𝟏 + 𝟔 𝟒𝟗 = =𝟕 𝟔 𝟕 Tepe değer, en çok tekrar eden değerdir. Dolayısıyla verilerimiz arasında en çok tekrar eden iki defa ile 6 ‘dır. Tepe değerimiz yani modumuz 6 dır. Ortanca verilerimizin en ortasındaki değerdir. Bu durumda verilerimizi küçükten büyüğe doğru sıralamamız gerekir. 4 5 6 6 8 9 11 ortanca Not: Merkezi eğilim ölçüleri sayısal veriler olduğu için iki veya daha fazla grubu karşılaştırırken, merkezi eğilim ölçüleri büyük olan daha büyük verilere sahip olduğu belirtilir. Yani merkezi eğilim ölçüleri ile hangi veri grubunun daha iyi olduğu ya da daha kötü olduğu direk bulunabilir. Özellikle aritmetik ortalaması karşılaştırmada önemli rol oynar. Aritmetik ortalamaları eşit olduğunda ise merkezi yayılma ölçülerinden faydalanılır.Merkezi yayılma ölçüleri ile hangi grubun daha düzenli ya da daha güvenilir olduğu hakkında yorum yapılır. MERKEZİ YAYILMA ÖLÇÜLERİ; 1. Açıklık: Verilerimiz arasındaki en büyük değer ile en küçük değer arasındaki farka açıklık denir. 2. Çeyrekler Açıklığı: Verilerin ortancası bulunur. Veri grubunun solunda yer lan verilerin bir daha ortancası alınır ve bu değer alt çeyrek olarak isimlendirilir. Veri grubunun ortancasının sağında yer alan verilerin bir daha ortancası alınır ve bu değer üst çeyrek olarak isimlendirilir. Üst çeyrek ve alt çeyrek farkına çeyrekler açıklığı denir. 3. Standart Sapma: İki grubu karşılaştırmada artmetik ortalamalar eşit ise standart sapmadan yararlanılır. Standart sapma ne kadar küçük ise verilerin düzenliliği ve güvenirliği o kadar iyi olur. Yalnız iki grup karşılaştırılırken aritmetik ortalaması büyük olan kesinlikle daha iyi bir gruptur. Bu tür durumda standart sapmaya bakmaya gerek yok.Standart sapma aritmetik ortalamaların eşit olması durumunda kullanılır ve standart sapması küçük olan daha iyi olarak nitelendirilir. STANDART SAPMA HESAPLAMASI; İlk önce verilerin aritmetik ortalaması bulunur.Daha sonra her bir veri değerinden bulunan aritmetik ortalama çıkarılır.Çıkan sonuçların karesi alınır ve toplanır. Toplam sonuç karekök içerisinde veri grubunun sayısının 1 eksiği ile bölünür. ÖRNEK; 10,5,15,10,15,10,5 verilerinin merkezi yayılım ölçülerini bulunuz. Sayılarımızı küçükten büyüğe doğru sıralayalım; Alt çeyrek ortanca 5 5 Üst çeyrek 10 10 10 15 15 Açıklık = en büyük değer – en küçük değer = 15-5=10 Çeyrekler açıklığı = üst çeyrek – alt çeyrek =15-5= 10 Burada açıklık ve çeyrekler açıklığı tesadüfen aynı çıktı. Her zaman aynı çıkacak diye bir durum yok kaldı ki genellikle farklı çıkar. Standart sapma, Önce aritmetik ortalamayı bulalım; 𝟓 + 𝟓 + 𝟏𝟎 + 𝟏𝟎 + 𝟏𝟎 + 𝟏𝟓 + 𝟏𝟓 𝟕𝟎 𝑨. 𝑶. = = = 𝟏𝟎 𝟕 𝟕 Şimdi aritmetik ortalamayı her bir veri grubundan çıkarıp karesini alalım; 𝟓 − 𝟏𝟎 = (−𝟓)𝟐 = 𝟐𝟓 Aritmetik ortalamalarının toplamı; 𝟓 − 𝟏𝟎 = (−𝟓)𝟐 = 𝟐𝟓 25+25+0+0+0+25+25=100 𝟏𝟎 − 𝟏𝟎 = (𝟎)𝟐 = 𝟎 𝟏𝟎 − 𝟏𝟎 = (𝟎)𝟐 Veri grubunun bir eksiği 6’dır. =𝟎 𝟏𝟎 − 𝟏𝟎 = (𝟎)𝟐 = 𝟎 𝒔𝒕𝒂𝒏𝒅𝒂𝒓𝒕 𝒔𝒂𝒑𝒎𝒂 = √ 𝟏𝟎𝟎 ≅ √𝟏𝟔, 𝟔𝟔. . ≅ 𝟒, 𝟏 𝟔 𝟏𝟓 − 𝟏𝟎 = (𝟓)𝟐 = 𝟐𝟓 𝟏𝟓 − 𝟏𝟎 = (𝟓)𝟐 = 𝟐𝟓 Standart sapmamızın değeri yaklaşık olara 4,1 çıktı. Eğer iki gurubu karşılaştırıyor olsaydık, diğer gruba da aynı işlemleri yapacaktık ve standart sapması küçük olanı seçecektik. Tabi aritmetik ortalama eşit olması şartıyla.