İSTATİSTİK (STATİSTİCS) NEDİR? Herhangi bir konuyu incelemek için gerekli verilerin toplanması, toplanan verilerin değerlendirilmesi ve bilgi haline dönüşmesini sağlayan bilim dalıdır. İstatistik, tüm evreni (populasyonu) incelemek yerine evrenden seçilen örneği inceleyerek evren hakkında tahminde bulunmayı sağlamaktadır. Çünkü tüm evreni incelemek maddi olarak çok zor olduğu gibi, büyük zaman kayıplarına da neden olmaktadır. O nedenle örnekleme yapılarak, para- zaman- araç-gereç ve personelden tasarruf sağlanmış olur. Ayrıca uzun yıllar gerektiren bir çalışmada örnek yerine tüm evrene ait verilerin toplanması yoluna gidilirse, yıllar sonra toplanmış olan verilerin güncelliğini kaybetme riski de ortaya çıkacaktır. Dolayısıyla yapılan tüm harcama ve geçen zamanın güncel olarak bir değeri 1 olmayacaktır. İstatistik konu olarak tanımlayıcı istatistik ve çıkarımsal istatistik olmak üzere iki ana gruba ayrılır. Tanımlayıcı istatistik: Elde edilen verilerin sınıflandırılması, ortalama ve yaygınlık ölçülerinin hesaplanması, tablo ve grafiklerle sunulmasını içerir. Çıkarımsal istatistik: Örneklemden elde edilen bulgular yardımıyla evren hakkında kestirimde bulunma, hipotezleri test etme ve karara varma gibi konuları içerir. 2 BİYOİSTATİSTİK Biyoloji, tıp ve diğer sağlık bilimlerinde araştırma düzeninin oluşturulması, verilerin elde edilmesi ve değerlendirilmesi ile uğraşan bilim dalıdır. 3 TANIMLAR EVREN (=POPULASYON – ANA KÜTLE) Belirli bir özelliğe sahip bireylerin tümünün oluşturduğu topluluk olarak tanımlanabilir. Örneğin veteriner fakültesi öğrencileri yada veteriner fakültesinin 1. sınıf öğrencileri gibi. Evren büyük – küçük; sonsuz – sınırlı olabilir. PARAMETRE Evreni tanımlamak için kullanılan ölçülere parametre denir. ÖRNEKLEM(E) Evreni temsil ettiği düşünülen bir grubun oluşturduğu topluluğa Örneklem denir. Örneklemi seçmek için yapılan işlemlere de Örnekleme denir. TAM SAYIM Bir araştırmanın populasyonu oluşturan bütün bireylere uygulanmasıdır. 4 DEĞİŞKEN (VARIABLE) Canlıların ve çevrenin her bir özelliğidir. İncelenen parametre, ölçü, veri veya değerdir. Adından da anlaşılacağı üzere incelenecek olan parametre anlık veya dönemsel olarak değişim göstermektedir. Aynı özelliği gösterenlerin oluşturduğu gruptur. (Ör: cinsiyet, ırk, günlük 20 lt.’nin üzerinde süt veren inekler vs.). Değişkenler kantitatif (rakamsal =quantitative) olabildiği gibi, kalitatif (grup, kategori, =qualitative) de olabilir. Ör: Türkiye’deki 10 milyon sığırın 2 milyonu(%20) Simental’dir, 3 milyonu (%30) Holstein’dır. VERİ (DATA) Bir olayı aydınlatmak veya gerçeği ortaya çıkarmak için toplanan rakamlar, sayısal bilgilerdir. İstatistikçilerin üzerinde çalıştığı materyallerdir. Ölçüm, sayım ve gözlem kayıtlarıdır. (Ör: İşletmemizde bulunan ineklerin günlük süt verimleri) 5 Araştırma Nedir? 6 Araştırma Bilinmeyen bir olayı ortaya çıkarmak, bilinenleri geliştirmek, herhangi bir konuyu aydınlatmak, sorunları ortaya çıkarmak ya da sorunlara çözüm yolları aramak için yapılan planlı ve bilimsel bir çalışmadır. 7 Araştırmanın Uygulanması ve Değerlendirilmesi Araştırmanın uygulanması için araştırma kapsamına giren birimler belirlenmelidir. Araştırma birimi, araştırma konusuna göre değişir. Örneğin bir bölgede hane halkı ile ilgili bir araştırma düzenlendiğinde, araştırma birimi hanelerdir. 8 Araştırma konusunu içeren sorular, araştırma birimlerine uygulanır. Araştırma sonunda toplanan veriler istatistiksel yöntemler kullanılarak değerlendirilir. 9 Araştırmaların Temel Amaç ve Yöntemlerine Göre Sınıflandırılması I. Gözlemsel Araştırmalar 1. Tanımlayıcı Araştırmalar 2. Analitik Araştırmalar 1- Vaka-Kontrol Araştırmaları 2-Kohort Araştırmaları 3-Kesitsel Araştırmalar 10 II. Deneysel Araştırmalar Deneysel araştırmalar genellikle klinikte ve laboratuvarlarda yapılır. III. Metodolojik Araştırmalar 11 ARAŞTIRMALARDA DİKKAT EDİLMESİ GEREKEN NOKTALAR Araştırmanın konusu ve amacı belirgin, sınırlı ve güncel olmalı, Araştırıcının yeterli bilgisi olmalı ya da konu ile ilgili uzmanlarla çalışmalı, Kullanılacak analiz metodu doğru seçilmeli, Elde edilen sonuçların bilime ya da uygulama alanlarına katkısı olmalı, Araştırıcının yeterli zamanı, elemanı, techizatı ve maddi kaynağı olmalı, Çalışacak elemanlar iyi eğitilmeli, personelin istenildiği ve öğretildiği gibi çalışıp çalışmadığı kontrol edilmeli, Araştırmada kullanılacak özellikler ve ölçüm belirlenmeli, amaca uygun ölçüler kullanılmalı, hassasiyeti önceden Toplanan bilgiler iyi korunmalıdır. Araştırma devam ederken sık sık değerlendirme yapılmalı ve 12 Deneklerin uygulamaya olan tepkileri kontrol edilmelidir. Deneme hatasını en aza indirilmesi için; Homojen materyal seçimi ve alt gruplara homojen dağıtılması için uygun örnekleme metotları kullanılmalı, Tekrar sayısı veya araştırmada kullanılan denek sayısı artırılmalı, Araştırma özelliğini etkileyen faktörler mümkün olduğu kadar araştırmaya dahil edilmeli, dahil edilemeyen faktörler ise bütün gruplara eşit uygulanmalı, Mekan ve çevre faktörlerinden kaynaklanan farklı etkilerin araştırma materyali üzerine homojen dağılması sağlanmalı ve Zaman faktörünün etkisi de dikkate alınmalıdır. 13 VERİ İncelenen konuya açıklık getirmek amacıyla toplanan bilgiler, belgeler, ölçümler, ... vb. Veri tipleri 1- Ölçümle Belirtilen Sürekli (Nicel) Veriler 2- Sayısal Olarak Belirtilen Kesikli Veriler 3- Nitelik (İsim) Olarak Belirtilen Veriler 14 VERİ TİPLERİ 1- Ölçümle Belirtilen Sürekli (Nicel) Veriler Kandaki kolesterol düzeyi, hayvanların günlük yem tüketimi, yaşı, kilosu gibi. Bu veriler süreklidir ve iki aralıkta değer alabilirler. 120-130 mg/ml veya 10-15 kg/gün gibi. Ölçüm veya tartımla elde edilirler. 2- Sayısal Olarak Belirtilen Kesikli Veriler Ölen hayvan sayısı, iyileşen hayvan sayısı, gebe kalma oranı, nüfus gibi. Bu veriler sürekli ve aralıklı değildir. Yani net bir rakamdır. Sayımla elde edilirler. 3- Nitelik (İsim) Olarak Belirtilen Veriler İyileşti- iyileşmedi, gebe kaldı- kalmadı şeklinde olabildiği gibi, çok iyi-iyi-az iyi-iyi değil gibi sıralanabilen verilerdir. Erkekdişi gibi, saç rengi göz rengi gibi nitelik belirten ve rakamla ifade edilmeyen verilerdir. 1 ve 2. tip veriler kantitatif, 3. tip veriler ise kalitatif niteliktedir. 15 VERİLERİN ELDE EDİLMESİ Temel olarak verileri 5 farklı yaklaşımla elde edebiliriz. 1. 2. 3. 4. 5. ARŞİV TARAMASI GÖZLEM YOLUYLA DENEME DÜZENLENEREK ANKET DÜZENLENEREK YAPAY (SİMULASYON) YOLLARLA 16 Verilerin elde edilmesinde dikkat edilmesi gereken hususlar; 1. 2. 3. 4. Araştırma sonuçlarını etkilemeyecek şekilde, en düşük maliyetle veri elde etmeye çalışılır. İstatistikte her ne kadar %100 doğruluk payı olmasa da verilerin doğruluğu ve güvenilirliği çok önemlidir. O nedenle, bizzat araştırıcı tarafından toplanan verilerin güvenirliği, eski kayıt ve belgelerden toplanan verilerin güvenirliğinden daha fazla olacaktır. Bilimsel araştırmalarda genellikle %95 güven aralığı yeterli olarak kabul edilmektedir. Verilerin en kısa sürede elde edilmesi, sonuçların geçerliliğini yitirmemesi açısından önemli bir kriterdir. Deneysel olarak elde edilecek veriler dışında veriler genellikle anket yoluyla toplanmaktadır. O nedenle düzenlenecek olan anket konunun uzman(lar)ı tarafından hazırlanmalı ve sorular açık, kısa ve mantıklı olmalıdır. 17 Verileri Sınıflandırılması, Tablo ve Grafiklerle Gösterilmesi Veriler elde edildikten sonra bilgi haline dönüştürebilmek ve daha kolay anlaşılmasına yardımcı olmak için sınıflandırılması gerekmektedir. Sınıf sınırı (Alt sınır-üst sınır); örneğin biyometri dersinden 60-70 arası not alanlar denildiğinde alt sınır 60, üst sınır 70’dir. Sınıf aralığı; ard arda gelen iki sınıfın alt ve üst sınırları arasındaki farktır. Örneğin dersten 10-14 arası alanlarla, 15-19 arası alanlar arasındaki sınıf aralığı 5’dir. Sınıf sayısı; 50-60 alanlar, 61-70 alanlar, 71-80 alanlar şeklinde sınıflandırma yapıldığında sınıf sayısı 3’tür. Sınıf sayısının 8 ile 15 arasında olması tercih edilir. 18 Örnek: 20 adet öğrencinin biyometri dersinden aldığı notlar sırasıyla aşağıdaki gibi olsun; 10-12-18-23-24-35-40-44-46-48-55-57-64-70-75-78-81-83-89-90 Dağılım aralığı bulunurken en büyükle en küçük değerin farkı alınır (90-10=80). Bulunan fark önce 8’e (80/8=10) sonra 15’e (80/15=5,3) bölünür. Elde edilen 5,3 ile 10 arasında bir değer sınıf aralığı olarak seçilebilir. Eğer sınıf aralığını 8 alırsak (80/8=10) 10 adet sınıfımız olur. 9 olarak alırsak (80/9=8,8) 9 adet sınıfımız olur. Sınıf aralığını 9 olarak aldığımızı kabul edersek; Sınıflar 10-18; 19-27; 28-36; 37-45; 46-54; 55-63; 64-72; 73-81; 82-90; şeklinde oluşur ve tüm değerler bu sınıfların içerisinde yer alır. 19 Frekans (sıklık); sınıflar tespit edildikten sonra her bir değerin hangi sınıfa gireceğine bakılır. Sınıf Sayısı Sınıflar 1 2 3 4 5 6 7 8 9 10-18 19-27 28-36 37-45 46-54 55-63 64-72 73-81 82-90 Frekans 3 2 1 2 2 2 2 3 3 20 Tablo Nedir? Tablo Düzenlenirken Nelere Dikkat Edilmelidir? Tablo, verilerin satır ve sütunlar halinde sistemli bir şekilde bir arada sunulmasıdır. Tablo düzenlerken dikkat edilmesi gereken noktalar; - Her tablonun mutlaka bir başlığı ve sıra numarası olmalıdır. Bu başlık, tablonun içeriğine uygun olmalı ve fazla uzun olmamalıdır. - Tablodaki birimlerin ölçü birimleri verilmelidir. Eğer tablodaki tüm ölçü birimleri aynı ise o zaman bu ölçü birimi tablo başlığının altına yazılabilir. - Tablodaki satır ve sütunların neyi ifade ettiği başta yazılmalıdır. - Tablolar fazla geniş ve uzun olmamalıdır. Gerekirse tablo 2’ye 3’e bölünmelidir. - Tabloda kullanılan kısaltma varsa tablonun altında belirtilmelidir. Tabloda kullanılan veriler başka bir kaynaktan alınmışsa alınan kaynağa atıf yapılmalıdır. - Tabloda kullanılan veriler açık ve tam olarak yazılmalıdır. 21 TABLO ÇEŞİTLERİ 1. MARJİNAL TABLO: Deneklerin incelenen herhangi bir değişkenin sınıflarına nasıl dağıldığını gösteren tablodur. Örn: 1. sınıf öğrencilerinin Anatomi, Histoloji, Biyoistatistik dersinden aldıkları not ortalamaları 2. ÇAPRAZ TABLO: İki yada daha çok değişkenin birlikte incelenmesidir. 22 Örnek: Türkiye ve Avrupa Birliği’nde yıllar itibariyle hayvansal ürünlerde verim miktarlarına ait rakamlar Tablo. 1’de verilmiştir (3, 6, 7, 8, 9, 10). Tablo 1. Türkiye’de ve AB’de Elde Edilen Verimler (2001-2003) TÜRKİYE AVRUPA BİRLİĞİ Üretim Miktarları ve Ortalama Verimlilikler 2001 2002 2003 2001 2002 2003 Sığır Karkas Verimi (kg/baş) 180 185 176 320 316 318 İnek Süt Verimi (kg/baş/yıl) 1.669 1.705 1.699 5.998 6.075 6.235 Koyun Karkas Verimi (kg/ baş) 18 19 16 14 14 14 Koyun Süt Verimi (kg/ baş/yıl) 49 48 61 128 126 126 23 Grafik Nedir? Grafik Yapımında Nelere Dikkat Edilmelidir? Grafik, bulguların şekillerle ifade edilerek açık ve kolay anlaşılır bir şekilde okuyucuya sunulmasını sağlayan bir araçtır. Grafiklerin en önemli özelliği göze hitap etmesidir. Grafiklerin de tablolar gibi kısa ve açıklayıcı bir başlığı ile numarası olmalı, eksenlerin neyi ifade ettiği belirtilmeli ve kısaltma kullanılmışsa açıklaması yapılmalıdır. 24 Grafik yapımında noktalar; dikkat edilmesi gereken - Her grafiğin mutlaka bir başlığı olmalıdır. Bu başlık, grafiğin içeriğine uygun olmalı ve fazla uzun olmamalıdır. - Eksenlerin neyi ifade ettiği belirtilmelidir. - Grafikte kullanılan ölçekler ve işaretler hakkında açıklayıcı bilgi konulmalıdır. - Grafik karışık olmamalıdır. 25 GRAFİK TÜRLERİ 1- Çubuk Grafik: Frekansların ve yüzdelerin bir çubukla gösterilmesidir. Çubuğun yüksekliği frekansı ve yüzdeyi ifade eder. Grafik 2. Süt sağımında eğitim düzeyine göre eldiven kullanım durumu 20 18 16 14 12 10 8 6 4 2 0 kullanan kullanmayan ilkokul ortaokul lise üniversite 26 Grafik 5. Süt sağımında eğitim düzeyine göre eldiven kullanım durumu 100% 80% 60% kullanmayan kullanan 40% 20% 0% ilkokul ortaokul lise üniversite 27 2- Çizgi Grafik: Genellikle bir değişkenin belirli bir süre içinde gösterdiği değişiklikleri incelemek için çizilen grafik türüdür. Grafik 1. İMKB’de İşlem Gören İki Farklı Hisse Senedi Fiyatları 4000 3500 3000 2500 sağlam 2000 spekülatif 1500 1000 500 0 1 2 3 4 5 6 7 8 9 10 11 28 3-Daire Grafikleri: Daha çok gelir, harcama, persenol, vb. dağılımlarda başvurulan bir grafik türüdür. Örn: Hayvancılık İşletmesinde Giderlerin Dağılımı Yem gideri : %70 360x70/100= 252 derece İşçilik gideri : %15 360x15/100= 54 derece Veteriner gideri: %5 360x 5/100= 18 derece Diğer giderler: 360x10/100= 36 derece %10 29 Grafik 11. Hayvancılık İşletmesinde Giderlerin Dağılımı 10% 5% yem 15% işçilik veteriner diğer 70% 30 4-Histogram Sürekli değişknler için çizilir. Sürekli değişknlerde sınıflar birbirine geçişli olduğu için çubuklar bitişiktir.Veri setinin frekans dağılımıdır. 31 Örnek: Veteriner Fakültesi Çiftliğinde bulunan 80 koyunun yapağı verimleri 1000 gr ile 1800 gr arasında değişsin. 5 koyun 1000-1100 gr, 7 koyun 1101-1200, 10 koyun 1201-1300 gr, 15 koyun 1301-1400 gr, 19 koyun da 1401-1500 gr 10 koyun 1501-1600 gr, 8 koyun 1601-1700 gr ve 4 koyun da 1701-1800 gr yapağı verirse histogramı nasıl çizilir? 32 5- Dağılım Poligoni: Histogramda çubukların orta noktalarından geçecek şekilde çizgiler çizilirse elde edilecek şekil dağılım poligonu adını alır. 33 Örnek: Veteriner Fakültesi 1.sınıfta öğrenim gören 65 öğrencinin boy uzunluğunu tahmin edebilmek için seçilen 20 öğrencinin boy uzunluğu ölçülmüş ve 1.60-1.80 cm arasında olduğu tespit edilmiştir. Evren (Popülasyon)? Örnek sayısı kaçtır? İncelenen değişken nedir? Boy uzunluğu nasıl bir veridir? 34 FREKANS DAĞILIMLARINI TANIMLAYICI ÖLÇÜTLER 1. YER GÖSTEREN ÖLÇÜTLER a. Merkez ölçütleri: Ortalamalar b. Çeyrek ve yüzdelikler 2. YAYGINLIK ÖLÇÜTLERİ a. Standart sapma b. Varyans c. Varyasyon katsayısı d. Standart hata 35 ORTALAMALAR Tanım: Ortalama, sayısal veriler topluluğunun orta noktasını bir kalemde özetleyen veya belirten tipik bir değerdir. Ortalama, merkezde toplanma eğiliminin ölçüsüdür, şeklinde de tanımlanabilir. Ortalama, dağılışları özetleyen tipik bir merkezi eğilim ölçüsüdür. FAYDALARI Ortalamalar, seride bulunan bütün değerleri hatırda tutma zahmetinden kurtarır. Bunlar, sayısal veriler topluluğunun kolay bir şekilde anlaşılmasına yardımcı olurlar. 36 Ortalamalar, rastgele nedenlerin etkilerine daha az maruz kalırlar. Bunlar, olaylardaki normal durumu daha iyi yansıtırlar. Ortalama, normal durumun bir ölçüsü olarak kabul edilir. Örneğin, her hangi bir öğrencinin bilgi düzeyini, tek dersten almış olduğu not değil, okumuş olduğu ve sınavım verdiği tüm derslerden aldığı notların ortalaması gösterir. Ortalamalar, genel örneğe, alışılmışa, kurala aykırı olan durumların bir ölçüsüdür. Olaylardaki bu anormal durumlar, ortalamalar ile çoğu kez açıklığa kavuşturulur. Örneğin, Van şehir merkezinde, 1984-85 Kış mevsiminde, bir yıl öncesine oranla daha soğuk geçtiğini, 1984-85 yılı Kış aylarında ölçülen sıcaklık dereceleri ortalamasının, 1983-84 Kış mevsimi ısı derecesi ortalaması ile karşılaştırılması sonucu söylenebilir. Ortalamalar, kıyaslama vasıtalarıdır. Mevcut iki serinin birbirleriyle mukayesesi, ancak, bunların ortalama değerlerinin karşılaştırılması ile mümkündür. 37 Ortalamaların sakıncaları Sayısal verilerin azlığında ortalamalar her hangi bir anlam taşımaz. Örneğin bir portakal yiyenle hiç portakal yemeyen iki kişiyi, yarım portakal yemiş gibi göstermek oldukça hatalıdır. Ortalamalar, sayısal bilgiler arasındaki farkları bazen ortadan kaldırabilirler. Örneğin istatistikten 2, Almanca’dan l0 numara almış olan bir öğrencinin not ortalaması 6'dır. Bu ortalama değer, öğrencinin istatistik ve almanca derslerine karşı yeteneğinin orta olduğunu, oysa bu öğrencinin istatistik dersine karşı yetenekli olmadığı, zayıf olduğu, Almanca’ya karşı ise yetenekli olduğu ve bu yeteneğinin pekiyi dereceyle ifade edildiği görülür. Ortalamalar, bazen gerçeği tam olarak yansıtmazlar; gerçeğe aykırı bilgi verirler. Örneğin 500 kişilik bir köyde, kişi başına düşen geliri hesaplamak istiyoruz. Bu kişilerin yıllık gelirleri 50 milyon ile 100 milyon arasında olsun ve bu köye yıllık geliri 500 milyon olan başka birisinin taşındığını varsayalım. Bu örnekte, köyün birey nüfusa düşen yıllık gelir ortalaması hesaplanmak istense, bu değerin, köyde yaşayan kişilerin gerçek gelirini yansıtmadığı görülür. 38 Ortalamaların bu sakıncalarından kaçınmak için, şu noktalara dikkat etmek gerekir: Ortalama, sayısal verilerin fazla olduğu durumlarda hesaplanır. Çünkü, sayısal verilerin azlığında, ortalama rastgele ortaya çıkan bazı nedenlerin etkisi altında kalabilir ve normal durumu yansıtmayabilir. Seriyi meydana getiren değerler farklı olmamalıdır. Örneğin Japon ve İngiliz çocuklarının devam ettiği İlkokulun her hangi bir sınıfındaki öğrencilerin boylarının ortalamasını hesaplamak istesek, seriyi oluşturan gruplarda farklılık olduğu, yani, Japon ırkının genelde boylarının kısa, İngilizlerin ise uzun olduğu için, her iki öğrenci grubunu temsil edecek olan ortalama, gerçek değerden ayrı bir noktada olacaktır. Anormal değerleri ihtiva eden serilerin ortalaması alınmamalıdır; yahut da bu mahsuru ortadan kaldıracak başka metotlar uygulanmalıdır. 39 Ortalama Türleri: İstatistikte çok değişik ortalama tipleri vardır. Bunlardan en fazla kullanılanları, Aritmetik Ortalama, Geometrik Ortalama, Harmonik Ortalama, Karesel Ortalama (Kadratik Ortalama), Medyan (Ortanca), Mod (Tepe Noktası)’dur. 40 ARİTMETİK ORTALAMA Uzun süreden beri kullanılan, ortalamalar içinde en iyi bilinen ve en yaygın olan bir ortalama çeşididir. Ortalama denildiğinde, genelde akla aritmetik ortalama gelir. Deneklerin aldıkları değerlerin toplanıp denek saysınına bölünmesi ile elde edilen matematiksel gerçel bir değerdir. Bu nedenle Aşırı dğerlerden etkilenir. Örnekten hesaplanan aritmetik ortalama, X sembolü ile gösterilir. Hesaplanması kolay ve serinin şekline göre değişir. 41 l- Aritmetik Ortalamayı Hesaplama Metotları a) Sınıflandırılmamış verilerde aritmetik ortalamanın hesaplanması Burada; deneklerin aldıkları değerler (Xı, X2, X3 ......... Xn) tek tek toplanır, bulunan toplam,denek sayısına bölünür. Formül; n n tane deneğin aldıkları değerlerin toplanacağı gösterir X x i 1 n i i. Deneğin aldığı değer Aritmetik ortalama Denek sayısı 42 ÖRNEK: E.Ü. Veteriner Fakültesi birinci sınıf öğrencilerinden rastgele seçilen 20 Öğrencinin 2006 yılında yapılan üniversite giriş sınavında almış oldukları sayısal puanlarının dağılımı aşağıda verilmiştir. Öğrencilerin almış oldukları fen puanlarının aritmetik ortalaması nedir? Öğrenci Sıra No: Fen Puanları (X) öğrenci sıra no: Fen Puanları (X) 1 322 11 325 2 315 12 337 3 325 13 324 4 322 14 312 5 314 15 325 6 327 15 315 7 342 17 332 8 327 18 332 9 349 19 317 10 306 20 315 Toplam 6483 6483/20=324,15'dir 43 b) Sınıflanmış verilerde aritmetik ortalamanın hesaplanması Eğer, sayısal veriler fazla ise, bu değerlerin aritmetik ortalamasını bulmak zorlaşır. Çünkü, sayısal veriler çoğaldıkça, basit bir toplama işlemi bile fazla zaman alır ve hata yapma ihtimali artar. Örneğin 20-30 bin kadar bir gözlemin, sayısal verinin aritmetik ortalamasını yukarıdaki formülün yardımıyla bulmak, hesap makinası ile bile, bir hayli zordur ve de oldukça uzun zaman alır. İşte bu nedenle, fazla sayıdaki verilerin aritmetik ortalamasını bulmak için, veriler, önce bir frekans dağılımı şeklinde gruplandırılır. Bu gruplandırma işlemi tamamlandıktan sonra, ancak gruplandırılmış verilerden aritmetik ortalama hesap edilir. 44 Hesaplama Metodu 1. Frekansları ile birlikte Sınıflar yazılır, 2. Sınıf değerleri (SD) bulunur ve her sınıfın karşısına yazılır. Sınıf değeri sınıfın ortalamasıdır. 3. Çalışma birimi “b” kolonu oluşturulur. Yukarı doğru “-” aşağı doğru “+” olacak şekilde 1 artırarak yazılır. 4. Frekansla çalışma birimleri çarpımları (f*b) alınarak her sınıfın karşısına yazılır. İşaretleri dikkate alınarak toplanır. 5. Değerler formüle yerleştirilir. 45 Formül; B kolonunda karşısına 0 konulan sınıfın sınıf değeri X A f* b toplamı fb n xC Sınıf Aralığı Aritmetik ortalama Denek sayısı 46 Örnek: Bir çiftlikte 1 - 3 kg arasında yapağı veren 300 baş koyunun yıllık yapağı verimleri şöyledir. Bu dağılımın aritmetik ortalaması nedir? f Yapağı verimi (gr) 1000 - 1199 10 1200-1399 12 1400-1599 18 1600-1799 40 1800-1999 45 2000 - 2199 60 2200 - 2399 46 2400 - 2599 34 2600 - 2799 25 2800 - 2999 10 300 47 yapağı verimi (gr) f 1000 - 1199 SD b fxb 10 1100 -5 -50 1200-1399 12 1300 -4 -48 1400-1599 18 1500 -3 -54 1600-1799 40 1700 -2 -80 1800-1999 45 1900 -1 -45 2000 - 2199 60 2100 0 0 2200 - 2399 46 2300 +1 46 2400 - 2599 34 2500 +2 68 2600 - 2799 25 2700 +3 75 2800 - 2999 10 2900 +4 40 -48 300 48 X 2100 x 200 300 2068 48 TARTILI VEYA AĞIRLIKLI ARİTMETİK ORTALAMA Bazı durumlarda serilerdeki terimler arasında önem dereceleri bakımından farklılıklar bulunabilir. Eğer ortalamanın hesaplanmasında bu farkların dikkate alınması gerekiyorsa ve de istenmiş ise, her terime veya değere, önem derecesi ile orantılı olmak üzere bir katsayı veya ağırlık verilmesi şarttır. Böyle dağılımlarda ortalama hesap edilirken, ortaya katılacak ferdi değerlerin nispi önemlerinin dikkate alınmaması, bizi, yanıltıcı sonuçlara götürebilir.Ağırlıklı veya tartılı aritmetik ortalama, ancak birimlerin her birinin değerine verilen önemin farklı olması durumlarında kullanılır. 49 Örnek: Fakültemizdeki bir öğrencinin birinci sınıfta okuduğu çeşitli derslerden aldığı notlar ve bu derslere ilişkin kredi saatleri veya haftalık ders saatleri aşağıdaki verilmiştir. Bu dağılımın ağırlıklı aritmetik ortalamasını bulunuz. Dersin Adı Haftalık ders saati/ kredi (t) Alınan Not (X) Fizik 5 70 350 Anatomi 4 60 240 Kimya 4 80 320 İstatistik 2 85 170 İngilizce 3 65 195 Biyoloji 1 90 90 TOPLAM 19 450 1.365 t.X Ağırlıklı Aritmetik Ortalama = 1.365/19 = 71,84'dür. Oysa, cetveldeki değerlere göre çeşitli derslerden alınan notların tartısız ortalaması; 450/6= 75’dir. 50 GEOMETRİK ORTALAMA Birim değerlerinin (gözlem sonuçlarının) birbirleriyle çarpımlarının, n birim sayısı olmak üzere, n’ inci dereceden köküne denir. Birim değerleri X1, X2, ... , Xn gibi gösterilirse geometrik ortalama aşağıdaki gibi yazılır: İstatistiksel araştırmalarda gözlem sonuçları arasındaki oransal farkların mutlak farklardan daha önemli olduğu durumlarda geometrik ortalamaya başvurulur. Diğer bir ifade ile gözlem sonuçlarının her biri bir önceki gözlem sonucuna bağlı olarak değişiyorsa ve bu değişmenin hızı saptanmak istenirse geometrik ortalama sağlıklı sonuçlar verir.Geometrik ortalama bulmak veri değerlerinin pozitif olmasi gerekir. Yukarıdaki formülden de anlaşılacağı üzere gözlemlerden birisinin değeri sıfır veya negatif ise, geometrik ortalama hesaplanmaz. Geometrik Ortalamanın Özellikleri -Geometrik ortalama, aritmetik ortalama gibi, hesapla bulunan bir ortalamadır ve ortalamaya katılan tüm değerler tarafından belirlenir. -Geometrik ortalama, aşırı değerlerden, aritmetik ortalamaya oranla, daha az etkilenir; yani, serideki aşırı büyük değerlere karşı, aritmetik ortalama kadar hassas değildir. Bu nedenle, böyle değerler ihtiva eden seriler için, ortalama hesaplanmak istenmişse, geometrik ortalama tercih edilmelidir. -Geometrik ortalama, aritmetik ortalamadan daha küçük çıkar. -Terimler arasındaki fark büyüdükçe, geometrik ortalama ile aritmetik ortalama arasındaki fark artar. Aksine, terimler arasındaki fark azaldıkça, aritmetik ortalama ile geometrik ortalama arasındaki fark azalır. -Değerler arasındaki farklar büyüdükçe, geometrik ortalama aritmetik ortalamadan uzaklaşır. Bu nedenle de, serideki terimler arasında çok büyük farkların bulunması durumunda, geometrik 52 ortalamanın kullanılması daha uygun olur. ÖDEV 1. 2. 3. Aritmetik ortalama ? Verileri sınıflandırıp, sıklık tablosunu oluşturun. Sınıflandırılmış verilerde ortalama hesaplayın? 53 MEDYAN (ORTANCA) • Dağılımın orta noktasındaki değer olarak tanımlanır. • Veriler küçükten büyüğe doğru dizildiğinde, serinin tam ortasında bulunan değere medyan veya ortanca adı verilir. • Büyüklük sırasına göre düzenlenmiş bir sayı setinin medyanı, orta değer veya iki orta değerin aritmetik ortalamasıdır. , • Medyan, bir dağılımı iki eşit parçaya bölen birim değeri olduğu, hesabında sadece tam ortaya rastlayan değeri dikkate aldığı, diğer terimleri hesaplama dışı bıraktığı için, analitik olmayan bir ortalamadır. 54 l – Sınıflanmamış verilerde Medyanın Hesaplanması Medyanı hesaplamak için, veriler, küçükten büyüğe doğru dizilir, tam ortaya isabet eden değer, medyan olarak kabul edilir. • Ancak, denek sayısı çift ise, tam ortaya bir birim düşmeyecektir. Böyle durumda, ortadaki iki değerin aritmetik ortalaması medyan olacaktır. • Örneğin, yaşları 5, 7, 8, 10, 12,15 ve 20 olan 7 çocuklu bir ailede ortanca yaş, dizide tam ortaya düşen dördüncü kardeşin yaşını gösteren 10 değeridir. • Eğer bu aileye yeni bir çocuk daha katılacak olursa, o zaman çocuk sayısı çift, yani 8 olacak; 1, 5, 7, 8, 10, 12,15 ve 20 tam ortaya 8 ve 10 yaşlarında iki çocuk rastlayacak, medyan yaşta, bu iki çocuğun yaşlarının aritmetik ortalaması 8+10/2 =9 olacaktır. 55 Sayısal verilerin fazla olmadığı durumlarda yukarıdaki hesaplamalar kolay ve de medyanın bulunması gayet basittir. Ama, sayısal verilerin fazlalığında, ortancanın bulunması oldukça güçleşir. Veri sayısı tek ise (n + l / 2). değer medyandır. Veri sayısı çift rakam ise, (n / 2). ve (n+2 / 2). değerlerin aritmetik ortalaması medyandır. Örnek: 25 trafik kazasında vakasında sürücü yaşları şöyledir: (10, 16, 19, 21, 24, 24, 25, 22, 21, 20, 20, 11,14, 16, 17, 15, 15, 19, 18, 21, 20, 23, 23, 28, 26) Burada, medyan değeri bulabilmemiz için, önce verileri aşağıdaki gibi küçükten büyüğe doğru dizeriz. 10, 11, 14, 15, 15, 16, 16, 17, 18, 19, 19, 20, 20, 20, 21, 21, 21, 22, 23, 23, 24, 24, 25, 26, 28 Yukarıdaki örnekte veri sayısı tek (25) olduğu için, tam ortaya bir birim düşmektedir. Bu değer medyandır. 56 l – Sınıflanmış verilerde Medyanın Hesaplanması • • • • Sınıflar yazılır Her sınıfın Frekansı yazılır. Yığılımlı frekan s (Yf) bulunur. Sınıflanmış verilerde Medyan formulü: Medyanın içinde bulunduğu sınıfın bir üstündeki sınıfın Yığılımlı frekansı Sınıf aralığı Medyanın içinde bulunduğu sınıfın frekansı Medyanın içinde bulunduğu sınıfın SAD 57 f Yapağı verimi (gr) Yf 1000 - 1199 10 10 1200-1399 12 22 1400-1599 18 40 1600-1799 40 80 1800-1999 45 125 2000 - 2199 60 185 2200 - 2399 46 231 2400 - 2599 34 265 2600 - 2799 25 290 2800 - 2999 10 310 300 Medyan : n/2= 150 185 : Yf bulunduğu sınıfta yer alıyor. L= 1999+2000/2=1999,5 Yf =125 f= 60 C=200 =2082,8 58 Medyanın Uygulanma Alanı ve Özellikleri 1-Ortancanın hesaplanması, özellikle basit serilerde çok kolaydır. Verileri ayrı ayrı değerlendirmeye katmadan medyan hesaplanabilir. Örneğin bir sınıftaki öğrencilerin ortalama boy uzunluğunu tespit etmek için, öğrencilerin boylarını ayrı ayrı ölçmeye gerek kalmadan, bunları küçükten büyüğe doğru sıralar, yani öğrencileri boy sırasına göre dizer, terim sayısı tek ise, en ortadaki öğrencinin boyunu, çift ise en ortada kalan iki öğrencinin boylarını ölçer, aritmetik ortalamasını bulur, böylece medyanı, yani ortalama boy uzunluğunu kolayca hesaplayabiliriz. 2-Medyan, örnekteki gözlem sayısından etkilenir. Örnekteki uç değerlerden , aşırı değerlerden pek etkilenmez. Daha doğrusu, aritmetik ortalama kadar hassas değildir. Bu nedenle anormal değerleri, çok küçük veya çok büyük değerleri kapsayan örneklerde, seriyi en iyi temsil edebilecek ortalama medyandır. Böyle durumlarda aritmetik ortalama, gerçeği yansıtmayabilir. Örnek: Bir bulaşıcı hastalığın kuluçka süresi 4, 5, 6, 6, 7, 7, 8, 8, 30 gün olarak gözlenmiş ise; bu hastalıkta ortalama kuluçka süresi aritmetik ortalamaya göre, X =81/9 = 9 gün; medyana göre ise 7 gün olarak bulunur. Bu ve benzer örneklerde ortalamanın hesaplanmasında, medyanın kullanılması daha doğru olur. 59 3-Bazı dağılımlarda alt veya üst değerler ya da hem alt ve hem de üst değerler belirsizdir. Böyle açık sınıflı seriler için, diğer ortalamalar, gerçekten oldukça uzaklaşır. Çünkü bu hesaplamalarda belirsiz olan sınıf hudutlarının tahmini olarak tayini söz konusudur; ve yapılacak bu tahminler, şahıslara göre de değişebilecektir. Bu nedenle, açık sınıflı serileri temsil edebilecek en iyi ortalama çeşidi, medyandır. Sıraya dizilen veriler arasında açıklık veya eksiklik varsa, örneğin bir dağılımdaki ferdi değerler 35, 40, 43, 50, 51, 60, 63, 65, 70 biçiminde ise, ortalama değer olarak, beşinci terim 51, seriyi en iyi şekilde temsil etmektedir. Serinin iki veya bir ucunun açık bırakıldığı durumlarda, örneğin 50'den az, 100'den yukarı gibi durumlarda, medyan, ortalama değer olarak seriyi daha iyi temsil edebilmektedir. 4-Medyanın aritmetik bir özelliği yoktur. Çünkü hesaplanmasında bütün birimler rol oynamaz. 60 MOD (TEPE DEĞERİ) Mod, bir dağılımda en fazla tekrar edilen, en çok gözlenen değerdir. Mod, en büyük frekansına karşılık gelen terimdir. Mod, bir dağılım içinde en popüler değeri gösterir. Modun, en fazla kullanılan, veya yaygın olan ya da sık görülen anlamlarına gelen moda kelimesi ile yakın bir ilişkisi vardır. Bu nedenle de mod, moda olan, göze en çok görülen değer olarak da tanımlanabilir. Mod, bir frekans dağılımının pozisyonunu ve eğilimini belirlemede, en fazla kullanılan merkezsel eğilim ölçülerinden birisidir. Uygulamada, bazı alanlarda diğer ortalamalara oranla, mod, daha çok kullanılır. Örneğin sanayi işletmelerinde görülen iş kazalarının temel nedenlerinin araştırılmasında, tepe değerinden yararlanılır. Hazır giyim sanayiinde, elbise ve ayakkabıların hangi ölçülerde ne miktarda üretileceği konusunda moddan faydalanılır. Esasında moda kelimesi de buradan kaynaklanır. Mod, eğer bir değişkenin almış olduğu değerlerden her hangi birisi, diğerlerine oranla daha fazla gözlenirse, o zaman bir anlam taşır. Tepe değeri, özellikle verilerin simetrik dağılım göstermedikleri durumlarda iyi bir yer ölçüsü olmaktadır. 61 Modun Hesaplanması Basit serilerde modun bulunması gayet kolaydır. Burada, bir dağılımda en fazla tekrarlanan gözlem değeri mod olarak kabul edilir. Örneğin 10 hastanın kan basıncı (mm / Hg olarak) 135, 140, 150, 140, 145, 140, 11, 100, 120, 130 ise; bu dağılımın modu, en fazla gözlenen değer 140 mm/Hg'dir. Özellikleri 1-Bazı serilerde modun bulunması mümkün değildir. Örneğin bir serideki değerlerin dağılımı l, 2, 3, 4, 5, 6, 7, 8, 9, 10 şeklinde ise, bu serinin modu yoktur. Çünkü, tüm değerler eşit sayıdadır. 2- Bir dağılımda tepe değeri olabilecek birden fazla değer görülüyorsa, ortalama değer olarak mod kullanılmamalıdır. Örneğin sınıfımızdan rastgele seçtiğimiz 29 öğrencinin boyları cm olarak 154, 156, 158, 160, 164, 164, 165, 165, 165, 166, 166, 167, 168, 168, 168, 169, 169, 170, 170, 170, 171, 173, 173, 176, 178, 179, 180, 185 cm ise, böyle bir dağıtımda tepe değer olabilecek 3 değer (165, 168, 170) vardır. Oysa, birbirinden farklı bu üç değerin, üçünü de mod olarak kullanmanın her hangi bir anlamı yoktur. 62 Aritmetik ortalama, medyan, mod arasındaki ilişki: •Simetrik dağılımlarda ortalama, medyan, mod birbirine eşittir. X=Mod=Medyan •Sağa Çarpık dağılımlarda X>Medyan>Mod •Sola Çarpık dağılımlarda X<Medyan<Mod 63 ORTALAMA TİPİNİN SEÇİMİ 1-Ortalama tipinin seçiminde, kalıplaşmış her hangi bir kural yoktur. Ancak, uygun bir ortalama çeşidinin seçimi, bazı özelliklerin dikkate alınması ile mümkündür. 2-Ortalama tipini tayinde, araştırmanın önemi ve ortalama hesaplamanın amacı, en önde gelen faktörler arasında yer alır. Ortalamaların kullanılış yerleri farklı olduğuna göre, o amacı en iyi biçimde yerine getirecek olan ortalama çeşidini seçmek gerekir. 3-Eğer verilere ileri istatistik analizler uygulanacaksa, aritmetik ortalama tipinin kullanılması daha uygundur. Ortalama karşılaştırma amacıyla hesaplanmak işlenmişse, aritmetik ortalama tercih edilir. Çünkü aritmetik ortalama, bütün değerler tarafından belirlenen en duyarlı ortalama çeşididir. 4-Dağılımdaki değerlerden yalnız bilgi edinmek isteniliyorsa, yerine göre medyan ya da mod kullanılır. Çünkü, bunlar, aritmetik ortalama kadar uç değerlerden etkilenmez. 5-Terimlerin kendileri yerine, oranları bizi ilgilendiriyorsa, serinin geometrik ortalaması hesaplanır. 64 6-Sıfır veya negatif değerlere sahip serilerde geometrik ortalama hesaplanamaz. 7-Aşırı değerler ihtiva eden seriler için, aritmetik ortalama uygun olmaz. 8-Ortalama tipinin seçiminde, yukarıdaki bazı ilkeler yanında, ortalamanın hesabındaki kolaylık ya da zorluk da dikkate alınmalıdır. 9-Ayrıca, hangi ortalama tipi seçilirse seçilsin, serideki terimler arasında bir önem farkı bulunuyorsa, o ortalamanın tartılı şekli hesaplanmalıdır. 65 Aşağıda en uygun ortalama tipinin seçimiyle ilgili bazı örnekler verilmiştir. l- Aşağıdaki basit seri için hangi ortalama tipi daha uygundur? Neden? 2, 6, 20, 190, 180, 25, 27, 30, 40, 13, 12, 16, 205, 90, 180, 200, 250, 230, 18, 15 Geometrik ortalamanın kullanılması daha uygun olur. Seri terimleri arasında büyük farklar vardır. 2- Konya ilinde geçen hafta ölçüler hava sıcaklıkları dağılımı aşağıda verilmiştir. Bu değerlere hangi ortalama uygulanamaz. 0, l, 3, 5, 7, 10, 16, 20 Geometrik ortalama 66 ÖRNEK: Bir çiftlikteki koyunlardan örnek olarak seçilen 26'sının hemoglogbin değerleri aşağıda verilmiştir. Bu veriler için ortalama, mod, medyan hesaplayınız, aralarındaki ilşkiyi grafik ile belirtiniz. (11.0, 11.2, 11.3, 11.4, 11.4, 11.5, 11.6, 11.7, 12.5,13.0, 12.9,11.5, 12.7, 13.8, 14.0, 12.7, 11.8, 11.8, 11.9, 11.9, 12.0, 12.1, 12.2, 12.3, 10.9, 11.1, 12.5, 11.9, 13.7, 13.8) . 67 Aşağıdaki dağılımlardan hangisinde medyanı kullanmak daha doğrudur? a-9, 22, 30, 21, 20, 32, 17, 14, 29, 53, 6, 60, 18, 15, 23, 21, 27 b-164, 169, 169, 170, 171, 167, 135, 170, 168, 170, 180, 159, 167, 175 c-11.9, 11.8, 11.3, 11.7, 11.6, 11.5, 11.4, 11.6, 12.4, 13.6, 11.1, 13.3 d-210, 212, 211, 210, 208, 212, 213, 214, 212, 214, 210, 220, 225 e-111, 114, 115, 112, 113, 110, 117, 116, 117, 119, 117, 120, 122, 125 a seçeneğindeki verilere ortalama hesabında, medyanın uygulanması daha doğru olur. Çünkü burada, dağılımı etkileyebilecek aşırı değerler (6, 9, 53, 60) vardır. 68 ÇEYREK VE YÜZDELİKLER Çeyrek ve yüzdelikler dağılımın herhangi bir noktasını gösterir. Örneğin, 1. çeyrek 25. yüzdeliktir. 2. çeyrek 50. yüzdeliktir yani medyandır. 3. çeyrek 75. yüzdeliktir. 69 Sınıflanmış verilerde Çeyrek ve Yüzdeliklerin hesabı •SAD bulunur. Bir üsteki sınıfın üst sınırı ile bir alttaki sınıfın alt sınırının ortalamasıdır. •….. Den az kolonu oluşturulur. Her SAD’dan az kaç denek olduğu sayı ve % ile yazılır. • Formül: Den az % kolununda X1 Verilen yüzde düştüğü aralığın üstündeki % değer X2 nin SAD X3 nin SAD Den az % kolununda X1 düştüğü aralığın altındaki % değer 70 Sınıflanmış verilerde Çeyrek ve Yüzdeliklerin hesabı SAD …den az Sayı % f Yapağı verimi (gr) 1000 - 1199 10 999,5 0 0 1200-1399 12 1199,5 10 3,33 1400-1599 18 1399,5 22 7,33 1600-1799 40 1599,5 40 13,33 1800-1999 45 1799,5 80 26,66 2000 - 2199 60 1999,5 125 41,66 2200 - 2399 46 2199,5 185 61,66 2400 - 2599 34 2399,5 231 77 2600 - 2799 25 2599,5 265 88,33 2800 - 2999 10 2799,5 290 96,66 300 71 Soru: Koyunların % 25 ‘ i hangi değerden daha az değer almışlardır. X1= 25 X2 = 13,33 X3 = 26,66 X2 SAD=1599,5 X3 SAD= 1799,5 X= 1774,5 72 Soru: Koyunların % 60 ‘ i hangi değerden daha az değer almışlardır. 73 DAĞILIMIN YAYGINLIK ÖLÇÜLERİ 1. Standart Sapma ve Varyans 2. Varyasyon Katsayısı 3. Standart Hata 1- Standart Sapma ve Varyans Aritmetik ortalama dağılımın orta nokta noktasını gösteren bir ölçüdür. Ancak dağılımın yaygınlığı hakkında bilgi vermez. 10 21 22 23 34 22 ORTALAMA: 66/3=22 ORTALAMA: 66/3=22 Standart sapma (S): Dağılımdaki her bir değerin ortalamaya göre ne derece uzakta olduğunu, başka bir ifade ile dağılımın ne yaygınlıkta olduğunu gösteren bir ölçüdür. Bir dağılımda değerler ortalamdan uzaklaştıkça dağılımın yaygınlığı artar. Standart sapmanın karesi varyans (S 2)olarak adlandırılır. % 68,2 % 95,4 % 99,6 76 Sınıflandırılmamış Verilerde Standart Sapma 1. 2. 3. Deneklerin aldıkları değerler toplanır Deneklerin aldıkları değerlerin kareleri alınarak toplanır. Formülde yerine konur. 2 n x i i 1 x n S Kareleri toplamı i 1 2 i n 1 Değerleri toplamı Örnek : 30 adet Laboratuvar faresinin hemoglobin değerlerinin standart sapması kaçtır. Denek No Hb Xi Hb Xi2 1 13,0 169,00 366 2 2 13,6 184,96 3 14,0 196,00 . . . . . . 29 15,0 225,00 30 10,3 106,09 Toplam 366,0 4523,26 S 4523,26 30 1 30 1,41 78 Sınıflandırılmış Verilerde Standart Sapma 1. 2. 3. 4. 5. 6. 7. Frekansları ile birlikte Sınıflar yazılır, Sınıf değerleri (SD) bulunur ve her sınıfın karşısına yazılır. Sınıf değeri sınıfın ortalamasıdır. Çalışma birimi “b” kolonu oluşturulur. Yukarı doğru “-” aşağı doğru “+” olacak şekilde 1 artırarak yazılır. Frekansla çalışma birimleri çarpımları (f*b) alınarak her sınıfın karşısına yazılır. İşaretleri dikkate alınarak toplanır. Çalışma biriminin “b” nin karesi alınır her sınıfın karşısına yazılır. Her sınıfın frekansıkendi b2 değeri ile çarpılarak f*b2 kolonu oluşturulur. Değerler formülde yerine konur. fb 2 fb 2 S c n 1 n Örnek : Belirli bir süre beslenen sığırların canlı ağırlık artışının standart sapmasını hesaplayınız . Ağır.Art f b fb b2 fb2 15-19 50 -3 -150 9 450 20-24 75 -2 -150 4 300 25-29 100 -1 -100 1 100 30-34 150 0 0 0 0 35-39 90 1 90 1 90 40-44 70 2 140 4 280 45-49 45 3 135 9 405 toplam 580 -35 fb 2 S c fb 2 n 1 n 35 1625 2 S 5 580 580 1 8,37 1625 80 2- Varyasyon Katsayısı Varyasyon Katsayısı: Standart sapmanın ortalamaya göre gösterdiği değişimin yüzde olarak ifadesidir. S V .K 100 X V.K ≤ 20 ise dağılım Homojen V.K > 20 ise dağılım Heterojendir. Örnek: Ortalaması 31,7 S= 8,37 n: 580 olan dağılımın VK=? 8,37 V .K 100 %26,4 31,7 82 3- Standart Hata Aritmetik ortalama standart hata ile birlikte verilmelidir. Sınıflandırılmış ve sınıflandırılmamış verilerde aynı formül kullanılır. S Sx n Örnek: Ortalaması 31,7 S= 8,37 n: 580 olan dağılımın standart hatası ? S x 8,37 580 0,35 Ortalama: 31,7±0,35 şeklinde gösterilir. ÖRNEK yapağı verimi (gr) f 1000 - 1199 10 1100 -5 -50 1200-1399 12 1300 -4 -48 1400-1599 18 1500 -3 -54 1600-1799 40 1700 -2 -80 1800-1999 45 1900 -1 -45 2000 - 2199 60 2100 0 0 2200 - 2399 46 2300 +1 46 2400 - 2599 34 2500 +2 68 2600 - 2799 25 2700 +3 75 2800 - 2999 10 2900 +4 40 -48 SD 300 X =2068 b fxb S= ? VK= ? 84 TEORİK DAĞILIMLAR İlgilenilen bir olayın gerçekleşme durumu, teorik bir dağılıma uyuyor ise olayın gerçekleşme olasılığı hesaplanarak olası sonuçlar tahmin edilebilir. Çok sayıda teorik dağılım mevcuttur. Veteriner Hekimlik alanında sıkça kullanılan dağılımlar; 1- Binomiyal Dağılım 2- Poisson Dağılım 3- Normal Dağılım Binomiyal Dağılım Sayımla belirtilen kesikli değişkenlerin dağılımıdır. Bir olayın oluş olasılığının (p) büyük, denek sayısının (n) küçük olduğu durumlarda olasılık hesaplanmasında kullanılır. Binomiyal dağılımda incelenen olayın birbirinden bağımsız iki olası sonucu vardır. Başarı (p), Başarısızlık (q) veya (1-p) p=q ise dalığım simetriktir. P 0 binomiyal dağılım poisson dağılımına yaklaşır Binom dağılımında denemeler birbirinden bağımsızdır. Bir sonucun ortaya çıkması diğer olayın ortaya çıkmasını etkilemez. n P(r ) r r pq nr r nr n! r 0,1,2,..., n p q (n r )! r! n: Toplam olay sayısı r: İstenen olayın oluş sayısı p: İstenen olayın gerçekleşme olasılığı q: İstenen olayın gerçekleşmeme olasılığı 87 Örnek: Doğum esnasında bir domuz yavrusunun dişi olma olasılığı %50’dir. Ultrason sonucu 4 yavru doğurması beklenen bir dişi domuzun 1,2 ve 3 yavrusunun dişi olma olasılığı hesaplansın 4 p(1) 0,51x (10,5)41 4! 0,51x (10,5)41 0,25 (4 1)!1! 1 4 p(2) 0,52 x (10,5)42 4! 0,52 x (10,5)42 0,375 (4 2)!2! 2 4 p(3) 0,53 x (10,5)43 4! 0,53 x (10,5)43 0,25 (4 3)!3! 3 Poisson Dağılımı Sayımla belirtilen değişkenlerin dağılımıdır. İncelenen olayın görülme olasılığı (p) küçük, n büyük olduğunda olasılık hesaplamak için kullanılır. r x X P(r ) r! e r: İstenen olayın oluş sayısı Örnek: Bir bölgedeki veteriner kliniğine gece muayene için gelen hasta sayısının Poisson dağılım gösterdiği bilinsin, Kliniğe gece ortalama 4 hasta geldiğine göre; Herhangi bir gece kliniğe 2 hasta 2 gelme olasılığı P(2) 4 e 4 2! 16 0,018 0,144 2 Normal Dağılım Ölçümle belirtilen (sürekli) değişkenlerin dağılımıdır. Ortalama ve Std. Sapma her farklı değeri için farklı bir normal dağılım oluşturulur. Normal dağılımın özellikleri - Normal dağılım ortalamaya göre simetriktir. - Eğri ile x ekseni arasındaki toplam alan 1 birim karedir. - Aritmetik ortalama, ortanca ve tepe değeri birbirine eşittir. - X± 1 Std. Sapma arasındaki toplam alan % 68,26 - X± 2 Std. Sapma arasındaki toplam alan % 95,44 - X± 3 Std. Sapma arasındaki toplam alan % 99,74 - Dağılım çan eğrisi biçimindedir. % 68,2 % 95,4 % 99,7 91 Standart Normal Dağılım Her farklı ortalama ve standart sapma farklı dağılımlar ürettiğinden, her dağılım için ayrı eğri altında alan hesaplamasının getireceği hesaplama zorluklarından kurtulmak için dağılımın standart tek bir dağılıma dönüştürülmesi yoluna gidilmiştir. Standartlaştırma için uygulanılan formül; z x s x Örnek: Bir toplumda kan basıncı değerlerinin ortalamasının 130 mmHg, standart sapmasının 25 mmHg ile normal dağılım gösterdiği bilinmektedir. -Kan basıncı 110-140 mmHg arasında bulunan kişi yüzdesi nedir? z x s x z1 110 130 0,8 25 z2 140 130 0,4 25 Z1=0,288 Z2=0,155 Z1 +Z2 =0,4435 Toplumdaki kişilerin % 44,35 nin kan basıncı 110-140 arasındadır. 93 Örnek: Sağlıklı 2 yaşlı Haflinger atlarında Cidago yüksekliği, 125 cm ortalamave 20 cm standart sapma ile normal dağılım göstermektedir. Buna göre aşağıdaki şıkları α=0.05 alarak çözümleyiniz. a)Sağlıklı 2 yaşlı Haflinger atlarında Cidago yüksekliği 130 cm üzerinde olma olasılığı nedir? Ödev b) Sağlıklı 2 yaşlı Haflinger atlarında Cidago yüksekliği 110 cm altında olma olasılığı nedir? c) Sağlıklı 2 yaşlı Haflinger atlarında Cidago yüksekliği 110 cm ile 130 cm arasında olma olasılığı nedir? 94 a: P(X>130)=? Bu olasılığı bulmak için 125 cm ortalama 20cm standart sapma ile normal dağılan X değerini, 0 ortalama ve 1 standart sapma ile standart normal dağılıma sahip Z skoruna çevirmek gerekir. Bunun için: Z x X 130 125 0,25 S 20 olarak bulunur. 0 0,25 Standart normal dağılım üzerinde z=0,25 değerinden büyük olan alan bize aradığımız olasılık değerini verecektir. Bunun için standart normal dağılım tablosundan z=0,25’e karşılık gelen olasılık tablo değeri =0,0987 olarak bulunur. Bu değer standart normal dağılım üzerinde 0’dan 0,25’e kadar olan alanı vermektedir. 0,0987 0 0,25 Sağlıklı bir yetişkin bireyin kan basıncı seviyesi değerinin 130 mmHg üzerinde olma olasılığının değeri P(X>130)=P(z>0,25)=0,5-0,0987 = 0,4013. 95