DE****M ÖLÇÜLER* (Varyasyon Ölçüleri)

advertisement
İSTATİSTİK (STATİSTİCS) NEDİR?



Herhangi bir konuyu incelemek için gerekli verilerin toplanması,
toplanan verilerin değerlendirilmesi ve bilgi haline dönüşmesini sağlayan
bilim dalıdır.
İstatistik, tüm evreni (populasyonu) incelemek yerine evrenden seçilen
örneği inceleyerek evren hakkında tahminde bulunmayı sağlamaktadır.
Çünkü tüm evreni incelemek maddi olarak çok zor olduğu gibi, büyük
zaman kayıplarına da neden olmaktadır. O nedenle örnekleme yapılarak,
para- zaman- araç-gereç ve personelden tasarruf sağlanmış olur.
Ayrıca uzun yıllar gerektiren bir çalışmada örnek yerine tüm evrene
ait verilerin toplanması yoluna gidilirse, yıllar sonra toplanmış olan
verilerin güncelliğini kaybetme riski de ortaya çıkacaktır. Dolayısıyla
yapılan tüm harcama ve geçen zamanın güncel olarak bir değeri
1
olmayacaktır.
İstatistik konu olarak
tanımlayıcı istatistik ve çıkarımsal istatistik
olmak üzere iki ana gruba ayrılır.
Tanımlayıcı istatistik: Elde edilen verilerin
sınıflandırılması, ortalama ve yaygınlık
ölçülerinin hesaplanması, tablo ve grafiklerle
sunulmasını içerir.
Çıkarımsal istatistik: Örneklemden elde edilen
bulgular yardımıyla evren hakkında kestirimde
bulunma, hipotezleri test etme ve karara varma
gibi konuları içerir.
2
BİYOİSTATİSTİK
Biyoloji, tıp ve diğer sağlık bilimlerinde
araştırma düzeninin oluşturulması, verilerin
elde edilmesi ve değerlendirilmesi ile uğraşan
bilim dalıdır.
3
TANIMLAR
EVREN (=POPULASYON – ANA KÜTLE)
Belirli bir özelliğe sahip bireylerin tümünün oluşturduğu topluluk olarak
tanımlanabilir. Örneğin veteriner fakültesi öğrencileri yada veteriner
fakültesinin 1. sınıf öğrencileri gibi. Evren büyük – küçük; sonsuz – sınırlı
olabilir.
PARAMETRE
Evreni tanımlamak için kullanılan ölçülere parametre denir.
ÖRNEKLEM(E)
Evreni temsil ettiği düşünülen bir grubun oluşturduğu topluluğa Örneklem
denir. Örneklemi seçmek için yapılan işlemlere de Örnekleme denir.
TAM SAYIM
Bir araştırmanın populasyonu oluşturan bütün bireylere uygulanmasıdır.
4
DEĞİŞKEN (VARIABLE)
Canlıların ve çevrenin her bir özelliğidir. İncelenen parametre, ölçü, veri veya
değerdir. Adından da anlaşılacağı üzere incelenecek olan parametre anlık
veya dönemsel olarak değişim göstermektedir. Aynı özelliği gösterenlerin
oluşturduğu gruptur. (Ör: cinsiyet, ırk, günlük 20 lt.’nin üzerinde süt veren
inekler vs.). Değişkenler kantitatif (rakamsal =quantitative) olabildiği gibi,
kalitatif (grup, kategori, =qualitative) de olabilir. Ör: Türkiye’deki 10 milyon
sığırın 2 milyonu(%20) Simental’dir, 3 milyonu (%30) Holstein’dır.
VERİ (DATA)
Bir olayı aydınlatmak veya gerçeği ortaya çıkarmak için toplanan rakamlar,
sayısal bilgilerdir. İstatistikçilerin üzerinde çalıştığı materyallerdir. Ölçüm,
sayım ve gözlem kayıtlarıdır. (Ör: İşletmemizde bulunan ineklerin günlük süt
verimleri)
5
Araştırma Nedir?
6
Araştırma
Bilinmeyen bir olayı ortaya çıkarmak, bilinenleri
geliştirmek, herhangi bir konuyu aydınlatmak,
sorunları ortaya çıkarmak ya da sorunlara çözüm yolları
aramak için yapılan planlı ve bilimsel bir çalışmadır.
7
Araştırmanın Uygulanması ve
Değerlendirilmesi
Araştırmanın uygulanması için araştırma
kapsamına giren birimler belirlenmelidir.
Araştırma birimi, araştırma konusuna göre değişir.
Örneğin bir bölgede hane halkı ile ilgili bir araştırma
düzenlendiğinde, araştırma birimi hanelerdir.
8
Araştırma konusunu içeren sorular,
araştırma birimlerine uygulanır.
Araştırma sonunda toplanan veriler
istatistiksel yöntemler kullanılarak
değerlendirilir.
9
Araştırmaların Temel Amaç ve Yöntemlerine Göre
Sınıflandırılması
I. Gözlemsel Araştırmalar
1. Tanımlayıcı Araştırmalar
2. Analitik Araştırmalar
1- Vaka-Kontrol Araştırmaları
2-Kohort Araştırmaları
3-Kesitsel Araştırmalar
10
II. Deneysel Araştırmalar
Deneysel araştırmalar genellikle klinikte ve
laboratuvarlarda yapılır.
III. Metodolojik Araştırmalar
11
ARAŞTIRMALARDA DİKKAT EDİLMESİ GEREKEN NOKTALAR
Araştırmanın konusu ve amacı belirgin, sınırlı ve güncel olmalı,
Araştırıcının yeterli bilgisi olmalı ya da konu ile ilgili uzmanlarla çalışmalı,
Kullanılacak analiz metodu doğru seçilmeli,
Elde edilen sonuçların bilime ya da uygulama alanlarına katkısı olmalı,
Araştırıcının yeterli zamanı, elemanı, techizatı ve maddi kaynağı olmalı,
Çalışacak elemanlar iyi eğitilmeli, personelin istenildiği ve öğretildiği gibi
çalışıp çalışmadığı kontrol edilmeli,
Araştırmada kullanılacak özellikler ve ölçüm
belirlenmeli, amaca uygun ölçüler kullanılmalı,
hassasiyeti
önceden
Toplanan bilgiler iyi korunmalıdır. Araştırma devam ederken sık sık
değerlendirme yapılmalı ve
12
Deneklerin uygulamaya olan tepkileri kontrol edilmelidir.
Deneme hatasını en aza indirilmesi için;
Homojen materyal seçimi ve alt gruplara homojen dağıtılması için uygun
örnekleme metotları kullanılmalı,
Tekrar sayısı veya araştırmada kullanılan denek sayısı artırılmalı,
Araştırma özelliğini etkileyen faktörler mümkün olduğu kadar araştırmaya
dahil edilmeli, dahil edilemeyen faktörler ise bütün gruplara eşit
uygulanmalı,
Mekan ve çevre faktörlerinden kaynaklanan farklı etkilerin araştırma
materyali üzerine homojen dağılması sağlanmalı ve
Zaman faktörünün etkisi de dikkate alınmalıdır.
13
VERİ
İncelenen konuya açıklık getirmek amacıyla
toplanan bilgiler, belgeler, ölçümler, ... vb.
Veri tipleri
1- Ölçümle Belirtilen Sürekli (Nicel) Veriler
2- Sayısal Olarak Belirtilen Kesikli Veriler
3- Nitelik (İsim) Olarak Belirtilen Veriler
14
VERİ TİPLERİ
1- Ölçümle Belirtilen Sürekli (Nicel) Veriler
Kandaki kolesterol düzeyi, hayvanların günlük yem tüketimi,
yaşı, kilosu gibi. Bu veriler süreklidir ve iki aralıkta değer
alabilirler. 120-130 mg/ml veya 10-15 kg/gün gibi. Ölçüm veya
tartımla elde edilirler.
2- Sayısal Olarak Belirtilen Kesikli Veriler
Ölen hayvan sayısı, iyileşen hayvan sayısı, gebe kalma oranı,
nüfus gibi. Bu veriler sürekli ve aralıklı değildir. Yani net bir
rakamdır. Sayımla elde edilirler.
3- Nitelik (İsim) Olarak Belirtilen Veriler
İyileşti- iyileşmedi, gebe kaldı- kalmadı şeklinde olabildiği gibi,
çok iyi-iyi-az iyi-iyi değil gibi sıralanabilen verilerdir. Erkekdişi gibi, saç rengi göz rengi gibi nitelik belirten ve rakamla
ifade edilmeyen verilerdir.
1 ve 2. tip veriler kantitatif, 3. tip veriler ise kalitatif niteliktedir.
15
VERİLERİN ELDE EDİLMESİ
Temel olarak verileri 5 farklı yaklaşımla elde edebiliriz.
1.
2.
3.
4.
5.
ARŞİV TARAMASI
GÖZLEM YOLUYLA
DENEME DÜZENLENEREK
ANKET DÜZENLENEREK
YAPAY (SİMULASYON) YOLLARLA
16
Verilerin elde edilmesinde dikkat edilmesi gereken hususlar;
1.
2.
3.
4.
Araştırma sonuçlarını etkilemeyecek şekilde, en düşük maliyetle veri
elde etmeye çalışılır.
İstatistikte her ne kadar %100 doğruluk payı olmasa da verilerin
doğruluğu ve güvenilirliği çok önemlidir. O nedenle, bizzat araştırıcı
tarafından toplanan verilerin güvenirliği, eski kayıt ve belgelerden
toplanan verilerin güvenirliğinden daha fazla olacaktır. Bilimsel
araştırmalarda genellikle %95 güven aralığı yeterli olarak kabul
edilmektedir.
Verilerin en kısa sürede elde edilmesi, sonuçların geçerliliğini
yitirmemesi açısından önemli bir kriterdir.
Deneysel olarak elde edilecek veriler dışında veriler genellikle anket
yoluyla toplanmaktadır. O nedenle düzenlenecek olan anket konunun
uzman(lar)ı tarafından hazırlanmalı ve sorular açık, kısa ve mantıklı
olmalıdır.
17
Verileri Sınıflandırılması, Tablo ve Grafiklerle Gösterilmesi
Veriler elde edildikten sonra bilgi haline dönüştürebilmek ve daha
kolay anlaşılmasına yardımcı olmak için sınıflandırılması
gerekmektedir.
Sınıf sınırı (Alt sınır-üst sınır); örneğin biyometri dersinden 60-70
arası not alanlar denildiğinde alt sınır 60, üst sınır 70’dir.
Sınıf aralığı; ard arda gelen iki sınıfın alt ve üst sınırları arasındaki
farktır. Örneğin dersten 10-14 arası alanlarla, 15-19 arası alanlar
arasındaki sınıf aralığı 5’dir.
Sınıf sayısı; 50-60 alanlar, 61-70 alanlar, 71-80 alanlar şeklinde
sınıflandırma yapıldığında sınıf sayısı 3’tür. Sınıf sayısının 8 ile 15
arasında olması tercih edilir.
18
Örnek:
20 adet öğrencinin biyometri dersinden aldığı notlar sırasıyla
aşağıdaki gibi olsun;
10-12-18-23-24-35-40-44-46-48-55-57-64-70-75-78-81-83-89-90
Dağılım aralığı bulunurken en büyükle en küçük değerin farkı
alınır (90-10=80). Bulunan fark önce 8’e (80/8=10) sonra 15’e
(80/15=5,3) bölünür. Elde edilen 5,3 ile 10 arasında bir değer
sınıf aralığı olarak seçilebilir. Eğer sınıf aralığını 8 alırsak
(80/8=10) 10 adet sınıfımız olur. 9 olarak alırsak (80/9=8,8) 9
adet sınıfımız olur. Sınıf aralığını 9 olarak aldığımızı kabul
edersek;
Sınıflar
10-18; 19-27; 28-36; 37-45; 46-54; 55-63; 64-72; 73-81; 82-90;
şeklinde oluşur ve tüm değerler bu sınıfların içerisinde yer alır.
19
Frekans (sıklık); sınıflar tespit edildikten sonra her bir değerin
hangi sınıfa gireceğine bakılır.
Sınıf Sayısı
Sınıflar
1
2
3
4
5
6
7
8
9
10-18
19-27
28-36
37-45
46-54
55-63
64-72
73-81
82-90
Frekans
3
2
1
2
2
2
2
3
3
20
Tablo Nedir? Tablo Düzenlenirken Nelere Dikkat Edilmelidir?
Tablo, verilerin satır ve sütunlar halinde sistemli bir şekilde bir arada
sunulmasıdır.
Tablo düzenlerken dikkat edilmesi gereken noktalar;
- Her tablonun mutlaka bir başlığı ve sıra numarası olmalıdır. Bu
başlık, tablonun içeriğine uygun olmalı ve fazla uzun olmamalıdır.
- Tablodaki birimlerin ölçü birimleri verilmelidir. Eğer tablodaki tüm
ölçü birimleri aynı ise o zaman bu ölçü birimi tablo başlığının altına
yazılabilir.
- Tablodaki satır ve sütunların neyi ifade ettiği başta yazılmalıdır.
- Tablolar fazla geniş ve uzun olmamalıdır. Gerekirse tablo 2’ye 3’e
bölünmelidir.
- Tabloda kullanılan kısaltma varsa tablonun altında belirtilmelidir.
Tabloda kullanılan veriler başka bir kaynaktan alınmışsa alınan
kaynağa atıf yapılmalıdır.
- Tabloda kullanılan veriler açık ve tam olarak yazılmalıdır.
21
TABLO ÇEŞİTLERİ


1. MARJİNAL TABLO: Deneklerin incelenen herhangi bir
değişkenin sınıflarına nasıl dağıldığını gösteren tablodur.
Örn: 1. sınıf öğrencilerinin Anatomi, Histoloji, Biyoistatistik
dersinden aldıkları not ortalamaları
2. ÇAPRAZ TABLO: İki yada daha çok değişkenin birlikte
incelenmesidir.
22
Örnek: Türkiye ve Avrupa Birliği’nde yıllar itibariyle hayvansal
ürünlerde verim miktarlarına ait rakamlar Tablo. 1’de verilmiştir
(3, 6, 7, 8, 9, 10).
Tablo 1. Türkiye’de ve AB’de Elde Edilen Verimler (2001-2003)
TÜRKİYE
AVRUPA BİRLİĞİ
Üretim Miktarları ve
Ortalama Verimlilikler
2001
2002
2003
2001
2002
2003
Sığır Karkas Verimi (kg/baş)
180
185
176
320
316
318
İnek Süt Verimi (kg/baş/yıl)
1.669
1.705
1.699
5.998
6.075
6.235
Koyun Karkas Verimi (kg/
baş)
18
19
16
14
14
14
Koyun Süt Verimi (kg/ baş/yıl)
49
48
61
128
126
126
23
Grafik Nedir? Grafik Yapımında Nelere Dikkat Edilmelidir?
Grafik, bulguların şekillerle ifade edilerek açık ve kolay anlaşılır
bir şekilde okuyucuya sunulmasını sağlayan bir araçtır.
Grafiklerin en önemli özelliği göze hitap etmesidir.
Grafiklerin de tablolar gibi kısa ve açıklayıcı bir başlığı ile
numarası olmalı, eksenlerin neyi ifade ettiği belirtilmeli ve
kısaltma kullanılmışsa açıklaması yapılmalıdır.
24

Grafik yapımında
noktalar;
dikkat
edilmesi
gereken
- Her grafiğin mutlaka bir başlığı olmalıdır. Bu başlık,
grafiğin içeriğine uygun olmalı ve fazla uzun olmamalıdır.
- Eksenlerin neyi ifade ettiği belirtilmelidir.
- Grafikte kullanılan ölçekler ve işaretler hakkında açıklayıcı
bilgi konulmalıdır.
- Grafik karışık olmamalıdır.
25
GRAFİK TÜRLERİ
1- Çubuk Grafik: Frekansların ve yüzdelerin bir çubukla
gösterilmesidir. Çubuğun yüksekliği frekansı ve yüzdeyi
ifade eder.
Grafik 2. Süt sağımında eğitim düzeyine göre eldiven kullanım durumu
20
18
16
14
12
10
8
6
4
2
0
kullanan
kullanmayan
ilkokul
ortaokul
lise
üniversite
26
Grafik 5. Süt sağımında eğitim düzeyine göre eldiven
kullanım durumu
100%
80%
60%
kullanmayan
kullanan
40%
20%
0%
ilkokul
ortaokul
lise
üniversite
27
2- Çizgi Grafik: Genellikle bir değişkenin belirli bir süre
içinde gösterdiği değişiklikleri incelemek için çizilen grafik
türüdür.
Grafik 1. İMKB’de İşlem Gören İki Farklı Hisse Senedi Fiyatları
4000
3500
3000
2500
sağlam
2000
spekülatif
1500
1000
500
0
1
2
3
4
5
6
7
8
9
10
11
28
3-Daire Grafikleri: Daha çok gelir, harcama, persenol, vb.
dağılımlarda başvurulan bir grafik türüdür.
Örn: Hayvancılık İşletmesinde Giderlerin Dağılımı
Yem gideri :
%70
360x70/100= 252 derece
İşçilik gideri :
%15
360x15/100= 54 derece
Veteriner gideri: %5
360x 5/100= 18 derece
Diğer giderler:
360x10/100= 36 derece
%10
29
Grafik 11. Hayvancılık İşletmesinde Giderlerin Dağılımı
10%
5%
yem
15%
işçilik
veteriner
diğer
70%
30
4-Histogram
Sürekli değişknler için çizilir. Sürekli değişknlerde sınıflar
birbirine geçişli olduğu için çubuklar bitişiktir.Veri setinin
frekans dağılımıdır.
31
Örnek: Veteriner Fakültesi Çiftliğinde bulunan 80 koyunun yapağı
verimleri 1000 gr ile 1800 gr arasında değişsin. 5 koyun 1000-1100 gr,
7 koyun 1101-1200, 10 koyun 1201-1300 gr, 15 koyun 1301-1400 gr, 19
koyun da 1401-1500 gr 10 koyun 1501-1600 gr, 8 koyun 1601-1700 gr
ve 4 koyun da 1701-1800 gr yapağı verirse histogramı nasıl çizilir?
32
5- Dağılım Poligoni: Histogramda çubukların orta
noktalarından geçecek şekilde çizgiler çizilirse elde
edilecek şekil dağılım poligonu adını alır.
33
Örnek: Veteriner Fakültesi 1.sınıfta öğrenim gören 65 öğrencinin boy
uzunluğunu tahmin edebilmek için seçilen 20 öğrencinin boy uzunluğu
ölçülmüş ve 1.60-1.80 cm arasında olduğu tespit edilmiştir.
Evren (Popülasyon)?
Örnek sayısı kaçtır?
İncelenen değişken nedir?
Boy uzunluğu nasıl bir veridir?
34
FREKANS DAĞILIMLARINI TANIMLAYICI ÖLÇÜTLER
1. YER GÖSTEREN ÖLÇÜTLER
a. Merkez ölçütleri: Ortalamalar
b. Çeyrek ve yüzdelikler
2. YAYGINLIK ÖLÇÜTLERİ
a. Standart sapma
b. Varyans
c. Varyasyon katsayısı
d. Standart hata
35
ORTALAMALAR
Tanım: Ortalama, sayısal veriler topluluğunun orta noktasını
bir kalemde özetleyen veya belirten tipik bir değerdir.
Ortalama, merkezde toplanma eğiliminin ölçüsüdür, şeklinde de
tanımlanabilir. Ortalama, dağılışları özetleyen tipik bir merkezi
eğilim ölçüsüdür.
FAYDALARI
 Ortalamalar, seride bulunan bütün değerleri hatırda tutma
zahmetinden kurtarır. Bunlar, sayısal veriler topluluğunun
kolay bir şekilde anlaşılmasına yardımcı olurlar.
36
 Ortalamalar, rastgele nedenlerin etkilerine daha az maruz
kalırlar. Bunlar, olaylardaki normal durumu daha iyi
yansıtırlar. Ortalama, normal durumun bir ölçüsü olarak
kabul edilir. Örneğin, her hangi bir öğrencinin bilgi düzeyini,
tek dersten almış olduğu not değil, okumuş olduğu ve sınavım
verdiği tüm derslerden aldığı notların ortalaması gösterir.
 Ortalamalar, genel örneğe, alışılmışa, kurala aykırı olan
durumların bir ölçüsüdür. Olaylardaki bu anormal durumlar,
ortalamalar ile çoğu kez açıklığa kavuşturulur. Örneğin, Van
şehir merkezinde, 1984-85 Kış mevsiminde, bir yıl öncesine
oranla daha soğuk geçtiğini, 1984-85 yılı Kış aylarında ölçülen
sıcaklık dereceleri ortalamasının, 1983-84 Kış mevsimi ısı
derecesi ortalaması ile karşılaştırılması sonucu söylenebilir.
 Ortalamalar, kıyaslama vasıtalarıdır. Mevcut iki serinin
birbirleriyle mukayesesi, ancak, bunların ortalama
değerlerinin karşılaştırılması ile mümkündür.
37
Ortalamaların sakıncaları
Sayısal verilerin azlığında ortalamalar her hangi bir anlam taşımaz.
Örneğin bir portakal yiyenle hiç portakal yemeyen iki kişiyi, yarım
portakal yemiş gibi göstermek oldukça hatalıdır.
 Ortalamalar, sayısal bilgiler arasındaki farkları bazen ortadan
kaldırabilirler. Örneğin istatistikten 2, Almanca’dan l0 numara almış
olan bir öğrencinin not ortalaması 6'dır.
 Bu ortalama değer, öğrencinin istatistik ve almanca derslerine karşı
yeteneğinin orta olduğunu, oysa bu öğrencinin istatistik dersine karşı
yetenekli olmadığı, zayıf olduğu, Almanca’ya karşı ise yetenekli olduğu
ve bu yeteneğinin pekiyi dereceyle ifade edildiği görülür.
 Ortalamalar, bazen gerçeği tam olarak yansıtmazlar; gerçeğe aykırı
bilgi verirler. Örneğin 500 kişilik bir köyde, kişi başına düşen geliri
hesaplamak istiyoruz. Bu kişilerin yıllık gelirleri 50 milyon ile 100
milyon arasında olsun ve bu köye yıllık geliri 500 milyon olan başka
birisinin taşındığını varsayalım. Bu örnekte, köyün birey nüfusa düşen
yıllık gelir ortalaması hesaplanmak istense, bu değerin, köyde yaşayan
kişilerin gerçek gelirini yansıtmadığı görülür.
38
Ortalamaların bu sakıncalarından kaçınmak için, şu noktalara
dikkat etmek gerekir:
 Ortalama, sayısal verilerin fazla olduğu durumlarda hesaplanır.
Çünkü, sayısal verilerin azlığında, ortalama rastgele ortaya
çıkan bazı nedenlerin etkisi altında kalabilir ve normal durumu
yansıtmayabilir.
 Seriyi meydana getiren değerler farklı olmamalıdır. Örneğin
Japon ve İngiliz çocuklarının devam ettiği İlkokulun her hangi
bir sınıfındaki öğrencilerin boylarının ortalamasını hesaplamak
istesek, seriyi oluşturan gruplarda farklılık olduğu, yani, Japon
ırkının genelde boylarının kısa, İngilizlerin ise uzun olduğu için,
her iki öğrenci grubunu temsil edecek olan ortalama, gerçek
değerden ayrı bir noktada olacaktır.
 Anormal değerleri ihtiva eden serilerin ortalaması
alınmamalıdır; yahut da bu mahsuru ortadan kaldıracak başka
metotlar uygulanmalıdır.
39
Ortalama Türleri: İstatistikte çok değişik ortalama tipleri
vardır. Bunlardan en fazla kullanılanları,
Aritmetik Ortalama,
Geometrik Ortalama,
Harmonik Ortalama,
Karesel Ortalama (Kadratik Ortalama),
Medyan (Ortanca),
Mod (Tepe Noktası)’dur.
40
ARİTMETİK ORTALAMA
Uzun süreden beri kullanılan, ortalamalar içinde en iyi bilinen ve en
yaygın olan bir ortalama çeşididir. Ortalama denildiğinde, genelde
akla aritmetik ortalama gelir.
Deneklerin aldıkları değerlerin toplanıp denek saysınına bölünmesi ile
elde edilen matematiksel gerçel bir değerdir. Bu nedenle Aşırı
dğerlerden etkilenir.
Örnekten hesaplanan aritmetik ortalama, X sembolü ile gösterilir.
Hesaplanması kolay ve serinin şekline göre değişir.
41
l- Aritmetik Ortalamayı Hesaplama Metotları
a) Sınıflandırılmamış verilerde aritmetik ortalamanın hesaplanması
Burada; deneklerin aldıkları değerler (Xı, X2, X3 ......... Xn) tek tek toplanır,
bulunan toplam,denek sayısına bölünür. Formül;
n
n tane deneğin
aldıkları değerlerin
toplanacağı
gösterir
X
x
i 1
n
i
i. Deneğin aldığı
değer
Aritmetik ortalama
Denek sayısı
42
ÖRNEK: E.Ü. Veteriner Fakültesi birinci sınıf öğrencilerinden rastgele
seçilen 20 Öğrencinin 2006 yılında yapılan üniversite giriş sınavında
almış oldukları sayısal puanlarının dağılımı aşağıda verilmiştir.
Öğrencilerin almış oldukları fen puanlarının aritmetik ortalaması
nedir?
Öğrenci
Sıra No:
Fen Puanları (X)
öğrenci sıra no:
Fen Puanları
(X)
1
322
11
325
2
315
12
337
3
325
13
324
4
322
14
312
5
314
15
325
6
327
15
315
7
342
17
332
8
327
18
332
9
349
19
317
10
306
20
315
Toplam
6483
6483/20=324,15'dir
43
b) Sınıflanmış verilerde aritmetik ortalamanın hesaplanması
Eğer, sayısal veriler fazla ise, bu değerlerin aritmetik
ortalamasını bulmak zorlaşır. Çünkü, sayısal veriler çoğaldıkça,
basit bir toplama işlemi bile fazla zaman alır ve hata yapma
ihtimali artar.
Örneğin 20-30 bin kadar bir gözlemin, sayısal verinin aritmetik
ortalamasını yukarıdaki formülün yardımıyla bulmak, hesap
makinası ile bile, bir hayli zordur ve de oldukça uzun zaman alır.
İşte bu nedenle, fazla sayıdaki verilerin aritmetik ortalamasını
bulmak için, veriler, önce bir frekans dağılımı şeklinde
gruplandırılır. Bu gruplandırma işlemi tamamlandıktan sonra,
ancak gruplandırılmış verilerden aritmetik ortalama hesap
edilir.
44
Hesaplama Metodu
1. Frekansları ile birlikte Sınıflar yazılır,
2. Sınıf değerleri (SD) bulunur ve her sınıfın karşısına yazılır.
Sınıf değeri sınıfın ortalamasıdır.
3. Çalışma birimi “b” kolonu oluşturulur. Yukarı doğru “-”
aşağı doğru “+” olacak şekilde 1 artırarak yazılır.
4. Frekansla çalışma birimleri çarpımları (f*b) alınarak her
sınıfın karşısına yazılır. İşaretleri dikkate alınarak toplanır.
5. Değerler formüle yerleştirilir.
45
Formül;
B kolonunda karşısına 0 konulan
sınıfın sınıf değeri
X  A
f* b toplamı
 fb
n
xC
Sınıf Aralığı
Aritmetik ortalama
Denek sayısı
46
Örnek: Bir çiftlikte 1 - 3 kg arasında yapağı veren 300 baş
koyunun yıllık yapağı verimleri şöyledir. Bu dağılımın
aritmetik ortalaması nedir?
f
Yapağı verimi
(gr)
1000 - 1199
10
1200-1399
12
1400-1599
18
1600-1799
40
1800-1999
45
2000 - 2199
60
2200 - 2399
46
2400 - 2599
34
2600 - 2799
25
2800 - 2999
10
300
47
yapağı verimi (gr)
f
1000 - 1199
SD
b
fxb
10
1100
-5
-50
1200-1399
12
1300
-4
-48
1400-1599
18
1500
-3
-54
1600-1799
40
1700
-2
-80
1800-1999
45
1900
-1
-45
2000 - 2199
60
2100
0
0
2200 - 2399
46
2300
+1
46
2400 - 2599
34
2500
+2
68
2600 - 2799
25
2700
+3
75
2800 - 2999
10
2900
+4
40
-48
300
 48
X  2100 
x 200
300
2068
48
TARTILI VEYA AĞIRLIKLI ARİTMETİK ORTALAMA
Bazı durumlarda serilerdeki terimler arasında önem dereceleri
bakımından farklılıklar bulunabilir. Eğer ortalamanın
hesaplanmasında bu farkların dikkate alınması gerekiyorsa ve
de istenmiş ise, her terime veya değere, önem derecesi ile orantılı
olmak üzere bir katsayı veya ağırlık verilmesi şarttır.
Böyle dağılımlarda ortalama hesap edilirken, ortaya katılacak
ferdi değerlerin nispi önemlerinin dikkate alınmaması, bizi,
yanıltıcı sonuçlara götürebilir.Ağırlıklı veya tartılı aritmetik
ortalama, ancak birimlerin her birinin değerine verilen önemin
farklı olması durumlarında kullanılır.
49
Örnek:
Fakültemizdeki bir öğrencinin birinci sınıfta okuduğu çeşitli derslerden aldığı
notlar ve bu derslere ilişkin kredi saatleri veya haftalık ders saatleri aşağıdaki
verilmiştir. Bu dağılımın ağırlıklı aritmetik ortalamasını bulunuz.
Dersin Adı
Haftalık ders
saati/ kredi (t)
Alınan Not (X)
Fizik
5
70
350
Anatomi
4
60
240
Kimya
4
80
320
İstatistik
2
85
170
İngilizce
3
65
195
Biyoloji
1
90
90
TOPLAM
19
450
1.365
t.X
Ağırlıklı Aritmetik Ortalama = 1.365/19 = 71,84'dür.
Oysa, cetveldeki değerlere göre çeşitli derslerden alınan notların tartısız
ortalaması; 450/6= 75’dir.
50
GEOMETRİK ORTALAMA
Birim değerlerinin (gözlem sonuçlarının) birbirleriyle çarpımlarının, n birim
sayısı olmak üzere, n’ inci dereceden köküne denir.
Birim değerleri X1, X2, ... , Xn gibi gösterilirse geometrik ortalama aşağıdaki
gibi yazılır:
İstatistiksel araştırmalarda gözlem sonuçları arasındaki oransal farkların
mutlak farklardan daha önemli olduğu durumlarda geometrik ortalamaya
başvurulur. Diğer bir ifade ile gözlem sonuçlarının her biri bir önceki gözlem
sonucuna bağlı olarak değişiyorsa ve bu değişmenin hızı saptanmak istenirse
geometrik ortalama sağlıklı sonuçlar verir.Geometrik ortalama bulmak veri
değerlerinin pozitif olmasi gerekir. Yukarıdaki formülden de anlaşılacağı
üzere gözlemlerden birisinin değeri sıfır veya negatif ise, geometrik ortalama
hesaplanmaz.
Geometrik Ortalamanın Özellikleri
-Geometrik ortalama, aritmetik ortalama gibi, hesapla bulunan bir
ortalamadır ve ortalamaya katılan tüm değerler tarafından
belirlenir.
-Geometrik ortalama, aşırı değerlerden, aritmetik ortalamaya oranla,
daha az etkilenir; yani, serideki aşırı büyük değerlere karşı,
aritmetik ortalama kadar hassas değildir. Bu nedenle, böyle
değerler ihtiva eden seriler için, ortalama hesaplanmak istenmişse,
geometrik ortalama tercih edilmelidir.
-Geometrik ortalama, aritmetik ortalamadan daha küçük çıkar.
-Terimler arasındaki fark büyüdükçe, geometrik ortalama ile
aritmetik ortalama arasındaki fark artar. Aksine, terimler
arasındaki fark azaldıkça, aritmetik ortalama ile geometrik
ortalama arasındaki fark azalır.
-Değerler arasındaki farklar büyüdükçe, geometrik ortalama
aritmetik ortalamadan uzaklaşır. Bu nedenle de, serideki terimler
arasında çok büyük farkların bulunması durumunda, geometrik 52
ortalamanın kullanılması daha uygun olur.
ÖDEV
1.
2.
3.
Aritmetik ortalama ?
Verileri sınıflandırıp, sıklık tablosunu oluşturun.
Sınıflandırılmış verilerde ortalama hesaplayın?
53
MEDYAN (ORTANCA)
• Dağılımın orta noktasındaki değer olarak tanımlanır.
• Veriler küçükten büyüğe doğru dizildiğinde, serinin tam ortasında bulunan
değere medyan veya ortanca adı verilir.
• Büyüklük sırasına göre düzenlenmiş bir sayı setinin medyanı, orta değer
veya iki orta değerin aritmetik ortalamasıdır. ,
• Medyan, bir dağılımı iki eşit parçaya bölen birim değeri olduğu, hesabında
sadece tam ortaya rastlayan değeri dikkate aldığı, diğer terimleri hesaplama
dışı bıraktığı için, analitik olmayan bir ortalamadır.
54
l – Sınıflanmamış verilerde Medyanın Hesaplanması
Medyanı hesaplamak için, veriler, küçükten büyüğe doğru dizilir, tam
ortaya isabet eden değer, medyan olarak kabul edilir.
• Ancak, denek sayısı çift ise, tam ortaya bir birim düşmeyecektir. Böyle
durumda, ortadaki iki değerin aritmetik ortalaması medyan olacaktır.
• Örneğin, yaşları 5, 7, 8, 10, 12,15 ve 20 olan 7 çocuklu bir ailede ortanca
yaş, dizide tam ortaya düşen dördüncü kardeşin yaşını gösteren 10
değeridir.
• Eğer bu aileye yeni bir çocuk daha katılacak olursa, o zaman çocuk sayısı
çift, yani 8 olacak;
1, 5, 7, 8, 10, 12,15 ve 20
tam ortaya 8 ve 10 yaşlarında iki çocuk rastlayacak, medyan yaşta, bu iki
çocuğun yaşlarının aritmetik ortalaması 8+10/2 =9 olacaktır.
55
Sayısal verilerin fazla olmadığı durumlarda yukarıdaki hesaplamalar kolay ve de
medyanın bulunması gayet basittir. Ama, sayısal verilerin fazlalığında,
ortancanın bulunması oldukça güçleşir.
Veri sayısı tek ise (n + l / 2). değer medyandır.
Veri sayısı çift rakam ise, (n / 2). ve (n+2 / 2). değerlerin aritmetik ortalaması
medyandır.
Örnek: 25 trafik kazasında vakasında sürücü yaşları şöyledir:
(10, 16, 19, 21, 24, 24, 25, 22, 21, 20, 20, 11,14, 16, 17, 15, 15, 19, 18, 21, 20, 23, 23, 28, 26)
Burada, medyan değeri bulabilmemiz için, önce verileri aşağıdaki gibi küçükten
büyüğe doğru dizeriz.
10, 11, 14, 15, 15, 16, 16, 17, 18, 19, 19, 20, 20, 20, 21, 21, 21, 22, 23, 23, 24, 24, 25, 26, 28
Yukarıdaki örnekte veri sayısı tek (25) olduğu için, tam ortaya bir birim
düşmektedir. Bu değer medyandır.
56
l – Sınıflanmış verilerde Medyanın Hesaplanması
•
•
•
•
Sınıflar yazılır
Her sınıfın Frekansı yazılır.
Yığılımlı frekan s (Yf) bulunur.
Sınıflanmış verilerde Medyan formulü:
Medyanın içinde
bulunduğu sınıfın bir
üstündeki sınıfın
Yığılımlı frekansı
Sınıf aralığı
Medyanın içinde
bulunduğu sınıfın
frekansı
Medyanın içinde
bulunduğu sınıfın
SAD
57
f
Yapağı verimi
(gr)
Yf
1000 - 1199
10
10
1200-1399
12
22
1400-1599
18
40
1600-1799
40
80
1800-1999
45
125
2000 - 2199
60
185
2200 - 2399
46
231
2400 - 2599
34
265
2600 - 2799
25
290
2800 - 2999
10
310
300
Medyan : n/2= 150
185 : Yf bulunduğu sınıfta yer alıyor.
L= 1999+2000/2=1999,5
Yf =125 f= 60 C=200
=2082,8
58
Medyanın Uygulanma Alanı ve Özellikleri
1-Ortancanın hesaplanması, özellikle basit serilerde çok kolaydır. Verileri ayrı ayrı
değerlendirmeye katmadan medyan hesaplanabilir.
Örneğin bir sınıftaki öğrencilerin ortalama boy uzunluğunu tespit etmek için,
öğrencilerin boylarını ayrı ayrı ölçmeye gerek kalmadan, bunları küçükten
büyüğe doğru sıralar, yani öğrencileri boy sırasına göre dizer, terim sayısı tek
ise, en ortadaki öğrencinin boyunu, çift ise en ortada kalan iki öğrencinin
boylarını ölçer, aritmetik ortalamasını bulur, böylece medyanı, yani ortalama
boy uzunluğunu kolayca hesaplayabiliriz.
2-Medyan, örnekteki gözlem sayısından etkilenir. Örnekteki uç değerlerden , aşırı
değerlerden pek etkilenmez. Daha doğrusu, aritmetik ortalama kadar hassas
değildir. Bu nedenle anormal değerleri, çok küçük veya çok büyük değerleri
kapsayan örneklerde, seriyi en iyi temsil edebilecek ortalama medyandır.
Böyle durumlarda aritmetik ortalama, gerçeği yansıtmayabilir.
Örnek: Bir bulaşıcı hastalığın kuluçka süresi 4, 5, 6, 6, 7, 7, 8, 8, 30 gün olarak
gözlenmiş ise; bu hastalıkta ortalama kuluçka süresi aritmetik ortalamaya göre,
X =81/9 = 9 gün; medyana göre ise 7 gün olarak bulunur.
Bu ve benzer örneklerde ortalamanın hesaplanmasında, medyanın kullanılması
daha doğru olur.
59
3-Bazı dağılımlarda alt veya üst değerler ya da hem alt ve hem de üst değerler
belirsizdir. Böyle açık sınıflı seriler için, diğer ortalamalar, gerçekten oldukça
uzaklaşır. Çünkü bu hesaplamalarda belirsiz olan sınıf hudutlarının tahmini olarak
tayini söz konusudur; ve yapılacak bu tahminler, şahıslara göre de değişebilecektir. Bu
nedenle, açık sınıflı serileri temsil edebilecek en iyi ortalama çeşidi, medyandır.
Sıraya dizilen veriler arasında açıklık veya eksiklik varsa, örneğin bir dağılımdaki
ferdi değerler 35, 40, 43, 50, 51, 60, 63, 65, 70 biçiminde ise, ortalama değer olarak,
beşinci terim 51, seriyi en iyi şekilde temsil etmektedir. Serinin iki veya bir ucunun
açık bırakıldığı durumlarda, örneğin 50'den az, 100'den yukarı gibi durumlarda,
medyan, ortalama değer olarak seriyi daha iyi temsil edebilmektedir.
4-Medyanın aritmetik bir özelliği yoktur. Çünkü hesaplanmasında bütün birimler rol
oynamaz.
60
MOD (TEPE DEĞERİ)
Mod, bir dağılımda en fazla tekrar edilen, en çok gözlenen değerdir.
Mod, en büyük frekansına karşılık gelen terimdir. Mod, bir dağılım içinde en popüler
değeri gösterir. Modun, en fazla kullanılan, veya yaygın olan ya da sık görülen
anlamlarına gelen moda kelimesi ile yakın bir ilişkisi vardır. Bu nedenle de mod,
moda olan, göze en çok görülen değer olarak da tanımlanabilir.
Mod, bir frekans dağılımının pozisyonunu ve eğilimini belirlemede, en fazla
kullanılan merkezsel eğilim ölçülerinden birisidir. Uygulamada, bazı alanlarda diğer
ortalamalara oranla, mod, daha çok kullanılır. Örneğin sanayi işletmelerinde görülen
iş kazalarının temel nedenlerinin araştırılmasında, tepe değerinden yararlanılır. Hazır
giyim sanayiinde, elbise ve ayakkabıların hangi ölçülerde ne miktarda üretileceği
konusunda moddan faydalanılır. Esasında moda kelimesi de buradan kaynaklanır.
Mod, eğer bir değişkenin almış olduğu değerlerden her hangi birisi, diğerlerine oranla
daha fazla gözlenirse, o zaman bir anlam taşır. Tepe değeri, özellikle verilerin
simetrik dağılım göstermedikleri durumlarda iyi bir yer ölçüsü olmaktadır.
61
Modun Hesaplanması
Basit serilerde modun bulunması gayet kolaydır. Burada, bir dağılımda en fazla
tekrarlanan gözlem değeri mod olarak kabul edilir.
Örneğin 10 hastanın kan basıncı (mm / Hg olarak)
135, 140, 150, 140, 145, 140, 11, 100, 120, 130 ise; bu dağılımın modu, en fazla
gözlenen değer 140 mm/Hg'dir.
Özellikleri
1-Bazı serilerde modun bulunması mümkün değildir. Örneğin bir serideki
değerlerin dağılımı l, 2, 3, 4, 5, 6, 7, 8, 9, 10 şeklinde ise, bu serinin modu yoktur.
Çünkü, tüm değerler eşit sayıdadır.
2- Bir dağılımda tepe değeri olabilecek birden fazla değer görülüyorsa, ortalama
değer olarak mod kullanılmamalıdır. Örneğin sınıfımızdan rastgele seçtiğimiz 29
öğrencinin boyları cm olarak
154, 156, 158, 160, 164, 164, 165, 165, 165, 166, 166, 167, 168, 168, 168, 169,
169, 170, 170, 170, 171, 173, 173, 176, 178, 179, 180, 185 cm ise, böyle bir
dağıtımda tepe değer olabilecek 3 değer (165, 168, 170) vardır. Oysa, birbirinden
farklı bu üç değerin, üçünü de mod olarak kullanmanın her hangi bir anlamı
yoktur.
62
Aritmetik ortalama, medyan, mod arasındaki ilişki:
•Simetrik dağılımlarda ortalama, medyan, mod birbirine eşittir.
X=Mod=Medyan
•Sağa Çarpık dağılımlarda
X>Medyan>Mod
•Sola Çarpık dağılımlarda
X<Medyan<Mod
63
ORTALAMA TİPİNİN SEÇİMİ
1-Ortalama tipinin seçiminde, kalıplaşmış her hangi bir kural yoktur. Ancak, uygun
bir ortalama çeşidinin seçimi, bazı özelliklerin dikkate alınması ile mümkündür.
2-Ortalama tipini tayinde, araştırmanın önemi ve ortalama hesaplamanın amacı, en
önde gelen faktörler arasında yer alır. Ortalamaların kullanılış yerleri farklı olduğuna
göre, o amacı en iyi biçimde yerine getirecek olan ortalama çeşidini seçmek gerekir.
3-Eğer verilere ileri istatistik analizler uygulanacaksa, aritmetik ortalama tipinin
kullanılması daha uygundur. Ortalama karşılaştırma amacıyla hesaplanmak
işlenmişse, aritmetik ortalama tercih edilir. Çünkü aritmetik ortalama, bütün değerler
tarafından belirlenen en duyarlı ortalama çeşididir.
4-Dağılımdaki değerlerden yalnız bilgi edinmek isteniliyorsa, yerine göre medyan ya
da mod kullanılır. Çünkü, bunlar, aritmetik ortalama kadar uç değerlerden
etkilenmez.
5-Terimlerin kendileri yerine, oranları bizi ilgilendiriyorsa, serinin geometrik
ortalaması hesaplanır.
64
6-Sıfır veya negatif değerlere sahip serilerde geometrik ortalama hesaplanamaz.
7-Aşırı değerler ihtiva eden seriler için, aritmetik ortalama uygun olmaz.
8-Ortalama tipinin seçiminde, yukarıdaki bazı ilkeler yanında, ortalamanın
hesabındaki kolaylık ya da zorluk da dikkate alınmalıdır.
9-Ayrıca, hangi ortalama tipi seçilirse seçilsin, serideki terimler arasında bir önem
farkı bulunuyorsa, o ortalamanın tartılı şekli hesaplanmalıdır.
65
Aşağıda en uygun ortalama tipinin seçimiyle ilgili bazı örnekler verilmiştir.
l- Aşağıdaki basit seri için hangi ortalama tipi daha uygundur? Neden?
2, 6, 20, 190, 180, 25, 27, 30, 40, 13, 12, 16, 205, 90, 180, 200, 250, 230, 18, 15
Geometrik ortalamanın kullanılması daha uygun olur.
Seri terimleri arasında büyük farklar vardır.
2- Konya ilinde geçen hafta ölçüler hava sıcaklıkları dağılımı aşağıda verilmiştir.
Bu değerlere hangi ortalama uygulanamaz.
0, l, 3, 5, 7, 10, 16, 20
Geometrik ortalama
66
ÖRNEK:
Bir çiftlikteki koyunlardan örnek olarak seçilen 26'sının hemoglogbin değerleri
aşağıda verilmiştir. Bu veriler için ortalama, mod, medyan hesaplayınız,
aralarındaki ilşkiyi grafik ile belirtiniz.
(11.0, 11.2, 11.3, 11.4, 11.4, 11.5, 11.6, 11.7, 12.5,13.0, 12.9,11.5, 12.7, 13.8, 14.0,
12.7, 11.8, 11.8, 11.9, 11.9, 12.0, 12.1, 12.2, 12.3, 10.9, 11.1, 12.5, 11.9, 13.7, 13.8)
.
67
Aşağıdaki dağılımlardan hangisinde medyanı kullanmak daha doğrudur?
a-9, 22, 30, 21, 20, 32, 17, 14, 29, 53, 6, 60, 18, 15, 23, 21, 27
b-164, 169, 169, 170, 171, 167, 135, 170, 168, 170, 180, 159, 167, 175
c-11.9, 11.8, 11.3, 11.7, 11.6, 11.5, 11.4, 11.6, 12.4, 13.6, 11.1, 13.3
d-210, 212, 211, 210, 208, 212, 213, 214, 212, 214, 210, 220, 225
e-111, 114, 115, 112, 113, 110, 117, 116, 117, 119, 117, 120, 122, 125
a seçeneğindeki verilere ortalama hesabında, medyanın uygulanması daha doğru
olur. Çünkü burada, dağılımı etkileyebilecek aşırı değerler (6, 9, 53, 60) vardır.
68
ÇEYREK VE YÜZDELİKLER
Çeyrek ve yüzdelikler dağılımın herhangi bir
noktasını gösterir.
Örneğin, 1. çeyrek 25. yüzdeliktir.
2. çeyrek 50. yüzdeliktir yani medyandır.
3. çeyrek 75. yüzdeliktir.
69
Sınıflanmış verilerde Çeyrek ve Yüzdeliklerin hesabı
•SAD bulunur. Bir üsteki sınıfın üst sınırı ile bir alttaki sınıfın alt
sınırının ortalamasıdır.
•….. Den az kolonu oluşturulur. Her SAD’dan az kaç denek olduğu sayı
ve % ile yazılır.
• Formül:
Den az % kolununda X1
Verilen yüzde
düştüğü aralığın üstündeki
% değer
X2 nin SAD
X3 nin SAD
Den az % kolununda X1
düştüğü aralığın altındaki
% değer
70
Sınıflanmış verilerde Çeyrek ve Yüzdeliklerin hesabı
SAD
…den az
Sayı
%
f
Yapağı verimi (gr)
1000 - 1199
10
999,5
0
0
1200-1399
12
1199,5
10
3,33
1400-1599
18
1399,5
22
7,33
1600-1799
40
1599,5
40
13,33
1800-1999
45
1799,5
80
26,66
2000 - 2199
60
1999,5
125
41,66
2200 - 2399
46
2199,5
185
61,66
2400 - 2599
34
2399,5
231
77
2600 - 2799
25
2599,5
265
88,33
2800 - 2999
10
2799,5
290
96,66
300
71
Soru: Koyunların % 25 ‘ i hangi değerden daha az değer
almışlardır.
X1= 25
X2 = 13,33
X3 = 26,66
X2 SAD=1599,5
X3 SAD= 1799,5
X= 1774,5
72
Soru: Koyunların % 60 ‘ i hangi değerden daha az değer
almışlardır.
73
DAĞILIMIN YAYGINLIK ÖLÇÜLERİ
1. Standart Sapma ve Varyans
2. Varyasyon Katsayısı
3. Standart Hata
1- Standart Sapma ve Varyans

Aritmetik ortalama dağılımın orta nokta noktasını gösteren bir ölçüdür.
Ancak dağılımın yaygınlığı hakkında bilgi vermez.
10
21


22
23
34
22
ORTALAMA: 66/3=22
ORTALAMA: 66/3=22
Standart sapma (S): Dağılımdaki her bir değerin ortalamaya göre ne
derece uzakta olduğunu, başka bir ifade ile dağılımın ne yaygınlıkta
olduğunu gösteren bir ölçüdür. Bir dağılımda değerler ortalamdan
uzaklaştıkça dağılımın yaygınlığı artar.
Standart sapmanın karesi varyans (S 2)olarak adlandırılır.
% 68,2
% 95,4
% 99,6
76
Sınıflandırılmamış Verilerde Standart Sapma
1.
2.
3.
Deneklerin aldıkları değerler toplanır
Deneklerin aldıkları değerlerin kareleri alınarak toplanır.
Formülde yerine konur.
2
 n x 
i
i 1 


x
n
S
Kareleri
toplamı
i 1
2
i
n 1
Değerleri
toplamı
Örnek : 30 adet Laboratuvar faresinin hemoglobin değerlerinin standart sapması
kaçtır.
Denek
No
Hb Xi
Hb Xi2
1
13,0
169,00
366
2
2
13,6
184,96
3
14,0
196,00
.
.
.
.
.
.
29
15,0
225,00
30
10,3
106,09
Toplam
366,0
4523,26
S
4523,26 
30  1
30
 1,41
78
Sınıflandırılmış Verilerde Standart Sapma
1.
2.
3.
4.
5.
6.
7.
Frekansları ile birlikte Sınıflar yazılır,
Sınıf değerleri (SD) bulunur ve her sınıfın karşısına yazılır. Sınıf değeri
sınıfın ortalamasıdır.
Çalışma birimi “b” kolonu oluşturulur. Yukarı doğru “-” aşağı doğru
“+” olacak şekilde 1 artırarak yazılır.
Frekansla çalışma birimleri çarpımları (f*b) alınarak her sınıfın
karşısına yazılır. İşaretleri dikkate alınarak toplanır.
Çalışma biriminin “b” nin karesi alınır her sınıfın karşısına yazılır.
Her sınıfın frekansıkendi b2 değeri ile çarpılarak f*b2 kolonu
oluşturulur.
Değerler formülde yerine konur.
 fb


2
fb
2
S c
n 1
n
Örnek : Belirli bir süre beslenen sığırların canlı ağırlık artışının standart sapmasını
hesaplayınız .
Ağır.Art
f
b
fb
b2
fb2
15-19
50
-3
-150
9
450
20-24
75
-2
-150
4
300
25-29
100
-1
-100
1
100
30-34
150
0
0
0
0
35-39
90
1
90
1
90
40-44
70
2
140
4
280
45-49
45
3
135
9
405
toplam
580
-35
 fb

2
S c
fb
2
n 1
n
35
1625 
2
S 5
580
580  1
 8,37
1625
80
2- Varyasyon Katsayısı

Varyasyon Katsayısı: Standart sapmanın ortalamaya göre
gösterdiği değişimin yüzde olarak ifadesidir.
S
V .K   100
X
V.K ≤ 20 ise dağılım Homojen
V.K > 20 ise dağılım Heterojendir.
Örnek: Ortalaması 31,7 S= 8,37 n: 580 olan dağılımın
VK=?
8,37
V .K 
 100  %26,4
31,7
82
3- Standart Hata
Aritmetik ortalama standart hata ile birlikte verilmelidir.
Sınıflandırılmış ve sınıflandırılmamış verilerde aynı formül kullanılır.
S
Sx  n
Örnek: Ortalaması 31,7 S= 8,37 n: 580 olan dağılımın
standart hatası ?
S
x

8,37
580
 0,35
Ortalama: 31,7±0,35 şeklinde gösterilir.
ÖRNEK
yapağı verimi (gr)
f
1000 - 1199
10
1100
-5
-50
1200-1399
12
1300
-4
-48
1400-1599
18
1500
-3
-54
1600-1799
40
1700
-2
-80
1800-1999
45
1900
-1
-45
2000 - 2199
60
2100
0
0
2200 - 2399
46
2300
+1
46
2400 - 2599
34
2500
+2
68
2600 - 2799
25
2700
+3
75
2800 - 2999
10
2900
+4
40
-48
SD
300
X =2068
b
fxb
S= ? VK= ?
84
TEORİK DAĞILIMLAR
İlgilenilen bir olayın gerçekleşme durumu, teorik bir
dağılıma uyuyor ise olayın gerçekleşme olasılığı
hesaplanarak olası sonuçlar tahmin edilebilir. Çok
sayıda teorik dağılım mevcuttur. Veteriner Hekimlik
alanında sıkça kullanılan dağılımlar;
1- Binomiyal Dağılım
2- Poisson Dağılım
3- Normal Dağılım
Binomiyal Dağılım
Sayımla belirtilen kesikli değişkenlerin dağılımıdır.
Bir olayın oluş olasılığının (p) büyük, denek sayısının (n)
küçük olduğu durumlarda olasılık hesaplanmasında kullanılır.
Binomiyal dağılımda incelenen olayın birbirinden bağımsız iki
olası sonucu vardır.
Başarı (p), Başarısızlık (q) veya (1-p)
p=q ise dalığım simetriktir.
P
0 binomiyal dağılım
poisson dağılımına yaklaşır
Binom dağılımında denemeler birbirinden bağımsızdır. Bir
sonucun ortaya çıkması diğer olayın ortaya çıkmasını
etkilemez.
n
P(r )   
r 
r
pq
nr
r
nr
n!

r  0,1,2,..., n
p
q
(n  r )! r!
n: Toplam olay sayısı
r: İstenen olayın oluş sayısı
p: İstenen olayın gerçekleşme olasılığı
q: İstenen olayın gerçekleşmeme olasılığı
87
Örnek:
Doğum esnasında bir domuz yavrusunun dişi olma olasılığı
%50’dir. Ultrason sonucu 4 yavru doğurması beklenen bir dişi
domuzun 1,2 ve 3 yavrusunun dişi olma olasılığı hesaplansın

4
p(1)   0,51x (10,5)41 4! 0,51x (10,5)41 0,25
(4 1)!1!
1 






4
p(2)   0,52 x (10,5)42  4! 0,52 x (10,5)42  0,375
(4  2)!2!
2






4
p(3)   0,53 x (10,5)43  4! 0,53 x (10,5)43  0,25
(4 3)!3!
3 





Poisson Dağılımı
Sayımla belirtilen değişkenlerin dağılımıdır. İncelenen olayın
görülme olasılığı (p) küçük, n büyük olduğunda olasılık hesaplamak
için kullanılır.
r

x
X
P(r ) 
r! e
r: İstenen olayın oluş sayısı
Örnek: Bir bölgedeki veteriner kliniğine gece muayene için gelen
hasta sayısının Poisson dağılım gösterdiği bilinsin, Kliniğe gece
ortalama 4 hasta geldiğine göre; Herhangi bir gece kliniğe 2 hasta
2
gelme olasılığı
P(2)  4 e
4
2!
16
 0,018  0,144
2
Normal Dağılım
Ölçümle belirtilen (sürekli) değişkenlerin
dağılımıdır. Ortalama ve Std. Sapma her farklı
değeri için farklı bir normal dağılım oluşturulur.
Normal dağılımın özellikleri
- Normal dağılım ortalamaya göre simetriktir.
- Eğri ile x ekseni arasındaki toplam alan 1 birim
karedir.
- Aritmetik ortalama, ortanca ve tepe değeri
birbirine eşittir.
- X± 1 Std. Sapma arasındaki toplam alan % 68,26
- X± 2 Std. Sapma arasındaki toplam alan % 95,44
- X± 3 Std. Sapma arasındaki toplam alan % 99,74
- Dağılım çan eğrisi biçimindedir.
% 68,2
% 95,4
% 99,7
91
Standart Normal Dağılım
Her farklı ortalama ve standart sapma farklı dağılımlar ürettiğinden, her dağılım
için ayrı eğri altında alan hesaplamasının getireceği hesaplama zorluklarından
kurtulmak için dağılımın standart tek bir dağılıma dönüştürülmesi yoluna
gidilmiştir. Standartlaştırma için uygulanılan formül;
z  x s x
Örnek: Bir toplumda kan basıncı değerlerinin ortalamasının 130 mmHg,
standart sapmasının 25 mmHg ile normal dağılım gösterdiği
bilinmektedir.
-Kan basıncı 110-140 mmHg arasında bulunan kişi yüzdesi nedir?
z  x s x
z1 
110  130
 0,8
25
z2 
140  130
 0,4
25
Z1=0,288
Z2=0,155
Z1 +Z2 =0,4435
Toplumdaki kişilerin % 44,35 nin kan basıncı 110-140 arasındadır.
93
Örnek: Sağlıklı 2 yaşlı Haflinger atlarında Cidago yüksekliği,
125 cm ortalamave 20 cm standart sapma ile normal dağılım
göstermektedir. Buna göre aşağıdaki şıkları α=0.05 alarak
çözümleyiniz.
a)Sağlıklı 2 yaşlı Haflinger atlarında Cidago yüksekliği 130 cm
üzerinde olma olasılığı nedir?
Ödev
b) Sağlıklı 2 yaşlı Haflinger atlarında Cidago yüksekliği 110
cm altında olma olasılığı nedir?
c) Sağlıklı 2 yaşlı Haflinger atlarında Cidago yüksekliği 110
cm ile 130 cm arasında olma olasılığı nedir?
94
a: P(X>130)=? Bu olasılığı bulmak için 125 cm ortalama 20cm standart sapma
ile normal dağılan X değerini, 0 ortalama ve 1 standart sapma ile standart normal
dağılıma sahip Z skoruna çevirmek gerekir. Bunun için:
Z
x  X 130  125

 0,25
S
20
olarak bulunur.
0
0,25
Standart normal dağılım üzerinde z=0,25 değerinden büyük olan alan bize
aradığımız olasılık değerini verecektir.
Bunun için standart normal dağılım tablosundan z=0,25’e karşılık gelen olasılık
tablo değeri =0,0987 olarak bulunur. Bu değer standart normal dağılım üzerinde
0’dan 0,25’e kadar olan alanı vermektedir.
0,0987
0
0,25
Sağlıklı bir yetişkin bireyin kan basıncı seviyesi değerinin 130 mmHg üzerinde
olma olasılığının değeri P(X>130)=P(z>0,25)=0,5-0,0987 = 0,4013.
95
Download