Tepe Değeri

advertisement
Tanımlayıcı İstatistikler
(Descriptive Statistics)
Dr. Musa KILIÇ
http://kisi.deu.edu.tr/musa.kilic
TANIMLAYICI ÖRNEK
İSTATİSTİKLERİ
YER ÖLÇÜLERİ
(Frekans dağılışının absis eksenindeki
durumunu belirtir.)
1. Aritmetik Ortalama
2. Diğer Ortalamalar
- Geometrik Ortalama
- Harmonik Ortalama
- Ağırlıklı Ortalama
3. Ortanca (Medyan)
4. Tepe Değeri (Mod)
DEĞİŞİM ÖLÇÜLERİ
( Frekans dağılışının şeklini belirtir.)
1. Değişim Aralığı
2. Ortalama Sapma
Ortalama Mutlak Sapma
3. Varyans
4. Standart Sapma
5. Değişim Katsayısı
http://kisi.deu.edu.tr/musa.kilic
YER ÖLÇÜLERİ
Aritmetik Ortalama:
• Değişken
• Örnek büyüklüğü
• Teksel gözlemler
1 n
x = ∑ xi
n i =1
•
:X
:n
: x1, x2, x3,…, xn
………tek tek veriler için
n adet gözlemin bazı durumlarda değerinin değişik frekanslarla
tekrarlanması durumunda
x=
1
∑f
k
∑fx
i i =1
i i
……… gruplandırılmış veriler için
Örnek: Bir öğrencinin beş ayrı dersten aldığı notlar: 72,66,88,92,76 ise
Öğrencinin not ortalaması:
1 n =5
1
x = ∑ xi = (72 + 66 + 88 + 92 + 76) = 78,8
5 i =1
5
http://kisi.deu.edu.tr/musa.kilic
YER ÖLÇÜLERİ
Ağırlıklı Ortalama
n
xa =
∑a x
i =1
n
i
i
Not
Haftalık
Ders Saati
1. Ders
72
5
2. Ders
66
4
3. Ders
88
4
4. Ders
92
2
5. Ders
76
4
∑ ai
i =1
xa:Ağırlıklı ortalama,
xi: i. gözlem,
ai:i. gözlem değerinin ağırlığı
•
Örnek: Yukarıdaki örnekteki
öğrencinin ağırlıklı not
ortalaması (Haftalık ders
saatine göre ağırlıklı not
ortalaması)
Örneği oluşturan
gözlemlerin ağırlıkları
birbirine oranla farklı
olduğu zaman kullanılır.
xa =
(72 x5 + 66 x 4 + 88 x 4 + 92 x 2 + 76 x 4)
5+4+4+2+4
xa =
360 + 264 + 352 + 184 + 304 1464
=
= 77,05
19
19
http://kisi.deu.edu.tr/musa.kilic
YER ÖLÇÜLERİ
Geometrik Ortalama
Logaritmaları alınan değişkenlerin tekrar orijinal şekle
dönüştürülmüş ortalamasına “geometrik ortalama” denir.
1 n

G.O.x = anti log ∑ log xi 
 n i =1

G.O.x = ( x1.x2 .x3 ...xn )
1
n
http://kisi.deu.edu.tr/musa.kilic
YER ÖLÇÜLERİ
Harmonik Ortalama
Bir X değişkeninin tersi (1/x) alınarak dönüşüm yapılır ve gözlemlerin
terslerinin aritmetik ortalaması hesaplanırsa elde edilen ortalamaya
“Harmonik Ortalama” denir.
1
1 n 1
= ∑
H x n i =1 xi
•
Örnek:
Öğrencinin notları : 72, 66, 88, 92, 76

1
G.Ox = anti log (log 72 + log 66 + log 88 + log 92 + log 76 )

n

1
G.Ox = anti log (1,86 + 1,82 + 1,94 + 1,96 + 1,88)

5
= 78,197
1
1 1
1
1
1
1 
=  + + + + 
H x 5  72 66 88 92 76 
1
= 0,01288
Hx
H x = 77,602
http://kisi.deu.edu.tr/musa.kilic
YER ÖLÇÜLERİ
Ortanca (Medyan)
Bir değişken için yapılan gözlemlerin büyükten küçüğe (veya
küçükten büyüğe) sıralanmasından sonra kendisinden küçük
ve kendisinden büyük eşit sayıda gözlem bırakan değer
“ortanca” olarak tanımlanır ve M ile gösterilir. Ortanca,
frekans dağılışını iki eşit kısma böler.
Gözlem sayısı tek ise ortanca büyüklük sırasına konmuş
verilerden (n+1)/2’ncidir.
Gözlem sayısı çift ise ortanca büyüklük sırasına göre
konmuş verilerden n/2’nci ile (n/2)+1’incinin ortalaması
olarak hesaplanır.
Örnek: 14,15,16,19,19,29
1
M = (16 + 19) = 17,5
2
http://kisi.deu.edu.tr/musa.kilic
YER ÖLÇÜLERİ
• Kartil: %25, %50, %75 noktalarında dağılışı dört
eşit parçaya böler.
• Desil: %10, % 20,…, %80,%90 noktalarında
dağılışı on eşit parçaya böler.
• Persentil: %1, %2,…, %99 noktalarında dağılışı
yüz eşit parçaya böler.
http://kisi.deu.edu.tr/musa.kilic
YER ÖLÇÜLERİ
Tepe Değeri (Mod)
• Bir frekans dağılışında en çok tekrarlanan değer,
üzerinde çalışılan değişkenin “tepe değeri” olarak
tanımlanır.
•
Frekans tablosu oluşturulmuşsa (veriler
sınıflanmışsa) tek bir tepe değeri yerine tepe
değerini içine alan sınıfın orta değerini vermek
daha uygun olur. (Tepe değeri sınıfı)
• Dağılış iki tepe değerine sahipse bimodal (iki
tepeli); ikiden çok tepe değerine sahipse
multimodal (çok tepeli) olarak adlandırılır.
http://kisi.deu.edu.tr/musa.kilic
DEĞİŞİM ÖLÇÜLERİ
Değişim Aralığı (Range)
Değişim Aralığı (R) = Xmaks- Xmin
Değişimi belirleyen en basit ölçüdür.
Gözlem serisi içindeki ekstrem değerlerden çok etkilenir.
Gözlemlerin ölçüm birimi ile ifade edilir.
http://kisi.deu.edu.tr/musa.kilic
DEĞİŞİM ÖLÇÜLERİ
Ortalama Sapma, Ortalama Mutlak Sapma
İyi bir değişken ölçüsü bir dağılışta yer alan tüm verilerin dağılışın
merkezinden uzaklıklarını kullanan bir ölçü olmalıdır. Değişim aralığı
sadece iki veriden hesaplandığı için iyi bir değişim ölçüsü olarak
kullanılmaz.
Ortalama Sapma =
1 n
( xi − x )
∑
n i =1
Ortalama Mutlak Sapma=
1
∑ xi − x
n
Sapmalar toplamı daima “sıfır”dır.
Ortalama mutlak sapmada mutlak değerlerin kullanılması nedeniyle
matematiksel işlem zorluğu vardır.
http://kisi.deu.edu.tr/musa.kilic
DEĞİŞİM ÖLÇÜLERİ
Varyans (Variance)
• Ortalamadan sapmalar kareler toplamının ortalaması
Tek tek veriler için:
Varyans:
Gruplandırılmış veriler için:
n
1
s = ∑ ( xi − x ) 2
n i =1
2
s =
∑ f (x − x)
k
∑f
i =1
•
k
1
2
i =1
i
2
i
i
Varyans hesaplanırken ölçüm birimi ile ifade edilen sapmaların kareleri
alındığından varyans, ölçüm biriminin karesi şeklinde belirtilir.
Standart Sapma (Standart Deviation)
• Varyansın pozitif kareköküdür.
Standart Sapma :
1 n
( xi − x ) 2
s=+
∑
n i =1
s=+
∑ f (x − x)
k
∑f
i =1
•
k
1
i =1
i
2
i
i
Standart sapmanın birimi gözlemlerin elde edilmesinde kullanılan ölçüm
birimidir.
Değişim Katsayısı (Varyasyon Katsayısı, Coefficient of Variation)
s
CV (%) = 100(%)
x
http://kisi.deu.edu.tr/musa.kilic
Gruplanmamış (tek tek) veriler için örnek:
• Bir işletmedeki yıllık izinler gün olarak
aşağıdaki gibidir. 8,8,7,7,7,6,6,5,5,4,4,3 Buna
göre;
a) Ortalama izin kaç gündür?
b) Bu grubun ortancası(medyanı) kaçtır?
c) Mod'u kaçtır?
d) Ranj'ı(Değişim aralığı) kaçtır?
e) Standart sapması kaçtır?
f) Değişim katsayısı kaçtır?
http://kisi.deu.edu.tr/musa.kilic
Histogram
http://kisi.deu.edu.tr/musa.kilic
Gövde-Yaprak (Stem-and-Leaf)
http://kisi.deu.edu.tr/musa.kilic
Kutu-Bıyık (BoxPlot)
http://kisi.deu.edu.tr/musa.kilic
Kutu-Bıyık (BoxPlot)
http://kisi.deu.edu.tr/musa.kilic
Skewness (Çarpıklık)
Skewness (Çarpıklık)
http://kisi.deu.edu.tr/musa.kilic
http://kisi.deu.edu.tr/musa.kilic
Kurtosis (Basıklık)
http://kisi.deu.edu.tr/musa.kilic
Pareto Diyagramı
İstatistiksel Kalite
Kontrolü’nde sıkça
kullanılan araçlardan bir
tanesidir.
Kategorilere ayrılmış
değişkenleri frekanslarına
göre büyükten küçüğe
sıralayan ve aynı grafikte
kümülatif yüzdelerini de
gösteren grafik çeşididir.
http://kisi.deu.edu.tr/musa.kilic
Download