Box ve Whisker Grafiği Box and Whisker Grafiğini Yapılandırma

advertisement
Bölümün Amaçları
Bu Bölümü tamamladıktan sonra neleri
yapabileceksiniz:
DEĞİŞKENLİK ÖLÇÜLERİ
Box ve Whisker grafiğini okuma ve yorumlama,
„
Değişkenlik kavramını anlama ve verilerin değişkenliğini
yorumlama,
„
Değim Aralığı, varyans, standart sapma, değişim
(varyasyon) katsayısını tanıma ve kullanma,
„
Dr. Mehmet AKSARAYLI
D.E.Ü
D.E.Ü. İ.İ.B.F.
EKONOMETRİ
EKONOMETRİ BÖLÜMÜ
mehmet.aksarayli@deu.edu.tr
Verilerin çarpıklığını hesaplama ve yorumlamak.
„
1
www.memetaksarayli.com
w.mehmetaksaraylicom
2
Tanımlayıcı İstatistikler
Box ve Whisker Grafiği
Box and Whisker grafiği verileri merkezi
dağılımına göre gösteren bir grafiktir.
„
Yer Ölçüleri (Merkezi Değişkenlik Ölçüleri
Eğilim Ölçüleri)
•Duyarlı Ortalamalar
•Aritmetik ort.
•Tartılı Aritmetik
•Geometrik ort.
•Kareli ort.
•Harmonik ort.
•Duyarlı Olmayan Ort.
•Mod
•Medyan
•Kartiller
Çarpıklık Ölçüleri
•Bowley asimetri
•Değişim Aralığı (Range) ölçüsü
•Standart sapma
•Pearson asimetri
ölçüsü
•Varyans
•Mutlak sapma
•Değişkenlik katsayısı
•Kartil sapma katsayısı
•Ortalama sapma katsayısı
Basıklık
Ölçüleri
Example:
25%
Sapan değerler
3
„
The lower limit is
Q1 – 1.5 (Q3 – Q1)
„
„
„
„
w.mehmetaksaraylicom
Median
3rd
Quartile
Alt Limit
1. Kartil
Medyan
3. Kartil
Üst Limit
4
Box ve Whisker Grafiğinin Sekli
(Shape)
* *
1st
Quartile
25%
w.mehmetaksaraylicom
Box and Whisker Grafiğini
Yapılandırma
Lower
Limit
25%
* *
w.mehmetaksaraylicom
Outliers
25%
Eğer veriler medyan etrafına simetrik yayılmışlarsa;
medyan kutuyu ortalamıştır.
Upper
Limit
The upper limit is
Q3 + 1.5 (Q3 – Q1)
„
Merkez kutu Q1 to Q3 arasındadır
Kutu ortasındaki çizgi medyandır,
Whiskers hesaplanan limitlerde en küçük ve en büyük verileri
gösterir,
Sapan değerler grafiğin dışında gösterilmiştir.
5
(Box and Whisker grafiği hem yatay hem de dikey
şekilde gösterilebilir)
w.mehmetaksaraylicom
6
Shape of a Distribution
(Ortalama ve Medyana göre)
„
Verilerin dağılımı nasıl tanımlanır?
„
Simetriklik veya Çarpıklık
Left-Skewed
Sola çarpık
Symmetric
Distribution Shape and Box and Whisker Plot
(Kartillere göre)
Left-Skewed
Sola Çarpık
Right-Skewed
Sağa çarpık
Q1
Mean < Median
Mean = Median
(Longer tail extends to left)
Uzun kuyruk sola doğru
Q2 Q3
Q1 Q2 Q3
Q1 Q2 Q3
Median < Mean
(Longer tail extends to right)
Uzun kuyruk sağa doğru
w.mehmetaksaraylicom
7
w.mehmetaksaraylicom
8
Değişkenlik - Varyasyon
(Variation)
Box ve Whisker Grafiği Örneği
„
Right-Skewed
Sağa Çarpık
Symmetric
Below is a Box-and-Whisker plot for the following data:
Min
Q1
Q2
Q3
Max
0 2
2
2
3
3
4
5
6 11 27
Değişkenlik ölçümü; verilerin yayılımı
(spread) veya değişkenliği (variability)
hakkında bilgi verir.
„
*
0 2 3
6
12
Upper limit = Q3 + 1.5 (Q3 – Q1)
= 6 + 1.5 (6 – 2) = 12
„
27
27 is above the
upper limit so is
shown as an outlier
Aynı merkez,
Farklı değişkenlik
Bu veriler sağa çarpıktır.
w.mehmetaksaraylicom
9
w.mehmetaksaraylicom
Değişim Aralığı (Range)
„
„
10
Değişim Aralığının Zayıf Yönleri
En basit değişkenlik ölçüsüdür.
En büyük ve en küçük gözlemler (observations)
arasındaki farktır:
„
Verilerin dağılımını göz ardı eder.
7
8
9
10
11
Range = 12 - 7 = 5
D.A.=Range = xmaximum – xminimum
„
Örnek:
12
7
8
9
10
11
12
Range = 12 - 7 = 5
Sapan değerler için hassastır.
1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,5
Range = 5 - 1 = 4
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120
Range = 14 - 1 = 13
w.mehmetaksaraylicom
Range = 120 - 1 = 119
11
w.mehmetaksaraylicom
12
Kartiller Arası Değişim
Aralığı (Interquartile Range)
„
„
„
Kartiller Arası Değişim Aralığı
Örneği:
Bazı sapan değer problemlerine uygulanabilir.
Örnek:
X
Yüksek ve düşük sapan değerleri dikkate
almadan kalan verilerle değişim aralığını
hesaplar.
minimum
25%
12
Interquartile range = 3rd quartile – 1st quartile
w.mehmetaksaraylicom
Median
(Q2)
Q1
25%
30
∑ x −x
i
∑ f x −x
∑f
i
14
Ortalama mutlak sapmada kullanılan mutlak değerli ifadeler ile
işlem yapmanın zor hatta bazı durumlarda imkansız olması
sebebiyle yeni değişkenlik ölçüsüne ihtiyaç bulunmaktadır.
„
Veri setindeki her bir gözlem değerinin aritmetik ortalamadan
farklarının karelerinin toplamının örnek hacminin bir eksiğine
bölünmesinden elde edilen değişkenlik ölçüsüne örnek
varyansı adı verilir.
„
w.mehmetaksaraylicom
15
Varyans (Variance)
w.mehmetaksaraylicom
Basit seriler İçin:
Populasyon Varyansı:
μ : Populasyon Ortalaması
Verilerin aritmetik ortalamadan sapmasının
ortalama ölçüsüdür.
N
„
Anakitle varyansı:
σ2 =
∑ (xi − μ)
Örnek(Sample) varyansı:
w.mehmetaksaraylicom
s2 =
16
2
2
i=1
− x)
N
∑ (x − x )
n
2
Örnek Varyansı :
s =
2
2
i
i =1
n −1
k
s2 =
Gruplanmış Seriler İçin:
i
i
N : Populasyon Hacmi
N
∑ (x
∑ (x − μ )
σ =
i=1
n
„
70
Mutlak değer ifadesindeki zorluk aritmetik ortalamadan farkların
karelerinin alınmasıyla ortadan kalkmaktadır.
i
„
57
„
n
i
45
Varyans
Ortalama Mutlak Sapma (MAD) : Bir gözlemin ortalamadan ortalama
olarak ne kadar saptığının ölçüsüdür.
Gruplandırılmış veriler için: MAD =
maximum
25%
w.mehmetaksaraylicom
Ortalama Mutlak Sapma
MAD =
25%
Interquartile range
= 57 – 30 = 27
13
Basit veriler için:
X
Q3
∑ f (x
i
i
− x )2
∑f
i
−1
i =1
k
2
i =1
k
n -1
Sınıflanmış Seriler İçin :
17
s =
2
∑ f (m − x )
i =1
i
i
k
∑f
i =1
i
−1
2
∑ (x − x )
n
(∑ x )
−
2
i
i =1
∑x
2
2
i =1
i
i =1
s =
Basit Seriler İçin:
n −1
ifadesi istatistikte bir çok formülde kullanılır ve
kareler toplamı olarak adlandırılır.
∑ fx
i
s =
∑ (x − x ) = ∑ x
2
i
i =1
i =1
2
i
k
∑
2
n
i=
i
i =1
„
„
„
σ=
„
Örne standard deviation:
∑ (x − μ)
„
13
14
15
16
17
18
19
20 21
12
13
14
15
16
17
18
19
20 21
12
13
14
15
16
17
18
19
20 21
i
−1
σ
Dağılım fazlaysa standart sapma büyük, dağılım
dar alanda ise küçüktür.
∑ (x
i=1
i
− x )2
n -1
w.mehmetaksaraylicom
22
Örnek verileri için standart
sapma hesaplama:
ortalama = 15.5
s = 3.338
Örnek
Veriler (Xi) :
ortalama = 15.5
s = .9258
23
12
14
15
n=8
=
ortalama = 15.5
s = 4.57
10
=
17
18
18
24
Ortalama = x = 16
(10 − x ) 2 + (12 − x ) 2 + (14 − x ) 2 + L + (24 − x ) 2
n −1
s =
Data C
w.mehmetaksaraylicom
∑f
i
N
Ortalama aynı, fakat
standart sapmaları farklı:
Veri B
11
i =1
k
Bir dizi ölçümün gösterdiği değişimin en
güvenilir ölçüsüdür.
Standart Sapmaları Karşılaştırma
12
k
∑f
2
21
Veri A
i
i
w.mehmetaksaraylicom
11
i
2
i =1
n
s=
11
⎛ k
⎞
⎜ ∑ f i mi ⎟
2
i=
⎝
⎠
fm −
Standart sapma:
N
Anakitle standard deviation:
i
i =1
„
i
∑ f −1
19
En yaygın kullanılan değişkenik ölçüsüdür,
Ortalama değişkenliği gösterir,
Orijinal verilerin aynı ölçü birimine sahptir.
„
k
∑ f
i
i =1
n
Standart Sapma
(Standard Deviation)
i
k
s2 =
Sınıflanmış Seriler İçin :
w.mehmetaksaraylicom
2
i
i=
i =1
• Matematiksel olarak hesaplama kolaylığı sağlaması
açısından formüllerde kareler toplamının açılımı olan
aşağıdaki eşitlik kullanılabilir.
(∑ x )
−
(∑ f x )
−
2
2
Gruplanmış Seriler İçin:
n
n
k
k
i=
n
2
n
n
(10 − 16)
130
7
w.mehmetaksaraylicom
=
2
+ (12 − 16)
2
+ (14 − 16)
8 −1
2
+ L + (24 − 16)
2
4.3095
24
Basit seriler İçin:
∑ (x − μ )
2
σ=
Populasyon Standart Sapması:
i
N
Basit veriler için:
μ : Populasyon Standart Sapması N : Populasyon Hacmi
∑ (x − x )
n
Örnek Standart Sapması :
s=
n −1
k
∑ f (x − x)
s=
Gruplanmış Seriler İçin:
i
i =1
k
i =1
i
−1
k
Sınıflanmış Seriler İçin :
∑ f (m − x )
s=
i
i =1
∑f
i
fi
35
1
( xi − x )2 fi( xi − x )2
-10
100
100
40
4
-5
25
100
45
5
0
0
0
50
4
5
25
100
55
1
10
100
100
Top.
15
35
-10
100
40
-5
25
45
0
0
5
25
55
10
100
s=
=
i
Göreli (relative) değişkenliği ölçer
(%) olarak youmlanır
„
„
⎛σ ⎞
CV = ⎜⎜ ⎟⎟ ⋅ 100%
⎝ μ ⎠
w.mehmetaksaraylicom
fi
2
6
10
7
4
1
30
∑ f (m − x )
i =1
i
i
∑ f −1
k
i =1
i
v
fi( mi − x )2
2(33-46,6)2
6(39-46,6)2
10(45-46,6)2
7(51-46,6)2
4(57-46,6)2
1(63-46,6)2
1579,2
mi
33
39
45
51
57
63
2
=
k
x=
∑m f
i
i=1
k
∑f
i=1
i
= 46,6kg.
i
1579,2
≈ 54,46
30 − 1
s = s = 54,46 ≈ 7,38 kg.
2
Değişkenlik Katsayısı Örneği:
„
İki veya daha fazla veri seti için karşılaştırmada
kullanılır.
Örnek: İstanbul’da ve Ankara’da yaşayan ailelerin aylık
gelirlerinin değişkenliklerinin karşılaştırılması
Population
26
k
s =
Varyasyon - Değişkenlik Katsayısı
(Coefficient of Variation)
„
250
= 7.9
5 −1
=
250
Sınıflar
30-36’dan az
36-42’den az
42-48’den az
48-54’dan az
54-60’den az
60-66’den az
Toplam
400
= 5.345
14
„
n −1
Sınıflandırılmış veriler için standart sapma:
2
2
i
Örnek: Aşağıdaki tabloda 30 günlük süre içinde bir restoranın kullandığı
et miktarının dağılımı verilmiştir. Günlük kullanılan et miktarının
varyansını ve standart sapmasını hesaplayınız.
400
i
2
50
4
i
∑ (x − x )
s=
w.mehmetaksaraylicom
xi − x
∑ f (x − x)
∑ f −1
x = 225 / 5 = 45
−1
Gruplandırılmış ve sınıflandırılmış veriler için standart sapma:
xi
(x i- x ) 2
225
2
i
k
i =1
2
i
∑f
x i- x
xi
2
i
i =1
„
Sample
Hisse senedi A:
„ Geçen yılki ortalama fiyat = $50
„ Standart sapma = $5
⎛s⎞
$5
CVA = ⎜⎜ ⎟⎟ ⋅ 100% =
⋅ 100% = 10%
$50
⎝x ⎠
Hisse senedi B:
„ Geçen yılki ortalama fiyat = $100
„ Standart sapma = $5
⎛ s ⎞
⎟ ⋅ 100%
CV = ⎜⎜
⎟
⎝ x ⎠
⎛s⎞
$5
CVB = ⎜⎜ ⎟⎟ ⋅ 100% =
⋅ 100% = 5%
$100
x
⎝ ⎠
29
w.mehmetaksaraylicom
Her iki hisse
senedi de aynı
standart
sapmaya sahip,
fakat hisse
senedi B daha
az göreli
değişkenliğe
sahiptir.
30
Çarpıklık (Asimetri) Ölçüleri
„ Populasyonları birbirinden ayırmak için her zaman yalnızca yer ve
yayılım ölçüleri yeterli olmayabilir. Aşağıda iki farklı populasyondan
alınmış örnekler için oluşturulan histogramlar verilmiştir.
Örnek: Buca ve Alsancak için gelir dağılımıyla ilgili veriler
aşağıdaki gibidir:
Buca Alsancak
25
X
s
Cv
50
5
7
0.2
0.14
Yorum: Buca’daki gelir dağılımı
Alsancak’takine göre daha değişkendir.
w.mehmetaksaraylicom
31
0
μA
0
μΒ
A
B
w.mehmetaksaraylicom
32
Asimetri Ölçüleri
PEARSON ÇARPIKLIK ÖLÇÜSÜ
Şekilden görüleceği üzere A ve B örneklerinin aynı
ortalamaya ve yaklaşık olarak aynı değişkenliğe sahip
olmalarına rağmen bu iki örneğin açıkça aynı
populasyondan gelmediği söylenir.
„
Skp =
3( X − med)
x − mod
veya Skp =
s
s
Skp<|1| --- Az çarpık dağılım
Skp>|1| --- Çarpık dağılım
SkP < 0 →Negatif çarpık(Sola)
SkP > 0 → Pozitif Çarpık(Sağa)
Asimetri (çarpıklık) ifadesi simetrik olmayan anlamını
taşımaktadır.
„
SkP = 0
Şekillere bakıldığında frekansların A’da daha çok sol
tarafta (küçük xi değerlerinde), B’de ise daha çok sağ
tarafta (büyük xi değerlerinde), toplandığı görülmektedir.
„
w.mehmetaksaraylicom
ise dağılış simetrik
BOWLEY ÇARPIKLIK ÖLÇÜSÜ
Skb =
33
(Q3 − Q2 ) − (Q2 − Q1 )
Q3 − Q1
Skb < 0 → Negatif çarpık(Sola)
Skb > 0 → Pozitif Çarpık(Sağa)
Skb = 0
ise dağılış simetrik
w.mehmetaksaraylicom
34
Örnek: Aşağıdaki tabloda 30 günlük süre içinde bir restoranın
kullandığı et miktarının dağılımından elde edilen bazı tanımlayıcı
istatistikler verilmiştir. Buna göre pearson ve bowley asimetri
ölçülerini hesaplayıp yorumlayınız.
Aritmetik Ort.
Mod
Medyan
Q1
Q2
s2
Simetrik Dağılım
46,6
45,4
46,2
41,5
51,9
54,46
A.O = Med = Mod
Sk p =
3( X − med ) 3( 46 ,6 − 46 , 2 )
=
≈ 0,16 > 0
s
54 , 46
Sk p =
x − mod 46 ,6 − 45 , 4
=
≈ 0,16 > 0
s
54 , 46
Sağa çarpık dağılım Sola çarpık dağılım
A.O > Med > Mod
A.O < Med < Mod
Sağa Çarpık ,
Pozitif Asimetri
Sağa Çarpık,
Pozitif Asimetri
Skb =
(Q3 − Q2 ) − (Q2 − Q1 ) (51,9 − 46,2) − (46,2 − 41,5)
=
Q3 − Q1
51,9 − 41,5
=
1
≈ 0,10 > 0
10,4
Sağa Çarpık ,
Pozitif Asimetri
İki modlu simetrik dağılım
Modu olmayan dağılım Tekdüzen dağılım
Basıklık Ölçüsü
Herhangi bir olasılık fonksiyonunun şekli ile ilgili parametrelerden bir
tanesi de basıklık ölçüsüdür. Basıklık Ölçüsü ortalamaya göre
dördüncü momentten gidilerek hesaplanır ve α4 olarak gösterilir.
Aşağıdaki A ve B dağılımlarının ortalamaları, değişkenlik
ölçülerinin aynı olmasından dolayı ve hatta ikisinin de
simetrik olmalarından dolayı bu iki dağılışı ayırt etmek için
Basıklık Ölçüsü kullanılır.
A
α4 =
B
μ4
σ4
n
Basit Seri İçin
μ4 =
∑ (x
i =1
− μ)
4
i
n
α4 = 3 ise Seri Normal
α4 < 3 ise Seri Basık
α4 < 3 ise Seri Sivri Ya da Yüksek
w.mehmetaksaraylicom
A
=
B
37
w.mehmetaksaraylicom
Microsoft Excel ile tanımlayıcı
istatistikleri hesaplama:
„
38
Excel Kullanımı
Descriptive Statistics are easy to obtain
from Microsoft Excel
„
Menüden:
Data / data analysis / descriptive statistics
„
Açılan pencereden gerekli veriler gir:
„
Seç:
Data / data analysis / descriptive statistics
w.mehmetaksaraylicom
39
w.mehmetaksaraylicom
Using Excel
„
„
„
40
Excel Çıktısı
Gerekli veriler gir
“summary
statistics”
butonunu seç
OK butonu…
w.mehmetaksaraylicom
41
w.mehmetaksaraylicom
42
Örnekler…
Örnek 1: Gruplanmış Seriler İçin Aritmetik Ortalama
k
x=
∑x f
i
i =1
f : frekans
∑ f =n
k
i
k
∑f
i =1
w.mehmetaksaraylicom
43
Örnek: Yandaki tabloda bir Samsung
bayisindeki LCD televizyonların ekran
boyutlarına göre satış miktarları verilmiştir.
Frekans dağılımının aritmetik ortalamasını
hesaplayınız.
fi
2
6
10
7
4
1
30
az
az
az
az
az
az
k
x =
∑m f
i
i =1
k
∑ f
i =1
i
=
i
=
mi
33
39
45
51
57
63
mifi
66
234
450
357
228
63
1398
X=
fi
2
6
10
14
9
7
2
50
∑fm
∑f
1
i
i
=
mi
85
95
105
115
125
135
145
5760
= 115.2
50
sınıflar
80-≤90
90-≤100
100-≤110
110-≤120
120-≤130
130-≤140
140-≤145
toplam
Histogram
fr
15
51(1) + 66 (3) + .... + 94 ( 7 )
1+ 3 + 4 + 5 + 7
=
1605
= 80 , 25
20
i
44
fi
2
6
10
7
4
1
30
Δ
.i
Δ +Δ
1
fi
2
6
10
14
9
7
2
50
2
Q2 = Med = LQ2 +
x
Mod = L mod +
Σ mi fi
170
570
1050
1610
1125
945
290
5760
mi
85
95
105
115
125
135
145
∑f
5
90 100 110 120 130 140
∑ f
=
(10 − 6)
= 42 +
.6 = 45,4 kg.
(10 − 6) + (10 − 7)
10
80
i
k
Sınıflar
30-36’dan az
36-42’den az
42-48’den az
48-54’dan az
54-60’den az
60-66’den az
Toplam
1
w.mehmetaksaraylicom
0
i
i =1
i =1
mod
1398
= 46 , 6 kg .
30
Σfi
2
8
18
32
41
48
50
x=
Mod = L +
33 ( 2 ) + 39 ( 6 ) + ... + 63 (1)
30
Σ mi fi
170
570
1050
1610
1125
945
290
5760
k
∑x f
w.mehmetaksaraylicom
Mod sınıfı
Örnek 4: Bir tencere pazarlama firmasına bağlı çalışan 50 satış
personelinin 1 aylık tencere satışları aşağıdaki gibidir. Bu verileri
kullanarak histogramı çiziniz, aritmetik ortalama, mod, medyan
ve kartilleri hesaplayarak yorumlayınız.
sınıflar
80-≤90
90-≤100
100-≤110
110-≤120
120-≤130
130-≤140
140-≤150
toplam
1
51
3
198
4
288
5
410
7
658
∑fi =20 1605
Örnek 3: Aşağıdaki tabloda 30 günlük süre içinde bir
restoranın kullandığı et miktarının dağılımı verilmiştir. Günlük
kullanılan et miktarının modunu hesaplayınız.
Örnek 2 : Aşağıdaki tabloda 30 günlük süre içinde bir
restoranın kullandığı et miktarının dağılımı verilmiştir. Günlük
kullanılan et miktarının aritmetik ortalamasını hesaplayınız.
Sınıflar
30-36’dan
36-42’den
42-48’den
48-54’dan
54-60’den
60-66’den
Toplam
i = 1,2,3,……….,k
i
Grup Frekans xifi
51
66
72
82
94
k: grup sayısı
i
i =1
2
i
− fl
fQ2
Σfi
2
8
18
32
41
48
50
50
−18
.i = 110 + 2
.10 = 115
14
4
Δ1
.i = 110 +
. 10 = 114 . 4
Δ1 + Δ 2
4+5
46
sınıflar
80-≤90
90-≤100
100-≤110
110-≤120
120-≤130
130-≤140
140-≤145
toplam
fi
2
6
10
14
9
7
2
50
Σ mi fi
170
570
1050
1610
1125
945
290
5760
mi
85
95
105
115
125
135
145
Σfi
2
8
18
32
41
48
50
∑f
Q1 = LQ1 +
Yorumlama:
Histogram
i
4
− fl
f Q1
Q1 : Gözlemlerin %25’i
104.5’ten daha
küçüktür.
fr
15
.i
10
50
−8
= 100 + 4
.10 = 104.5
10
Yorumlama:
Q2 : Gözlemlerin
%50’si 115’ten daha
küçük, %50’si 115’ten
daha büyüktür.
5
0
Q2 = Med = 115
80
90
%25 %25
%25
3∑ f i
3 × 50
− fl
− 32
Q3 = LQ3 + 4
.i = 120 + 4
.10 = 126.11
f Q31
9
x
100 110 120 130 140
%25
Yorumlama:
Q3 : Gözlemlerin %25’i
126.11’den daha
büyüktür.
Q1=104.5 Q2=115 Q3=126.11
A.O=115.2
Mod=114.4
Örnek 5: İstatistik I dersini alan 10 öğrencinin vize notları
aşağıdaki gibi sıralanmıştır. Buna göre vize notları için varyans ve
standart sapmayı hesaplayınız.
Aynı soru kareler ortalamasının açılımı
çözüldüğünde aynı sonuçları verecektir.
kullanılarak
30,41,53,61,68,79,82,88,90,98
n
∑x
30 + 41 + .... + 98
=
= 69
x=
n
10
30,41,53,61,68,79,82,88,90,98
∑ (x − x )
n
s =
2
(30 − 69 ) + (41 − 69 ) + ... + (98 − 69 )
=
2
2
i
i =1
i
i =1
2
n −1
4538
=
≈ 504 , 22
9
s ≈ 504 , 22
2
9
2
→
s = s = 504,22 ≈ 22,45
2
2
x
x
30
41
53
61
68
79
82
88
90
900
1681
2809
3721
4624
6241
6724
7744
8100
Örnek 6 : Yandaki tabloda bir Samsung bayisindeki LCD
televizyonların ekran boyutlarına göre satış miktarları verilmiştir.
Frekans dağılımının varyans ve standart sapmasını hesaplayınız.
Grup Frekans xifi
51
66
72
82
94
(∑ f x )
−
k
i=
s =
i
2
i
i
i=
i =1
∑ f −1
k
i
(1605)
2
i
i
2
=
131607 −
20
19
≈ 147,67
s = s = 147,67 ≈ 12,15
2
2
i =1
i
n −1
n
(690)
2
i =1
=
52148 −
10
9
s ≈ 504 , 22
2
s=
i =1
51
n
i
i =1
s =
2
504 , 22 ≈ 22 , 45
2
i
w.mehmetaksaraylicom
52
Örnek 7 : Kuruyemiş satan bir dükkanda bir haftalık sürede satılan
leblebi, fıstık ve bademlerin ortalamaları ve standart sapmaları aşağıda
verilmiştir. Buna göre kuruyemişleri değişkenlikleri açısından
karşılaştırınız ve kuruyemişin değişkenliğinin daha fazla olduğunu
belirtiniz.
x
s
Leblebi
30 kg.
5 kg.
Fıstık
40 kg.
4 kg.
Badem
10 kg.
3 kg.
C
Vleblebi
C
C
=
V fııstı
VBADEM
k
∑f
2
i =1
1
51
2601
3
198 13068
4
288 20736
5
410 33620
7
658 61852
∑fi =20 1605 131607
2
k
∑fx
xi2 fi
s =
∑x
2
∑ x = 690 ∑ x = 52148
n
İstatistik I vizesinden alınan notların ortalama etrafında
yaklaşık olarak 22 puan değiştiği görülmektedir.
w.mehmetaksaraylicom
(∑ x )
−
n
n
s
5
*100 = *100 = 16,67 = %16,67
30
X
4
s
= * 100 =
* 100 = 10 = % 10
40
X
=
3
s
*100 = *100 = 30 = %30
10
X
Üç kuruyemişin değişkenlikleri karşılaştırıldığında en küçük standart
sapma değeri bademde olmasına rağmen en büyük varyasyon
katsayısına sahip olduğundan en fazla değişkenliğin bademde olduğu
görülür. Aritmetik ortalamalar içerisinde standart sapma yüzdelerine
bakıldığında en büyük yüzde bademdedir.
GRAFİKLER
Scores Plot of y1 y2 y3 y41 vs x1 x2 x32
2,00
1,13
1,13
y1 y2 y3 y41
y1 y2 y3 y41
Scores Plot of y1 y2 y3 y41 vs x1 x2 x31
2,00
0,25
-0,63
-1,50
-2,00
0,25
-0,63
-1,13
-0,25
0,63
-1,50
-2,00
1,50
-1,00
x1 x2 x31
Scores Plot of y1 y2 y3 y41 vs x1 x2 x33
2,00
1,50
0,38
y1 y2 y3 y42
1,13
y1 y2 y3 y41
1,00
Scores Plot of y1 y2 y3 y42 vs x1 x2 x31
2,00
0,25
-0,63
-1,50
-2,00
0,00
x1 x2 x32
-0,75
-1,88
-1,00
0,00
x1 x2 x33
1,00
2,00
-3,00
-2,00
-1,13
-0,25
x1 x2 x31
0,63
1,50
Download