Document

advertisement
Merkezi Limit Teoremi:
İstatistikteki en temel sonuçlardan birisidir. En basit yapısıyla, birçok sayıda birbirinden bağımsız
rassal değişkenler herhangi bir dağılıştan çekilirse, bu değişkenlerin toplamı (ya da alternatif olarak
örnek ortalamaları) her zaman Normal dağılışa yakınsar.
Teorem: X 1 ,..., X n herhangi bir dağılışa sahip, ortalamaları μ, varyansları σ2 olan bağımsız rassal
değişkenler olsun.
Örneğin, her bir i için Xi ̴ Binom (n,p) olsun. μ = np ve σ2 = np(1-p)’dir.
O halde S n  X 1  ...  X n 
n
X
i 1
i
’nin dağılımı n   için Normale yakınsar.
Normal dağılımın ortalaması E S n  

Varyansı VarS n   Var
n
X

i 1
i
n
 E  X   n
i 1
i



n
  Var  X i  çünkü X 1 ,..., X n bağımsızdır.
i 1
= nσ2
Böylece S n  X 1  ...  X n n   için Normal( n ,nσ2).
Notlar:
1. Bu teorem X 1 ,..., X n ’in tüm dağılışları için geçerlidir.
2. Merkezi limit teoreminin yeterli koşulu Var(X)’in sonlu olmasıdır. Bu teoremin başka
versiyonlarında X 1 ,..., X n ’in bağımsız ve eş dağılmlı olma koşulları esnetilebilirdir.
3. Sn’in Normal dağılışa yakınsama hızı X’in dağılışına bağlıdır. Çarpık dağılışlar, simetrik
dağılışlara göre Normale daha yavaş yakınsarlar. Merkezi limit teoremi genellikle n30 için
uygulanmaktadır. Hatta n = 4 için de uygulanabilir.
Uygulamada Merkezi Limit Teoremi:
Aşağıdaki simülasyon çalışmasıyla merkezi limit teoreminin işleyişi gösterilmiş, istatistik dersinde
öğrenilen tekniklerin kullanımı anlatılmıştır. Sn’in Normal dağılışa yakınsama hızı incelenmiştir.
Örnek-1: Üçgensel dağılış
f  x   2 x , 0<x<1 için
Beklenen değer ve varyans elde edilsin:
1
  E  X    xf x dx
0
1
  2 x 2 dx
0
1
 2x3 


 3 0

2
3
 2  Var  X   E X 2   E  X 2
2
  x f x dx   
3
0
1
2
2
1
  2 x 3 dx 
0
4
9
1
 2x 4 
4

 
 4 0 9

1
18
X 1 ,..., X n bağımsız olmak üzere, S n  X 1  ...  X n olsun. O halde,
E S n   E  X 1  ...  X n   n 
2n
3
Var S n   Var  X 1  ...  X n   n 2 (bağımsızlık şartı ile)

n
18
Elde edilen sonuçla merkezi limit teoremine göre, büyük n değerleri için Sn ̴ yaklaşık Normal
 2n n 
 , .
 3 18 
Aşağıdaki grafikler n = 1,2,3 ve 10 değerleri için S n  X 1  ...  X n ’in 10.000 değerinin
 2n n 
,  .oyf ile birleştirilmiştir. Oldukça
 3 18 
histogramını göstermektedir. Yukarıda elde edilen Normal 
küçük olan n = 10 değeri için bile Normal eğri oldukça iyi bir uyum sağlamaktadır.
Örnek-2: U-şekilli dağılış
f x  
3 2
x , -1<x<1 için.
2
E  X     0 , Var X    2 
3
olarak verilmiştir.
5
X 1 ,..., X n bağımsız olmak üzere, S n  X 1  ...  X n olsun. O halde,
E S n   E  X 1  ...  X n   n  0
Var S n   Var  X 1  ...  X n   n 2 (bağımsızlık şartı ile)

3n
5
Elde edilen sonuçla merkezi limit teoremine göre, büyük n değerleri için Sn ̴ yaklaşık Normal
 3n 
 0,  .
 5 
X’in dağılışıNormal’den oldukça farklı olsa dahi, Normal eğri n = 10 gibi küçük bir değerde bile iyi
bir uyum sağlamaktadır.
Merkezi Limit Teoremini Kullanarak Binom Dağılımının Normale Yaklaşması:
Y ̴ Binom(n,p) olmak üzere,
Y şans değişkeni n adet Bernoulli değişkeninin toplamı olarak ele alınabilir:
deneme
1, basarili
Y  X 1  ...  X n burada X i  
0, diger durumlarda
Böylece Y  X 1  ...  X n ’dir ve her bir Xi için   E  X i   p ,  2  Var  X   p1  p  .
Merkezi limit teoremine göre,
Böylece,
Sabit p ile n   için
Binomun ortalaması
Binomun varyansı
Binom dağılımı, sabit p değeri için n büyük olduğunda Normal dağılıma yakınsamaktadır.
Aynı durum büyük λ değerinde Poisson dağılımı için de geçerlidir.
λ büyük olduğunda
X ̴ Binom(n,p) olduğunda, p’nin en yüksek olabilirlik tahmini,
pˆ 
X
’dir.
n
Büyük örnekler için, X ̴ yaklaşık Normal np, npq  olduğu biliniyor. Böylece
pˆ 
X
̴ yaklaşık Normal
n
 pq 
 p,
 (Normal dağılımlı rassal değişkenlerin doğrusal
n 

dönüşümü)
Ortalamanın Dağılışının Bulunmasında Merkezi Limit Teoreminin Kullanılması:
X 1 ,..., X n ortalaması E  X i    ve varyansı Var  X i    2 olan bağımsız, eş dağılımlı şans
değişkenleri olsun.
Örnek ortalaması X şu şekilde tanımlanmıştır:
X 
Böylece X 
X 1  ...  X n
n
Sn
olur. Burada merkezi limit teoremine göre S n  X 1  ...  X n ̴ yaklaşık
n
Normal( n ,nσ2).
X Normal bir rassal değişkenin bir skalerle çarpımı olduğu için, n büyüdükçe X ’nın kendisi de
yaklaşık Normal dağılışa sahip olur:
 2
X 1  ... X n
̴ yaklaşık Normal   ,
n
n


 , n   için.

Merkezi limit teoreminin şu üç durumu birbirine denktir:
yaklaşık
yaklaşık
yaklaşık
n   için
n   için
n   için
Merkezi limit teoremine dair unutulmaması gereken temel nokta, orijinal rassal değişkenlerin dağılışı
ne olursa olsun büyük örnekler için toplamları ya da ortalamaları Normal dağılışa yaklaşmaktadır.
Download