Merkezi Limit Teoremleri

advertisement
13. Ders
Merkezi Limit Teoremleri
Büyük sayılar kanunları rasgele değişkenlerin X n  dizisinde
S n = X 1 + X 2 +. . . +X n
kısmi toplamlarına dayalı,
X n = S n /n
ortalamalarının X n  dizisi için,
p
X n  EX 1 
yakınsamasını ifade etmektedir.
S n − ES n 
VarS n 
Yn =
olmak üzere, Merkezi limit teoremleri, Y n  dizisinin dağılımda yakınsaması ile ilgilidir.
Bazı X n  dizileri için Y n  dizileri dağılımda, dağılım fonksiyonu,
x
Fx = ∫
−∞
1 e −x 2 /2 dx
2n
olan dağılıma yakınsamaktadır. Bu dağılımın olasılık yoğunluk fonksiyonu,
2
fx = 1 e −x /2 , − ∞ < x < ∞
2n
karakteristik fonksiyonu,
Φ X t = e −t
2 /2
, t∈R
beklenen değeri 0, varyansı 1 olmak üzere, kendisine standart normal dağılım denir ve
N0, 1 biçiminde gösterilir. Bu kısımda N0, 1 dağılımına sahip rasgele değişken Z harfi
ile gösterilecektir. Buna göre, μ ∈ R , σ 2 ∈ 0, ∞ için X = σZ + μ rasgele değişkeninin
beklenen değeri EX = μ, varyansı VarX = σ 2 olmak üzere, olasılık yoğunluk
fonksiyonu,
1 x−μ 2
−
σ
1 e 2
f X x =
, −∞ < x < ∞
2n σ
ve karakteristik fonksiyonu,
μ X t = e
iμt−
σ2t2
2 , t∈R
dır. Bu dağılıma μ ortalamalı ve σ 2 varyanslı normal dağılım denir ve Nμ, σ 2  ile
gösterilir. Bu kitapta ilk defa belli bir dağılımın ismi zikredilmiş oldu. Kitabın başlıca
amacı olasılık ve istatistik ile ilk kez karşılaşanlar için temel kavramları, özellikle rasgele
değişken kavramını tanıtmak olduğundan, dağılımların tanımlamaları ve
isimlendirilmeleri yapılmadı. Merkezi limit teoreminde karşımıza çıkan N0, 1 dağılımı,
başka yollardan da karşımıza çıkabilir. Örneğin sıfır ortalamalı ve bir varyanslı dağılımlar
arasında en küçük entropiye sahip dağılım N0, 1 dir. N0, 1 dağılımı ilk olarak
DeMoivre, Laplace ve Gauss tarafından fark edilmiştir.
Teorem: (Lindeberg-Levy Teoremi) X n  dizisi sıfır ortalamalı, bir varyanslı bağımsız ve
aynı dağılımlı rasgele değişkenlerin bir dizisi ise,
d
Sn 
Z
n
dır.
Đspat: S n = Y 1 + Y 2 +. . . +Y n olmak üzere,
Φ S n t = Φ X 1 t n
,t ∈ ℝ
ve
Φ S n / n t = Φ S n
t
n
=
ΦX1
n
t
n
yazılabilir.
ΦX1
t
n
= 1+
iEX 1 
1!
2
2
3
3
t + i EX  t 2 + i EX  t 3 +. . .
3
n
2!
3!
n
n2
iEX 3  t 3
= 1 − 1 t2 −
+. . .
3! n 32
2n
olmak üzere,
Φ S n / n t =
iEX 3  t 3
1 − 1 t2 −
+. . .
2n
3! n 32
n
ve
lim
n∞
iEX 3  t 3
1 − 1 t2 −
+. . .
2n
3! n 32
n
t2
= e− 2
yani,
lim Φ S n / n t = Φ Z t
n∞
olduğundan,
d
Sn 
Z
n
olup, teorem ispatlanmıştır.
S n = nX n
olmak üzere,
d
n Xn  Z
dır.
Bağımsız ve aynı dağılımlı rasgele değişkenlerin V n  dizisi için EV n  = μ,
VarV n  = σ 2 < ∞, n = 1, 2, . . . olduğunda,
Xn =
Vn − μ
, n = 1, 2, . . .
σ
−
V −μ
X n = nσ
, n = 1, 2, . . .
ve
−
d
n Xn  Z
olmak üzere,
−
V n −μ d
Z
σ/ n
dır.
Özetlersek, ikinci momentleri mevcut bağımsız ve aynı dağılımlı rasgele
değişkenlerin X n  dizisi için,
Xn − μ d
Z
σ/ n
yani,
lim P
n∞
Xn − μ
≤t
σ/ n
= PZ ≤ t
t
=
∫
−∞
1 e −z 2 /2 dz
2n
dır. DeMoivre-Laplace teoremi bu sonuçtan elde edilebilir.
∞
X n , n = 1, 2, . . . rasgele değişkenlerinin karakteristik fonksiyonu için ∫ |Φ X 1 t| < ∞
−∞
özelliği de sağlanıyorsa S n / n rasgele değişkenlerin olasılık(yoğunluk) fonksiyonlarının
değerleri de standart normal dağılımın olasılık yoğunluk fonksiyonunun değerlerine
yakınsadığı, yani
n∞
1 e −x 2 /2
f S n / n x 
2π
olduğu ispatlanabilir.
Teorem: (Liapunov Teoremi) X n  dizisi, bağımsız rasgele değişkenlerin, EY i  = μ i ,
VarX i  = σ 2i , β i = E|X i − μ i | 2 < ∞, i = 1, 2, . . . ve
n
1/3
∑ βi
n∞
i=1
n
1/2
 0
∑ σ 2i
i=1
olan bir dizi ise,
S n − ES n  d
Z
VarS n 
dır.
Teorem:(Lindeberg-Feller Teoremi) X n  bağımsız rasgele değiş-kenlerin bir dizisi
olmak üzere, her  > 0 için,
n∞
S − ES n  d
i
max
 0 ve n
Z
1≤i≤n
VarS n
VarS n 
olması için gerek ve yeter şart
n
1
VarS n
∑
∫
i=1
|x−μ i |>VarS n
x − μ i  2 dF X n x
n∞
 0
olmasıdır. (Buradaki integral bir Riemann-Stieltjes integralidir.)
Teorem:X n  bağımsız ve aynı dağılımlı, EX n  = μ , VarX n  = σ 2 < ∞, n = 1, 2, . . . olan
rasgele değişkenlerin bir dizisi, V n  tam sayı değerler alan rasgele değişkenlerin bir
dizisi, öyleki a n  pozitif sayıların,
lim a n = ∞
n∞
olan bir dizisi olmak üzere, c c < ∞ pozitif sabiti için,
P
Vn 
c
an
olsun. O zaman,
Vn
∑ X i − μ
d
i=1
σ Vn
Z
dir.
Teorem: n = 1, 2, . . . için EX n  = 0 , VarX n  = 1 olmak üzere, X n  bağımsız ve aynı
dağılımlı rasgele değişkenlerin bir dizisi olsun. Bu dağılımın Φt karakteristik fonksiyonu
mutlak integrallenebilir, yani
∞
∫
|Φt|dt < ∞
−∞
ise,  n X n  dizisindeki n X n rasgele değişkenlerin olasılık (yoğunluk) fonksiyonlarının
dizisi düzgün olarak standart normal dağılımın olasılık yoğunluk fonksiyonuna yakınsar,
yani düzgün olarak,
2
lim f n X x = 1 e −x /2 , x ∈ R
n∞
2π
dır.
Yukarıdaki teoremlerin ispatları kitaplarda bulunabilir.
X n  bağımsız ve aynı dağılımlı EX i  = μ, VarX i  = σ 2 < ∞ , i = 1, 2, . . .
rasgele değişkenlerin bir dizisi olduğunda,
olan
n
n
i=1
i=1
∑ Xi − E ∑ Xi
Yn =
d
Z
n
Var ∑ X i
i=1
yani,
lim PY n ≤ t = PZ ≤ t , t ∈ R
n∞
Büyük n ’ler için,
n
n
∑ Xi − E ∑ Xi
P
i=1
≤t
i=1
n
≃ PZ ≤ t
Var ∑ X i
i=1
P
Xn − μ
≤t
σ/ n
≤ t ≃ PZ ≤ t
dır.
Örnek: X 1 , X 2 , . . . X n , . . . dizisindeki rasgele değişkenler bağımsız ve herbiri, olasılık
yoğunluk fonksiyonu,
fx =
1 , 0<x<1
0 ,
d. y.
olan dağılıma sahip olsun. Bu dağılımın beklenen değeri 1/2 ve varyansı 1/12 olmak
üzere,
d
12n X n − 1/2  Z
ve büyük n ler için,
P
12n X n − 1/2 ≤ t
≈ PZ ≤ t , t ∈ R
dır. Örneğin 0, 1 aralığındaki reel sayılardan "rasgele 27 tane sayı çekilirse" bunların
ortalamasının 0.45 ile 0.55 arasında olması olasılığı yaklaşık olarak,
P0, 45 < X 27 < 0, 55 = PX 27 < 0, 55 − PX < 0, 45
=P
−P
12 × 27 X 27 − 0, 5 <
12 × 27 X 27 − 0, 5 <
12 × 27 0. 55 − 0. 5
12 × 27 0. 45 − 0. 5
≈ PZ < 1. 8 − PZ < −1. 8 = 0. 722
dır.
Örnek:Düzgün bir paranın ardarda atılması deneyinde X, bir atışta gelen tura sayısı
olmak üzere,
x
1
2
f X x =
1−x
1
2
, x = 0, 1
n
ve ∑ X i , n atışta gelen tura sayısı olmak üzere,
i=1
n
n
=  nx  1
2
P ∑ Xi = x
i=1
, x = 0, 1, 2, . . . , n
n
dır. X n =∑ X i /n rasgele değişkeninin aldığı değerler,
i=1
x n = 0, 1/n, 2/n, . . . , 1
olmak üzere, bu değerleri alması olasılığı,
−
P X n = nk = n
k
dır. Merkezi limit teoreminden,
n
1
2
, k = 0, 1, 2, . . . , n
d
2 n X n − 1/2  Z
n
∑ X i − n/2
2
n
d
Z
i=1
ve büyük n ler için,
P
2
n
n
∑ X i − n/2
≤t
≈ PZ ≤ t
i=1
n
nt
+ n
2
2
P ∑ Xi ≤
i=1
≈ PZ ≤ t
dır. Buna göre 100 atışta gelen tura sayısının 56 dan az olması olasılığı için,
n
P ∑ X i ≤ 55
≈ PZ ≤ 1 = 0. 8413
i=1
dır.
Problemler
1. X n  bağımsız ve aynı dağılımlı μ ortalamalı ve σ 2 < ∞ varyanslı rasgele
değişkenlerin bir dizisi olmak üzere,
n
∑ X i − X n  2
S 2n−1 =
i=1
P
n−1
 σ2
ve
Xn − μ
=
S n−1 / n
n X n − μ
n
∑ X i − X n  2
i=1
n−1
d
Z
olduğunu gösteriniz.
2.
a) Düzgün bir zar 100 defa atıldığında en az 20 kez 6 gelmesi olasılığı nedir?
b) Düzgün bir zar 100 defa atıldığında gelen sayıların toplamının 360 dan büyük
olması olasılığı nedir?
8. Belli bir tür elektronik parça için yıl olarak dayanma süresinin (X) olasılık yoğunluk
fonksiyonu,
fx =
e −x , x > 0
0
,
d. y.
olduğu bilinmektedir.
a) Böyle 100 parçanın toplam dayanma süresinin en az 110 yıl olması olasılığı
nedir?
b) Böyle 100 parçadan en az 50 tanesinin dayanma süresinin 1 yıldan fazla olması
olasılığı nedir?
Download