BÖLÜM 5: KESĠKLĠ ġANS SEĞĠġKENĠ DAĞILIMLARI Bu kısımda, gerçek yaşamdan ortaya çıkan pek çok rassal olayın modellenmesinde faydalı olan, kesikli (tek değişkenli) parametrik olasılık dağılımlarından bazıları incelenecektir. Ele alınacak dağılımlar, bir hipotetik örnekleme süreci ile ilgili varsayımlar kümesi altında matematiksel olarak elde edilmiş teorik dağılımlardır. Bu teorik dağılımlar, belirli parametrelere göre bir olasılık kütle (mass) ailesini tanımlayan kurallar kümesi ile ifade edilirler. Bir şans değişkeni X ve bir parametre verilmiş olsun. f ( x, ) ise bir kesikli teorik olasılık kütle fonksiyonunu tanımlayan kural olsun. Eğer bir reel sayı ise, bu parametre farklı olasılık kütle fonksiyonlarının; f ( x,1 ), f ( x,2 ), bütün bir kümesini belirler. Sonuç olarak, bu parametrik kesikli dağılım ailesinin değişik elemanlarını içeren küme f (X , ) / tanımlanabilir. Bir şans değişkeni X için kesikli olasılık kütle fonksiyonu ailesini tanımlamakta kullanılabilecek parametre tipleri aşağıda listelenmiştir; Sayım (count) parametresi; bir şans deneyindeki belirli bir çıktının ortaya çıkış sayısı. Orantı (proportion) parametresi; bir şans deneyindeki belirli bir çıktının ortaya çıkış sayısının toplam deneme sayısına göreceli oranı. Yer (location) parametresi: X-ekseni üzerinde, olasılık kütle fonksiyonunun pozisyonunu (orijine göre göreceli olarak) belirler. Ölçek (scale) parametresi: şans değişkeninin ölçümlendiği birimleri dikkate alarak, fonksiyonun grafiğini daraltarak ya da genişleterek olasılık kütle fonksiyonun yayılımını etkiler. Biçim (shape) parametresi: bir olasılık kütle fonksiyonunun şeklini (örneğin simetrisi) etkiler. Oran (rate) parametresi: bir rassal sürecin zaman, uzay, hacim, üzerinden çıktılarının oluşum yoğunluğunu belirler (örneğin verilen bir zaman periyodunda bir olayın ortaya çıkış sayısı). Aşağıdaki kısımlarda bazı özel kesikli şans değişkeni modelleri ve özellikleri ele alınmıştır. 5.1 KESĠKLĠ UNĠFORM (TEKDÜZE) DAĞILIM Bir kesikli şans değişkeni X, her biri 1 / k eşit olasılıklı k adet farklı değer alabiliyor ise bu şans değişkeni kesikli tekdüze dağılıma sahiptir. Tanım (Üniform şans değişkeni): k pozitif bir tam sayı olmak üzere olasılık dağılımı 1 k f x; k 0 x 1,, k d .d fonksiyonu ile belirlenen bir X şans değişkeni, kesikli uniform şans değişkeni olarak adlandırılır. Teorem: Eğer X bir kesikli uniform dağılıma sahip ise, beklenen değeri, varyansı ve moment türeten fonksiyonu aşağıdaki eşitlikler ile tanımlanmıştır: 142 a. E X k 1 , 2 b. V X k 2 1 12 c. M X t k e tx x 1 k Ġspat: İlk olarak x x 1 a. E X k 1 k k k 1 ve 2 x k 1 x 1 k x 2 x 1 k k 12k 1 olduğu hatırlanarak, 12 k 1 2 elde edilir. x b. E X 2 k x 1 2 1 k k 1k 2 k 12 olduğundan, V X E X 2 E X 2 k 1k 1 12 k 1 12 2 bulunur. 5.2 BERNOULLĠ DAĞILIMI Benzer koşullarda tekrarlanabilir bir deney, bir olayın gerçekleşip gerçekleşmemesi yönünden incelediğinde ortaya iki ayrık olay ile incelenebilecek bir deney çıkar ve bu deneye ait örnek uzayı S A, Ac olacaktır. Örneğin, bir üretimin kusurlu ve kusursuz diye belirlenmesi, piyasaya çıkan yeni bir malın beğenilip beğenilmemesi gibi deneyler iki sonuçlu olaylardır. Bir Bernoulli deneyi, çıktısı iki ayrık olay olarak tanımlanabilen bir rassal deneydir. Bir denemede elde edilecek iki sonuç genellikle 0 ve 1 değerleri ile kodlanır. 1 değeri deneyin başarılı olmasına, 0 değeri ise deneyin başarısızlığına karşılık gelir, X A 1 ve X Ac 0 ve bu olaylara ait olasılıklar, P X 1 p ve P X 0 1 p olarak tanımlanabilir. Tanım (Bernoulli şans değişkeni): Bir X rastgele değişkeni için yalnızca birbirinden ayrık iki mümkün durum varsa X‟e Bernoulli şans değişkeni denir. Bernoulli olasılık fonksiyonu, f x; p p x 1 p 1 x x 0,1 olur. Teorem: Eğer X şans değişkeni bir bernoulli dağılımına sahip ise, beklenen değeri, varyansı ve moment türeten fonksiyonu aşağıdaki eşitlikler ile tanımlanmıştır: 143 a. E ( X ) p b. V ( X ) p(1 p) c. M X t et p 1 p Ġspat: a. E ( X ) 1 xp 1 p 1 x x p x 0 1 x p 1 p b. E ( X 2 ) 2 1 x x p x 0 V ( X ) p p 2 p1 p e c. E etx 1 tx p x 1 p 1 x et p 1 p x 0 bulunur. Teorem: Bernoulli dağılışının birikimli dağılım fonksiyonu; 0, x 0 F ( x; p) p,0 x 1 1, x 1 Bernoulli dağılışının birikimli dağılım fonksiyonu yalnızca 3 değer alır. 5.3 BĠNOM DAĞILIMI Binom dağılımı Bernoulli deneylerinden ortaya çıkar. İadeli örnekleme ile birbirinden bağımsız n adet Bernoulli deneyi uygulanarak, bir Bernoulli süreci tanımlansın. Eğer deneyler özdeş ise başarı olasılığı p deneyden deneye değişmez ve sonuç olarak binom olasılık dağılımı ortaya çıkar. Tanım (Binom şans değişkeni): Birbirinden bağımsız n adet Bernoulli denemesinden başarılı olanların toplam sayısı X şans değişkeni olsun. Bir tek deneme için başarılı olma olasılığı p, başarısız olma olasılığı (1 p) ise aşağıdaki koşulları sağlayan X‟ e binom şans değişkeni denir ve şu özellikleri taşır: a. Deney n adet özdeş denemeden oluşmaktadır. (Deneme sayısı n sabit olmalı.) b.Her deneme için yalnız iki sonuç vardır. Başarı veya bunun tümleyeni olan başarısızlık. c.Başarı olasılığı p deneyden deneye değişmez. Başarısızlık olasılığı q 1 p dir. d.Denemeler birbirinden bağımsızdır. n bağımsız denemede başarı sayısı X, 0,1,, n değerlerini alabilir. Aşağıdaki dizi ele alınsın: 1 ,1 , ,1, 0 ,0 , ,0 x n x Burada 1 başarıyı, 0 başarısızlığı gösterir. Çarpım teoreminden yukarıdaki dizinin olasılığı, yani ilk x adet denemenin başarılı, geri kalan (n x) denemenin başarısız olması olasılığı p x 1 p n x ile hesaplanır. Denemeler birbirinden bağımsız olduğundan, farklı bir x “başarı” ve (n x) “başarısızlık” dizisinin olasılığı da p x 1 p n x ‟dir. Bir grupta x, diğerinde (n x) terim bulunan n elemanın farklı 144 n dizilişlerinin sayısı dir. Bir defada sadece bir diziliş elde edileceğinden bu olaylar ayrıktırlar. Bu x nedenle toplama kuralı nedeniyle X şans değişkeninin olasılık fonksiyonu; (n denemedeki x adet başarının ortaya çıkma olasılığı) Teorem (Binom Dağılımı): Birbirinden bağımsız n Bernoulli denemesi için X, her bir denemede başarı olasılığı p, başarısızlık olasılığı (1 p) olan binom rasgele değişkeni ise, X‟ in olasılık fonksiyonu; n n x f x; n, p p x 1 p x x 0,1,, n olur. Ġspat: Birbirinden bağımsız n Bernoulli denemesi için 0,1,, n kez başarma olasılıklarının toplamı binom açılımındaki ardışık terimlere karşılık gelir, n pozitif tamsayı olmak üzere, a b n x n x a b x 0 x n olduğundan a p ve b 1 p alınarak, olasılıklar toplamı; n f ( x; n, p) x 0 n n x p 1 p x n x 1 (1 p) 1 n x 0 elde edilerek ispat tamamlanır. Binom olasılık fonksiyonu için, f x; n, p f n x; n, 1 p eşitliği geçerlidir. Ardışık binom olasılıklarının hesaplanması ise, f x 1; n, p ( n x) p f x; n, p ( x 1)(1 p) x 0,1,...,n 1 eşitliğinden elde edilir. Teorem: Eğer X bir binom dağılımına sahip bir şans değişkeni ise, beklenen değeri, varyansı ve moment türeten fonksiyonu aşağıdaki eşitlikler ile tanımlanmıştır: a. E ( X ) np b. V ( X ) np(1 p) c. M X t et p 1 p Ġspat:a. E X n x 0 n n 1! x 1!n x!p 1 p n n x x p x 1 p np x n x 1 n x x 1 Burada y x 1 dönüşümü ile E X np n 1 y 0 n 1! p y 1 p n 1 y y!n 1 y ! np p 1 p n 1 np 145 Burada n 1! n 1! n 1 x 1!n x ! y!n 1 y ! y b. E X2 n x 0 xx 1 E X 2 nn 1 p 2 alınmıştır. nn 1n 2! n x p 2 p x 2 1 p E X xx 1x 2!n x ! n 2! x 2!n x!p 1 p n x2 n x x2 np Burada y x 2 dönüşümü ile E X 2 nn 1 p 2 n2 y 0 n 2! p y 1 p n 2 y np y!n 2 y ! nn 1 p 2 np V X n2 p 2 np2 np n2 p 2 np1 p c. M X t E etx n tx n x p 1 p n x e x 0 x n n t x e p 1 p n x x 0 x Burada binom teoremine göre a et p ve b (1 p) alınarak M X t et p 1 p n bulunur. Binom dağılımında p ve (1 p) değeri birbirine yaklaştıkça simetri artar, p (1 p) 1/ 2 ise tam simetriktir. Binom dağılımından olasılıkların elde edilmesinde n değeri büyüdükçe hesaplama zorlukları ortaya çıkar. Simetrik bir binom dağılımı (p değerinin çok büyük ya da çok küçük olmadığı durumlar) n için normal dağılıma yakınsar. Asimetrik bir binom dağılımı (p değerinin çok büyük ya da küçük olduğu durumlar) n için Poisson dağılıma yakınsar. Binom dağılımının poisson dağılımına yakınsaması Kısım 5.7.2‟de daha detaylı olarak ele alınmıştır. 5.4 GEOMETRĠK DAĞILIM Binom olasılık dağılımında olduğu gibi bir Bernoulli sürecinden türetilen rassal deneylerin çıktısı ile ilgilenilsin. Bu süreçte çıktı ayrık iki olayı (başarı ve başarısızlık) tanımlar ve başarı olasılığı p deneyden deneye değişmez. Tanım (Geometrik şans değişkeni): Şans değişkeni X ilk başarı elde edilinceye kadar gerçekleştirilen deney sayısı olarak tanımlandığında, şans değişkeni geometrik dağılıma sahiptir. İlk başarının elde edilmesi için gerekli denemelerin sayısı X, geometrik şans değişkenidir. İlk başarının elde edilmesi için gereken denemelerin sayısı x ve ilk başarıdan önceki başarısızlıkların sayısı x 1 olsun. Bu durum aşağıdaki dizi ile gösterilebilir. 146 0 ,0 , ,0,1 x 1 O halde x 1 adet başarısızlığı, başarının takip ettiği dizinin olasılığı p1 p x 1 ‟dir. Teorem: X, bir tek denemede başarısızlık olasılığı 1 p ve başarı olasılığı p olan geometrik rastgele değişken ise, X şans değişkeninin olasılık fonksiyonu: f x, p p1 p x 1 x 1,2,3, Ġspat: Geometrik dağılımın bir olasılık kütle fonksiyonu olduğunun ispatı gerçekte geometrik serinin özelliklerine dayanmaktadır. Herhangi bir a 1 için, a x 1 x 1 1 1 a olduğundan, 1,2,3, denemede ilk başarının elde edilmesi olasılıkları aşağıdaki sonsuz serideki ardışık terimlere karşılık gelir. f x p 1 p p 1 p 2 x 0 p p 1 1 p 1 p 2 1 1 p 1 1 p a 1 p için ispat tamamlanır. Teorem: Eğer X bir geometrik dağılıma sahip ise, beklenen değeri, varyansı ve moment türeten fonksiyonu aşağıdaki eşitlikler ile tanımlanmıştır: a. E ( X ) 1 p b. V ( X ) (1 p) p2 c. M X t pet 1 1 e (1 p) t Ġspat: a. Geometrik dağılımın beklenen değeri, E( X ) xp(1 p) x 1 x 1 p x(1 p) x 1 x 1 p p d d x (1 p) (1 p) 2 ... (1 p) p d (1 p) x 1 d (1 p) d (1 p) 1 (1 p) (1 p 2 ) ... d (1 p) 147 Burada 1 1 x x 2 ... eşitliği kullanılarak, 1 x EX p d 1 (1 p) d (1 p) 1 (1 p) 1 2 p (1 p)1 (1 p) 1 (1 p) 1 (1 p) p p2 p 1 p b. Geometrik dağılımın varyansı, E( X 2 ) x( x 1) p(1 p) x 1 EX x 1 p(1 p) x( x 1)(1 p) x2 E ( x) x 1 p(1 p) d2 (1 p)1 (1 p) ... E ( x) d (1 p) 2 p(1 p) d2 d (1 p) 2 p(1 p) (1 p) E ( x) 1 (1 p) 1 d 1 1 (1 p). 2 d (1 p) 1 ( 1 p ) p 1 ( 1 p ) 1 2 1 1 p(1 p) 2 2 (1 p). 3 p p p p p p 22p 1 p(1 p) p3 p 2(1 p) 1 p p2 Buradan varyans, V (X ) 2(1 p) 1 1 p p p2 2 (1 p) p2 bulunur. c. Geometrik dağılımın moment türeten fonksiyonu, M x (t ) E[e xt ] e tx p(1 p) x 1 x 1 148 p (1 p) p 1 p e tx (1 p) x x 1 e (1 p) x t x 1 p et (1 p) 1 et (1 p) ... 1 p pet 1 1 e (1 p) t bulunur. Teorem: Geometrik dağılımın kümülatif dağılım fonksiyonu: F x 1 1 p x x Ġspat: F x PrX x p1 p x 1 X 1 p 1 1 p ... 1 p x 1 1 1 p x p 1 1 p bulunur. Geometrik dağılım ile binom dağılımı arasındaki ilişki, f ( x, p) 1 f ( x 1; n x; p) x olarak tanımlanır. Teorem (Hafızasızlık özelliği): Geometrik dağılım hafızasızlık özelliğine sahiptir. s t olan tamsayılar için, Pr X s X t Pr X s t Ġspat: Herhangi n tamsayısı için, Pr X n p 1 p (n denemede başarı olmama olasılığı) n Bu durumda, Pr X s X t Pr(X s ve X t ) Pr(X t ) Pr X s Pr(X t ) 1 p s t Pr X s t 149 Hafızasızlık özelliği; t adet gözlenmiş başarısızlığa s t adet daha başarısızlığın eklenmesinin olasılığının, serinin başlangıcında s t adet başarısızlık oluşma olasılığı ile aynı olduğunu belirtir. Diğer bir deyişle, başarısızlığa ait bir dizinin ortaya çıkma olasılığı dizinin başladığı deneye değil deney sayısına bağımlıdır. Geometrik dağılım daima sağa çarpık bir dağılımdır. 5.5 NEGATĠF BĠNOM (PASCAL) DAĞILIMI Geometrik dağılımın k adet başarı için genellenmiş şeklidir. Bir deney birbirinden bağımsız Bernoulli denemelerinden oluşmaktadır. Deneye k adet başarı elde edilinceye kadar devam edilirse k başarının elde edilmesi için gerekli denemelerin sayısı negatif binom şans değişkenidir. Negatif binom dağılımında, denemelerin sayısı bir rastgele değişkendir ve başarıların sayısı sabittir; binom dağılımda başarının sayısı rastgele değişkendir ve denemelerin sayısı sabittir. Tanım (Negatif binom şans değişkeni): Bağımsız Bernoulli denemelerinde her bir denemede başarı olasılığı p olmak üzere k 1 başarının elde edilmesi için gereken denemelerin sayısı X rastgele değişkeni olsun. Bu koşul altında X‟e negatif binom şans değişkeni denir. Teorem: Bir tek denemedeki başarısızlık olasılığı 1 p ve başarı olasılığı p olmak üzere, X negatif binom şans değişkeninin olasılık fonksiyonu aşağıdadır: x 1 k p 1 p x k f x; p, k k 1 x k , k 1, Ġspat: k 1 başarının gerçekleşmesi için gereken denemelerin sayısı X olsun. X şans değişkeni k , k 1, değerlerini alabilir. Son deneme (x-inci deneme) k-ıncı başarıyı vermek zorunda olduğundan, k 1 adet başarı veren denemelerin sayısını x 1 olacaktır. x 1 denemedeki k 1 başarının olasılığı ve x-inci denemede başarı elde etme olasılığı aşağıdaki gibi bulunur. Aşağıdaki A ve B olayları ele alınsın: A ilk x - 1 deneme k - 1 başaşaiçerir B x - inci deneme başaşaiçerir Denemeler birbirinden bağımsız kabul edildiğinden A ve B olayları da birbirinden bağımsızdır. Pr(B) p ´dir. O halde, f ( x; p, k ) Pr(X x) P(A B) PAPB yazılır. Görüldüğü gibi ( x 1) k 1 ya da eşdeğer olarak x k için P(A) 0 ‟ dır. x k ise binom dağılımdaki yaklaşım kullanılarak, x 1 k 1 p 1 p x k PA k 1 bulunur. Sonuç olarak olasılık fonksiyonu x 1 k p 1 p x k f x; p, k k 1 150 dır. Bu olasılık fonksiyonuna sahip dağılıma Pascal dağılımı da denir. k 1 ise negatif binom dağılımı geometrik dağılıma indirgenir. Teorem: Eğer X bir negatif binom dağılımına sahip ise, beklenen değeri, varyansı ve moment türeten fonksiyonu aşağıdaki eşitlikler ile tanımlanmıştır: a. E ( X ) k p b. V ( X ) k 1 p p2 c. M x (t ) p k e xt 1 [1 [e (1 p)]]k t Ġspat. a Negatif binom dağılımının beklenen değeri; E( X ) ( x 1)! x ( x k )!(k 1)! p k (1 p) x k xk p k (1 p) k ( x 1)! x ( x k )!(k 1)!(1 p) x xk k (k 1)(k 2) p k (1 p) k k (1 p) k k (k 1)(1 p) k 1 (1 p) k 2 .... 2! (k 1)(k 2) p k (1 p) k k (1 p) k 1 (k 1)(1 p) (1 p) 2 .... 2 ! Burada köşeli parantez içindeki ifade, f (1 p) 1 (1 p) k 1 fonksiyonunun MacLauren açılımına eşittir: f (1 p) 1 (1 p) k 1 f (0) 1 f (1 p) (k 1)1 (1 p) k 2 (1) f ' (0) (k 1) f (1 p) (k 1)(k 2)1 (1 p) k 3 (1) f (0) (k 1)(k 2) buradan, f (1 p) 1 (1 p) k 1 1 (k 1) (k 1)(k 2) (1 p) (1 p)2 ..... 1! 2! elde edilir. Sonuç olarak, E ( X ) p k k 1 (1 p) k 1 k p bulunur. b. Negatif Binom Dağılımının Varyansı E( X 2 ) x 2 f ( x) xk 151 x( x 1) f ( x) xk xf ( x) xk ( x 1)! x( x 1) ( x k )!(k 1) p k (1 p) x k E ( X ) xk ( x 1)! x( x 1) ( x k )!(k 1)!(1 p) p k (1 p) k x E( X ) xk E (X ) için izlenen yol kullanılarak, k (k 1) 2k (1 p) k p p2 E( X 2 ) k 2 kp k p2 olarak bulunur. V (X ) k 2 kp k k 2 2 p2 p k (1 p) p2 elde edilir. c. Negatif binom dağılımının moment türeten fonksiyonu, M x (t ) E[e xt ] e xt xk ( x 1)! p k (1 p) x k ( x k )!(k 1)! p k (1 p) k e xk tx ( x 1)! (1 p) x ( x k )!(k 1) k k (k 1) p k (1 p) k e xt (1 p) k et ( k 1) (1 p) k 1 et ( k 2) (1 p) k 2 ... 1 ! 2 ! k (k 1) p k (1 p) k e xt (1 p) k 1 et (1 p)k e 2t (1 p) 2 ... 2! burada köşeli parantezin içi [1 [et (1 p)]] k fonksiyonunun MacLauren açılımı olduğundan, M x (t ) p k e xt 1 [1 [e (1 p)]]k t olarak bulunur. Bazı durumlarda negatif binom dağılımı, k-ıncı başarıdan önce ortaya çıkan başarısızlık sayısına göre de tanımlanabilir. Eğer Y şans değişkeni k-ıncı başarıdan önce ortaya çıkan başarısızlık sayısı ise, y k 1 k p (1 p) y f ( y; p, k ) y y 0,1,.... 152 olasılık kütle fonksiyonu, daha önce verilen ve X şans değişkeninin k-ıncı başarı elde edilinceye kadar gerçekleştirilen deney sayısını tanımladığı olasılık kütle fonksiyonuna denktir. Burada Y X k olarak tanımlanabilir. Negatif binom dağılımı adını y k 1 k (k )(k 1)(k 2)...(k y 1) (1) y (1) y y( y 1)( y 2)...(2)(1) y y ilişkisinden almaktadır. Olasılık kütle fonksiyonu, k f ( y; p, k ) (1) y p k (1 p) y y k y p k (1 p) y olarak tanımlanabilir. Dağılışın beklenen değer ve varyansı, E (Y ) y k 1 k p (1 p) y y y y 0 (k y 1)! ( y 1)!(k 1)!p k (1 p) y y 1 k k (k y 1)! ( y 1)!(k 1)!p k (1 p) y y 1 k y 1 k p (1 p) y k y 1 y 1 Burada z y 1 dönüşümü yapılarak: E (Y ) z k k p (1 p) z 1 k z z 0 k 1 p z 1 k 1 k 1 p (1 p) z p z 0 z k 1 p p bulunur. Dağılımın varyansı ise, V Y k 1 p p2 olarak tanımlanmıştır. Negatif binom dağılımının varyansı ortalamasının karesel bir fonksiyonudur, yukarıda elde edilen E Y kullanılarak, V Y E Y 1 E Y 2 k bulunur. 153 Negatif binom dağılımı limit durumunda Poisson dağılımına yakınsar. Eğer k ve p 1 ise k 1 p olduğundan, E Y k 1 p p V Y k 1 p p2 sonuçları elde edilir ki bunlar Poisson dağılımının ortalaması ve varyansıdır. Binom dağılımı ve negatif binom dağılımı arasındaki fark aşağıda açıklanmıştır: X şans değişkeni, n ve p parametreleri ile binom dağılımına sahip olsun. Yani X, n adet Bernoulli denemesindeki başarı sayısıdır. Y şans değişkeni ise, k ve p parametreli negatif binom dağılımına sahip olsun. Diğer bir deyişle Y, k adet başarı elde etmek için gereken Bernoulli denemelerinin sayısıdır. a. PrY n Pr X k İlk n denemede k ya da daha çok başarı varsa, ilk k başarıyı elde etmek için n ya da daha az deneme gerekir. b. PrY n Pr X k İlk n denemede k dan az başarı varsa, k başarıyı elde etmek için n den çok deneme gerekir. 5.6 HĠPERGEOMETRĠK DAĞILIM İçinde iki çeşit nesne bulunan sonlu sayıda öğeden oluşan bir anakütle ele alınsın. Tekrar yerine koymaksızın, ardışık olarak sabit büyüklükte bir örneklem seçilsin. Örneklemdeki iki çeşit öğeden herhangi birinin sayısını ise şans değişkenini tanımlasın. Hipergeometrik dağılım, sonlu elemanlı anakütle ile ilgilenildiğinde oldukça uygun bir modeldir. Anakütledeki eleman sayısının N olduğu ve alınan örnek hacminin n olduğu varsayılsın. Anakütlede ilgilenilen özelliğe sahip eleman sayısı ise M olsun. Alınan n hacimli örnekte X adet başarının ortaya çıkma olasılığı, hipergeometrik dağılım gösterir Tanım (Hipergeometrik şans değişkeni): Sonlu sayıda N öğeden oluşan bir anakütle içinde belli bir A tipindeki öğelerin sayısı M olsun. Tekrar yerine koymaksızın rasgele çekilen ve n birimden oluşan bir örneklemdeki A tipindeki öğelerin sayısı X şans değişkeni olsun. X hipergeometrik şans değişkenidir ve hipergeometrik olasılık kütle fonksiyonu; M N M X n x f ( x; N , M , n) N n x 0,1,....,n Teorem: Eğer X şans değişkeni hipergeometrik dağılıma sahip ise, a. E ( X ) nM N 154 b. V ( X ) N n M M n 1 N 1 N N c. M X t yoktur. Ġspat: Hipergeometrik dağılımın beklenen değer ve varyansı M N M x n x E( X ) x N x 0 n n M N M x n x N x 1 n n ( x 0 daki değer sıfırdır) Bu ifadeyi değerlendirmek için aşağıdaki eşitlikler kullanılır. M M 1 , x M x x 1 N N N 1 n n n 1 Bu durumda M 1 N M M x 1 n x EX N N 1 x 1 n n 1 n M 1 N M x 1 n x nM N x 1 N 1 n 1 n bulunur. Eşitliğin en sağındaki ifade parametreleri N 1, M 1 ve n 1 olan bir başka hipergeometrik dağılımın olasılıklarının toplamıdır. Bunu görebilmek için y x 1 tanımlanır ve f (x) bir olasılık fonksiyonu olduğundan, M N M N n x n x 0 n x eşitliği geçerlidir ve M 1 N M x 1 n x N 1 x 1 n 1 M 1 N M y n y 1 N 1 y 0 n 1 n 1 n n 1 f y; N 1, M 1, n 1 y 0 1 Sonuç olarak, EX nM N 155 bulunur. b. Dağılımın varyansı n E X2 M N M x n x N n x( x 1) x x 0 n M N M M N M n x x n x x n x N N x 0 n n x( x 1) x 0 MnM 1n 1 Mn nM M 1n 1 N 1 N N 1 N N N 1 bulunur ve V X nM (nM M n N ) n 2 M 2 N ( N 1) N2 N n M n N 1 N M 1 N elde edilir. Bu eşitlikleri, p M / N ve 1 p ( N M ) / N olduğundan; EX n M np N N n M V X n N 1 N M 1 N N n np1 p N 1 şeklinde de ifade etmek mümkündür. Hipergeometrik dağılımın moment türeten fonksiyonu yoktur. Alternatif olarak, iadesiz ardışık örnekleme yapılabilir. i-inci denemedeki başarı sayısı Yi olsun. Her bir çekilişte ortaya çıkabilecek sonuç başarı Yi 1 ya da başarısızlık Yi 0 olacağından, Yi „ler binary (ikili) değerler alır. Yi „ler bağımsız olmadıkları için denemeler Bernoulli denemesi değildir. Açıkça görülmektedir ki PY1 1 r N p değeri, anakütledeki başarı oranıdır. Şimdi Y2 ele alınsın. Bu durumda, olur. PY2 1 | Y1 1 r 1 N 1 PY2 1 | Y1 0 r N 1 Toplam olasılık kuralına göre P A P A | BPB P A | Bc P Bc ‟dir. Böylece PY2 1 PY2 1 | Y1 1PY1 1 PY2 1 | Y1 0PY1 0 156 r r 1 r r . .1 N N 1 N N 1 r N 1 r N 1N N p bulunur. Tümevarım yolu ile tüm i denemeleri için PY1 1 r N p olduğu gösterilebilir. Başarı olasılığı (koşulsuz) tüm denemeler için Bernoulli denemelerinde olduğu gibi aynıdır. Denemeler bağımlı oldukları için bu denemeler Bernoulli denemesi değildir. (Unutulmamalıdır ki örnekleme iadeli olarak yapılırsa denemeler Bernoulli denemesi olur ve X şans değişkeni de başarı olasılığı p olan n denemeli Binom dağılımı olur.) Örnekleme ister bir grubun topluca rassal olarak seçilmesi ister tek tek iadesiz olarak yapılıyor olsa da X‟nin dağılımı aynıdır. Tek tek yapılan seçimde X‟nin ortalama ve varyansını hesaplamak daha kolaydır. Doğrudan Hipergeometrik dağılımın olasılık fonksiyonundan elde edilen momentlerin hesaplamaları karşılaştırılsın. Öncelikle tüm denemeler için EYi 01 p 1 p p r N ‟dir. Bu yüzden X Y1 Y2 Yn olduğunda binom dağılımında olduğu gibi E X E Y1 Y2 Yn E Y1 E Y2 E Yn p p p np nr N elde edilir. Bununla birlikte Y‟ler bağımsız olmadıkları için Var X ‟yi bulmak nispeten zordur. n Var X Var Yi i 1 Var Y 2 CovY , Y n i i 1 i j i j Y‟ler binary oldukları ve aynı başarı olasılığı p‟ye sahip olduklarından, tüm i-ler için Var Yi p1 p ‟dir. Genel olarak, E Y Y Cov Yi , Y j E Yi i Y j j i j i j E YiY j ‟yi elde edebilmek için, Y‟lerin binary oldukları bilindiğine göre YiYj‟nin 0 ya da 1 olacağı unutulmamalıdır. Bu nedenle, PY 1, Y 1 PY 1 | Y 1.PY 1 E YiY j 1P YiY j 1 i j j i i r 1 r N 1 N ve 157 Nr 11 Nr Nr Cov Yi , Y j 2 r N r 1 r N 1 N 1N 2 r N r N 1N 2 p1 p N 1 (Negatif kovaryans ve dolayısıyla korelasyon, bir denemede elde edilen başarının diğer bir denemenin başarısının olabilirliğini azaltma eğilimindedir.) Sonuç olarak, Var X ‟nin elde edilebilmesi için n adet eş varyans ve nn 1 2 adet eş kovaryansın toplanması gerekmektedir. Böylece, Var X np1 p 2 nn 1 p1 p 2 N 1 n 1 np1 p 1 N 1 İlgili Hipergeometrik dağılımın standart sapmasını elde edebilmek için Binom dağılımının standart sapmasıyla çarpım halinde olan 1 n 1 faktörüne sonlu anakütle düzeltme faktörü denir. N 1 Unutulmamalıdır ki genelde örnek hacmi popülasyon hacminden oldukça küçüktür n N . Bu nedenle sonlu popülasyon düzeltme faktörü 1‟e yakındır ve Binom dağılımından elde edilen standart sapma Hipergeometrik dağılımın gerçek standart sapmasına mükemmel bir yakınsama sağlar. Aslında Binom dağılımı Hipergeometrik dağılıma çok iyi bir yakınsama sağlar. Hipergeometrik dağılımın binom dağılımına yaklaşımı aşağıda açıklanmıştır. Anakütledeki eleman sayısı N çok büyük ise ve n ile p sabit kaldıkça hipergeometrik dağılım binom dağılımına yaklaşır. N M ! M! x!M x ! n x !N M n x ! f x; N , M , n N! n! N n ! N n! M M 1....M x 1M x ! n! M x ! N N 1...N n 1N n! x!n x ! N M N M 1...N M n x 1N M n x ! N M n x ! M ...M x 1 N M ...N M n x n! x!n x ! N ...N n 1 Burada, N için, N...N n 1 N n 158 N M ...N M n x N M n x M ...M x 1 M x yaklaşımları kullanılarak, f x; N , M , n M x N M Nn n x x n! x!n x ! M N M N N n x n! x!n x ! Burada p M N ve 1 p N M N alınarak f x; n, p n! n x p x 1 p x!n x ! sonucuna ulaşılır. Bu da binom dağılışının olasılık kütle fonksiyonudur. Eğer örnek hacmi n büyük fakat hala n N ise X‟nin dağılımı Merkezi Limit Teoremi ile ortalaması np ve varyansı np1 p olan Normal dağılıma yakınsar. Buna benzer olarak örnek oranı pˆ x n ‟in dağılımı ortalaması p ve varyansı p1 p n olan Normal dağılıma yakınsar. 5.7 POĠSSON DAĞILIMI VE SÜRECĠ Belirli sürekli bir ölçekte rasgele olarak ortaya çıkan olay sayısı ile ilgileniliyor olsun. Bu tip şans değişkenleri poisson dağılımına sahiptir. Bu şans değişkenlerini türeten süreç ise poisson sürecidir. 5.7.1 Poisson Sürecinin Varsayımları Poisson dağılımı, poisson postulate adı verilen temel varsayımlar setinden ele edilebilir. Bu varsayımlar incelenen sürecin fiziksel özellikleri ile ilgilidir ve aşağıdaki teorem ile özetlenmiştir. Teorem: Her bir t 0 değeri için, X t aşağıdaki özelliklere sahip tam sayı değerli bir şans değişkeni olsun; (Burada X t , 0 ile t aralığında otaya çıkan rasgele olay sayısı olarak düşünülebilir). a. x0 0 (Başlangıç sınırındaki olay sayısı sıfırdır) b. s t olmak üzere xs ve xt xs bağımsızdır. (Ayrık periyotlardaki olay sayıları bağımsızdır) c. xs ve xt s xt özdeş dağılmıştır. (Ortaya çıkan olay sayısı sadece periyot uzunluğuna bağlıdır) d. lim t 0 P( xt 1) (Ortaya çıkış olasılığı eğer periyot küçük ise periyot uzunluğu ile doğru t orantılıdır) e. lim t 0 P( xt 1) 0 (Olaylar eşanlı olarak oluşmazlar). t Eğer a-e varsayımları sağlanıyor ise herhangi bir X tamsayısı için, f ( xt x) e t ( t ) x x! 159 olup xt ~ Poisson (t ) ‟ dir. Tanım (Poisson şans değişkeni): Sürekli bir ölçekte rasgele olarak ortaya çıkan olay sayısı X olsun. Eğer X şans değişkeni yukarıda verilen teoremin özelliklerini sağlıyor ise X‟e Poisson şans değişkeni denir ve olasılık fonksiyonu, e x x! f x; x 0,1,2, Şeklinde tanımlanır. Teorem: f x; bir olasılık fonksiyonudur. Ġspat: Bu fonksiyonun olasılık fonksiyonu olduğu e y fonksiyonunun Taylor serisine açılımı kullanılarak, ey yi i! i 0 olduğundan, f x; e x 0 x x! x 0 e e 1 ispat tamamlanır. Teorem: Eğer X bir poisson dağılımına sahip ise, a. E (X ) b. V (X ) t c. M x e e 1 Ġspat: a. E ( X ) xf ( x) x 0 x.e x x! x 0 e x x 1 e x 1 ( x 1)! x 1 ( x 1)! Burada y x 1 dönüşümü ile denklemin sağ yanındaki toplam e ‟ ya eşit olur. E ( X ) e e elde edilir. b. E ( X 2 ) x 2 f ( x) x 0 x 2 e x x! x 0 Bu denklemde x 2 x( x 1) x özdeşliğini kullanarak, x( x 1) x! xe E X2 x x 0 160 x0 x( x 1)e x xe x x! x! x0 e x e x x 2 ( x 2)! x 1 ( x 1)! 2e x 2 ( x 2)! E X x 2 Burada y x 2 dönüşümü ile denklemin sağ yanındaki toplam e ya eşit olur. E X 2 2 ve sonuç olarak, V X E X 2 E X 2 elde edilir. c. Poisson Dağılımının Moment Çıkaran Fonksiyonu, tx e x x! e e M x t E etx x0 e x 0 t x! x e e e t t e e 1 olur. Teorem: Bir Poisson (λ) şans değişkeninin kümülatif dağılım fonksiyonu, x i i! , F x exp x0 i 0 şeklinde elde edilir. Burada . ifadesi girdiden küçük olan en büyük tam sayı değerini ifade etmektedir. Poisson dağılmış bir tesadüfi değişkenle ilgili olasılıkları hesaplamak için verilecek λ değerlerine karşılık gelen e ve x sayısal değerlerine ihtiyaç vardır. İşlemleri kolaylaştırmak için verilen her λ ve X değerlerine göre poisson dağılımlarına karşı gelen olasılıkları veren tablolar hazırlanmıştır. Poisson dağılımı gerçekleşme olasılığı çok küçük olan olayların tekrarlı denemeleri için uygun bir dağılımdır. Diğer taraftan Poisson dağılımı Pr X x 0.01 ve n 20 olduğunda binom dağılımı için iyi bir yaklaşımdır. 5.7.2 Binom Dağılımının Poisson Dağılımına YaklaĢımı Simetrik bir binom dağılımı, örnek çapı büyüdükçe normal bir dağılıma yakınsamaktadır. Ancak n bile olsa, eğer p ya da q dan biri sıfıra, diğeri 1‟e yaklaşırsa, asimetri çok şiddetleneceğinden normal dağılımdan yararlanılamaz. Bu durumda binom dağılımı bir poisson dağılımına yaklaşır. 161 Binom dağılımının n parametresi sonsuza ve p parametresi sıfıra yaklaşıyor ise np sabit kalıyor ise binom dağılımı poisson dağılımına yaklaşır. Bu durumda np olduğu kabul edilir. f x; n, p n! n x p x 1 p n x ! x! nn 1...n x 1 x 1 n 1 x x! n n n nn 1...n x 1 x 1 n 1 x nx x! n 1 x 1 x 11 ...1 1 n n n x! n n n 1 n x 1 x 1 x lim f x; n, p lim 11 ......1 1 1 n n n n n x! n n n x Burada x 1 2 1 lim (1 )....(1 )(1 )(1) 1 n n n n lim{1 n n n e } lim (1 ) x 1 n olduklarından, n lim f x; n, p 1 n x x! x e 1 e x! bulunur. 5.8 ÇOK TERĠMLĠ (MULTĠNOMĠAL) DAĞILIM Bir deneyde E1 , E2 ,, Ek ile gösterilen ayrık olaylar tanımlanmış olsun. Denemeler n kez tekrarlandığında her bir Ei olayının elde ediliş sayısının Xi ortak dağılımı çok terimli dağılımdır. Örneğin bir zar n kez atılsın zarın üst yüzüne gelen 1‟lerin sayısı x1, 2‟lerin sayısı x2, 6‟larin sayısı x6 ile tanımlanır. Her bir Ei olayının elde edilme olasılığı ise pi ile tanımlanır ve tüm deneler için sabit olduğu varsayılır. Bu dağılım binom dağılımının genelleştirilmiş halidir. Teorem: Sabit n adet denemede her bir Ei, i 1,2,, k , olayının ortaya çıkış sayısının ortak olasılık k dağılımı x i i 1 n ve k p i 1 koşulları altında, i 1 162 f x1 , x2 ,, xk n! p1x1 . p2x2 ... pkx k x1! x2!....xk ! xi 0,1,2,, n fonksiyonu ile belirlenir ve bu dağılıma çok terimli dağılım adı verilir. İspat: n adet bağımsız denemede belli bir sırada E1 olayının x1 kez, E2 olayının x2 kez,…., Ek olayının xk kez elde edilmesi olasılığı, p1x1 p2x2 ... pkxk eşitliğinden elde edilir. Olayların herhangi bir sırada elde edilmesi ile ilgilenildiğinden, diğer bir deyişle sıralama önemsiz olduğundan, buradaki eşanlı olayların farklı dizilişlerinin sayısı; n! x1! x2 !....xk ! k olacaktır. Bu nedenle i 1 xi n ve k p i 1 olmak üzere X1, X 2 ,, X k şans değişkenlerinin ortak i 1 olasılık fonksiyonu elde edilen iki sonucun çarpılması ile tanımlanır. 5.9 ÇOK DEĞĠġKENLĠ HĠPERGEOMETRĠK DAĞILIM Eğer hipergeometrik dağılımda ana kütledeki birimler iki değil de k tane gruba ayrılıyor ise genelleştirilmiş hipergeometrik dağılıma geçilir. Her bir Ei olayının elde edilme olasılığı ise pi deneyden deneye değişiyor ise deney n kez tekrarlandığında, x1 kez E1, x2 kez E2, , xk kez Ek sonuçlarının ortak oluşma olasılıkları genelleştirilmiş (çok değişkenli) hipergeometrik dağılım ile bulunur. Çok değişkenli hipergeometrik dağılımın olasılık fonksiyonu, N1 N 2 N k x x x f x1 , x2 ,, xk 1 2 k N n olup burada, N1 N 2 N k N ve x1 x2 xk n eşitlikleri ile tanımlanmıştır. 163 BÖLÜM 5 EKLER Ek5.1 Poisson Olasılık Fonksiyonunun Elde Edilmesi Olayların h uzunluğundaki bir periyotta yaklaşık olarak homojen bir şekilde ortaya çıktığı varsayılsın. Belirlenen periyot için aşağıdaki durumlarla karşılaşılabilir: Sadece bir olay ortaya çıkar, Hiç olay oluşmayabilir, Birden fazla olay ortaya çıkabilir. h periyodundaki olasılıklar P( x, h) ile belirtilsin, o(h) fonksiyonu: oh lim 0 h h 0 h 2 oh oh oh oh özelliklerini sağlayan bir fonksiyon olsun. Varsayım d için; w h olan küçük bir aralık için bir olayın ortaya çıkma olasılığı P(1, h) , aralığın uzunluğu ile h şeklinde doğru orantılıdır. Burada sabit pozitif oransal bir çarpımı ifade eder. Başka bir ifade ile P1, h h oh Varsayım e için; w h olan küçük bir aralık için iki veya daha fazla olayın ortaya çıkma olasılığı, Px, h oh x 2 Varsayım b için; Kesişmeyen aralıklardaki olay sayısı birbirinden bağımsızdır. Varsayım d ve e‟ den en az bir olayın h aralığında oluşmasının olasılığı, Px 1, h h oh oh h oh bunun sonucu olarak, h aralığında hiç olay oluşmamasının olasılığı, P0, h 1 h oh olup, Varsayım b ile, periyodu h w olan bir aralıkta hiç olay oluşmamasının olasılığı P(0, h w) , w aralığında hiç olay olmama olasılığı P(0, w) ile h aralığında hiç olay olmama olasılığı P(0, h) ‟nın çarpımına eşittir: P0, h w P0, w1 h oh P0, w h P0, w oh P0, w P0, w h h h 0 için limit alınarak, dP0, w P0, w dw 164 diferansiyel denklemi elde edilir. Bu diferansiyel denklemin çözümü aşağıda verilmiştir: dP0, w dw P0, w dP0, w P0, w dw ln P0, w w c P0, w ewc bulunur. Eğer w 0 ise varsayım a ile, P(0,0) 1 olur. Bu koşul altında c 1 elde edilir. Sonuç olarak: P0, w ew . Periyodu w h olan bir aralıkta x adet olay olmasının olasılığı, P( x, w h) : w aralığında x olay olmasının olasılığı P( x, w) ile h aralığında hiç olay olmamasının olasılığı [1 h o(h)] çarpımı artı, w aralığında x 1 olay olmasının olasılığı P( x 1, w) ile h aralığında bir olay olmasının olasılığı h oh çarpımı artı, w aralığında x 2 olay olmasının olasılığı P( x 2, w) ile h aralığında iki olay olmasının olasılığı o(h) çarpımından oluşur; Px, w h Px, w1 h oh Px 1, wh oh Px 2, woh Px, w h Px, w oh Px, w Px 1, w Px 2, w h h ve h 0 için limit alınarak, dPx, w Px, w Px 1, w dw (1) türev eşitliği bulunur. Bu diferansiyel denkleminin çözümü aşağıda verilmiştir: x 1 için; dP 1, w dw dP 1, w dw P 1, w P 0, w P 1, w e w Bu ifade birinci mertebeden doğrusal bir diferansiyel denklemdir. Bu diferansiyel denklemin integral çarpanı, T w e dw ew P1, wew ew ewdw P1, wew w c 165 P1, w ew w c bulunur. w 0 için P(1,0) 0 olduğundan, c 0 bulunur. Sonuç olarak: P1, w we w elde edilir. Türev eşitliğinde yerine konarak P(2, w) ve sırasıyla diğer terimler bulunur ve P x, w w x e w x x 1,2,... , Poisson olasılık fonksiyonu elde edilir. Poisson süreci ile ilişkili dağılımlar (gama, üstel ve bazı sürekli dağılışlar) ve olasılık yoğunluk fonksiyonlarının elde edilişleri ilgili dağılışların ele alındığı kısımlarda açıklanmıştır. 166