BÖLÜM 4 KESĠKLĠ ġANS SEĞĠġKENĠ DAĞILIMLARI Bu kısımda, gerçek yaşamdan ortaya çıkan pek çok rassal olayın modellenmesinde faydalı olan, kesikli (tek değişkenli) parametrik olasılık dağılımlarından bazıları incelenecektir. Ele alınacak dağılımlar, bir hipotetik örnekleme süreci ile ilgili varsayımlar kümesi altında matematiksel olarak elde edilmiş teorik dağılımlardır. Bu teorik dağılımlar, belirli parametrelere göre bir olasılık kütle (mass) ailesini tanımlayan kurallar kümesi ile ifade edilirler. Bir şans değişkeni X ve bir parametre verilmiş olsun. f ( x, ) ise bir kesikli teorik olasılık kütle fonksiyonunu tanımlayan kural olsun. Eğer bir reel sayı ise, bu parametre farklı olasılık kütle fonksiyonlarının; f ( x,1 ), f ( x, 2 ), bütün bir kümesini belirler. Sonuç olarak, bu parametrik kesikli dağılım ailesinin değişik elemanlarını içeren küme f (X , ) / elde edilir. Bir şans değişkeni X için kesikli olasılık kütle fonksiyonu ailesini tanımlamakta kullanılabilecek parametre tipleri aşağıda listelenmiştir; Sayım (count) parametresi; bir şans deneyindeki belirli bir çıktının ortaya çıkış sayısı. Orantı (proportion) parametresi; bir şans deneyindeki belirli bir çıktının ortaya çıkış sayısının toplam deneme sayısına göreceli oranı. Yer (location) parametresi: X-ekseni üzerinde, olasılık kütle fonksiyonunun pozisyonunu (orijine göre göreceli olarak) belirler. Ölçek (scale) parametresi: şans değişkeninin ölçümlendiği birimleri belirler, fonksiyonun grafiğini daraltarak ya da genişleterek olasılık kütle fonksiyonun yayılımını etkiler. Biçim (shape) parametresi: bir olasılık kütle fonksiyonunun şeklini (örneğin simetrisi) etkiler. Oran (rate) parametresi: bir rassal sürecin zaman, uzay, hacim, üzerinden çıktılarının oluşum yoğunluğunu belirler (örneğin verilen bir zaman periyodunda bir olayın ortaya çıkış sayısı). 4.1 KESĠKLĠ UNĠFORM (TEKDÜZE) DAĞILIM Bir kesikli şans değişkeni X, her biri 1/ k eşit olasılıklı k adet farklı değer alabiliyor ise bu şans değişkeni kesikli tekdüze dağılıma sahiptir. Tanım (Üniform şans değişkeni): k pozitif bir tam sayı olmak üzere olasılık dağılımı 1 k f x; k 0 x 1,, k d .d fonksiyonu ile belirlenen bir X şans değişkeni, kesikli uniform şans değişkeni olarak adlandırılır. Teorem: Eğer X bir kesikli uniform dağılıma sahip ise, a. E X k 1 , 2 b. V X k 2 1 12 k c. M X t e tx 1 k x 1 Ġspat: İlk olarak k x x 1 k k 1 ve 2 k x 2 x 1 k k 12k 1 olduğu hatırlanarak, 12 1 k 1 k 2 k a. E X x x 1 elde edilir. 1 k k 1k 2 k 12 b. E X 2 x 2 k x 1 olduğundan, V X E X 2 E X 2 k 1k 1 12 k 1 12 2 bulunur. 4.2 BERNOULLĠ DAĞILIMI Benzer koşullarda tekrarlabilir bir deney bir olayın gerçekleşip gerçekleşmemesi yönünden incelediğinde ortaya iki ayrık olay ile incelenebilecek bir deney çıkar ve bu deneye ait örnek uzayı S A, Ac olacaktır. Örneğin, bir üretimin kusurlu ve kusursuz diye belirlenmesi, piyasaya çıkan yeni bir malın beğenilip beğenilmemesi gibi deneyler iki sonuçlu olaylardır. Bir bernoulli deneyi, çıktısı iki ayrık olay olarak tanımlanabilen bir rassal deneydir. Bir denemede elde edilecek iki sonuç genellikle 0 ve 1 değerleri ile kodlanır. 1 değeri deneyin başarılı olmasına, 0 değeri deneyin başarısızlığına karşılık gelir, X A 1 ve X Ac 0 ve bu olaylara ait olasılıklar, P X 1 p ve P X 0 1 p olarak tanımlanabilir. Tanım (Bernoulli şans değişkeni): Bernoulli rasgele değişkeni; bir X rasgele değişkeni için yalnız iki sonuç varsa X ‟ e Bernoulli rasgele değişkeni denir. Bernoulli olasılık fonksiyonu, f x; p p x 1 p 1 x olur. x 0,1 Teorem: Eğer X şans değişkeni bir bernoulli dağılımına sahip ise, a. E ( X ) p b. V ( X ) p(1 p) c. M X t e t p 1 p Ġspat: 1 a. E X xp x (1 p )1 x p x0 b. E X 2 x 2 p x (1 p )1 x p 1 x 0 V X p p2 p(1 p) c. E etX etx p x (1 p )1 x et p (1 p ) 1 x0 bulunur. 4.3 BĠNOM DAĞILIMI Binom dağılımı Bernoulli deneylerinden ortaya çıkar. İadeli örnekleme ile birbirinden bağımsız n adet Bernoulli deneyi uygulanarak, bir Bernoulli süreci tanımlansın. Eğer deneyler özdeş ise başarı olasılığı p deneyden deneye değişmez ve sonuç olarak binom olasılık dağılımı ortaya çıkar. Tanım (Binom şans değişkeni): Birbirinden bağımsız n adet Bernoulli denemesinden başarılı olanların toplam sayısı X şans değişkeni olsun. Bir tek deneme için başarılı olma olasılığı p, başarısız olma olasılığı (1 p) ise aşağıdaki koşulları sağlayan X‟ e binom şans değişkeni denir ve şu özellikleri taşır: a. Deney n adet özdeş denemeden oluşmaktadır. (Deneme sayısı n sabit olmalı.) b.Her deneme için yalnız iki sonuç vardır. Başarı veya bunun tümleyeni olan başarısızlık. c.Başarı olasılığı p deneyden deneye değişmez. Başarısızlık olasılığı q 1 p dir. d.Denemeler birbirinden bağımsızdır. Teorem (Binom Dağılımı): Birbirinden bağımsız n Bernoulli denemesi için X, her bir denemede başarı olasılığı p, başarısızlık olasılığı (1 p) olan binom rasgele değişkeni ise, X‟ in olasılık fonksiyonu; n n x f x; n, p p x 1 p x x 0,1,2,...., n olur. Ġspat: n bağımsız denemede başarı sayısı X, 0,1,2,....,n değerlerini alabilir. Aşağıdaki diziyi ele alınsın: 1 ,1 , ,1, 0 ,0 , ,0 n x x Burada 1 başarıyı, 0 başarısızlığı gösterir. Çarpım teoreminden yukarıdaki dizinin olasılığı, yani ilk x adet denemenin başarılı, geri kalan (n x) denemenin başarısız olması olasılığı p x 1 p n x ile hesaplanır. Denemeler birbirinden bağımsız olduğundan, diğer bir x “başarı” ve (n x) “başarısızlık” dizisinin olasılığı da p x 1 p n x ‟dir. Bir grupta x, n diğerinde (n x) terim bulunan n elemanın farklı dizilişlerinin sayısı dir. Bir defada x sadece bir diziliş elde edileceğinden bu olaylar ayrıktırlar. Bu nedenle toplama kuralı nedeniyle X şans değişkeninin olasılık fonksiyonu; ( n denemedeki başarı sayısı) n n x f ( x) p x 1 p x x 0,1,2,3,..., n dir. Bu f ( x) fonksiyonuna binom olasılık fonksiyonu denir. f ( x) fonksiyonunun bir olasılık fonksiyonu olduğunun ispatı aşağıda verilmiştir. 0,1,2,3…,n kez başarma olasılıklarının toplamı binom açılımındaki ardışık terimlere karşılık gelir. Eğer n pozitif tamsayı olmak üzere, a b n x n x a b x 0 x n olduğundan a p ve b 1 p alınarak, olasılıklar toplamı; n x 0 f ( x) n x p 1 p n x n x 1 (1 p) 1 n x 0 elde edilerek ispat tamamlanır. Binom olasılık fonksiyonu için, f x; n, p f n x; n, 1 p eşitliği geçerlidir. Ardışık binom olasılıklarının hesaplanması ise, f x 1; n, p (n x) p f x; n, p x 0,1,..., n 1 ( x 1)(1 p ) eşitliğinden elde edilir. Teorem: Eğer X bir binom dağılımına sahip bir şans değişkeni ise, a. E ( X ) np b. V ( X ) np(1 p) c. M X t e t p 1 p n n n Ġspat: a. E X x p x (1 p ) n x x0 x n (n 1)! n x np p x 1 1 p x 0 ( x 1)!( n x )! np[ p (1 p)]n 1 np NOT: Burada n 1 (n 1)! n 1 p (1 p) 1 ( x 1)!(n x)! x 1 b. E x 2 x x 1 n n 1 n 2 ! n x0 x x 1 x 2 ! n x ! p 2 p x 2 1 p n x n xf x x0 n 2 ! p x 2 1 p n x np x 2 x 2 ! n x ! n n n 1 p 2 np 2 n 1 np V x n 2 p 2 np 2 np n 2 p 2 np 1 p c. M X (t ) E etX n n etx p x (1 p) n x x 0 x n n etx (et p) x (1 p) n x x 0 x Burada binom teoremine göre a et p ve b (1 p) alınarak M X t e t p 1 p n bulunur. Binom dağılımında p ve (1 p) değeri birbirine yaklaştıkça simetri artar, p (1 p) 1 / 2 ise simetriktir. NOT: Binom dağılımından olasılıkların elde edilmesinde n değeri büyüdükçe hesaplama zorlukları ortaya çıkar: Simetrik bir binom dağılımı ( p değerinin çok büyük ya da çok küçük olmadığı durumlar) n için normal dağılıma yakınsar. Asimetrik bir binom dağılımı ( p değerinin çok büyük ya da küçük olduğu durumlar) n için Poisson dağılıma yakınsar. Binom dağılımının yakınsaması ileriki konularda daha detaylı olarak ele alınacaktır. 4.4 GEOMETRĠK DAĞILIMI Binom olasılık dağılımında olduğu gibi bir Bernoulli sürecinden türetilen rassal deneylerin çıktısı ile ilgilenilsin. Bu süreçte çıktı ayrık iki olayı (başarı ve başarısızlık) tanımlar ve başarı olasılığı p deneyden deneye değişmez. Tanım (Geometrik şans değişkeni): Şans değişkeni X ilk başarı elde edilinceye kadar gerçekleştirilen deney sayısı olarak tanımlandığında, şans değişkeni geometrik dağılıma sahiptir. İlk başarının elde edilmesi için gerekli denemelerin sayısı X, geometrik şans değişkenidir. Teorem: X , bir tek denemede başarısızlık olasılığı 1 p ve başarı olasılığı p olan geometrik rasgele değişken ise, X şans değişkeninin olasılık fonksiyonu; f x, p p1 p x 1 x 1,2,3, Ġspat: İlk başarının elde edilmesi için gereken denemelerin sayısı x ve ilk başarıdan önceki başarısızlıkların sayısı x 1 olsun. Bu durum aşağıdaki dizi ile gösterilebilir. 0 ,0 , ,0,1 x 1 O halde x 1 başarısızlığı, başarının takip ettiği dizinin olasılığı p1 p x 1 ‟dir. Bu nedenle X rasgele değişkeninin olasılık fonksiyonu; f x, p p1 p x 1 ile tanımlanır. x 1,2,3, f ( x) fonksiyonunun bir olasılık fonksiyonu olduğunun ispatı aşağıda verilmiştir. Geometrik dağılımın bir olasılık kütle fonksiyonu olduğunun ispatı gerçekte geometrik serinin özelliklerine dayanmaktadır. Herhangi bir a 1 için, a x 1 x 1 1 1 a olduğundan, 1, 2,... denemede ilk başarının elde edilmesi olasılıkları aşağıdaki sonsuz serideki ardışık terimlere karşılık gelir. f x p 1 p p 1 p 2 p x 0 p 1 1 p 1 p 2 1 1 p 1 1 p İspat tamamlanır. Geometrik dağılım daima sağa çarpık bir dağılımdır. Teorem: Eğer X bir geometrik dağılıma sahip ise, 1 p a. E ( X ) b. V ( X ) (1 p ) p2 c. M X t pe t 1 1 e t (1 p ) Ġspat: a. Geometrik dağılımın beklenen değeri, E( X ) xp (1 p) x 1 x 1 p x(1 p) x 1 x 1 p Buradan d x (1 p) d (1 p) x 1 p d (1 p) (1 p) 2 ... d (1 p) p d (1 p) 1 (1 p) (1 p 2 ) ... d (1 p) p d 1 (1 p ) d (1 p ) 1 (1 p ) 1 1 x x 2 ... eşitliği kullanılmıştır. 1 x 1 2 E( X ) p (1 p )1 (1 p ) 1 (1 p ) 1 (1 p ) p p2 p 1 . p b. Geometrik dağılımın varyansı, E( X 2 ) x( x 1) p (1 p ) x 1 x 1 xp (1 p) x 1 x 1 p (1 p ) x( x 1)(1 p) x2 E ( x) x 1 d2 (1 p)1 (1 p) ... E ( x) d (1 p) 2 p(1 p) p (1 p ) d2 d (1 p ) 2 (1 p ) E ( x) 1 (1 p ) 1 d 1 1 (1 p). 2 d (1 p) 1 (1 p) p 1 (1 p) p(1 p) 1 2 1 1 p(1 p) 2 2 (1 p). 3 p p p p p p 2 2p 1 p(1 p) p3 p 2(1 p) 1 p p2 Buradan varyans, 2(1 p) 1 1 p p p2 V (X ) 2 (1 p) p2 bulunur. c. Geometrik dağılımın moment türeten fonksiyonu, M x (t ) E[e xt ] e tx p(1 p) x 1 x 1 p (1 p ) p 1 p e tx (1 p) x x 1 e (1 p) x t x 1 p et (1 p) 1 et (1 p) ... 1 p pe t bulunur. 1 1 e (1 p) t Geometrik dağılımın kümülatif dağılım fonksiyonu, F x PrX x x p1 p x 1 X 1 p 1 1 p ... 1 p x 1 1 1 p x p. 1 1 p 1 1 p x bulunur. Geometrik dağılım ile binom dağılımı arasındaki ilişki, f ( x, p ) 1 f ( x 1; n x; p) x olarak tanımlanır. Geometrik dağılım hafızasızlık özelliğine sahiptir. Teorem (Hafızasızlık özelliği): s t olan tamsayılar için, Pr X s X t Pr X s t Ġspat: Herhangi n tamsayısı için, Pr X n p 1 P n ( n denemede başarı olmama olasılığı) Bu durumda, Pr X s X t Pr( X s ve X t ) Pr( X t ) Pr X s Pr( X t ) 1 p s t Pr X s t Hafızasızlık özelliği; t adet gözlenmiş başarısızlığa s t adet daha başarısızlığın eklenmesinin olasılığının, serinin başlangıcında s t adet başarısızlık oluşma olasılığı ile aynı olduğunu belirtir. Diğer bir deyişle, başarısızlığa ait bir dizinin ortaya çıkma olasılığı dizinin başladığı deneye değil deney sayısına bağımlıdır. 4.5 NEGATĠF BĠNOM (PASCAL) DAĞILIMI Geometrik dağılımın genel şeklidir. Bir deney birbirinden bağımsız Bernoulli denemelerinden oluşmaktadır. Deneye k adet başarı elde edilinceye kadar devam edilirse k başarının elde edilmesi için gerekli denemelerin sayısı negatif binom rasgele değişkenidir. Negatif binom dağılımında, denemelerin sayısı bir rasgele değişkendir ve başarıların sayısı sabittir; binom dağılımda başarının sayısı rasgele değişkendir ve denemelerin sayısı sabittir. Tanım (Negatif binom şans değişkeni): Bağımsız Bernoulli denemelerinde her bir denemede başarı olasılığı p olmak üzere k 1 başarının elde edilmesi için gereken denemelerin sayısı X rasgele değişkeni olsun. Bu koşul altında X‟e negatif binom şans değişkeni denir. Teorem: Bir tek denemedeki başarısızlık olasılığı 1 p ve başarı olasılığı p olmak üzere, X negatif binom şans değişkeninin olasılık fonksiyonu aşağıdadır: x 1 k p 1 p x k f x; p, k k 1 x k , k 1, Ġspat: k 1 başarının gerçekleşmesi için gereken denemelerin sayısı X olsun. X şans değişkeni k , k 1, değerlerini alabilir. Son deneme (x-inci deneme) k-ıncı başarıyı vermek zorunda olduğundan, k 1 adet başarı veren denemelerin sayısını x 1 olacaktır. x 1 denemedeki k 1 başarının olasılığı ve x-inci denemede başarı elde etme olasılığı aşağıdaki gibi bulunur. Aşağıdaki A ve B olayları ele alınsın: A ilk x - 1 deneme k - 1 başaşaiçerir B x - inci deneme başaşaiçerir Denemeler birbirinden bağımsız kabul edildiğinden A ve B olayları da birbirinden bağımsızdır. Pr(B) p ´dir. O halde, f ( x) Pr( X x) P(A B) PAPB yazılır. Görüldüğü gibi ( x 1) k 1 ya da eşdeğer olarak x k için P(A) 0 ‟ dır. x k ise binom dağılımdaki yaklaşım kullanılarak, x 1 k 1 p 1 p x k PA k 1 bulunur. Sonuç olarak f (x) olasılık fonksiyonu x 1 k p 1 p x k f x; p, k k 1 dır. Bu olasılık fonksiyonuna sahip dağılıma Pascal Dağılımı da denir. k 1 ise negatif binom dağılımı geometrik dağılıma indirgenir. Teorem: Eğer X bir negatif binom dağılımına sahip ise, a. E ( X ) k p b. V ( X ) k 1 p p2 c. M x (t ) p k e xt 1 [1 [e (1 p)]]k t Ġspat. a Negatif binom dağılımının beklenen değeri; E( X ) ( x 1)! x ( x k )!(k 1)! p k (1 p) x k xk p k (1 p ) x k ( x 1)! x ( x k )!(k 1)!(1 p) x xk k (k 1)(k 2) p k (1 p) k k (1 p) k k (k 1)(1 p) k 1 (1 p) k 2 .... 2 ! (k 1)( k 2) p k (1 p ) k k (1 p) k 1 (k 1)(1 p) (1 p ) 2 .... 2! Burada köşeli parantez içindeki ifade, f (1 p) 1 (1 p) k 1 fonksiyonunun MacLauren açılımına eşittir. f (1 p) 1 (1 p) k 1 f (0) 1 f (1 p) (k 1)1 (1 p) k 2 (1) f ' (0) (k 1) f (1 p) (k 1)(k 2)1 (1 p) k 3 (1) f (0) (k 1)(k 2) buradan, f (1 p) 1 (1 p) k 1 1 (k 1) (k 1)(k 2) (1 p) (1 p) 2 ..... 1! 2! elde edilir. Sonuç olarak, E ( X ) p k k 1 (1 p) k 1 k p bulunur. b. Negatif Binom Dağılımının Varyansı E( X 2 ) x 2 f ( x) xk x( x 1) f ( x) xk xf ( x) xk ( x 1)! x( x 1) ( x k )!(k 1) p k (1 p) x k E ( X ) xk p k (1 p) k ( x 1)! x( x 1) ( x k )!(k 1)!(1 p) xk x E( X ) E (X ) için izlenen yol kullanılarak, E( X 2 ) k (k 1) 2k (1 p) k p p2 k 2 kp k p2 olarak bulunur. V (X ) k 2 kp k k 2 2 p2 p k (1 p) p2 bulunur. c. Negatif binom dağılımının moment türeten fonksiyonu, M x (t ) E[e xt ] e xk xt ( x 1)! p k (1 p) x k ( x k )!(k 1)! p k (1 p ) k e xk tx ( x 1)! (1 p ) x ( x k )!(k 1) k k (k 1) p k (1 p) k e xt (1 p) k et ( k 1) (1 p) k 1 et ( k 2) (1 p) k 2 ... 1! 2! k (k 1) p k (1 p) k e xt (1 p) k 1 et (1 p)k e 2t (1 p) 2 ... 2! burada köşeli parantezin içi [1 [e t (1 p )]] k fonksiyonunun MacLauren açılımı olduğundan, M x (t ) p k e xt 1 [1 [e (1 p )]] k t olarak bulunur. Bazı durumlarda negatif binom dağılımı, k-ıncı başarıdan önce ortaya çıkan başarısızlık sayısına göre de tanımlanabilir. Eğer Y şans değişkeni k-ıncı başarıdan önce ortaya çıkan başarısızlık sayısı ise, y k 1 k p (1 p) y f ( y; p, k ) y y 0,1,.... olasılık kütle fonksiyonu, daha önce verilen ve X şans değişkeninin k-ıncı başarı elde edilinceye kadar gerçekleştirilen deney sayısını tanımladığı olasılık kütle fonksiyonuna denktir. Burada Y X k olarak tanımlanabilir. Negatif binom dağılımı adını y k 1 k (k )( k 1)( k 2)...( k y 1) (1) y (1) y y ( y 1)( y 2)...( 2)(1) y y ilişkisinden almaktadır. Olasılık kütle fonksiyonu, k f ( y; p, k ) (1) y p k (1 p) y y k y p k (1 p ) y olarak tanımlanabilir. Dağılışın beklenen değer ve varyansı, E (Y ) y 0 y k 1 k p (1 p) y y y (k y 1)! ( y 1)!(k 1)!p k (1 p) y y 1 k k (k y 1)! ( y 1)!(k 1)!p k (1 p) y y 1 k y 1 k p (1 p) y k y 1 y 1 Burada z y 1 dönüşümü yapılarak: E (Y ) z k k p (1 p ) z 1 k z z 0 k 1 p z 1 k 1 k 1 p (1 p ) z p z 0 z k 1 p p bulunur. Dağılımın varyansı ise, V Y k 1 p p2 olarak tanımlanmıştır. Negatif binom dağılımının varyansı ortalamasının karesel bir fonksiyonudur, yukarıda elde edilen E Y kullanılarak, V Y E Y 1 EY 2 k bulunur. Negatif binom dağılımı limit durumunda Poisson dağılımına yakınsar. Eğer k ve p 1 ise k 1 p olduğundan, E Y k 1 p p V Y k 1 p p2 sonuçları elde edilir ki bunlar Poisson dağılımının ortalaması ve varyansıdır. Binom dağılımı ve negatif binom dağılımı arasındaki fark aşağıda açıklanmıştır: X şans değişkeni, n ve p parametreleri ile binom dağılımına sahip olsun. Yani X, n adet Bernoulli denemesindeki başarı sayısıdır. Y şans değişkeni ise, k ve p parametreli negatif binom dağılımına sahip olsun. Diğer bir deyişle Y, k adet başarı elde etmek için gereken Bernoulli denemelerinin sayısıdır. a. PrY n Pr X k İlk n denemede k ya da daha çok başarı varsa, ilk k başarıyı elde etmek için n ya da daha az deneme gerekir. b. PrY n Pr X k İlk n denemede k dan az başarı varsa, k başarıyı elde etmek için n den çok deneme gerekir. 4.6 HĠPERGEOMETRĠK DAĞILIM İçinde iki çeşit nesne bulunan sonlu sayıda öğeden oluşan bir anakütle ele alınsın. Tekrar yerine koymaksızın, ardışık olarak sabit büyüklükte bir örneklem seçilsin. Örneklemdeki iki çeşit öğeden herhangi birinin sayısını ise şans değişkenini tanımlasın. Hipergeometrik dağılım, sonlu elemanlı anakütle ile ilgilenildiğinde oldukça uygun bir modeldir. Anakütledeki eleman sayısının N olduğu ve alınan örnek hacminin n olduğu varsayılsın. Anakütlede ilgilenilen özelliğe sahip eleman sayısı ise M olsun. Alınan n hacimli örnekte X adet başarının ortaya çıkma olasılığı, hipergeometrik dağılım gösterir Tanım (Hipergeometrik şans değişkeni): Sonlu sayıda N öğeden oluşan bir anakütle içinde belli bir A tipindeki öğelerin sayısı M olsun. Tekrar yerine koymaksızın rasgele çekilen ve n birimden oluşan bir örneklemdeki A tipindeki öğelerin sayısı X şans değişkeni olsun. X hipergeometrik şans değişkenidir ve hipergeometrik olasılık kütle fonksiyonu; M N M X n x f ( x; N , M , n) N n x 0,1,...., n Teorem: Eğer X şans değişkeni hipergeometrik dağılıma sahip ise, a. E ( X ) nM N b. V (X ) c. M X t Ġspat: Hipergeometrik dağılımın beklenen değer ve varyansı M N M x n x E( X ) x N x 0 n n M N M x n x N x 1 n n ( x 0 daki değer sıfırdır) Bu ifadeyi değerlendirmek için aşağıdaki eşitlikler kullanılır. M M 1 x M x x 1 N N N 1 n n n 1 Bu durumda M 1 N M M x 1 n x EX N N 1 x 1 n n 1 M 1 N M n x 1 n x nM N x 1 N 1 n 1 n bulunur. Eşitliğin en sağındaki ifade parametreleri N 1 , M 1 ve n 1 olan bir başka hipergeometrik dağılımın olasılıklarının toplamıdır. Bunu görebilmek için tanımlanır ve f (x) bir olasılık fonksiyonu olduğundan, M N M N n x n x 0 n x eşitliği geçerlidir ve M 1 N M M 1 N M n 1 x 1 n x y n y 1 N 1 N 1 x 1 y 0 n 1 n 1 n n 1 f y; N 1, M 1, n 1 y 0 1 Sonuç olarak, y x 1 E X nM N bulunur. b. Dağılımın varyansı n E( X 2 ) a N a x n x N n x.( x 1) x x0 a N a a N a x( x 1) n x x n x x n x N N x0 x 0 n n n a (a 1)n(n 1) na na (a 1)(n 1) ( N 1) N ( N 1) N N ( N 1) V X E ( X 2 ) [ E ( X )]2 nM (nM M n N ) n 2 M 2 N n M M n 1 N ( N 1) N 1 N N N2 elde edilir. NOT: p M / N ve 1 p ( N M ) / N olduğundan; E X n M np N N n M V X n N 1 N M 1 N N n np 1 p N 1 şeklinde de ifade etmek mümkündür. Hipergeometrik dağılımın moment türeten fonksiyonu yoktur. Alternatif olarak, iadesiz ardışık örnekleme yapılabilir. i-inci denemedeki başarı sayısı Yi olsun. Her bir çekilişte ortaya çıkabilecek sonuç başarı (Yi = 1) ya da başarısızlık (Yi = 0) olacağından, Yi „ler binary (ikili) değerler alır. Yi „ler bağımsız olmadıkları için denemeler Bernoulli denemesi değildir. Açıkça görülmektedir ki PYi 1 başarı oranıdır. Şimdi Y2 ele alınsın. Bu durumda, PY2 1 | Y1 1 r 1 N 1 PY2 1 | Y1 0 r N 1 r p değeri, anakütledeki N olur. Toplam olasılık kuralına göre P A P A | B .PB PA | B c .PB c ‟dir. Böylece PY2 1 PY2 1 | Y1 1.PY1 1 PY2 1 | Y1 0.PY1 0 r r 1 r r . .1 N 1 N N 1 N r N 1 N 1N r p N Tümevarım yolu ile tüm i denemeleri için PYi 1 r p olduğu gösterilebilir. Başarı N olasılığı (koşulsuz) tüm denemeler için Bernoulli denemelerinde olduğu gibi aynıdır. Denemeler bağımlı oldukları için bu denemeler Bernoulli denemesi değildir. (Unutulmamalıdır ki örnekleme iadeli olarak yapılırsa denemeler Bernoulli denemesi olur ve X şans değişkeni de başarı olasılığı p olan n denemeli Binom dağılımı olur.) Örnekleme ister bir grubun topluca rassal olarak seçilmesi ister tek tek iadesiz olarak yapılıyor olsa da X‟nin dağılımı aynıdır. Tek tek yapılan seçimde X‟nin ortalama ve varyansını hesaplamak daha kolaydır. Doğrudan Hipergeometrik dağılımın olasılık fonksiyonundan elde edilen momentlerin hesaplamaları karşılaştırılsın. Öncelikle tüm denemeler X Y1 Y2 Yn için olduğunda E Yi 01 p 1 p p Binom r ‟dir. N dağılımında E X E Y1 Y2 Yn E Y1 E Y2 E Yn p p p np Bu yüzden olduğu gibi nr N Y‟ler bağımsız olmadıkları için Var X ‟yi bulmak nispeten zordur. n Var X Var Yi i 1 VarY 2 CovY , Y n i i i 1 j i j Y‟ler binary oldukları ve aynı başarı olasılığı p‟ye sahip olduklarından, tüm i-ler için Var Yi p1 p ‟dir. Genel olarak, E Y Y CovYi , Y j E Yi i Y j j i j i j E YiY j ‟yi elde edebilmek için, Y‟lerin binary oldukları bilindiğine göre YiYj‟nin 0 ya da 1 olacağı unutulmamalıdır. Bu nedenle, E YiY j 1.P YiY j 1 P Yi 1, Y j 1 P Y j 1 | Yi 1.PYi 1 r 1 r N 1 N ve 2 r 1 r r CovYi , Y j N 1 N N r N r 1 r N 1 N 1N 2 r N r N 1N 2 p1 p N 1 (Negatif kovaryans ve dolayısıyla korelasyon, bir denemede elde edilen başarının diğer bir denemenin başarısının olabilirliğini azaltma eğilimindedir.) Sonuç olarak, Var X ‟nin elde edilebilmesi için n adet eş varyans ve nn 1 adet eş 2 kovaryansın toplanması gerekmektedir. Böylece, Var X np 1 p 2 nn 1 p1 p 2 N 1 n 1 np1 p 1 N 1 İlgili Hipergeometrik dağılımın standart sapmasını elde edebilmek için Binom dağılımının standart sapmasıyla çarpım halinde olan 1 n 1 faktörüne sonlu anakütle düzeltme N 1 faktörü denir. Unutulmamalıdır ki genelde örnek hacmi popülasyon hacminden oldukça küçüktür n<<N. Bu nedenle sonlu popülasyon düzeltme faktörü 1‟e yakındır ve Binom dağılımından elde edilen standart sapma Hipergeometrik dağılımın gerçek standart sapmasına mükemmel bir yakınsama sağlar. Aslında Binom dağılımı Hipergeometrik dağılıma çok iyi bir yakınsama sağlar. Hipergeometrik dağılımın binom dağılımına yaklaşımı aşağıda açıklanmıştır. Anakütledeki eleman sayısı N çok büyük ise ve n ile p sabit kaldıkça hipergeometrik dağılım binom dağılımına yaklaşır. N M ! M! x!M x ! n x !N M n x ! f x; N , M , n N! n!N n ! N n! M M 1....M x 1M x ! n! M x ! N N 1...N n 1N n! x!n x ! N M N M 1...N M n x 1N M n x ! N M n x ! M ...M x 1 N M ...N M n x n! x!n x ! N ...N n 1 Burada, N için, N ...N n 1 N n N M ...N M n x N M n x M ...M x 1 M x yaklaşımları kullanılarak, f x; N , M , n M x N M Nn n x x n! x!n x ! M N M N N Burada p n x n! x!n x ! N M M ve 1 p alınarak N N f x; n, p n! n x p x 1 p x!n x ! sonucuna ulaşılır. Bu da binom dağılışının olasılık kütle fonksiyonudur. Eğer örnek hacmi n büyük fakat hala n<<N ise X‟nin dağılımı Merkezi Limit Teoremi ile ortalaması np ve varyansı np1 p olan Normal dağılıma yakınsar. Buna benzer olarak örnek x n oranı pˆ ‟in dağılımı ortalaması p ve varyansı p 1 p olan Normal dağılıma yakınsar. n 4.7 POĠSSON DAĞILIMI VE SÜRECĠ Belirli sürekli bir ölçekte rasgele olarak ortaya çıkan olay sayısı ile ilgileniliyor olsun. Bu tip şans değişkenleri poisson dağılımına sahiptir. Bu şans değişkenlerini türeten süreç ise poisson sürecidir. Poisson Sürecinin Varsayımları: Poisson dağılımı, poisson postulate adı verilen temel varsayımlar setinden ele edilebilir. Bu varsayımlar incelenen sürecin fiziksel özellikleri ile ilgilidir ve aşağıdaki teorem ile özetlenmiştir. Teorem: Her bir t 0 değeri için, X t aşağıdaki özelliklere sahip tam sayı değerli bir şans değişkeni olsun; (Burada X t , 0 ile t aralığında otaya çıkan rasgele olay sayısı olarak düşünülebilir). a. x0 0 (Başlangıç sınırındaki olay sayısı sıfırdır) b. s t olmak üzere x s ve xt xs bağımsızdır. (Ayrık periyotlardaki olay sayıları bağımsızdır) c. x s ve xt s xt özdeş dağılmıştır. (Ortaya çıkan olay sayısı sadece periyot uzunluğuna bağlıdır) d. lim t 0 P( xt 1) (Ortaya çıkış olasılığı eğer periyot küçük ise periyot uzunluğu ile t doğru orantılıdır) P( xt 1) 0 (Olaylar eşanlı olarak oluşmazlar). t 0 t e. lim Eğer a-e varsayımları sağlanıyor ise herhangi bir X tamsayısı için, f ( xt x) e t (t ) x x! olup xt ~ Poisson (t ) ‟ dir. Tanım (Poisson şans değişkeni): Sürekli bir ölçekte rasgele olarak ortaya çıkan olay sayısı X olsun. Eğer X şans değişkeni yukarıda verilen teoremin özelliklerini sağlıyor ise X‟e Poisson şans değişkeni denir ve olasılık fonksiyonu, f x; e x x! x 0,1,2, Şeklinde tanımlanır. Teorem: f x; bir olasılık fonksiyonudur. Ġspat: Bu fonksiyonun olasılık fonksiyonu olduğu e y fonksiyonunun Taylor serisine açılımı kullanılarak, ey yi i! i 0 olduğundan, x 0 f x; e x x! x 0 e e 1 ispat tamamlanır. Teorem: Eğer X bir poisson dağılımına sahip ise, a. E(X ) b. V (X ) t c. M x e e 1 x.e x x! x 0 Ġspat: a. E ( X ) xf ( x) x 0 e x x 1 ( x 1)! e ( x 1)! x 1 x 1 Burada y x 1 dönüşümü ile denklemin sağ yanındaki toplam e ‟ ya eşit olur. E ( X ) e e elde edilir. x 2 e x x! x 0 b. E ( X 2 ) x 2 f ( x) x 0 Bu denklemde x 2 x( x 1) x özdeşliğini kullanarak, x( x 1) x! xe E X2 x x 0 x( x 1)e x xe x x! x! x 0 x 0 e x x 2 ( x 2)! 2e e x ( x 1)! x 1 x 2 ( x 2)! E X x2 Burada y x 2 dönüşümü ile denklemin sağ yanındaki toplam e ya eşit olur. E X 2 2 ve sonuç olarak, V X E X 2 E X 2 elde edilir. c. Poisson Dağılımının Moment Çıkaran Fonksiyonu, e M x t E etx tx x 0 e e x x! x 0 e e t e t x! x e ee t 1 olur. Poisson dağılmış bir tesadüfi değişkenle ilgili olasılıkları hesaplamak için verilecek λ değerlerine karşılık gelen e ve x sayısal değerlerine ihtiyaç vardır. İşlemleri kolaylaştırmak için verilen her λ ve X değerlerine göre poisson dağılımlarına karşı gelen olasılıkları veren tablolar hazırlanmıştır. Poisson dağılımı gerçekleşme olasılığı çok küçük olan olayların tekrarlı denemeleri için uygun bir dağılımdır. Diğer taraftan Poisson dağılımı Pr X x 0.01 ve n 20 olduğunda binom dağılımı için iyi bir yaklaşımdır. Binom Dağılımının Poisson Dağılımına YaklaĢımı Simetrik bir binom dağılımı, örnek çapı büyüdükçe normal bir dağılıma yakınsamaktadır. Ancak n→∞ bile olsa, eğer p ya da q dan biri sıfıra, diğeri 1‟e yaklaşırsa, asimetri çok şiddetleneceğinden normal dağılımdan yararlanılamaz. Bu durumda binom dağılımı bir poisson dağılımına yaklaşır. Binom dağılımının n parametresi sonsuza ve p parametresi sıfıra yaklaşıyor ise np sabit kalıyor ise binom dağılımı poisson dağılımına yaklaşır. Bu durumda np olduğu kabul edilir. f x; n, p n! n x p x 1 p n x ! x! x n x nn 1...n x 1 1 1 n x! n n nn 1...n x 1 x 1 n 1 x x! nx n 1 x 1 x 11 ...1 1 n n n n x! n n 1 n x n 1 x 1 x lim f x; n, p lim 11 ......1 1 1 n n n x! n n n n Burada Limn→∞ (1 x 1)....(1 2 )(1 1 )(1) 1 dir. n n n x Limn→∞ {1 n n } e Limn→∞ (1 ) x 1 n olduklarından, lim f x; n, p 1 n x e 1 x! x e x! bulunur. 4.8 ÇOK TERĠMLĠ (MULTĠNOMĠAL) DAĞILIM Bir deneyde E1 , E2 ,, Ek ile gösterilen ayrık olaylar tanımlanmış olsun. Denemeler n kez tekrarlandığında her bir Ei olayının elde ediliş sayısının Xi ortak dağılımı çok terimli dağılımdır. Örneğin bir zar n kez atılsın zarın üst yüzüne gelen 1‟lerin sayısı x1, 2‟lerin sayısı x2, 6‟larin sayısı x6 ile tanımlanır. Her bir Ei olayının elde edilme olasılığı ise pi ile tanımlanır ve tüm deneler için sabit olduğu varsayılır. Bu dağılım binom dağılımının genelleştirilmiş halidir. Teorem: Sabit n adet denemede her bir Ei, i 1,2,, k , olayının ortaya çıkış sayısının ortak olasılık dağılımı k xi n ve p i 1 koşulları altında, i 1 i 1 f x1 , x2 ,, xk k n! p1x1 . p2x 2 ... pkx k x1! x2!....xk ! xi 0,1,2,, n fonksiyonu ile belirlenir ve bu dağılıma çok terimli dağılım adı verilir. İspat: n adet bağımsız denemede belli bir sırada E1 olayının x1 kez, E2 olayının x2 kez,…., Ek olayının xk kez elde edilmesi olasılığı, p1x1 . p2x 2 ... pkx k eşitliğinden elde edilir. Olayların herhangi bir sırada elde edilmesi ile ilgilenildiğinden, diğer bir deyişle sıralama önemsiz olduğundan, buradaki eşanlı olayların farklı dizilişlerinin sayısı; n! x1! x2!....xk ! olacaktır. Bu nedenle k x i i 1 n ve k p i 1 olmak üzere X1 , X 2 ,, X k şans değişkenlerinin i 1 ortak olasılık fonksiyonu elde eilen iki sonucun çarpılması ile tanımlanır. 4.9 ÇOK DEĞĠġKENLĠ HĠPERGEOMETRĠK DAĞILIM Eğer hipergeometrik dağılımda ana kütledeki birimler iki değil de k tane gruba ayrılıyor ise genelleştirilmiş hipergeometrik dağılıma geçilir. Her bir Ei olayının elde edilme olasılığı ise pi deneyden deneye değişiyor ise deney n kez tekrarlandığında, x1 kez E1, x2 kez E2, , xk kez Ek sonuçlarının ortak oluşma olasılıkları genelleştirilmiş (çok değişkenli) hipergeometrik dağılım ile bulunur. Çok değişkenli hipergeometrik dağılımın olasılık fonksiyonu, N1 N 2 N k x x x f x1 , x2 ,, xk 1 2 k N n olup burada, N1 N 2 N k N ve x1 x2 xk n eşitlikleri ile tanımlanmıştır. BÖLÜM 4 EKLER E.4 POĠSSON OLASILIK YOĞUNLUK FONKSĠYONUNUN ELDE EDĠLMESĠ Olayların h uzunluğundaki bir periyotta yaklaşık olarak homojen bir şekilde ortaya çıktığı varsayılsın. Belirlenen periyot için aşağıdaki durumlarla karşılaşılabilir: — Sadece bir olay ortaya çıkar, — Hiç olay oluşmayabilir, — Birden fazla olay ortaya çıkabilir. h periyodundaki olasılıklar P( x, h) ile belirtilsin, o(h) fonksiyonu: oh lim 0 h 0 h h 2 oh oh oh oh özelliklerini sağlayan bir fonksiyon olsun. Varsayım d için; w h olan küçük bir aralık için bir olayın ortaya çıkma olasılığı P(1, h) , aralığın uzunluğu ile h şeklinde doğru orantılıdır. Burada sabit pozitif oransal bir çarpımı ifade eder. Başka bir ifade ile P1, h h oh Varsayım e için; w h olan küçük bir aralık için iki veya daha fazla olayın ortaya çıkma olasılığı, Px, h oh x2 Varsayım b için; Kesişmeyen aralıklardaki olay sayısı birbirinden bağımsızdır. Varsayım d ve e‟ den en az bir olayın h aralığında oluşmasının olasılığı, Px 1, h h oh oh h oh bunun sonucu olarak, h aralığında hiç olay oluşmamasının olasılığı, P0, h 1 h oh olup, Varsayım b ile, periyodu h w olan bir aralıkta hiç olay oluşmamasının olasılığı P(0, h w) , w aralığında hiç olay olmama olasılığı P(0, w) ile h aralığında hiç olay olmama olasılığı P(0, h) ‟nın çarpımına eşittir: P0, h w P0, w1 h oh P0, w h P0, w oh P0, w P0, w h h h 0 için limit alınarak, dP0, w P0, w dw diferansiyel denklemi elde edilir. Bu diferansiyel denklemin çözümü aşağıda verilmiştir: dP 0, w dw P0, w dP 0, w P0, w dw ln P0, w w c P0, w e w c bulunur. Eğer w 0 ise varsayım a ile, P(0,0) 1 olur. Bu koşul altında c 1 elde edilir. Sonuç olarak: P0, w e w . Periyodu w h olan bir aralıkta x adet olay olmasının olasılığı, P( x, w h) : w aralığında x olay olmasının olasılığı P( x, w) ile h aralığında hiç olay olmamasının olasılığı [1 h o(h)] çarpımı artı, w aralığında x 1 olay olmasının olasılığı P( x 1, w) ile h aralığında bir olay olmasının olasılığı h oh çarpımı artı, w aralığında x 2 olay olmasının olasılığı P( x 2, w) ile h aralığında iki olay olmasının olasılığı o(h) çarpımından oluşur; Px, w h Px, w1 h oh Px 1, wh oh Px 2, woh Px, w h Px, w oh Px, w Px 1, w Px 2, w h h ve h 0 için limit alınarak, dPx, w Px, w Px 1, w dw türev eşitliği bulunur. Bu diferansiyel denkleminin çözümü aşağıda verilmiştir: x 1 için; dP 1, w dw dP 1, w dw P 1, w P 0, w P 1, w e w (1) Bu ifade birinci mertebeden doğrusal bir diferansiyel denklemdir. Bu diferansiyel denklemin integral çarpanı, T w e dw e w P1, wew ew e w dw P1, we w w c P1, w e w w c bulunur. w 0 için P(1,0) 0 olduğundan, c 0 bulunur. Sonuç olarak: P1, w we w elde edilir. Türev eşitliğinde yerine konarak P(2, w) ve sırasıyla diğer terimler bulunur ve P x, w w x e w x x 1,2,... , Poisson olasılık fonksiyonu elde edilir. Poisson süreci ile ilişkili dağılımlar (gama, üstel ve bazı sürekli dağılışlar) ve olasılık yoğunluk fonksiyonlarının elde edilişleri ilgili dağılışların ele alındığı kısımlarda açıklanmıştır.