4. TEK DEĞİŞKENLİ PARAMETRİK DAĞILIMLAR 4.1 KESİKLİ PARAMETRİK OLASILIK DAĞILIMLARI Bu kısımda, gerçek yaşamdan ortaya çıkan pek çok rassal olayın modellenmesinde faydalı olan, kesikli (tek değişkenli) parametrik olasılık dağılımlarından bazıları incelenecektir. Ele alınacak dağılımlar, bir hipotetik örnekleme süreci ile ilgili varsayımlar kümesi altında matematiksel olarak elde edilmiş teorik dağılımlardır. Bu teorik dağılımlar, belirli parametrelere göre bir olasılık kütle (mass) ailesini tanımlayan kurallar kümesi ile ifade edilirler. Bir şans değişkeni X ve bir parametre verilmiş olsun. f ( X , ) ise bir kesikli teorik olasılık kütle fonksiyonunu tanımlayan kurul olsun. Eğer α bir pozitif tamsayı ise, bu parametre farklı olasılık kütle fonksiyonlarının; f (X ,1) , f (X ,2) , … bütün bir kümesini belirler. Sonuç olarak, bu parametrik kesik dağılım ailesinin değişik elemanlarını içeren küme F { f ( X , ) / tamsayı} elde edilir. Bir şans değişkeni X için kesikli olasılık kütle fonksiyonu ailesini tanımlamakta kullanılabilecek parametre tipleri aşağıda listelenmiştir; Sayım (count) parametresi; bir şans deneyindeki belirli bir çıktının ortaya çıkış sayısı. Orantı (proportion) parmatre; bir şans deneyindeki belirli bir çıktının ortaya çıkış sayısının toplam deneme sayısına göreceli oranı. Yer (location) parametresi: x -ekseni üzerinde, olasılık kütle fonksiyonunun pozisyonunu (orijine göre göreceli olarak) belirler. Ölçek (scale) parametresi: şans değişkeninin ölçümlendiği birimleri belirler, fonksiyonun grafiğini daraltarak ya da genişleterek olasılık kütle fonksiyonun yayılımını etkiler. Biçim (shape) parametresi: bir olasılık kütle fonksiyonunun şeklini (örneğin simetrisi) etkiler. Oran (rate) parametresi: bir rassal sürecin zaman, uzay, hacim, üzerinden çıktılarının oluşum yoğunluğunu belirler (örneğin verilen bir zaman periyodunda bir olayın ortaya çıkış sayısı). 4.1.1 Kesikli Uniform (Tekdüze) Dağılım Bir kesikli şans değişkeni X , her biri 1 / k eşit olasılıklı k adet farklı değer alabiliyor ise bu değişkenin kesikli tekdüze dağılımı vardır. Tanım: k pozitif bir tam sayı olmak üzere; x 1,, k 1 k f x; k 0 d .d yoğunluğuna sahip bir x şans değişkeni, kesikli uniform şans değişkeni olarak adlandırılır. Teorem: Eğer X bir kesikli uniform dağılıma sahip ise, a. E X k 1 , 2 b. V X k 2 1 12 k c. M X t e tx 1 k x 1 İspat: İlk olarak k x x 1 k k 1 ve 2 k x 2 x 1 1 k 1 k 2 k a. E X x x 1 elde edilir. k b. E X 2 x 2 x 1 1 k k 1k 2 k 12 olduğundan, V X E X 2 E X k 1k 1 12 k 1 12 2 2 k k 12k 1 olduğu hatırlanarak, 12 bulunur. 4.1.2 Bernoulli Dağılımı Bir deney bir olayın gerçekleşip gerçekleşmemesi yönünden incelediğinde ortaya iki sonuçlu bir deney çıkar ve bu deneye ait örneklem uzayı S = { A, A } olacaktır. Örneğin, bir üretimin kusurlu ve kusursuz diye belirlenmesi, piyasaya çıkan yeni bir malın beğenilip beğenilmemesi gibi iki sonuçlu olaylardır. Bir bernoulli deneyi, çıktısı iki ayrık olay olarak tanımlanabilen bir rassal deneydir. X şans değişkeni 0 ve 1 değerlerini alır. x (A) = 1 ve x (A ) = 0 ya da P( x=1 ) = p ve P( x=0 ) = q Tanım: Bernoulli rasgele değişkeni; bir X rasgele değişkeni için yalnız iki sonuç varsa X’e Bernoulli rasgele değişkeni denir. Bir denemede elde edilecek iki sonuç için genellikle 0 ve 1 değerleri karşılık getirilir (kodlanır). 1 değeri → Belli bir değerin başarılı olmasına 0 değeri → Belli bir değerin başarısızlığına karşılıktır. Tanım: Bernoulli rasgele değişkeni; bir X rasgele değişkeni için yalnız iki sonuç varsa X ’ e Bernoulli rasgele değişkeni denir. Bernoulli olasılık kütle fonksiyonu, f x; p p x 1 p 1 x x 0,1 olur. Teorem: Eğer X bir bernoulli dağılımına sahip ise, a. E ( X ) p b. V ( X ) p(1 p) c. M X t e t p 1 p İspat: 1 a. E X xp x (1 p)1 x p x 0 b. E X 2 x 2 p x (1 p)1 x p 1 x 0 V X p p 2 p(1 p) c. E etX etx p x (1 p)1 x et p (1 p) 1 x 0 bulunur. 4.1.3 Binom Dağılımı Binom dağılımı tek bir Bernoulli deneyinden ortaya çıkar. İadeli örnekleme ile birbirinden bağımsız n adet Bernoulli deneyi uygulanarak, bir Bernoulli prosesi tanımlansın. Eğer deneyler özdeş ise başarı olasılığı p deneyden deneye değişmez. Sonuç olarak binom olasılık dağılımı bir Bernoulli prosesinden ortaya çıkar. Tanım: Binom rasgele değişkeni; Birbirinden bağımsız n Bernoulli denemesinden başarılı olanların toplam sayısı X rasgele değişkeni olsun. Bir tek deneme için başarılı olma olasılığı p , başarısız olma olasılığı (1 p) ise aşağıdaki koşulları sağlayan X ’ e binom rasgele değişkeni denir ve şu özellikleri taşır: — Deney n özdeş denemeden oluşmaktadır. (Deneme sayısı değişmemelidir.) — Her deneme için yalnız iki sonuç vardır. İstenen olay veya bunun tümleyeni. Başarı ( S ), Başarısızlık ( F ). — Bir tek deneme için başarı olasılığı p olan her deneme için aynıdır. Başarısızlık olasılığı q 1 p dir. — Denemeler birbirinden bağımsızdır. Teorem: (Binom Dağılımı) Birbirinden bağımsız n Bernoulli denemesi için X , her bir denemede başarı olasılığı p , başarısızlık olasılığı (1 p) olan binom rasgele değişkeni ise, X ’ in olasılık fonksiyonu; n n x f x; n, p p x 1 p x x 0,1,2,...., n olur. İspat: n bağımsız denemede başarı sayısı x , 0,1,2,....,n olabilir. Aşağıdaki diziyi düşünelim: SS ....S FF ....F x n x Burada S başarıyı, F başarısızlığı gösterir. Çarpım teoreminden yukarıdaki dizinin olasılığı, yani ilk x denemenin başarılı, geri kalan (n x) denemenin başarısız olması olasılığı p x 1 p n x ile hesaplanır. Denemeler birbirinden bağımsız olduğundan, diğer bir x “başarı” ve (n x) “başarısızlık” dizisinin olasılığı da p x q n x dir. Bir grupta x , diğerinde n (n x) sonuç bulunan n sonucun farklı dizilerinin sayısı dir. Bir defada bir olay elde x edileceğinden bu olaylar ayrıktırlar. Bu nedenle toplama kuralı nedeniyle X rasgele değişkeninin olasılık fonksiyonu; ( n denemedeki başarı sayısı) n f ( x) . p x .q n x x 0,1,2,3,..., n x dir. Bu f ( x) fonksiyonuna binom dağılımı denir. 0,1,2,3…,n kez başarma olasılıkları (p+q)n in binom açılımındaki ardışık terimlere karşılık gelir. Olasılıklar toplamı; n n n x 0 x 0 f ( x) x . p x .q n x ( p q) n 1 dir. Binom olasılık fonksiyonu için, f x; n, p f n x; n, 1 p eşitliği geçerlidir. Eğer n pozitif tamsayı olmak üzere, n x n x a b x 0 x a b n olduğundan a p ve b 1 p alınarak, p (1 p) n n 1 f ( x) x 0 n n n x p x 1 p x 0 x bulunur. Ardışık binom olasılıklarının hesaplanması ise, f x 1; n, p ( n x) p f x; n, p x 0,1,..., n 1 ( x 1)(1 p) Teorem: Eğer X bir binom dağılımına sahip ise, a. E ( X ) np b. V ( X ) np(1 p) c. M X t e t p 1 p n İspat: n n a. E X x p x (1 p) n x x 0 x n (n 1)! n x p x 1 1 p np x 0 ( x 1)!( n x)! np[ p (1 p)]n 1 np n 1 (n 1)! n 1 p (1 p) 1 ( x 1)!(n x)! x 1 NOT: Burada n n 1 n 2 ! n b. E x 2 x x 1 x 0 x x 1 x 2 ! n x ! p 2 p x 2 1 p n x n xf x x 0 n 2 ! p x 2 1 p n x np x 2 x 2 ! n x ! n n n 1 p 2 np 2 n 1 np V x n 2 p 2 np 2 np n 2 p 2 np 1 p c. M X (t ) E etX n n etx p x (1 p ) n x x0 x n n etx (et p) x (1 p ) n x x0 x Burada binom teoremine göre; a b n n n x a xb n x x 0 olduğundan a e t p ve b (1 p) alınarak M X t e t p 1 p n bulunur. Binom dağılımında p ve (1 p) değeri birbirine yaklaştıkça simetri artar, p (1 p) 1 / 2 ise simetriktir. NOT: Binom dağılımından olasılıkların elde edilmesinde n değeri büyüdükçe hesaplama zorlukları ortaya çıkar: Simetrik bir binom dağılımı ( p değerinin çok büyük ya da çok küçük olmadığı durumlar) n için normal dağılıma yakınsar. Asimetrik bir binom dağılımı ( p değerinin çok büyük ya da küçük olduğu durumlar) n için Poisson dağılıma yakınsar. Binom dağılımının yakınsaması ileriki konularda daha detaylı olarak ele alınacaktır. 4.1.4 Geometrik Dağılımı Binom olasılık dağılımında olduğu gibi bir Bernoulli sürecinden türetilen rassal deneylerin çıktısı ile ilgilenilsin. Bu süreçte çıktı ayrık iki olayı (başarı ve başarısızlık) tanımlar ve başarı olasılığı p deneyden deneye değişmez. Şans değişkeni x ilk başarı elde edilinceye kadar gerçekleştirilen deney sayı olarak tanımlandığında, şans değişkeninin dağılımı geometrik olasılık dağılımına uygundur. İlk başarının elde edilmesi için gerekli denemelerin sayısı X, geometrik rasgele değişkenidir. Teorem: X , bir tek denemede başarısızlık olasılığı q 1 p ve başarı olasılığı p olan geometrik rasgele değişken ise, X in olasılık fonksiyonu; f ( x) P( X x) q x 1 p x 1,2,3,... İspat: İlk başarının elde edilmesi için gereken denemelerin sayısı X ,1,2,3,.... değerlerinden biri olabilir. x 1 ilk başarıdan önceki başarısızlıkların sayısı olsun. Bu durum aşağıdaki gibi gösterilebilir. FF ....F S x 1 O halde x 1 başarısızlığı, başarının takip ettiği dizinin olasılığı q x 1 p dir. Bu nedenle X rasgele değişkeninin olasılık fonksiyonu; f ( x) P( X x) q x 1 p x 1,2,3,... 1,2,... denemede ilk başarının elde edilmesi olasılıkları aşağıdaki sonsuz serideki ardışık terimlere karşılık gelir. f ( x) p qp q 2 p ... Olasılıklar toplamı; 1 f x P( X x) p(1 q q 2 ...) p ( ) 1 x 1 x 1 1 q dir. Geometrik dağılımın bir olasılık kütle fonksiyonu olduğunun ispatı P X x 1 x 1 gerçekte geometrik serinin özelliklerine dayanmaktadır. Herhangi bir a 1 için, a x 1 x 1 1 1 a olduğundan, x 1 x 1 P X x P1 P P 1 P x 1 x 1 x 1 P. 1 1 1 P 1 bulunur. Geometrik dağılım daima sağa çarpık bir dağılımdır. Teorem: Eğer X bir geometrik dağılıma sahip ise, 1 p a. E ( X ) (1 p) b. V ( X ) p2 c. M X t pet 1 1 e t (1 p) İspat: a. Geometrik dağılımın beklenen değeri, E ( x) xp (1 p) x 1 x 1 p x(1 p) x 1 x 1 d (1 p) x d (1 p) x 1 d p (1 p) (1 p) 2 ... d (1 p) d p (1 p) 1 (1 p) (1 p 2 ) ... d (1 p) p p Buradan d 1 (1 p ) d (1 p) 1 (1 p) 1 1 x x 2 ... eşitliği kullanılmıştır. 1 x 1 E ( x) p (1 p)1 (1 p)2 1 (1 p) 1 (1 p) p p p 2 1 p b. Geometrik dağılımın varyansı, E ( x 2 ) x( x 1) p (1 p ) x 1 xp (1 p ) x 1 x 1 x 1 p (1 p ) x( x 1)(1 p ) x 2 E ( x) x 1 p (1 p ) d2 (1 p)1 (1 p) ... E ( x) d (1 p ) 2 p (1 p ) d2 d (1 p ) 2 p (1 p ) 1 d 1 1 (1 p ). 2 d (1 p ) 1 (1 p ) 1 (1 p) p (1 p ) 1 (1 p ) E ( x) 1 1 2 1 p (1 p ) 2 2 (1 p ). 3 p p p p p p 2 2p 1 p (1 p ) p3 p 2(1 p ) 1 p p2 Buradan varyans, V ( x) 2(1 p) p2 (1 p) 1 1 p p 2 p2 bulunur. c. Geometrik dağılımın moment türeten fonksiyonu, M x (t ) E[e xt ] x 1 e tx p(1 p ) x 1 p (1 p ) p 1 p x e tx (1 p ) x 1 e t (1 p) x x 1 p e t (1 p) 1 e t (1 p ) ... 1 p 1 pet 1 e t (1 p ) bulunur. Geometrik Dağılımın kümülatif dağılım fonksiyonu, x F x Prx X p1 p x 1 X 1 p 1 1 p ... 1 p x 1 1 1 p p. 1 1 p x 1 1 p x bulunur. Geometrik dağılım ile binom dağılımı arasındaki ilişki, f ( x, p) 1 f ( x 1; n x; p) x olarak tanımlanır. Geometrik dağılım hafızasızlık özelliğine sahiptir. Teorem (Hafızasızlık): s t olan tamsayılar için, P X s X t P X s t İspat: Herhangi n tamsayısı için, P X n P ( n denemede başarı olmama olasılığı) 1 P n Bu durumda, P( X s ve X t) P( X t ) P X s P( X t ) P X s X t 1 P s t P X s t Hafızasızlık özelliği; t adet gözlenmiş başarısızlığa s t adet başarısızlığın eklenmesinin olasılığı, serinin başlangıcında s t adet başarısızlık oluşma olasılığı ile aynıdır. Diğer bir deyişle, başarısızlığın bir dizisinin ortaya çıkma olasılığı dizinin pozisyonuna değil uzunluğuna bağımlıdır. 4.1.5 Negatif Binom (ya da Pascal) Dağılımı Geometrik dağılımın genel şeklidir. Bir deney birbirinden bağımsız Bernoulli denemelerinden oluşmaktadır. Deneye K başarı elde edilinceye kadar devam edersek K başarının elde edilmesi için gerekli denemelerin sayısı negatif binom rasgele değişkenidir. Negatif binom dağılımında, denemelerin sayısı bir rasgele değişkendir ve başarıların sayısı sabittir; binom dağılımda başarının sayısı rasgele değişkendir ve denemelerin sayısı sabittir. Tanım: Negatif binom rasgele değişkeni; Bağımsız Bernoulli denemelerinde her bir denemede başarı olasılığı p olmak üzere K 1 başarının elde edilmesi için gereken denemelerin sayısı X rasgele değişkeni olsun. Bu takdirde X ’ e negatif binom rasgele değişkeni denir. Teorem: Bir tek denemedeki başarısızlık olasılığı q 1 p ve başarı olasılığı p olmak üzere, X rasgele değişkeninin olasılık fonksiyonu aşağıdadır: x 1 K xK f ( x) p (1 p) K 1 x K , K 1,... Negatif Binom Dağılımı İspat: K 1 başarının gerçekleşmesi için gereken denemelerin sayısı X olsun. X rasgele değişkeni K , K 1,... değerlerini alabilir. K 1 başarı veren denemelerin sayısını x 1 alalım ve x inci deneme K ’ ıncı başarıyı versin. x 1 denemedeki K 1 başarının olasılığı ve x ’ inci Denemede de başarı elde etme olasılığı aşağıdaki gibi bulunur. K ve x için sabit değerler seçip A ve B olaylarını düşünelim: A İlk x 1 deneme K 1 başarı içeriyor B x ’ inci denemede başarı var Denemeler birbirinden bağımsız kabul edildiğinden A ve B olayları da birbirinden bağımsızdır. P( B) p ´dir. O halde, f ( x) P( X x) P( A B) P( A).P( B) yazılır. Görüldüğü gibi ( x 1) K 1 ya da eşdeğer olarak x K için P( A) 0 ’ dır. x K ise binom dağılımdaki düşünceler gereğince, x 1 K xK f ( x) p (1 p) K 1 x K , K 1,.. bulunur. Sonuç olarak f (x) olasılık fonksiyonu x 1 K xK f ( x) p (1 p) K 1 dır. Bu olasılık fonksiyonuna sahip dağılıma Pascal Dağılımı da denir. K 1 ise negatif binom dağılımı geometrik dağılıma f ( x) P( X x) q x 1 p ’ ye indirgenir. Teorem: Eğer X bir negatif binom dağılımına sahip ise, a. E ( X ) k p b. V ( X ) k 1 p p2 c. M x (t ) p k e xt 1 [1 [e (1 p)]]k t İspat. a Negatif binom dağılımının beklenen değeri; E ( x) x xk ( x 1)! p k (1 p) x k ( x k )!(k 1)! p k (1 p) x k x xk ( x 1)! (1 p) x ( x k )!(k 1)! k (k 1)(k 2) (1 p) k 2 .... p k (1 p) k k (1 p) k k (k 1)(1 p) k 1 2! (k 1)(k 2) (1 p) 2 .... p k (1 p) k k (1 p) k 1 (k 1)(1 p) 2! Burada köşeli parantez içindeki ifade, f (1 p) 1 (1 p) k 1 fonksiyonunun MacLauren açılımına eşittir. f (1 p) 1 (1 p) k 1 f ' (0) 1 f (1 p) (k 1)1 (1 p) k 2 (1) f ' (0) (k 1) f (1 p) (k 1)(k 2)1 (1 p) k 3 (1) f ' (0) (k 1)(k 2) buradan, f (1 p) 1 (1 p) k 1 1 (k 1) (k 1)(k 2) (1 p) (1 p) 2 ..... 1! 2! elde edilir. Sonuç olarak, E ( x) p k k 1 (1 p)k 1 k p bulunur. b. Negatif Binom Dağılımının Varyansı E ( x 2 ) x 2 f ( x) xk xk xk x( x 1) f ( x) xf ( x) x( x 1) xk ( x 1)! p k (1 p ) x k E ( x) ( x k )!(k 1) p k (1 p) k x( x 1) xk ( x 1)! (1 p) x E ( x) ( x k )!(k 1)! E (x) için izlenen yol kullanılarak, E(x 2 ) k (k 1) 2k (1 p) k p p2 k 2 kp k p2 olarak bulunur. V ( x) k 2 kp k p2 k (1 p) k2 p2 p2 bulunur. c. Negatif binom dağılımının moment türeten fonksiyonu, M x (t ) E[e xt ] e xt xk ( x 1)! p k (1 p) x k ( x k )!(k 1)! p k (1 p) k e tx xk ( x 1)! (1 p) x ( x k )!(k 1) k k (k 1) (1 p) k 2 ... p k (1 p) k e xt (1 p) k e t ( k 1) (1 p) k 1 e t ( k 2 ) 1! 2! k (k 1) p k (1 p) k e xt (1 p) k 1 e t (1 p)k e 2t (1 p) 2 ... 2! burada köşeli parantezin içi [1 [e t (1 p)]] k fonksiyonunun MacLauren açılımı olduğundan, M x (t ) p k e xt 1 [1 [e (1 p)]]k t olarak bulunur. Bazı durumlarda negatif binom dağılımı, k ’ ıncı başarıdan önce ortaya çıkan başarısızlık sayısına göre de tanımlanabilir. Eğer Y şans değişkeni k ’ ıncı başarıdan önce ortaya çıkan başarısızlık sayısı ise, k y 1 k p (1 p) y P(Y y ) y y 0,1,.... olasılık kütle fonksiyonu, daha önce verilen ve x şans değişkeninin k ’ ıncı başarı elde edilinceye kadar gerçekleştirilen deney sayısını tanımladığı olasılık kütle fonksiyonuna denktir. Burada Y X k olarak tanılanabilir. Negatif binom dağılımı adını k k y 1 (r )(r 1)(r 2)...(r y 1) (1) y (1) y y( y 1)( y 2)...(2)(1) y y ilişkisinden almaktadır. Olasılık kütle fonksiyonu, k P(Y y ) (1) y p k (1 p) y y k p k (1 p) y y olarak tanımlanabilir. Dağılışın beklenen değer ve varyansı, k y 1 k p (1 p ) y E (Y ) y y 0 y (k y 1)! k p (1 p) y y k ( 1 )! ( 1 )! y 1 k (k y 1)! k p (1 p) y k y 1 ( y 1)!(k 1)! k y 1 k p (1 p ) y k y 1 y 1 Burada z=y-1 dönüşümü yapılarak: = bulunur. V(Y)= olarak tanımlanmıştır. Negatif binom dağılımının varyansı ortalamasının karesel bir fonksiyonudur.E(Y)=µ=k(1-p)/p alınarak V(Y)=µ+(1/k) bulunur. Negatif binom dağılımı limit durumunda Poisson dağılımına yakınsar. Eğer ise olduğundan ve Sonuçları elde edilir ki bunlar Poisson dağılımının ortalaması ve varyansıdır. Binom Dağılımı ve Negatif Binom Dağılımı Arasındaki Fark X, n ve p parametreleri ile binom dağılımına sahip olsun. Yani X, n Bernoulli denemesindeki başarı sayısıdır. Y, k ve p parametreleri negatif binom dağılımına sahip olsun. Yani Y, k başarı elde etmek için gereken Bernoulli denemelerinin sayısıdır. a) P(Y ≤ n )=P(X ≥ k) İlk n denemede k ya da daha çok başarı varsa, ilk K başarıyı elde etmek için n ya da daha az deneme gerekir. b) P(Y > n )=P(X < k) İlk n denemede K dan az başarı varsa, K başarıyı elde etmek için n den çok deneme gerekir. 4.1.6 Hipergeometrik Dağılım İçinde iki çeşit nesne bulunan sonlu sayıda öğeden oluşan bir kitle düşünelim. Tekrar yerine koymaksızın, ardışık olarak sabit büyüklükte bir örneklem seçelim. Örneklemdeki iki çeşit öğeden herhangi birinin sayısını bilmek istiyoruz. Hipergeometrik dağılım, sonlu elemanlı anakütle ile ilgilenildiğinde oldukça uygun bir modeldir. Anakütledeki eleman sayısının N olduğu ve alınan örnek hacminin n olduğu varsayılsın. Anakütlede ilgilenilen özelliğe sahip eleman sayısı ise M olsun. Alınan n hacimli örnekte x adet başarının ortaya çıkma olasılığı, hipergeometrik dağılım gösterir Tanım: Sonlu sayıda N öğeden oluşan bir kitle içinde belli bir A tipindeki öğelerin sayısı a olsun. Tekrar yerine koymaksızın rasgele çekilen ve n birimden oluşan bir örneklemdeki A tipindeki öğelerin sayısı X olsun. X rasgele hipergeometrik değişkendir. ve hipergeometrik olasılık kütle fonksiyonu; M N M X n x f ( x; N , M , n) N n x 0,1,...., n Teorem: Eğer X bir hipergeometrik dağılıma sahip ise, a. E ( X ) nM N b. V (X ) c. M X t İspat: Hipergeometrik dağılımın beklenen değer ve varyansı; M N M M N M n n x n x x n x E ( x) x N N x 0 x 1 n n ( x 0 daki değer sıfırdır) Bu ifadeyi değerlendirmek için aşağıdaki eşitlikler kullanılır. M M 1 x M x x 1 N N N 1 n n n 1 Bu durumda M 1 N M M n x n x 1 E x N 1 N x 1 n n 1 M 1 N M x 1 n x nM N 1 N x 1 n 1 n Eşitliğin en sağındaki ifade parametreleri N 1 , M 1 ve n 1 olan bir başka hipergeometrik dağılımın olasılıklarının toplamıdır. Bunu görebilmek için y x 1 tanımlanarak, ve n f ( x) 1 ( Olasılık Fonksiyonu ) n x 0 x 0 a N a N x n x n M 1 N M M 1 N M n 1 x 1 n x y n y 1 N 1 N 1 x 1 y 0 n 1 n 1 n n 1 PY y; N 1, M 1, n 1 y 0 1 Sonuç olarak, E x nM N bulunur. b. Dağılımın varyansı olduğu hatırlanarak n E( X 2 ) a N a x n x N n x.( x 1) x x 0 a N a a N a x( x 1) n x x n x x n x N N x 0 x 0 n n n a(a 1)n(n 1) na na (a 1)(n 1) ( N 1) N ( N 1) N N ( N 1) 2 E ( X 2 ) [ E ( X )] 2 na(na a n N ) n 2 a 2 N n a a n 1 2 N N ( N 1) N 1 N N elde edilir. NOT: p a / N q 1 p ( N a) / N olduğundan; E( X ) na / N np a N n a N n n 1 npq N N 1 N N 1 2 şeklinde de ifade etmek mümkündür. Hipergeometrik dağılımın moment türeten fonksiyonu yoktur. Hipergeometrik dağılımın binom dağılımına yaklaşımı: Anakütle eleman sayısı N çok büyük ise n ve p sabit kaldıkça hipergeometrik dağılım binom dağılımına yaklaşır. N M ! M! x!M x ! n x !N M n x ! f x; N , M , n N! n! N n ! N n ! M M 1....M x 1M x ! n! M x ! N N 1...N n 1N n ! x!n x ! N M N M 1...N M n x 1N M n x ! N M n x ! M ...M x 1 N M ...N M n x n! x!n x ! N ...N n 1 Burada, N için, N...N n 1 N n N M ...N M n x N M n x M ...M x 1 M x Bu durumda, M x N M f x; N , M , n Nn n x x n! x!n x ! M N M N N Burada p n x n! x!n x ! M N M ve 1 p alınarak N N f x; n, p n! n x p x 1 p x!n x ! Buda binom dağılışının olasılık kütle fonksiyonudur. 4.1.6 Poisson Dağılımı ve Süreci Belirli sürekli bir ölçekte rasgele olarak ortaya çıkan olay sayısı ile ilgileniliyor olsun. Bu tip şans değişkenleri poisson dağılımına sahiptir. Bu şans değişkenlerini türeten süreç ise poisson sürecidir. Poisson Sürecinin Varsayımları: Poisson dağılımı, poisson postulate adı verilen temel varsayımlar setinden ele edilebilir. Bu varsayımlar incelenen sürecin fiziksel özellikleri ile ilgilidir. Teorem: Her bir t 0 değeri için, N t aşağıdaki özelliklere sahip tam sayı değerli bir şans değişkeni olsun; (Burada N t , 0 ile t aralığında otaya çıkan rasgele olay sayısı olarak düşünülebilir). a. N 0 0 (Başlangıç sınırındaki olay sayısı sıfırdır) b. s t olmak üzere N s ve N t N s bağımsızdır. (Ayrık periyotlardaki olay sayıları bağımsızdır) c. N s ve N t s N t özdeş dağılmıştır. (Ortaya çıkan olay sayısı sadece periyot uzunluğuna bağlıdır) d. lim t 0 P( N t 1) (Ortaya çıkış olasılığı eğer periyot küçük ise periyot uzunluğu ile t doğru orantılıdır) e. lim t 0 P( N t 1) 0 (Olaylar eşanlı olarak oluşmazlar) t Eğer a-e varsayımları sağlanıyor ise herhangi bir n tamsayısı için, P ( N t n) e t (t ) n n! olup N t ~ Poisson (t ) ’ dir. Poisson olasılık yoğunluk fonksiyonunun elde edilmesi: Olayların h uzunluğundaki bir periyotta yaklaşık olarak homojen bir şekilde ortaya çıktığı varsayılsın. Belirlenen periyot için aşağıdaki durumlarla karşılaşılabilir: — Sadece bir olay ortaya çıkar, — Hiç olay oluşmayabilir, — Birden fazla olay ortaya çıkabilir. h periyodundaki olasılıklar P( x, h) ile belirtilsin, o(h) fonksiyonu: oh lim 0 h 0 h h 2 oh oh oh oh özelliklerini sağlayan bir fonksiyon olsun. Varsayım d için; w h olan küçük bir aralık için bir olayın ortaya çıkma olasılığı P(1, h) , aralığın uzunluğu ile h şeklinde doğru orantılıdır. Burada sabit pozitif oransal bir çarpımı ifade eder. Başka bir ifade ile P1, h h oh Varsayım e için; w h olan küçük bir aralık için iki veya daha fazla olayın ortaya çıkma olasılığı, Px, h oh x 2 Varsayım b için; Kesişmeyen aralıklardaki olay sayısı birbirinden bağımsızdır. Varsayım d ve e’ den en az bir olayın h aralığında oluşmasının olasılığı, Px 1, h h oh oh h oh bunun sonucu olarak, h aralığında hiç olay oluşmamasının olasılığı, P0, h 1 h oh olup, Varsayım b ile, periyodu h w olan bir aralıkta hiç olay oluşmamasının olasılığı P(0, h w) , w aralığında hiç olay olmama olasılığı P(0, w) ile h aralığında hiç olay olmama olasılığı P(0, h) ’nın çarpımına eşittir: P0, h w P0, w1 h oh oh P0, w h P0, w P0, w P0, w h h h 0 için limit alınarak, dP0, w P0, w dw diferansiyel denklemi elde edilir. Bu diferansiyel denklemin çözümü aşağıda verilmiştir: dP0, w dw P0, w dP0, w P0, w dw ln P0, w w c P0, w e w c bulunur. Eğer w 0 ise varsayım a ile, P(0,0) 1 olur. Bu koşul altında c 1 elde edilir. Sonuç olarak: P0, w e w . Periyodu w h olan bir aralıkta x adet olay olmasının olasılığı, P( x, w h) : w aralığında x olay olmasının olasılığı P( x, w) ile h aralığında hiç olay olmamasının olasılığı [1 h o(h)] çarpımı artı, w aralığında x 1 olay olmasının olasılığı P( x 1, w) ile h aralığında bir olay olmasının olasılığı h oh çarpımı artı, w aralığında x 2 olay olmasının olasılığı P( x 2, w) ile h aralığında iki olay olmasının olasılığı o(h) çarpımından oluşur; Px, w h Px, w1 h oh Px 1, wh oh Px 2, woh oh Px, w h Px, w Px 2, w Px, w Px 1, w h h ve h 0 için limit alınarak, dPx, w Px, w Px 1, w dw (1) türev eşitliği bulunur. Bu diferansiyel denkleminin çözümü aşağıda verilmiştir: x 1 için; dP 1, w dw dP 1, w dw P 1, w P 0, w P 1, w e w Bu ifade birinci mertebeden doğrusal bir diferansiyel denklemdir. Bu diferansiyel denklemin integral çarpanı (bkz. Appendiks), T w e dw e w P1, we w e w e w dw P1, we w w c P1, w e w w c bulunur. w 0 için P(1,0) 0 olduğundan, c 0 bulunur. Sonuç olarak: P1, w we w elde edilir. Türev eşitliğinde yerine konarak P(2, w) ve sırasıyla diğer terimler bulunur ve P x, w w x e w x 1,2,... , x Poisson olasılık fonksiyonu elde edilir. Poisson süreci ile ilişkili dağılımlar (gama, üstel ve bazı sürekli dağılışlar) ve olasılık yoğunluk fonksiyonlarının elde edilişleri ilgili dağılışların ele alındığı kısımlarda açıklanmıştır. e . x Tanım: f ( x) P( X x) x! x 0,1,2,... 0 Bu fonksiyonun olasılık kütle fonksiyonu olduğu e y fonksiyonunun Taylor serisine açılımı ile yi e i 0 i! y olduğundan, x f X x; e x! x 0 x 0 e e 1 Teorem: Eğer X bir poisson dağılımına sahip ise, a. E (X ) b. V (X ) c. M x e e 1 t x 0 x 0 İspat: a. E ( X ) x. f ( x) x.e x e . x x 1 e x! x 1 ( x 1)! x 1 ( x 1)! Burada y x 1 dönüşümü iledenklemin sağ yanındaki toplam e ’ ya eşit olur. E( X ) .e .e elde edilir. b. x 0 x 0 E ( X 2 ) x 2 f ( x ) x 2 e x x! Bu denklemde x 2 x( x 1) x özdeşliğini kullanarak, ( x( x 1) x)e x x! x0 E( X 2 ) x( x 1)e x xe x x! x! x0 x0 e x e x x 2 ( x 2)! x 1 ( x 1)! 2e x2 x2 ( x 2)! E( X ) Burada y x 2 dönüşümü ile denklemin sağ yanındaki toplam e ya eşit olur. E ( X 2 ) 2 .e .e 2 Böylece, V ( X ) E ( X 2 ) [ E ( X )]2 2 2 elde edilir. c. Poisson Dağılımının Moment Çıkaran Fonksiyonu M X (t ) E (etX ) etx x 0 e x x! (et ) x x! x 0 e e e e t e ( e 1) t olur. Poisson dağılmış bir tesadüfi değişkenle ilgili olasılıkları hesaplamak için verilecek λ değerlerine karşılık gelen e-λ ve λx sayısal değerlerine ihtiyaç vardır. İşlemleri kolaylaştırmak için verilen her λ ve x’lere göre poisson dağılımlarına karşı gelen olasılıkları veren tablolar hazırlanmıştır. Poisson dağılımı gerçekleşme olasılığı çok küçük olan olayların tekrarlı denemeleri için uygun bir dağılımdır. Öte yandan Poisson dağılımı p 0.01 n20 olduğunda binom dağılımı için iyi bir yaklaşımdır. 4.2 SÜREKLİ PARAMETRİK OLASILIK DAĞILIMLARI 4.2.1 Tekdüze Dağılım Sürekli şans değişkenleri için kullanılan en basit dağılımlardan biri tekdüze dağılımdır. Matematiksel hesaplamalara uygunluğuyla özellikle teorik istatistik için oldukça kullanışlı bir dağılımdır. Bu dağılımın diğer bir önemi istatistik kuramının çeşitli yönlerini açıklamaya, basitliği nedeniyle, çok yatkın olmasıdır. Tanım: Tek düzen dağılımın olasılık yoğunluğu şu şekildedir: 1 f ( x; a, b) b a 0 a xb d .d . Eğer bir X şans değişkeni yukarıdaki koşullara uyuyorsa sürekli tekdüze şans değişkeni adını alır. Burada a ile b reel sabitlerdir ve a b şeklindedirler. Tek düzen dağılımda a b olduğuna göre b a 0 ’ dır. O halde f (x) bir olasılık yoğunluk fonksiyonu olma koşulunu sağlar. b a 0 olduğu için f ( x) 0 ’dır. b f ( x)dx özelliği de geçerlidir. a Şekil: Tekdüzen Dağılış Teorem: Eğer X , [a, b] üzerinde tekdüzen dağılış gösteriyorsa; a. E ( X ) ab 2 (b a) 2 b. V ( X ) 12 e bt e at c. M (t ) (b a)t şeklindedir. b İspat: E ( X ) x a 1 dx ba b2 a 2 2(b a ) ab 2 V ( X ) E ( X 2 ) [ E ( X )]2 b x2 a 1 ab dx ba 2 2 b 3 a 3 ( a b) 2 3(b a) 4 (b a) 2 12 M (t ) E (etX ) b etx a 1 dx ba ebt e at (b a )t Tekdüzen dağılış adını [a, b] aralığındaki tekdüzen yoğunluğundan ve grafikteki şeklinden almaktadır. Bu dağılıma dikdörtgen biçimli dağılım da denmektedir. Tek düzen şans değişkeninin birikimli dağılış fonksiyonu şu şekildedir: F ( x) ( x a) (b a) İspat: b F ( x) xa b a dt b a t a Bu bazı rassal olgularda araştırıcı için kullanışlı olmaktadır. Örneğin; rassal bir X değişkeninin değerleri sadece [a, b] gibi bir sınırlı alan içinde dağılıyorsa; [a, b] aralığının eşit mesafeli iki alt aralığının X şans değişkenini içerme olasılıkları eşitse o zaman X , [a, b] aralığında tekdüze dağılış göstermektedir. Ya da [0,1] aralığında herhangi bir sayı ele alındığında, aslında bu aralıkta tekdüzen dağılış gösteren bir şans değişkeninden bahsedilmektedir. Tekdüzen dağılımın belirli kapalı bir [a, b] aralığında dağıldığını tanımlamıştık. Ayrıca (a, b) açık aralığı ya da (a, b] ve [a, b) yayı açık yarı kapalı aralıklarında da aynı tanımı yapmak mümkündür. Burada bilinmesi gereken her dört olasılık yoğunluğunun da aynı birikimli dağılış fonksiyonuna sahip olduğudur. 4.2.2 Normal Dağılış Birçok bakımdan istatistik kuramının temel taşı sayılan normal dağılış, ölçme hatalarının şaşılacak derecede düzenlilik göstermesini gözlemleyen bilim adamlarınca bulunmuştur. Gözlenen dağılımların, normal hata eğrileri adı verilen ve şans kurallarına bağlanan sürekli eğrilere çok yakın olduğu bulunmuştur. Bu tür normal eğrilerin matematik özellikleri ilk olarak Abraham de Moivre (1667–1745), Pierre Laplace (1749–1827) ve Karl Gauss (1777– 1855) tarafından incelenmiştir. İlk olarak; I e 1 y2 2 dy İntegralinin mevcut olup olmadığı ele alınsın. Bu integralin integrandı pozitif sürekli bir fonksiyon olduğundan ve integrali alınabilir bir fonksiyonla sınırlı olduğu, 0e 1 y2 2 için mevcuttur. e y 1 y e y 1 0 dy e dy e y 1 y 1 dy 0 0 e y 1 dy e y 1 dy 0 k 0 e. lim e dy e. lim e y dy y t k t 0 2e Standart Normal Dağılımın Olasılık Yoğunluk Fonksiyonunun Elde Edilmesi: I integrali için I 0 olup, I 2 ise; I 2 e y2 z2 2 dydz Bu integralin çözümü için kutupsal koordinatlara dönüşüm y rCos ve z rSin yapılarak; 2 I2 e 1 r2 2 .rdrd 0 0 bulunur. Burada jakobian determinantı; dy J dr dy d dz dr cos dz r sin d bulunur. İlk olarak, u sin r cos r r2 dönüşümünü yaparsak, du r.dr 2 2 e I 2 u du.d 0 0 2 e d u 0 0 2 d 0 2 ve I 2 olduğundan, 1 2 e 1 y2 2 dy 1 bulunur. Normal Dağılımın Olasılık Yoğunluk Fonksiyonu: x Eğer yeni bir değişken y 1 2 e tanımlanırsa, dy x 2 2 2 dx 1 tanımlanır. 0 için bu fonksiyon; f x 1 2 e x 2 x 2 2 normal dağılımın o.y.f. ‘ sidir. Normal Dağılımın Moment Türeten Fonksiyonu: 1 M t etx . .e 2 1 2 e tx e x 2 2 2 dx x 2 2 x 2 2 2tx 2 2 dx 1 dx olup integrali; u x dönüşümü ile, 1 e 2 2 e 2 e 2 e t tu u 2 (2 2 ) 2 1 t t 2 2 2 2 1 du 2 çarpılıp bölünürse, 2 e ( u 2 tu 2 2 t 2 4 (2 2 ) du et et 2 2 2 2 2 e ( u t 2 )2 (2 2 ) du Burada e e 2 e Elde edilen bu ifade et M (t ) du 1 t ( u ) u 2 (2 2 ) 1 2 2 e (u t 2 2 ) (2 2 ) du bir normal dağılış tanımlamaktadır ve -∞’dan ∞’a bu integralin değeri 1’dir. Sonuç olarak; M x (t ) et t 2 2 2 elde edilir. 4.2.3 Gama Dağılışı ve Fonksiyonu Gama dağılış ailesi ele alınmadan önce, y 1e y dy 0 integrali ile tanımlanan gama fonksiyonu incelenecektir. Eğer 1 ise 1 e y dy 1 0 Eğer 1 ise, y 1e y 0 1 y 2e y dy 1 2 0 Ardışık iterasyon ile; ( ) 1! bulunur. Değerlendirilmesi gereken özel durumlardan biri de 1 2 değeridir. 1 1 1 1 1 ! 2 2 1 ! 2 1 1 ! 2 2 1 12 y y e dy 2 0 Burada, y z 2 2 dönüşümü yapılarak, 1 2 1 1 z z2 2 zdz ! 0 e 2 2 2 2 1 2e z 2 dz 2 0 1 z2 2 . .e dz 2 0 2 Bu integral standart normal dağılımın yarı alanına eşit olduğundan 1 ! 2 2 bulunur. Ayrıca gerekli olan diğer bir bilgi 1 2 ’ dir. 1 1 y 2 e y dy 2 0 Burada y z 2 2 alındığında, 1 z 2 0 2 2 0 1 2 e z 2 zdz 2 2e z 2 dz 2 Burada normal dağılıştan, e z 2 dz 2 , olduğu hatırlanarak 2 0 e z 2 dz 2 2 , ve 2 sonuç olarak, 2 1 2 2 2 bulunur. Gama Dağılımı f y 1 . y 1 .e y 0 ( ) olasılık yoğunluk fonksiyonu tanımlanabilir. Bu dağılış tek parametreli gama dağılımıdır. Eğer y x şeklinde bir şans değişkeni tanımlanırsa, iki parametreli gama dağılımı elde edilir. Tanım: Bir X şans değişkeni aşağıdaki olasılık yoğunluğuna uyuyorsa (gama dağılımı) gama şans değişkeni olarak adlandırılır. 1 x 1e x / g ( x; a, b) ( ) 0 x0 d .d . Burada 0, 0 ve ( ) 0 şeklindedir. Burada ölçek, şekil parametresidir. Teorem: Gama dağılımının r ’ inci momenti şu şekildedir. r ( r ) M (t ) ( ) İspat: Gama dağılışının moment türeten fonksiyonu şu şekilde bulunmaktadır. M (t ) e tx 0 1 x 1e x / dx ( ) 1 x 1e x (1 t ) / dx ( ) M (t ) 0 y x( βt ) / β , t / β , x βy( βt ) şeklinde alınırsa aşağıdaki ifadeye ulaşılır: 1 / (1 t ) y M (t ) 1 t 0 ( ) 1 1 t 1 (1 t ) 1 ( ) y e y dy 1 y e dy 0 t 1 İspat yukarıdaki işlemlerin ışığında şu şekilde kısaca gösterilebilir: M (t ) x r 0 Burada y x 1 x 1e x / dx ( ) r r 1 y y e dy ( ) 0 alınmıştır. Gama fonksiyonun tanımı gereği sağ tarafın integrali (r ) olduğuna göre kanıt tamamlanmış olur. Bu teorem kullanılarak aşağıdaki sonuçlar çıkarılabilir. Teorem: Eğer X , ve parametreli gama dağılışı gösteriyorsa, a. E (X ) b. V ( X ) 2 c. M (t ) ( βt ) α şeklindedir. İspat: a. Dağılışın beklenen değeri, x 1 1 E( X ) xx e dx ( ) 0 Gama fonksiyonunun özelliğinden, 1 x e x dx ( ) olduğundan 0 x 1 E( X ) x e dx ( ) 0 1 ( 1) 1 ( ) ( ) ( ) . elde edilir. b. Gama dağılışının varyansı da benzer şekilde, 1 E( X ) ( ) 1 ( ) 2 1 x x .e dx 0 1 x .e x dx 0 1 ( 2) 2 ( ) ( 1) 2 ve x V ( X ) E ( X 2 ) [ E ( X )] 2 ( 2 ) 2 2 2 2 bulunur. c. Gama dağılışının moment türeten fonksiyonu ise; E (e tX ) e tx 0 x 1 1 . x e dx ( ) 1 x t 1 1 x . e dx 0 ( ) burada x y dönüşümü ile, E (e ) tX 0 0 1 1 y 1 .e y (1 t ) dy ( ) 1 y 1 .e y (1 t ) dy ( ) burada z y(1 t ) dönüşümü ile 1 1 1 z 1.e z dz 1 (1 t ) 0 ( ) (1 t ) E (e ) tX 1 1 1 z z e dz 1 t ( ) 0 1 1 t Sonuç olarak gama dağılımı için, 1 M x (t ) 1 t bulunur. 1 t İki parametreli gama dağılımı poisson dağılımının parametresine göre de ifade edilebilir.Bu amaçla 1 alınarak, f ( x) bulunur. 1 1 ( ) x 1e x ( x) 1 e x ( )