2. FREKANS DAĞILIŞLARI ve ŞANS DEĞİŞKENLERİ Pek çok deneyde, orijinal olasılık yapısı ile çalışmaktansa özel bir değişkenle ilgilenmek ve bu yeni değişkene ait olasılıkları belirleyebilmek işlemleri kolaylaştır. Örneğin bazı deney sonuçlarının tanımladığı örnek uzayları, bir çift paranın üst yüzüne gelen sembol gibi, S=(Y,Y), (T,Y), (Y,T),(T,T), sayılarla ifade edilmemektedir. Deneyde ortaya çıkan yazı sayısı ile ilgilenildiğinde yeni bir değişken tanımlanmış olur. Farklı bir örnek olarak, bir soru için doğru ya da yanlış olup olmadığı 50 kişiye sorulduğunda ve doğru cevabı 1 yanlış cevabı 0 ile kayıt altına alındığında bu deneyin örnek uzayı 250 elemandan oluşur ve her bir eleman 50 digit uzunluğunda 1 ve 0’ların farklı sıralamalarından oluşur. Bu örnek uzayı, x=1 cevabını verenlerin sayısı bir şans değişkeni ile tanımlanarak basite indirgenebilir. Bu durumda x şans değişkeni örnek uzayı {0,1,…..50} şeklinde tam sayılar kümesi olacaktır ve bu örnek uzayı ile çalışmak işlemleri daha kolaylaştıracaktır. Bu x değerinin tanımlanması ile gerçekte, orijinal örnek uzayından yeni bir örnek uzayına genellikle gerçel sayıların bir kümesine bir fonksiyon tanımlanmıştır. Bu kısımda bir S örnek uzayındaki ei elemanlarını sayılarla ifade edebilecek kuralların nasıl formülleştirileceği açıklanacaktır. Tanım (Şans Değişkeni): Örnek uzayı S olan bir şans deneyi ele alınsın. Örnek uzayındaki her bir elemanı; eS bir ve yalnız bir gerçel sayıya atayan X fonksiyonuna; X(e)=x bir şans değişkeni denir. Şans değişkeninin tanımlanması ile aynı zamanda yeni bir örnek uzayı da (şans değişkenin tanım kümesi) tanımlanmış olur. Bu nedenle orijinal örnek uzayı üzerine tanımlanan olasılık fonksiyonunun bu şans değişkeni içinde kullanılıp kullanılamayacağı kontrol edilmelidir. Şans değişkeninin uzayı gerçel sayılar kümesidir: R=x: X(e)=x, eS Her hangi bir şans değişkeninin olasılık yapısını tanımlamakta kullanılan iki temel fonksiyon: a. Olasılık yoğunluk/kütle fonksiyonu, f(x). b. Birikimli dağılım fonksiyonu, F(x). Şans değişkenleri genel olarak dört sınıfta incelenir: 1. Kesikli şans değişkenleri. 2. Sürekli şans değişkenleri. 3. Karma (mixed) şans değişkenleri. 4. Çok değişkenli şans değişkenleri. Aşağıda her bir sınıf detaylı olarak incelenmiştir. 2.1 KESİKLİ ŞANS DEĞİŞKENLERİ Bir paranın atıldığı basit şans deneyi ele alınsın. Bu deneye ait örnek uzayı S=Y,T olup örnek uzayındaki elemanları temsil eden e elemanı Y ya da T değerini alır. Bir X fonksiyonu aşağıdaki gibi tanımlansın: X(e)=0, e=T ise, X(e)=1, e=Y ise. Tanımlanan X fonksiyonu örnek uzayı S üzerine tanımlı gerçel değerli bir fonksiyon olup örnek uzayının elemanlarını bir gerçel sayı uzayına R={0,1} bire bir atamaktadır. R uzayının bir alt uzayı A olsun Bölüm 1’de S örnek uzayında tanımlanan bir C olayının olasılığı P(C) ile tanımlanmıştı. Şimdi A olayının olasılığı ile ilgilenilecek ve C olayı ile A olayının olasılıkları arasındaki ilişki kurularak, Pr(XA) ile gösterilen A olayının olasılığı belirlenmeye çalışılacaktır. İlk olarak A olayına karşılık gelecek şekilde C olayının kümesi belirlenmelidir: C={e:eS ve X(e)A}. Diğer bir deyişle S örnek uzayındaki C olayı, elemanları A alt uzayındaki X şans değişkenlerini veren elemanlardan seçilmiştir. Bu nedenle; Pr(XA)=P(A)=P(C) olmalıdır. Sonuç olarak, Pr(XA) ifadesi X şans değişkenine ait R uzayının bir alt kümesi olan A alt kümesine bir olasılık atamasıdır. P(A) fonksiyonu Bölüm 1’de verilen olasılık küme fonksiyonuna ait üç aksiyomu sağlar. Bu nedenle P(A)’da bir olasılık küme fonksiyonudur. İspat aşağıda verilmiştir: P(C) bir olasılık küme fonksiyonu olduğundan ve P(A)=P(C) eşitliği geçerli olduğundan; P(C)=P(A)0 Aksiyom 1. Eğer C kümesi yerine S kümesi alınır ise; S={e:eS ve X(e)R} ve P(S)=P(R)=1 Aksiyom 2. Son aksiyomu ispatlamak için R uzayı üzerine tanımlı iki ayrık olay A1 ve A2 ele alınsın. Burada; C={e:eS ve X(e)A1A2} ya da P(C)= P(A1A2). Bu ifade; C={e:eS ve X(e)A1}{e:eS ve X(e)A2} ya da C= C1C2 Burada C1 ve C2 ayrık kümelerdir. Çünkü eğer her iki kümeye de ait bir ei elemanı için elde edilen X(ei) değeri aynı olup A1 ve A2 kümeleri ayrık olduğundan hem X(ei)A1 hem de X(ei)A2 olamayacağı için sonuç olarak C1 ve C2 ayrık kümelerdir. Ayrık olaylar için aksiyom 3 kullanılarak; P(C)= P(C1)+P(C2). ve P(C1)=P(A1) ve P(C2)=P(A2) olduğundan sonuç olarak iki ayrık küme için, P(A1A2)=P(A1)+P(A2) Aksiyom 3 elde edilir. P(A) ve P(C) her ikisi de küme fonksiyonu olsalar da farklı kümeler üzerine tanımlandıkları için eşit küme fonksiyonları değildirler. Örnek: İki para atışı ile gerçekleştirilen bir şans denemesinin örnek uzayı; S e : T , T , Y , T , T , Y , Y , Y ele alınsın ve şans değişkeni fonksiyonu aşağıdaki gibi tanımlansın: X(e)=0, e=TT ise X(e)=1, e=YT ise X(e)=1, e=TY ise X(e)=2, e=YY ise Şans değişkeninin örnek uzayı: R x : 0,1,2 olacaktır. R kümesinin bir alt kümesi A=1 alınsın. P(A) olasılığı nasıl elde edilir? Çözüm: İlk olarak X şans değişkeninin A kümesindeki değerine sahip olan S örnek uzayındaki elemanlar ile bir C olayı tanımlanır: C1=e:TT, C2=e:YT, C3=e:TY, C4=e:YY X(e)=1 değeri için e=YT ve e=TY olduğundan: C=C2,C3= C2C3 Bu kümeye ait olasılıkların hesaplanabilmesi için S üzerine tanımlı P(.) olasılık küme fonksiyonun belirlenmesi gereklidir: e TT YT TY YY P(Ci) 1/4 1/4 1/4 1/4 P(C)=P(C2C3)= P(C2)+P(C3)=1/4+1/4=1/2 P(A)=P(x=1)=P(C)=1/2 bulunur. Sonuç olarak R üzerine tanımlı bütün ayrık Ai olayları üzerinden P(A) küme fonksiyonu da elde edilebilir: x 0 1 2 P(Ai)=Pr(X=x) 1/4 1/2 1/4 ya da 2 1 Pr X x x 2 2 xR. Tanım (Olasılık kütle (mass) fonksiyonu): X şans değişkeni bir boyutlu R uzayında tanımlı olsun. R kümesinin sayılabilir (sonlu ya da sonsuz) elemanlara sahip olduğu varsayılsın. Böyle bir R uzayı kesikli noktaların kümesi olarak adlandırılır. Bu küme üzerinde eğer bir f(x) fonksiyonu; 1. f x 0 2. xR. f x 1 R koşullarını sağlıyor ise X kesikli bir şans değişkenidir ve f(x) ise X şans değişkeninin olasılık kütle (mass) fonksiyonu olarak adlandırılır. Bir olasılık kütle fonksiyonu ile X şans değişkeninin olasılık dağılımı tam olarak belirlenebilir. Şans değişkenine ait olasılık dağılımının belirlenmesinde kullanılabilecek diğer bir fonksiyon ise F(x) birikimli dağılım fonksiyonudur. X kesikli şans değişkenine ait olasılık küme fonksiyonu P(A) olsun. A kümesi gerçel sayılar üzerinde - ile x aralığında olsun. Bu şekilde tanımlanmış tüm A kümeleri için olasılık değerleri; P(A)=Pr(xA)=Pr(Xx) şeklinde elde edilebilir. Olasılık değerlerinin x noktasına bağımlı olduğu açıktır. Diğer bir deyişle bu olasılık x noktasının bir fonksiyonudur. Bu özelliğe sahip fonksiyonlara birikimli dağılım fonksiyonu denir. Tanım (Birikimli dağılım fonksiyonu): Bir kesikli X şans değişkeninin birikimli dağılım fonksiyonu, F x Pr X x f x X x şeklinde tanımlanır. Tanım kümesi R gerçel sayılar ve görüntü kümesi =[0,1] dir. Her x kesikli şans değişkeninin kendisine ait bir birikimli dağılım fonksiyonu mevcuttur. F(x) fonksiyonu sadece kümesinde değil tüm x değerlerinde tanımlıdır. F(x) fonksiyonu kesikli şans değişkenleri için xR değerlerinde sıçramalara sahiptir. Bu sıçramaların büyüklüğü Pr(X=x) olasılık değerine eşittir. Belirli x değerlerindeki bu sıçramalarda F(x) fonksiyonu sürekli değildir. Bununla birlikte F(x) tanımlıdır çünkü sıçrama noktasında fonksiyon sıçramadaki üst değeri alır. Bu özellik sağdan süreklilik olarak bilinir. Çünkü bir noktaya sağdan yaklaşıldığında fonksiyon süreklidir. Sağdan süreklilik kümülatif dağılım fonksiyonunun tanımının bir sonucudur. Eğer F(x)=Pr(X<x) olarak tanımlansaydı, F(x) soldan sürekli olacaktı. Bir kesikli şans değişkeni için F(x) fonksiyonu kullanılarak f(x) olasılık kütle fonksiyonu belirlenebilir. Teorem: X kesikli şans değişkeninin tanımlı olduğu değerler; x1 x2 x3 olsun: f x1 F x1 f xi F xi F xi 1 i>1 için. Teorem: F(x) fonksiyonu ancak ve ancak aşağıdaki üç şart sağlandığında kesikli bir şans değişkeninin birikimli dağılım fonksiyonudur. 1. lim F x 0 ve lim F x 1 x x 2. lim F x h F x h0 F(x) sağdan sürekli bir fonksiyondur. 3. a<b için F(a)F(b) F(x) fonksiyonu azalmayan bir fonksiyonudur. Son özellik (-,b] şeklindeki bir aralık iki ayrık kümenin birleşimi olarak yazılarak ispatlanabilir: (-,b]= (-,a](a,b] Bu kümelere ait olasılıklar: F(b)=F(a)+Pr(a<xb) Aksiyom 1 ile Pr(a<xb)0 olduğundan F(a)F(b) elde edilir. Bu sonuç oldukça kullanışlı bir ilişkiyi de tanımlamaktadır: Pr(a<xb)=F(b)-F(a) 2.2 SÜREKLİ ŞANS DEĞİŞKENLERİ Aralarındaki boşluklar sayılabilen değerlerden oluşmayan, aksine belli aralıklardan ya da bu aralıkların birleşimlerinden oluşan şans değişkenleri sürekli tipteki şans değişkenleri adını almaktadır. Bu şekilde bir şans değişkeninin göreli frekans histogramı h(x) negatif olmayan bir fonksiyondur ve bunun grafiği ile x ekseni arasında kalan alan 1’e eşittir. Bu nedenle sürekli şans değişkenine ait bir dağılım söz konusu olduğunda oluşum sıklıklarının çok küçük aralıklarda incelenmesi daha uygun bir yaklaşımdır. Sonsuz adet çok küçük değerin toplanmasında integral işleminden faydalanılabilir. Örneğin uzunluğu x olan çok küçük aralıklar için [x,x+x] olasılık değerinin tahmini göreli histogram fonksiyonu kullanılarak; x x h( x)dx x integralinden elde edilebilir. Bu yaklaşımda oluşum sıklıklarının aralığın uzunluğu ile orantılı olduğu ve oransal çarpanın ise x ve dolayısı ile h(x) fonksiyonuna bağımlı olduğu varsayılmıştır. Yaklaşımda ortaya çıkan hata aralık uzunluğu x değeri küçültülerek azaltılır. Sonuç olarak histogramdaki sınıf sayısı n sınırsız bir şekilde artarken ve sınıf aralıklarının uzunlukları sıfıra doğru düşerken h(x) fonksiyonunun limitinin ne olacağı önemli bir konudur. Bu durumda h(x) adım fonksiyonunun sınırlarının gittikçe düzgünleşen bir fonksiyon olması beklenir. Yeni fonksiyon f(x) ile temsil edilsin. Bu koşul X şans değişkeninin dağılımına uygulandığında: Prx X x x f x x Bu eşitlikteki tam olasılık f(x) eğrisinin altında kalan alandır. Yaklaşık olarak hesaplanan alan (olasılık) ise h(x) yüksekliğinin x uzunluğunun çarpımıdır. Sonuç olarak sürekli bir X şans değişkeni için f(x) çok küçük aralıklara ait olasılıkların belirlenmesinde kullanılsa da doğrudan doğruya bir olasılık değeri değildir. Şans değişkeni için olasılık yoğunluğunu atayan bir fonksiyondur. Tanım (Olasılık yoğunluk fonksiyonu):Tanım uzayı R bir aralık ya daralıkların birleşiminden oluşan şans değişkeni X olsun. Bir f(x) fonksiyonu 1. f x 0 2. xR. f x dx 1 R koşullarını sağlıyor ise X sürekli bir şans değişkenidir ve f(x) ise X şans değişkeninin olasılık yoğunluk fonksiyonu olarak adlandırılır. Burada görülmektedir ki f(x) fonksiyonu da x ekseni ile grafiği arasındaki alan 1’e eşit olan bir pozitif fonksiyondur. Sürekli bir şans değişkeni için, AR olmak üzere, bir olasılık küme fonksiyonu P(A), olasılık yoğunluk fonksiyonuna göre, P A Prx A f x dx A ifade edilebilir. Eğer f(x) sürekli bir X şans değişkeninin olasılık yoğunluk fonksiyonu ise ve tanım uzayı üzerine belirlenen bir küme A={x:a<X<b} ise P(A)=Pr(xA) ifadesi; b Pra X b f x dx a olarak yazılabilir. Pr(a<X<b) olasılığı; f(x)’in grafiği, x ekseni, x=a ve x=b ile sınırlanmış alandır. Eğer A kümesi tek bir noktadan oluşuyor ise ; a P A Prx A Pr X a f x dx 0 a Nokta olasılığın sıfır olması nedeni ile; Pra X b Pra X b Pra X b Pra X b eşitlikleri geçerlidir. Sürekli şans değişkenlerinin bu özelliğine dayanarak eğer iki olasılık yoğunluk fonksiyonu sadece sıfır olasılığa sahip sonlu elemanlı bir küme için farklılık gösteriyor ise bu iki olasılık küme fonksiyonunun tamamen aynı olduğu söylenebilir. Kesikli şans değişkenleri bu özelliğe sahip değildir. Matematik bakış açısıyla sonlu pozitif bir integrale (ya da toplama) sahip olan negatif olmayan herhangi bir fonksiyon bir olasılık yoğunluk (ya da olasılık kütle) fonksiyonuna dönüştürülebilir. Örneğin eğer h(x) bir A kümesi üzerinde pozitif ve diğer durumlarda sıfır değerini alan herhangi bir negatif olmayan fonksiyon ise ve hx dx K A ise f x 1 h x K fonksiyonu A kümesindeki değerleri alan bir X şans değişkeninin olasılık yoğunluk fonksiyonudur. Sürekli şans değişkenlerinin daha iyi anlaşılabilmesi için aşağıdaki örneğin incelenmesi faydalı olacaktır. Yarıçapı 1 birim ve merkezi iki boyutlu uzayın başlangıç noktası olan bir dairenin iç bölgesinden bir noktanın seçilmesi şans deneyini oluştursun. Bu uzay S ile belirtilsin. Dairenin alanı r2 eşitliğinden olarak belirlenir. Rassal seçimin sonucunda noktanın S üzerinde tanımlanan bir C kümesinden gelmesinin olasılığı, CS koşulu ile; PC C kümesinin alanı İlk olarak P(C)0 ve P(S)=1 olduğu görülebilir. Eğer C1 kümesi S kümesinin birinci bölgesini tanımlayan bir alt küme ise P(C1)=1/4. Eğer C2 yarıçapı 1/3 olan ve C2S koşulunu sağlayan bir daire ise P(C2)=1/9. Analitik geometriden bilindiği üzere bir noktanın, bir doğrunun ya da bir eğrinin alanı sıfırdır. Bu nedenle bunlara ait olasılıklar da sıfır olacaktır. Örneğin C3 kümesi C2 ile tanımlanan dairenin sınırlarını (çemberini) tanımlıyor ise P(C1)=0. Bu rassal deneye ait şans değişkeni orijinden seçilen bir noktaya olan uzaklık olsun. Şans değişkeninin uzayı; R=x:0x1. Her hangi bir xR için Pr(X=x)=0 olacaktır. Çünkü X=x olayı daire üzerinde rassal olarak seçilen bir noktaya karşılık gelen olayı tanımlamaktadır. Diğer bir deyişle orijine uzaklığı (yarıçapı) x olan bir çemberi tanımlamaktadır ki buna karşılık gelen alan sıfırdır. Bununla birlikte Xx ile tanımlanan bir olay için olasılık araştırılabilir. Bu olayın olasılığı, xR koşulu ile, Pr(Xx): Pr X x x yarçaplı dairenin alanı Bu olasılık X şans değişkenin birikimli dağılım fonksiyonuna karşılık gelmektedir ve F x Pr X x x 2 0x1 ya da, 0 F x x 2 1 x0 0 x 1 1 x şeklinde tanımlanabilir. Sürekli şans değişkenlerinde nokta olasılığı sıfır olduğu için, F ve f fonksiyonlarını ilişkilendiren bir integral yaklaşımının kullanılması daha uygun olacaktır. Tanım (Birikimli dağılım fonksiyonu): Eğer X sürekli bir şans değişkeni ve f(x) onun olasılık yoğunluk fonksiyonu ise; F x Pr X x x f t dt Eşitliği ile tanımlanan F(x) fonksiyonu X şans değişkeninin birikimli dağılım fonksiyonu olarak adlandırılır. Teorem: Eğer F(x) ve f(x) fonksiyonları X şans değişkenin birikimli dağılım ve olasılık yoğunluk fonksiyonları ise her hangi ab şeklinde tanımlanan iki gerçel değer için; Pra x b F b F b . Teorem: Eğer F(x) ve f(x) fonksiyonları X sürekli şans değişkenin birikimli dağılım ve olasılık yoğunluk fonksiyonları ise: f x dF x . dx Eğer X sürekli tipte bir şans değişkeni ise olasılık yoğunluk fonksiyonu f(x) her sonlu aralıkta en fazla sonlu sayıda süreksizliğe sahip olabilir. Diğer bir ifade ile süreksiz olduğu nokta sayısı sonsuz olamaz. Buradan; a. F(x) dağılım fonksiyonunun her yerde sürekli olduğu, b. f(x) fonksiyonunun sürekli olduğu her noktada F(x) fonksiyonunun X şans değişkenine göre türevinin var olduğu ve bu türevin f(x) fonksiyonuna eşit olduğu sonucu çıkarılabilir. Tanım (Sürekli şans değişkeni için birikimli dağılım fonksiyonu): Bir şans değişkeni X eğer F(x), şans değişkeni değerlerinin sürekli bir fonksiyonu ise sürekli şans değişkenidir. Tanım: F(x) fonksiyonu bir X şans değişkeninin olasılık dağılımını tamamen belirler. Bu tanım, (a,b), [a,b),(a,b] ve [a,b] şeklindeki tüm gerçel sayı aralıklarını içeren en küçük sigma cebiri β ile gösterilirse, eğer Pr(xA) olasılığı sadece β’ deki A olayları için geçerli ise doğrudur. Eğer olasılıklar olayların daha büyük bir sınıfı için tanımlanmış ise iki şans değişkeninin aynı dağılım fonksiyonuna sahip olsalar bile her olay için aynı olasılık değerine sahip olmamaları mümkündür. Tanım: Şans değişkenleri X ve Y, AR’ deki her küme için, eğer Pr(xA)= Pr(yA) ise özdeş dağılmışlardır. İki şans değişkeninin özdeş dağılması onların eşit olduğu anlamına gelmez diğer bir deyişle yukarıdaki tanım X=Y olduğunu söylemez Bir olasılık küme fonksiyonu P(.) kullanılarak dağılım fonksiyonu F(x) belirlenebilir. Çok kolay olmasa da bir dağılım fonksiyonu F(x) kullanılarak bir olasılık küme fonksiyonu P(.) bulunabilir. Sonuç olarak P(.) ve F(x) fonksiyonlarının olasılık dağılımı ile ilgili aynı bilgiyi verdikleri söylenebilir. 2.3 SÜREKLİ ŞANS DEĞİŞKENLERİ Bir şans değişkeni dağılımının tamamen sürekli ya da kesikli olarak tanımlanamadığı durumlarla da karşılaşmak mümkündür. Bu özelliğe sahip şans değişkenlerinin dağılım fonksiyonları tamamen adım fonksiyon ya da tamamen sürekli olmayıp karma bir yapı sergilerler. Eğer bir X şans değişkeninin dağılım fonksiyonu; F(x)=aFk(x)+(1-a)Fs(x) yapısında ise bu şans değişkeninin karma tipte bir şans değişkenidir. Burada 0<a<1 olup Fk(x) ve Fs(x) sırası ile kesikli ve sürekli yapıların dağılım fonksiyonlarıdır. Tanım: Kısmi kesikli ve kısmi mutlak sürekli olarak tanımlanan bir kümülatif dağılım fonksiyonuna ait yoğunluk fonksiyonu eğer kümülatif dağılım: F(x)=aFk(x)+(1-a)Fs(x) ise f(x)=afk(x)+(1-a)fs(x) şeklindedir. Burada fk(x), Fk(x)’nin kesikli olasılık kütle fonksiyonu, fs(x) ise Fs(x)’nin olasılık yoğunluk fonksiyonudur. Örnek: Bir sürücü trafik ışıklarında beklemeden geçme ve bekleme süreleri için model oluşturmak istemektedir. Işıktan beklemeden geçme olasılığı Pr(X=0)=0.4 olarak belirlenmiştir. Işıkta bekleme süresi ise üstel dağılıma uymaktadır. Bu durumda; Fk(x)=1,Fs(x)=1-ex ve a=0.4 alınarak, F(x)=0.4+0.6(1-ex) model belirlenir. Sürücünün 5 dakikadan az beklemesinin olasılığı: Pr(X<0.5)=0.4+0.6(1-e0.5)=0.636 bulunur. 2.4 ÇOK DEĞİŞKENLİ ŞANS DEĞİŞKENLERİ Bazı şans deneyi sonuçlarında çıktı üzerinde birden fazla özellik ile ilgilenilebilir. Bu gibi durumlarda ortaya çıkan şans değişkeni modellerine çok değişkenli dağılımlar adı verilir. En basit çok değişkenli model iki şans değişkenini içerir. Örneğin üç adet para atıldığında ilk iki atışta gelen yazı sayısı bir değişkeni tüm üç atışta gelen yazı sayısı ikinci değişkeni tanımlasın. Bu deneyin örnek uzayı: S={e:e1=TTT, e2=TTY, e3=TYT, e4=YTT, e5=TYY, e6=YTY, e7=YYT, e8=YYY} Bu örnek uzayı üzerine tanımlanmış iki şans değişkeni X1 ve X2: X1(e1)=0 X2(e1)=0 X1(e2)=0 X2(e2)=1 X1(e3)=1 X2(e3)=1 X1(e4)=1 X2(e4)=1 X1(e5)=1 X2(e5)=2 X1(e6)=1 X2(e6)=2 X1(e7)=2 X2(e7)=2 X1(e8)=2 X2(e8)=3 olsun. Şans değişkeni fonksiyonları S örnek uzayındaki her bir elemanı gerçel değerli sıralı sayı ikilileri uzayına; R={(x1,x2):(0,0),(0,1),(1,1),(1,2),(2,2),(2,3)} götürmektedir. Diğer bir deyişle bu şans değişkenlerinin uzayı iki boyutlu bir gerçel kümedir. Tanım: Örnek uzayı S olan bir şans deneyi ele alınsın S uzayının her bir ei elemanını bir ve yalnız bir sıralı sayı çiftine, X1(ei)=x1, X2(ei)= x2, atayan şans değişkenleri X1 ve X2 olsun. X1 ve X2 şans değişkenlerinin uzayı sıralı sayı ikililerinin kümesidir: R={(x1,x2): X1(ei)=x1, X2(ei)= x2, eiS} Amaç R uzayı üzerine tanımlanmış bir A olayının Pr[(x1,x2)A] ile ifade edilen olasılığının, S örnek uzayında ona karşılık gelen bir C olayının, C={e: eiS ve [X1(ei), X2(ei)]A} olasılığını kullanarak, Pr[(x1,x2)A]=P(C) belirleyebilmektir. Burada P(.), S örnek uzayı üzerine tanımlı bir olasılık küme fonksiyonudur. Pr[(x1,x2)A] ifadesinin bu olasılık küme fonksiyonu ile gösterimi: Pr[(x1,x2)A]=P(A). Bu sonucun belirlenebilmesi için S örnek uzayı üzerine tanımlı P fonksiyonunun belirlenmesi gerektiği açıktır. Konuyu açıklamak amacıyla örneğe geri dönüp R kümesi üzerinde bir A olayı; A={(x1,x2):(1,1),(1,2)} tanımlansın. P(A) değerinin bulunabilmesi için A kümesindeki (x1,x2) elemanlarına karşılık gelen S örnek uzayındaki C kümesinin elemanları belirlenmelidir: X1(e3)=1 X2(e3)=1 X1(e5)=1 X2(e5)=2 X1(e4)=1 X2(e4)=1 X1(e6)=1 X2(e6)=2 Burada; P(A)=Pr[(x1,x2)A]=P(C) koşulunu sağlayan C kümesi, C={e: e3,e4,e5,e6} belirlenmiştir. Olasılık küme fonksiyonu P(.)’nin belirlenmesi için paranın hilesiz olduğu varsayımı ile P(Y)=P(T)=1/2 ve denemelerin birbirinden bağımsız olduğu varsayımı ile; P({e1})=Pr[TTT]=1/8 Sonuç olarak; ei TTT TTY TYT YTT TYY YTY YYT YYY P({ei}) 1/8 1/8 1/8 1/8 1/8 1/8 1/8 1/8 (x1,x2) (0,0) (0,1) (1,1) (1,2) (2,2) (2,3) Pr[(x1,x2)] 1/8 1/8 2/8 2/8 1/8 1/8 ve P(A)=1/2 elde edilir. Tanım (Ortak olasılık kütle fonksiyonu): Eğer X ve Y tanım uzayı R olan iki kesikli şans değişkeni ise tanım aralığındaki tüm (x,y) sıralı ikilileri için ancak ve ancak, 1. f(x,y)0 2. (x,y)R. f x, y 1 x y koşullarını sağlıyor ise f(x,y)= Pr[X=x,Y=y] fonksiyonu X ve Y kesikli şans değişkenlerinin ortak olasılık kütle fonksiyonudur. Tanım (Ortak birikimli dağılım fonksiyonu): Eğer X ve Y tanım uzayı R olan iki kesikli şans değişkeni ise ve f(s,t) kesikli şans değişkenlerinin ortak olasılık kütle fonksiyonu ise F x, y PrX x, Y y f s, t s x t y fonksiyonu X ve Y kesikli şans değişkenlerinin ortak birikimli dağılım fonksiyonudur. Yukarıda kesikli şans değişkenleri için verilen fonksiyon tanımları tek değişkenli durumda açıklanan bazı küçük farklılıklar dikkate alınarak sürekli şans değişkenleri için de verilebilir. Tanım (Ortak olasılık yoğunluk fonksiyonu): Eğer X ve Y tanım uzayı R olan iki sürekli şans değişkeni ise tanım aralığındaki tüm (x,y) sıralı ikilileri için ancak ve ancak, 1. f(x,y)0 2. (x,y)R. f x, y dxdy 1 R koşullarını sağlıyor ise f(x,y) fonksiyonu X ve Y sürekli şans değişkenlerinin ortak olasılık yoğunluk fonksiyonudur. Sürekli şans değişkenleri X ve Y için bir olasılık küme fonksiyonu P(A) olsun. Eğer A alt kümesi; A={(u,v):ux,vy} yapısında sınırsız bir küme ise araştırılan olasılık değeri, P(A)=Pr [(x,y)A]=Pr[Xx,Yy] ile tanımlanabilir. Bu olasılık değeri (x,y) noktasının bir fonksiyonu olup bu fonksiyon X ve Y sürekli şans değişkenlerinin ortak birikimli dağılım fonksiyonudur. Tanım (Ortak birikimli dağılım fonksiyonu): Eğer X ve Y tanım uzayı R olan iki sürekli şans değişkeni ise ve f(s,t) sürekli şans değişkenlerinin ortak olasılık yoğunluk fonksiyonu ise F x, y PrX x, Y y x y f s, t dsdt fonksiyonu X ve Y sürekli şans değişkenlerinin ortak birikimli dağılım fonksiyonudur. Eğer A alt kümesi; A={(x,y):aXb,cYd} ise araştırılan olasılık değeri ortak olasılık yoğunluk fonksiyonu kullanılarak: b d P A Pra X b, c Y d f x, y dxdy a c bulunabilir. R uzayı üzerinde tanımlı bir A kümesinin olasılığı f(x,y) fonksiyonu ile bulunabileceği gibi F(x,y) fonksiyonu ile de hesaplanabilir. Eğer P(A)= Pr[a<X<b;c<Y<d] ise Pr[a<X<b;c<Y<d]=F(b,d)-F(b,c)-F(a,d)+F(a,c). İki değişkenli sürekli dağılımlarda yoğunluk ve dağılım fonksiyonları arasındaki ilişki: f x, y 2 F x, y xy ile tanımlanmıştır. İki şans değişkenli durum için elde edilen sonuçlar n adet şans değişkenli durum için genellenebilir. Şans değişkenlerinin kesikli olması durumunda ortak olasılık kütle fonksiyonu; f x1 ,, xn PrX 1 x1 ,, X n xn ve ortak birikimli dağılım fonksiyonu; F x1 ,, xn PrX 1 x1 ,, X n xn olup sürekli şans değişkenleri için ise ortak birikimli dağılım fonksiyonu; x1 xn F x1 ,, xn f t1 ,, t n dt1 dt n ve ortak olasılık yoğunluk fonksiyonu; f x1 ,, xn n F x1 ,, xn . x1 xn 2.5 MARJİNAL DAĞILIMLAR Marjinal dağılımlar birden fazla şans değişkenine sahip olasılık dağılımları için söz konusudur. X ve Y şans değişkenlerinin ortak olasılık kütle/yoğunluk fonksiyonu f(x,y) olsun. Tanımlanan iki değişkenli dağılımda A={x:a<x<b} olayı ile ilgilenilsin. Bu olay ancak ve ancak B={(x,y):a<x<b;-<y<} olayı oluştuğunda gerçekleşebilir. Gerçekte bu iki olay birbirine denktir ve aynı olasılığa sahiptirler. B olayının olasılığı, sürekli değişkenler için; b Pra x b; y f x, y dydx a ve kesikli değişkenler için; b a Pra x b; y f x, y eşitliklerinden elde edilir. İşlem iki aşamalıdır. İlk aşamada y değişkeni integral ya da toplama işlemi ile elimine edilir: g x f x, y dy ya da g x f x, y y Sadece x değişkenine bağlı olarak elde edilen g(x) fonksiyonu marjinal olasılık kütle/yoğunluk fonksiyonu olarak adlandırılır. A olayı için araştırılan olasılık marjinal olasılık fonksiyonu kullanılarak b b a a Pra x b g x dx ya da Pra x b g x hesaplanır. f(x,y) iki değişkenli dağılımda değişkenlerden sadece birinin davranışı ile ilgilenildiğinde, marjinal dağılıma gereksinim vardır. Tanım (Kesikli marjinal dağılımlar): X ve Y kesikli şans değişkenleri, f(x,y)’de bunların ortak olasılık kütle fonksiyonu ise X şans değişkeninin tanım aralığındaki her x için, g x f x, y y ile gösterilen fonksiyona X’in marjinal dağılımı h y f x, y x fonksiyonuna ise Y’nin marjinal dağılımı denir Tanım (Sürekli marjinal dağılımlar): X ve Y sürekli şans değişkenleri, f(x,y)’de bunların ortak olasılık yoğunluk fonksiyonu ise X şans değişkeninin tanım aralığındaki her x için, g x f x, y dy ile gösterilen fonksiyona X’in marjinal dağılımı h y f x, y dx fonksiyonuna ise Y’nin marjinal dağılımı denir Marjinal dağılımların bilinmesi durumunda kümülatif marjinal dağılımlar elde edilebilir. Kesikli X şans değişkeni için, F x f x, y g x x y x F x, Sürekli X şans değişkeni için, F x x f s, t dtds x g s ds F x, . 2.6 KOŞULLU DAĞILIMLAR İlk bölümde koşullu olasılık kavramı bir örnek uzayı üzerinde tanımlı olaylar üzerinden açıklanmıştı. Bu kavram şans değişkenleri ve onlara ait olasılık fonksiyonları ile genişletilebilir. f(x,y) iki değişkenli dağılış olsun. Y şans değişkeninin bilinen değerleri için X şans değişeninin yoğunluğu ile ilgilenilsin. Bu yoğunluk f(x/y) ile temsil edilir. Tüfekle yapılan atışta Y değişkeninin gözlendiğini fakat X değişkeninin elde edilemediği varsayılsın. Elde edilen Y değerine karşın X şans değişkeninin a<X<b aralığında olma olasılığı Pr[a<X<b/Y=y] olup bu olasılık kesikli şans değişkenleri için, b Pra X b / Y y f x / y a Sürekli şans değişkenleri için, b Pra X b / Y y f x / y dx a şeklinde hesaplanır. Tanım (Kesikli/Sürekli şans değişkenleri için koşullu dağılım):Kesikli şans değişkenleri X ile Y’nin ortak olasılık kütle/yoğunluk fonksiyonu f(x,y) ve Y şans değişkeninin marjinal dağılımı h(y) ise, verilen Y=y için X şans değişkeninin koşullu dağılımı: f x / y f x, y h y h(y) 0 X şans değişkeninin marjinal dağılımı g(x) ise verilen X=x için Y şans değişkeninin koşullu dağılımı: f y / x f x, y g x g(x) 0 İkiden daha fazla şans değişkeninin tanımladığı ortak dağılımlarla çalışıldığında, ister kesikli isterse sürekli olsun, farklı yapıda koşullu dağılışlar ile karşılaşılabilir. Örneğin f(x1,x2,x3,x4) ortak olasılık kütle/yoğunluk fonksiyonu olsun. Verilen bir X1=x1,X2=x2 ve X3=x3 için X4 değişkeninin koşullu dağılımı: f x4 / x1 , x2 , x3 f x1 , x2 , x3 , x4 . g x1 , x2 , x3 Benzer bir yaklaşımla ortak koşullu dağılımlarda tanımlanabilir. Örneğin verilen bir X1=x1 ve X2=x2 için X3 ve X4 şans değişkenlerinin koşullu ortak dağılımı: f x3 , x4 / x1 , x2 f x1 , x2 , x3 , x4 . g x1 , x2 Örnek: X1 ve X2 sürekli şans değişkenleri olsun. f(x1,x2) ortak olasılık yoğunluk fonksiyonu ve g(x1) ise marjinal olasılık yoğunluk fonksiyonu ise f(x2/x1) koşullu fonksiyonunun sürekli bir şans değişkenine ait olasılık yoğunluk fonksiyonu olduğunu gösteriniz. Çözüm: 1) f(x1,x2)0 ve g(x1)0 olduğundan. f x2 / x1 2) f x 2 f x1 , x2 0. g x1 / x1 dx2 f x1 , x2 1 dx2 f x1 , x2 dx2 g x1 g x1 g x1 g x1 =1. 2.7 BAĞIMSIZ ŞANS DEĞİŞKENLERİ Eğer şartlı olasılık f(x/y), Y şans değişkenini içermiyorsa, olasılıksal anlamda, X şans değişkeni Y şans değişkeninden bağımsızdır. Ortak olasılık yoğunluk/kütle fonksiyonları f(x,y) ve marjinal olasılık yoğunluk/kütle fonksiyonları g(x) ve h(y) olan (kesikli ya da sürekli) şans değişkenleri X ve Y olsun. Koşullu dağılışın özelliği kullanılarak, f(x,y)= f(x/y) h(y) yazılabilir. Burada f(x/y) fonksiyonu Y değişkenine bağımlı değilse X şans değişkeninin marjinal olasılık yoğunluk/kütle fonksiyonu (sürekli şans değişkeni için): f x, y dy f x / y h y dy g x f x / y h y dy g x f x / y elde edilir. Bu sonuç kullanılarak, f(x/y) fonksiyonu Y değişkenine bağımlı olmadığında, f(x,y)= g(x) h(y) yazılabilir. Diğer bir deyişle verilen bir Y=y değeri için X şans değişkenin koşullu dağılımı Y ile ilgili her hangi bir varsayımdan bağımsız ise f(x,y)= g(x) h(y) yazılabilir. Tanım (Bağımsız şans değişkenleri): X ve Y şans değişkenleri ancak ve ancak f(x,y)= g(x) h(y) koşulu sağlanıyor ise birbirinden bağımsızdır. Bağımsız değiller ise bağımlıdırlar. Teorem: Marjinal olasılık kütle/yoğunluk fonksiyonları g(x) ve h(y) olan birbirinden bağımsız iki şans değişkeni X ve Y olsun. a, b, c, d sabitler olmak üzere her a<b ve c<d için: Pr[a<X<b; c<Y<d]=Pr[a<X<b]Pr[c<Y<d]. İspat: X ve Y birbirinden bağımsız olduğu için, sürekli şans değişkenleri için; b d b d a c a c Pr[a X b, c Y d ] f x, y ,dxdy g x h y dxdy b d g x dx h y dy a c =Pr[a<X<b]Pr[c<Y<d]. Teorem: Ortak olasılık yoğunluk/kütle fonksiyonları f(x,y) ve marjinal olasılık yoğunluk/kütle fonksiyonları g(x) ve h(y) olan (kesikli ya da sürekli) şans değişkenleri X ve Y olsun. X ve Y ancak ve ancak a.f(x,y) fonksiyonu, sadece X değişkeninin bir fonksiyonu olan ve negatif olmayan bir fonksiyon ile sadece Y değişkeninin bir fonksiyonu olan ve yine negatif olmayan bir fonksiyonun çarpımı olarak; f(x,y)=u(x)v(y) yazılabiliyor ise, b. X için tanım kümesi A ve Y için tanım kümesi B olmak koşulu ile iki değişkenli dağılımın tanım kümesi R={(x,y): f(x,y)>0}; R=AB bir Kartezyen çarpımdan elde edilmiş ise birbirinden bağımsızdır. İspat a: X ve Y birbirinden bağımsız ise marjinal olasılık fonksiyonları kullanılarak, f(x,y)= g(x)h(y) yazılabilir. Marjinal olasılık kütle/yoğunluk fonksiyonu oldukları için negatif olmayan fonksiyonlardır bu nedenle koşul sağlanır. Buna karşın f(x,y)=u(x)v(y) yazılabiliyor ise: g x ux v y dy ux v y dy c1ux h y ux v y dx v y ux dx c2 v y burada c1 ve c2 sabitlerdir. Olasılık yoğunluk fonksiyonu tanımından: f x, y dxdy uxv y dxdy 1 ux dx v y dy 1 c1c2 olmalıdır. Sonuç olarak: f(x,y)= g(x)h(y)= u(x)v(y). İki şans değişkeni için elde edilen sonuçlar n adet şans değişkeni için genellenebilir. Teorem: X1,…,Xn şans değişkenleri ancak ve ancak aşağıdaki özellikler sağlanıyor ise F(x1,…,xn)=F(x1)…F(xn) f(x1,…,xn)=f(x1)…f(xn) birbirinden bağımsızdır.