2. FREKANS DAĞILIŞLARI ve ŞANS DEĞİŞKENLERİ Pek çok deneyde, orijinal olasılık yapısı (kümeler ya da olaylar) ile çalışmaktansa özel bir değişkenle ilgilenmek ve bu yeni değişkene ait olasılıkları belirleyebilmek işlemleri kolaylaştır. Örneğin bazı deney sonuçlarının tanımladığı örnek uzayları, bir çift paranın üst yüzüne gelen sembol gibi, S=(Y,Y), (T,Y), (Y,T),(T,T), sayılarla ifade edilmemektedir. Deneyde ortaya çıkan yazı sayısı ile ilgilenildiğinde yeni bir değişken tanımlanmış olur. Farklı bir örnek olarak, bir soru için doğru ya da yanlış olup olmadığı 50 kişiye sorulduğunda ve doğru cevabı 1 yanlış cevabı 0 ile kayıt altına alındığında bu deneyin örnek uzayı 2 50 elemandan oluşur ve her bir eleman 50 digit uzunluğunda 1 ve 0‟ların farklı sıralamalarından oluşur. Bu örnek uzayı, doğru cevabını verenlerin sayısı şeklinde bir şans değişkeni ile tanımlanarak basite indirgenebilir. Bu durumda X şans değişkeni örnek uzayı {0,1,…..50} aralığında tam sayılar kümesi olacaktır ve bu örnek uzayı ile çalışmak işlemleri daha kolaylaştıracaktır. Bu X değerinin tanımlanması ile gerçekte, orijinal örnek uzayından yeni bir örnek uzayına genellikle gerçel sayıların bir kümesine bir fonksiyon tanımlanmıştır. Bu kısımda bir S örnek uzayındaki ei elemanlarını sayılarla ifade edebilecek kuralların nasıl formülleştirileceği açıklanacaktır. Sonucunda rassal sayılar üreten birçok rassal deney mevcuttur. Örneğin; üç çocuklu ailelerdeki kız çocuğu sayısı, bir paranın 10 kere atılmasıyla ortaya çıkan tura sayısı gibi. Rassal bir deneyin sonucu bir sayı olduğunda, ilgilenilen bazı özelliklerin ölçümlenmesine olanak sağlar: 1. Ortalama değerin hesaplanabilmesi (bir paranın 10 kez atılma deneyinin tekrarlanmasıyla ortaya çıkan ortalama tura sayısı), 2. Deneyin çıktılarından kaçının ortalama değerden saptığının belirlenmesi, 3. Farklı rassal değişkenler arasındaki ilişkinin belirlenebilmesi (babaların hormon seviyeleri ile kız çocukları sayısı arasındaki ilişki gibi), Bu liste daha da genişletilebilir. “Ölçümlenen kümeler nedir?” sorusu akla gelebilir. Çünkü birçok farklı örnek uzayı mevcuttur. Bununla birlikte, S = {yazı, tura} S = {aynı, farklı} S = {Fenerbahçe kazanır, Galatasaray kazanır} Şeklinde tanımlanmış tüm bu farklı denemelere ait örnek uzayları kısaca rakamlarla ifade edilebilir: S = {0, 1} Rassal değişkenleri tanımlamanın iki temel amacı vardır. Bunlar: 1. Birbirinden farklı örnek uzaylarını aynı terimlerle ifade etmek. Örneğin: S = {0, 1}, P(1) = p ve P(0) = 1- p iki mümkün sonucu olan tüm deneyleri tanımlamaktadır. 2. Ortalamaları, varyansları, ilişkileri vb için genel kurallar geliştirilmek istenen ve rassal sayılar üreten rassal deneylere isim vermek. Tanım (Şans Değişkeni): Örnek uzayı S olan bir şans deneyi ele alınsın. Örnek uzayındaki her bir elemanı; eS bir ve yalnız bir gerçel sayıya atayan X fonksiyonuna; X(e)=x bir şans değişkeni denir. Genellikle, X : ei ile tanımlanır. Rassal değişkenler için büyük harfler kullanılırken (örn: X), rassal değişkenlerin aldıkları değerler küçük harflerle gösterilir (örn: x). Şans değişkeninin tanımlanması ile aynı zamanda yeni bir örnek uzayı da (şans değişkenin tanım kümesi) tanımlanmış olur. Bu nedenle orijinal örnek uzayı üzerine tanımlanan olasılık fonksiyonunun bu şans değişkeni içinde kullanılıp kullanılamayacağı kontrol edilmelidir. Şans değişkeninin uzayı gerçel sayılar kümesidir: R=x: X(e)=x, eS Her hangi bir şans değişkeninin olasılık yapısını tanımlamakta kullanılan iki temel fonksiyon: a. Olasılık yoğunluk/kütle fonksiyonu, f(x). b. Birikimli dağılım fonksiyonu, F(x). Şans değişkenleri genel olarak dört sınıfta incelenir: 1. Kesikli şans değişkenleri. 2. Sürekli şans değişkenleri. 3. Karma (mixed) şans değişkenleri. 4. Çok değişkenli şans değişkenleri. Aşağıda her bir sınıf detaylı olarak incelenmiştir. 2.1 KESİKLİ ŞANS DEĞİŞKENLERİ Bir paranın atıldığı basit şans deneyi ele alınsın. Bu deneye ait örnek uzayı S=Y,T olup örnek uzayındaki elemanları temsil eden e elemanı Y ya da T değerini alır. Bir X fonksiyonu aşağıdaki gibi tanımlansın: X(e)=0, e=T ise, X(e)=1, e=Y ise. Tanımlanan X fonksiyonu örnek uzayı S üzerine tanımlı gerçel değerli bir fonksiyon olup örnek uzayının elemanlarını bir gerçel sayı uzayına R={0,1} bire bir atamaktadır. R uzayının bir alt uzayı A olsun Bölüm 1‟de S örnek uzayında tanımlanan bir C olayının olasılığı P(C) ile tanımlanmıştı. Şimdi A olayının olasılığı ile ilgilenilecek ve C olayı ile A olayının olasılıkları arasındaki ilişki kurularak, Pr(XA) ile gösterilen A olayının olasılığı belirlenmeye çalışılacaktır. İlk olarak A olayına karşılık gelecek şekilde C olayının kümesi belirlenmelidir: C={e:eS ve X(e)A}. Diğer bir deyişle S örnek uzayındaki C olayı, elemanları A alt uzayındaki X şans değişkenlerini veren elemanlardan seçilmiştir. Bu nedenle; Pr(XA)=P(A)=P(C) olmalıdır. Sonuç olarak, Pr(XA) ifadesi X şans değişkenine ait R uzayının bir alt kümesi olan A alt kümesine bir olasılık atamasıdır. P(A) fonksiyonu Bölüm 1‟de verilen olasılık küme fonksiyonuna ait üç aksiyomu sağlar. Bu nedenle P(A)‟da bir olasılık küme fonksiyonudur. İspat aşağıda verilmiştir: P(C) bir olasılık küme fonksiyonu olduğundan ve P(A)=P(C) eşitliği geçerli olduğundan; P(C)=P(A)0 Aksiyom 1. Eğer C kümesi yerine S kümesi alınır ise; S={e:eS ve X(e)R} ve P(S)=P(R)=1 Aksiyom 2. Son aksiyomu ispatlamak için R uzayı üzerine tanımlı iki ayrık olay A1 ve A2 ele alınsın. Burada; C={e:eS ve X(e)A1A2} ya da P(C)= P(A1A2). Bu ifade; C={e:eS ve X(e)A1}{e:eS ve X(e)A2} ya da C= C1C2 Burada C1 ve C2 ayrık kümelerdir. Çünkü eğer her iki kümeye de ait bir ei elemanı için elde edilen X(ei) değeri aynı olup A1 ve A2 kümeleri ayrık olduğundan hem X(ei)A1 hem de X(ei)A2 olamayacağı için sonuç olarak C1 ve C2 ayrık kümelerdir. Ayrık olaylar için aksiyom 3 kullanılarak; P(C)= P(C1)+P(C2). ve P(C1)=P(A1) ve P(C2)=P(A2) olduğundan sonuç olarak iki ayrık küme için, P(A1A2)=P(A1)+P(A2) Aksiyom 3 elde edilir. P(A) ve P(C) her ikisi de küme fonksiyonu olsalar da farklı kümeler üzerine tanımlandıkları için eşit küme fonksiyonları değildirler. Örnek: İki para atışı ile gerçekleştirilen bir şans denemesinin örnek uzayı; S e : T , T , Y , T , T , Y , Y , Y ele alınsın ve şans değişkeni fonksiyonu aşağıdaki gibi tanımlansın: X(e)=0, e=TT ise X(e)=1, e=YT ise X(e)=1, e=TY ise X(e)=2, e=YY ise Şans değişkeninin örnek uzayı: R x : 0,1,2 olacaktır. R kümesinin bir alt kümesi A=1 alınsın. P(A) olasılığı nasıl elde edilir? Çözüm: İlk olarak X şans değişkeninin A kümesindeki değerine sahip olan S örnek uzayındaki elemanlar ile bir C olayı tanımlanır: C1=e:TT, C2=e:YT, C3=e:TY, C4=e:YY X(e)=1 değeri için e=YT ve e=TY olduğundan: C=C2,C3= C2C3 Bu kümeye ait olasılıkların hesaplanabilmesi için S üzerine tanımlı P(.) olasılık küme fonksiyonun belirlenmesi gereklidir: e TT YT TY YY P(Ci) 1/4 1/4 1/4 1/4 P(C)=P(C2C3)= P(C2)+P(C3)=1/4+1/4=1/2 P(A)=P(x=1)=P(C)=1/2 bulunur. Sonuç olarak R üzerine tanımlı bütün ayrık Ai olayları üzerinden P(A) küme fonksiyonu da elde edilebilir: x 0 1 2 P(Ai)=Pr(X=x) 1/4 1/2 1/4 ya da 2 1 Pr X x x 2 2 xR. Görüldüğü üzere P X A f x x ‟tir. x A Kesikli bir rassal değişken olan X ele alındığında, S örnek uzayının artık bir önemi yoktur. X‟in mümkün değerleri ve bu değerlere karşılık gelen olasılık değerlerini listelemeye yetmektedir. Bu bilgiyi X‟in olasılık kütle fonksiyonunda barındırmaktadır. Tanım (Olasılık kütle (mass) fonksiyonu): Kesikli bir şans değişkeni X‟in olasılık kütle fonksiyonu f : 0,1 şu şekilde tanımlanmıştır: f x P X a , x için. Tanım (Olasılık kütle (mass) fonksiyonu koşulları): X şans değişkeni bir boyutlu R uzayında tanımlı olsun. R kümesinin sayılabilir (sonlu ya da sonsuz) elemanlara sahip olduğu varsayılsın. Böyle bir R uzayı kesikli noktaların kümesi olarak adlandırılır. Bu küme üzerinde eğer bir f(x) fonksiyonu; 1. f x 0 2. xR. f x 1 R koşullarını sağlıyor ise X kesikli bir şans değişkenidir ve f(x) ise X şans değişkeninin olasılık kütle (mass) fonksiyonu olarak adlandırılır. Olasılık fonksiyonu f(x), X‟in tüm mümkün değerlerini listeler ve her bir değere bir olasılık değeri atar. Bir olasılık kütle fonksiyonu ile X şans değişkeninin olasılık dağılımı tam olarak belirlenebilir. Şans değişkenine ait olasılık dağılımının belirlenmesinde kullanılabilecek diğer bir fonksiyon ise F(x) birikimli dağılım fonksiyonudur. X kesikli şans değişkenine ait olasılık küme fonksiyonu P(A) olsun. A kümesi gerçel sayılar üzerinde - ile x aralığında olsun. Bu şekilde tanımlanmış tüm A kümeleri için olasılık değerleri; P(A)=Pr(xA)=Pr(Xx) şeklinde elde edilebilir. Olasılık değerlerinin x noktasına bağımlı olduğu açıktır. Diğer bir deyişle bu olasılık x noktasının bir fonksiyonudur. Bu özelliğe sahip fonksiyonlara birikimli dağılım fonksiyonu denir. Tanım (Birikimli dağılım fonksiyonu): Bir kesikli X şans değişkeninin birikimli dağılım fonksiyonu F : 0,1 , F x Pr X x f x , X x x şeklinde tanımlanır. Tanım kümesi gerçel sayılar ve görüntü kümesi R=[0,1] dir. Her x kesikli şans değişkeninin kendisine ait bir birikimli dağılım fonksiyonu mevcuttur. F(x) fonksiyonu tüm x değerlerinde tanımlıdır. F(x) fonksiyonu kesikli şans değişkenleri için x değerlerinde sıçramalara sahiptir. Bu sıçramaların büyüklüğü Pr(X=x) olasılık değerine eşittir. Belirli x değerlerindeki bu sıçramalarda F(x) fonksiyonu sürekli değildir. Bununla birlikte F(x) tanımlıdır çünkü sıçrama noktasında fonksiyon sıçramadaki üst değeri alır. Bu özellik sağdan süreklilik olarak bilinir. Çünkü bir noktaya sağdan yaklaşıldığında fonksiyon süreklidir. Sağdan süreklilik kümülatif dağılım fonksiyonunun tanımının bir sonucudur. Eğer F(x)=Pr(X<x) olarak tanımlansaydı, F(x) soldan sürekli olacaktı. Bir kesikli şans değişkeni için F(x) fonksiyonu kullanılarak f(x) olasılık kütle fonksiyonu belirlenebilir. Teorem: X kesikli şans değişkeninin tanımlı olduğu değerler; x1 x 2 x3 olsun: f x1 F x1 f xi F xi F xi 1 i>1 için. Teorem: F(x) fonksiyonu ancak ve ancak aşağıdaki üç şart sağlandığında kesikli bir şans değişkeninin birikimli dağılım fonksiyonudur. 1. lim F x 0 ve lim F x 1 x x 2. lim F x h F x h0 F(x) sağdan sürekli bir fonksiyondur. 3. a<b için F(a)F(b) F(x) fonksiyonu azalmayan bir fonksiyonudur. Son özellik (-,b] şeklindeki bir aralık iki ayrık kümenin birleşimi olarak yazılarak ispatlanabilir: (-,b]= (-,a](a,b] Bu kümelere ait olasılıklar: F(b)=F(a)+Pr(a<xb) Aksiyom 1 ile Pr(a<xb)0 olduğundan F(a)F(b) elde edilir. Bu sonuç, Pr(a<xb)=F(b)-F(a) şeklinde oldukça kullanışlı bir ilişkiyi de tanımlamaktadır. Değeri 0,1,2,…, olan kesikli rassal değişkenler için farklı bir eşitlik ise Pa X b Pa 1 X b 1 F b 1 F a şeklinde tanımlanabilir. 2.2 SÜREKLİ ŞANS DEĞİŞKENLERİ Aralarındaki boşluklar sayılabilen değerlerden oluşmayan, aksine belli aralıklardan ya da bu aralıkların birleşimlerinden oluşan şans değişkenleri sürekli tipteki şans değişkenleri adını almaktadır. Bu şekilde bir şans değişkeninin göreli frekans histogramı F(x) negatif olmayan bir fonksiyondur ve bunun grafiği ile x ekseni arasında kalan alan 1‟e eşittir. Bu nedenle sürekli şans değişkenine ait bir dağılım söz konusu olduğunda oluşum sıklıklarının çok küçük aralıklarda incelenmesi daha uygun bir yaklaşımdır. Sürekli şans değişkenlerinin daha iyi anlaşılabilmesi için aşağıdaki örneğin incelenmesi faydalı olacaktır. Yarıçapı 1 birim ve merkezi iki boyutlu uzayın başlangıç noktası olan bir dairenin iç bölgesinden bir noktanın seçilmesi şans deneyini oluştursun. Bu uzay S ile belirtilsin. Dairenin alanı r2 eşitliğinden olarak belirlenir. Rassal seçimin sonucunda noktanın S üzerinde tanımlanan bir C kümesinden gelmesinin olasılığı, CS koşulu ile; PC C kümesinin alanı İlk olarak P(C)0 ve P(S)=1 olduğu görülebilir. Eğer C1 kümesi S kümesinin birinci bölgesini tanımlayan bir alt küme ise P(C1)=1/4. Eğer C2 yarıçapı 1/3 olan ve C2S koşulunu sağlayan bir daire ise P(C2)=1/9. Analitik geometriden bilindiği üzere bir noktanın, bir doğrunun ya da bir eğrinin alanı sıfırdır. Bu nedenle bunlara ait olasılıklar da sıfır olacaktır. Örneğin C3 kümesi C2 ile tanımlanan dairenin sınırlarını (çemberini) tanımlıyor ise P(C1)=0. Bu rassal deneye ait şans değişkeni orijinden seçilen bir noktaya olan uzaklık olsun. Şans değişkeninin uzayı; R=x:0x1. Her hangi bir xR için Pr(X=x)=0 olacaktır. Çünkü X=x olayı daire üzerinde rassal olarak seçilen bir noktaya karşılık gelen olayı tanımlamaktadır. Diğer bir deyişle orijine uzaklığı (yarıçapı) x olan bir çemberi tanımlamaktadır ki buna karşılık gelen alan sıfırdır. Bununla birlikte Xx ile tanımlanan bir olay için olasılık araştırılabilir. Bu olayın olasılığı, xR koşulu ile, Pr(Xx): Pr X x x yarçaplı dairenin alanı Bu olasılık X şans değişkenin birikimli dağılım fonksiyonuna karşılık gelmektedir ve F x Pr X x x 2 0x1 ya da, 0 F x x 2 1 x0 0 x 1 1 x şeklinde tanımlanabilir. Tanım (Birikimli dağılım fonksiyonu): Eğer X sürekli bir şans değişkeni ve f(x) onun olasılık yoğunluk fonksiyonu ise; F x Pr X x x f t dt F x F F x 0 F x Eşitliği ile tanımlanan F(x) fonksiyonu X şans değişkeninin birikimli dağılım fonksiyonu olarak adlandırılır. Sürekli şans değişkenlerinde nokta olasılığı sıfır olduğu için, F ve f fonksiyonlarını ilişkilendiren bir yaklaşımının tanımlanması da gereklidir. Bu yaklaşım aşağıdaki örnek ile daha detaylı olarak incelenmiştir. Aşağıda 168 koşucunun 10 adet 100m koşu zamanları verilmiştir. Toplamda 1680 zaman verisi bulunmaktadır. Bazı özet istatistikleri şu şekildedir: Bu histogram farklı zaman aralıkları için de oluşturulabilir: Şekillerden de görüldüğü gibi, her bir histogramda çubukların uzunlukları ve aralıkların genişlikleri farklı olsa da hepsinin şekli kabaca aynıdır. Histogramlar dağılışın şekli hakkında sezgisel olarak bilgi sağlamaktadırlar. Buna göre: En olası zamanlar 10.2 saniye civarındadır, Zamanların dağılımı soldan uzun kuyruğa sahiptir (sola çarpıktır), 10.0 saniyenin altında ve 10.3 saniyenin üstündeki zamanların olasılıkları düşüktür. Dağılışın şeklini görebilmek için bu histogramlardan herhangi birine eğri uyumu yapılabilir. Fakat burada sorun histogramların standardize olmamasıdır.Aralığın genişliği her değiştirildiğinde çubukların boyları da değişmektedir. Histogramların hepsini kapsayacak şekilde, aralık genişliği değişse de yüksekliği değişmeyecek bir eğri ya da fonksiyon nasıl türetilebilir? Standardize Histogram: 1680 adet koşu zamanının ele alınması yerine, koşu zamanları dağılımının ideal fonksiyonu üzerinde durulsun. Amaç histogramdaki çubukların her bir genişliği için yüksekliğin aynı kalacağı bir eğri ya da bir fonksiyon türetmektir. İlk yaklaşım: nisbi frekansları olasılık olarak değerlendiren bir şeklin çizilmesidir. Bu durumda histogramdaki her bir çubuk, bir gözlemin o çubukta yer alma olasılığını göstermektedir. Bu yaklaşım, amaca uygun değildir. Çünkü yükseklik (olasılık) hala çubuğun genişliğine bağlıdır. Daha geniş çubuklar, daha büyük olasılık değerlerine sahiptir. İkinci yaklaşım: çubuk genişliğine bölünmüş nisbi frekans değerlerine ait grafiğin çizilmesidir. Histogramdaki her bir çubuğun yüksekliği bir gözlemin o çubukta yer alması olasılığının, çubuğun genişliğine oranını göstermektedir. Yukarıdaki şekillere bakıldığında istenilen amaca ulaşıldığı görülmektedir. Tüm histogramlar için, genişliği ne olursa olsun çubukların yükseklikleri aynıdır ve aynı eğri ile uyum yapılabilmektedir. Bu tür histogramlar standardize histogramlardır. Uyumu yapılan eğri de olasılık yoğunluk fonksiyonu olarak adlandırılır. Verilen bir dağılış için herhangi bir standardize histogramda uyumu yapılabilen yalnızca bir eğri vardır. Bu eğriye olasılık yoğunluk fonksiyonu (oyf) denmektedir. Sürekli bir rassal değişken olan X için oyf; f(x) şeklinde gösterilmektedir. Oyf kesinlikle X şans değişkenine ait olasılıkları vermez. Örneğin koşu zamanları ait veriler için f(x) = 4 elde edilebilmektedir. Standardize histogramlarda çubuklar daraltıldıkça oyf eğrisine yaklaşılmaktadır. Yaklaşımda ortaya çıkan hata aralık uzunluğu x değeri küçültülerek azaltılır. Sonuç olarak histogramdaki sınıf sayısı n sınırsız bir şekilde artarken ve sınıf aralıklarının uzunlukları sıfıra doğru düşerken F(x) fonksiyonunun limitinin ne olacağı önemli bir konudur. Bu durumda F(x) adım fonksiyonunun sınırlarının gittikçe düzgünleşen bir fonksiyon olması beklenir. Aslında oyf, çubukların genişliği sıfıra giderken standardize histogramın limitine eşittir. Herhangi bir x ile x x aralığı için standardize histogram, bir gözlemin bu aralığa düşme olasılığının, aralığın genişliğine oranıdır. O halde x ile x x aralığında standardize histogramın yüksekliği, olasilik Px X x x F x x F x aralik genisligi x x Burada F(x) kümülatif dağılım fonksiyonudur. Şimdi de histogram çubuğunun genişliği x sıfıra giderken limit değeri ele alınsın. Bu limit x noktasında oyf‟yi tanımlar: F x x F x f x lim x 0 x Bu ifade aynı zamanda F(x)‟in türevine eşittir. O halde oyf, f x F x dFx dx olup sonuç olarak, F x f x dx yazılabilir. X şans değişkeninin frekans dağılımından elde edilen herhangi bir standardize histogramın şeklini tanımlayan, değişmeyen tek bir eğridir. Oyf ile, Verilen bir nokta için olasılığın birikimini tanımlayan oran F x elde edilebilir, X‟in dağılımının şekli elde edilebilir. Oyf değeri bir olasılık değildir. Her zaman f(x) 0‟dır. Fakat f(x) 1 olmak zorunda değildir. Sonsuz adet çok küçük değerin toplanmasında integral işleminden faydalanılabilir. Örneğin uzunluğu x olan çok küçük aralıklar için [x,x+x] olasılık değerinin tahmini göreli bir standart histogram fonksiyonu kullanılarak; x x F ( x)dx x integralinden elde edilebilir. Bu ifadedeki tam olasılık değeri f(x) eğrisinin altında kalan alana karşılık gelir. Sonuç olarak sürekli bir X şans değişkeni için f(x) çok küçük aralıklara ait olasılıkların belirlenmesinde kullanılsa da doğrudan doğruya bir olasılık değeri değildir. Şans değişkeni için olasılık yoğunluğunu atayan bir fonksiyondur. Teorem: Eğer F(x) ve f(x) fonksiyonları X şans değişkenin birikimli dağılım ve olasılık yoğunluk fonksiyonları ise her hangi ab şeklinde tanımlanan iki gerçel değer için; Pr a x b F b F a . Sürekli şans değişkenlerinin birikimli dağılım fonksiyonları elde edilirken yapay değişkenin kullanılması en doğru yaklaşımdır. F x x f t dt yazılmasının anlamı, f(t)‟in -‟dan x‟e kadar toplanmasıdır. F x x f x dx yazılması yanlış x ve anlamsızdır. f x dx „in anlamı f(x)‟in -‟dan x‟e kadar toplanmasıdır. Bu durumda x, - ‟dan x‟e kadar nasıl değer alabilir? Oyf eğrisi altında kalan toplam alanın ise f xdx F F 1 0 1 olduğu görülmektedir. Diğer bir deyişle f(x) fonksiyonu X ekseni ile grafiği arasındaki alan 1‟e eşit olan bir pozitif fonksiyondur. Tanım (Olasılık yoğunluk fonksiyonu):Tanım uzayı R bir aralık ya da aralıkların birleşiminden oluşan şans değişkeni X olsun. Bir f(x) fonksiyonu 1. f x 0 2. xR. f xdx 1 R koşullarını sağlıyor ise X sürekli bir şans değişkenidir ve f(x) ise X şans değişkeninin olasılık yoğunluk fonksiyonu olarak adlandırılır. Sürekli bir şans değişkeni için, AR olmak üzere, bir olasılık küme fonksiyonu P(A), olasılık yoğunluk fonksiyonuna göre, P A Prx A f x dx A ifade edilebilir. Eğer f(x) sürekli bir X şans değişkeninin olasılık yoğunluk fonksiyonu ise ve tanım uzayı üzerine belirlenen bir küme A={x:a<X<b} ise P(A)=Pr(xA) ifadesi; b Pra X b f x dx a olarak yazılabilir. Pr(a<X<b) olasılığı; f(x)‟in grafiği, x ekseni, x=a ve x=b ile sınırlanmış alandır. Eğer A kümesi tek bir noktadan oluşuyor ise ; a P A Prx A Pr X a f x dx 0 a Nokta olasılığın sıfır olması nedeni ile; Pr a X b Pr a X b Pr a X b Pr a X b eşitlikleri geçerlidir. Sürekli şans değişkenlerinin bu özelliğine dayanarak eğer iki olasılık yoğunluk fonksiyonu sadece sıfır olasılığa sahip sonlu elemanlı bir küme için farklılık gösteriyor ise bu iki olasılık küme fonksiyonunun tamamen aynı olduğu söylenebilir. Kesikli şans değişkenleri bu özelliğe sahip değildir. Matematik bakış açısıyla sonlu pozitif bir integrale (ya da toplama) sahip olan negatif olmayan herhangi bir fonksiyon bir olasılık yoğunluk (ya da olasılık kütle) fonksiyonuna dönüştürülebilir. Örneğin eğer h(x) bir A kümesi üzerinde pozitif ve diğer durumlarda sıfır değerini alan herhangi bir negatif olmayan fonksiyon ise ve hxdx K A ise f x 1 h x K fonksiyonu A kümesindeki değerleri alan bir X şans değişkeninin olasılık yoğunluk fonksiyonudur. Eğer X sürekli tipte bir şans değişkeni ise olasılık yoğunluk fonksiyonu f(x) her sonlu aralıkta en fazla sonlu sayıda süreksizliğe sahip olabilir. Diğer bir ifade ile süreksiz olduğu nokta sayısı sonsuz olamaz. Buradan; a. F(x) dağılım fonksiyonunun her yerde sürekli olduğu, b. f(x) fonksiyonunun sürekli olduğu her noktada F(x) fonksiyonunun X şans değişkenine göre türevinin var olduğu ve bu türevin f(x) fonksiyonuna eşit olduğu sonucu çıkarılabilir. Tanım (Sürekli şans değişkeni için birikimli dağılım fonksiyonu): Bir şans değişkeni X eğer F(x), şans değişkeni değerlerinin sürekli bir fonksiyonu ise sürekli şans değişkenidir. Tanım: F(x) fonksiyonu bir X şans değişkeninin olasılık dağılımını tamamen belirler. Bu tanım, (a,b), [a,b),(a,b] ve [a,b] şeklindeki tüm gerçel sayı aralıklarını içeren en küçük sigma cebiri β ile gösterilirse, eğer Pr(xA) olasılığı sadece β‟ deki A olayları için geçerli ise doğrudur. Eğer olasılıklar olayların daha büyük bir sınıfı için tanımlanmış ise iki şans değişkeninin aynı dağılım fonksiyonuna sahip olsalar bile her olay için aynı olasılık değerine sahip olmamaları mümkündür. Tanım: Şans değişkenleri X ve Y, AR‟ deki her küme için, eğer Pr(xA)= Pr(yA) ise özdeş dağılmışlardır. İki şans değişkeninin özdeş dağılması onların eşit olduğu anlamına gelmez diğer bir deyişle yukarıdaki tanım X=Y olduğunu söylemez Bir olasılık küme fonksiyonu P(.) kullanılarak dağılım fonksiyonu F(x) belirlenebilir. Çok kolay olmasa da bir dağılım fonksiyonu F(x) kullanılarak bir olasılık küme fonksiyonu P(.) bulunabilir. Sonuç olarak P(.) ve F(x) fonksiyonlarının olasılık dağılımı ile ilgili aynı bilgiyi verdikleri söylenebilir. 2.3 KARMA ŞANS DEĞİŞKENLERİ Bir şans değişkeni dağılımının tamamen sürekli ya da kesikli olarak tanımlanamadığı durumlarla da karşılaşmak mümkündür. Bu özelliğe sahip şans değişkenlerinin dağılım fonksiyonları tamamen adım fonksiyon ya da tamamen sürekli olmayıp karma bir yapı sergilerler. Eğer bir X şans değişkeninin dağılım fonksiyonu; F(x)=aFk(x)+(1-a)Fs(x) yapısında ise bu şans değişkeninin karma tipte bir şans değişkenidir. Burada 0<a<1 olup Fk(x) ve Fs(x) sırası ile kesikli ve sürekli yapıların dağılım fonksiyonlarıdır. Tanım: Kısmi kesikli ve kısmi mutlak sürekli olarak tanımlanan bir kümülatif dağılım fonksiyonuna ait yoğunluk fonksiyonu eğer kümülatif dağılım: F(x)=aFk(x)+(1-a)Fs(x) ise f(x)=afk(x)+(1-a)fs(x) şeklindedir. Burada fk(x), Fk(x)‟nin kesikli olasılık kütle fonksiyonu, fs(x) ise Fs(x)‟nin olasılık yoğunluk fonksiyonudur. Örnek: Bir sürücü trafik ışıklarında beklemeden geçme ve bekleme süreleri için model oluşturmak istemektedir. Işıktan beklemeden geçme olasılığı Pr(X=0)=0.4 olarak belirlenmiştir. Işıkta bekleme süresi ise üstel dağılıma uymaktadır. Bu durumda; Fk(x)=1,Fs(x)=1-ex ve a=0.4 alınarak, F(x)=0.4+0.6(1-ex) model belirlenir. Sürücünün 5 dakikadan az beklemesinin olasılığı: Pr(X<0.5)=0.4+0.6(1-e0.5)=0.636 bulunur. 2.4 ÇOK DEĞİŞKENLİ ŞANS DEĞİŞKENLERİ Bazı şans deneyi sonuçlarında çıktı üzerinde birden fazla özellik ile ilgilenilebilir. Bu gibi durumlarda ortaya çıkan şans değişkeni modellerine çok değişkenli dağılımlar adı verilir. En basit çok değişkenli model iki şans değişkenini içerir. Örneğin üç adet para atıldığında ilk iki atışta gelen yazı sayısı bir değişkeni tüm üç atışta gelen yazı sayısı ikinci değişkeni tanımlasın. Bu deneyin örnek uzayı: S={e:e1=TTT, e2=TTY, e3=TYT, e4=YTT, e5=TYY, e6=YTY, e7=YYT, e8=YYY} Bu örnek uzayı üzerine tanımlanmış iki şans değişkeni X1 ve X2: X1(e1)=0 X2(e1)=0 X1(e2)=0 X2(e2)=1 X1(e3)=1 X2(e3)=1 X1(e4)=1 X2(e4)=1 X1(e5)=1 X2(e5)=2 X1(e6)=1 X2(e6)=2 X1(e7)=2 X2(e7)=2 X1(e8)=2 X2(e8)=3 olsun. Şans değişkeni fonksiyonları S örnek uzayındaki her bir elemanı gerçel değerli sıralı sayı ikilileri uzayına; R={(x1,x2):(0,0),(0,1),(1,1),(1,2),(2,2),(2,3)} götürmektedir. Diğer bir deyişle bu şans değişkenlerinin uzayı iki boyutlu bir gerçel kümedir. Tanım: Örnek uzayı S olan bir şans deneyi ele alınsın S uzayının her bir ei elemanını bir ve yalnız bir sıralı sayı çiftine, X1(ei)=x1, X2(ei)= x2, atayan şans değişkenleri X1 ve X2 olsun. X1 ve X2 şans değişkenlerinin uzayı sıralı sayı ikililerinin kümesidir: R={(x1,x2): X1(ei)=x1, X2(ei)= x2, eiS} Amaç R uzayı üzerine tanımlanmış bir A olayının Pr[(x1,x2)A] ile ifade edilen olasılığının, S örnek uzayında ona karşılık gelen bir C olayının, C={e: eiS ve [X1(ei), X2(ei)]A} olasılığını kullanarak, Pr[(x1,x2)A]=P(C) belirleyebilmektir. Burada P(.), S örnek uzayı üzerine tanımlı bir olasılık küme fonksiyonudur. Pr[(x1,x2)A] ifadesinin bu olasılık küme fonksiyonu ile gösterimi: Pr[(x1,x2)A]=P(A). Bu sonucun belirlenebilmesi için S örnek uzayı üzerine tanımlı P fonksiyonunun belirlenmesi gerektiği açıktır. Konuyu açıklamak amacıyla örneğe geri dönüp R kümesi üzerinde bir A olayı; A={(x1,x2):(1,1),(1,2)} tanımlansın. P(A) değerinin bulunabilmesi için A kümesindeki (x1,x2) elemanlarına karşılık gelen S örnek uzayındaki C kümesinin elemanları belirlenmelidir: X1(e3)=1 X2(e3)=1 X1(e5)=1 X2(e5)=2 X1(e4)=1 X2(e4)=1 X1(e6)=1 X2(e6)=2 Burada; P(A)=Pr[(x1,x2)A]=P(C) koşulunu sağlayan C kümesi, C={e: e3,e4,e5,e6} belirlenmiştir. Olasılık küme fonksiyonu P(.)‟nin belirlenmesi için paranın hilesiz olduğu varsayımı ile P(Y)=P(T)=1/2 ve denemelerin birbirinden bağımsız olduğu varsayımı ile; P({e1})=Pr[TTT]=1/8 Sonuç olarak; ei TTT TTY TYT YTT TYY YTY YYT YYY P({ei}) 1/8 1/8 1/8 1/8 1/8 1/8 1/8 1/8 (x1,x2) (0,0) (0,1) (1,1) (1,2) (2,2) (2,3) Pr[(x1,x2)] 1/8 1/8 2/8 2/8 1/8 1/8 ve P(A)=1/2 elde edilir. Tanım (Ortak olasılık kütle fonksiyonu): Eğer X ve Y tanım uzayı R olan iki kesikli şans değişkeni ise tanım aralığındaki tüm (x,y) sıralı ikilileri için ancak ve ancak, 1. f(x,y)0 2. (x,y)R. f x, y 1 x y koşullarını sağlıyor ise f(x,y)= Pr[X=x,Y=y] fonksiyonu X ve Y kesikli şans değişkenlerinin ortak olasılık kütle fonksiyonudur. Tanım (Ortak birikimli dağılım fonksiyonu): Eğer X ve Y tanım uzayı R olan iki kesikli şans değişkeni ise ve f(s,t) kesikli şans değişkenlerinin ortak olasılık kütle fonksiyonu ise F x, y PrX x, Y y f s, t s x t y fonksiyonu X ve Y kesikli şans değişkenlerinin ortak birikimli dağılım fonksiyonudur. Yukarıda kesikli şans değişkenleri için verilen fonksiyon tanımları tek değişkenli durumda açıklanan bazı küçük farklılıklar dikkate alınarak sürekli şans değişkenleri için de verilebilir. Tanım (Ortak olasılık yoğunluk fonksiyonu): Eğer X ve Y tanım uzayı R olan iki sürekli şans değişkeni ise tanım aralığındaki tüm (x,y) sıralı ikilileri için ancak ve ancak, 1. f(x,y)0 2. (x,y)R. f x, y dxdy 1 R koşullarını sağlıyor ise f(x,y) fonksiyonu X ve Y sürekli şans değişkenlerinin ortak olasılık yoğunluk fonksiyonudur. Sürekli şans değişkenleri X ve Y için bir olasılık küme fonksiyonu P(A) olsun. Eğer A alt kümesi; A={(u,v):ux,vy} yapısında sınırsız bir küme ise araştırılan olasılık değeri, P(A)=Pr [(x,y)A]=Pr[Xx,Yy] ile tanımlanabilir. Bu olasılık değeri (x,y) noktasının bir fonksiyonu olup bu fonksiyon X ve Y sürekli şans değişkenlerinin ortak birikimli dağılım fonksiyonudur. Tanım (Ortak birikimli dağılım fonksiyonu): Eğer X ve Y tanım uzayı R olan iki sürekli şans değişkeni ise ve f(s,t) sürekli şans değişkenlerinin ortak olasılık yoğunluk fonksiyonu ise F x, y PrX x, Y y x y f s, t dsdt fonksiyonu X ve Y sürekli şans değişkenlerinin ortak birikimli dağılım fonksiyonudur. Eğer A alt kümesi; A={(x,y):aXb,cYd} ise araştırılan olasılık değeri ortak olasılık yoğunluk fonksiyonu kullanılarak: b d P A Pra X b, c Y d f x, y dxdy a c bulunabilir. R uzayı üzerinde tanımlı bir A kümesinin olasılığı f(x,y) fonksiyonu ile bulunabileceği gibi F(x,y) fonksiyonu ile de hesaplanabilir. Eğer P(A)= Pr[a<X<b;c<Y<d] ise Pr[a<X<b;c<Y<d]=F(b,d)-F(b,c)-F(a,d)+F(a,c). İki değişkenli sürekli dağılımlarda yoğunluk ve dağılım fonksiyonları arasındaki ilişki: f x, y 2 F x, y xy ile tanımlanmıştır. İki şans değişkenli durum için elde edilen sonuçlar n adet şans değişkenli durum için genellenebilir. Şans değişkenlerinin kesikli olması durumunda ortak olasılık kütle fonksiyonu; f x1 ,, x n Pr X 1 x1 ,, X n x n ve ortak birikimli dağılım fonksiyonu; F x1 ,, x n Pr X 1 x1 ,, X n x n olup sürekli şans değişkenleri için ise ortak birikimli dağılım fonksiyonu; x1 xn F x1 ,, xn f t1 ,, t n dt1 dt n ve ortak olasılık yoğunluk fonksiyonu; f x1 ,, xn n F x1 ,, xn . x1 xn 2.5 MARJİNAL DAĞILIMLAR Marjinal dağılımlar birden fazla şans değişkenine sahip olasılık dağılımları için söz konusudur. X ve Y şans değişkenlerinin ortak olasılık kütle/yoğunluk fonksiyonu f(x,y) olsun. Tanımlanan iki değişkenli dağılımda A={x:a<x<b} olayı ile ilgilenilsin. Bu olay ancak ve ancak B={(x,y):a<x<b;-<y<} olayı oluştuğunda gerçekleşebilir. Gerçekte bu iki olay birbirine denktir ve aynı olasılığa sahiptirler. B olayının olasılığı, sürekli değişkenler için; b Pra x b; y f x, y dydx a ve kesikli değişkenler için; b a Pr a x b; y f x, y eşitliklerinden elde edilir. İşlem iki aşamalıdır. İlk aşamada y değişkeni integral ya da toplama işlemi ile elimine edilir: g x f x, y dy ya da g x f x, y y Sadece x değişkenine bağlı olarak elde edilen g(x) fonksiyonu marjinal olasılık kütle/yoğunluk fonksiyonu olarak adlandırılır. A olayı için araştırılan olasılık marjinal olasılık fonksiyonu kullanılarak b b a a Pra x b g x dx ya da Pr a x b g x hesaplanır. f(x,y) iki değişkenli dağılımda değişkenlerden sadece birinin davranışı ile ilgilenildiğinde, marjinal dağılıma gereksinim vardır. Tanım (Kesikli marjinal dağılımlar): X ve Y kesikli şans değişkenleri, f(x,y)‟de bunların ortak olasılık kütle fonksiyonu ise X şans değişkeninin tanım aralığındaki her x için, g x f x, y y ile gösterilen fonksiyona X‟in marjinal dağılımı h y f x, y x fonksiyonuna ise Y‟nin marjinal dağılımı denir Tanım (Sürekli marjinal dağılımlar): X ve Y sürekli şans değişkenleri, f(x,y)‟de bunların ortak olasılık yoğunluk fonksiyonu ise X şans değişkeninin tanım aralığındaki her x için, g x f x, y dy ile gösterilen fonksiyona X‟in marjinal dağılımı h y f x, y dx fonksiyonuna ise Y‟nin marjinal dağılımı denir Marjinal dağılımların bilinmesi durumunda kümülatif marjinal dağılımlar elde edilebilir. Kesikli X şans değişkeni için, F x f x, y g x x y F x, x Sürekli X şans değişkeni için, F x x x f s, t dtds g s ds F x, . 2.6 KOŞULLU DAĞILIMLAR İlk bölümde koşullu olasılık kavramı bir örnek uzayı üzerinde tanımlı olaylar üzerinden açıklanmıştı. Bu kavram şans değişkenleri ve onlara ait olasılık fonksiyonları ile genişletilebilir. f(x,y) iki değişkenli dağılış olsun. Y şans değişkeninin bilinen değerleri için X şans değişeninin yoğunluğu ile ilgilenilsin. Bu yoğunluk f(x/y) ile temsil edilir. Tüfekle yapılan atışta Y değişkeninin gözlendiğini fakat X değişkeninin elde edilemediği varsayılsın. Elde edilen Y değerine karşın X şans değişkeninin a<X<b aralığında olma olasılığı Pr[a<X<b/Y=y] olup bu olasılık kesikli şans değişkenleri için, b Pr a X b / Y y f x / y a Sürekli şans değişkenleri için, b Pra X b / Y y f x / y dx a şeklinde hesaplanır. Tanım (Kesikli/Sürekli şans değişkenleri için koşullu dağılım):Kesikli şans değişkenleri X ile Y‟nin ortak olasılık kütle/yoğunluk fonksiyonu f(x,y) ve Y şans değişkeninin marjinal dağılımı h(y) ise, verilen Y=y için X şans değişkeninin koşullu dağılımı: f x / y f x, y h y h(y) 0 X şans değişkeninin marjinal dağılımı g(x) ise verilen X=x için Y şans değişkeninin koşullu dağılımı: f y / x f x, y g x g(x) 0 İkiden daha fazla şans değişkeninin tanımladığı ortak dağılımlarla çalışıldığında, ister kesikli isterse sürekli olsun, farklı yapıda koşullu dağılışlar ile karşılaşılabilir. Örneğin f(x1,x2,x3,x4) ortak olasılık kütle/yoğunluk fonksiyonu olsun. Verilen bir X1=x1,X2=x2 ve X3=x3 için X4 değişkeninin koşullu dağılımı: f x 4 / x1 , x 2 , x3 f x1 , x 2 , x3 , x 4 . g x1 , x 2 , x3 Benzer bir yaklaşımla ortak koşullu dağılımlarda tanımlanabilir. Örneğin verilen bir X1=x1 ve X2=x2 için X3 ve X4 şans değişkenlerinin koşullu ortak dağılımı: f x3 , x 4 / x1 , x 2 f x1 , x 2 , x3 , x 4 . g x1 , x 2 Örnek: X1 ve X2 sürekli şans değişkenleri olsun. f(x1,x2) ortak olasılık yoğunluk fonksiyonu ve g(x1) ise marjinal olasılık yoğunluk fonksiyonu ise f(x2/x1) koşullu fonksiyonunun sürekli bir şans değişkenine ait olasılık yoğunluk fonksiyonu olduğunu gösteriniz. Çözüm: 1) f(x1,x2)0 ve g(x1)0 olduğundan. f x 2 / x1 2) f x 2 f x1 , x 2 0. g x1 / x1 dx2 f x1 , x 2 1 dx2 f x1 , x 2 dx2 g x1 g x1 g x1 g x1 =1. 2.7 BAĞIMSIZ ŞANS DEĞİŞKENLERİ Eğer şartlı olasılık f(x/y), Y şans değişkenini içermiyorsa, olasılıksal anlamda, X şans değişkeni Y şans değişkeninden bağımsızdır. Ortak olasılık yoğunluk/kütle fonksiyonları f(x,y) ve marjinal olasılık yoğunluk/kütle fonksiyonları g(x) ve h(y) olan (kesikli ya da sürekli) şans değişkenleri X ve Y olsun. Koşullu dağılışın özelliği kullanılarak, f(x,y)= f(x/y) h(y) yazılabilir. Burada f(x/y) fonksiyonu Y değişkenine bağımlı değilse X şans değişkeninin marjinal olasılık yoğunluk/kütle fonksiyonu (sürekli şans değişkeni için): f x, y dy f x / y h y dy g x f x / y h y dy g x f x / y elde edilir. Bu sonuç kullanılarak, f(x/y) fonksiyonu Y değişkenine bağımlı olmadığında, f(x,y)= g(x) h(y) yazılabilir. Diğer bir deyişle verilen bir Y=y değeri için X şans değişkenin koşullu dağılımı Y ile ilgili her hangi bir varsayımdan bağımsız ise f(x,y)= g(x) h(y) yazılabilir. Tanım (Bağımsız şans değişkenleri): X ve Y şans değişkenleri ancak ve ancak f(x,y)= g(x) h(y) koşulu sağlanıyor ise birbirinden bağımsızdır. Bağımsız değiller ise bağımlıdırlar. Teorem: Marjinal olasılık kütle/yoğunluk fonksiyonları g(x) ve h(y) olan birbirinden bağımsız iki şans değişkeni X ve Y olsun. a, b, c, d sabitler olmak üzere her a<b ve c<d için: Pr[a<X<b; c<Y<d]=Pr[a<X<b]Pr[c<Y<d]. İspat: X ve Y birbirinden bağımsız olduğu için, sürekli şans değişkenleri için; b d b d a c a c Pr[a X b, c Y d ] f x, y ,dxdy g x h y dxdy b d g x dx h y dy a c =Pr[a<X<b]Pr[c<Y<d]. Teorem: Ortak olasılık yoğunluk/kütle fonksiyonları f(x,y) ve marjinal olasılık yoğunluk/kütle fonksiyonları g(x) ve h(y) olan (kesikli ya da sürekli) şans değişkenleri X ve Y olsun. X ve Y ancak ve ancak a.f(x,y) fonksiyonu, sadece X değişkeninin bir fonksiyonu olan ve negatif olmayan bir fonksiyon ile sadece Y değişkeninin bir fonksiyonu olan ve yine negatif olmayan bir fonksiyonun çarpımı olarak; f(x,y)=u(x)v(y) yazılabiliyor ise, b. X için tanım kümesi A ve Y için tanım kümesi B olmak koşulu ile iki değişkenli dağılımın tanım kümesi R={(x,y): f(x,y)>0}; R=AB bir Kartezyen çarpımdan elde edilmiş ise birbirinden bağımsızdır. İspat a: X ve Y birbirinden bağımsız ise marjinal olasılık fonksiyonları kullanılarak, f(x,y)= g(x)h(y) yazılabilir. Marjinal olasılık kütle/yoğunluk fonksiyonu oldukları için negatif olmayan fonksiyonlardır bu nedenle koşul sağlanır. Buna karşın f(x,y)=u(x)v(y) yazılabiliyor ise: g x ux v y dy ux v y dy c1ux h y ux v y dx v y ux dx c2 v y burada c1 ve c2 sabitlerdir. Olasılık yoğunluk fonksiyonu tanımından: f x, y dxdy uxv y dxdy 1 ux dx v y dy 1 c1c 2 olmalıdır. Sonuç olarak: f(x,y)= g(x)h(y)= u(x)v(y). İki şans değişkeni için elde edilen sonuçlar n adet şans değişkeni için genellenebilir. Teorem: X1,…,Xn şans değişkenleri ancak ve ancak aşağıdaki özellikler sağlanıyor ise F(x1,…,xn)=F(x1)…F(xn) f(x1,…,xn)=f(x1)…f(xn) birbirinden bağımsızdır.