ŞANS DEĞİŞKENLERİ

advertisement
2. FREKANS DAĞILIŞLARI ve ŞANS DEĞİŞKENLERİ
Pek çok deneyde, orijinal olasılık yapısı ile çalışmaktansa özel bir değişkenle ilgilenmek ve
bu yeni değişkene ait olasılıkları belirleyebilmek işlemleri kolaylaştır. Örneğin bazı deney
sonuçlarının tanımladığı örnek uzayları, bir çift paranın üst yüzüne gelen sembol gibi,
S=(Y,Y), (T,Y), (Y,T),(T,T), sayılarla ifade edilmemektedir. Deneyde ortaya çıkan yazı
sayısı ile ilgilenildiğinde yeni bir değişken tanımlanmış olur. Farklı bir örnek olarak, bir soru
için doğru ya da yanlış olup olmadığı 50 kişiye sorulduğunda ve doğru cevabı 1 yanlış cevabı
0 ile kayıt altına alındığında bu deneyin örnek uzayı 250 elemandan oluşur ve her bir eleman
50 digit uzunluğunda 1 ve 0’ların farklı sıralamalarından oluşur. Bu örnek uzayı, x=1 cevabını
verenlerin sayısı bir şans değişkeni ile tanımlanarak basite indirgenebilir. Bu durumda x şans
değişkeni örnek uzayı {0,1,…..50} şeklinde tam sayılar kümesi olacaktır ve bu örnek uzayı ile
çalışmak işlemleri daha kolaylaştıracaktır. Bu x değerinin tanımlanması ile gerçekte, orijinal
örnek uzayından yeni bir örnek uzayına genellikle gerçel sayıların bir kümesine bir fonksiyon
tanımlanmıştır.
Bu kısımda bir S örnek uzayındaki ei elemanlarını sayılarla ifade edebilecek kuralların nasıl
formülleştirileceği açıklanacaktır.
Tanım (Şans Değişkeni): Örnek uzayı S olan bir şans deneyi ele alınsın. Örnek uzayındaki
her bir elemanı;
eS
bir ve yalnız bir gerçel sayıya atayan X fonksiyonuna;
X(e)=x
bir şans değişkeni denir.
Şans değişkeninin tanımlanması ile aynı zamanda yeni bir örnek uzayı da (şans değişkenin
tanım kümesi) tanımlanmış olur. Bu nedenle orijinal örnek uzayı üzerine tanımlanan olasılık
fonksiyonunun bu şans değişkeni içinde kullanılıp kullanılamayacağı kontrol edilmelidir.
Şans değişkeninin uzayı gerçel sayılar kümesidir:
R=x: X(e)=x, eS
Her hangi bir şans değişkeninin olasılık yapısını tanımlamakta kullanılan iki temel fonksiyon:
a. Olasılık yoğunluk/kütle fonksiyonu, f(x).
b. Birikimli dağılım fonksiyonu, F(x).
Şans değişkenleri genel olarak dört sınıfta incelenir:
1. Kesikli şans değişkenleri.
2. Sürekli şans değişkenleri.
3. Karma (mixed) şans değişkenleri.
4. Çok değişkenli şans değişkenleri.
Aşağıda her bir sınıf detaylı olarak incelenmiştir.
2.1 KESİKLİ ŞANS DEĞİŞKENLERİ
Bir paranın atıldığı basit şans deneyi ele alınsın. Bu deneye ait örnek uzayı S=Y,T olup
örnek uzayındaki elemanları temsil eden e elemanı Y ya da T değerini alır. Bir X fonksiyonu
aşağıdaki gibi tanımlansın:
X(e)=0, e=T ise,
X(e)=1, e=Y ise.
Tanımlanan X fonksiyonu örnek uzayı S üzerine tanımlı gerçel değerli bir fonksiyon olup
örnek uzayının elemanlarını bir gerçel sayı uzayına R={0,1} bire bir atamaktadır.
R uzayının bir alt uzayı A olsun Bölüm 1’de S örnek uzayında tanımlanan bir C olayının
olasılığı P(C) ile tanımlanmıştı. Şimdi A olayının olasılığı ile ilgilenilecek ve C olayı ile A
olayının olasılıkları arasındaki ilişki kurularak, Pr(XA) ile gösterilen A olayının olasılığı
belirlenmeye çalışılacaktır. İlk olarak A olayına karşılık gelecek şekilde C olayının kümesi
belirlenmelidir:
C={e:eS ve X(e)A}.
Diğer bir deyişle S örnek uzayındaki C olayı, elemanları A alt uzayındaki X şans
değişkenlerini veren elemanlardan seçilmiştir. Bu nedenle;
Pr(XA)=P(A)=P(C)
olmalıdır. Sonuç olarak, Pr(XA) ifadesi X şans değişkenine ait R uzayının bir alt kümesi
olan A alt kümesine bir olasılık atamasıdır. P(A) fonksiyonu Bölüm 1’de verilen olasılık
küme fonksiyonuna ait üç aksiyomu sağlar. Bu nedenle P(A)’da bir olasılık küme
fonksiyonudur. İspat aşağıda verilmiştir:
P(C) bir olasılık küme fonksiyonu olduğundan ve P(A)=P(C) eşitliği geçerli olduğundan;
P(C)=P(A)0
Aksiyom 1.
Eğer C kümesi yerine S kümesi alınır ise;
S={e:eS ve X(e)R} ve P(S)=P(R)=1
Aksiyom 2.
Son aksiyomu ispatlamak için R uzayı üzerine tanımlı iki ayrık olay A1 ve A2 ele alınsın.
Burada;
C={e:eS ve X(e)A1A2} ya da P(C)= P(A1A2).
Bu ifade;
C={e:eS ve X(e)A1}{e:eS ve X(e)A2} ya da C= C1C2
Burada C1 ve C2 ayrık kümelerdir. Çünkü eğer her iki kümeye de ait bir ei elemanı için elde
edilen X(ei) değeri aynı olup A1 ve A2 kümeleri ayrık olduğundan hem X(ei)A1 hem de
X(ei)A2 olamayacağı için sonuç olarak C1 ve C2 ayrık kümelerdir. Ayrık olaylar için
aksiyom 3 kullanılarak;
P(C)= P(C1)+P(C2).
ve
P(C1)=P(A1) ve P(C2)=P(A2)
olduğundan sonuç olarak iki ayrık küme için,
P(A1A2)=P(A1)+P(A2)
Aksiyom 3
elde edilir.
P(A) ve P(C) her ikisi de küme fonksiyonu olsalar da farklı kümeler üzerine tanımlandıkları
için eşit küme fonksiyonları değildirler.
Örnek: İki para atışı ile gerçekleştirilen bir şans denemesinin örnek uzayı;
S  e : T , T , Y , T , T , Y , Y , Y 
ele alınsın ve şans değişkeni fonksiyonu aşağıdaki gibi tanımlansın:
X(e)=0, e=TT ise
X(e)=1, e=YT ise
X(e)=1, e=TY ise
X(e)=2, e=YY ise
Şans değişkeninin örnek uzayı:
R  x : 0,1,2
olacaktır. R kümesinin bir alt kümesi A=1 alınsın. P(A) olasılığı nasıl elde edilir?
Çözüm: İlk olarak X şans değişkeninin A kümesindeki değerine sahip olan S örnek uzayındaki
elemanlar ile bir C olayı tanımlanır:
C1=e:TT, C2=e:YT, C3=e:TY, C4=e:YY
X(e)=1 değeri için e=YT ve e=TY olduğundan:
C=C2,C3= C2C3
Bu kümeye ait olasılıkların hesaplanabilmesi için S üzerine tanımlı P(.) olasılık küme
fonksiyonun belirlenmesi gereklidir:
e
TT
YT
TY
YY
P(Ci)
1/4
1/4
1/4
1/4
P(C)=P(C2C3)= P(C2)+P(C3)=1/4+1/4=1/2
P(A)=P(x=1)=P(C)=1/2
bulunur. Sonuç olarak R üzerine tanımlı bütün ayrık Ai olayları üzerinden P(A) küme
fonksiyonu da elde edilebilir:
x
0
1
2
P(Ai)=Pr(X=x)
1/4
1/2
1/4
ya da
 2  1 
Pr X  x     
 x  2 
2
xR.
Tanım (Olasılık kütle (mass) fonksiyonu): X şans değişkeni bir boyutlu R uzayında tanımlı
olsun. R kümesinin sayılabilir (sonlu ya da sonsuz) elemanlara sahip olduğu varsayılsın.
Böyle bir R uzayı kesikli noktaların kümesi olarak adlandırılır. Bu küme üzerinde eğer bir f(x)
fonksiyonu;
1. f x   0
2.
xR.
 f x   1
R
koşullarını sağlıyor ise X kesikli bir şans değişkenidir ve f(x) ise X şans değişkeninin olasılık
kütle (mass) fonksiyonu olarak adlandırılır.
Bir olasılık kütle fonksiyonu ile X şans değişkeninin olasılık dağılımı tam olarak
belirlenebilir. Şans değişkenine ait olasılık dağılımının belirlenmesinde kullanılabilecek diğer
bir fonksiyon ise F(x) birikimli dağılım fonksiyonudur.
X kesikli şans değişkenine ait olasılık küme fonksiyonu P(A) olsun. A kümesi gerçel sayılar
üzerinde - ile x aralığında olsun. Bu şekilde tanımlanmış tüm A kümeleri için olasılık
değerleri;
P(A)=Pr(xA)=Pr(Xx)
şeklinde elde edilebilir. Olasılık değerlerinin x noktasına bağımlı olduğu açıktır. Diğer bir
deyişle bu olasılık x noktasının bir fonksiyonudur. Bu özelliğe sahip fonksiyonlara birikimli
dağılım fonksiyonu denir.
Tanım (Birikimli dağılım fonksiyonu): Bir kesikli X şans değişkeninin birikimli dağılım
fonksiyonu,
F x   Pr X  x  
 f x 
X x
şeklinde tanımlanır. Tanım kümesi R gerçel sayılar ve görüntü kümesi =[0,1] dir.
Her x kesikli şans değişkeninin kendisine ait bir birikimli dağılım fonksiyonu mevcuttur. F(x)
fonksiyonu sadece  kümesinde değil tüm x değerlerinde tanımlıdır. F(x) fonksiyonu kesikli
şans değişkenleri için xR değerlerinde sıçramalara sahiptir. Bu sıçramaların büyüklüğü
Pr(X=x) olasılık değerine eşittir. Belirli x değerlerindeki bu sıçramalarda F(x) fonksiyonu
sürekli değildir. Bununla birlikte F(x) tanımlıdır çünkü sıçrama noktasında fonksiyon
sıçramadaki üst değeri alır. Bu özellik sağdan süreklilik olarak bilinir. Çünkü bir noktaya
sağdan
yaklaşıldığında
fonksiyon
süreklidir.
Sağdan
süreklilik
kümülatif
dağılım
fonksiyonunun tanımının bir sonucudur. Eğer F(x)=Pr(X<x) olarak tanımlansaydı, F(x) soldan
sürekli olacaktı. Bir kesikli şans değişkeni için F(x) fonksiyonu kullanılarak f(x) olasılık kütle
fonksiyonu belirlenebilir.
Teorem: X kesikli şans değişkeninin tanımlı olduğu değerler; x1  x2  x3   olsun:
f x1   F x1 
f xi   F xi   F xi 1  i>1 için.
Teorem: F(x) fonksiyonu ancak ve ancak aşağıdaki üç şart sağlandığında kesikli bir şans
değişkeninin birikimli dağılım fonksiyonudur.
1. lim F x   0 ve lim F x   1
x 
x 
2. lim F x  h  F x 
h0
F(x) sağdan sürekli bir fonksiyondur.
3. a<b için F(a)F(b)
F(x) fonksiyonu azalmayan bir fonksiyonudur.
Son özellik (-,b] şeklindeki bir aralık iki ayrık kümenin birleşimi olarak yazılarak
ispatlanabilir:
(-,b]= (-,a](a,b]
Bu kümelere ait olasılıklar:
F(b)=F(a)+Pr(a<xb)
Aksiyom 1 ile Pr(a<xb)0 olduğundan F(a)F(b) elde edilir. Bu sonuç oldukça kullanışlı
bir ilişkiyi de tanımlamaktadır:
Pr(a<xb)=F(b)-F(a)
2.2 SÜREKLİ ŞANS DEĞİŞKENLERİ
Aralarındaki boşluklar sayılabilen değerlerden oluşmayan, aksine belli aralıklardan ya da bu
aralıkların birleşimlerinden oluşan şans değişkenleri sürekli tipteki şans değişkenleri adını
almaktadır. Bu şekilde bir şans değişkeninin göreli frekans histogramı h(x) negatif olmayan
bir fonksiyondur ve bunun grafiği ile x ekseni arasında kalan alan 1’e eşittir. Bu nedenle
sürekli şans değişkenine ait bir dağılım söz konusu olduğunda oluşum sıklıklarının çok küçük
aralıklarda incelenmesi daha uygun bir yaklaşımdır. Sonsuz adet çok küçük değerin
toplanmasında integral işleminden faydalanılabilir. Örneğin uzunluğu x olan çok küçük
aralıklar için [x,x+x] olasılık değerinin tahmini göreli histogram fonksiyonu kullanılarak;
x  x
 h( x)dx
x
integralinden elde edilebilir. Bu yaklaşımda oluşum sıklıklarının aralığın uzunluğu ile orantılı
olduğu ve oransal çarpanın ise x ve dolayısı ile h(x) fonksiyonuna bağımlı olduğu
varsayılmıştır. Yaklaşımda ortaya çıkan hata aralık uzunluğu x değeri küçültülerek azaltılır.
Sonuç olarak histogramdaki sınıf sayısı n sınırsız bir şekilde artarken ve sınıf aralıklarının
uzunlukları sıfıra doğru düşerken h(x) fonksiyonunun limitinin ne olacağı önemli bir konudur.
Bu durumda h(x) adım fonksiyonunun sınırlarının gittikçe düzgünleşen bir fonksiyon olması
beklenir. Yeni fonksiyon f(x) ile temsil edilsin. Bu koşul X şans değişkeninin dağılımına
uygulandığında:
Prx  X  x  x   f x x
Bu eşitlikteki tam olasılık f(x) eğrisinin altında kalan alandır. Yaklaşık olarak hesaplanan alan
(olasılık) ise h(x) yüksekliğinin x uzunluğunun çarpımıdır. Sonuç olarak sürekli bir X şans
değişkeni için f(x) çok küçük aralıklara ait olasılıkların belirlenmesinde kullanılsa da
doğrudan doğruya bir olasılık değeri değildir. Şans değişkeni için olasılık yoğunluğunu atayan
bir fonksiyondur.
Tanım (Olasılık yoğunluk fonksiyonu):Tanım uzayı R bir aralık ya daralıkların birleşiminden
oluşan şans değişkeni X olsun. Bir f(x) fonksiyonu
1. f x   0
2.
xR.
 f x dx  1
R
koşullarını sağlıyor ise X sürekli bir şans değişkenidir ve f(x) ise X şans değişkeninin olasılık
yoğunluk fonksiyonu olarak adlandırılır.
Burada görülmektedir ki f(x) fonksiyonu da x ekseni ile grafiği arasındaki alan 1’e eşit olan
bir pozitif fonksiyondur.
Sürekli bir şans değişkeni için, AR olmak üzere, bir olasılık küme fonksiyonu P(A), olasılık
yoğunluk fonksiyonuna göre,
P A  Prx  A   f x dx
A
ifade edilebilir. Eğer f(x) sürekli bir X şans değişkeninin olasılık yoğunluk fonksiyonu ise ve
tanım uzayı üzerine belirlenen bir küme A={x:a<X<b} ise P(A)=Pr(xA) ifadesi;
b
Pra  X  b    f x dx
a
olarak yazılabilir. Pr(a<X<b) olasılığı; f(x)’in grafiği, x ekseni, x=a ve x=b ile sınırlanmış
alandır. Eğer A kümesi tek bir noktadan oluşuyor ise ;
a
P A  Prx  A  Pr X  a    f x dx  0
a
Nokta olasılığın sıfır olması nedeni ile;
Pra  X  b  Pra  X  b  Pra  X  b  Pra  X  b
eşitlikleri geçerlidir. Sürekli şans değişkenlerinin bu özelliğine dayanarak eğer iki olasılık
yoğunluk fonksiyonu sadece sıfır olasılığa sahip sonlu elemanlı bir küme için farklılık
gösteriyor ise bu iki olasılık küme fonksiyonunun tamamen aynı olduğu söylenebilir. Kesikli
şans değişkenleri bu özelliğe sahip değildir.
Matematik bakış açısıyla sonlu pozitif bir integrale (ya da toplama) sahip olan negatif
olmayan herhangi bir fonksiyon bir olasılık yoğunluk (ya da olasılık kütle) fonksiyonuna
dönüştürülebilir. Örneğin eğer h(x) bir A kümesi üzerinde pozitif ve diğer durumlarda sıfır
değerini alan herhangi bir negatif olmayan fonksiyon ise ve
 hx dx  K  
A
ise
f x  
1
h x 
K
fonksiyonu A kümesindeki değerleri alan bir X şans değişkeninin olasılık yoğunluk
fonksiyonudur.
Sürekli şans değişkenlerinin daha iyi anlaşılabilmesi için aşağıdaki örneğin incelenmesi
faydalı olacaktır.
Yarıçapı 1 birim ve merkezi iki boyutlu uzayın başlangıç noktası olan bir dairenin iç
bölgesinden bir noktanın seçilmesi şans deneyini oluştursun. Bu uzay S ile belirtilsin.
Dairenin alanı r2 eşitliğinden  olarak belirlenir. Rassal seçimin sonucunda noktanın S
üzerinde tanımlanan bir C kümesinden gelmesinin olasılığı, CS koşulu ile;
PC  
C kümesinin alanı

İlk olarak P(C)0 ve P(S)=1 olduğu görülebilir. Eğer C1 kümesi S kümesinin birinci bölgesini
tanımlayan bir alt küme ise P(C1)=1/4. Eğer C2 yarıçapı 1/3 olan ve C2S koşulunu sağlayan
bir daire ise P(C2)=1/9. Analitik geometriden bilindiği üzere bir noktanın, bir doğrunun ya da
bir eğrinin alanı sıfırdır. Bu nedenle bunlara ait olasılıklar da sıfır olacaktır. Örneğin C3
kümesi C2 ile tanımlanan dairenin sınırlarını (çemberini) tanımlıyor ise P(C1)=0.
Bu rassal deneye ait şans değişkeni orijinden seçilen bir noktaya olan uzaklık olsun. Şans
değişkeninin uzayı; R=x:0x1. Her hangi bir xR için Pr(X=x)=0 olacaktır. Çünkü X=x
olayı daire üzerinde rassal olarak seçilen bir noktaya karşılık gelen olayı tanımlamaktadır.
Diğer bir deyişle orijine uzaklığı (yarıçapı) x olan bir çemberi tanımlamaktadır ki buna
karşılık gelen alan sıfırdır. Bununla birlikte Xx ile tanımlanan bir olay için olasılık
araştırılabilir. Bu olayın olasılığı, xR koşulu ile, Pr(Xx):
Pr X  x  
x yarçaplı dairenin alanı

Bu olasılık X şans değişkenin birikimli dağılım fonksiyonuna karşılık gelmektedir ve
F x   Pr X  x   x 2 0x1
ya da,
0

F x    x 2
1

x0
0  x 1
1 x
şeklinde tanımlanabilir. Sürekli şans değişkenlerinde nokta olasılığı sıfır olduğu için, F ve f
fonksiyonlarını ilişkilendiren bir integral yaklaşımının kullanılması daha uygun olacaktır.
Tanım (Birikimli dağılım fonksiyonu): Eğer X sürekli bir şans değişkeni ve f(x) onun olasılık
yoğunluk fonksiyonu ise;
F x   Pr X  x  
x
 f t dt

Eşitliği ile tanımlanan F(x) fonksiyonu X şans değişkeninin birikimli dağılım fonksiyonu
olarak adlandırılır.
Teorem: Eğer F(x) ve f(x) fonksiyonları X şans değişkenin birikimli dağılım ve olasılık
yoğunluk fonksiyonları ise her hangi ab şeklinde tanımlanan iki gerçel değer için;
Pra  x  b  F b  F b .
Teorem: Eğer F(x) ve f(x) fonksiyonları X sürekli şans değişkenin birikimli dağılım ve
olasılık yoğunluk fonksiyonları ise:
f x  
dF x 
.
dx
Eğer X sürekli tipte bir şans değişkeni ise olasılık yoğunluk fonksiyonu f(x) her sonlu aralıkta
en fazla sonlu sayıda süreksizliğe sahip olabilir. Diğer bir ifade ile süreksiz olduğu nokta
sayısı sonsuz olamaz. Buradan;
a. F(x) dağılım fonksiyonunun her yerde sürekli olduğu,
b. f(x) fonksiyonunun sürekli olduğu her noktada F(x) fonksiyonunun X şans
değişkenine göre türevinin var olduğu ve bu türevin f(x) fonksiyonuna eşit olduğu
sonucu çıkarılabilir.
Tanım (Sürekli şans değişkeni için birikimli dağılım fonksiyonu): Bir şans değişkeni X eğer
F(x), şans değişkeni değerlerinin sürekli bir fonksiyonu ise sürekli şans değişkenidir.
Tanım: F(x) fonksiyonu bir X şans değişkeninin olasılık dağılımını tamamen belirler.
Bu tanım, (a,b), [a,b),(a,b] ve [a,b] şeklindeki tüm gerçel sayı aralıklarını içeren en küçük
sigma cebiri β ile gösterilirse, eğer Pr(xA) olasılığı sadece β’ deki A olayları için geçerli
ise doğrudur. Eğer olasılıklar olayların daha büyük bir sınıfı için tanımlanmış ise iki şans
değişkeninin aynı dağılım fonksiyonuna sahip olsalar bile her olay için aynı olasılık değerine
sahip olmamaları mümkündür.
Tanım: Şans değişkenleri X ve Y, AR’ deki her küme için, eğer Pr(xA)= Pr(yA) ise
özdeş dağılmışlardır.
İki şans değişkeninin özdeş dağılması onların eşit olduğu anlamına gelmez diğer bir deyişle
yukarıdaki tanım X=Y olduğunu söylemez
Bir olasılık küme fonksiyonu P(.) kullanılarak dağılım fonksiyonu F(x) belirlenebilir. Çok
kolay olmasa da bir dağılım fonksiyonu F(x) kullanılarak bir olasılık küme fonksiyonu P(.)
bulunabilir. Sonuç olarak P(.) ve F(x) fonksiyonlarının olasılık dağılımı ile ilgili aynı bilgiyi
verdikleri söylenebilir.
2.3 SÜREKLİ ŞANS DEĞİŞKENLERİ
Bir şans değişkeni dağılımının tamamen sürekli ya da kesikli olarak tanımlanamadığı
durumlarla da karşılaşmak mümkündür. Bu özelliğe sahip şans değişkenlerinin dağılım
fonksiyonları tamamen adım fonksiyon ya da tamamen sürekli olmayıp karma bir yapı
sergilerler. Eğer bir X şans değişkeninin dağılım fonksiyonu;
F(x)=aFk(x)+(1-a)Fs(x)
yapısında ise bu şans değişkeninin karma tipte bir şans değişkenidir. Burada 0<a<1 olup Fk(x)
ve Fs(x) sırası ile kesikli ve sürekli yapıların dağılım fonksiyonlarıdır.
Tanım: Kısmi kesikli ve kısmi mutlak sürekli olarak tanımlanan bir kümülatif dağılım
fonksiyonuna ait yoğunluk fonksiyonu eğer kümülatif dağılım:
F(x)=aFk(x)+(1-a)Fs(x)
ise
f(x)=afk(x)+(1-a)fs(x)
şeklindedir. Burada fk(x), Fk(x)’nin kesikli olasılık kütle fonksiyonu, fs(x) ise Fs(x)’nin olasılık
yoğunluk fonksiyonudur.
Örnek: Bir sürücü trafik ışıklarında beklemeden geçme ve bekleme süreleri için model
oluşturmak
istemektedir.
Işıktan
beklemeden
geçme
olasılığı
Pr(X=0)=0.4
olarak
belirlenmiştir. Işıkta bekleme süresi ise üstel dağılıma uymaktadır. Bu durumda;
Fk(x)=1,Fs(x)=1-ex ve a=0.4
alınarak,
F(x)=0.4+0.6(1-ex)
model belirlenir. Sürücünün 5 dakikadan az beklemesinin olasılığı:
Pr(X<0.5)=0.4+0.6(1-e0.5)=0.636
bulunur.
2.4 ÇOK DEĞİŞKENLİ ŞANS DEĞİŞKENLERİ
Bazı şans deneyi sonuçlarında çıktı üzerinde birden fazla özellik ile ilgilenilebilir. Bu gibi
durumlarda ortaya çıkan şans değişkeni modellerine çok değişkenli dağılımlar adı verilir. En
basit çok değişkenli model iki şans değişkenini içerir. Örneğin üç adet para atıldığında ilk iki
atışta gelen yazı sayısı bir değişkeni tüm üç atışta gelen yazı sayısı ikinci değişkeni
tanımlasın. Bu deneyin örnek uzayı:
S={e:e1=TTT, e2=TTY, e3=TYT, e4=YTT, e5=TYY, e6=YTY, e7=YYT, e8=YYY}
Bu örnek uzayı üzerine tanımlanmış iki şans değişkeni X1 ve X2:
X1(e1)=0
X2(e1)=0
X1(e2)=0
X2(e2)=1
X1(e3)=1
X2(e3)=1
X1(e4)=1
X2(e4)=1
X1(e5)=1
X2(e5)=2
X1(e6)=1
X2(e6)=2
X1(e7)=2
X2(e7)=2
X1(e8)=2
X2(e8)=3
olsun. Şans değişkeni fonksiyonları S örnek uzayındaki her bir elemanı gerçel değerli sıralı
sayı ikilileri uzayına;
R={(x1,x2):(0,0),(0,1),(1,1),(1,2),(2,2),(2,3)}
götürmektedir. Diğer bir deyişle bu şans değişkenlerinin uzayı iki boyutlu bir gerçel kümedir.
Tanım: Örnek uzayı S olan bir şans deneyi ele alınsın S uzayının her bir ei elemanını bir ve
yalnız bir sıralı sayı çiftine, X1(ei)=x1, X2(ei)= x2, atayan şans değişkenleri X1 ve X2 olsun. X1
ve X2 şans değişkenlerinin uzayı sıralı sayı ikililerinin kümesidir:
R={(x1,x2): X1(ei)=x1, X2(ei)= x2, eiS}
Amaç R uzayı üzerine tanımlanmış bir A olayının Pr[(x1,x2)A] ile ifade edilen olasılığının, S
örnek uzayında ona karşılık gelen bir C olayının,
C={e: eiS ve [X1(ei), X2(ei)]A}
olasılığını kullanarak,
Pr[(x1,x2)A]=P(C)
belirleyebilmektir. Burada P(.), S örnek uzayı üzerine tanımlı bir olasılık küme
fonksiyonudur. Pr[(x1,x2)A] ifadesinin bu olasılık küme fonksiyonu ile gösterimi:
Pr[(x1,x2)A]=P(A).
Bu sonucun belirlenebilmesi için S örnek uzayı üzerine tanımlı P fonksiyonunun belirlenmesi
gerektiği açıktır.
Konuyu açıklamak amacıyla örneğe geri dönüp R kümesi üzerinde bir A olayı;
A={(x1,x2):(1,1),(1,2)}
tanımlansın. P(A) değerinin bulunabilmesi için A kümesindeki (x1,x2) elemanlarına karşılık
gelen S örnek uzayındaki C kümesinin elemanları belirlenmelidir:
X1(e3)=1
X2(e3)=1
X1(e5)=1
X2(e5)=2
X1(e4)=1
X2(e4)=1
X1(e6)=1
X2(e6)=2
Burada;
P(A)=Pr[(x1,x2)A]=P(C)
koşulunu sağlayan C kümesi,
C={e: e3,e4,e5,e6}
belirlenmiştir. Olasılık küme fonksiyonu P(.)’nin belirlenmesi için paranın hilesiz olduğu
varsayımı ile P(Y)=P(T)=1/2 ve denemelerin birbirinden bağımsız olduğu varsayımı ile;
P({e1})=Pr[TTT]=1/8
Sonuç olarak;
ei
TTT
TTY
TYT
YTT
TYY
YTY
YYT
YYY
P({ei})
1/8
1/8
1/8
1/8
1/8
1/8
1/8
1/8
(x1,x2)
(0,0)
(0,1)
(1,1)
(1,2)
(2,2)
(2,3)
Pr[(x1,x2)]
1/8
1/8
2/8
2/8
1/8
1/8
ve P(A)=1/2 elde edilir.
Tanım (Ortak olasılık kütle fonksiyonu): Eğer X ve Y tanım uzayı R olan iki kesikli şans
değişkeni ise tanım aralığındaki tüm (x,y) sıralı ikilileri için ancak ve ancak,
1. f(x,y)0
2.
(x,y)R.
 f x, y   1
x
y
koşullarını sağlıyor ise f(x,y)= Pr[X=x,Y=y] fonksiyonu X ve Y kesikli şans değişkenlerinin
ortak olasılık kütle fonksiyonudur.
Tanım (Ortak birikimli dağılım fonksiyonu): Eğer X ve Y tanım uzayı R olan iki kesikli şans
değişkeni ise ve f(s,t) kesikli şans değişkenlerinin ortak olasılık kütle fonksiyonu ise
F x, y   PrX  x, Y  y    f s, t 
s x t  y
fonksiyonu X ve Y kesikli şans değişkenlerinin ortak birikimli dağılım fonksiyonudur.
Yukarıda kesikli şans değişkenleri için verilen fonksiyon tanımları tek değişkenli durumda
açıklanan bazı küçük farklılıklar dikkate alınarak sürekli şans değişkenleri için de verilebilir.
Tanım (Ortak olasılık yoğunluk fonksiyonu): Eğer X ve Y tanım uzayı R olan iki sürekli şans
değişkeni ise tanım aralığındaki tüm (x,y) sıralı ikilileri için ancak ve ancak,
1. f(x,y)0
2.
(x,y)R.
 f x, y dxdy  1
R
koşullarını sağlıyor ise f(x,y) fonksiyonu X ve Y sürekli şans değişkenlerinin ortak olasılık
yoğunluk fonksiyonudur.
Sürekli şans değişkenleri X ve Y için bir olasılık küme fonksiyonu P(A) olsun. Eğer A alt
kümesi;
A={(u,v):ux,vy}
yapısında sınırsız bir küme ise araştırılan olasılık değeri,
P(A)=Pr [(x,y)A]=Pr[Xx,Yy]
ile tanımlanabilir. Bu olasılık değeri (x,y) noktasının bir fonksiyonu olup bu fonksiyon X ve Y
sürekli şans değişkenlerinin ortak birikimli dağılım fonksiyonudur.
Tanım (Ortak birikimli dağılım fonksiyonu): Eğer X ve Y tanım uzayı R olan iki sürekli şans
değişkeni ise ve f(s,t) sürekli şans değişkenlerinin ortak olasılık yoğunluk fonksiyonu ise
F x, y   PrX  x, Y  y  
x y
  f s, t dsdt

fonksiyonu X ve Y sürekli şans değişkenlerinin ortak birikimli dağılım fonksiyonudur.
Eğer A alt kümesi;
A={(x,y):aXb,cYd}
ise araştırılan olasılık değeri ortak olasılık yoğunluk fonksiyonu kullanılarak:
b d
P A  Pra  X  b, c  Y  d     f x, y dxdy
a c
bulunabilir. R uzayı üzerinde tanımlı bir A kümesinin olasılığı f(x,y) fonksiyonu ile
bulunabileceği gibi F(x,y) fonksiyonu ile de hesaplanabilir. Eğer P(A)= Pr[a<X<b;c<Y<d] ise
Pr[a<X<b;c<Y<d]=F(b,d)-F(b,c)-F(a,d)+F(a,c).
İki değişkenli sürekli dağılımlarda yoğunluk ve dağılım fonksiyonları arasındaki ilişki:
f  x, y  
 2 F  x, y 
xy
ile tanımlanmıştır.
İki şans değişkenli durum için elde edilen sonuçlar n adet şans değişkenli durum için
genellenebilir. Şans değişkenlerinin kesikli olması durumunda ortak olasılık kütle fonksiyonu;
f x1 ,, xn   PrX 1  x1 ,, X n  xn 
ve ortak birikimli dağılım fonksiyonu;
F x1 ,, xn   PrX 1  x1 ,, X n  xn 
olup sürekli şans değişkenleri için ise ortak birikimli dağılım fonksiyonu;
x1
xn


F x1 ,, xn      f t1 ,, t n dt1  dt n
ve ortak olasılık yoğunluk fonksiyonu;
f x1 ,, xn  
 n F x1 ,, xn 
.
x1 xn
2.5 MARJİNAL DAĞILIMLAR
Marjinal dağılımlar birden fazla şans değişkenine sahip olasılık dağılımları için söz
konusudur. X ve Y şans değişkenlerinin ortak olasılık kütle/yoğunluk fonksiyonu f(x,y) olsun.
Tanımlanan iki değişkenli dağılımda A={x:a<x<b} olayı ile ilgilenilsin. Bu olay ancak ve
ancak B={(x,y):a<x<b;-<y<} olayı oluştuğunda gerçekleşebilir. Gerçekte bu iki olay
birbirine denktir ve aynı olasılığa sahiptirler. B olayının olasılığı, sürekli değişkenler için;
b 
Pra  x  b;  y    
 f x, y dydx
a 
ve kesikli değişkenler için;
b

a

Pra  x  b;  y     f x, y 
eşitliklerinden elde edilir. İşlem iki aşamalıdır. İlk aşamada y değişkeni integral ya da toplama
işlemi ile elimine edilir:
g x  

 f x, y dy

ya da g x    f x, y 
y
Sadece x değişkenine bağlı olarak elde edilen g(x) fonksiyonu marjinal olasılık kütle/yoğunluk
fonksiyonu olarak adlandırılır. A olayı için araştırılan olasılık marjinal olasılık fonksiyonu
kullanılarak
b
b
a
a
Pra  x  b   g x dx ya da Pra  x  b   g x 
hesaplanır. f(x,y) iki değişkenli dağılımda değişkenlerden sadece birinin davranışı ile
ilgilenildiğinde, marjinal dağılıma gereksinim vardır.
Tanım (Kesikli marjinal dağılımlar): X ve Y kesikli şans değişkenleri, f(x,y)’de bunların ortak
olasılık kütle fonksiyonu ise X şans değişkeninin tanım aralığındaki her x için,
g x    f x, y 
y
ile gösterilen fonksiyona X’in marjinal dağılımı
h y    f x, y 
x
fonksiyonuna ise Y’nin marjinal dağılımı denir
Tanım (Sürekli marjinal dağılımlar): X ve Y sürekli şans değişkenleri, f(x,y)’de bunların ortak
olasılık yoğunluk fonksiyonu ise X şans değişkeninin tanım aralığındaki her x için,
g x  

 f x, y dy

ile gösterilen fonksiyona X’in marjinal dağılımı
h y  

 f x, y dx

fonksiyonuna ise Y’nin marjinal dağılımı denir
Marjinal dağılımların bilinmesi durumunda kümülatif marjinal dağılımlar elde edilebilir.
Kesikli X şans değişkeni için,
F x  
  f x, y    g x
  x y
 x
 F x, 
Sürekli X şans değişkeni için,
F x  
x 

f s, t dtds 

x
 g s ds

 F x,  .
2.6 KOŞULLU DAĞILIMLAR
İlk bölümde koşullu olasılık kavramı bir örnek uzayı üzerinde tanımlı olaylar üzerinden
açıklanmıştı. Bu kavram şans değişkenleri ve onlara ait olasılık fonksiyonları ile
genişletilebilir. f(x,y) iki değişkenli dağılış olsun. Y şans değişkeninin bilinen değerleri için X
şans değişeninin yoğunluğu ile ilgilenilsin. Bu yoğunluk f(x/y) ile temsil edilir.
Tüfekle yapılan atışta Y değişkeninin gözlendiğini fakat X değişkeninin elde edilemediği
varsayılsın. Elde edilen Y değerine karşın X şans değişkeninin a<X<b aralığında olma
olasılığı
Pr[a<X<b/Y=y]
olup bu olasılık kesikli şans değişkenleri için,
b
Pra  X  b / Y  y    f x / y 
a
Sürekli şans değişkenleri için,
b
Pra  X  b / Y  y    f x / y dx
a
şeklinde hesaplanır.
Tanım (Kesikli/Sürekli şans değişkenleri için koşullu dağılım):Kesikli şans değişkenleri X ile
Y’nin ortak olasılık kütle/yoğunluk fonksiyonu f(x,y) ve Y şans değişkeninin marjinal dağılımı
h(y) ise, verilen Y=y için X şans değişkeninin koşullu dağılımı:
f x / y  
f x, y 
h y 
h(y)  0
X şans değişkeninin marjinal dağılımı g(x) ise verilen X=x için Y şans değişkeninin koşullu
dağılımı:
f  y / x 
f x, y 
g x 
g(x)  0
İkiden daha fazla şans değişkeninin tanımladığı ortak dağılımlarla çalışıldığında, ister kesikli
isterse sürekli olsun, farklı yapıda koşullu dağılışlar ile karşılaşılabilir. Örneğin f(x1,x2,x3,x4)
ortak olasılık kütle/yoğunluk fonksiyonu olsun. Verilen bir X1=x1,X2=x2 ve X3=x3 için X4
değişkeninin koşullu dağılımı:
f x4 / x1 , x2 , x3  
f x1 , x2 , x3 , x4 
.
g x1 , x2 , x3 
Benzer bir yaklaşımla ortak koşullu dağılımlarda tanımlanabilir. Örneğin verilen bir X1=x1 ve
X2=x2 için X3 ve X4 şans değişkenlerinin koşullu ortak dağılımı:
f x3 , x4 / x1 , x2  
f x1 , x2 , x3 , x4 
.
g x1 , x2 
Örnek: X1 ve X2 sürekli şans değişkenleri olsun. f(x1,x2) ortak olasılık yoğunluk fonksiyonu ve
g(x1) ise marjinal olasılık yoğunluk fonksiyonu ise f(x2/x1) koşullu fonksiyonunun sürekli bir
şans değişkenine ait olasılık yoğunluk fonksiyonu olduğunu gösteriniz.
Çözüm: 1) f(x1,x2)0 ve g(x1)0 olduğundan.
f x2 / x1  
2)
 f x
2
f x1 , x2 
 0.
g x1 
/ x1 dx2  

f x1 , x2 
1
dx2 
f x1 , x2 dx2
g x1 
g x1  
g x1 
g x1 
=1.
2.7 BAĞIMSIZ ŞANS DEĞİŞKENLERİ
Eğer şartlı olasılık f(x/y), Y şans değişkenini içermiyorsa, olasılıksal anlamda, X şans
değişkeni Y şans değişkeninden bağımsızdır. Ortak olasılık yoğunluk/kütle fonksiyonları
f(x,y) ve marjinal olasılık yoğunluk/kütle fonksiyonları g(x) ve h(y) olan (kesikli ya da sürekli)
şans değişkenleri X ve Y olsun. Koşullu dağılışın özelliği kullanılarak,
f(x,y)= f(x/y) h(y)
yazılabilir. Burada f(x/y) fonksiyonu Y değişkenine bağımlı değilse X şans değişkeninin
marjinal olasılık yoğunluk/kütle fonksiyonu (sürekli şans değişkeni için):
 f x, y dy   f x / y h y dy
g x   f x / y  h y dy
g x   f x / y 
elde edilir. Bu sonuç kullanılarak, f(x/y) fonksiyonu Y değişkenine bağımlı olmadığında,
f(x,y)= g(x) h(y)
yazılabilir. Diğer bir deyişle verilen bir Y=y değeri için X şans değişkenin koşullu dağılımı Y
ile ilgili her hangi bir varsayımdan bağımsız ise f(x,y)= g(x) h(y) yazılabilir.
Tanım (Bağımsız şans değişkenleri): X ve Y şans değişkenleri ancak ve ancak
f(x,y)= g(x) h(y)
koşulu sağlanıyor ise birbirinden bağımsızdır. Bağımsız değiller ise bağımlıdırlar.
Teorem: Marjinal olasılık kütle/yoğunluk fonksiyonları g(x) ve h(y) olan birbirinden
bağımsız iki şans değişkeni X ve Y olsun. a, b, c, d sabitler olmak üzere her a<b ve c<d için:
Pr[a<X<b; c<Y<d]=Pr[a<X<b]Pr[c<Y<d].
İspat: X ve Y birbirinden bağımsız olduğu için, sürekli şans değişkenleri için;
b d
b d
a c
a c
Pr[a  X  b, c  Y  d ]    f x, y ,dxdy    g x h y dxdy
b
d

   g x dx    h y dy 
a
 c

=Pr[a<X<b]Pr[c<Y<d].
Teorem:
Ortak
olasılık
yoğunluk/kütle
fonksiyonları
f(x,y)
ve
marjinal
olasılık
yoğunluk/kütle fonksiyonları g(x) ve h(y) olan (kesikli ya da sürekli) şans değişkenleri X ve Y
olsun. X ve Y ancak ve ancak
a.f(x,y) fonksiyonu, sadece X değişkeninin bir fonksiyonu olan ve negatif olmayan bir
fonksiyon ile sadece Y değişkeninin bir fonksiyonu olan ve yine negatif olmayan bir
fonksiyonun çarpımı olarak;
f(x,y)=u(x)v(y)
yazılabiliyor ise,
b. X için tanım kümesi A ve Y için tanım kümesi B olmak koşulu ile iki değişkenli
dağılımın tanım kümesi R={(x,y): f(x,y)>0};
R=AB
bir Kartezyen çarpımdan elde edilmiş ise birbirinden bağımsızdır.
İspat a: X ve Y birbirinden bağımsız ise marjinal olasılık fonksiyonları kullanılarak,
f(x,y)= g(x)h(y)
yazılabilir. Marjinal olasılık kütle/yoğunluk fonksiyonu oldukları için negatif olmayan
fonksiyonlardır bu nedenle koşul sağlanır. Buna karşın f(x,y)=u(x)v(y) yazılabiliyor ise:
g x    ux v y dy  ux  v y dy  c1ux 
h y    ux v y dx  v y  ux dx  c2 v y 
burada c1 ve c2 sabitlerdir. Olasılık yoğunluk fonksiyonu tanımından:
 f x, y dxdy   uxv y dxdy


1   ux dx  v y dy

1  c1c2
olmalıdır. Sonuç olarak:
f(x,y)= g(x)h(y)= u(x)v(y).
İki şans değişkeni için elde edilen sonuçlar n adet şans değişkeni için genellenebilir.
Teorem: X1,…,Xn şans değişkenleri ancak ve ancak aşağıdaki özellikler sağlanıyor ise
F(x1,…,xn)=F(x1)…F(xn)
f(x1,…,xn)=f(x1)…f(xn)
birbirinden bağımsızdır.
Download