BÖLÜM 3 ŞANS DEĞİŞKENLERİNİN BEKLENEN DEĞER VE MOMENTLERİ Matematiksel beklenti kavramı şans oyunlarından doğmuştur. En yalın biçimiyle, bir oyuncunun kazanabileceği miktar ile kazanma olasılığının çarpımıdır. Sözgelimi büyük ödülün 4800TL olduğu bir çekilişteki 10.000 biletten birine sahip olan bir kişinin matematiksel beklentisi 4800*1/10.000 = 0,48 TL olur. 3.1 BEKLENEN DEĞER ve ÖZELLİKLERİ Beklenen değer ya da matematiksel beklenti kavramı matematiğin istatistik bilimine yaptığı bir katkı olarak düşünülebilir. Bir X şans değişkeninin ya da bu şans değişkeninin herhangi bir g(x) fonksiyonunun beklenen değeri, değişkenin tüm değerleri üzerinden, olasılık fonksiyonun ortalama değerinin bulunmasıyla elde edilir. Beklenen değer teorik ya da ideal değerdir. Her hangi bir denemede X şans değişkeninin beklenen değerini alması gerçekte beklenemez. Bir X şans değişkeni için matematiksel beklenti ya da beklenen değer E(X) ile gösterilir. Bu bakış açısıyla sürekli bir şans değişkeninin beklenen değerinin nasıl hesaplanması gerektiği sorusu akla gelebilir. Örneğin X, olasılık yoğunluk fonksiyonu f ile tanımlanan ve f fonksiyonu [0,1] aralığı dışında 0 olan bir şans değişkeni olsun. Burada X, 1 2 n 1 , ,..., ,1 değerlerini alan n n n kesikli bir şans değişkeni Y olarak ele alınabilir. X şans değişkeninin frekanslarını dikkate k 1 k alarak olasılıkları , aralığına atayan fonksiyon, n n k k k 1 X f x dx P Y P n k 1 n n n k n olsun. Bu ifade büyük n değerleri için f cinsinden yaklaşık olarak, k n 1 k k P Y f x dx f n k 1 n n n şeklinde tanımlanır. Ağırlık merkezi yorumuna göre Y’nin beklenen değeri E(Y), X’in beklenen değeri E(X)’e yakınsamalıdır. Yukarıdaki eşitlik kullanılarak, n k k n k k1 E Y P Y f n k 1 n n n k 1 n elde edilir. Belirli integralin tanımından, büyük n değerleri için sağ taraftaki ifade için yaklaşık olarak, 1 1 xf x dx 0 sonucu bulunur. Tanım (Beklenen değer): Bir X şans değişkeninin olasılık fonksiyonu f(x) olsun. Şans değişkeninin beklenen değeri, kesikli ve sürekli şans değişkenleri için sırasıyla, E( X ) x f ( x) x E ( X ) xf ( x)dx x herhangi tipteki bir şans değişkeni için, E( X ) 0 0 1 F xdx F xdx eşitlikleri ile tanımlanır. Bu eşitlik gerçekte X şans değişkeninin bir ağırlıklı ortalamasıdır. Burada ağırlıkları olasılıklar tanımlamaktadır. Diğer bir ifade ile X şans değişkeninin tanımladığı f(x) yoğunluğunun ağırlık merkezinin X eksenindeki değeridir. Beklenen değerin tanımlı olabilmesi için toplam ya da integral işlemlerinin yakınsak olması gereklidir. Ayrıca E(X) ifadesine X’in beklenen değeri ya da ortalaması denir. E(X), f ile gösterilen fonksiyonun ağırlık merkezidir: EX xf x dx xf x dx f x dx Bir şans değişkenin beklenen değeri, şans değişkeninin olasılık fonksiyonuna ya da birikimli dağılım fonksiyonuna göre tanımlandığı için şans değişkeni referans alınmadan bu fonksiyonlara göre elde edilebilir. Yukarıdaki tanım dikkate alındığında sonlu bir beklenen değere sahip her şans değişkeni için, E (X ) yazılabilir. Diğer bir ifade ile şans değişkenin beklenen değeri anakütle ortalamasına eşittir. Daha önce belirtildiği üzere beklenen değer mevcut olmayabilir. Sorun, toplamların veya integrallerin ıraksak ya da belirsiz olması problemidir. Bir şans değişkeninin beklenen değeri, a) sonlu bir reel sayı olabilir, b) sonsuz (integral ya da toplam sonucu ıraksak ise) olabilir, c) var olmayabilir (integral ya da toplam sonucu belirsiz ise). 2 Sürekli değişkenlerden beklenen değeri var olmayanlara bir örnek Cauchy dağılışı gösteren şans değişkenidir. Cauchy dağılımının olasılık yoğunluk fonksiyonu, f x 1 , 1 x2 x için olup, bu şans değişkeni için, 1 E X x. dx ln 1 x 2 2 2 1 x 1 belirsizliği ortaya çıktığı için beklenen değer yoktur. Beklenen değerin sonsuz olduğu durum için verilebilecek örnek de α = 1 olan Pareto dağılımıdır. Sürekli şans değişkeni X’in beklenen değeri E(X)’teki integral için tanımlanan bu özellikler kesikli şans değişkeni X’in beklenen değeri E(X)’teki toplama işlemi için de geçerlidir. Beklenen değer işlemi ile temel özellikler aşağıdaki teorem ile verilmiştir. Teorem: X şans değişkenin anakütle ortalaması ve a ile b sabit sayılar olmak üzere: 1. E a a 2. EaX aE X 1 1 3. Genelde E ( X ) 0 için E X E( X ) Özellik (1) ve (2)’nin bir sonucu olarak tanımlanabilecek E aX b durumu ise Kısım 3.4’de açıklanmıştır. İspat: İspat sürekli şans değişkenleri için verilmiştir. 1. E a af x dx a f x dx a 2. E aX axf x dx a xf x dx a 3. Bkz. Jensen eşitsizliği n i 0 i n Teorem: E (a bX ) n aib n i E ( X n i ) n n n i İspat: (a bx) n a i bx olduğuna göre, i 0 i n n n n E (a bX ) n E a i b n i X n i a i b n i E ( X n i ) i 0 i i 0 i 3 Beklenen değer ile ilgili diğer özellikler ileriki kısımlarda açıklanacaktır. Beklenen değer şans değişkeninin anakütle ortalamasına eşit olduğundan sonuç olarak bir yer ölçüsüdür. Bir sonraki kısımda şans değişkenleri için kullanılabilecek diğer yer ölçülerinden bazıları tanıtılacaktır. 3.2 TEMEL YER ÖLÇÜLERİ Şans değişkeni dağılımını farlı bakış açıları ile tanımak amacıyla farklı yer ölçüleri kullanılmaktadır bu yer ölçülerinden bazıları aşağıda tanıtılmıştır. Tanım (Kantil): X şans değişkeninin ya da ona ait dağılımın p-inci kantili xp ile gösterilir ve F(xp)p koşulunu sağlayan en küçük şans değişkeni değeridir. Eğer X sürekli bir şans değişkeni ise pinci kantil F(xp)=p koşulunu sağlayan en küçük şans değişkeni değeridir. Tanım (Medyan): X şans değişkeninin ya da ona ait dağılımın 0.5-inci kantili x0.5 ile ya da M gösterilir ve medyan olarak adlandırılır. Genel olarak: Pr[XM]1/2 ya da Pr[XM]1/2 tanımlanır. Eğer X sürekli bir şans değişkeni ise medyan: M f x dx 1 / 2 f x dx . M Medyan veya ortanca, bir frekans dağılımında frekansları iki eşit parçaya bölen şans değişkeni değeridir. Bir şans değişkeninin en çok rastlanan değerine mod denir. Bir frekans dağılımında, özellikle homojen olmayan dağılımlarda birden fazla mod değeri bulunabilir. Mod değeri olmayan dağılımlar da vardır. Tanım (Mod): X şans değişkenine ait olasılık fonksiyonunun x x0 noktasında bir maksimum değeri f(x0) var ise x0 değeri mod olarak adlandırılır. Eğer X sürekli bir şans değişkeni ise: df x 0 dx x x0 Bir kesikli değişkenin modu, frekansların maksimum olduğu değişken değeridir. f(x)’i maksimum yapan şans değişkeni değeridir. Yukarıda açıklanan yer ölçüleri farklı değerler alabileceği gibi dağılım biçiminin özel bir durumunu tanımlayan simetrik dağılımlarda her üç yer ölçüsü de aynı değere sahiptir. Tanım (Simetri): Olasılık fonksiyonu f(x) için, 4 f x c f x c özelliğine sahip olan dağılımlar c noktasına ya da diğer bir deyişle x c doğrusuna göre simetriktir. Eğer bir f(x) dağılımı c noktasına göre simetrik ve anakütle ortalaması sonlu ise c olmalıdır. 3.3 VARYANS Şans değişkeninin dağılımı ile ilgili önemli bir ölçü grubu da yayılım ölçüleridir. Aşağıda bazı önemli yayılım ölçüleri kısaca açıklanmıştır. Tanım (Varyans): X bir şans değişkeni ve E X ise şans değişkeninin varyansı V(X) ile ya da 2 ile gösterilir. Kesikli ve sürekli şans değişkenleri için sırasıyla, x V X E X 2 2 i f xi i x V X E X 2 2 f x dx ve herhangi bir şans değişkeni için ise, V X 2 x1 F x F x dx 2 0 şeklinde tanımlanır. Varyansın mevcut olabilmesi için toplam serisinin ya da integralin yakınsak olması gereklidir. Bir şans değişkenin beklenen değerin de olduğu gibi varyansı da, şans değişkeninin olasılık fonksiyonuna ya da birikimli dağılım fonksiyonuna göre tanımlandığı için şans değişkeni referans alınmadan bu fonksiyonlara göre tanımlanabilir. Gözlenen değerleri ortalamaya göre uzaklaşmaya meyilli X şans değişkenine göre değerleri ortalama civarında olan bir Y şans değişkenin varyans değerleri karşılaştırıldığında X şans değişkeninin varyansı daha büyük değerler aldığından varyans bir yayılım ölçüsüdür. Varyansın formülleri incelendiğinde negatif olmayan değerlere sahip bir ölçüt olduğu görülebilir. Varyans şans değişkeni ile aynı ölçü birimine sahip değildir. Varyansın bu eksikliğini gideren yayılım ölçüsüne ise standart sapma denir. Tanım (Standart sapma): X şans değişkeninin standart sapması ile gösterilir ve V X ile tanımlanır. Pek çok uygulamada şans değişkeni ile aynı ölçü birimine sahip olduğu için varyansa göre tercih edilir. Varyansa ait temel bazı özellikler aşağıda verilmiştir. 5 Teorem: Bir sabitin varyansı sıfırdır. V c 0 İspat: V c E c Ec 2 0 . Teorem: Bir sabit ile bir şans değişkeninin çarpımının varyansı: V cX c 2V X c EX E X . İspat: V cX E cX EcX 2 E cX cE X 2 2 2 c0 ise, bir rasal değişkenin değerlerinin sabit bir sayıyla çarpılması varyansın da aynı sabit sayının karesiyle çarpılması demek olduğundan, dağılım yayıklığında da ona uygun bir değişmeyle karşılaşılır. Teorem: Bir sabit ile bir şans değişkeninin toplamının varyansı: V c X V X EX E X İspat: V c X E c X Ec X 2 E c X c E X 2 2 Teoremin sonucuna göre; bir rassal değişkenin değerlerine sabit bir sayının eklenmesinin x’in bütün değerlerinin sağa ya da sola kaymasına yol açtığını ama onun dağılım yayıklığını hiç etkilemediği görülmektedir. Varyans, şans değişkeninin beklenen değeri etrafındaki yoğunlaşmasının zayıf bir ölçütüdür. Bununla birlikte simetrik dağılışlar için yeterli bir ölçüdür. Varyans özellikle asimetrik dağılışlar ve yoğunluğun küçük bir kısmının ortalamadan oldukça uzak olduğu dağılımlar için yetersiz bir yayılım ölçüsüdür. Bir şans değişkeninin varyansının her zaman varolması gerekli değildir. 3.4 ŞANS DEĞİŞKENİNİN BİR FONKSİYONUN BEKLENEN DEĞERİ Bazı durumlarda doğrudan X şans değişkeni ile değil onun bir fonksiyonu y g x şeklinde ortaya çıkan şans değişkenleri ile ilgilenilir. Bu gereksinim genellikle araştırmalarda şans değişkenine ait ölçü biriminin değiştirilmesi gerekli olduğunda ortaya çıkar. Örneğin ısı Celsius biriminden ölçümlendiğinde ve bu veriler Fahrenheit’e dönüştürüldüğünde beklenen değer bu döüşümden nasıl etkilenir? Burada yeni tanmlanan şans değişkeni Fahrenheit ölçü birimine sahiptir ve Celsius ile aralarında, a ve b sabitler olmak üzere, g x ax b ilişkisi vardır. Sonuç olarak, sürekli şans değişkenleri için, E aX b ax bf xdx x 6 a xf x dx b f x dx x x aE X b elde edilir. Benzer bir sonuç kesikli şans değişkenleri için de bulunabilir. Beklenen değer alma işlemi doğrusal bir operasyondur. Bu nedenle X’ in doğrusal bir fonksiyonunun beklenen değeri sabitlerin etkisi dikkate alınarak kolayca bulunabilir. Tanım: X olasılık fonksiyonu f (x) olan bir şans değişkeni olsun. Şans değişkeninin bir fonksiyonunun g (x) ’ in beklenen değeri kesikli ve sürekli şans değişkenleri için sırasıyla, Eg ( x) g ( x) f ( x) x Eg ( x) g ( x) f ( x)dx tanımlanır. Teorem: X bir şans değişkeni, f(x)’de onun olasılık fonksiyonu c1, c2…,cn birer sabit sayı ise gi(x) i=1,…,n fonksiyonlarının sabitlerle çarpımlarının toplamının beklenen değeri: n n E ci g i ( x) ci Eg i ( x). i 1 i 1 n n n İspat: E ci g i ( x) ci g i ( x). f ( x) ci g i ( x) f ( x) i 1 x x i 1 i 1 n n = ci g i ( x) f ( x) ci Eg i ( x). i 1 x i 1 Teorem: X bir şans değişkeni, f(x)’de onun olasılık fonksiyonu olmak üzere, eğer tüm x değerleri için g1 ( x) 0 ise Eg1 ( x) 0 . Teorem: X bir şans değişkeni, f(x)’de onun olasılık fonksiyonu olmak üzere, eğer tüm x değerleri için g1(x) g2(x) ise E[g1(x)] E[g2(x)] . Teorem: X bir şans değişkeni ve a, b ise sabitler olsun. Beklenen değerleri mevcut g (x) , fonksiyonları için eğer tüm X değerleri için a g ( x) b ise a Eg ( x) b . 3.6 OLASILIK ÜZERİNE EŞİTSİZLİKLER Beklenen değer kavramı kullanılarak olasılıklar üzerine bazı eşitsizlikler elde edilebilir. Bu eşitsizliklerin en önemlileri Chebyshev ve Jensen eşitsizlikleri olarak bilinir. 7 3.6.1 Chebyshev Eşitsizliği Chebyshev teoremi belirli bir olasılık için üst sınırın bulunmasına imkan verir. Bu sınırların tam olasılık değerlerine eşit ya da yakın olması gerekli değildir. Bu nedenle bir olasılık değerine yakınsamak için genelde bu teorem kullanılmaz. Bu teoremin ana kullanım alanlarından biri Büyük Sayılar Kanunudur. Teorem: Şans değişkeni X’in olasılık fonksiyonu f(x) ve negatif olmayan bir fonksiyonu g(x) olsun. Eğer E[g(x)] mevcut ise her bir pozitif k sabiti için; Prg x k Eg x k İspat: Şans değişkeni X için A={x:g(x)k} olsun. Bu durumda, Eg x g x f x dx g x f x dx x g x f xdx Ac A Eşitliğin sağındaki her iki integral de negatif olmayan değerlere sahip olduğundan, Eg x g x f x dx A Eğer xA bu durumda g(x)k olacağı için g(x) yerine k yazılması eşitsizliğin sağ tarafının değerini artırmaz. Eg x k f x dx A Burada f xdx Prx A Prg x k olduğundan, A Eg x k Prg x k İspat tamamlanır. Açıklanan teoerem, Chebyshev eşitsizliği olarak adlandırılan bir eşitsizliğin genellenmiş şeklidir. Bir şans değişkenin olasılık dağılımından bağımsız sadece beklenen değer ve varyans bilgileri kullanılarak şans değişkeni ile ilgili bazı olasılık eşitsizlikleri elde edilebileceği, Rus matematikçisi Chebyshev tarafından ispatlanmıştır. Teorem: Şans değişkeni X’in bir olasılık dağılışına ve sonlu varyansa sahip olduğu varsayılsın, (bu durumda mutlaka sonlu bir anakütle ortalaması vardır). Bu koşul altında her k 0 için, a) Markov eşitsizliği, g x x , r 0 alınarak, r Exk . r Pr x k r r r b) Markov eşitsizliğinde özel durum olarak r 2 alınarak, 8 Exk 2 Pr x k 2 2 2 2 k2 ve k c alınarak, 2 2 Pr x c 2 2 1 c2 Pr x c 2 2 1 1 c2 ve sonuç olarak Pr c x c 1 1 . c2 bulunur. Burada c değeri birden büyük olarak alınır. Yukarıda verilen teoreme göre ile , X rassal değişkeninin ortalaması ve standart sapması ise, herhangi bir pozitif c sabiti için X’in ortalamanın iki yanında c standart sapma aralığında bir değer alabilme olasılığı en az 1 1 c2 kadardır. Örneğin, X rassal değişkeninin ortalamanın her iki yanında, iki standart sapma aralığında bir değer alma olasılığı en az 1-(1/22)=3/4; 3 standart sapma aralığında bir değer alma olasılığı 1-(1/32)=8/9; 5 standart Sapma aralığında bir değer alma olasılığı 1-(1/52)=24/25 olur. Elde edilen sonuçlar şans değişkeninin standart sapmasının, değişkenin yayılımını etkileyen önemli bir faktör olduğunu belirtmektedir. Chebyshev teoreminin verdiği olasılığın bir alt sınır olduğu açıktır. Belli bir rassal değişkenin ortalamanın iki yanında c standart sapma aralığında bir değer alma olasılığının 1-(1/c2)’den büyük olup olmadığını bilinemez ama Chebyshev teoremi bu olasılığın kesinlikle 1-(1/c2)’den 9 küçük olamayacağını söyler. Bir rassal değişkenin dağılımı bilinirse ancak o zaman tam olasılık hesaplanabilir. 3.6.2 Jensen Eşitsizliği Şans değişkeninin g(x) ile tanımlanan bir fonksiyonunun gerçek dağılışı hesaplanmadan Eg x ile g E X arasındaki ilişki belirlenebilir. g x ax b doğrusal dönüşümün de Eg x g E X olduğu bilinmektedir. Fakat bu eşitliği başka g fonksiyonları için kullanmak yaygın bir yanlıştır. Aslında bu eşitlik doğrusal olmayan g için oldukça ender ortaya çıkar. Örneğin, mikro elektronik parçalar üreten bir firmanın günlük üretim hedefinin 240 çip üretmek olduğu fakat ardışık üç günde sırasıyla 40, 60 ve 80 çip ürettiği varsayılsın. Bu üç günün ortalama üretimi 60 çiptir ve hedef değere ulaşılabilmesi için bu ortalamanın 4 katı üretim yapılması gerekmektedir. Bir başka bakış açısı da şudur: belirtilen 3 günde üretim miktarı sırasıyla 240/40 = 6, 240/60 = 4 ve 240/80 = 3 kat fazla olmalıydı. Bu değerlerin ortalaması alındığında, 1 6 4 3 4.3333 3 kat fazla üretim yapılmalı. (Burada X, gerçekleştirilmiş üretim miktarıdır ve üç çıktı değeri 1/6, 1/4 ve 1/3’ü eşit olasılıkla alabilmektedir.) Yukarıdaki ifadeler pozitif değerler alan bir şans değişkeni X ile açıklanırsa V X 0 olmadıkça her zaman, 1 1 E EX X eşitsizliği geçerlidir. Bu eşitsizlik 0, aralığında g x 1 x durumunu göstermektedir ve aşağıdaki sonuçlar tüm konveks g fonksiyonları için geçerlidir. Tanım (Jensen Eşitsizliği): g konveks bir fonksiyon ve X bir şans değişkeni olmak üzere, g E X Eg x . İki kez türevlenebilen g fonksiyonu A kümesinde, A 0, tanımlı tüm x’ler için g x 0 ise zayıf konveks, g x 0 ise güçlü konvekstir. X, değerlerini A kümesinden alan bir şans değişkeni ve g fonksiyonu da güçlü konveks ise güçlü eşitsizlik gE X Eg x geçerlidir. 10 Örneğin yukarıdaki şekilde sadece a ve b değerleri alan bir X şans değişkeni için bu sonuçlar gösterilmiştir. X şans değişkeni a ve b değerlerini sırasıyla 3/4 ve 1/4 olasılıkla almaktadır. g fonksiyonunun konveks olması dolayısıyla şekildeki iki nokta bir doğru ile birleştirilebilmektedir. Böylece a, g a ’dan b, g b ’ye bir doğru çizilirse, E X , Eg x 3 a 1 b, 3 g a 1 g b 3 a, g a 1 b, g b 4 4 4 4 4 4 g fonksiyonun grafiğinde bu nokta E X , Eg x noktasının yukarısında yer alır. Böylece g E X Eg x olur. Basit bir örnek de g x x 2 ’dir. Bu fonksiyon konveks olduğu için [ g x 2 , tüm x’ler için], E X 2 EX 2 Bu eşitsizlik V X E X 2 E X 2 0 eşitsizliğinin doğru olduğunu kanıtlamaktadır. 3.7 MOMENTLER Moment terimi fizik biliminden gelmektedir. Moment bir f(x) frekansının (kuvvetinin) x birim uzaklıkta olduğu bir nokta üzerinde oluşturduğu etkidir. Momentler, bir şans değişkenin dağılışının kesin şeklini belirler. Bir dağılımın momentleri şans değişkeninin kuvvetlerinin beklenen değeridir. Momentler genel olarak üç grupta incelenir. 1. Orijine göre momentler 2. Merkezi momentler 3. Herhangi bir a noktasına göre momentler Tanım (Orijine göre moment): X rassal değişkeninin r ile gösterilen, sıfır noktası dolayındaki r-inci momenti, x r fonksiyonunun beklenen değeridir. 11 r E ( X r ) x r f ( x) x r E ( X r ) x r f x dx En çok kullanılan iki özel durum: f xdx 1 r 0 iken 0 E X 0 r 1 iken '1 E ( X ) xf x dx olur. Bu da X rassal değişkeninin beklenen değerinden başka bir şey değildir. Tanım : 1 ifadesine X dağılımının anakütle ortalaması ya da kısaca X şans değişkeninin ortalaması denir ve ile gösterilir. Tanım (Merkezi moment): X şans değişkeninin ile gösterilen, ortalama dolayındaki r-inci momenti, x fonksiyonunun beklenen değeridir, r 0,1,2, için r E[( X ) r ] ( x ) r f ( x) x r E[( X ) ] ( x ) r f ( x)dx r Teorem: değeri var olan her rassal değişken için 0 1 ve 1 0 eşitlikleri daima geçerlidir. İspat: Merkezi birinci moment; 1 E[( X )] xf ( x)dx f ( x)dx ( x ) f ( x)dx 0 Bu sonuç tanımlayıcı istatistikten bilinen, aritmetik ortalamadan sapmaların toplamının sıfır olmasının teorik ispatıdır. Bir dağılımın tüm momentleri ile ilgili bilgi bu dağılımı eşsiz olarak belirler. Ortalama dolayındaki ikinci moment, bir rassal değişken dağılımının yayılımının bir göstergesi olduğundan istatistikte özel bir önem taşır. Merkezi ikinci moment şans değişkeninin 2 E X 2 V X varyansıdır. Bir dağılımın varyansı, dağılımın ortalama etrafındaki yoğunluğunun ölçümünü verdiği daha önce açıklanmıştı. Tanım (Herhangi Bir a Noktasına Göre Momentler): X şans değişkeninin, bir a noktası etrafındaki r-inci momenti, x a r fonksiyonunun beklenen değeridir. 12 r E X a r x a f x r x r E X a r x a f x r x Tanım: Eğer r' mevcut ise k r için k' momentleri mevcuttur. Tanımın bir sonucu olarak eğer E X 2 mevcut ise E X mevcuttur ve sonuçta V X bulunur. Bu nedenle V X ’in varlığı E X ’in var olduğunu belirtir. Teorem: Merkezi ikinci moment, yani varyans, daima herhangi bir a noktasına göre ikinci dereceden momentten daha küçük veya ona eşittir. Buna varyansın minimum olma özelliği denir: E X E X a 2 ya da eşdeğer olarak 2 Mina E ( X a)2 E ( X E( X ))2 EX E X E X a 2E X aX E X EX E X EE X ba 2E X aEX E X EX E X E X a İspat: E X a 2 E X E X E X a 2 2 2 2 2 2 2 Eşitliğin sağındaki ikinci terim daima pozitif olup ancak ve ancak E X a olduğunda sıfır alabilir. Teorem: Eğer X bir şans değişkeni ise; Mina E X a E X med . 3.7.1 Merkezi Momentlerin Orijine Göre Momentler Cinsinden Hesabı: Hesaplama kolaylığı açısından merkezi momentler orijine göre momentler cinsinden bulunabilir. Orijine göre momentlerle merkezi momentler arasındaki ilişki Binom teoremi kurulanarak bulunabilir. Bilindiği gibi binom açılımı; n n (a b) n b i a n i i 0 i olup bu açılım ortalamaya göre momentlerde kullanıldığında; x r (1) i i x r i r i 0 r i sonuç olarak, 13 E X r r 1i i E X r i r r 1i i r' i i 0 i r i 0 i Teorem: Eğer r 2 alınırsa 2 2 2 ' İspat : 2 E ( X )2 E X 2 2 X 2 E( X 2 ) 2E( X ) E( 2 ) = E( X 2 ) 2 2 2' 2 . 3.7.2 Orijine Göre Momentlerin Merkezi Momentler Cinsinden Hesabı: Orijine göre momentler de merkezi momentler cinsinden hesaplanabilir ve ' r E X r E ( X ) r r E ( X ) i r i i r i r i i olarak bulunur. 3.7.3 Momentlere Dayanan Asimetri ve Basıklık Ölçüleri Bir olasılık dağılımının biçimi ile ilgili ek bilgiler üçüncü ve dördüncü merkezi momentler yardımı ile elde edilebilir. Bu ek bilgiler genellikle dağılımın çarpıklık ve basıklığı olarak adlandırılır. Bir frekans dağılışının ortalama değerine göre simetriden ayrılış derecesine asimetri ya da çarpıklık denir. Asimetri ölçüleri için beklenen temel özellikler: a) Değişkenin ölçme biriminden bağımsız olmalı b) Dağılım simetrik olduğunda sıfır değerini almalı X şans değişkeninin üçüncü merkezi momenti, 3 E X 3 kullanılarak asimetriyi ölçebilmek için 1 ölçüsü Pearson tarafından tek modlu dağılımlar için bulunmuştur: 1 3 2 3 2 2 3 2 3 Bu parametre değişkenin ölçü biriminden bağımsızdır. Simetrik dağılışlarda 1 0 ve asimetrik dağılışlarda 1 0 eşitsizliği daima sağlanır. 1 parametresininin işaret eksikliğini gidermek için Fisher tarafından standartlaştırılmış üçüncü moment ya da diğer adıyla çarpıklık katsayısı önerilmiştir: 14 1 3 33 32 2 1 parametresi de değişkenin ölçü biriminden bağımsızdır. Simetrik dağılışlarda 1 0 olup, sağa çarpık dağılışlarda 1 0 , sola çarpık dağılışlarda 1 0 eşitsizlikleri sağlanır. 3 0 olduğu halde simetrik olmayan dağılışlarda mevcuttur. Bunun nedeni aşırı büyüklükteki uç değerlerin aritmetik ortalamaya etki edip, onu büyütüp, küçültmeleridir. E X değerinde oluşan bu değişme 3’e yansımaktadır. Bir dağılışın modunun, aynı beklenen değer ve varyansa sahip bir normal dağılımın moduna göre daha aşağıda ya da daha yukarıda bulunmasına basıklık farkı denir. Dağılışın tepe noktası normal dağılımdan daha yüksekse sivri, alçaksa basık dağılımdır. Sivri dağılımda beklenen değer etrafında yoğunlaşma daha fazladır. X şans değişkeninin dördüncü merkezi momenti: 4 E X 4 kullanılarak basıklığı ölçebilmek için 2 ölçüsü Pearson tarafından tek modlu dağılımlar için bulunmuştur: 2 4 42 2 2 2 15 Bu parametre değişkenin ölçü biriminden bağımsızdır. Normal dağılışlarda 2 3 , normale göre basık dağılışlarda 1 2 3 , normale göre sivri dağılışlarda ise 2 3 eşitsizlikleri sağlanır. Fisher basıklık ölçüsü ise 2 2 3 olup değişkenin ölçü biriminden bağımsızdır. Normal dağılışlarda 2 0 , normale göre basık dağılışlarda 2 0 , normale göre sivri dağılışlarda 2 0 eşitsizlikleri sağlanır. Bir ya da bir kaç tane momentin dağılış hakkında verdiği bilgi sınırlıdır. Aşağıdaki şekil ilk dört momenti eşit olan iki dağılımı göstermektedir. Bununla birlikte momentlerin bütün bir seti 1, 2 , dağılımı tam olarak belirler. Şans değişkeni X, standart değişkene dönüştürülürse; Z X E Z 0 olduğu için Z değişkeninin merkezi momentleri ile orijine göre momentleri eşittir. Bu özellik kullanılarak Z değişkeninin r-inci merkezi momenti, X değişkeninin r-inci merkezi momenti cinsinden ifade edilebilir: X r 1 r r [E( X ) ] r ( z ) E ( Z r ) E µ r ( x) r µ r ( x) [ 2 ( x)]r / 2 Sonuç olarak, V (Z ) 2 ( z) 1 elde edilir. Görüldüğü gibi bir X şans değişkeninin standartlaştırılması ortalama ve varyansı etkilemekte fakat 1 ( z ) 1 ( x) 2 ( z ) 2 ( x) standartlaştırılmış üçüncü ve dördüncü momenti etkilememektedir. 16 Tanım (Şans Değişkeninin Fonksiyonun Momenti): g x şans değişkeni X’in bir fonksiyonu ise r-inci dereceden momenti, kesikli ve sürekli şans değişkenleri için sırasıyla, g x f x E g x r x E g x g x f x dx r x eşitliklerinden elde edilir. 3.8 ÇOK DEĞİŞKENLİ DAĞILIMLAR İÇİN BEKLENEN DEĞER Beklenen değer ve varyans kavramları çok değişkenli durum için de genellenebilir. Örneğin bir Z şans değişkeni X1 ve X2 gibi iki şans değişkeninin z f x1, x2 ya da daha genel olarak X1, X 2 ,, X k sonlu sayıdaki şans değişkenlerinin bir fonksiyonu f x1, x2 ,, xk olarak ortaya çıkabilir. Bu gibi durumlarda gereksinim duyulabilecek bazı önemli teoremler aşağıda verilmiştir. Teorem: X1 ve X2 şans değişkenleri, f x1, x2 bunların ortak olasılık fonksiyonları ise X1’nin ve X2’nin beklenen değeri: E X1 x f x , x 1 x1 E X1 1 EX 2 2 x2 1 2 2 x2 x f x , x dx dx 1 x f x , x 2 EX 2 1 x1 x 2 1 2 x1 x f x , x dx dx 2 1 2 1 2 . x 2 x1 Teorem: X1 ve X2 şans değişkenleri, f x1, x2 bunların ortak olasılık fonksiyonları ise ve marjinal dağılımlar f x1 x1 ile f x2 x2 biliniyorsa X1 ve X2 şans değişkenlerinin beklenen değeri: E X1 x f x 1 x1 EX 2 1 x1 x 2 f x2 x2 x2 E X 1 x1 f x1 x1 dx1 E X 2 x2 f x2 x2 dx2 . x1 x2 Teorem: X1 ve X2 şans değişkenleri, f x1, x2 bunların ortak olasılık fonksiyonları ise: E X1 X 2 E X1 E X 2 İspat: Sadece kesikli şans değişkenleri için gerçekleştirilecektir. X1 ve X2 şans değişkenlerinin aldıkları değerler sırası ile a1, a2 , ve b1, b2 , olsun, E X1 X 2 a b f X i i a f X i i j 1 ai , X 2 b j j j 1 b f X ai , X 2 b j j i 1 ai , X 2 b j j 17 a f X i i 1 j ai , X 2 b j b f X j j i 1 ai , X 2 b j a f x b f x 1 i x1 2 j x2 i j E X1 E X 2 Yukarıdaki teoremden görüldüğü gibi beklenen değer işlemi doğrusal bir işlemdir. Diğer bir ifade ile şans değişkenlerinin toplamlarının beklenen değeri, daima ayrı ayrı beklenen değerlerin toplamına eşittir. Bu eşitliğin geçerli olabilmesi için şans değişkenlerinin bağımsız olması şart değildir. Bu teoremin daha genel yapısı aşağıdaki tanımda verilmiştir. Tanım (Beklenen değerin doğrusallık özelliği): X1, X 2 ,, X k şans değişkenleri ve c1, c2 ,, ck ile b sabitler olmak üzere, Ec1 X1 c2 X 2 ck X k b c1E X1 c2 E X 2 ck E X k b eşitliği daima geçerlidir. Teorem: X1 ve X2 şans değişkenleri, f x1, x2 bunların ortak olasılık fonksiyonları ise şans değişkenlerinin her hangi bir g x1, x2 fonksiyonunun beklenen değeri kesikli ve sürekli şans değişkenleri için: Eg x1 , x2 g x , x f x , x 1 x1 Eg x1 , x2 2 1 2 x2 g x , x f x , x dx dx . 1 2 1 2 2 1 x1 x 2 Teorem: X1, X 2 ,, X k şans değişkenleri, f x1, x2 ,, xk bunların ortak olasılık fonksiyonları ve c1, c2 ,, ck sabitler olmak üzere şans değişkenlerinin her hangi bir g x1, x2 ,, xk fonksiyonunun beklenen değeri kesikli ve sürekli şans değişkenleri için: E ci g x1 , , x k ci Eg x1 , , x k i i eşitliği sağlanır. 3.9 ÇOK DEĞİŞKENLİ DAĞILIMLAR İÇİN KOŞULLU BEKLENEN DEĞER X1 ve X2 ortak olasılık fonksiyonları f x1, x2 olan iki şans değişkeni olsun. Eğer tüm X1 değerleri için f x1 x1 0 ise koşullu ortak olasılık fonksiyonu f x1 / x2 tanımlıdır. Bu koşul altında tüm X2 değerleri üzerinden X1 şans değişkenin koşullu beklenen değeri (orijine göre birinci momenti) E X1 / X 2 x2 ile gösterilir. 18 Teorem: X1 şans değişkeni ve f x1 / x2 ’de verilen X2 değeri için X1’in şartlı olasılık fonksiyonu ve f x2 / x1 fonksiyonu verilen X1 değeri için X2’in şartlı olasılık fonksiyonu ise X1’in ve X2’nin şartlı beklenen değeri kesikli ve sürekli şans değişkenleri için: E X1 / X 2 x f x / x 1 1 E X 2 / X1 2 x1 x f x 2 2 / x1 x2 E X 1 / X 2 x1 f x1 / x2 dx1 E X 2 / X 1 x2 f x2 / x1 dx2 x1 x2 Verilen X2 değeri yerine konduğunda E X 1 / X 2 sabit bir sayıdır, başka bir deyişle şartlı beklenen değer X2 değişkeninin bir fonksiyonudur. Benzer şekilde E X 2 / X1 ‘de X1’in bir fonksiyonudur. E X 2 / X1 , X1’in belli bir değeri için sabit, fakat x’in değişen değerlerine bağlı olarak değiştiği için bir şans değişkenidir. E X 2 / X1 ’in dağılımının beklenen değeri EE X 2 / X1 olup, E X 2 / X 1 regresyon fonksiyonu olarak da adlandırılır. Teorem: Koşullu dağılımların beklenen değerlerinin beklenen değeri için, eğer E X 2 ve E X 2 / X 1 mevcut ise, X2 şans değişkeni için beklenen değer; E X 2 EE X 2 / X1 eğer E X1 ve E X 1 / X 2 mevcut ise, X1 şans değişkeni için beklenen değeri; E X1 EE X1 / X 2 . İspat: E X 2 / X1 x2 f x2 / x1 dx2 değerinin X1 değişkeninin bir fonksiyonu olduğu belirtildi. x2 Bu nedenle ikinci beklenen değer işlemi X1 şans değişkeni üzerinden uygulanır. EE X 2 / X 1 x2 f x2 / x1 dx2 f x1 x1 dx1 x1 x 2 x f x 2 2 / x1 f x1 x1 dx2 dx1 x1 x 2 x f x , x dx dx 2 1 2 2 1 x1 x 2 EX 2 Teorem: X1 ve X2 şans değişkenleri ve f x2 / x1 ’de verilen X1 değeri için X2’in şartlı olasılık fonksiyonu ve g x2 , X2 şans değişkeninin bir fonksiyonu ise verilen X1 değeri için g x2 ’in şartlı beklenen değeri: Eg X 2 / X 1 g x f x 2 2 / x1 x2 19 Eg X 2 / X 1 g x2 f x2 / x1 dx2 . x2 Teorem: g X 2 , X2 şans değişkeninin bir fonksiyonu olmak üzere, Eg X 2 EEg X 2 / X1 İspat: Eg X 2 / X1 g x2 f x2 / x1 dx2 değeri X1 değişkeninin bir fonksiyonu olduğundan x2 ikinci beklenen değer işlemi X1 şans değişkeni üzerinden uygulanır. EEg X 2 / X 1 g x2 f x2 / x1 dx2 f x1 x1 dx1 x1 x 2 g x f x 2 2 / x1 f x1 x1 dx2 dx1 x1 x 2 g x f x , x dx dx 2 1 2 2 1 x1 x 2 Eg X 2 Teorem: X1 ve X2 şans değişkenleri ve g x1 , X1 şans değişkeninin bir fonksiyonu ise E X 2 sonlu olmak üzere X1 şans değişkeninin tüm değerleri için, EX 2 g x1 / X1 g x1 EX 2 / X1 tanımlıdır. İspat: EX 2 g x1 / X1 g x1 x2 f x2 / x1 dx2 x2 g x1 EX 2 / X1 elde edilir. Bu teoremin özel bir durumu x2 1 ile tanımlanır. Diğer bir deyişle, Eg x1 / X 1 g x1 f x2 / x1 dx2 x2 g x1 Burada f x2 / x1 ’nin bir olasılık yoğunluk fonksiyonu olduğu unutulmamalıdır. Teorem: Eğer X1 ve X2 şans değişkenleri stokastik bağımsız ise, diğer bir deyişle f x1, x2 f x1 x1 f x2 x2 ise, veya şartlı ve şartsız dağılımlar arasında fark yoksa: E X1 / X 2 E X1 E X 2 / X1 E X 2 eşitlikleri geçerlidir. 20 3.10 İKİ ŞANS DEĞİŞKENİ İÇİN ÇARPIM MOMENTLERİ Bu kısımda iki şans değişkeninin ortak dağılımı dikkate alınarak şans değişkenlerinin çarpım halindeki momentleri elde edilecektir. Tanım (İki şans değişkeninin orijine göre çarpım momenti): X1 ve X2 şans değişkenlerinin ortak olasılık fonksiyonları f x1, x2 ise orijin civarındaki r-inci ve s-inci dereceden orijine göre çarpım momentleri r, s ile gösterilir ve x1r x2s fonksiyonunun beklenen değeri ile elde edilir: r , s E X1r X 2s Kesikli ve sürekli şans değişkenleri için sırasıyla; r , s E X1r X 2s x1r x2s f x1 , x2 x1 x2 r , s E X1r X 2s x1r x2s f x1 , x2 dx2 dx1 x1 x 2 eşitlikleri ile tanımlanır. Çarpım momentleri marjinal (tek değişkenli) momentlere dönüşebilir. Örneğin s 1 alınarak 1,0 E X1 ya da r 1 alınarak 0 ,1 E X 2 ile tanımlanabilir. Özel bir durum r s 1 ise ortaya çıkar ve 1,1 E X1 X 2 ile gösterilir. Teorem: Z1 ve Z2 şans değişkenleri için, EZ1 E Z 2 0 , V Z1 V Z 2 1 koşulları sağlanıyor (standart değişkenler) ise, a) 1 EZ1Z 2 1 ya da E Z1Z 2 2 1 b) EZ1Z 2 1 ancak ve ancak Pz1 z2 1 ise, EZ1Z 2 1 ancak ve ancak Pz1 z2 1 ise, eşitsizlik ve eşitlikleri sağlanır. İspat: a şıkkı için ilk olarak aşağıdaki eşitsizlik ele alınsın, 0 E Z1 Z 2 E Z12 2Z1Z 2 Z 22 2 2EZ1Z 2 2 2 2E Z1Z 2 1 E Z1Z 2 bulunur. İkinci olarak, 0 E Z1 Z 2 E Z12 2Z1Z 2 Z 22 2 2EZ1Z 2 2 2 2EZ1Z 2 21 1 E Z1Z 2 elde edilir ve bu iki sonuç birlikte kullanılarak ispat tamamlanır. Teoremin b şıkkı için ise Pz1 z2 1 alındığında, EZ1Z 2 E Z12 V Z1 1 Pz1 z2 1 alındığında, EZ1Z 2 E Z12 V Z1 1 elde edilerek ispat tamamlanır. Yukarıdaki ispat ters yönden de gerçekleştirilebilir: ilk olarak E Z1Z 2 1 alınsın bu durumda, V Z1 Z 2 E Z1 Z 2 EZ1 Z 2 E Z1 Z 2 2 2 2 E Z12 2Z1Z 2 Z 22 2 2EZ1Z 2 0 elde edilir. İki şans değişkeni arasındaki varyansın sıfır olabilmesi için Z1 Z 2 diğer bir deyişle Pz1 z2 1 olmalıdır. EZ1Z 2 1 için ise V Z1 Z 2 0 olduğu görülebilir ve bu durum için sonuç olarak Pz1 z2 1 elde edilebilir. Eğer Z1 Z 2 ise, Z1 X 1 x1 x1 , Z2 X 2 x2 x2 alınarak, X 2 x2 x2 X x1 x1 1 yazılabilir. Yukarıda Pz1 z2 1 ve Pz1 z2 1 için elde edilen sonuçlar, a bir sabit olmak üzere, Z 2 Z1 a ve Z 2 Z1 a için de geçerlidir. Örneğin Z 2 Z1 a ise, EZ1Z 2 EZ1 Z1 a E Z12 aEZ1 1 ya da V Z 2 Z1 V a 0 bulunabilir. Bu durumda, X 2 x2 a x2 x2 X x1 x1 1 ya da eşitliğin sağındaki ilk iki terim sabit olduğundan, X2 x2 X x1 x1 1 22 yazılabilir. Elde edilen sonuçların şans değişkenlerinin kovaryans ve korelasyonu ile ilişkisi Kısım 3.11’de verilmiştir. Teorem: X1 ve X2 bağımsız şans değişkenleri, f x1, x2 bunların ortak olasılık fonksiyonları ise: E X1 X 2 E X1 E X 2 . İspat: Sadece kesikli şans değişkenleri için verilecektir: E X1 X 2 x x f x , x 1 2 x2 1 2 x1 Eğer şans değişkenleri bağımsız ise f x1 x1 ve f x2 x2 marjinal olasılık fonksiyonları olmak üzere ortak olasılık fonksiyonu; f x1 , x2 f x1 x1 f x2 x2 ve E X1 X 2 x x f x f x 1 2 x1 x2 x1 1 x2 2 x1 x1 f x1 x1 x2 f x 2 x2 x2 E X1 E X 2 Teorem: X1, X 2 ,, X k sonlu sayıdaki bağımsız şans değişkenleri, f x1, x2 ,, xk bunların ortak olasılık fonksiyonları ise çarpımlarının beklenen değeri E X1 X 2 X k E X1 E X 2 E X k şeklinde elde edilir. Tanım (İki şans değişkeninin merkezi çarpım momenti): X1 ve X2 şans değişkenlerinin olasılık fonksiyonları f x1, x2 ise orijin civarındaki r-inci ve s-inci dereceden merkezi çarpım momentleri r , s ile gösterilir ve X1 E X1 r X 2 E X 2 s fonksiyonunun beklenen değeri ile elde edilir: r ,s E X1 E X1 r X 2 E X 2 s Kesikli ve sürekli şans değişkenleri için sırasıyla; r , s E X1 E X1 r X 2 E X 2 s X1 E X1 r X 2 E X 2 s f x1 , x2 x1 x2 r ,s E X 1 E X 1 r X 2 E X 2 s X 1 E X 1 r X 2 E X 2 s f x1 , x2 dx1dx2 x1 x2 Çarpım momentleri marjinal (tek değişkenli) momentlere dönüşebilir. Örneğin s 0 için 2,0 V X1 ya da r 0 için 0, 2 V X 2 ile tanımlanabilir. 23 Teorem (Cauchy-Schwarz eşitsizliği): Ortalamaları x1 ve x 2 , varyansları x21 ve x22 olan X1 ve X2 şans değişkenleri için, a) EX 1 EX x1 X 2 x2 x1 x2 1 X 2 x1 2 x1 2 ya da eşdeğer olarak, 2 x2 x2 x1 x2 eşitsizlikleri geçerlidir. x2 X 1 x1 1 ise x1 b) ancak ve ancak P X 2 x2 E X1 x1 X 2 x2 x1 x2 , ve ancak ve ancak P X 2 x2 x2 X 1 x1 1 x1 E X1 x1 X 2 x2 x1 x2 eşitlikleri geçerlidir. İspat: a şıkkı için, bir önceki teoremde, EZ1Z 2 2 1 ya da 1 EZ1Z 2 1 eşitsizlikleri ispatlanmıştı bu eşitsizliklerde standart değişkenler yerine konarak, X 1 x1 E x1 X 2 x 2 x 2 X 1 x 1 1 E x1 2 1 X 2 x2 x 2 1 ispat tamamlanır. b şıkkı için de benzer yaklaşım kullanılır. Cauchy-Schwarz eşitsizliğinin daha fazla bilinen yapısı ise, E X1 X 2 2 EX12 EX 22 şeklindedir. 3.11 KOVARYANS ve KORELASYON İstatistikte özel öneme sahip bir merkezi çarpım momenti 1,1 ’ dir ve kovaryans olarak adlandırılır. Kovaryans iki şans değişkeni arasındaki doğrusal ilişkinin bir ölçümünü verir. Aralarındaki kovaryans sıfır olan şans değişkenlerine doğrusal ilişkisiz adı verilir. Stokastik bağımsızlık doğrusal ilişkisizliği de otomatik olarak sağlar. Fakat doğrusal ilişkisizliğin mutlaka stokastik bağımsızlık anlamına geleceği söylenemez. Tek istisna normal dağılmış şans değişkenleridir. Normal dağılmış iki değişken doğrusal ilişkisiz ise aynı zamanda stokastik bağımsızdır. 24 Tanım (Kovaryans): X1 ve X2 iki şans değişkeni ve onların ortalamaları sırası ile x1 ve x 2 ise, X1 ve X2 şans değişkenleri arasındaki kovaryans Cov X1, X 2 ile ya da x1 x2 ile gösterilir ve: Cov X1 , X 2 E X1 x1 X 2 x2 eşitliğinden elde edilir. Teorem: İki şans değişkeni X1 ve X2 arasındaki kovaryans orijine göre çarpım momentleri cinsinden de ifade edilebilir: x1 x2 1,1 1,0 0 ,1 1,1 x1 x2 . İspat: Beklenen değerle ilgili teoremler kullanılarak, EX X x1x2 E X1 x1 X 2 x2 1 2 X1 x2 X 2 x1 x1 x2 E X1 X 2 x2 E X1 x1 E X 2 x1 x2 1,1 x1 x2 Teorem: İki şans değişkeni X1 ve X2 bağımsız ise kovaryansları sıfıra eşittir, x1 x2 0 . İspat: Bağımsız şans değişkenleri için; E X1 X 2 E X1 E X 2 olduğu için x1 x2 1,1 x1 x2 E X1 X 2 E X1 E X 2 0 Teorem: Eğer X1 ve X2 şans değişkenleri ve a ile b sabitler ise: CovaX1, bX 2 abCov X1, X 2 Cov X1 a, X 2 b Cov X1, X 2 Cov X1, aX1 b aV X1 . İki değişken arasındaki kovaryans, değişkenlerin ölçülmesinde kullanılan birimlere bağlıdır. İlişkinin ölçü birimlerinden arıtılmış ifadesi, ortak anakütle korelasyon katsayısıdır. Tanım (Korelasyon): Ortalamaları x1 ve x 2 , varyansları x21 ve x22 olan X1 ve X2 şans değişkenlerinin tanımladığı standart, Z1 X 1 x1 x1 , Z2 X 2 x2 x2 değişkenler arasındaki kovaryans CovZ1, Z 2 , ile sembolize edilir, 25 X 1 x 1 x1 E X 2 x 2 x 2 ve korelasyon katsayısı olarak adlandırılır. Yukarıdaki eşitlik dikkate alındığında korelesyon katsayısının orijinal X1 ve X2 şans değişkenleri için, Cov X 1 , X 2 x1 x2 şeklinde tanımlanabileceği de görülebilir. Korelasyon katsayısının temel özellikleri: 1. Korelasyon katsayısı ‘nun işareti Cov X1, X 2 ’nin işaretine göre değişir. 2. Cov X1, X 2 0 ise 0 olur. 3. Korelasyon katsayısı ‘nun alabileceği maksimum ve minimum değerler: 1 1 4. 1 olması X1 ve X2 arasında tam doğrusal ilişki bulunduğunu belirtir. 1 durumunda x2 a bx1 doğrusunun grafiği X1 ve X2’nin tüm olasılık dağılımını içerir. Tüm x1 , x2 ikilileri bu doğrunun üzerindedir. Bu ekstrem durum için Px2 a bx1 1 olur. Ekstrem durum haricinde, X1 ve X2’nin tüm olasılık dağılımı x2 a bx1 doğrusunun çevresinde bir bant içindedir. 3.12 ÇOK DEĞİŞKENLİ DAĞILIMLAR İÇİN VARYANS Beklenen değerdeki doğrusallık kuralının aksine V X1 X 2 genellikle V X1 V X 2 değerine eşit değildir. V X1 X 2 ’nin belirlenmesi için varyans tanımından hareketle, V X1 X 2 EX1 X 2 E X1 X 2 2 ve eşitliğin sağındaki terim X1 X 2 E X1 X 2 X1 E X1 X 2 E X 2 şeklinde düzenlenerek karesi alındığında, X1 X 2 EX1 X 2 2 X1 EX1 2 X 2 EX 2 2 2X1 EX1 X 2 EX 2 Elde edilir ve her iki tarafın da beklenen değeri alındığında V X1 X 2 V X1 V X 2 2EX1 E X1 X 2 E X 2 V X1 V X 2 2Cov X1 , X 2 olur. Teorem: X1 ve X2 şans değişkenleri, a ve b sabitler olmak üzere: V aX1 bX 2 a 2V X1 b2V X 2 2abCov X1 , X 2 26 Şans değişkenleri doğrusal ilişkisiz ise Cov X1, X 2 0 . Bu teoremin daha genel yapısı aşağıdaki tanımda verilmiştir. Tanım (Varyans-kovaryans matrisi): X1, X 2 ,, X k sonlu sayıdaki şans değişkenlerinin tanımladığı k1 boyutlu bir şans vektörü xT X1 ,, X k için varyans–kovaryans matrisi Σ olsun. Her bir şans değişkeninin varyansı, V X i ve her hangi iki şans değişkeninin kovaryansı, Cov X i , X j olsun. Sonuç olarak k1 boyutlu bir şans vektörünün varyans-kovaryans matrisi kk boyutlu, Σ E x Exx Ex T X 1 E X 1 E X 1 E X 1 X k E X k X E X k k Cov X 1 , X 2 Cov X 1 , X k V X1 Cov X , X V X 2 Cov X 2 , X k 2 1 V X k Cov X k , X 1 Cov X k , X 2 simetrik bir matristir. Şans değişkenlerinin toplamlarının varyansı ise 11 boyutlu bir skalerdir, V X1 X 2 X k E x Ex x Ex T X1 E X1 E X 1 E X 1 X k E X k X E X k k V X1 V X k 2Cov X1, X 2 2Cov X k 1, X k . Teorem: X1, X 2 ,, X k sınırlı sayıdaki bağımsız şans değişkenleri ise, V X1 X 2 X k V X1 V X k . Bu konuda daha detaylı bilgi Kısım 3.13’de verilmiştir. Teorem: X1 ve X2 şans değişkenlerinin f x1 / x2 ve f x2 / x1 şartlı dağılışlarının varyansı: a. V X1 / X 2 E X12 / X 2 E X1 / X 2 2 b. V X 2 / X1 E X 22 / X1 E X 2 / X1 2 eşitliklerinden ya da daha açık olarak kesikli ve sürekli şans değişkenleri için sırasıyla: V X1 / X 2 x E X V X1 / X 2 1 x1 x EX 1 1/ 1 2 / X 2 f x1 / x2 , V X 2 / X 1 x X 2 f x1 / x2 dx1 , V X 2 / X1 2 x1 2 x2 x 2 2 E X 2 / X 1 f x2 / x1 E X 2 / X1 f x2 / x1 dx2 2 x2 İspat: Sadece (a) şıkkına ait sürekli değişkenler için verilmiştir. 27 EX 2 X E X / X E X / X x 2 x E X / X E X / X f X / X V X1 / X 2 E X1 E X1 / X 2 2 2 2 1 1 1 2 1 2 2 2 1 1 1 2 1 2 1 2 dx1 x1 x12 f X 1 / X 2 dx1 2E X 1 / X 2 x1 f X 1 / X 2 dx1 E X 1 / X 2 x1 2 x1 E X EX f X 1 / X 2 dx1 x1 E X12 / X 2 2E X1 / X 2 E X1 / X 2 E X1 / X 2 2 1 / X2 2 1/ 2 X 2 . Koşullu beklenen değerin varyansının elde edilmesi ile ilgili önemli bir teorem de aşağıda verilmiştir. Teorem: X1 ve X2 şans değişkenleri, E X 2 ise sonlu olsun. E X 2 / X1 mevcut ise, V X 2 EV X 2 / X1 V E X 2 / X1 . Son eşitlikte, X2 şans değişkeninin varyansı iki farklı varyansın toplamı olduğu görülmektedir. İlki X2 şans değişkeninin değişen X1 değerleri için şartlı varyanslarının beklenen değeri. İkincisi ise X2 şans değişkeninin değişen X1 değerleri için şartlı dağılımlarına ait ortalamalarının varyansıdır. İspat: E X 2 x2 olarak tanımlansın. V X 2 E X 2 x2 2 E X 2 E X 2 / X1 E X 2 / X1 x2 2 E X 2 E X 2 / X1 E E X 2 / X1 x2 2 Bu eşitlikteki son bileşen, 2EX 2 2 E X 2 / X1 E X 2 / X1 x2 E X 2 E X 2 / X1 E X 2 / X1 x2 EX 2 E X 2 / X1 x2 E X 2 E E X 2 / X1 x2 EE X 2 / X1 2 EEX 2 E X 2 / X1 / X1 x2 EE X 2 / X1 E E X 2 / X1 x2 EE X 2 / X1 2 olup burada, EX 2 E X 2 / X1 / X1 E X 2 / X1 E X 2 / X1 E X 2 / X1 2 alınarak, E X 2 E X 2 / X1 E X 2 / X1 x2 E E X 2 / X1 x2 EE X 2 / X1 E E X 2 / X1 x2 EE X 2 / X1 2 2 0 elde edilir. Bu durumda, EX / X EE X V X 2 E X 2 E X 2 / X1 E E X 2 / X1 x2 2 2 E X 2 2 1 2 / X1 x 2 2 2 28 E X 22 2 X 2 E X 2 / X1 E X 2 / X1 E E X 2 / X1 EE( X 2 / X1 ) 2 2 Burada E X EE X / X ve E X EE X / X olduğu hatırlanarak, V X EE X / X EE X / X EE X / X V E X / X EE X / X E X / X V E X / X E X 22 2E X 2 EE X 2 / X1 EE X 2 / X1 EE X 2 / X1 V E X 2 / X1 2 2 2 2 2 2 2 2 1 1 2 2 1 1 2 1 2 1 2 1 2 2 2 1 2 1 EV X 2 / X1 V E X 2 / X1 elde edilerek ispat tamamlanır. Bu teoremin önemli bir sonucu olarak, EV X 2 / X1 0 eşitsizliği daima sağlanacağı için, V X 2 V E X 2 / X1 eşitsizliği yazılabilir. 3.13 ŞANS DEĞİŞKENLERİNİN DOĞRUSALKOMBİNASYONLARININ MOMENTLERİ Bazı durumlarda n adet şans değişkeninin X1, X 2 ,, X k doğrusal kombinasyonundan ortaya çıkan bir Y1 şans değişkeninin beklenen değer ve varyansı ile ya da n adet şans değişkeninin tanımladığı iki doğrusal kombinasyondan elde edilen iki şans değişkeni Y1 ve Y2 arasındaki kovaryans ile ilgilenilebilir. Bu konu özellikle istatistiksel yorumlama da önemlidir. Teorem: Eğer X1, X 2 ,, X k şans değişkenleri ve c1, c2 ,, ck ile d1, d 2 ,, d k sabitler olmak üzere bu şans değişkenlerinin doğrusal fonksiyonu olarak; y1 k ci xi , y2 i 1 k d x i i i 1 tanımlanan iki şans değişkeni Y1 ,Y2 olsun. n a) E Y1 ci E X i i 1 b) V Y1 ci2V X i 2 ci c j CovX i , X j k i 1 i j k c) CovY1 , Y2 ci diV X i 2 ci d j CovX i , X j . k i 1 i j k İspat: a şıkkı için beklenen değerin doğrusallık özelliği kullanılarak, k E Y1 E ci X i i 1 29 k a EX . i i i 1 Teoremin b şıkkı için, V Y1 E Y1 E Y1 2 k E ci X i i 1 ci E X i i 1 k 2 2 k E ci X i E X i i 1 Köşeli parantezin içinin açılması çokterimli bir ifadenin açılımıdır. Örneğin x y z 2 x2 y 2 z 2 2xy 2xz 2 yz gibi: k 2 V Y1 E ci2 X i E X i i j i 1 c c X c EX k 2 i i 1 i E X i X j E X j c c EX E X i 2 i i j i j i E X i X j E X j i j Varyans ve kovaryansın tanımı kullanılarak, V Y1 c V X c c CovX , X k 2 i i i 1 i j i j i j ve CovX i , X j CovX j , X i olduğundan, V Y1 c V X 2 c c CovX , X k 2 i i i j i 1 i j i j k Teoremin c şıkkı için, CovY1, Y2 EY1 EY1 Y2 EY2 k k k E ci X i E ci X i d j X j E j 1 i1 i1 k E ci X i i1 k ci E X i d j X j i 1 j 1 k k E i1 d E X k j j 1 k k E ci X i E X i d j X j E X j j 1 i 1 d j X j j 1 k j ci d j X i E X i X j E X j j 1 k 30 c d EX k k i j i E X i X j E X j i 1 j 1 c d CovX , X k k i j i j i 1 j 1 Burada, Cov X i , X i V X i olduğundan, CovY1 , Y2 c d V X 2 c d CovX , X . k i i i i i 1 j i j i j k Teorem: Eğer X1, X 2 ,, X k şans değişkenleri birbirinden bağımsız ve c1, c2 ,, ck sabitler ise; Y1 k c x i i i 1 ile tanımlanan şans değişkeninin varyansı; V Y1 k c V X . 2 i i i 1 Teorem: Eğer X1, X 2 ,, X k şans değişkenleri birbirinden bağımsız ve c1, c2 ,, ck ile d1 , d 2 ,, d k sabitler ise; Y1 k ci xi ve Y2 i 1 k d x i i i 1 şeklinde tanımlanan iki şans değişkeni arasındaki kovaryans, CovY1 , Y2 k c d V X . i i i i 1 3.14 FAKTÖRİYEL MOMENTLER Özellikle kesikli şans değişkenlerinin momentlerinin bulunmasında faydalı olan bir yaklaşım dağılımın faktöriyel momentleridir. İlk olarak şans değişkeninin karesi ele alınsın; x 2 xx 1 x bu ifadenin beklenen değeri alınarak, E X 2 EX X 1 E X Sonuç olarak; EX X 1 E X 2 E X 2 1 bulunur. Bu yaklaşım daha büyük momentler için de geçerlidir. Örneğin şans değişkeninin üçüncü faktöriyel momenti EX X 1 X 2 E X 3 3E X 2 2E X 3 32 21 olup, üçüncü faktöriyel moment kullanılarak, 31 3 EX X 1 X 2 32 21 bulunabilir. Genel olarak r-inci faktöriyel moment EX X 1 X 2 X r 1 olarak tanımlanır. 3.15 MOMENT TÜRETEN FONKSİYONLAR Beklenen değer tanımı kullanılarak momentler elde edilebilir. Bu yaklaşımın hesaplamalarında zorluk olması durumunda dağılımın momentleri, bir fonksiyon yardımı ile hesaplanabilir. Moment türeten fonksiyonlar sürekli veya kesikli bir X şans değişkenin dağılımın momentlerinin hesaplanmasına yarayan bir fonksiyondur. X şans değişkeninin moment türeten fonksiyonu M x (t ) ile gösterilir. Bir X şans değişkeninin orijine göre veya merkezi moment türeten fonksiyonu bulunabilir. Şans değişkeni X için moment türeten fonksiyon şans değişkenine ait f (x) olasılık fonksiyonunun Laplace dönüşümü olarak da adlandırılır. Tanım (Moment türeten fonksiyon): Olasılık fonksiyonu f (x) olan bir şans değişkeni X olsun. Eğer h 2 t h 2 aralığındaki t ‘nin her bir değeri için şans değişkeninin beklenen değeri mevcut ise, e tx fonksiyonunun beklenen değeri X şans değişkeninin moment türeten fonksiyonu olarak adlandırılır. Kesikli ve sürekli şans değişkenleri için moment türeten fonksiyon: e M x t E etx tx f (x) etx f ( x)dx Eğer bir moment türeten fonksiyon mevcut ise, orijin civarında sürekli olarak türevlenebilir. Çünkü h 2 t h 2 aralığı t 0 değerini içerir. Moment türeten fonksiyon t parametresinin fonksiyonudur. Bu parametrenin gerçek bir anlamı yoktur, sadece momentlerin belirlenmesine yardımcı olan matematiksel bir araçtır. Kukla değişkendir. Moment türeten fonksiyon; a) tüm t için, b) sadece t A , A için, c) sadece t 0 için, elde edilebilir. Son durumu sağlayan dağılımlar için moment türeten fonksiyon mevcut değildir. Bunun nedeni t 0 için M x (0) fonksiyonu daima tanımlı olup 1 değerine eşittir. Teorem: Eğer X şans değişkeninin moment türeten fonksiyonu M x (t ) ise ve 32 r Mx dr 0 r M x t dt t 0 olarak tanımlanmış ise E X r M xr 0 olur. İspat: İntegral işareti altında türev alınabileceği varsayımı altında, moment türeten fonksiyonun t ‘ ye göre türevi, sürekli şans değişkenleri için, d d M x t e tx f x dx dt dt d dt e f x dx tx xe f x dx tx E Xext ve t 0 alınırsa; M x 0 d M x t E xe xt dt t 0 EX t 0 Bu yaklaşım r-inci türev için genellendiğinde, M xr 0 dr M x t E x r e xt dt r t 0 t 0 E Xr . Sonuç olarak; bir dağılımın momentleri, moment türeten fonksiyonun yapay değişken t’ye göre türevi alınarak elde edilebilir. Fonksiyona neden moment türeten fonksiyon dendiğini açıklayabilmek amacı ile E (e xt ) yerine bu fonksiyonun Maclaurin seri açılımı konulur. Maclaurin serisi, matematikteki fonksiyonların seri açılımlarını elde etmek amacıyla kullanılan Taylor yaklaşımının, ( x a) 2 ( x a) r ( x a) n ... f r (a) ... f n (a) 2! r! n! n 0 özel olarak a 0 alınarak oluşturulmuş serisidir. f ( x) f (a) f (a)( x a) f (a) f ( x) f (0) f (0) x f (0) x2 xr xn .... f r (0) .... f n (0) r! 2! n! n 0 Burada maclaurin serisine e x fonksiyonu uygulanmasının nedeni 1 değerine yakınsamasıdır. Momentler şöyle bulunabilir; f ( x) e x fonksiyonu maclaurin serisiyle açılırsa, 33 ex 1 x x2 xr ... ... 2! r! buradan da, x2 2 xr r e 1 xt t ... t ... 2! r! xt elde edilir ve M x (t ) ‘ in seri açılımı f (x) ‘ in momentlerine göre bulunabilir. x2 2 xr r t2 tr M x t E (e xt ) E 1 xt t ... t ... E (1) tE ( x) E ( x 2 ) .... E ( x r ) .... 2! 2! r! r! 1 t2 tr 1 t1 2 ... r ... r' t i 2! r! i 0 i! Bu durum r ‘ nin, M x (t ) ‘ nin r defa türevi alınıp daha sonra t 0 konularak elde edilebileceğinin bir diğer kanıtıdır. Örneğin birinci momenti bulmak için M x (t) nin t ye göre birinci türevi alınır; E ( x) M x (t ) dM x (t ) dt t 0 2t 3t rt r 1 1 2 3 ... r 2! 3! r! t 0 burada t=0 olduğunda 1 olarak bulunur. İkinci moment 2 isteniyor ise d dM x (t ) E ( x 2 ) M x (t ) dt dt t 0 M x (t) 2 6t r (r 1)t r 2 2 3 ... r 2! 3! r! = 2 t 0 Burada söylenmesi gereken bir şans değişkeninin momentlerini belirlemek için bir moment türeten fonksiyonun Maclaurin serisini kullanmaktaki asıl güçlük moment türeten fonksiyonunu bulmak değil buna Maclaurin serisini uygulamaktır. Bazı dağılımlarda M(t), t ‘nin bütün değerleri için hesaplanabilir; bazı dağılımlarda ise M(t), t’ nin sadece belirli bir aralıktaki değerleri için bulunabilir. Örneğin üstel dağılım. Eğer M(t) mevcut ise, X’ in dağılımı eşsiz ve tam olarak belirlenir. Eğer iki şans değişkeni aynı moment türeten fonksiyona sahip ise, bu şans değişkenleri aynı olasılık dağılımına 34 e sahiptir. Bazı durumlarda tx f ( x)dx ’ in integrali ve e tx f (x) ‘ in toplamı mevcut x değildir. Böyle durumlarda X’ in moment türeten fonksiyon bulunamaz. Diğer bir deyişle her dağılımın moment türeten fonksiyonu yoktur. Bu tip dağılımlarda momenti bulmak için karakteristik fonksiyon kullanılır. 3.15.1 Moment Türeten Fonksiyonlarla İlgili Teoremler Teorem: c bir sabit sayı olmak üzere y cx ’ in moment türeten fonksiyonu; M cx (t ) M x (ct ) ’ dir. İspat: M cx t E e cxt e cxt f x dx e x ( ct ) f ( x)dx M x ct ’ dir. Teorem: Bir X şans değişkeninin moment türeten fonksiyonu M(t) olsun, c sabit bir sayı olmak üzere y c x ’ in moment türeten fonksiyonu; M c x (t ) e ct M x (t ) ’ dir. İspat: M ( c t ) (t ) E e ( c x )t e ct e xt f ( x)dx e ct e xt f t dx e ct M x t ’ dir. Teorem: y ax b şeklinde tanımlanan y şans değişkeninin moment türeten fonksiyonu; M y t e bt M x at ’ dir. İspat: M y t E e yt E e axb t E e axt e bt e bt E e axt M x at e bt ’ dir. Teorem: Bir X şans değişkeninin moment türeten fonksiyonu M(t) olsun, y x a b olmak üzere; M y t E e yt ea / b t M x (t / b) ’ dir. Bu teoremde a ve b olarak alınır ise M x / t e / t M x t / olacaktır. Bu fonksiyon standart normal değişkenin moment türeten fonksiyonu olarak da bilinir. Teorem: Eğer iki şans değişkeni aynı moment türeten fonksiyona sahipse bu iki şans değişkeni aynı dağılıma sahiptir. X şans değişkeninin moment türeten fonksiyonu Mx(t) ve Y şans değişkeninin moment türeten fonksiyonu My(t) olsun, eğer h 2 t h 2 aralığındaki tüm t değerleri için M x (t ) M y (t ) ise X ve Y şans değişkenleri aynı olasılık dağılımına sahiptir. 35 Örneğin X şans değişkeninin dağılımı N ; 2 olsun y ax b şeklinde ve normal dağılımlı M y t ebt M x at olsun. M x t e t M y t ebt eat a 2 2 t /2 e 2t 2 2 olduğuna göre; b a t a 2 t 2 / 2 e ’ dir. Bu ise ortalaması a b ve varyansı a 2 2 olan normal bir dağılımın moment türeten fonksiyonudur. Moment türeten fonksiyonun kullanılabileceği konulardan biri de bağımsız şans değişkenlerinin toplamının dağılışının belirlenmesidir. Teorem: X ve Y bağımsız ve aynı dağılıma sahip iki tesadüfi değişken ve bunların moment türeten fonksiyonları sırasıyla M x (t ) ve M y (t ) olsun z x y şeklinde tanımlanan bir Z tesadüfi değişkeninin moment türeten fonksiyonu; M z (t ) M x (t )M y (t ) ’ dir. İspat: M z (t ) E e zt E e x y t E e xt e yt X ve Y bağımsız olduklarından; M z (t ) E e xt E e yt M z (t ) M x (t ) M y (t ) olur. Eğer bu teorem n tane tesadüfi değişken için genişletilir ise; M z (t ) M x1 (t )M x2 (t )...M xn (t ) . Tanım (Bir şans değişkeninin fonksiyonunun moment türeten fonksiyonu): X şans değişkeninin herhangi bir fonksiyonu g (x) ise M g x (t ) E e g x t dir. M g x (t ) e g x t f x dx M g x (t ) e f x olur. g xt x 3.15.2 Merkezi Moment Türeten Fonksiyon Bir X şans değişkeninin kendi anakütle ortalamasına göre de moment türeten fonksiyonu bulunabilir. Bu da genellikle M x (t ) ile ifade edilir. M x (t ) E e E e xt e t M x (t ) ’ dir. 36 Buna göre kesikli veya sürekli bir X şans değişkeninin orijine göre moment türeten fonksiyonu biliniyorsa bu fonksiyon e t ile çarpılarak anakütle ortalaması etrafındaki moment türeten fonksiyon kolayca bulunabilir. 3.15.3 Faktöriyel Moment Türeten Fonksiyon X şans değişkeninin faktöriyel moment türeten fonksiyonu eğer t x fonksiyonunun beklenen değeri mevcutsa Gt E (t x ) ile tanımlanır. Bu fonksiyon f x olasılık fonksiyonunun Mellin-Stieltjes dönüşümü olarak da adlandırılır ve dr E (t x ) t 1 E[ X ( X 1).......(X r 1)] dt r eşitliğini sağlar. Eşitliğin sağ tarafı r-inci dereceden faktöriyel momenttir. Eğer X kesikli bir şans değişkeni ise, E (t x ) t x f ( x) x yazılabilir. Bu ifadede kuvvet serisinin katsayıları olasılıklar olduğu için faktöriyel moment türeten fonksiyon, olasılık türeten fonksiyon olarak adlandırılır. Burada x k olasılığını elde etmek için 1 dk E (t x ) t 0 f x k . k k! dt Bu fonksiyonun çeşitli derecelerden türevleri alınıp, t yerine 1 konduğunda x şans değişkenine ilişkin faktöriyel momentler bulunur. Birinci türevi; dt x d E Xt x 1 Gx t E t x E dt dt t 1 G1 E X bulunur. İkinci türevi; G 1 EX X 1 bulunur. r -inci türevi; G r 1 EX X 1... X r t Faktöriyel moment özellikle kesikli değişkenlerde önemlidir. 37