BİYOİSTATİSTİK Bazı Olasılık Dağılışları Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH Ege Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim AD. Web: www.biyoistatistik.med.ege.edu.tr 1 2 3 4 • Uygulamalı bilim dallarında çoğu kez üzerinde araştırma yapılan özellikler, belirli varsayımlar altında belirli olasılık dağılışları göstermektedir. • Doğada ve deneysel ortamlarda, çoğu olay belirli olasılık kurallarına göre oluşmaktadır. • Şans değişkeni (rassal değişken) sınıflamasına uygun olarak, kesikli ve sürekli şans değişkenleri için uygulamada yaygın olarak pek çok olasılık dağılımı kullanılmaktadır. Olasılık Dağılımları Kesikli değişkenler için • • • • Binom Negatif Binom Geometrik Poisson Sürekli değişkenler için • • • • • Uniform Üssel Gamma Weibull Normal 1. Binom Dağılımı (Kesikli Dağılım): • Deney birbirine benzer şekilde n kez tekrarlanır. • Tekrarlanan bu n deneyin her birinin sonunda iki olaydan biri gözlenir (HT+, HT-). • Her deneyde (+) sonucunun gözlenme olasılığı p’ye eşittir ve değişmez. ((-) olasılığı, p+q=1, q=1-p) • p=q ise dağılım simetriktir, aksi halde dağılım çarpıklık gösterir. • Deneyler birbirinden bağımsız olarak yapılmaktadır. • Bizim ilgilendiğimiz şans değişkeni (X), n defa tekrarlanan deneylerin sonucunda (+) sonuçların gözlenme sıklığıdır. Bu deneme bir BİNOM denemesidir. 8 • Binom Dağılımı Örnekleri; – Yazı-tura denemeleri – Bir soruya verilen evet-hayır cevabı – Bir laboratuar testinin sonucunun + ve – çıkması – Rasgele seçilen bir kişinin sigara içip içmemesi – İncelenen bir elektronik devrenin bozuk olup olmaması – Bir kişinin hasta olup olmaması vb. 1. Binom Dağılımı (devam): X: 50 yaş üzeri erkeklerde HT görülme sıklığı n→ deneme yapıldığında (gözlem sayısı) x = 0,1,2,….,n (Kesikli şans değişkeni) P(X=x)=? P(X≤x) =? 10 1. Binom Dağılımı (devam): x = 0,1,2,….,n X ~ B(n,p) n x n x n! x n x p q P(X=x) = p q x!n x ! x n x n x P(X≤x) = p q x 0 x x μ = E(x) = np σ2 = E(x-μ)2 = npq 11 Örnek 1 Herhangi bir ameliyatta başarı oranının %40 olduğu bilinsin. 5 hasta ameliyat edildiğine göre; a) Bu 5 hastanın kaçında başarı beklersiniz? b) En az 4 başarı olasılığı nedir? a) X: Başarılı geçen operasyon sayısı X~B(n=5;p=0.40) x = 0,1,2,3,4,5 E(X) =µ=(n)*(p)=5*0.4=2 operasyon b) Örnek 2 Bir şehirde bulunan 4 ambulansın herhangi bir zamanda servise çıkmaya hazır olması olasılığı 0.8’dir ve ambulanslar birbirinden bağımsız olarak hareket etmektedir. Herhangi bir gereksinim olduğunda; a) Sadece 2 ambulansın hazır olma olasılığı nedir? b) En az 2 ambulansın hazır olma olasılığı nedir? c) 4 ambulansın birden hazır olma olasılığı nedir? a) Sadece 2 ambulansın hazır olma olasılığı nedir? Ambulanslar birbirinden bağımsız hareket ettikleri ve her birinin servise çıkmaya hazır olma olasılıkları birbirine eşit olduğu için, deney bir binom denemesidir. n=4 ve p=0.8 olarak soruda verilmiştir. 4 x 4 x P( X x) (0.8) (0.2) x 4 2 4 2 P( X 2) (0.8) (0.2) 2 4! (0.64)(0.04) 0.1536 2!4 2 ! b) En az 2 ambulansın hazır olma olasılığı nedir? P(en az 2) P(2) P(3) P(4) 1 P(0) P(1) 4 0 4 0 4 1 41 1 (0.8) (0.2) (0.8) (0.2) 0 1 0.9728 c) 4 ambulansın birden hazır olma olasılığı nedir? 4 4 4 4 P( X 4) (0.8) (0.2) 4 4! 4 0 (0.8) (0.2) 0.4096 4!0! 2. Normal Dağılım (Sürekli Dağılım) • X şans değişkeni süreklidir. Genellikle ölçümle elde edilir. • Sürekli bir şans değişkeni olan X, normal dağılıma uyuyor ise, X~N(µ ,σ2) olur. • µ, popülasyon ortalamasını ve 2, popülasyon varyansı olmak üzere olasılık fonksiyonu, f ( x) 1 e 2 1 x 2 2 -∞ < x < ∞, -∞ < µ < ∞ ve 2>0 18 • Gauss tarafından bulunup özellikle ölçüm hatalarının dağılımlarının incelenmesinde kullanılmaktadır. • İstatistik teorisinin bel kemiği olan normal dağılım, çan eğrisi şeklindeki eğrisi ile bilimsel ve teknolojik araştırmalarda üzerinde çalışılan pek çok değişkenin modellenmesinde kullanılmaktadır. • Bazı koşullar sağlandığında kesikli ve sürekli pek çok değişken normal dağılıma yaklaşım gösterir. Normal Dağılım Grafiği f(x) X~N(µ ,σ2) µ 20 • Dağılım ortalamaya göre simetriktir. • Alanın %50’si ortalamadan geçen dikey çizginin sağına, %50’si soluna düşer. • Simetrik bir dağılım olduğu için, eğri altında kalan toplam alan bir birim karedir. f ( x)dx 1 µ • Aritmetik ortalama, ortanca ve tepe değeri birbirine eşittir. 21 Eğri altında kalan alan = Olasılık %68,26 µ- µ µ+ P (µ - ≤ x ≤ µ+) = 0,6826 22 Eğri altında kalan alan = Olasılık %95,44 µ-2 µ µ+2 P (µ - 2 ≤ x ≤ µ+2) = 0,9544 23 Eğri altında kalan alan = Olasılık %99,74 µ-3 µ µ+3 P (µ - 3 ≤ x ≤ µ+3) = 0,9974 24 Normal dağılımda ampirik kurala göre; µ ± sınırları verilerin %68.26’sını, µ ± 2 sınırları verilerin %95.44’ünü, µ ± 3 sınırları verilerin %99.74’ünü kapsar. 25 Normal dağılımda yığılımlı (birikimli) olasılıklar b P ( X b) f ( x)dx işlemi ile, herhangi [a b] aralığına ilişkin olasılık b P(a X b) f ( x)dx işlemi ile bulunabilir. a Yukarıdaki hesaplamaları yapmak kolay olmadığından, bu hesaplamalar için standart normal dağılım dönüşümünden yararlanılır. 26 3. Standart Normal Dağılım • Normal dağılımın özel bir biçimidir. Normal dağılıma dayalı hesaplamalarda kullanıcılara kolaylık sağlar. • X ~ N (0, 1) • µ = 0 ve 2 = 1 dir. • Yoğunluk fonksiyonu aşağıdaki gibidir: 1 2 z 2 f ( z) 1 e 2 27 • Eğer bir X şans değişkeninin (ş.d.) normal dağıldığı biliniyorsa z x eşitliği ile elde edilen z değerleri ortalaması 0 ve varyansı 1 olan standart normal dağılıma uyar. Dağılımın grafiği aşağıdadır: Z~N(µ=0 ,σ2=1) µ=0 Z 28 29 Örnek 3: X şd.: Bebeklerin doğum ağırlığı (gr.) X ~ N ( = 3100 ; 2 = 90000) a) Doğum ağırlığının 2500 gr’ın altında olma olasılığı nedir? b) Doğum ağrılığının 2500-3500 gr arasında olma olasılığı nedir? z z= 2500 3100 x 2500-3100 300 z = -2 30 31 32 0,0228 0,4772 -2 0 Standart Normal Dağılım Tablosu kullanarak P ( X 2500 ) P ( Z 2 ) P ( 0 Z 2 ) 0 . 4772 P ( Z 2 ) 0 ,5 0 , 4 7 7 2 0 ,0 2 2 8 33 z x 3500 3100 z2 300 z 2 1 .33 z1 2 0,4772 -2 0,4082 0 1,33 P ( 2500 X 3500 ) P ( 2 Z 1 . 33 ) 0 . 4772 0 . 4082 0 . 8854 34 Alıştırmalar 1. Aynı koşullar altında n kez tekrarlanan deneyde istenilen sonucun elde edilme olasılığı ………….………………….. dağılımında denemeden denemeye değişmez. 1. Aynı koşullar altında n kez tekrarlanan deneyde istenilen sonucun elde edilme olasılığı ……binom………………….. dağılımında denemeden denemeye değişmez. 2. …………. Dağılımda, aritmetik ortalama, ortanca ve tepe değeri birbirine eşittir. 2. …Normal…. Dağılımda, aritmetik ortalama, ortanca ve tepe değeri birbirine eşittir. 3. Eğer bir X şans değişkeninin (ş.d.) normal dağıldığı biliniyorsa, bu X şans değişkeni kullanılarak yapılan z dönüşümü ile elde edilen z değerleri ortalaması ……….. ve varyansı ………. olan standart normal dağılıma uyar. 3. Eğer bir X şans değişkeninin (ş.d.) normal dağıldığı biliniyorsa, bu X şans değişkeni kullanılarak yapılan z dönüşümü ile elde edilen z değerleri ortalaması …..0….. ve varyansı …..1…. olan standart normal dağılıma uyar. 4. Normal dağılımda ampirik kurala göre; µ ± 3 sınırları verilerin %95.44’ünü kapsar. Yanlış 5. Bir binom deneyi için aşağıdaki koşullardan hangileri geçerlidir. I) Denemler birbirinden bağımsız olmalıdır. II) n tane özdeş deneme olmalıdır. III) İki sonucun olasılıkları denemeden denemeye değişmeyip hep aynı olmalıdır. a. I ve II b. I ve III c. II ve III d. I,II ve III • Haftaya derste anlatılacak konular… – Uygulama III 43