Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı

advertisement
BİYOİSTATİSTİK
Bazı Olasılık Dağılışları
Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH
Ege Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim AD.
Web: www.biyoistatistik.med.ege.edu.tr
1
2
3
4
• Uygulamalı bilim dallarında çoğu
kez üzerinde araştırma yapılan
özellikler,
belirli
varsayımlar
altında belirli olasılık dağılışları
göstermektedir.
• Doğada ve deneysel ortamlarda,
çoğu olay belirli olasılık kurallarına
göre oluşmaktadır.
• Şans
değişkeni
(rassal
değişken)
sınıflamasına uygun olarak, kesikli ve
sürekli şans değişkenleri için uygulamada
yaygın olarak pek çok olasılık dağılımı
kullanılmaktadır.
Olasılık Dağılımları
Kesikli değişkenler için
•
•
•
•
Binom
Negatif Binom
Geometrik
Poisson
Sürekli değişkenler için
•
•
•
•
•
Uniform
Üssel
Gamma
Weibull
Normal
1. Binom Dağılımı (Kesikli Dağılım):
• Deney birbirine benzer şekilde n kez tekrarlanır.
• Tekrarlanan bu n deneyin her birinin sonunda iki
olaydan biri gözlenir (HT+, HT-).
• Her deneyde (+) sonucunun gözlenme olasılığı p’ye
eşittir ve değişmez. ((-) olasılığı, p+q=1, q=1-p)
• p=q ise dağılım simetriktir, aksi halde dağılım çarpıklık
gösterir.
• Deneyler birbirinden bağımsız olarak yapılmaktadır.
• Bizim ilgilendiğimiz şans değişkeni (X), n defa
tekrarlanan deneylerin sonucunda (+) sonuçların
gözlenme sıklığıdır.
Bu deneme bir BİNOM denemesidir.
8
• Binom Dağılımı Örnekleri;
– Yazı-tura denemeleri
– Bir soruya verilen evet-hayır cevabı
– Bir laboratuar testinin sonucunun + ve – çıkması
– Rasgele seçilen bir kişinin sigara içip içmemesi
– İncelenen bir elektronik devrenin bozuk olup
olmaması
– Bir kişinin hasta olup olmaması vb.
1. Binom Dağılımı (devam):
X: 50 yaş üzeri erkeklerde HT görülme sıklığı
n→ deneme yapıldığında (gözlem sayısı)
x = 0,1,2,….,n (Kesikli şans değişkeni)
P(X=x)=?
P(X≤x) =?
10
1. Binom Dağılımı (devam):
x = 0,1,2,….,n
X ~ B(n,p)
 n  x n x  n!  x n x
 p q
P(X=x) =   p q  
 x!n  x ! 
 x
  n  x n x 
P(X≤x) =     p q 
x 0   x 

x
μ = E(x) = np
σ2 = E(x-μ)2 = npq
11
Örnek 1
Herhangi bir ameliyatta başarı oranının %40 olduğu
bilinsin. 5 hasta ameliyat edildiğine göre;
a) Bu 5 hastanın kaçında başarı beklersiniz?
b) En az 4 başarı olasılığı nedir?
a) X: Başarılı geçen operasyon sayısı
X~B(n=5;p=0.40) x = 0,1,2,3,4,5
E(X) =µ=(n)*(p)=5*0.4=2 operasyon
b)
Örnek 2
Bir şehirde bulunan 4 ambulansın herhangi bir
zamanda servise çıkmaya hazır olması
olasılığı 0.8’dir ve ambulanslar birbirinden
bağımsız olarak hareket etmektedir. Herhangi
bir gereksinim olduğunda;
a) Sadece 2 ambulansın hazır olma olasılığı
nedir?
b) En az 2 ambulansın hazır olma olasılığı nedir?
c) 4 ambulansın birden hazır olma olasılığı
nedir?
a) Sadece 2 ambulansın hazır olma olasılığı
nedir?
Ambulanslar birbirinden bağımsız hareket
ettikleri ve her birinin servise çıkmaya hazır
olma olasılıkları birbirine eşit olduğu için,
deney bir binom denemesidir.
n=4 ve p=0.8 olarak soruda verilmiştir.
 4
x
4 x


P( X  x)   (0.8) (0.2)
 x
 4
2
4 2
P( X  2)   (0.8) (0.2)
 2

4! 
(0.64)(0.04)  0.1536
 
 2!4  2 ! 
b) En az 2 ambulansın hazır olma olasılığı
nedir?
P(en az 2)  P(2)  P(3)  P(4)
 1  P(0)  P(1)
 4
0
4 0  4 
1
41
 1   (0.8) (0.2)   (0.8) (0.2)
0
1
 0.9728
c) 4 ambulansın birden hazır olma olasılığı
nedir?
 4
4
4 4
P( X  4)   (0.8) (0.2)
 4
 4! 
4
0

(0.8) (0.2)  0.4096
 4!0! 
2. Normal Dağılım (Sürekli Dağılım)
• X şans değişkeni süreklidir. Genellikle ölçümle
elde edilir.
• Sürekli bir şans değişkeni olan X, normal dağılıma
uyuyor ise,
X~N(µ ,σ2) olur.
• µ, popülasyon ortalamasını ve 2, popülasyon
varyansı olmak üzere olasılık fonksiyonu,
f ( x) 
1
e
2
1  x 
 

2  
2
-∞ < x < ∞, -∞ < µ < ∞ ve  2>0
18
• Gauss tarafından bulunup özellikle ölçüm hatalarının
dağılımlarının incelenmesinde kullanılmaktadır.
• İstatistik teorisinin bel kemiği olan normal dağılım, çan
eğrisi şeklindeki eğrisi ile bilimsel ve teknolojik
araştırmalarda üzerinde çalışılan pek çok değişkenin
modellenmesinde kullanılmaktadır.
• Bazı koşullar sağlandığında kesikli ve sürekli pek çok
değişken normal dağılıma yaklaşım gösterir.
Normal Dağılım Grafiği
f(x)
X~N(µ ,σ2)
µ
20
• Dağılım
ortalamaya
göre
simetriktir.
• Alanın %50’si ortalamadan
geçen dikey çizginin sağına,
%50’si soluna düşer.
• Simetrik bir dağılım olduğu için,
eğri altında kalan toplam alan
bir birim karedir.


f ( x)dx  1
µ

• Aritmetik ortalama, ortanca ve tepe değeri birbirine
eşittir.
21
Eğri altında kalan alan = Olasılık
%68,26
µ-
µ
µ+
P (µ -  ≤ x ≤ µ+) = 0,6826
22
Eğri altında kalan alan = Olasılık
%95,44
µ-2
µ
µ+2
P (µ - 2 ≤ x ≤ µ+2) = 0,9544
23
Eğri altında kalan alan = Olasılık
%99,74
µ-3
µ
µ+3
P (µ - 3 ≤ x ≤ µ+3) = 0,9974
24
Normal dağılımda ampirik kurala göre;
µ ±  sınırları verilerin %68.26’sını,
µ ± 2 sınırları verilerin %95.44’ünü,
µ ± 3 sınırları verilerin %99.74’ünü
kapsar.
25
Normal dağılımda yığılımlı (birikimli) olasılıklar
b
P ( X  b) 
 f ( x)dx
işlemi ile,

herhangi [a b] aralığına ilişkin olasılık
b
P(a  X  b)   f ( x)dx
işlemi ile bulunabilir.
a
Yukarıdaki
hesaplamaları
yapmak
kolay
olmadığından, bu hesaplamalar için standart
normal dağılım dönüşümünden yararlanılır.
26
3. Standart Normal Dağılım
• Normal dağılımın özel bir biçimidir. Normal
dağılıma dayalı hesaplamalarda kullanıcılara
kolaylık sağlar.
• X ~ N (0, 1)
• µ = 0 ve 2 = 1 dir.
• Yoğunluk fonksiyonu aşağıdaki gibidir:
1 2
 z
2
f ( z) 
1
e
2
27
• Eğer bir X şans değişkeninin (ş.d.) normal dağıldığı biliniyorsa
z
x

eşitliği ile elde edilen z değerleri ortalaması 0 ve varyansı 1 olan
standart normal dağılıma uyar.
Dağılımın grafiği aşağıdadır:
Z~N(µ=0 ,σ2=1)
µ=0
Z
28
29
Örnek 3:
X şd.: Bebeklerin doğum ağırlığı (gr.)
X ~ N ( = 3100 ; 2 = 90000)
a) Doğum ağırlığının 2500 gr’ın altında olma olasılığı nedir?
b) Doğum ağrılığının 2500-3500 gr arasında olma olasılığı nedir?
z
z=
2500
3100
x

2500-3100
300
z = -2
30
31
32
0,0228
0,4772
-2
0
Standart Normal Dağılım Tablosu kullanarak
P ( X  2500 )  P ( Z   2 )
P ( 0  Z  2 )  0 . 4772
P ( Z   2 )  0 ,5  0 , 4 7 7 2  0 ,0 2 2 8
33
z
x
3500  3100
z2 
300
z 2  1 .33

z1  2
0,4772
-2
0,4082
0
1,33
P ( 2500  X  3500 )  P (  2  Z  1 . 33 )
 0 . 4772  0 . 4082  0 . 8854
34
Alıştırmalar
1. Aynı koşullar altında n kez tekrarlanan
deneyde istenilen sonucun elde edilme
olasılığı
………….…………………..
dağılımında
denemeden
denemeye
değişmez.
1. Aynı koşullar altında n kez tekrarlanan
deneyde istenilen sonucun elde edilme
olasılığı
……binom…………………..
dağılımında
denemeden
denemeye
değişmez.
2.
………….
Dağılımda,
aritmetik
ortalama, ortanca ve tepe değeri birbirine
eşittir.
2. …Normal…. Dağılımda, aritmetik
ortalama, ortanca ve tepe değeri birbirine
eşittir.
3. Eğer bir X şans değişkeninin (ş.d.) normal
dağıldığı biliniyorsa, bu X şans değişkeni
kullanılarak yapılan z dönüşümü ile elde
edilen z değerleri ortalaması ……….. ve
varyansı ………. olan standart normal
dağılıma uyar.
3. Eğer bir X şans değişkeninin (ş.d.) normal
dağıldığı biliniyorsa, bu X şans değişkeni
kullanılarak yapılan z dönüşümü ile elde
edilen z değerleri ortalaması …..0….. ve
varyansı …..1…. olan standart normal
dağılıma uyar.
4. Normal dağılımda ampirik kurala göre;
µ ± 3 sınırları verilerin %95.44’ünü
kapsar.
Yanlış
5. Bir binom deneyi için aşağıdaki koşullardan
hangileri geçerlidir.
I) Denemler birbirinden bağımsız olmalıdır.
II) n tane özdeş deneme olmalıdır.
III) İki sonucun olasılıkları denemeden
denemeye değişmeyip hep aynı olmalıdır.
a. I ve II
b. I ve III
c. II ve III
d. I,II ve III
• Haftaya derste anlatılacak konular…
– Uygulama III
43
Download