İTİCÜ Mühendislik ve Tasarım Fakültesi Endüstri Mühendisliği Bölümü İSTATİSTİK VE OLASILIK I 6. Hafta: Kesikli Olasılık Dağılımları Öğr. Gör. Dr. Berk Ayvaz 2013 Kesikli Olasılık Dağılım Türleri Kesikli Olasılık Dağılımları Binom Dağılımı Poisson Dağılımı Hipergeometrik Dağılım 1- Binom Dağılımı Bir X olayının meydana gelmesinde iki durum söz konusu olduğu zamanlarda bu olayın binom dağılımı gösterdiği söylenir. Başarılı-başarısız, yazı-tura, kız-erkek vs. iki sonuçlu olaylar binom dağılımına uyarlar. Binom dağılımında başarılı olma olasılığı p, başarısız olma olasılığı ise q=1-p ‘dir. Gerçekte başarı denilen kavram, üzerinde durulan olayın meydana gelmesi, başarısızlık ise gelmemesi durumudur. Mesela, bir para atıldığında yazı gelme olasılığı üzerinde duruyorsak yazı gelme olasılığı p, gelmeme olasılığı ise 1-p=q olarak gösterilir. Bu dağılım Bernoulli dağılımı diye tanınır. Üzerinde durulan olayın n denemede x defa meydana gelme olasılığının oluşturduğu dağılıma Binom dağılımı denir. Binom dağılımının olasılık fonksiyonu şu şekildedir. 𝐏 𝐱 = 𝐧! . 𝐩𝐱 . 𝐪𝐧−𝐱 𝐱!(𝐧−𝐱)! 1- Binom Dağılımı 𝐏 𝐱 = 𝐧! . 𝐩𝐱 . 𝐪𝐧−𝐱 𝐱!(𝐧−𝐱)! X değerleri 0, 1, 2,….. gibi kesikli değerler alabileceğinden ve sadece bu değerler için nokta olasılıkları hesaplanabileceğinden binom dağılımı kesikli bir dağılımdır. Örnek 1 Bir sigortacı sigorta poliçesi satmak için farklı firmalarla görüşmeler yapmaktadır. Satış yapma olasılığı 0,4 olduğunu düşünelim. Bu kişinin 5 farklı firma ile görüştüğü bilinmektedir. Bu görüşmelerden 2 tanesinin başarılı geçme olasılığı nedir? Çözüm 1 𝐏 𝐱 = 𝐧! . 𝐩𝐱 . 𝐪𝐧−𝐱 𝐱!(𝐧−𝐱)! 𝐏 𝟐 = 𝟓! . 𝟎, 𝟒𝟐 . 𝟎, 𝟔𝟑 𝟐!(𝟑)! Binom Dağılımının Özellikleri Binom dağılımının parametresi p’dir. Ortalama = n.p Varyans = n.p.q= n.p.(1-p) Standart sapma = n.p.(1−p) Örnek 2 1. Bir proseste üretilen ürünlerin %15’inin kusurlu olduğu biliniyor. Bu prosesten şansa bağlı olarak alınan 3 birimlik bir ürün örneğinde; a) 2 ürünün kusurlu olma olasılığı nedir? b) En az 2 ürünün kusurlu olma olasılığı nedir? Çözüm 2 𝐏 𝐱 = 𝐧! . 𝐩𝐱 . 𝐪𝐧−𝐱 𝐱!(𝐧−𝐱)! a) 𝐏 𝟐 = 𝟑! . 𝟎, 𝟏𝟓𝟐 . 𝟎, 𝟖𝟓𝟏 = 𝟎, 𝟎𝟓𝟕𝟒 𝟐!(𝟏)! b) 𝐏 𝒙 ≥ 𝟐 = 𝐏 𝟐 + 𝐏 𝟑 = 𝟑! 𝟑! . 𝟎, 𝟏𝟓𝟐 . 𝟎, 𝟖𝟓𝟏 + . 𝟎, 𝟏𝟓𝟑 . 𝟎, 𝟖𝟓𝟎 𝟑!(𝟎)! 𝟐!(𝟏)! = 𝟎, 𝟎𝟓𝟕𝟒 + 𝟎, 𝟎𝟎𝟑𝟒 = 𝟎, 𝟎𝟔𝟎𝟖 Örnek 3 Bir toplantıya katılan 20 katılımcıya akşam yemeği çağrıları gönderilmiştir. Davet edilen her katılımcı için daveti kabul olasılığı 0,9 ‘dur. Bu daveti en çok 17 kişinin kabul etme olasılığı nedir? Çözüm 3 Rassal değişken X daveti kabul sayısını göstersin. O zaman X= 17 , n= 20 , ve p=0,9 olan bir binom dağılımına uyar. 𝐏 𝑿 ≤ 𝟏𝟕 = 𝐏 𝟏 + 𝐏 𝟐 + ⋯ + 𝐏 𝟏𝟕 = 𝟏 − [𝐏 𝐗 = 𝟏𝟖 + 𝐏 𝐗 = 𝟏𝟗 + 𝐏 𝐗 = 𝟐𝟎 ] 𝐏 𝑿 ≤ 𝟏𝟕 = 𝟏 − 𝐏 𝐗 = 𝟏𝟖 + 𝐏 𝐗 = 𝟏𝟗 + 𝐏 𝐗 = 𝟐𝟎 𝟐𝟎! 𝟐𝟎! 𝟐𝟎! = 𝟏 − [ 𝟏𝟖!(𝟐)! . 𝟎, 𝟗𝟏𝟖 . 𝟎, 𝟏𝟐 + 𝟏𝟗!(𝟏)! . 𝟎, 𝟗𝟏𝟗 . 𝟎, 𝟏𝟏 + 𝟐𝟎!(𝟎)! . 𝟎, 𝟗𝟐𝟎 . 𝟎, 𝟏𝟎 ] = 𝟏 − (𝟎, 𝟐𝟖𝟓𝟐 + 𝟎, 𝟐𝟕𝟎𝟐 + 𝟎, 𝟏𝟐𝟏𝟔) = 𝟎, 𝟑𝟐𝟑 Örnek 4 Cıvata üretimini yapan bir firmada kalite kontrol mühendisi üretilen ürünlerin kalitesini denetlemektedir. 20 adetlik cıvata kutusunda 5 adet civatanın kusurlu olduğu bilinmektedir. Bu kutudan 4 adet cıvata çekildiğinde; a) Bir civatanın kusurlu olma olasılığı nedir? b) En az bir civatanın kusurlu olma olasılığı nedir? Çözüm 4 𝐧! 𝐱!(𝐧−𝐱)! . 𝐩𝐱 . 𝐪𝐧−𝐱 𝐏 𝐱 = P= 5/20= 0,25 a) 𝐏 𝐱=𝟏 = b) P(X≥ 𝟏) = 𝐏 𝐗 = 𝟏 + 𝐏 𝐗 = 𝟐 + 𝐏 𝐗 = 𝟑 + 𝐏 𝐗 = 𝟒 = 1 - 𝐏 𝐗 = 𝟎 𝟒! 𝟏!(𝟒−𝟏)! 𝟐𝟕 . 𝟎, 𝟐𝟓𝟏 . 𝟎, 𝟕𝟓𝟑 = 𝟔𝟒 𝟒! 𝟏𝟕𝟓 = 𝟏 − 𝐏 𝐱 = 𝟎 = 𝟏 − [ 𝟎!(𝟒−𝟎)! . 𝟎, 𝟐𝟓𝟎 . 𝟎, 𝟕𝟓𝟒 ] = 𝟐𝟓𝟔 Örnek 5 Yeni geliştirilen bir füze, hedefin 50 m yakınına düştüğünde hedefi imha etmektedir. Füzenin hedefi imha etme olasılığı 0.40’tır. Prototip olarak üretilen 5 tane füze yapay bir hedefe atılıyor. Buna göre, hedefe atılan a) 5 füzeden 1 tanesinin hedefi imha etme olasılığını bulunuz. b) 5 füzeden en az 4 tanesinin hedefi imha etme olasılığını bulunuz. Çözüm 5 Bu örnekte, p: Hedefin imha edilme sayısı p olarak tanımlanırsa, n=5 ve p=0.40 olduğu görülür. Poisson Dağılımı Poisson dağılımı, olasılık ve istatistik teorisinde yaygın olarak kullanılan kesikli bir dağılımdır. Bir olayın, belirlenen bir zaman ya da uzay (uzunluk, alan, hacim gibi) aralığında gerçekleşme sayısını modellemek için kullanılır. İlgilenilen aralık uzunluğu, bir “birim” olarak ifade edilirse zamanla ilgili aralıklar “birim zaman”, uzayla ilgili aralıklar ise “birim uzay” olarak ifade edilir. Birim zamana örnek olarak; Bir hafta, altı ay, bir yıl Birim uzaya örnek olarak; Bir metre (uzunluk), bir dönüm (alan), 1/2 metre küp (hacim) v.b. verilebilir. Aşağıda, Poisson dağılımı kullanılarak modelleme yapılabilecek bazı olaylara örnekler verilmiştir. • Dünyaya, bir haftada (birim zaman) düşen göktaşı sayısı. • Bir kavşakta, altı ayda (birim zaman) meydana gelen trafik kazası sayısı. • Bir maden ocağında, bir yılda (birim zaman) meydana gelen ve yaralanmayla sonuçlanan kaza sayısı. • Bir metre (birim uzunluk) uzunluğunda, bir çelik halattaki üretimden kaynaklanan hata sayısı. • 2 dönüm (birim alan) büyüklüğünde bir domates serasındaki hastalıklı fide sayısı. • 1/2 metreküp (birim hacim) büyüklüğünde bir akvaryumdaki hasta Japon balığı sayısı. Örneklerden de anlaşılabileceği üzere, Poisson dağılımı nadir (seyrek) gerçekleşen olayların modellenmesinde kullanılan bir dağılımdır. Poisson Dağılımı Binom dağılımı gibi kesikli bir olasılık dağılımıdır. Bu dağılımda üzerinde durulan olayın meydana gelme ihtimali çok düşüktür. N ‘nin büyümesi, p’nin de küçülmesi halinde binom dağılımı yerine poisson dağılımı kullanılır. Daha net bir ifade ile n.p < 𝟓 olduğunda binom dağılımı poisson dağılımına dönüştürülür. 𝐞−𝛌 . 𝛌𝐱 𝐏 𝐱 = 𝐱! Burada 𝝀 = poisson dağılımının ortalamasıdır. Bu dağılımın varyansı da 𝝀’ya eşittir. Poisson dağılımının ortalaması 𝝀 = n.p ile hesaplanır. Poisson dağılımındaki e indisi yaklaşık olarak 2,71828 ‘e eşittir. e= 2,71828 𝝀 = 0’dan t’ye kadar olan zaman diliminde bir olayın ortalama gerçekleşme sayısıdır. Ortalama (𝜇) = λ Varyans (𝜎 2 ) = λ Standart sapma (𝜎)= λ Örnek 6 Bir çağrı merkezinde her bir dakikada 4 çağrı alındığını düşünelim. a) 2 dakikalık bir zaman aralığında 6 adet çağrı gelme olasılığı nedir? b) 3 dakika içinde en az 3 çağrı gelme olasılığını bulunuz. Çözüm 6 a) 2 dakikalık bir zaman diliminde beklenen çağrı sayısı 𝛌=8 ‘dir. X verilen sürede kabul edilen çağrı sayısı ise; P x=6 = b) e−λ .λx x! = e−8 .86 = 0,122138 6! Süre 3 dakika olduğunda beklenen çağrı sayısı λ=12 ‘dir. X verilen sürede kabul edilen çağrı sayısı ise; P x ≥3 = 1− P 0 +P 1 +P 2 e−12 .120 =1−( 0! + e−12 .121 e−12 .122 + 1! 2! )= 0,999478 Örnek 7 Bir araştırmaya göre İngiltere’de 2000 çalışanı olan bir fabrikada bir yıl içinde yapılan grevlerin sayısı, ortalaması 𝛌 = 0.4 olan poisson dağılımına uymaktadır. Bu durumda bir yılda en çok 1 grev olma olasılığını bulunuz. Çözüm 7 P(X≤ 𝟏) = 𝐏 𝐗 = 𝟏 + 𝐏 𝐗 = 𝟎 P x=0 = e−λ .λx x! P x=1 = e−λ .λx x! = e−0,4 .0,40 = 0,6703 0! = e−0,4 .0,41 = 0,2681 1! P(X≤ 𝟏) = 𝟎, 𝟔𝟕𝟎𝟑 + 𝟎, 𝟐𝟔𝟖𝟏 = 𝟎, 𝟗𝟑𝟖𝟒 Örnek 8 Bir otomobil galerisine ayda ortalama 150 müşteri gelmektedir. Herhangi bir günde dükkanını açmayan galeri sahibi % kaç ihtimalle en az 3 müşteriyi kaçırmıştır? Çözüm 8 Aylık λ değeri 150 olduğuna göre günlük λ=5 ‘tir. 3 veya daha fazla müşteriyi kaçırma olasılığı hesaplamak için; 𝐞−𝛌 . 𝛌𝐱 𝐏 𝐱 = 𝐱! 𝑃 𝑥 ≥ 3 = P(3)+P(4)+….+P(150)= 1- [P(0)+P(1)+P(2)] P x≥3 =1− e−5 .λ0 0! + e−5 .λ1 1! + e−5 .λ2 2! =0,8754 Örnek 9 Çözüm 9 Binom Dağılımının Poisson Yakınsaması Herbirinde başarı olasılığı p olan n bağımsız denemede başarıların sayısı X olsun. Başarı sayısı X’in dağılımı, np ortalama ile binomdur. Ancak deneme sayısı n büyük ve np orta büyüklükte (tercihen np≥ 𝟕) iken bu dağılım, ortalaması λ=np olan poisson dağılımına yakınsar. Bu durumda yakınsayan dağılımın olasılık fonksiyonu şu şekilde bulunur: 𝐏 𝐱 = 𝐞−𝐧𝐩 .(𝐧𝐩) 𝐱 𝐱! Örnek 10 Bir analist bütün küçük şirketlerin %3.5 ‘inin gelecek yıl işas edeceğini tahmin etmektedir. Bu tahminin doğru olduğu varsayımıyla 100 küçük şirketten oluşan rassal bir örneklemde gelecek yıl en az 3 işas olması olasılığını tahmin ediniz. Çözüm 10 İşas sayısı X’in dağılımı n=100 ve p=0,035 ile binomdur. Dağılımın ortalaması: μx = np = 100. 0,035 = 3,5 Binom dağılımını yakınsamak için ortalaması 𝜆= 3,5 olan Poisson dağılımını kullanacağız. Bu durumda işas sayısı X’in olasılık fonksiyonu şöyle yakınsayabilir. 𝑃 𝑥 ≥ 3 = 1- [P(0)+P(1)+P(2)] 𝐏 𝐱 = 𝐞−𝐧𝐩 .(𝐧𝐩)𝐱 𝐞−𝟑.𝟓 .(𝟑.𝟓)𝟎 = 𝐱! 𝟎! = 0.0302 𝐏 𝐱 = 𝐞−𝐧𝐩 .(𝐧𝐩)𝐱 𝐞−𝟑.𝟓 .(𝟑.𝟓)𝟏 = 𝐱! 𝟏! = 0.1057 𝐏 𝐱 = 𝐞−𝐧𝐩 .(𝐧𝐩)𝐱 𝐞−𝟑.𝟓 .(𝟑.𝟓)𝟐 = 𝐱! 𝟐! = 0.1850 𝑷 𝒙 ≥ 𝟑 = 1- [P(0)+P(1)+P(2)]= 1-(0.032+0.1057+0.1850)= 0,679 Hipergeometrik Dağılım Binom dağılımı ve hipergeometrik dağılım aynı tür olaylara uygulanır. Fark örneklemenin şeklinde ortaya çıkar. Binom dağılımında sınırsız anakütleden iadesiz çekilişler veya sınırlı anakütleden iadeli çekilişler söz konusudur. Bu yüzden binomdaki p değeri çekilişten çekilişe değişim göstermez. Hipergeometrik denemede ise sınırlı anakütleden iadesiz çekilişler söz konusudur. Bir başka ifade ile binom olaylarında çekilişler birbirlerinden bağımsız iken hipergeometrik olaylarda bir sonraki çekiliş bir öncekine bağımlıdır. İstatistiki kalite kontrol çalışmalarında en elverişli olasılık dağılımı hipergeometrik dağılımdır. Hipergeometrik dağılım formülü yardımıyla bir X olayının olasılığı; 𝐏 𝐗 = 𝐱\n, 𝐍, 𝐀 = 𝑨 𝑵−𝑨 . 𝒙 𝒏−𝒙 𝑵 𝒏 n: örnekteki birim sayısı N: anakütledeki birim sayısı x: Örnekte üzerinde durulan birim sayısı A: anakütlede üzerinde durulan birim sayısı Hibir şekilde x değeri A’dan büyük olamaz. Hipergeometrik Dağılımın Özellikleri A N Dağılımın parametresi: p= Ortalama: np Varyans: np.(1-p). Standart Sapma: np.(1−p). N−n N−1 N−n N−1 Örnek 11 2 istatistik, 3 bilgisyar ve 4 yöneylem hocasından 3 kişilik sayısal yöntemeler bilim jürisi seçilecektir. Jüride en az 1 istatistik hocası bulunma ihtimalini hesaplayınız. Çözüm 11 Jüriye girebilecek toplam hoca sayısı: N=9 Jüride yalnız 3 hoca olabileceği için n=3 İstatistik hocasının jüride bulunma ihtimali araştırıldığı için A=2 Buna göre 2 istatistik hocasından 1 veya 2 ‘sinin jüride bulunma ihtimali ; 𝑃 𝑥 ≥ 1 = [P(1)+P(2)] 𝐏 𝑥≥1 = 𝑨 𝑵−𝑨 𝟐 𝟗−𝟐 𝟐 𝟗−𝟐 . . . 𝒙 𝒏−𝒙 𝟏 𝟑−𝟏 𝟐 𝟑−𝟐 = + 𝟗 𝟗 𝑵 𝟑 𝟑 𝒏 𝟕 =𝟒𝟐 + = 𝟎, 𝟓𝟖𝟑𝟑 𝟖𝟒 𝟖𝟒 Örnek 12 Not ortalaması 85’in üzerinde olan 4 iktisat ve 7 işletme bölümü öğrencisinden 3 kişilik bir temsilci grubu oluşturulacaktır. Grupta en fazla bir iktisatçı bulunması ihtimali nedir? Çözüm 12 ÇÖZÜM: N=11 n=3 A=4 P(x≤1)= [ P(1) + P(2) ] P x≥1 = A N−A 4 11−4 4 11−4 . . . x n−x 0 3−0 1 3−1 = + 11 11 N 3 3 n 119 =165 = 0,7212