Yrd.Doç.Dr. Emre YALAMAÇ TEK BİR ÖRNEKLEME İÇİN İSTATİSTİKSEL ARALIKLAR Yrd.Doç.Dr. Emre YALAMAÇ o Giriş İÇERİK oVaryansı Bilinen Bir Normal Dağılımın Ortalamasının Güvenlik Aralığı (CI) o İçin Büyük Örnekleme Güvenlik Aralığı oVaryansı Bilinmeyen Bir Normal Dağılımın Ortalamasının Güvenlik Aralığı (CI) • • t Dağılımı ’nün t Güvenlik Aralığı oBir Normal Dağılımın Varyans ve Standart Sapma Güvenlik Aralığı o Tolerans ve Tahmin Aralık • Gelecek Bir Gözlem İçin Tahmin Aralığı • Bir Normal Dağılım İçin Tolerans Aralığı Yrd.Doç.Dr. Emre YALAMAÇ GİRİŞ Daha önceki konularda bir parametrenin örnekleme verilerinden nasıl tahmin edildiğini gördük. Fakat önemli olan tahminin ne kadar iyi edildiğini anlamaktır. Örneğin bir kimyasal ürünün ortalama viskozitesini tahmin etmek istiyoruz. örneklemin ortalaması, örnekleme çeşitliliğinden dolayı hiçbir zaman kitle ortalamasına eşit olamaz. Tahmin edilen nokta ‘nın ’ya ne kadar yakın olduğu hakkında hiçbir şey söylemez. Gerçek üretim ortalaması 900 ile 1000 arasında mı?ya da 990 ile 1010 arasında mı? Bu soruların cevabı bu üretim için kararımızı etkiler. Sınırlar, bir parametre için makul bir aralığı gösterir ve bir aralık tahmini örneğidir. Bir kitle parametresinin bir aralık tahminine güvenlik aralığı denir. Bilinmeyen kitle parametresini içeren aralık hesabını sadece tüm kitleden alınan örnekler kullanarak tam olarak yapamayız. Fakat güven aralığı hesaplanarak, bilinmeyen kitle parametresini içerdiği konusunda yüksek güvenimiz olur. Yrd.Doç.Dr. Emre YALAMAÇ GİRİŞ Bir tolerans aralığı bir başka önemli çeşit aralık tahminidir. Viskozite örneğinin normal dağılımlı olduğunu varsayarak %95 viskozite değerini içine alan sınır bir değer hesaplayabiliriz. Yani dağılımın %95’i bu aralık içindedir. -1,96, +1,96 ve bilinmediğinden dolayı nokta tahminleri -ks, ve s kullanılır. +ks k uygun bir sabittir ve 1,96’dan büyüktür. Tahmini aralık kitleden gelecek gözlemleri sınırlamayı sağlar. Yrd.Doç.Dr. Emre YALAMAÇ Varyansı Bilinen Bir Normal Dağılımın Ortalamasının Güvenlik Aralığı (CI) Gerçekci olmayan yani ortalaması bilinmeyip de varyansı bilinen bir kitlenin, X1,X2,…Xn varyansı bilinen ve ortalaması bilinmeyen bir normal dağılımdan alınan bir rasgele örnekleme olsun. Standardize edilirse; Standart normal dağılım Ortalama için güvenlik aralığı bir aralık tahmin eder bunu da örnek veri setinden hesaplanan l ve u uç noktalarından yapar. Çünkü farklı örnekleme farklı uç noktalar üretir dolayısıyla bu uç noktaların değerleri rasgele değişkenler L ve U’dur. L ve U değerlerini aşağıdaki olasılık durumundan belirleyebiliriz. Seçilen örneklemin 1- olasılığında güvenlik aralığının gerçek orta değeri içermesi mümkündür. Yrd.Doç.Dr. Emre YALAMAÇ Varyansı Bilinen Bir Normal Dağılımın Ortalamasının Güvenlik Aralığı (CI) Örnekleme seçildikten sonra için güvenlik aralığı l ve u değerlerinden hesaplanır. l ve u’ya alt ve üst güvenlik sınırları denir ve 1-’ya güvenlik sabiti denir. Standart normal dağılım durumunda Standart normal dağılım olasılık aralığı değiştirilerek : Şayet xa varyansı bilinen (2) bir normal kitleden alınan n tane rasgele örneğin ortalaması ise , için bir %100(1-) güvenlik aralığı şöyle ifade edilir: Yrd.Doç.Dr. Emre YALAMAÇ Varyansı Bilinen Bir Normal Dağılımın Ortalamasının Güvenlik Aralığı (CI) ÖRNEK: A238 çeliğinin charpy darbe enerji değerini bulmak için yapılan 10 deneyin sonuçları aşağıdaki gibidir. Darbe enerjisi =1J’luk standart sapmaya ile normal dağılım göstermektedir. ortalama darbe enerjisi için % 95 güvenlik aralığını bulunuz? ve Yrd.Doç.Dr. Emre YALAMAÇ Varyansı Bilinen Bir Normal Dağılımın Ortalamasının Güvenlik Aralığı (CI) ÖRNEK: A238 çeliğinin charpy darbe enerji değerini bulmak için yapılan 10 deneyin sonuçları aşağıdaki gibidir. Darbe enerjisi =1J’luk standart sapmaya ile normal dağılım göstermektedir. ortalama darbe enerjisi için % 95 güvenlik aralığını bulunuz? ve CEVAP: % 100(1-)=% 95 ise =0,05 - Tablo’dan okunur. Yrd.Doç.Dr. Emre YALAMAÇ Varyansı Bilinen Bir Normal Dağılımın Ortalamasının Güvenlik Aralığı (CI) Bir Güvenlik Aralığının Yorumlanması: Çeliğin ortalama darbe enerji () örneğine göre 0,95 olasılıkla ortalama değer arasındadır denmektedir. Fakat biraz düşünülürse bunun doğru olmadığı gerçek değeri bilinmeyen bir ortalama ve durumu için ya doğru yada yanlış bir olasılık vardır. Doğru yorum bir ‘CI’nın rasgele bir aralık olduğunu anlamakta yatar. Şekilde gösterildiği gibi, Eğer %95 güvenlik aralıklı bir durumsa sadece bu aralıklardan %5’i değeri için başarısızdır. Pratikte, sadece bir örnekleme yapılır ve bunun güvenlik aralığı hesaplanır bu örneklemenin aralığı ’yu içerir ya da içermez bunun için bir olasılık seviyesi atamak mantıklı değildir. Uygun durum gözlenen aralığın [l, u] gerçek değerini 100(1-) güvenle tutmasıdır. Yrd.Doç.Dr. Emre YALAMAÇ Varyansı Bilinen Bir Normal Dağılımın Ortalamasının Güvenlik Aralığı (CI) Güven Seviyesi ve Tahminin Kesinliği: Çelik darbe enerji deneyinde seçilen güvenlik seviyesi %95 keyfidir. Daha yüksek güven seviyesi örneğin %99 seçsek ne olur? Ya da daha yüksek güven aralığı seçmek mantıksız mıdır? Güvenlik Aralığı Uzunluğu %99 CI, %95 CI’dan daha uzundur. Genel olarak belirli sayıda örnek ve s standart sapma için yüksek güven seviyesi yüksek güven aralığı sonucudur. Güven aralığı uzunluğu tahminin kesinliğinin bir ölçüsüdür. Kesinlik güven aralığı ile ters ilişkilidir. Yeterince kısa bir güven aralığı elde etmek karar verme ve yeterli güvenliğe sahip olmak için istenilendir. Yrd.Doç.Dr. Emre YALAMAÇ Varyansı Bilinen Bir Normal Dağılımın Ortalamasının Güvenlik Aralığı (CI) Örnekleme Büyüklüğünün Seçilmesi: Güven aralığının kesinliği denklemde ba kullanarak hata ‘dir. ’yu tahmin etmek için ,100(1-)güvenliğinde ‘ye eşit veya küçüktür. Örnekleme büyüklüğünün kontrol edilebildiği durumlarda, n’yi seçebiliriz böylece yüzde 100(1-) güvenli yani tahminindeki hata bir belirlenmiş sınır hatasından küçük olur. Uygun örnekleme büyüklüğü n’i örneğin seçerek bulunur. Bu denklemin çözülmesi bize n değerini verir. Şayet xb, ’yu tahmin etmek için kullanılıyorsa %100(1-) güvenli olabiliriz ki hata bir belirli E miktarını geçmez. örnek büyüklüğü Yrd.Doç.Dr. Emre YALAMAÇ Varyansı Bilinen Bir Normal Dağılımın Ortalamasının Güvenlik Aralığı (CI) Örnekleme Büyüklüğünün Seçilmesi: ÖRNEK: A238 çeliğinin charpy darbe enerji deneylerinde % 95 güvenlik aralığı hesabı için n sayısı nedir? CEVAP: Yrd.Doç.Dr. Emre YALAMAÇ Varyansı Bilinen Bir Normal Dağılımın Ortalamasının Güvenlik Aralığı (CI) Örnekleme Büyüklüğünün Seçilmesi: Örnek büyüklüğü, istenilen uzunlukta güvenlik aralığı 2E, güvenlik seviyesi 100(1-) ve standart sapma arasındaki genel ilişki: • İstenilen uzunluktaki 2E azaldıkça, belirli bir değeri ve belirlenmiş güvenlik için gerekli örnek büyüklüğü n artar. • standart sapma artarken, istenilen uzunluk 2E ve belirlenmiş güvenlik için gerekli örnek büyüklüğü n artar. • Güvenlik seviyesi arterken, sabitlenmiş istenilen uzunluk 2E ve standart sapma için gerekli örnek büyüklüğü n artar. Yrd.Doç.Dr. Emre YALAMAÇ Varyansı Bilinen Bir Normal Dağılımın Ortalamasının Güvenlik Aralığı (CI) Tek Taraflı Güvenlik Sınırları: için alt ve üst güvenlik sınırları güvenlik aralığını iki taraftan da sınırlar. Fakat tek taraflı yani bir tarafı l=-∞ ya da u= ∞ olarak z/2’yi z olarak değiştirerek sınırlayabiliriz. Bir %100(1-) üst güvenlik sınırı için: Bir %100(1-) alt güvenlik sınırı için: Aynı örnek %95 güvenlik aralığında sadece alt güvenlik için hesaplandığında Eşit güvenlikte, iki taraflı aralıkta alt limit 63,84 iken tek taraflı da büyümüştür. Çünkü: Yrd.Doç.Dr. Emre YALAMAÇ Varyansı Bilinen Bir Normal Dağılımın Ortalamasının Güvenlik Aralığı (CI) Bir Güvenlik Aralığı Çıkartmak için Genel Metot: Bir bilinmeyen parametre için bir güvenlik aralığı bulmak için bir genel metot vermek kolaydır. X1,X2,…Xn n tane rasgele gözlemdir. Bir istatistik g(X1,X2,…Xn:) aşağıdaki özellikleri ile bulunabilir: 1. g(X1,X2,…Xn:) örnekleme ve ’ya birden bağlıdır. 2. g(X1,X2,…Xn:) olasılık dağılımı ya da başka bir bilinmeyen parametreye bağlı değildir. Bu kısımda ele alınan durum düşünüldüğünde, parametre = Rasgele değişken g(X1,X2,…Xn:)= ve yukarıdaki her iki durumu da sağlar. Yani örnekleme ve ’ya bağlıdır ve bir bilinen standart sapmadan dolayı standart normal dağılıma sahiptir. Yrd.Doç.Dr. Emre YALAMAÇ İÇİN BÜYÜK ÖRNEKLEME GÜVENLİK ARALIĞI Biz normal kitle dağılımlı ve ortalaması bilinmeyen ve standart sapması bilinen kabuller yaptık. Fakat şimdi bir büyük örneklemeli güvenlik aralığı sunarak bu kabullenmelere gerek kalmaz. Ortalaması ve varyansı bilinmeyen bir kitleden rasgele örnekleme yapalım. Şayet örnekleme sayısı büyük ise, merkezi limit teoremi X, ortalması ve varyansı 2/n ile yaklaşık bir normal dağılımlıdır. Bir standart normal dağılımlıdır. bilinmediği için yerine s konur. Dolayısıyla n büyük olduğunda: Büyük örneklemeli güvenlik aralığı için: Merkezi limit teoremi n=>30 olması durumunda dikkat etmez. Fakat burda n=>40 istenir çünkü ’da s ile yerdeğiştirmiştir. Yrd.Doç.Dr. Emre YALAMAÇ Varyansı Bilinmeyen Bir Normal Dağılımın Ortalamasının Güvenlik Aralığı (CI) n yeterince büyük olduğunda kitlenin normal dağılımlı olup olmadığını (Merkez limit teoreşinden dolayı) bakmaksızın güvenlik aralığını tespit ediyorduk. İlgilenilen kitlenin ortalama ve varyans değerlerinin bilinmediğini varsayarsak. Varyansın bilindiği durumda aşağıdaki gibi yazılır: Varyasnın bilinmemesi durumunda ->s olur ve dolayısıyla Z->T olarak yazılır: n sayısı yeterince büyük olduğunda ’nın s ile yerdeğiştirmesi sonuç için çok küçük bir etki yapar. Peki n yeterince büyük değilse o zaman güvenlik aralığı belirlemek için farklı dağılımlar kullanmak gerekir. Örneğin mühendislik deneylerinde. Yrd.Doç.Dr. Emre YALAMAÇ Varyansı Bilinmeyen Bir Normal Dağılımın Ortalamasının Güvenlik Aralığı (CI) t Dağılımı Varyansı ve ortalaması bilinmeyen bir normal dağılımdan alınan rasgele örnekleme X1,X2,...Xn olsun Rasgele değişkeni n-1 serbeslik derecesiyle bir t dağılımına sahiptir. olasılık yoğunluk fonksiyonu: k(serbeslik derecesiyle) t dağılımının genel görünümü standart normal dağılım gibidir. Her ikiside simetrik, tektepeli ve tepe noktası =0’da olur. Yrd.Doç.Dr. Emre YALAMAÇ Varyansı Bilinmeyen Bir Normal Dağılımın Ortalamasının Güvenlik Aralığı (CI) t Dağılımı Fakat t dağılımı normal dağılımdan daha ağır kuyrukludur yani kuyruklarında normal dağılıma göre daha fazla olasılık barındırır.Serbestlik derecesi k sonsuza doğru artarken t dağılımının limiti standart normal dağılım olur. t dağılımının yüzde noktaları tablosu eklerde verilir. Yrd.Doç.Dr. Emre YALAMAÇ Varyansı Bilinmeyen Bir Normal Dağılımın Ortalamasının Güvenlik Aralığı (CI) t dağılımının yüzde noktaları tablosu IV Yrd.Doç.Dr. Emre YALAMAÇ Varyansı Bilinmeyen Bir Normal Dağılımın Ortalamasının Güvenlik Aralığı (CI) k serbestlik derecesiyle t dağılımının yukarı(sağa) kuyruğunun 100 yüzde noktasıdır. 10 serbestlik derecesiyle 0,05’lık bir alanın t değeri: t dağılımının 0 noktasına göre simetriktir. Yrd.Doç.Dr. Emre YALAMAÇ Varyansı Bilinmeyen Bir Normal Dağılımın Ortalamasının Güvenlik Aralığı (CI) ’nun t güvenlik aralığı Ders başında varyansı bilinmeyen bir normal dağılımın orta değeri üzerine 100(1-) güvenlik aralığı için kolayca bulmayı gördük. Dağılımı n-1 serbestlik derecesiyle t’dir. n-1 serbestlik dereceli t dağılımının t/2,n-1 üst 100/2 yüzde noktası şöyle ifade edilir. Son denklem üzerinde bir ayarlama yapılırsa: Yrd.Doç.Dr. Emre YALAMAÇ Varyansı Bilinmeyen Bir Normal Dağılımın Ortalamasının Güvenlik Aralığı (CI) ’nun t güvenlik aralığı İki taraflı güvenlik aralığı için yüzde 100(1-) şöyle tanımlanır : Tek taraflı güvenlik sınırlarında : Yrd.Doç.Dr. Emre YALAMAÇ t Dağılımı : ÖRNEK X alışım örneklerinin çekme yapışma deneyleri sonucu ayrılma yükleri MPa olarak aşağıda verilmiştir. ’nun %95 güvenlik aralığını bulunuz? CEVAP: Deney sonuçlarının dağılımı test edilir->Normal dağılım Probability Plot of C1 Boxplot of C1 99 20 18 C1 14 12 10 8 6 Percent 16 95 90 80 70 60 50 40 30 20 10 5 1 0 5 10 15 BOZULMA YUKU 20 25 Yrd.Doç.Dr. Emre YALAMAÇ t Dağılımı : ÖRNEK Deney sonuçlarının ortlama ve standart sapma değerleri bulunur. Deney sayısı n 30’dan küçük olduğu ve deney sonuçları normal dağılım gösterdiği için, serbestlik derecesi bulunur: %95 güvenlik aralığına göre iki taraflı güvenlik aralığı için t değeri tablodan bulunur: Varyansı bilinmeyen ortalamanın güvenlik aralığı t dağılımına göre formülde yerine konularak bulunur: Yrd.Doç.Dr. Emre YALAMAÇ Bir Normal Dağılımın Varyans ve Standart Sapma Güvenlik Aralığı Bazen kitlenin varyansının ve standart sapmasının güvenlik aralığı gerekebilir. Ortalama ve varyansı 2 olan bir normal dağılımdan X1,X2,...Xn bir rasgele örnekleme olsun ve s2 örneklemenin varyansı olduğunda, rasgele değişken: n-1 serbestlik derecesiyle bir ki-kare (2) dağılımına sahiptir. Bazı 2 dağılımlarının olasılık yoğunluk fonksiyonu grafikleri Bir 2 rasgele değişkenin olasılık yoğunluk fonksiyonu k serbestlik derecesi Yrd.Doç.Dr. Emre YALAMAÇ Bir Normal Dağılımın Varyans ve Standart Sapma Güvenlik Aralığı Üst ve alt %5 ki-kare noktaları (10 serbestlik değeri için) Üst %5 ki-kare noktası: Varyans için %100(1-) güvenlik aralığı Yrd.Doç.Dr. Emre YALAMAÇ Bir Normal Dağılımın Varyans ve Standart Sapma Güvenlik Aralığı Tek taraflı (alt ve üst) güvenlik sınırlarında : Yrd.Doç.Dr. Emre YALAMAÇ Bir Normal Dağılımın Varyans ve Standart Sapma Güvenlik Aralığı ÖRNEK: Şişeleri sıvı deterjan ile dolduran bir makina için rasgele seçilen 20 şişe örneklemesine göre örnek varyansı s2=0,0153 oz2 çıkmıştır. Şayet varyans çok yüksek olursa, kabul edilemez miktar şişe az ya da çok dolu olarak doldurulacaktır. Şişe doldurma hacminin normal dağılımlı olduğunu varsayarsak. Bir %95 üst güvenlik aralığında standart sapmanın maksimum değerini bulunuz? CEVAP: Yrd.Doç.Dr. Emre YALAMAÇ Tolerans ve Tahmin Aralık Gelecek Bir Gözlem İçin Tahmin Aralığı Bazı durumlarda bir değişkenin gelecek bir gözleminin aralığını tahmin etmekle ilgilenilir. Bu durum, bu değişkenin ortalamasını tahmin etmekten tamamen farklıdır. Dolayısıyla güvenlik aralığı kullanmak uygun değildir. Bu durumlarda bir normal rasgele değişkenin bir gelecek değerinin %100(1-) tahmin aralığını nasıl elde edilir? Bir normal kitleden bir rasgele X1,X2,...Xn örneklemesi alalım. Amacımız Xn+1 yani tek bir gelecek gözlemi tahmin etmek olsun. Tahmini hata Xn+1-Xb’dır. Tahmini hatanın beklenen değeri E(Xn+1-Xb)=- Tahmini hatanın varyansı V(Xn+1-Xb)=2+(2/n) Yrd.Doç.Dr. Emre YALAMAÇ Tolerans ve Tahmin Aralık Gelecek Bir Gözlem İçin Tahmin Aralığı Gelecek gözlem Xn+1, örneklemenin ortalamasından bağımsız olduğu için, Tahmini hata normal dağılımlıdır. Dolayısıyla standart normal dağılıma sahiptir. Kitle standart sapmasının bilinmediği durumlarda ile s yer değiştirdiğinde: n-1 serbestlik derecesiyle t dağılım Tahmini aralık: Xn+1 için tahmini aralık, için güvenlik aralığından daha büyüktür. Çünkü Xn+1 tahmini hatası ile ’nün tahmini hatasından daha fazla değişken etkileşimdedir. Yrd.Doç.Dr. Emre YALAMAÇ Tolerans ve Tahmin Aralık Gelecek Bir Gözlem İçin Tahmin Aralığı ÖRNEK: Çekme yapışma deneyinde n=22 örnek test edilmiş ve örneklemenin ortalaması ve standart sapması ba=13.71 ve s=3.55 MPa olarak bulunmuştur. Kitle ortalaması() için %95 güvenlik aralığı 12,14<=<=15,28 ise, Yapılacak 23. deneyin sonucunun %95 tahmin aralığı nedir? CEVAP: Yrd.Doç.Dr. Emre YALAMAÇ Tolerans ve Tahmin Aralık Bir Normal Dağılım İçin Tolerans Aralığı Bir yarıiletken işlemci kitlesini düşünelim, işlemci hızının kitle ortalaması =600 MHz ve standart sapması =30 MHz ile normal dağılım gösterdiği bir durumda kitlenin %95’inin hızını kapsayan aralık: 600 - 1,96x30=541,2 MHz 600 + 1,96x30=658,8 MHz – z/2 ‘den + z/2’ye kadar olan aralığa tolerans aralığı denir. Şayet ve bilinmiyor ise; n tane alınan örnekten ba ve s hesaplanıp aralık (ba-1,96s, ba+1,96s) Fakat örneklemenin ba ve s değerleri örneklemeden örneklemeye değişme göstereceğinden bu aralık kitlenin %95’inden daha az bir aralığı ele alır. Dolayısıyla 1,96’dan daha uygun bir değer seçilmesi gerekir. Yrd.Doç.Dr. Emre YALAMAÇ Tolerans ve Tahmin Aralık %100(1-) güvenlik seviyesi ile bir normal dağılım içinde değerlerin en az %’sını yakalayan bir tolerans aralığını Örnekleme Büyüklüğü Bir Normal Dağılım İçin Tolerans Aralığı Şeklinde ifade ederiz ve k değerini Appendikste verilen güvenlik ve değerleri için bulabiliriz. Yrd.Doç.Dr. Emre YALAMAÇ Tolerans ve Tahmin Aralık Bir Normal Dağılım İçin Tolerans Aralığı ÖRNEK: Çekme yapışma deneyinde n=22 örnek test edilmiş ve örneklemenin ortalaması ve standart sapması ba=13.71 ve s=3.55 MPa olarak bulunmuştur. %95 güvenlikte kitledeki değerlerin %90’nını içine alan işgörmezlik yükü için bir tolerans aralığı bulunması? Güvenlik= Tablodan