tek bir örnekleme için istatistiksel aralıklar

advertisement
Yrd.Doç.Dr. Emre YALAMAÇ
TEK BİR ÖRNEKLEME İÇİN
İSTATİSTİKSEL ARALIKLAR
Yrd.Doç.Dr. Emre YALAMAÇ
o Giriş
İÇERİK
oVaryansı Bilinen Bir Normal Dağılımın Ortalamasının
Güvenlik Aralığı (CI)
o  İçin Büyük Örnekleme Güvenlik Aralığı
oVaryansı Bilinmeyen Bir Normal Dağılımın
Ortalamasının Güvenlik Aralığı (CI)
•
•
t Dağılımı
’nün t Güvenlik Aralığı
oBir Normal Dağılımın Varyans ve Standart Sapma
Güvenlik Aralığı
o Tolerans ve Tahmin Aralık
•
Gelecek Bir Gözlem İçin Tahmin Aralığı
•
Bir Normal Dağılım İçin Tolerans Aralığı
Yrd.Doç.Dr. Emre YALAMAÇ
GİRİŞ
Daha önceki konularda bir parametrenin örnekleme verilerinden nasıl tahmin
edildiğini gördük. Fakat önemli olan tahminin ne kadar iyi edildiğini anlamaktır.
Örneğin bir kimyasal ürünün ortalama viskozitesini tahmin etmek istiyoruz.
örneklemin ortalaması, örnekleme çeşitliliğinden dolayı hiçbir
zaman kitle ortalamasına
eşit olamaz. Tahmin edilen nokta
‘nın ’ya
ne kadar yakın olduğu hakkında hiçbir şey söylemez.
Gerçek üretim ortalaması 900 ile 1000 arasında mı?ya da 990 ile 1010 arasında
mı? Bu soruların cevabı bu üretim için kararımızı etkiler. Sınırlar, bir parametre
için makul bir aralığı gösterir ve bir aralık tahmini örneğidir.
Bir kitle parametresinin bir aralık tahminine güvenlik aralığı denir.
Bilinmeyen kitle parametresini içeren aralık hesabını sadece tüm kitleden alınan
örnekler kullanarak tam olarak yapamayız. Fakat güven aralığı hesaplanarak,
bilinmeyen kitle parametresini içerdiği konusunda yüksek güvenimiz olur.
Yrd.Doç.Dr. Emre YALAMAÇ
GİRİŞ
Bir tolerans aralığı bir başka önemli çeşit aralık tahminidir.
Viskozite örneğinin normal dağılımlı olduğunu varsayarak %95 viskozite
değerini içine alan sınır bir değer hesaplayabiliriz.
Yani dağılımın %95’i bu aralık içindedir.
-1,96, +1,96
 ve  bilinmediğinden dolayı nokta tahminleri
-ks,
ve s kullanılır.
+ks
k uygun bir sabittir ve 1,96’dan büyüktür.
Tahmini aralık kitleden gelecek gözlemleri sınırlamayı sağlar.
Yrd.Doç.Dr. Emre YALAMAÇ
Varyansı Bilinen Bir Normal Dağılımın
Ortalamasının Güvenlik Aralığı (CI)
Gerçekci olmayan yani ortalaması bilinmeyip de varyansı bilinen bir kitlenin,
X1,X2,…Xn varyansı bilinen ve ortalaması bilinmeyen bir normal dağılımdan
alınan bir rasgele örnekleme olsun.
Standardize edilirse;
Standart normal dağılım
Ortalama  için güvenlik aralığı bir aralık tahmin eder bunu da örnek veri
setinden hesaplanan l ve u uç noktalarından yapar. Çünkü farklı örnekleme
farklı uç noktalar üretir dolayısıyla bu uç noktaların değerleri rasgele değişkenler
L ve U’dur. L ve U değerlerini aşağıdaki olasılık durumundan belirleyebiliriz.
Seçilen örneklemin 1- olasılığında güvenlik aralığının gerçek orta  değeri
içermesi mümkündür.
Yrd.Doç.Dr. Emre YALAMAÇ
Varyansı Bilinen Bir Normal Dağılımın
Ortalamasının Güvenlik Aralığı (CI)
Örnekleme seçildikten sonra  için güvenlik aralığı l ve u değerlerinden
hesaplanır.
l ve u’ya alt ve üst güvenlik sınırları denir ve 1-’ya güvenlik sabiti denir.
Standart normal dağılım durumunda
Standart normal dağılım olasılık aralığı değiştirilerek :
Şayet xa varyansı bilinen (2) bir normal kitleden alınan n tane rasgele örneğin
ortalaması ise ,  için bir %100(1-) güvenlik aralığı şöyle ifade edilir:
Yrd.Doç.Dr. Emre YALAMAÇ
Varyansı Bilinen Bir Normal Dağılımın
Ortalamasının Güvenlik Aralığı (CI)
ÖRNEK: A238 çeliğinin charpy darbe enerji değerini bulmak için yapılan 10
deneyin sonuçları aşağıdaki gibidir. Darbe enerjisi =1J’luk standart sapmaya
ile normal dağılım göstermektedir.  ortalama darbe enerjisi için % 95 güvenlik
aralığını bulunuz?
ve
Yrd.Doç.Dr. Emre YALAMAÇ
Varyansı Bilinen Bir Normal Dağılımın
Ortalamasının Güvenlik Aralığı (CI)
ÖRNEK: A238 çeliğinin charpy darbe enerji değerini bulmak için yapılan 10 deneyin sonuçları
aşağıdaki gibidir. Darbe enerjisi =1J’luk standart sapmaya ile normal dağılım göstermektedir.
 ortalama darbe enerjisi için % 95 güvenlik aralığını bulunuz?
ve
CEVAP:
% 100(1-)=% 95 ise =0,05
-
Tablo’dan okunur.
Yrd.Doç.Dr. Emre YALAMAÇ
Varyansı Bilinen Bir Normal Dağılımın Ortalamasının
Güvenlik Aralığı (CI)
Bir Güvenlik Aralığının Yorumlanması:
Çeliğin ortalama darbe enerji () örneğine göre 0,95 olasılıkla ortalama değer
arasındadır denmektedir. Fakat biraz düşünülürse bunun
doğru olmadığı gerçek değeri bilinmeyen bir ortalama ve durumu için ya doğru
yada yanlış bir olasılık vardır. Doğru yorum bir ‘CI’nın rasgele bir aralık olduğunu
anlamakta yatar. Şekilde gösterildiği gibi, Eğer %95 güvenlik aralıklı bir durumsa
sadece bu aralıklardan %5’i  değeri için başarısızdır. Pratikte, sadece bir
örnekleme yapılır ve bunun güvenlik
aralığı hesaplanır bu örneklemenin
aralığı ’yu içerir ya da içermez bunun için
bir olasılık seviyesi atamak mantıklı
değildir. Uygun durum gözlenen aralığın [l, u]
gerçek  değerini 100(1-) güvenle tutmasıdır.
Yrd.Doç.Dr. Emre YALAMAÇ
Varyansı Bilinen Bir Normal Dağılımın
Ortalamasının Güvenlik Aralığı (CI)
Güven Seviyesi ve Tahminin Kesinliği:
Çelik darbe enerji deneyinde seçilen güvenlik seviyesi %95 keyfidir. Daha
yüksek güven seviyesi örneğin %99 seçsek ne olur? Ya da daha yüksek
güven aralığı seçmek mantıksız mıdır?
Güvenlik Aralığı Uzunluğu
%99 CI, %95 CI’dan daha uzundur. Genel olarak belirli sayıda örnek ve s
standart sapma için yüksek güven seviyesi yüksek güven aralığı sonucudur.
Güven aralığı uzunluğu tahminin kesinliğinin bir ölçüsüdür. Kesinlik güven
aralığı ile ters ilişkilidir. Yeterince kısa bir güven aralığı elde etmek karar verme
ve yeterli güvenliğe sahip olmak için istenilendir.
Yrd.Doç.Dr. Emre YALAMAÇ
Varyansı Bilinen Bir Normal Dağılımın Ortalamasının
Güvenlik Aralığı (CI)
Örnekleme Büyüklüğünün Seçilmesi:
Güven aralığının kesinliği denklemde
ba kullanarak hata
‘dir. ’yu tahmin etmek için
,100(1-)güvenliğinde
‘ye eşit
veya küçüktür.
Örnekleme büyüklüğünün kontrol edilebildiği durumlarda, n’yi seçebiliriz böylece
yüzde 100(1-) güvenli yani  tahminindeki hata bir belirlenmiş sınır hatasından
küçük olur. Uygun örnekleme büyüklüğü n’i örneğin
seçerek
bulunur. Bu denklemin çözülmesi bize n değerini verir.
Şayet xb, ’yu tahmin etmek için kullanılıyorsa %100(1-)
güvenli olabiliriz ki hata
bir belirli E miktarını geçmez.
örnek büyüklüğü
Yrd.Doç.Dr. Emre YALAMAÇ
Varyansı Bilinen Bir Normal Dağılımın
Ortalamasının Güvenlik Aralığı (CI)
Örnekleme Büyüklüğünün Seçilmesi:
ÖRNEK: A238 çeliğinin charpy darbe enerji deneylerinde % 95 güvenlik aralığı
hesabı için n sayısı nedir?
CEVAP:
Yrd.Doç.Dr. Emre YALAMAÇ
Varyansı Bilinen Bir Normal Dağılımın
Ortalamasının Güvenlik Aralığı (CI)
Örnekleme Büyüklüğünün Seçilmesi:
Örnek büyüklüğü, istenilen uzunlukta güvenlik aralığı 2E, güvenlik seviyesi
100(1-) ve standart sapma  arasındaki genel ilişki:
• İstenilen uzunluktaki 2E azaldıkça, belirli bir  değeri ve belirlenmiş güvenlik
için gerekli örnek büyüklüğü n artar.
•  standart sapma artarken, istenilen uzunluk 2E ve belirlenmiş güvenlik için
gerekli örnek büyüklüğü n artar.
• Güvenlik seviyesi arterken, sabitlenmiş istenilen uzunluk 2E ve standart
sapma için gerekli örnek büyüklüğü n artar.
Yrd.Doç.Dr. Emre YALAMAÇ
Varyansı Bilinen Bir Normal Dağılımın
Ortalamasının Güvenlik Aralığı (CI)
Tek Taraflı Güvenlik Sınırları:
 için alt ve üst güvenlik sınırları güvenlik aralığını iki taraftan da sınırlar.
Fakat tek taraflı yani bir tarafı l=-∞ ya da u= ∞ olarak z/2’yi z olarak değiştirerek
sınırlayabiliriz.
Bir %100(1-) üst güvenlik sınırı  için:
Bir %100(1-) alt güvenlik sınırı  için:
Aynı örnek %95 güvenlik aralığında sadece alt güvenlik için hesaplandığında
Eşit güvenlikte, iki taraflı aralıkta alt limit 63,84 iken tek taraflı da büyümüştür.
Çünkü:
Yrd.Doç.Dr. Emre YALAMAÇ
Varyansı Bilinen Bir Normal Dağılımın
Ortalamasının Güvenlik Aralığı (CI)
Bir Güvenlik Aralığı Çıkartmak için Genel Metot:
Bir  bilinmeyen parametre için bir güvenlik aralığı bulmak için bir genel metot
vermek kolaydır. X1,X2,…Xn n tane rasgele gözlemdir.
Bir istatistik g(X1,X2,…Xn:) aşağıdaki özellikleri ile bulunabilir:
1. g(X1,X2,…Xn:) örnekleme ve ’ya birden bağlıdır.
2. g(X1,X2,…Xn:) olasılık dağılımı  ya da başka bir bilinmeyen parametreye
bağlı değildir.
Bu kısımda ele alınan durum düşünüldüğünde, parametre =
Rasgele değişken g(X1,X2,…Xn:)=
ve yukarıdaki her iki durumu da sağlar. Yani örnekleme ve ’ya bağlıdır ve bir
bilinen standart sapmadan dolayı standart normal dağılıma sahiptir.
Yrd.Doç.Dr. Emre YALAMAÇ
 İÇİN BÜYÜK ÖRNEKLEME GÜVENLİK ARALIĞI
Biz normal kitle dağılımlı ve ortalaması bilinmeyen ve standart sapması bilinen
kabuller yaptık. Fakat şimdi bir büyük örneklemeli güvenlik aralığı sunarak bu
kabullenmelere gerek kalmaz. Ortalaması ve varyansı bilinmeyen bir kitleden
rasgele örnekleme yapalım. Şayet örnekleme sayısı büyük ise, merkezi limit
teoremi X, ortalması  ve varyansı 2/n ile yaklaşık bir normal dağılımlıdır.
Bir standart normal dağılımlıdır.
 bilinmediği için yerine s konur. Dolayısıyla n büyük olduğunda:
Büyük örneklemeli güvenlik aralığı  için:
Merkezi limit teoremi n=>30 olması durumunda dikkat etmez.
Fakat burda n=>40 istenir çünkü ’da s ile yerdeğiştirmiştir.
Yrd.Doç.Dr. Emre YALAMAÇ
Varyansı Bilinmeyen Bir Normal Dağılımın
Ortalamasının Güvenlik Aralığı (CI)
n yeterince büyük olduğunda kitlenin normal dağılımlı olup olmadığını (Merkez
limit teoreşinden dolayı) bakmaksızın güvenlik aralığını tespit ediyorduk.
İlgilenilen kitlenin ortalama ve varyans değerlerinin bilinmediğini varsayarsak.
Varyansın bilindiği durumda aşağıdaki gibi yazılır:
Varyasnın bilinmemesi durumunda ->s olur ve dolayısıyla Z->T olarak yazılır:
n sayısı yeterince büyük olduğunda ’nın s ile yerdeğiştirmesi sonuç için çok
küçük bir etki yapar.
Peki n yeterince büyük değilse o zaman güvenlik aralığı belirlemek için farklı
dağılımlar kullanmak gerekir. Örneğin mühendislik deneylerinde.
Yrd.Doç.Dr. Emre YALAMAÇ
Varyansı Bilinmeyen Bir Normal Dağılımın
Ortalamasının Güvenlik Aralığı (CI)
t Dağılımı
Varyansı ve ortalaması bilinmeyen bir normal dağılımdan alınan rasgele
örnekleme X1,X2,...Xn olsun
Rasgele değişkeni n-1 serbeslik derecesiyle bir
t dağılımına sahiptir.
olasılık yoğunluk fonksiyonu: k(serbeslik derecesiyle)
t dağılımının genel görünümü standart normal
dağılım gibidir. Her ikiside simetrik, tektepeli
ve tepe noktası =0’da olur.
Yrd.Doç.Dr. Emre YALAMAÇ
Varyansı Bilinmeyen Bir Normal Dağılımın
Ortalamasının Güvenlik Aralığı (CI)
t Dağılımı
Fakat t dağılımı normal dağılımdan daha ağır kuyrukludur yani kuyruklarında
normal dağılıma göre daha fazla olasılık barındırır.Serbestlik derecesi k
sonsuza doğru artarken t dağılımının limiti standart normal dağılım olur.
t dağılımının yüzde noktaları tablosu eklerde verilir.
Yrd.Doç.Dr. Emre YALAMAÇ
Varyansı Bilinmeyen Bir Normal Dağılımın
Ortalamasının Güvenlik Aralığı (CI)
t dağılımının
yüzde noktaları tablosu
IV
Yrd.Doç.Dr. Emre YALAMAÇ
Varyansı Bilinmeyen Bir Normal Dağılımın
Ortalamasının Güvenlik Aralığı (CI)
k serbestlik derecesiyle t dağılımının yukarı(sağa) kuyruğunun
100 yüzde noktasıdır.
10 serbestlik derecesiyle 0,05’lık bir alanın t değeri:
t dağılımının 0 noktasına göre simetriktir.
Yrd.Doç.Dr. Emre YALAMAÇ
Varyansı Bilinmeyen Bir Normal Dağılımın
Ortalamasının Güvenlik Aralığı (CI)
’nun t güvenlik aralığı
Ders başında varyansı bilinmeyen bir normal dağılımın orta değeri üzerine
100(1-) güvenlik aralığı için kolayca bulmayı gördük.
Dağılımı n-1 serbestlik derecesiyle t’dir. n-1 serbestlik dereceli t dağılımının
t/2,n-1 üst 100/2 yüzde noktası şöyle ifade edilir.
Son denklem üzerinde bir ayarlama yapılırsa:
Yrd.Doç.Dr. Emre YALAMAÇ
Varyansı Bilinmeyen Bir Normal Dağılımın
Ortalamasının Güvenlik Aralığı (CI)
’nun t güvenlik aralığı
İki taraflı  güvenlik aralığı için yüzde 100(1-) şöyle tanımlanır :
Tek taraflı güvenlik sınırlarında :
Yrd.Doç.Dr. Emre YALAMAÇ
t Dağılımı : ÖRNEK
X alışım örneklerinin çekme yapışma deneyleri sonucu ayrılma yükleri MPa
olarak aşağıda verilmiştir. ’nun %95 güvenlik aralığını bulunuz?
CEVAP: Deney sonuçlarının dağılımı test edilir->Normal dağılım
Probability Plot of C1
Boxplot of C1
99
20
18
C1
14
12
10
8
6
Percent
16
95
90
80
70
60
50
40
30
20
10
5
1
0
5
10
15
BOZULMA YUKU
20
25
Yrd.Doç.Dr. Emre YALAMAÇ
t Dağılımı : ÖRNEK
Deney sonuçlarının ortlama ve standart sapma değerleri bulunur.
Deney sayısı n 30’dan küçük olduğu ve deney sonuçları normal dağılım
gösterdiği için, serbestlik derecesi bulunur:
%95 güvenlik aralığına göre iki taraflı güvenlik aralığı için t değeri
tablodan bulunur:
Varyansı bilinmeyen ortalamanın güvenlik aralığı t dağılımına göre formülde
yerine konularak bulunur:
Yrd.Doç.Dr. Emre YALAMAÇ
Bir Normal Dağılımın Varyans ve Standart
Sapma Güvenlik Aralığı
Bazen kitlenin varyansının ve standart sapmasının güvenlik aralığı gerekebilir.
Ortalama  ve varyansı 2 olan bir normal dağılımdan X1,X2,...Xn bir rasgele
örnekleme olsun ve s2 örneklemenin varyansı olduğunda,
rasgele değişken:
n-1 serbestlik derecesiyle
bir ki-kare (2) dağılımına sahiptir.
Bazı 2 dağılımlarının
olasılık yoğunluk fonksiyonu
grafikleri
Bir 2 rasgele değişkenin
olasılık yoğunluk fonksiyonu
k serbestlik derecesi
Yrd.Doç.Dr. Emre YALAMAÇ
Bir Normal Dağılımın Varyans ve Standart
Sapma Güvenlik Aralığı
Üst ve alt %5 ki-kare noktaları (10 serbestlik değeri için)
Üst %5 ki-kare noktası:
Varyans için %100(1-) güvenlik aralığı
Yrd.Doç.Dr. Emre YALAMAÇ
Bir Normal Dağılımın
Varyans ve Standart
Sapma Güvenlik
Aralığı
Tek taraflı (alt ve üst)
güvenlik sınırlarında :
Yrd.Doç.Dr. Emre YALAMAÇ
Bir Normal Dağılımın Varyans ve Standart
Sapma Güvenlik Aralığı
ÖRNEK:
Şişeleri sıvı deterjan ile dolduran bir makina için rasgele seçilen 20 şişe
örneklemesine göre örnek varyansı s2=0,0153 oz2 çıkmıştır. Şayet varyans
çok yüksek olursa, kabul edilemez miktar şişe az ya da çok dolu olarak
doldurulacaktır. Şişe doldurma hacminin normal dağılımlı olduğunu
varsayarsak. Bir %95 üst güvenlik aralığında standart sapmanın maksimum
değerini bulunuz?
CEVAP:
Yrd.Doç.Dr. Emre YALAMAÇ
Tolerans ve Tahmin Aralık
Gelecek Bir Gözlem İçin Tahmin Aralığı
Bazı durumlarda bir değişkenin gelecek bir gözleminin aralığını tahmin etmekle
ilgilenilir. Bu durum, bu değişkenin ortalamasını tahmin etmekten tamamen
farklıdır. Dolayısıyla güvenlik aralığı kullanmak uygun değildir. Bu durumlarda
bir normal rasgele değişkenin bir gelecek değerinin %100(1-) tahmin aralığını
nasıl elde edilir?
Bir normal kitleden bir rasgele X1,X2,...Xn örneklemesi alalım. Amacımız Xn+1
yani tek bir gelecek gözlemi tahmin etmek olsun.
Tahmini hata
Xn+1-Xb’dır.
Tahmini hatanın beklenen değeri
E(Xn+1-Xb)=-
Tahmini hatanın varyansı
V(Xn+1-Xb)=2+(2/n)
Yrd.Doç.Dr. Emre YALAMAÇ
Tolerans ve Tahmin Aralık
Gelecek Bir Gözlem İçin Tahmin Aralığı
Gelecek gözlem Xn+1, örneklemenin ortalamasından bağımsız olduğu için,
Tahmini hata normal dağılımlıdır. Dolayısıyla standart normal dağılıma sahiptir.
Kitle standart sapmasının bilinmediği durumlarda  ile s yer değiştirdiğinde:
n-1 serbestlik derecesiyle
t dağılım
Tahmini aralık:
Xn+1 için tahmini aralık,  için güvenlik aralığından daha büyüktür. Çünkü Xn+1
tahmini hatası ile ’nün tahmini hatasından daha fazla değişken etkileşimdedir.
Yrd.Doç.Dr. Emre YALAMAÇ
Tolerans ve Tahmin Aralık
Gelecek Bir Gözlem İçin Tahmin Aralığı
ÖRNEK:
Çekme yapışma deneyinde n=22 örnek test edilmiş ve örneklemenin ortalaması
ve standart sapması ba=13.71 ve s=3.55 MPa olarak bulunmuştur.
Kitle ortalaması() için %95 güvenlik aralığı 12,14<=<=15,28 ise,
Yapılacak 23. deneyin sonucunun %95 tahmin aralığı nedir?
CEVAP:
Yrd.Doç.Dr. Emre YALAMAÇ
Tolerans ve Tahmin Aralık
Bir Normal Dağılım İçin Tolerans Aralığı
Bir yarıiletken işlemci kitlesini düşünelim, işlemci hızının kitle ortalaması =600
MHz ve standart sapması =30 MHz ile normal dağılım gösterdiği bir durumda
kitlenin %95’inin hızını kapsayan aralık:
600 - 1,96x30=541,2 MHz
600 + 1,96x30=658,8 MHz
 – z/2 ‘den  + z/2’ye kadar olan aralığa tolerans aralığı denir.
Şayet  ve  bilinmiyor ise; n tane alınan örnekten ba ve s hesaplanıp aralık
(ba-1,96s, ba+1,96s)
Fakat örneklemenin ba ve s değerleri örneklemeden örneklemeye değişme
göstereceğinden bu aralık kitlenin %95’inden daha az bir aralığı ele alır.
Dolayısıyla 1,96’dan daha uygun bir değer seçilmesi gerekir.
Yrd.Doç.Dr. Emre YALAMAÇ
Tolerans ve Tahmin Aralık
%100(1-) güvenlik seviyesi
ile bir normal dağılım içinde
değerlerin en az %’sını
yakalayan bir tolerans
aralığını
Örnekleme Büyüklüğü
Bir Normal Dağılım İçin Tolerans Aralığı
Şeklinde ifade ederiz ve k
değerini Appendikste
verilen güvenlik ve  değerleri
için bulabiliriz.
Yrd.Doç.Dr. Emre YALAMAÇ
Tolerans ve Tahmin Aralık
Bir Normal Dağılım İçin Tolerans Aralığı
ÖRNEK:
Çekme yapışma deneyinde n=22 örnek test edilmiş ve örneklemenin ortalaması
ve standart sapması ba=13.71 ve s=3.55 MPa olarak bulunmuştur.
%95 güvenlikte kitledeki değerlerin %90’nını içine alan işgörmezlik yükü için
bir tolerans aralığı bulunması?
Güvenlik=
Tablodan
Download