BÖLÜM III ÖRNEKLEME DAĞILIMLARI VE TAHMİN ETME 3.1.Giriş em ir Daha önce bahsettiğimiz gibi, istatistiğin en önemli problemlerinden biri örneklemlerden bulunan sonuçları kitleye genelleştirmektir. Bu bölümde bu genelleştirmenin nasıl yapıldığını göreceğiz, şöyle ki örneklem istatistiği kullanarak bilinmeyen kitle parametrelerinin nasıl tahmin edileceği hesaplanacaktır. er isteyebiliriz. gü l zd Örnek: Bir X rastgele değişkeni, μ ortalaması ve 2 varyansı ile bir normal yoğunlukla tanımlanırsa, bir x1 , x2 ,..., xN rastgele örneklemini kullanarak μ ve 2 yi tahmin etmeyi rin im Ö Örnek: Kitle, belli bir üniversitedeki öğrenciler ise ve biz öğrencilerin ortalama boy uzunluğu µ’yü öğrenmek istediğimizde bir örnekleme dayanarak karar vereceğiz. Bu nedenle µ’yü tam olarak bilemeyiz. Yapabileceğimiz en iyi yol hacmi N olan bir örneklemden µ’yü tahmin etmektir. es al Tanım 1. Bir istatistiğin olasılık dağılımına örnekleme dağılımı denir. N H Örneklem ortalaması X , kitle ortalaması µ’yü tahmin ederse, biliyoruz ki N artarken µ ile ilgili kesin olmama yargımız kesinliğe yaklaşacaktır. Örneklem kitlenin tümünü kapsadığında X olacaktır. Ayrıca bir istatistiğin beklenen değeri kitle parametresine eşit olabilir. .D r. .D r. Örneğin, ( X ) ' dür. Daha sonra göreceğimiz gibi her tahmin edicinin beklenen değeri tahmin edilen parametreye eşit olmayabilir. oç D Pr of Tanım 2. Bir kitle parametresini tahmin etmek için kitle yerine, örneklemin kullanılmasından oluşan hataya örnekleme hatası denir. 3.2 Örneklem Ortalaması ve Varyansın Bazı Özellikleri d. Örneklem ortalaması ve örneklem varyansı istatistikleri, matematiksel özelliklerinden dolayı başka çalışmalar için özellikle önem taşır. X1 , X 2 , , X N rastgele değişkenler ise, örneklem Yr ortalaması ve varyansı da rastgele değişkendir. Teorem 3.2.1. X1 , X 2 , , X N ‘lerin her birinin beklenen değeri ise X dür. 1 İspat: X X 1 + X 2 X N , beklenen değerin özelliklerinden, N 1 1 1 ( X i ) ( X i ) , a , b 0 ) olduğundan, N N N 1 X1 X 2 N olur. Fakat X i , i 1, 2, XN 1 X1 X 2 N , N , olduğundan X 1 N N N er em olur. X N ir X gü l 7 dir. 2 Ö gösteriniz ki X zd Örnek: İki zar atıldığında üste gelen yüzlerdeki noktaların sayısı sırasıyla X1 , X 2 ise al rin edilir. Buradan 2 3 4 5 6 f x X x 1 6 1 6 1 6 1 6 1 6 1 6 .D r. r. N 1 H X x j j xi f xi 1 2 3 4 5 6 .D 6 i 1 1 6 1 6 1 olasılığı ile elde 6 es im Çözüm: X 1 (ve X 2 ‘nin) mümkün değerleri; 1, 2,3, 4,5,6 nın her biri 1 6 1 6 1 6 1 6 7 ; j 1, 2 2 oç d. olduğu görürlür. D Pr of 1 1 7 7 1 14 7 2 X 1 1 2 2 2 2 2 2 2 2 2 Örnek: Kitle 2, 4,6,8,10 olarak verilsin. Yerine koymaksızın bu kitleden 2 birimlik Yr örneklemler seçelim. Örneklem ortalamasının ( X ‘nin) beklenen değerini bulunuz. 5 Çözüm: 10 farklı örneklem vardır. 2 Örneklem Örn.Ort X 2, 4 2, 6 2,8 2,10 3 4 5 4, 6 4,8 5 6 4,10 6,8 6,10 7 7 8 6 8,10 9 1 olasılık ile elde edileceğinden rastgele örneklem seçmiş oluyoruz. Örneğin, 10 2 X 5 olabilmesi için örneklem 2,8 ya da 4, 6 olmalıdır. Bu nedenle X 5 10 dur. X ’nin örnekleme dağılımı 3 X x 5 4 6 7 8 9 er X x em ir Her bir sonuç Ö olur. Beklenen değerin tanımı kullanılırsa; gü l zd 0.1 0.1 0.2 0.2 0.2 0.1 0.1 al es olur. Öte yandan kitle ortalaması H N 1 2 4 6 8 10 6 5 , X N rastgele bağımsız değişkenleri için X i , V ar X i X2 X2 oç of , olmak üzere Var X Pr , i 1, 2, .D r. .D r. ve böylece X olduğu görülür. Teorem 3.2.2. X1 , X 2 , rin im X 3 0.1 4 0.1 5 0.2 6 0.2 7 0.2 8 0.1 9 0.1 6 N dir. d. D İspat: Tanımdan Var X X dir. O halde Yr X X2 Var X 1 N XN 2 2 1 2 X 1 X 2 N 1 2 2 X1 X 2 2 N X N 2 X N ikili karşılıklı çarpımlar 2 yazılır. Burada her ( X i )( X j ) ikili çarpımının beklenen değeri i j için, X i ve X j bağımsız olduğundan sıfır olacaktır. Yani X i X j X i X j 0 dır. Böylece i X2 , i 1, 2,..., N olduğundan 2 1 2 2 X1 X 2 2 N X2 N XN 2 N1 2 X2 2 X X2 X2 ir Var X er em elde edilir. gü l zd Örnek: Sonuçların X 1 ve X 2 olduğu düzgün iki zarın atılması deneyi için Var X yi Çözüm : 1 6 1 6 1 6 1 6 1 6 1 6 1 6 2 6 3 6 4 6 5 6 6 6 al 4 N oç D 6 + Yr 1 1 12 6 6 1 4 22 6 6 1 9 32 6 6 1 16 42 6 6 1 25 52 6 6 1 36 62 6 6 + X d. Pr of 5 .D r. .D r. 3 x2 f x es xf x H 1 2 f x X x im X x rin Ö bulunuz. ( X 1 üst yüzde görünecek noktaların sayısını göstersin.) X 2 21 7 6 2 X1 X 2 91 6 7 2 ve V 1 V 2 2 X1 2 X2 2 1 1 2 2 91 7 35 6 2 12 ve Teorem 3.2.2’ den 35 35 Var X 12 N 2 4 X2 bulunur. 3 olduğunu gösteriniz. 8 3 ve 2 er Var X em ir Örnek: Düzgün iki para üç kez atılsın. Turaların ortalaması X ise X gü l zd Çözüm: Paraların her birinin ayrı ayrı üç kez atılmasındaki turaların sayısı sırasıyla X 1 , X 2 Olasılık TTT 3 TTY 2 TYT 1 8 1 8 1 8 1 8 1 8 1 8 1 8 1 8 0 Yr d. YYY 1 D Pr YYT 1 es .D r. of YTY 1 oç .D TYY 2 r. YTT N H 2 rin Turaların Sayısı im Örnek Nokta al Ö olsun. O halde paraların birisi için düşünüldüğünde; X1 x f x X1 x 0 1 2 3 1 8 3 8 3 8 1 8 3 3 1 3 3 1 12 3 X1 xi f xi 0 1 2 3 1 2 2 8 8 8 8 8 2 i 1 ve benzer şekilde V 1 V 2 3 olur. Buradan, Teorem 3.2.1 ve Teorem 3.2.2’ den 4 sırasıyla 3 1 1 1 3 3 ve Var X X2 Var X1 2 2 2 2 4 8 em olarak bulunur. er ir X X1 X 2 , XN , N ); aynı kitleden bağımsız şekilde seçilen N hacimli örneklem; im Var i X2 ( i 1, 2, formülü N bağımsız r. değişkenleri için i ve Ö ile verilmiştir. (Teorem 3.2.2; X1 , X 2 , 2 gü l , X N ‘ler bağımsız iseler örneklem ortalamasının varyansı Var X rin X1 , X 2 , zd NOT: Kitle sonsuz elemanlı olduğunda, bu kitleden seçilen rastgele örneklemdeki yani her biri bir r. değişkeni temsil ediyor.) Kitle sonlu ise N p kitle hacmi olmak üzere es N H al X X ve Var X ile ilgili aşağıdaki teoremleri ispatsız olarak vereceğiz. Teorem 3.2.3 N p h.h. sonlu bir kitlenin büyüklüğünü, N bu kitleden yerine koymaksızın .D r. Var X 2 Np N N N p 1 D dir. Pr X X ve oç of .D r. seçilen bir örneklemin büyüklüğünü gösterirse, N elemanlı tüm olanaklı örneklemler için ortalamaların ortalaması X ve varyansı X2 , sırasıyla d. Not: “ N 1 olduğunda X2 2 dir. N p , N ’ye göre oldukça büyük ise, Np N N p 1 değeri 1 ’e Yr 2 yakın, fakat daima 1 ’ den küçük ve dolayısıyla yaklaşık olarak, olur. N Teorem 3.2.4. N p herhangi sonlu bir kitlenin büyüklüğünü ve N bu kitleden tekrar yerine koyma yoluyla seçilen bir örneğin büyüklüğünü gösterirse, N büyüklüğünde tüm olanaklı örnekler için ortalamaların ortalaması (beklenen değeri) X ve varyansı X2 sırasıyla X ve X2 1 2 dir. N Örnek: N p 7 olan 7,10,9,11,13,12,15 kitlesinden N 2 büyüklüklü rastgele örneklemleri 2 Np N yerine koymaksızın seçtiğimizde X ve X2 N p 1 olduğunu gösteriniz. ir N er gü l rin es N oç D d. 8 8.5 1 21 1 1 2 21 21 21 Yr P X x .D r. r. .D of Pr X x 2 Ö al im 8.5 8.00 9.00 10.00 9.5 11.0 9.5 10.5 11.5 11.0 12.5 10.0 11.0 10.5 12.0 12.0 11.5 .13.0 12.5 14.0 13.5 X i X 6.25 9.00 4.00 1.00 2.25 0.00 2.25 0.25 0.25 0.00 2.25 1.00 0.00 0.25 1.00 1.00 0.25 4.00 2.25 9.00 6.25 zd Xi H Olanaklı örneklemler 7,10 7,9 7,11 7,13 7,12 7,15 10,9 10,11 10,13 10,12 10,15 9,11 9,13 9,12 9,15 11,13 11,12 11,15 13,12 13,15 12,15 em 7 Çözüm Örneklem sayısı 21 ‘dir. Kitle: 7,10,9,11,13,12,15 ; 2 9 9.5 10 10.5 11 11.5 12 12.5 13 13.5 X 8 2 21 2 21 3 21 1 1 8.5 21 21 2 21 2 21 2 1 21 21 14 1 231 11 21 21 1 21 14 1 21 bulunur. Tablodan X2 1 21 Xi X 21 i 1 bulunur. Öte yandan, kitleden 52.50 2.5 21 77 42 11 ve 2 6 elde edilir. Böylece 7 7 6 7 2 6 5 2.5 ve X 11 N p 1 2 7 1 2 6 2 Np N zd elde edilir. er em N ir 2.5 2 X 2 , X N rastgele değişkenlerinin ortalaması ve varyansı 2 ise Teorem 3.2.1 ve Ö X1 , X 2 , gü l NOT: Örneklem ortalamalarının standart sapması X ye ortalamanın standart hatası denir. rin es , X N normal dağılıma sahip bir kitleden alınmışsa, X ile ilgili son derece önemli N H X1 , X 2 , al im 2 3.2.2 gereğince X ‘nin ortalaması ve varyansı ‘dir. Çünkü rasgele değişkenler sonsuz N bir kitleden alınan sonlu bir örneklem olarak düşünülebilir. Teorem 3.2.5 X1 , X 2 , .D r. .D r. sonuç elde edilir. İspat dersin amacını aşar diye düşünüyorum. , X N bağımsız rastgele değişkenleri, ortalaması ve varyansı 2 oç D d. Pr of 2 olan bir normal dağılıma sahipse, X de ortalamalı ve varyanslı, normal dağılıma N sahiptir. Ayrıca olasılıktan biliyoruz ki X değişkeni bir standart normal dağılıma sahiptir. Yr N Örneklem varyansını incelemeye geçmeden önce ispat etmeksizin son derece önemli olan ve Merkezi Limit Teoremi olarak bilinen bir teoremi yine ispat etmeksızın vereceğiz. Teorem 3.2.6 (Merkezi Limit Teoremi): X1 , X 2 , , X N değişkenleri ortalamalı ve 2 varyanslı aynı olasılık dağılımına sahip bağımsız rastgele değişkenler olsun. X rastgele , X N değişkenlerinin aritmetik ortalaması olmak üzere, Z değişkeni X1 , X 2 , X ile N tanımlanan Z rastgele değişkeni N ’nin büyük değerleri için yaklaşık olarak standart normal ir dağılıma sahiptir. er em Örnek: Belli bir grup tarafından bir radyo istasyonunun müzik programlarının her hafta dinlenilme süresi yaklaşık olarak normal dağılıma sahiptir. 4 ve 1 dir. Bu gruptan al N 1 1 P Z P Z 2 0.0456 P Z 2 1 2 4 16 .D d. D oç of 1 P Z 2 N .D r. r. H X 1 1 P X P X 2 2 X Pr gü l rin Çözüm: es im Ö zd seçilen 16 kişilik bir örneklem için ortalama dinleme zamanı X dir. X ’nin grup 1 ortalamasından (yani kitle ortalamasından) saatten daha çok farklı olmasının olasılığı 2 1 nedir? Yani, P( X ) ? 2 0 2 Yr -2 Z Örnek: Bir sanayi kuruluşunda çalışanların ücretleri 800 TL ortalama ve 90 TL standart sapmalıdır. Rastgele seçilen 81 işçinin saat ücretlerinin ortalamasının 810 TL ve 825 TL arasında bulunma olasılığı nedir? Çözüm 800 ve 90 , X ’nin örnekleme dağılımı için X olduğundan X 800 ve ortalamanın standart hatası X N X X 90 değişkeni 10 bulunur. O halde Z X 81 kullanılarak 810 800 X 800 825 800 P 810 X 825 P Z 10 10 10 gü l rin es al im Ö zd bulunur. er em ir P 1 Z 2.5 0.4938 0.3413 0.1525 N H Şimdi iki grup gözlem kullanarak ortalamanın nasıl bulunacağını göreceğiz. .D r. r. Teorem 3.2.7 1 ve 2 ortalamalı 12 ve 22 varyanslı iki ayrı dağılımdan sırasıyla X 1 ve .D X 2 ortalamalı N ve M hacimlik iki örneklem seçilirse aşağıdakiler doğrudur., a. X1 X 2 1 2 12 22 . oç of b. Var X 1 X 2 N M D Pr İspat Olasılıktan biliyoruz ki iki rastgele değişkenin toplamının ortalaması onların ortalamalarının toplamına eşittir. Buradan (a) derhal yazılır; d. X1 X 2 X1 X 2 1 2 Yr (b)’yi göstermek için de olasılıktan bildiğimiz Var X Y Var X Var Y ( X ve Y bağımsız) sonucunu kullanarak, Var X1 X 2 Var X 1 Var X 2 elde edilir. 12 N 22 M Şimdi aşağıdaki gibi tanımlanan örneklem varyansı ile ilgili teorem vereceğiz: S x2 Teorem 3.2.8. X1 , X 2 , 1 N ( X i X )2 N 1 i 1 , X N ‘ler X i ve Var X i 2 , i 1, 2, , N , olan bağımsız rastgele değişkenler iseler S x2 2 ‘dir. ir İspat: Olasılıktan a ve b sabitler ve X rastgele değişken olmak üzere ax b a x b em olduğunun biliyoruz; bulunur. X i ve X N D rin olduğundan, 1 2 2 N 2 N N 1 N oç S X2 d. Yr 2 .D r. .D Pr of bulunur. 2 2 r. 2 es H al 2 1 N 2 X i N X N 1 i 1 N im 2 1 N 2 X i N X 2 N X N 1 i 1 gü l zd Ö 2 1 N 2 X i 2 X i X X N 1 i 1 er 2 1 1 1 N N 2 S (Xi X ) ( X i X ) 2 X i X N 1 i 1 N 1 i 1 N 1 2 x