Yrd.Doç.Dr. Emre YALAMAÇ ÖRNEKLEME DAĞILIMLARI VE PARAMETRELERİN NOKTA TAHMİNİ Yrd.Doç.Dr. Emre YALAMAÇ İÇİNDEKİLER Giriş - parametre tahmini ve hipotez test etme Örnekleme Dağılımları Nokta Tahmininde Genel Kavramlar • Bir Nokta Tahmincisinin Varyansı • Standart Hata • Bir Tahmincinin Ortalama Karesel Hatası(Mean Squared Error) • Nokta Tahmincisi Metotları Yrd.Doç.Dr. Emre YALAMAÇ GİRİŞ - Parametre Tahmini ve Hipotez Test Etme Bir kitle hakkında sonuçlara varma ve kararlar almak için kitle hakkında bilgiler içeren bir örneklem kullanılır. İstatistiksel sonuç çıkarma iki önemli alana bölünebilinir: • Parametre tahmini • Hipotez test etme İmalat mühendisi otomobil şasesinde kullanılan bir parçanın akma dayanımını analiz edip ortalama akma dayanımını tahmin ederken akma dayanımı (üretilen hammaddenin havuz grubuna, üretim süreçleri ve ölçüm prosedürü) birçok faktöre baglı oldugundan mühendis burda örnek verileri değerlendirerek mantıklı bir genel akma dayınımı tahmin eder. Bu tahmini değere bir tahmin noktası denir. Bir kimyasal reaksiyonda iki farklı sıcaklık(T1 ve T2) kullanılabiliniyor. Fakat mühendis bir tanesinin(T1) diğerine(T2) göre daha fazla verim verdiği sanınısda olabilir. İstatistiksel hipotez testi bu çeşit problemlerin çözümü için bir çerçevedir. Yrd.Doç.Dr. Emre YALAMAÇ GİRİŞ - Parametre Tahmini ve Hipotez Test Etme Bir kitle parametresinin bir tahmin noktasını elde etmek istiyoruz Örneğin: Türkiye 40-50 yaş arası nüfusun ağırlık ortalaması. Sonuç çıkarma problemlerinde ilgilenilen parametre olsun. Nokta tahminin amacı örnek verilerine göre tek bir değer seçmek ve bu değerine en yakın olanı olmasıdır. Genel olarak, Eğer X, bilinmeyen tarafından karakterize edilen f(x) olasılık dağılımlı bir rasgele değişken ve Eğer X1,X2,…Xn bir n sayıda rasgele örnekleme ise, istatistik =h(X1,X2,...Xn) ya ’nın bir nokta tahmincisi denir. rasgele değişkendir çünkü rasgele değişkenlerin bir fonksiyonudur. Örnekleme seçildikten sonra belirli bir sayısal değer alır (T ) buna da ’nın nokta tahmini denir. Yrd.Doç.Dr. Emre YALAMAÇ ÖRNEKLEME DAĞILIMLARI Örnek: Bir konserve kutusuna ortalama kitle hacmi 300ml olması istenir. Mühendis 25 kutuda yaptığı ölçümler sonucu =298 ml’dir ve mühendis bu sonuçlardan kitlenin ortalamasının 300 ml olduğuna karar verir. Her 5 dk bir 25 kutunun test sonuçları 300 ml değeri çevresinde değişecektir. Örnek ortalaması bir istatistiktir ve seçilen örnek grubuna bağlı olarak değişen bir rasgele değişkendir. Örneğin; Türkiyede yaşayan insanların özel bir marka asitli içecek tercih oranı p olsun. Fakat bunu tespit etmek pek mümkün değildir. Dolayısıyla uygun sayıda bir rasgele örnek seçilir bu örnek grupta oran ṗ olarak tanımlanır. ṗ değeri seçilen denek grubuna göre değişim gösterir dolayısıyla ṗ bir rasgele değişkendir. Bu rasgele değişkene bir istatistik denir. İstatistiğin olasılık dağılımına örnekleme dağılımı denir. Yrd.Doç.Dr. Emre YALAMAÇ ÖRNEKLEME DAĞILIMLARI Eğer olasılık dağılımı bilinmeyen bir kitleden örnekleme yapılıyorsa, Örnekleme dağılımının ortalaması yaklaşık olarak normal ve ortalama ve varyans 2/n’dir vede tabiki n büyük bir sayıdır. Bu en çok kullanılan istatistiksel teoremlerden biridir ve merkezi limit teoremi denir. Şayet örnekleme ortalaması ise, Z dağılımı limit hali standart normal dağılımdır. Yrd.Doç.Dr. Emre YALAMAÇ ÖRNEKLEME DAĞILIMLARI Şekil (a) da bir zar bir kere atıldığında her sayının bir kere gelme olasılığı gösterilmiştir. İki zar atıldığında ortalama değerin gelme olasılığı şekil b’deki gibi olur. Her ne kadar kesikli rasgele örnek uygulaması olsada, Zar atış sayısı 5 ve sonrasında ortalama sayı değeri normal olasılık dağılımı göstermektedir. değişkenlerde, seçilen Sürekli örneklemede rasgele örnek sayısı n=>30 durumlarda normal dağılımı kitle dağılımının şeklinden(çarpıklık) bağımsız olarak olumlu sonuç verir. Yrd.Doç.Dr. Emre YALAMAÇ ÖRNEKLEME DAĞILIMLARI Örnek : Bir elektronik firması elektronik devreler için 100 ohms ortalama ve 10 ohms standart sapmayla direnç üretmektedir. Test ölçümü yapılan 25 direnç parçasının ortalama direncinin 95 ohms altında olma olasılığını bulunuz? CEVAP: =? Tablo’dan okunur. Yrd.Doç.Dr. Emre YALAMAÇ Yrd.Doç.Dr. Emre YALAMAÇ ÖRNEKLEME DAĞILIMLARI Örnek : Uçak jet motorunda kullanılan bir parçanın ortalama ömrü 5000 saat ve standart sapması 40 saattir ve kullanım ömrü normal dağılıma yakındır. Yeni geliştirilen teknolojiyle parçanın ortalama ömrü 5050 saate ve standart sapması 30 saate düşürülmüştür. Eski üretimden 16 parçanın ve yeni üretimden 25 parçanın testleri sonucu örneklemlerin ortalama değerleri arasında 25 saatten fazla fark olma olasılığı nedir? Yrd.Doç.Dr. Emre YALAMAÇ ÖRNEKLEME DAĞILIMLARI Örnek : Uçak jet motorunda kullanılan bir parçanın ortalama ömrü 5000 saat ve standart sapması 40 saattir ve kullanım ömrü normal dağılıma yakındır. Yeni geliştirilen teknolojiyle parçanın ortalama ömrü 5050 saate ve standart sapması 30 saate düşürülmüştür. Eski üretimden 16 parçanın ve yeni üretimden 25 parçanın testleri sonucu örneklemlerin ortalama değerleri arasında 25 saatten fazla fark olma olasılığı nedir? CEVAP: Tablo’dan okunur. Yrd.Doç.Dr. Emre YALAMAÇ NOKTA TAHMİNİNDE GENEL KAVRAMLAR Yansız, sapmasız(Unbias) Tahminciler : Bir tahmincinin bilinmeyen parametrenin gercek değerine yakın olmalıdır. Şayet beklenen değeri ’ya eşit ise ’ya ’nun sapmasız tahmincisi denir. Eğer tahminci sapmasız değil ise o zaman fark olur ve tahminci ’nın sapması denir Yrd.Doç.Dr. Emre YALAMAÇ NOKTA TAHMİNİNDE GENEL KAVRAMLAR Bazen örnek kitle parametresi için birden çok yansız tahmin edici olabilir Örneğin: Ortalama Değer: Medyan : En küçük ve en büyük değer kırpılmış ortalama: Bunların hepsi ’nun yansız tahmincileri olabilirler. Tahmincimizi seçmek için sadece yansızlığın özellikleri ile ilgilenemeyiz çünkü yansız tahminci tek değildir. Dolayısıyla bir metod önermemiz gerekir. Yrd.Doç.Dr. Emre YALAMAÇ NOKTA TAHMİNİNDE GENEL KAVRAMLAR Bir Nokta Tahmincisinin Varyansı Örneğin A1 ve a2 ’nın yansız tahmincileri olsun. Bu demektir her tahmincinin dağılımının merkezi gerçek değerindendir. Fakat bu dağılımların varyansı farklı olabilir. Şekilde A1 , A2’den küçük varyanslıdır. Dolayısıyla A1 tahmincisi gerçek değerine daha yakın bir tahmin üretir. Bir çok tahminci arasından seçim yapılırken en küçük varyansa sahip olan seçilir. Ortalaması ve varyansı 2 olan bir normal dağılımında, eğer X1,X2,...Xn olarak n tane rasgele örnek ise, Örnek ortalaması Ẋ , için en küçük varyanslı yansız tahmincidir. İki yansız tahmincinin örnekleme dağılımı Yrd.Doç.Dr. Emre YALAMAÇ NOKTA TAHMİNİNDE GENEL KAVRAMLAR Standart Hata Bir parametrenin sayısal değeri ya da bir nokta tahmin belirtildiyse, genelde tahminin kesinliği konusunda bazı fikirler vermesi istenir. Ölçümün kesinliği genelde uygulanır kullanılan tahmincinin standart hatasıdır. Bir tahmincinin standart hatası onun standart sapmasıdır. Eğer, standart hata tahmin edilebilecek bilinmeyen parametreler ile ilgileniyorsa bu değerlerin ! standart sapma yerine konması bir tahmini standart hata !! üretir. Şayet örnekleme ortalaması, ve varyansı 2 olan normal dağılımdan alınmış ise; Xb dağılımı ortalama ve varyans 2/n ile normaldir, dolayısıyla standart hata: Şayet kitle standart sapması bilinmiyorsa, standart hata tahmininda, örneklemin standart sapması kullanılır: Yrd.Doç.Dr. Emre YALAMAÇ NOKTA TAHMİNİNDE GENEL KAVRAMLAR Standart Hata Örnek: Çeliğin Isıl iletim katsayısını(HTC) ölçmede kullanılan yeni bir metotla 100oF sıcaklıkta 550 watt güç altında yapılan 10 deney sonucu aşağıdaki gibidir. Isı iletim katsayısı: Örnekleme ortalaması: Örnek ortalamasının standart hatası: Kitle standart sapması bilinmiyor dolayısıyla örneğinki alınır : Standart hata örnek ortalamasının yüzde 0,2’si bu demektirki göreceli olarak kesin bir nokta tahmini elde edilmiştir. Eğer HTC normal dağıldığı kabul edilirse, standart hatanın iki katı: veya Yrd.Doç.Dr. Emre YALAMAÇ NOKTA TAHMİNİNDE GENEL KAVRAMLAR Bir Tahmincinin Ortalama Karesel Hatası(Mean Squared Error) Bazen bir yanlı tahminci kullanmak gerekir. Böyle durumlarda, tahmincinin ortalama karesel hatası önemli olabilir. Bir tahmincinin Q ortalama karesel hatası Q ile arasındaki farkın karesinin beklenen değeridir. İki tahminciyi karşılaştırırken ortalama karesinin hatası bir önemli kriterdir. Q2 ‘in Q1 ’e göreceli verimliliği : Şayet göreceli verimlilik 1’den küçük ise; Q1 verimliliği Q2 ’den daha büyüktür. Yani daha küçük bir ortalama kare Yanlı tahmincinin Q1 varyansı Yansız hatasına sahiptir. Tahminciye Q2 göre daha küçüktür. Yrd.Doç.Dr. Emre YALAMAÇ NOKTA TAHMİNİNDE GENEL KAVRAMLAR Nokta Tahmincisi Metotları: Yansızlığın tanımlarında ve tahmincilerin diğer özelliklerinde iyi tahmincilerin nasıl elde edileceği hakkında hiçbir rehber sağlanmamıştır. Bu kısımda nokta tahmincilerin elde edilmesi için metotlardan bahsedilecektir. Bunlar momentler metodu ve maksimum likelihood metotlarıdır. Maksimum likelihood metodu tahminde moment tahmincilerine göre genelde tahmin edilir çünkü daha iyi verim özellikleri vardır. Fakat moment tahminciler bazen kolay hesaplanır. Her iki metot da yansız nokta tahmincileri üretir.