SAÜ 6. BÖLÜM DEĞİŞKENLİK (YAYIKLIK) ÖLÇÜLERİ PROF. DR. MUSTAFA AKAL İÇİNDEKİLER 1. DEĞİŞKENLİĞİN TANIMI VE ÇEŞİTLERİ 2. ANALATİK OLMAYAN DEĞİŞKENLİK ÖLÇÜLERİ 3. ORTALAMA MUTLAK SAPMA 4. 5. 6. 7. 3.1. Basit Seride Ortalama Mutlak Sapma 3.2. Tasnif Edilmiş Seride Ortalama Mutlak Sapma 3.3. Gruplanmış Seride Ortalama Mutlak Sapma STANDART SAPMA VE VARYANS 4.1. Basit Seride Standart Sapma ve Varyans 4.2. Tasnif Edilmiş Seride Standart Sapma ve Varyans 4.3. Gruplanmış Seride Standart Sapma ve Varyans DEĞİŞİM KATSAYISI ÖRNEKLEMİN VARYANS VE STANDART HESAPLANMASI STANDART SAPMANIN ÖZELLİKLERİ VE FAYDALARI SAPMASININ 8. TOPLANMA ORANI HEDEFLER Değişkenliğin ve çeşitlerinin tanıtılması, değişim aralığı, OMS, standart sapma, varyans, değişim katsayısı ve toplanma oranı kavramlarının tanıtılması ve yorumu. 1. DEĞİŞKENLİĞİN TANIMI VE ÇEŞİTLERİ Seriler için hesaplanan ve tek bir rakamla gösterilen merkezi eğilim ölçüleri, o serinin merkezi hakkında bazı faydalı bilgiler verse de tek başına o serinin dağılımı ve diğer serilerle karşılaştırılması için ayrıntılı bilgi vermez. Bundan dolayı serinin değişkenliğini belirlemek ve diğer serilerle karşılaştırmak için ilave bilgilere ihtiyaç vardır. Araştırmacı serinin dağılımı (yayıklığı) yani serideki değerlerin ortalamadan ne ölçüde uzak ya da yakın olduğunu ölçmeye ve serileri karşılaştırmaya da ihtiyaç duyar. Bunun için de serilerin merkezi eğilim ölçülerine ilave olarak “DEĞİŞİM” ölçülerinin de hesaplanması gerekir. Değişim ölçülerinin önemini bir örnekle açıklayabiliriz. ÖRNEK: Aşağıdaki seriler İktisat ve Kamu Yönetimi bölümündeki öğrencilerin istatistik final notlarını vermektedir. İktisat Bölümü (Xi) Kamu Yönetimi Bölümü (Yi) 30 5 35 10 40 20 45 25 50 50 55 75 60 80 65 90 70 95 İki sınıfında aritmetik ortalaması ve medyanı hesaplandığında, sınıfların aynı aritmetik ortalamaya ve medyana sahip olduğu görülmektedir. ve Medyan = 50 Merkezi eğilim ölçülerine baktığımızda iki sınıf arasında bir fark gözükmüyor olsa da verilerin yayılımında farklılık olduğu dikkatlerden kaçmamaktadır. İktisat bölümündeki öğrencilerin notları göreceli olarak Kamu Yönetimi bölümündeki öğrencilerin notlarından birbirine daha yakındır. Diğer bir ifadeyle, İktisat bölümündeki öğrencilerin notları Kamu Yönetimi bölümündeki öğrencilerin notlarıyla karşılaştırıldığında 1 ortalama değer etrafında daha yakın dağılmıştır. Bu nedenle serilerin diğer özelliklerini de ortaya koyacak merkezi eğilim ölçüleri dışında değişim ölçülerine ihtiyaç vardır. Değişim ölçüleri genel olarak Değişim Aralığı (Range), Ortalama Sapma, Standart Sapma, Varyans ve Değişim (değişkenlik) Katsayısı olarak bilinir. Değişkenlik, seri terimlerinin değerce birbirlerinden farklılıkları ve değerce nasıl dağıldıklarını ifade eder. Dağılma, grafik üzerinde, özellikle apsiste kapladığı kısmın eninde kendini gösterir. Bir serinin değişkenliği arttıkça ölçek sabit kalmak şartıyla, o kısım genişler. Değişkenlik azaldığı oranda ortalamanın temsil kabiliyeti azalmakta, değişkenlik azaldığı oranda ortalama temsili olmak vasfını kazanmaktadır. Bir serinin bölünmesi o serinin grafikte “y” ekseninde kapladığı bölümde ortaya çıkmaktadır. Seriyi tam olarak tanımlayabilmek için ortalama yanında değişkenlik ve bölünme şeklinden yararlanılır. Değişkenlik ölçülerinin hesaplanmasında serinin bütün terimleri dikkate alınmasına analatik değişkenlik ölçüleri, serinin tüm terimlerinin hesaplanmaya katılmadığı değişkenlik ölçüsüne analitik olmayan değişkenlik ölçüleri denir. ANALATİK OLMAYAN DEĞİŞKENLİK ÖLÇÜLERİ 2. Analitik olmayan değişkenlik ölçüleri; Değişim Aralığı ve Kartiller Arası Farktır. 2.1. Değişim Aralığı Serideki en büyük gözlem değeri ile en küçük gözlem değeri arasındaki farka “DEĞİŞİM ARALIĞI” denir. Formülü aşağıdaki gibi yazılır. DA = Xmax - Xmin Yukarıdaki örnekte İktisat bölümü için DA = 70 - 30 = 40 ve Kamu yönetimi bölümü için DA = 95 - 5 = 90 olarak hesaplanır. Tüm gözlem değerlerinin birbirinden ya da ortalamadan farklarını ortaya koymaması açısından serinin dağılımı hakkında fazla bir bilgi içermez. Değişim Aralığı katsayısı yukarıdaki örnekten de görüldüğü gibi özellikle serideki uç değerlerden aşırı etkilenmektedir. Özellikleri: i. D.A.’nın hesabı kolaydır. ii. Aykırı ve uç değerlerden hemen etkilenir. iii. Açık uçlu dağılımlar için hesaplanamaz. 2.2. Kartiller Arası Fark Değişim aralığının serinin iki ucunda yer alan anormal terimlerden hemen etkilenmesi sakıncasını gidermek üzere kartiller arası fark (KAF) adı verilen ölçü kullanılır. Bu ölçü KAF= Q3 Q1 ’e eşittir. 2 ÖRNEK: Aşağıdaki A ve B serilerinin değişkenliklerini DA ve KAF ile karşılaştırınız? A B 2 2 5 3 8 5 9 6 15 9 11 A serisi: D.A = Xmax- Xmin = 15 -2 =3’tür, K.A.F. = Q3 Q1 =9–5=4’dir. B serisi: D.A = Xmax- Xmin = 11 -2 =9’tür, K.A.F. = Q3 Q1 =9-3=6’dır. B için kartiller; N 2 Q1 .terim olduğundan 2.terim = Q1=3. 4 3N 2 .terim olduğundan 5.terim=Q3=9. 4 Benzer olarak A serisinin kartilleri bulunur ve KAF hesaplanır. Q3 Değişim aralığının serinin iki ucunda yer alan anormal terimlerden hemen etkilenmesi sakıncasını gidermek üzere kartiller arası fark adı verilen ölçü kullanılır. Kartiller arası farkı büyük olan serinin değişkenliği kartiller arası farkı küçük olan seriye nazaran değişkenliği daha fazladır. Dağılma özelliği yüksektir. Örneğin A serisinin kartiller arası farkı 4 ve B serisinin KAF’ ı 6 ise; B serisinin değişkenliği A serisinin değişkenliği Çünkü 6 4’tür. Bütün serilerde bu özellik aynıdır. Oysa Değişim aralığı kriterine bakılacak olsaydı A serisinin değişkenliği B serisininkinden daha büyük olarak kabul edilecekti. ÖRNEK: Sınıflanmış Serilerde KAF’ın hesabı. A B Xi Ni Xi Ni 1 2 2 7 5 7 4 4 7 9 5 6 12 2 6 3 A; Q1 5; Q3 7 Q1 N 2 .terim 4 Q3 3N 2 .terim 4 Q2 2N 2 .terim 4 B; Q1 2; Q3 5 3 KAFA=7-5=2 < KAFB =5-2=3, B serisi daha değişkendir. KAF’ın Özellikleri: i. Hesabı D.A. dan biraz daha kolaydır. ii. Aykırı ve uç değerlerden etkilenmez. iii. Açık uçlu dağılımlar için hesaplanabilir. 2.3. Kartiller Arası Değişim Katsayısı Kartiller Arası Değişim Katsayısı (KADK) kartillere dayanan diğer bir değişkenlik 1 ölçüsüdür. Q1 ve Q3 bir seri için verilsin. Q1 Q3 bize serinin merkezi eğilimini 2 verir veya ortalamasını verir. 1 Q3 Q1 bize kartiller arası farkın yarısını verir. Bu bize veri dağılımının 2 asimetrisi hakkında bilgi verir. Mutlak değeri ne kadar büyük ise serinin değişkenliği ve asimetrisi o kadar yüksektir. Q 1 Q3 Q1 formülü kullanılarak Kartiller Arası Değişim Katsayısı hesaplanarak 2 asimetrik dağılımın nispi değeri de belirlenebilir. Nispi asimetri ölçüsü ve değişkenliği ise şöyledir; Kartiller Arası Değişim Katsayısı; Q 1 (Q3 Q1 ) (Q Q ) 1 2 VQ 3 1 ( Q Q 3 1) (Q3 Q1 ) 2 ÖRNEK: Bir serinin Q3 =69.61, Q1 =65.64 ise KADK nedir? VQ 69.61 65.64 3.97 0.0293 %2.9 69.61 65.64 135.25 Değeri sıfırdan büyük olduğu için seri sağa eğiktir. İki kartil arası farkın değişkenliği %2’dir. ÖRNEK: İki seriye ait olarak seri A: Q1 =2.29, Q2 3.43, Q3 =5 ve Seri B: Q1 =4.25, Q2 5.25, Q3 =6.40 kartil değerlerini kullanarak iki serinin çarpıklığını ve değişkenliğini karşılaştırınız? Pearson Asimetri ölçüsünü kullanarak ASPA 0.159 0 ve ASPB 0.070 0 her iki seri asimetrisi hafif sağa eğik serilerdir. K.A.D.K.’nı kullanarak; 4 VQ A 5 2.29 2.71 0.3717 %37 5 2.29 7.29 VQ B 6.4 4.25 2.15 0.2018 %20 6.4 4.25 10.65 olduğu bulunur. VQ A %37 > VQ B =%20 olduğundan A serisi değişkenliğinin daha yüksek olduğu görülür; Dolayısıyla A serisi daha asimetrik ve değişkenliği daha yüksektir. 3. ANALİTİK DEĞİŞKENLİK ÖLÇÜLERİ 3.1. ORTALAMA MUTLAK SAPMA (OMS) Değişim aralığı hesaplanırken serideki tüm değerler kullanılmadığı için bilgi kaybı olabilir ve bu bir eksikliktir. Bundan dolayı serideki değişimi ölçmek için daha ileri ve tüm değerleri hesaba katan değişim ölçülerine ihtiyaç vardır. Bir serideki gözlem değerlerinin o serinin aritmetik ortalamasından farklarının (sapmalarının) mutlak değerinin ortalamasına “ORTALAMA MUTLAK SAPMA” denir. Bu değişim ölçüsü gözlem değerlerinin aritmetik ortalamadan ne kadar saptığını göstermesi açısından değişkenlik hakkında bilgi içerir. Ortalama Mutlak Sapma, terimlerin aritmetik ortalamadan mutlak sapmalarının aritmetik ortalamasıdır. OMS Medyana göre de hesaplanabilir. Ortalama mutlak sapma basit seriler, tasnif edilmiş seriler ve gruplanmış seriler için hesaplanabilir. ORTALAMA MUTLAK SAPMASI (ANAKÜTLE) Basit serilerde N X i -X OMS i 1 N Sınıflanmış serilerde k Ni X i -X OMS i 1 k Ni i 1 Gruplanmış serilerde k Ni mi -X OMS i 1 k Ni i 1 Ortalama mutlak sapmanın medyana göre hesaplanmasında ise X = Me formülde yerine konur. Ortalama mutlak sapması büyük olan seri daha değişkendir. 3.1.1. Basit Seride Ortalama Mutlak Sapma Basit seride Ortalama Mutlak Sapma aşağıdaki formül yardımıyla hesaplanır. 5 ÖRNEK: İstatistik dersi sınavına giren 5 öğrencinin aldığı notlar aşağıdaki tabloda verilmiştir. Öğrencilerin aldığı notların ortalama mutlak sapmasını hesaplayınız. İstatistik Notları (Xi) Ortalama Sapmalar Ortalama Mutlak Sapmalar 40 40 - 66 = -26 26 50 50 – 66 = -16 16 70 70 - 66 = 4 4 80 80 - 66 = 14 14 90 90 - 66 = 24 24 0 Beş öğrencinin notlarının ortalamadan sapması mutlak değer olarak 16.8 bulunmuştur. 3.1.2. Sınıflanmış Serilerde Ortalama Mutlak Sapma Tasnif edilmiş seride Ortalama Mutlak Sapma aşağıdaki formül yardımıyla hesaplanır. ÖRNEK: Maliye bölümü öğrencilerinin İstatistik final sınavı notları tasnif edilmiş seri olarak aşağıda verilmiştir. Bu dağılımın ortalama mutlak sapmasını hesaplayınız. Öğrencilerin Notları (Xi) fi fiXi 40 1 40 30 30 50 2 100 20 40 60 4 240 10 40 70 6 420 0 0 6 80 4 320 10 40 90 2 180 20 40 100 1 100 30 30 Toplam İlk aşamada aritmetik ortalama hesaplanır. Aritmetik ortalamadan mutlak sapmalar ( ) bulunduktan sonra her bir gözlemin aritmetik ortalamadan mutlak sapması frekansı ile çarpılır ( ). Bulunan değerler formülde yerine konulduğunda tasnif edilmiş serinin OMS bulunur. olarak bulunur. 3.1.3. Gruplanmış Seride Ortalama Mutlak Sapma Gruplanmış seride Ortalama Mutlak Sapma aşağıdaki formül yardımıyla hesaplanır. ÖRNEK: Sakarya Üniversitesi İİBF öğrencilerinin istatistik yılsonu notları gruplanmış seri olarak aşağıda verilmiştir. Bu dağılımın ortalama mutlak sapmasını hesaplayınız. Not Sınıfları m i (Gruplar) fi mifi 90-100 95 50 4750 28 1400 85-89 87 60 5220 20 1200 80-84 82 40 3280 15 600 75-79 77 50 3850 10 500 70-74 72 100 7200 5 500 7 60-69 64,5 50 3225 2.5 125 50-59 54,5 60 3270 12.5 750 40-49 44,5 40 1780 22.5 900 0-39 19,5 50 975 47.5 2375 İlk aşamada aritmetik ortalama hesaplanır. İkinci aşamada sınıf orta değerleri (mi) bulunur. Aritmetik ortalamadan mutlak sapmalar ( ) bulunduktan sonra her bir gözlemin aritmetik ortalamadan mutlak sapması frekansı ile çarpılır ve toplamları alını; ∑ konulduğunda gruplanmış serinin OMS bulunur. . Bulunan değerler formülde yerine olarak bulunur. Ancak aşağıdaki yaklaşım O.M.S. değerini daha doğru verir: 3.1.4. Gruplanmış Seride Ortalama Mutlak Sapma Hesabında Eğilim Gruplanmış serilerde formülü uygulamadan önce aritmetik ortalamayı ihtiva eden sınıfı ortalamaya kadar ve ortalamadan sonra olmak üzere ikiye bölmek gerekir. X’ler yerine sınıf ortaları yani (mi)’ler dikkate alınır. Gruplar 2-4’den az 4-6’dan az 6-8’den az 8-10’dan az Ni 2 3 7 4 ΣNi=16 mi 3 5 7 9 Nimi 6 15 49 36 ΣNimi=106 k N m i ΣNi=16, ΣNimi =106 ise X = i i=1 k N = 106 =6.625 16 i i=1 8 Sınıflar Ni mi mi - X mi -X 2-4’den az 4-6’dan az 2 3 3 5 -3.625 -1.625 3.625 1.625 Ni mi -X 7.25 4.875 6-6.625’den az 2.1875 6.3125 0.3125 0.3125 0.6835 6.625-8’den az 4.8125 7.3125 0.6875 0.6875 3.3085 8-10’dan az 2.375 4 9 2.375 9.50 Sonra aşağıdaki seri üzerinden OMS oluşturulur. Σ Ni mi -X =25.617 6.625 frekansı 6-8’den az sınıfında bulunur. 6-8’den az sınıfını (6-6.625’den az) ve (6.625-8’den az) şeklinde ikiye böleriz ve bu bölme esnasında 6-8’den az sınıfının frekansı bu bölünmüş sınıfa sınıf aralıkları ile orantılı olarak dağıtılır. Sınıflar 6-6.625’den az Sınıf aralıkları 0.625 Frekanslar Na frekans 2.1875 6.625-8’den az 1.375 Nt 4.8125 6-8’den az 7 2.000 Ni si 7*0.625 2.1875 , yani frekansların % kaçının 0.626 sınıf aralığına karşılık s 2 geldiğini buluruz. Na Na+Nt=7 2.1875+Nt=7 Nt=4.8125 5 Ortalama Mutlak Sapma OMS N i 1 i mi -X 5 N i 1 25.617 1.601 dır. 16 i 3.1.5. Ortalama Mutlak Sapmanın Özellikleri i. Her gözlem sapmasına eşit ağırlık verir. ii. Ortalamadan sapmalar biçiminde olduğu gibi Medyandan sapmalar şeklinde de hesaplanabilir. iii. Hesabı ve anlaşılması standart sapmaya göre daha kolaydır. iv. OMS, standart sapma kadar olmasa da serideki aşırı değerlerin etkisi altında kalır. 9 v. Açık gruplu serilerde OMS hesaplanamaz. Hesaplamak içinse grup üst veya alt sınır için bir tahmin yapılır. vi. OMS matematiksel işlemlere uygun değildir. vii. Öngörü doğruluk kıyaslaması ve öngörü modeli seçiminde kullanılabilmektedir. 3.2. STANDART SAPMA VE VARYANS Gözlem değerlerinin aritmetik ortalamadan farklarının toplamı sıfır olacağından, bu farkların mutlak değerini alarak ortalama mutlak sapmaları hesaplandı. Ortalama Mutlak sapmaya alternatif olarak bir değişkenlik ölçüsü olarak standart sapma kullanılabilir. Bir serideki gözlem değerlerinin o serinin aritmetik ortalamasından farklarının (sapmalarının) karesinin toplamının ortalamasına “VARYANS” ve karekökü alınan varyansa “STANDART SAPMA” denir. Standart sapma, terimlerin aritmetik ortalamadan farklarının kareli ortalamasından ibarettir. Standart sapması küçük olan seri daha değişkendir. Ana kütlenin varyansı ve standart sapması σ (sigma) simgesi ile gösterilirken, örneklemin varyansı ve standart sapması s simgesi ile gösterilir. Serilerdeki varyans ve dolayısıyla standart sapma arttıkça serinin yayganlığı artmaktadır. Ana kütlenin aritmetik ortalaması μ ve örneklemin aritmetik ortalaması simgesi ile gösterilir. Bu bölümde ana kütle üzerinde çalışacağımız varsayımı altında aritmetik ortalama μ ile gösterilecektir. ANAKÜTLENİN STANDART SAPMASI Basit Serilerde X i - 2 Sınıflanmış Serilerde N i 1 N k Ni X i - 2 i 1 k Ni Gruplanmış Serilerde k Ni mi - 2 i 1 k Ni i 1 i 1 Örneklem standart sapması ile ilgilenildiğinde, σ yerine s, μ yerine X simgesi ve N yerine n simgesi tercih edilir ve toplam örneklemin frekans (gözlem) sayısının bir eksiği ile bölünür. Burada k seride bulunan farklı terim ya da grup sayısıdır. Gruplanmış serilere Sheppard düzeltmesi uygulanır; 1 2 s2 12 s= Ortak sınıf aralığı 1 =Düzeltilmiş Sheppard düzeltilmesinin yapılabilmesi için serinin bölünmesinin normal veya normale yakın, ayrıca frekanslarının büyük ve serinin iki ucunda asimptotik olarak sıfıra yaklaşma eğiliminde olması gerekir. J, ters J ve U serilerinde ve çok asimetrik serilerde 10 düzeltmenin yararı yoktur. Bu düzeltme sınıf sayısının yeterince çok olmaması halinde anlam taşımaz. Not: 1) > ortalama sapma (Standart Sapma > Ortalama Mutlak Sapma) 2) K > A ( Kareli Ortalama>Aritmetik Ortalama) 3) >0. 3.2.1. Basit Seride Standart Sapma ve Varyans Basit serilerde Varyans ve Standart Sapma aşağıdaki formül yardımıyla hesaplanır. X i - 2 N 2 i 1 N X i - 2 N i 1 N ÖRNEK: İstatistik dersi sınavına giren 5 öğrencinin aldığı notlar aşağıdaki tabloda verilmiştir. Öğrencilerin aldığı notların (basit serinin) varyansını ve standart sapmasını hesaplayınız? İstatistik Notları (Xi) Ortalama Sapmalar Ortalama Mutlak Sapmalar 40 40 - 66 = -26 676 50 50 – 66 = -16 256 70 70 - 66 = 4 16 80 80 - 66 = 14 196 90 90 - 66 = 24 576 0 11 Yorum: Her bir öğrencinin notu aritmetik ortalamadan (66) ortalama olarak 18.5 standart sapma farklılık göstermektedir. 3.2.2. Tasnif Edilmiş Seride Standart Sapma ve Varyans Tasnif edilmiş serilerde Varyans ve Standart Sapma aşağıdaki formül yardımıyla hesaplanır. k Ni X i - 2 2 i 1 k Ni i 1 k Ni X i - 2 i 1 k Ni i 1 ÖRNEK: Maliye bölümü öğrencilerinin İstatistik final sınavı notlarının tasnif edilmiş seri olarak aşağıda verilmiştir. Bu dağılımın (tasnif edilmiş serinin) varyansını ve standart sapmasını hesaplayınız? Öğrencilerin Ni X i - X i - 2 Ni X i - 2 Notları (Xi) 40 1 -30 900 900 50 2 -20 400 800 60 4 -10 100 400 70 6 0 0 0 80 4 10 100 400 90 2 20 400 800 100 1 30 900 900 Toplam k N i =20 i 1 k Ni X i - 2 =4200 i 1 12 k Ni X i 1400 İlk aşamada aritmetik ortalama hesaplanır. i 1 70. k 20 Ni i 1 k Ni X i - 2 2 i 1 k Ni 4200 210 20 i 1 k Ni X i - 2 i 1 k Ni 4200 14.5 . 20 i 1 Yorum: Her bir öğrencinin notu aritmetik ortalamadan (70) ortalama olarak 14.5 standart sapma farklılık göstermektedir. 3.2.3. Gruplanmış Seride Standart Sapma ve Varyans Gruplanmış serilerde Varyans ve Standart Sapma aşağıdaki formül yardımıyla hesaplanır. k Ni mi - 2 2 i 1 k Ni , i 1 k Ni mi - 2 i 1 k Ni i 1 Gruplanmış serilerde Sınıflar Ni mi Nimi mi mi 2-6’dan az 2 4 8 -7.6 57.76 115.52 6-10’dan az 1 8 8 -3.6 12.96 12.96 10-14’ten az 3 12 36 0.4 0.16 0.48 14-18’den az 4 16 64 4.4 19.36 77.44 Σ 10 Nimi N i 116 2 Ni mi 2 206.4 116 11, 6 10 13 n N m N i i i 1 2 , i 206.4 20.64 4.54 10 Gruplanmış seri olduğu için düzeltme gerekir. s2 42 20.64 19.14 4.375 12 12 1 2 Yorum: Her bir terimin değeri aritmetik ortalamadan (11.6) ortalama olarak 4.375 standart sapma farklılık göstermektedir. 3.2.4. Standart sapma kareli ve aritmetik ortalama yardımıyla şu şekilde hesaplanır. K 2 2 . Bunun için önce kareli ortalamanın ve aritmetik ortalamanın kareleri hesaplanır. Bir önceki örneğe uygulayalım: K2 Nm N i 2 i i 1552 2 155.2 , X 2 11.6 134.56 10 155.2 134.56 20.64 4.54 Gruplanmış seri olduğu için düzeltme gerekir. 1 2 s2 42 20.64 19.14 4.375 . 12 12 ÖRNEK: Tabloda verilen gruplanmış serinin varyansını bunuz? Sınıflar Ni mi Ni mi Nimi 2 2-4’den az 2 3 6 18 4-6’dan az 3 5 15 75 6-8’den az 7 7 49 343 8-10’dan az 4 9 36 324 106 760 Σ X 16 Nm N i i i 106 Nimi 2 47.5 6.625 , K 2 16 Ni 2 47.5 6.625 3.61 2 14 2 1 3.61 4 3.27 3.61. 12 Alternatif olarak aşağıdaki şekilde de standart sapma hesaplanabilir. Sınıflar Ni mi N i mi X N i mi X 2 2-4’den az 2 3 2(3.625)=7.25 26.28125 4-6’dan az 2 5 2(1.625)=3.25 5.28125 6-6.625’den az 2.1875 6.3125 2.1875(0.3125)=0.6836 0.2136 6.625-8’den az 4.8125 7.3125 4.8125(0.6875)=3.3086 2.2746 8-10’dan az 4 9 4(2.375)=9.5 22.5625 Toplam 16 23.9922 56.6132 2 56.6132 3.54 16 3.2.5. Standart Sapma ve Varyansın Özellikleri 1. Bir serinin bütün terimlerine aynı sayı eklenir veya toplanırsa serinin varyansı değişmez. X k X k 2 i a) N 2 i N X k X k i b) X X N 2 X X i N V X k V X V X k V X 2 Bir seriye k sayısı çıkartılır veya toplanırsa aritmetik ortalama k kadar artar veya azalır ancak serinin standart sapması değişmez. 2. Bir serinin bütün terimlerini aynı sayıyla çarptığımızda ya da böldüğümüzde, varyans çarpılan sayının karesi ile orantılı olarak büyür ya da bölümün karesiyle orantılı olarak küçülür. Yine burada terimler bir sayı ile çarpılırsa aritmetik ortalama o sayı kadar büyür ve bölünürse küçülür özelliğinden hareketle; a) LX LX i N 2 X X L. 2 i N 2 V LX L2V X 15 2 Xi X L L 1 Xi X 2 b) 2. N L N X V L 1 2 V X L 3. Birbiriyle ilişkili iki serinin terimlerinin karşılıklı toplanması (veya çıkarılması) sonucu elde edilen serinin varyansı, bu serilerin varyansları toplamı (çıkarımı) kovaryansının 2 katının toplamına (farkına) eşittir. Yine iki serinin terimlerinin karşılıklı olarak aritmetik ortalaması bu serilerin aritmetik ortalamalarının toplamına eşittir; aritmetik ortalama özelliğinden yararlanarak; X Y X Y i a) i N 2 X X Y Y i 2 i N X X Y Y = 2 i 2 i = 2 Xi X Yi Y N V X Y V X V Y 2Cov XY X Y X Y i b) i N 2 X X Y Y i N X X Y Y i 2 i 2 2 i 2 Xi X Yi Y N V X Y V X V Y 2Cov XY Kovaryans seriler arası ilişkinin varlığını ve yönünü belirleyen bir özelliğe sahiptir. 4. Birbirinden bağımsız iki serinin terimlerinin karşılıklı olarak toplanması (çıkartılması) suretiyle elde edilen serinin varyansı, bu serilerinin varyansları toplamına (çıkarımına) eşittir. Çünkü X ve Y bağımsız iki seri ise; Cov(X,Y)=0’dır. Ve V X Y V X V Y 5. > OMS’dır. 3.3. DEĞİŞİM KATSAYISI (DK) Ölçüm birimleri aynı olan iki serinin dağılımının değişkenliğini karşılaştırmak mümkün iken farklı ölçü birimleri kullanan iki serinin dağılımının değişimlerini gösteren standart sapmalarını karşılaştırılarak serilerin değişkenliğini kıyaslamak mümkün değildir. Bu nedenle serilerin standart sapmasının ortalamasına göre yüzdesi alınarak “DEĞİŞİM KATSAYISI” hesaplanır. Farklı ölçü birimlerine sahip serilerin değişim katsayıları yardımıyla değişkenlikleri karşılaştırılabilir. Değişim katsayısının formülü aşağıda verilmiştir. 16 Bu formül yardımıyla hesaplanan değişim katsayılarında ölçü birimleri ortadan kalkarak farklı ölçümlü serilerin değişkenliği bu oranlar karşılaştırılarak yapılabilir. ÖRNEK: Tabloda 5 kişiye ait yaş ve ağırlıklardan vermektedir. Bu kişilerin yaş ve ağırlıklarından oluşan bu iki serinin değişkenliklerini karşılaştırınız. 2 2 Yaş (Yıl) (Xi - µyaş) Ağırlık (Kilogram) (Xi - µağırlık) 20 400 52 576 30 100 70 36 40 0 75 1 50 100 85 81 60 400 98 484 Yaş ve ağırlık farklı ölçü birimleri ile ölçüldüğünden standart sapmalarına bakarak serilerin değişimlerini karşılaştırmak sağlıklı olmaz. Değişim katsayılarını hesaplamamız gerekir. µyaş = , µağırlık = kg 1000 14.14 yıl. σyaş = 5 1178 15.35 kğ. σağırlık = 5 Yaş ve ağırlıklardan oluşan iki serinin standart sapmalarını karşılaştırdığımızda ağırlık serisindeki değişimin daha fazla olduğu sonucu ortaya çıkmaktadır ki bu sonuç bizi yanıltır. İki serinin ölçü birimleri farklı olduğundan standart sapmalarını karşılaştırarak böyle bir sonuca varmak yanıltıcı olacaktır. Doğru yöntem her iki serinin değişim katsayılarını karşılaştırmaktır. 17 DKyaş = 14.14 100 35.35 40 DKağırlık = 15.35 100 20.2 76 Ağırlık serisinin standart sapması daha yüksek olmasına rağmen, yaş serisinin değişim katsayısı daha yüksektir. Dolasıyla yaş serisinin değişkenliği ağırlık serisinden daha yüksektir. Gruplanmış serilerde düzeltilmiş standart sapma uygulanır. 4. ÖRNEKLEMİN VARYANS VE STANDART SAPMASININ HESABI Örneklemin varyansı basit serilerde aşağıdaki formül yardımıyla hesaplanır. S2 = Örneklemin varyansı. = Örneklemin aritmetik ortalaması. n = Örneklemin gözlem sayısı, örneklem hacmi. n-1 = Serbestlik derecesi. Örnekten bir değer hesaplanırken parametre yerine kullanılan her istatistik için gözlem sayısından bir eksiltilir. Burada μ yerine X hesaplanmıştır. Bundan dolayı hesaplamada örneklem gözlem sayısından bir çıkartılmıştır. Örneklemin standart sapması aşağıdaki formül yardımıyla hesaplanır. S= Örneklemin standart sapması. ÖRNEKLEMİN STANDART SAPMASI Basit Serilerde Sınıflanmış Serilerde Gruplanmış Serilerde k ni X i - X k ni mi -X n s Xi -X i 1 n-1 2 s i 1 2 k ni -1 i 1 5. s i 1 2 k ni -1 i 1 STANDART SAPMANIN FAYDALARI 1. Terimlerin ortalamadan sapmalarının kareleri toplamı dolayısıyla varyans minimumdur. 18 2. Standart sapma serinin yayganlığı hakkında bilgi veriri. Standart sapma büyüdükçe (küçüldükçe) serinin grafiğinin yayganlığı artar (azalır). 3. Gözlem değerlerini aritmetik ortalamadan sapmalarını standart sapma cinsinden ifade edebiliriz. Diğer bir ifade ile z normal değişkenini oluştururken standart sapmadan yararlanırız. Örneğin istatistik sınavının ortalaması 60 ve standart sapması 10 olsun. Bir öğrenci bu sınavdan 90 almıştır. Bu öğrenci ortalamadan 30 puan fazla almıştır. Standart sapma cinsinden ise ortalamadan 3 standart sapma daha yüksek almıştır. 4. Seri terimlerinin cebirsel sapmalarını standart sapmanın katları cinsinden ölçülmesinde kullanılır. Aynı ölçü birimini kullanan farklı serilerdeki gözlem değerlerini standart sapma cinsinden karşılaştırabiliriz. Örneğin bir öğrenci istatistik dersi birinci vizesinden 40 ( ) ve ikinci vizesinden 80 ( ) almıştır. Bu öğrenci ilk vizede sınıf ortalamasından 10 puan ikinci sınavda ise 20 puan yüksek not almıştır. Standart sapma cinsinden hesapladığımızda, bu öğrenci ilk vizede sınıf ortalamasından 2 standart sapma ve ikinci sınavda ise sınıf ortalamasından 1 standart sapma daha yüksek not almıştır. Dolayısıyla öğrenci birinci vizede daha başarılıdır. 6. TOPLANMA ORANI Günlük hayatımızda gelirlerin eşit dağılmadığı görülür. T.O. iktisadi faktörlerin az sayıda büyük ellerde toplanıp toplanmadığını; eşit dağılıp dağılmadığını veya dağılımın eşitsizlik seviyesini belirlemek için kullanılır. Nicel bölünme serilerinden sınıflanmış serilerle gruplanmış serilerde belirli seviyelerin altında kalan kümülatif oransal frekanslarla bunlara tekabül eden kümülatif oransal toplam kıymetler arasında bir kıyaslama yapmayı sağlamak üzere toplanma serisi oluşturulur. Sonra şu formül yardımıyla toplanma oranı oluşturulur. k 1 p q i T .O. i 1 i k 1 p 100 i i 1 pi= Nispi kümülatif frekans değerleri. qi= “(frekans)x(terim)” değerlerinin nispi kümülatif frekans değerleri. k= sınıf sayısı, pi-qi (-) olamaz, pi-qi > 0. 0 T .O. 1' dir. 19 Grafikteki 45 derecelik çizgi pi=qi olduğunu gösterir. T .O. Taralı Alan A O C A T.O.=0 ise birimlerin tam eşit dağılımını, T.O.=1 ise birimlerin tek bir yerde veya tek bir elde toplandığını gösterir. 0 < T.O.< 0.5 terimlerin sınıflar arasında eşit dağıldığını gösterir. Toplanma oranının 1’e yaklaşması dağılımda eşitsizliğin arttığını gösterir. Toplanma oranının 0’a yaklaşması dağılımda eşitliğin arttığını gösterir. Eşit dağılma 450 ’lik bir açı yapar. 450 ’lik açılı doğru ile eğri arasında kalan gölgeli alana “toplanma alanı” adı verilir. Seri eşit dağılmadan uzaklaştıkça bu alan genişler. k pi k Ni i 1 N NX q NX ve i i i i i i i 1 k 1 k 1 pi qi i 1 T .O. ; k 1 i 1 pi p q i T .O. i 1 i k 1 p i i 1 Basit Serilerde T aralı Alan değeri sıfırdır ve T.O.=0 olup tam eşit dağılımı ifade eder. 6.1. Sınıflanmış Serilerde Toplanma Oranının Hesabı 20 ÖRNEK: X serisinin değerleri ve frekansları aşağıdaki gibi verilmiş olsun. Buna göre toplanma oranını bulalım. Xi Ni Ni.Xi ΣNi ΣNiXi %pi %qi %(pi-qi) 20 40 800 40 800 40 19 21 40 25 1000 65 1800 65 42.8 22.2 60 20 1200 85 3000 85 71.4 13.6 80 15 1200 100 4200 100 100 0 Toplam ΣNi=100 ΣNiXi=4200 k 1 p =190 Σ(pi-qi)=56.8 i i k % pi Ni i 1 k N k NX i .100 %qi i NX i i 1 i i 1 k .100 i i 1 %pi’lerin ΣNi’lerin en sonuncusu %100 kabul edilmek suretiyle pi’ler bulunur; 40 .100 40 100 65 .100 65 100 85 .100 85 100 100 .100 100 100 %qi’lerin ΣNiXi’lerin en sonuncusu %100 kabul edilerek qi’ler bulunur. 800 .100 19 4200 1800 .100 42.8 4200 3000 .100 71.4 4200 4200 .100 100 4200 Şimdi toplanma oranını hesaplayalım. Seride 4 sınıf mevcuttur. Bundan dolayı pi, ve (pi-qi) farklarının ilk üçü toplanması gerekmektedir. %pi’lerin ilk üçü sırasıyla; 40+65+85=190’dır. Ve %(pi-qi) farklarının ilk üç toplamı ise 56.8’dir. k 1 p q i T .O. i =1 i k 1 p i x100 0.40-0.19 + 0.65-0.428 + 0.85-0.714 x100 0.40+0.65+0.85 i =1 T.O.= 6.2. 56.8 0.3<0.5 olduğundan adildir 190 Gruplanmış Serilerde Toplanma Oranının Hesabı 21 ÖRNEK: X serisinin grupları ve frekansları aşağıdaki gibi verilmiş olsun. Buna göre toplanma oranını bulalım. Sınıflar Ni mi Nimi ΣN i ΣNi mi %pi %qi %(pi-qi) 8-12’den az 8 10 80 8 80 16 10.05 5.95 12-16’dan az 20 14 280 28 360 56 45.23 10.77 16-20’den az 12 18 216 40 576 80 72.30 7,64 20-24’den az 10 22 220 50 796 100 100 - Toplam ΣNi=50 ΣN i mi=796 k 1 k 1 pi =152 ( p -q ) =24.36 i i %pi’ler için; 8 .100 16 50 28 .100 56 50 80 .100 10.05 796 %qi’ler için; 40 .100 80 50 360 .100 45.23 796 i i =1 50 .100 100 50 576 .100 72.36 796 k 1 p q i T .O. i =1 i k 1 p x100 0.1600-0.1005 + 0.5600-0.4523 + 0.800-0.723 x100 0.16+0.56+0.80 i i =1 T .O. 5.95+10.77+7.64 24.36 0.16 < 0.5 adildir. 16+56+80 152 ÖRNEK: Aşağıda şehir büyüklükleri ve sayıları verilen tabloda nüfusun şehirlere ne derece eşit dağıldığını belirleyiniz? Şehir büyüklükleri Ni NiXi ΣN i ΣN i X i 0-10000’den az 2 4000 2 4000 10- 20000’den az 3 31500 5 20000-30000’den az 4 87000 30000-40000’den az 377500 11 %pi %qi %(pi-qi) 10 0.8 9.2 35500 25 7.1 17.9 9 122500 45 24.5 19.5 20 500000 100 100 - 22 ΣN i=20 Toplam ΣN iXi=500000 k 1 p =80 i 46.6 i %pi’ler için; %qi’ler için; 2 .100 10 20 5 .100 25 20 4000 .100 0.8 500000 9 .100 45 20 35500 .100 7.1 500000 20 .100 100 20 122500 .100 24.5 500000 9.2 17.9 19.5 46.6 0.5825 > 0.5 adil değildir. Nüfus eşit olarak şehirlere 10 25 45 80 dağılmamıştır. T .O. KAYNAKLAR: Yılmaz Özkan, Uygulamalı İstatistik 1, Sakarya Kitapevi, 2008. Özer Serper, Uygulamalı İstatistik 1, Filiz Kitapevi, 1996. Meriç Öztürkcan, İstatistik Ders notları, YTÜ. Andım Oben Balce ve Serdar Demir, İstatistik Ders Notları, Pamukkale Üniversitesi, 2007. 5. Ayşe Canan Yazıcı, Biyoistatistik Ders Notları, Başkent Üniversitesi. 6. Zehra Muluk ve Yavuz Eren Ataman, Biyoistatistik ve Araştırma Teknikleri Ders Notları, Başkent Üniversitesi. 1. 2. 3. 4. 23