ÖLÇME DEĞERLENDİRME İLE İLGİLİ TEMEL KAVRAMLAR Ölçme nedir? Ölçme: “Bir niteliğin (özelliğin) gözlenip gözlem sonuçlarının sayı ve sembollerle ifade edilmesidir”. Ölçme işleminin aşamaları: Ölçülecek özellikler tanımlanır: Masanın boyu, Ayşe’nin zekası, Öğrencilerin derse karşı tutumu Ölçülecek niteliğe uygun araç seçimi ya da hazırlanması: Cetvel, zeka testi, tutum ölçeği. Ölçülecek nitelik ve aracın eşleştirilerek, sayı ya da başka bir sembolle ifade edilmesi: Masanın boyu 85 cm. Ayşe’nin IQ’sü 95 puandır. Veli sınavdan 60 puan aldı. Ölçme nedir? Ölçme Kuralı: Ölçülen özellik ile sayıların eşleşme yollarıdır. Yapılan bir sınavda her sorunun 3 puan olması bir ölçme kuralıdır. DEĞİŞKEN Değişken: Bir durumdan diğerine farklı değerler alabilen özelliklere değişken denir. Örnek: İnsanların boy uzunlukları, zeka düzeyleri, tutumları, başarıları, cinsiyetleri, milliyetleri, dilleri, ekonomik gelirleri. Değişken olmayan özelliklere sabit denir. Örnek: pi sayısı. DEĞİŞKEN TÜRLERİ Nicel Değişken: Sayılarla ifade edilebilen değişkenlerdir. Bu değişkenler bir büyüklük gösterir. Örnek: Boy uzunluğu, ağırlık, zeka düzeyi Nitel Değişken: Sembollerle ya da sıfatlarla ifade edilebilen değişkenlerdir. Sayılarla ifade edilse dahi bu sayılar bir büyüklük ifade etmez. Örnek: Cinsiyet, milliyet, din. DEĞİŞKEN TÜRLERİ Sürekli Değişken: İki değer arasında başka bir değeri bulunabilen değişkenler süreklidir. Örnek: Ağırlık, uzunluk, zeka düzeyi, yaş. Süreksiz Değişken: İki değer arasında sınırlı sayıda değer alan değişkenler süreksizdir. Bunlar listelenebilir. Örnek: Cinsiyet (kadın, erkek), Okul türleri (Meslek lisesi, Anadolu lisesi…) DEĞİŞKEN TÜRLERİ Bağımsız Değişken: Bir duruma etki eden değişkendir. Bağımlı değişken: Bir başka değişkene bağlı olan, yani etkilenen değişkendir. Örnek: Sigara Kanser (Bağımsız Değişken) Kanser (Bağımsız Değişken) (Bağımlı Değişken) Depresyon Düzeyi (Bağımlı Değişken) Değerlendirme Değerlendirme: Ölçme sonuçlarının bir ölçütle karşılaştırılarak değer yargısına varılma sürecidir. Bu sürecin üç ögesi vardır: Ölçme sonucu: Veli, sınavdan 60 puan aldı. Ölçüt: Sınavdan en az 60 puan alan geçer Karar: Veli 60 puan aldığı için geçti. Değerlendirme Ölçüte Göre Kaça Ayrılır? Mutlak değerlendirme (kriter dayanaklı): Örnek: “60 puan alan sınıfı geçer”. Ölçüte diğer öğrencilerin etkisi yoktur. Ölçüt sınavdan önce belirlenir. Programın hedeflerine dönük, öğrenme eksikliğini ve ön koşul öğrenmeleri belirlemede kullanılır. Değerlendirme Ölçüte Göre Kaça Ayrılır? Bağıl değerlendirme (norm dayanaklı): Çan eğrisi buna örnektir. Ölçüt, gruptaki diğer kişilerden etkilenir. Ör: “Ortalamanın 15 puan üstünde puan alanlar başarılı olur.” Ölçütün kaç olduğu, sınavdan sonra belirlenir. Alınacak kişi sayısının az, başvurunun çok olduğu sınavlarda kullanılır. Ör: KPSS, ÖSS sınavları Ölçme kaça ayrılır? Doğrudan ölçme: Ölçülmek istenen özellik, başka bir özelliğe ihtiyaç duyulmadan gözlenerek ölçülmesi.. Ör: Masanın boyu, öğrencilerin boy uzunluğu, iki şehir arasındaki mesafe, bir kitabın sayfa sayısı, sınıftaki öğrenci sayısı. Ölçme kaça ayrılır? Dolaylı ölçme: Ölçülmek istenen özellik, başka bir özellikle ilişkilendirilerek yapılır. Ölçmeye konu olan özelliklerin doğrudan gözlenememesi ancak, kendileri ile ilgili olduğu bilinen başka özellikler aracılığı ile ölçülmesidir. Ör: Öğrencilerin zeka seviyelerinin, bir dersteki bilgi düzeylerinin, ilgi ve yeteneklerinin, derse karşı tutumlarının ölçülmesi. Sıcaklığın ölçülmesi. Ölçme kaça ayrılır? Türetilmiş ölçme: Ölçülmek istenen özellik, bir araç yardımıyla ölçülemez, başka ölçme işlemlerine ihtiyaç duyulur. Ör: Üçgenin alanı, nüfus yoğunluğu, kişi başına düşen gelir. Ölçmede birim nedir? Birim: Bir ölçme aracını oluşturan en küçük parça, o ölçme aracının birimi olarak kabul edilir. Herhangi bir ölçme işlemi sayı ya da sembollerin yanında bir birimle ifade edilir ve böylelikle anlaşılır olur. Ör: Veli sınavdan 60 puan aldı. Bugünkü sıcaklık 3 C˚ vs. Birimler; “doğal” ve “tanımlanmış” olarak ikiye ayrılır. Doğal olanlar: Ör. Sınıftaki öğrenci sayısındaki birim “bir öğrenci”. Tanımlanmış olanlar: Ör. Uzunluk, ağırlık, öğrenci başarısı, zeka. Ölçmede birim nedir? Birimlerde üç özellik bulunmalıdır: Eşitlik: Birimin her zaman aynı büyüklükte olmasıdır. Genellik: Birimin insanlar tarafından aynı anlama gelmesidir. Kullanışlılık: Birimin ölçülecek büyüklüğe uygun olmasıdır. Ölçmede sıfır nedir? Ölçmede sıfır (0) ikiye ayrılır: Doğal (gerçek, mutlak) sıfır: Sıfır, yokluk manasına gelir. Sınıftaki öğrencilerin mevcudunu saydığımızda, bir masanın boyunu ölçtüğümüzde kullanılan sıfır mutlaktır. Bağıl (göreli, tanımlanmış) sıfır: Sıfır, yokluk manasına gelmez. Bir öğrencinin sınavdan sıfır alması, hava sıcaklığının 0 derece ölçülmesi. Takvimin “0” yılını göstermesi, Dağların deniz seviyesindeki yüksekliği Ölçek Nedir? Nesnelere verilen sayıların anlamlarını ya da nesnelere sayılar vermede ve nesnelere verilen sayıların kullanılmasında uyulması gereken kurallar ile kısaltmaları belirtmek için kullanılır. Başlıca ölçek türleri: sınıflama, sıralama, eşit aralıklı ve oran ölçekleridir. Eğitimde kullanılan ölçek türleri sıralama ve eşit aralıklı ölçeklerdir. ÖLÇEK TÜRLERİ VE TEMEL ÖZELLİKLERİ SINIFLAMA ÖLÇEĞİ •Nesneleri belirli yönlerden benzeyip, benzemediklerine göre sınıflamaktır. •Nesnelerin farklılık ve benzerlikleri belirlenir. •Nesneler sınıf, tip ve kategorilerine göre sınıflanır. •İllere plaka numarası vermek, kız erkek öğrencileri ayırma, kısa uzun boylu öğrencileri ayırma. •Basit istatistik işlemler yapılır. SIRALAMA ÖLÇEĞİ •Nesneleri belli özelliğe sahip oluş miktarı bakımından sıralamaktır. •Öğrencileri boy sırasına, sınav notlarına göre sıralama. •Ortanca ve yüzdelikler hesaplanabilir. ÖLÇEK TÜRLERİ VE TEMEL ÖZELLİKLERİ EŞİT ARALIKLI ÖLÇEK •Nesnelerin belli bir başlangıç noktasına göre ve belli bir özelliğe sahip oluş derecesi bakımından eşit aralıklarla sıralanmasıdır. •Başlangıç noktası sıfır noktası tanımlanmıştır. 0 noktası keyfidir ve eşit aralıklarla bölmelenmiştir. •Termometre, takvim, saat , sınavlar. •Aritmetik ortalama standart sapma hesaplanır. ÖLÇEK TÜRLERİ VE TEMEL ÖZELLİKLERİ EŞİT ARALIKLI ÖLÇEK •Türkçe dersinin sınavından 90 alan öğrencinin zekası 45 alan öğrencinin zekasından iki kat fazladır anlamı çıkmaz. •Hava sıcaklığının 18 0C belirlenmesi. •Öğrencinin matematik başarısı. •Öğrencinin fen bilgisine olan tutumu. •Matematik notu 90 olan bireyin notu matematik dersi 45 olan bireyin notunun tam iki katıdır anlamı çıkmaz. Çünkü 0 noktası görecelidir. ÖLÇEK TÜRLERİ VE TEMEL ÖZELLİKLERİ ORANLI ÖLÇEK •Nesnelerin belli bir başlangıç noktasına göre ve belli bir özelliğe sahip oluş derecesi bakımından eşit aralıklarla sıralanmasıdır. •Başlangıç noktası olan 0 noktası gerçek sıfır noktasıdır. •Sıfır noktası ölçülen özelliğin hiçliğini , yokluğunu gösterir. ÖLÇEK TÜRLERİ VE TEMEL ÖZELLİKLERİ ORANLI ÖLÇEK •Uzunluğun yada ağırlığın ölçülmesi. •Sınıftaki öğrenci sayısının belirlenmesi. •Basketbol takımına girecekler için boy uzunluğu sınırı belirlenmesi. •Boyu 90 cm olan bireyin boyu 45 cm olan başka bir bireyin boyunun tam 2 katıdır anlamı çıkar. •Her türlü istatistik işlemi yapılır. Sorular: 1) Sembollerle ya da sıfatlarla ifade edilebilen değişkenler nitel değişkenlerdir. Aşağıdakilerden hangisi nitel değişkenlere örnek olarak verilebilir? A) Zeka B) Boy uzunluğu C) Ağırlık D) Cinsiyet E) Yoğunluk 23 2) Bir özelliğin gözlenip gözlem sonuçlarının sayı ve sembollerle ifade edilmesine ne denir? A) Ölçüt B) Ölçek C) Ölçme D) Değerlendirme E) Karar 3) Ölçme sonuçlarının bir ölçütle karşılaştırılarak değer yargısına varılma sürecine ne denir? A) Ölçme B) Değerlendirme C) Ölçek D) Karar 24 E) Ölçüm 4) ’’60 puan alan sınıfı geçer.“ ifadesi hangi değerlendirme türüne örnektir? A) Norm dayanıklı B) Çan eğrisi değerlendirme C) Kriter dayanaklı değerlendirme D) Bağıl değerlendirme E) Birim değerlendirme 5) Aşağıdakilerden hangisinde tanımlanmış sıfır kullanılır? A) Sınıf mevcudu B) Masanın boyu C) Kitabın ağırlığı D) Hava sıcaklığı 25 E) Sıvının yoğunluğu 6) Aşağıdakilerden hangisi ölçek türlerinden değildir? A) Sınıflama ölçeği B) Sıralama ölçeği C) Eşit aralıklı ölçek D) Oranlı ölçek E) Orantılı ölçek 26 Ölçme Aracının Yapısal Nitelikleri Ölçme araçlarının nitelikleri üç başlık altında ele alınmaktadır. Geçerlilik Güvenirlilik Kullanışlılık 27 Geçerlilik Bir ölçme aracının her şeyden önce, ölçülecek özellik ya da özellikleri tam ve doğru olarak ölçmesi ve ölçülmesi söz konusu olmayan başka özelliklerle karıştırılmadan ölçülebilmesidir. İçerik ön plandadır. Geçerliliği kestirme, genellikle korelasyon tekniğine dayanır. “-1” ile “+1” arasında değerler alır. +1’e yaklaşması yükselmesi, +1’den uzaklaşması ise düşmesi anlamına gelir. 28 Geçerlilik türleri 1) Kapsam geçerliliği: Bir ölçme aracının yoklanması gereken konu, ünite ya da tüm davranışları kapsayıp kapsamadığı ile ilgilidir. Bir testin hangi davranışları kapsayacağı; “belirtke tablosu” ile belirlenir. Bu tablo, davranışların konulara ne kadar ağırlıkta dağıldığını gösteren iki boyutlu bir çizelgedir. 29 Geçerlilik türleri Kapsam geçerliliğini belirleme yolları: Uzman kanısı alma. Aynı kapsamı ölçen başka bir testle korelasyon. 30 Geçerlilik türleri 2) Bir ölçüte dayalı Geçerlilik: İki türü vardır: Yordama Geçerliliği: Puanların ileri performanslara ilişkin tahminlerde dayanak olarak kullanıldığı durumlarda kullanılır. Yordayıcı puanlar, ölçüt puanlardan önce elde edilir. korelasyon ÖSS Akademik başarı (yordayıcı) (ölçüt) 31 Geçerlilik türleri Uygunluk (uyum) Geçerliliği: Ölçüt puanlar, yordayıcı puanlardan önce elde edilir. Deneme sınavı (ölçüt) korelasyon ÖSS (yordayıcı) 32 Geçerlilik türleri 3) Yapı Geçerliliği: Bir testin yapı geçerliliği, testle ölçülmek istenen yapının ortaya konulması derecesidir. Bir ölçme aracının yapı geçerliliğine sahip olup olmadığının anlaşılması; maddelerin tamamıyla aynı yapıyı ölçmesine bağlıdır. 33 Geçerlilik türleri 4) Görünüş geçerliği: Testin hangi davranışları ölçtüğünün görülmesi ile ilgilidir. Bu daha çok testlerin kapağında yazılır. Matematik testi, Tarih testi gibi. Testin içindeki sorular, kapağındaki başlık ile örtüşmesi gerekir. 34 Geçerliliği Etkileyen Faktörler Güvenilirlik, geçerlilik için bir ön koşuldur. Güvenilirliğin sağlanmış olması; geçerliliğin de sağlandığı anlamına gelmez. Soru sayısının artması, Sabit ve sistematik hatalar geçerliliği düşürür Maddelerin, ölçmek istenen değişkeni ölçmesi geçerliliği arttırır. Soruların, bilenle bilmeyeni ayırt etmesi geçerliliği attırır. Sınavın uygulanma koşulları (gürültülü, karanlık, soğuk ya da sıcak, verilen süre) geçerliliği düşürür. Güvenilirlik Ölçümlerin hatasızlık derecesi ya da gerçeği yansıtma derecesi olarak algılayabiliriz. 0 ile 1 arasında değerler alan bir korelasyon katsayısıdır Belli bir özellik, bir ölçme aracı ile değişik zamanlarda ölçüldüğü zaman aynı ya da hiç olmazsa yaklaşık olarak aynı ölçümleri vermelidir. Yani güvenilirlik, aracın ölçtüğü şeyi tutarlı bir biçimde ölçmesidir. Güvenilirliğin üç özelliği: Duyarlılık: Hatası az olan ölçmedir. Hata azaldıkça ölçme daha duyarlı (hassas) olur. Ör: 25 soruluk bir test; 10 soruluk bir testten daha duyarlı sonuçlar verir. Soru sayısı arttıkça duyarlık artar. Ör: Bir cetvelin en küçük birimi, cm. yerine mm. olursa; daha hassas bir ölçme yapılır. Duyarlık; birimlerin büyüklüğü ile ilgilidir. Birimleri küçük olan ölçme aracı, büyük olandan daha duyarlıdır. Güvenilirliğin üç özelliği: Tutarlılık: Aynı özelliğin farklı araçlarla ya da farklı kişiler tarafından ölçülmesi durumunda ölçme sonuçlarının benzer olmasına denir. Örnek: Bir masanın boyunun iki farklı metre ile ölçülmesi durumunda, iki ölçme sonucunun birbirine yakın olması, metrelerin birbirleriyle tutarlı ölçmeler yaptığını gösterir. Ayrıca, Madde puanlarının (cevapların), testin bütününden elde edilen puan ile korelasyonunun bir göstergesidir. Korelasyonun yüksek olması, maddelerin ölçülmek istenen özellik bakımından homojen (tutarlı) olduğunu gösterir. Düşük olması, maddelerin birbirleriyle ve bütünle tutarlı olmadığını, testin heterojen bir yapıda olduğunu gösterir Güvenilirliğin üç özelliği: Kararlılık: Bir nitelik aynı araçla birden fazla ölçüldüğünde, birbirinden farklı olmayan sonuçlar çıkarsa, ölçme aracı kararlıdır. Örnek:Bir metre ile bir masanın uzunluğunu birden çok ölçtüğümüzde ölçme sonuçlarının birbirine yakın çıkması metrenin kararlı ölçmeler yaptığını gösterir. 39 Korelasyon Katsayısı Korelasyon; İki değişken arasındaki ilişkinin miktarını ve yönünü tanımlayan istatistiksel bir tekniktir. “r” ile gösterilir. +1.00 ile -1.00 arasında bir değer alır. İki değişken arasındaki ilişkinin gücü; katsayı değerinin, +1 ya da -1’e yaklaşması ölçüsünde artar. Katsayı değerinin (0) olması; değişkenler arasında ilişkinin olmadığını gösterir. 40 Korelasyon Katsayısı Korelasyon katsayısının pozitif olması; iki değişkenin aynı yönde, birlikte arttığını gösterir. Doğru orantıya benzer. Ör: Zeka ve başarı arasındaki ilişki için hesaplanan r =0.85 olsun. Bu katsayı, zeka arttıkça başarının da arttığını gösterir. 41 Korelasyon Katsayısı Korelasyon katsayısının negatif olması; Değişkenlerden birinin artarken diğerinin azaldığını ya da birinin azalırken diğerinin attığını gösterir. Ters orantıya benzer. Ör: Sigara içme ile sağlık arasındaki ilişkide r = -0.75 bulunsun. Bu durum; sigara içme davranışı arttıkça sağlık düzeyinin düştüğünü göstermektedir. 42 Korelasyon Katsayısı Korelasyon katsayısının sıfıra yakın olması; eksi ya da artı olsun r nin sıfıra yakın olması; ilişkinin olmadığını ya da çok zayıf olduğunu gösterir. Ör: Boy uzunluğu ile akademik başarı arasındaki ilişki katsayısı 0.05 olsun. Bu durum; boy ile akademik başarı arasında neredeyse hiç ilişki olmadığını gösterir. 43 Güvenilirliği sağlama yöntemleri Test-tekrar test yöntemi: Test aynı gruba belirli bir aralıkla iki kez uygulanır. Birinci uygulama ile ikinci uygulama puanları arasındaki ilişki/korelasyon hesaplanır. Bu yöntemde iki uygulama arasındaki tutarlılığa bakılır. Güvenirlik için katsayının +1.00’a yaklaşması gerekir. Testin tekrarı için üç haftalık süre yeterlidir. Elde edilen katsayı; “kararlılık katsayısı” olarak da bilinir. 44 Güvenilirliği sağlama yöntemleri Eşdeğer (Paralel) formlar yöntemi: Testin iki kez uygulanmasından kaynaklanan olumsuzlukları gidermek için eşdeğer formlar geliştirip uygulanır. Geliştirilen iki form aynı gruba aynı anda ya da kısa bir zaman aralığında uygulanır. İki testten elde edilen puanlar arasındaki korelasyon katsayısı hesaplanır. Elde edilen katsayı; “tutarlılık ve eşdeğerlik” olarak ifade edilir. 45 Güvenilirliği sağlama yöntemleri Testi yarılama (eşdeğer yarılar) yöntemi: Testin iki yarısı arasındaki tutarlılık araştırılır. Tek numaralı sorular bir yarı, çift numaralı sorular bir yarı oluşturur. Elde edilen iki yarı; iki ayrı testmiş gibi kabul edilip aralarındaki korelasyon hesaplanır. Bu yöntem, testin bir kez uygulanmasına dayandığından kullanışlıdır. 46 Güvenilirliği sağlama yöntemleri Kuder-Richardson yöntemi (KR-20, KR-21 formülleri: Her iki katsayı, testin iç tutarlılık katsayısıdır. Eşdeğer yarılar yönteminde testin iki yarısı arasındaki ilişki miktarı hesaplanırken, iç tutarlılık katsayılarında testin bütün sorularının birbirleri ile uyumu incelenir. Bu yöntemin kullanılması; testin homojen bir yapıya, yani aynı özelliği ölçüyor olması sayıltısına dayanır. Bu yöntem, cevapların “1” ve “0” olarak puanlanabildiği testlerde kullanılır. 47 Güvenilirliği sağlama yöntemleri KR-20: Her bir maddenin güçlük indekslerinin belirlenebildiği durumlarda kullanılır. Güçlük indekslerinin hesaplanamadığı durumlarda KR-21 kullanılır. KR-21 formülü, madde güçlük indekslerinin eşit olduğu varsayımına dayalıdır. Eğer maddeler güçlük indeksleri bakımından birbirinden farklı, yani heterojen bir dağılım gösteriyorsa KR-21 ile hesaplanan katsayı, KR-20 ile hesaplanandan daha düşük çıkar. 48 Güvenilirliği sağlama yöntemleri Cronbach Alpha (α) Katsayısı: Cevapların “1” ve “0” şeklinde puanlanamadığı araçlarda kullanılır. İç tutarlılık katsayısıdır. Duyuşsal özelliklerin ölçülmesinde kullanılır. Örneğin tutum ölçeklerinde doğru cevap yoktur ve cevaplar kategoriktir. Alpha değerinin +1.00’e yaklaşması testin kendi içinde tutarlılığının arttığını gösterir. 49 Güvenilirliği sağlama yöntemleri Puanlayıcı güvenilirliği: Yazılı, sözlü sınav gibi puanlaması subjektif olan araçlarda kullanılır. Cevap kağıtları birden çok puanlayıcı tarafından puanlanarak, arasındaki korelasyon hesaplanır. 50 Güvenilirlik sağlama yöntemleri ve anlamları Uygulama Sayısı Güvenirlik Test-tekrar test 2 Kararlılık Paralel (Eşdeğer) Formlar 2 Tutarlılık Eşdeğer Yarılar 1 İç tutarlılık KR-20 ve KR-21 1 İç tutarlılık Cronbach Alpha 1 İç tutarlılık Puanlayıcı Güvenirliği 1 Tutarlılık 51 Güvenirliği Etkileyen Faktörler Testin uzunluğu: Soru sayısı arttıkça güvenirlik artar Ölçülen niteliğin genişliği (Ranj): Gruptaki değişiklik ne kadar fazla ise güvenirlik o kadar yüksek olur. Bu nedenle birkaç sınıfta uygulanan testin güvenirliği bir sınıfta uygulanan testin güvenirliğinden daha yüksektir Test uygulama şartları: Sınav süresi, öğrencileri güdülenme düzeyleri, dikkatsizlik, gürültü, ölçmeyi yapan kişinin sınav anındaki davranışları 52 GÜVENİLİRLİĞİ ARTTIRMAK İÇİN; Bir testteki soru sayısını arttırmak, Açık anlaşılır ve kesin cevaplı sorular sormak, Öğrencilerin seviyelerine uygun sorular sormak. Sınav süresinin gereğinden kısa veya uzun olmamasına dikkat etmek. Öğrencilerin sınav öncesi motivasyonunu sağlamak. Ölçmenin hatalardan arındırılması. Puanlamanın objektifliği. Şans başarısının azaltılması Soru sayısı, süre, puanlamanın nasıl olacağı gibi özelliklerin yönerge ile belirtilmesi Yapısal Nitelikler 53 Güvenilirlik ve Geçerlilik arasındaki ilişki Bir test eğer geçerliyse zaten güvenilirdir Test istenen özelliği ölçüyorsa, hatalardan arınık ölçüyor demektir. Güvenilir bir test geçerli olmayabilir Güvenilirliği yüksek bir matematik testi, fen bilgisini ölçmek için geçerli değildir. Testin güvenilirliği, geçerliliğini sınırlar Güvenilirliği 0.90 olan bir test, 0.10 kadar tesadüfi hata barındırır. Bu hatadan dolayı geçerlilik sınırlı olur. Güvenilirlik ve Geçerlilik bir derecedir, varlık ya da yokluk durumu değildir Bir testin güvenilirliği ve geçerliliği yok/var yerine, düşüktür/yüksektir denir. 54 Kullanışlılık Ekonomiklik Hazırlama süresi Uygulama süresi Hazırlayıcı ve uygulayıcının nitelikleri Cevaplayıcının nitelikleri Uygulama kolaylığı Puanlama kolaylığı Puanların yorumlama kolaylığı 55 Ölçmede Hata Ölçme Hatası: Ölçülen özelliğin gerçek değeri ile, ölçme sonuçlarında elde edilen değer arasındaki farktır. Ör: Gerçek uzunluğu 94x52 cm. olan bir sehpanın uzun kenarı ölçüldüğünde 92 cm. bulunur ise, bu ölçümde 2 cm. ölçme hatası vardır. 56 Ölçme Hatalarının Kaynakları 1. 2. 3. Ölçen kişiden gelen hatalar Ölçülen özellikten gelen hatalar Ölçme aracından gelen hatalar 57 Ölçen Kişiden Gelen Hatalar Yaş Öğrenme durumu Herhangi bir bedensel özür Ruh hali O anki durumu 58 Ölçülen Özellikten Gelen Hatalar Ölçülen özelliğin tam olarak tanımının yapılmamış olması Ölçülecek özelliğin tümünün ölçülemeyişi gibi özellikler ölçmede hataya neden olabilir 59 Ölçme Aracından Gelen Hatalar Kullanılan aracının basımından doğabilecek hatalar da ölçme hatalarına neden olabilir. Örneğin 100 cm değil de 98 cm olan bir metre ile yapılan ölçüm haliyle bize hatalı sonuçlar verecektir. 60 Hata Türleri Sabit hata Sistematik hata Tesadüfi hata 61 Hata Türleri Sabit Hatalar: Bir ölçmeden diğerine miktarı değişmeyen hatalara denir. Her ölçmede hata payı aynıdır. Kontrol edilebilir. Geçerliliği etkiler. Örnek: Bir sınavda herkese 10 puan fazla verilmesi, bir sorunun tüm sınıf tarafından cevapsız bırakılması, bir cetvelin 1 cm eksik ölçmesi 62 Hata Türleri Sistematik Hatalar: Ölçülen büyüklüğe, ölçmeciye veya ölçme koşullarına bağlı olarak miktarı değişen hatalardır. Yanlılık adı da verilir. Kontrol edilebilir. Hatanın kaynağı bellidir. Geçerliliği etkiler. Örnek: Yazısı güzel olana fazla puan verilmesi, kızların fazla puan alması, ilk okunan kağıtlara az, daha sonra okunanlara gittikçe fazla puan verilmesi gibi. 63 Hata Türleri Tesadüfi Hatalar: Bu tür hatalarda, hataların hangi yönde geleceği belli olmaz. Böyle hatalar genellikle kaynakları iyi bilinmeyen hatalar olup ölçme sonuçlarına gelişi güzel karışırlar. Kontrol edilemezler. Güvenilirliği etkiler Örnek: Dikkatsizce okunup puanlanan ya da doğru okunduğu halde yanlış kayıt edilen notlar. Öğrenci kayıtlarına rastgele puan verilmesi. Öğrencinin sınavda hastalanması, motivasyonun düşmesi. 64 Sorular: 1) Ölçme aracının; ölçülecek özellikleri, ölçülmesi söz konusu olmayan başka özelliklerle karıştırmadan tam ve doğru olarak ölçmesine ne denir? A) Güvenirlik B) Geçerlilik C) Kullanışlık D) Kararlılık E) Duyarlılık 2) Aynı özelliğin farklı araçlar ya da farklı kişiler tarafından ölçülmesi durumunda ölçme sonuçlarının benzer olmasına ne denir? A) Tutarlılık B) Kararlılık C) Duyarlılık D) Geçerlik E) Kullanışlık 3) Aşağıdaki ilişkilerin hangisinde korelasyon katsayısı pozitiftir? A) Zeka - Başarı B) Sigara içme - Sağlık C) Boy uzunluğu - Akademik başarı D) Yorulma – Öğrenme hızı E) Doğum yılı – Doğum tarihi 4) Aşağıdakilerden hangisi güvenirliği yollarından biri değildir? A) Şans başarısını azaltmak B) Puanlamanın objektifliği C) Soru sayısını azaltmak D) Ölçmenin hatalardan arındırılması E) Seviyeye uygun soru sormak artırma 5) Aşağıdakilerden hangisi sabit hatalara örnektir? A) Yazısı güzel olana fazla puan verilmesi B) Sınavda herkese 10 puan fazla verilmesi C) Kızlara fazla puan verilmesi D) İlk okunan kağıda daha az puan verilmesi E) Dikkatsizce okunup puanlama yapılması Eğitimde Kullanılan Ölçme Araç ve Yöntemleri A. Geleneksel Ölçme Araç ve Yöntemleri 1. Yazılı Yoklamalar 2. Kısa Cevaplı Testler 3. Ödev ve Projeler 4. Sözlü Sınavlar 5. Çoktan Seçmeli Testler 6. Doğru-Yanlış Testleri Geleneksel Ölçme Araç ve Yöntemleri 1. Yazılı Yoklamalar Yazılı olarak verilen birkaç sorunun yine yazılı olarak cevaplandırılması istenilen sınavlara yazılı yoklamalar adı verilmektedir. Geleneksel Ölçme Araç ve Yöntemleri 2. Kısa Cevaplı Testler : Cevaplayıcının bir rakam, bir kelime ya da en çok bir cümle ile cevaplandırdığı sorulardan oluşan sınavlara kısa cevaplı testler adı verilmektedir. Geleneksel Ölçme Araç ve Yöntemleri 4. Sözlü Sınavlar ve Mülakatlar: Sözlü sınavlar, soruların ve cevapların sözlü olarak verildiği sınavlar olarak tanımlanmaktadır. Sözel iletişim becerilerinin ölçülmesinde kullanılabilen tek ölçme yöntemidir. Geleneksel Ölçme Araç ve Yöntemleri 5. Çoktan Seçmeli Testler: Sorulan bir sorunun cevabını, verilen cevaplar arasından seçme gerektiren maddelerden oluşan testlere çoktan seçmeli, ya da seçme gerektiren testler denilmektedir. Yeni Ölçme Araç ve Yöntemleri B. Yeni Ölçme Araç ve Yöntemleri 1) 2) 3) 4) 5) 6) Portfolyolar (gelişim dosyaları) Performans değerlendirme ve gözlem Tartışma Görüşme (Mülâkat) Projeler Kavram haritaları Portfolyo (Öğrenci Gelişim Dosyası) Bireyin gelişim ve öğrenme sürecini bir bütün olarak gösteren ve bunların değerlendirilmesini sağlayan sistemli ve amaçlı olarak oluşturulmuş gelişim dosyalarıdır. Ödevler ve Projeler Bir konunun sınıf ortamı dışında araştırma yaparak derinlemesine incelenmesi ve raporlaştırılması ile yapılan çalışmalardır. Projeler, ‘proje değerlendirme formu’ kullanılarak puanlamada nesnellik sağlanabilir. Öz Değerlendirme Belli bir konuda bireyin kendi kendisini değerlendirmesine öz değerlendirme denir. Öz değerlendirmede subjektiflik olması nedeniyle daha çok öğrenme eksikliklerin belirlenmesinde kullanılmalıdır. • Yazılı yoklamalar: Kısaca açıklama ve örneklendirme yaptırılması istenildiğinde uygun olur. • Kısa cevaplı testler: Boşluk doldurmalı ve soru şeklinde sorulabilir. Ancak soruda derste ve kitapta geçen ifadenin dışında bir cevap olmalı. • Çoktan seçmeli testler: Sorular çevirme, yorum yapma ve öteleme içerdiğinde kavramaya uygun olur. • Doğru-yanlış testler: Bilgi farklı formatta verildiğinde öğrencinin bunu görebilmesi kavradığını gösterir. • Eşleştirmeli testler: Farklı içerikte olanların eşleştirilmesi kavramaya uygun olduğunu gösterir Sorular: 1) Aşağıdakilerden hangisi geleneksel ölçme araçlarından değildir? A) Yazılı yoklamalar B) Sözlü sınavlar C) Doğru yanlış testleri D) Performans değerlendirme E) Çoktan seçmeli testler 2) Bireyin gelişim ve öğrenme sürecini bir bütün olarak gösteren ve bunların değerlendirilmesini sağlayan sistemli ve amaçlı olarak oluşturulmuş gelişim dosyalarına ne denir? A) Performans değerlendirme B) Kavram haritaları C) Projeler D) Portfolyolar E) Görüşme (mülakat) 3) Kısaca açıklama ve örneklendirme yaptırılması istendiğinde kullanılması uygun olan ölçme araç ve yöntemi nedir? A) Çoktan seçmeli testler B) Yazılı yoklamalar C) Kısa cevaplı testler D) Doğru yanlış testler E) Eşleştirmeli testler Merkezi Eğilim ve Merkezi Dağılım Ölçüleri TANIMLAYICI İSTATİSTİK . Tanımlayıcı istatistikler verilerin sayısal ya da grafiksel olarak özetlenmesidir. Çalışmada veriler toplandıktan sonra, bunların merkezi eğilimleri, yayılımları, çarpıklıkları araştırılır. MERKEZİ EĞİLİM ÖLÇÜLERİ . Merkezi eğilim ölçüleri ,puan dağılımında verilerin hangi puan etrafında toplandığı hakkında bilgi veren ve veri grubunu özetleyen değerlerdir. . Merkezi eğilim ölçüsü olarak Mod, aritmetik ortalama, medyan gibi istatistiksel tanımlar kullanılmaktadır. Aritmetik Ortalama . Aritmetik ortalama, değerler toplamının değer sayısına bölümü şeklinde tanımlanır. Bu tanıma göre aritmetik ortalama şöyle formüle edilir. n X1 X 2 X 3 ....... Xn X n . X i 1 i n Frekanslar söz konusu olduğunda, sınıflandırılmış seriler için, f1 X1 f2 X 2 ........ fn Xn X f1 f2 .......... fn n fX i 1 n i f i 1 i i . Örnek olarak, bir sınava giren toplam öğrenci sayısı 7 olsun. Bu 7 öğrencinin sınavdan aldıkları notlar ise 100 üzerinden 60, 35, 28, 77, 81, 72 ve 74 olsun. O halde yukarıdaki formülü kullanarak bu sınav sonucundaki aritmetik ortalamayı hesaplayabiliriz: Aritmetik ortalama (60+35+28+77+81+72+74) / 7 = 61’dir. = Frekans serisi aritmetik ortalama örneği Xi fi fi.Xi 10 2 20 11 3 33 12 5 60 13 8 104 14 14 196 15 18 270 16 15 240 17 12 204 18 10 180 19 6 114 20 4 80 21 3 63 100 1564 fX X f i i i 1564 15,64 100 . Toplam puanların puan sayısına (öğrenci sayısına) bölünmesi ile aritmetik ortalama bulunur.Aritmetik ortalamanın hesaplanmasında, puan dağılımındaki her puan hesaplamaya dahil edildiğinden, diğer merkezi eğilim ölçülerine göre aritmetik ortalama daha çok tercih edilen bir istatistiktir. . Dağılışların yerinin belirlenmesinde en çok kullanılan yer ölçüsü aritmetik ortalamadır; ve tek başına ortalama sözcüğünden aritmetik ortalama anlaşılır. . Aritmetik ortalama bütün değerlerin ağırlığını eşit kabul ettiğinden dağılımı her zaman en iyi şekilde temsil etmeyebilir. Ayrıca aritmetik ortalama, veri kümesindeki aşırı değerlerden çok kolay etkilenir. . Not:Aritmetik ortalama hesaplanırken her bir puanın ortalamaya katkı oranı aynıdır. . Puanlar farklı olduğunda katılım miktarları farklıdır, fakat katılım oranları(yüzde olarak) aynıdır. Ağırlıklı Ortalama . Puanların ortalamaya katkı oranlarının farklı olması gerektiği durumlarda aritmetik ortalama yerine ağırlıklı ortalama hesaplanabilir. . Sınavların farklı kapsama sahip olmaları ya da farklı önem dereceleri ağırlıklı ortalama kullanmalarını gerektirir. . Ağırlıklı ortalama; veri kümesindeki bütün değerlerin aynı ağırlığa (öneme) sahip olmadıkları durumlarda kullanılır. . 1’den n’e kadar olan bir veri kümesinde X’ler veri değerleri ve W’lar her bir X için bir ağırlık fonksiyonu olarak kabul edilirse; ağırlıklı ortalama formülü şöyle oluşur: 90 . Ağırlıklı ortalama eğitimde yaygın olarak kredili ders sistemindeki ortalamaların hesaplanmasında kullanılmaktadır. Örnek: İktisat, İşletme, Hukuk ve İngilizce derslerini alan bir öğrencinin ders kredisi / ders notu çizelgesi şöyledir: Ders Kredisi Ders Notu İktisat 4 75 İşletme 3 70 Hukuk 2 60 İngilizce 2 90 O halde ağırlıklı ortalaması; (4x75)+(3x70)+(2x60)+(2x90)=73.63 11 91 Örnek Ders Kred i Not Ağ. Not Fiz 101 4 AA (4.0) 16.0 Kim 101 4 BB (3.0) 12.0 Müh 100 2 BA (3.5) 7.0 Mat 101 4 CB (2.5) 10.0 Türk 101 2 CC (2.0) 4.0 İng 101 2 DD (1.0) 2.0 MAK 101 3 DC (1.5) 4.5 Toplam 21 55.5 • Yandaki tabloda verilen ders ve notlar için ağırlıklı ortalama: 55.5 A.O. 2.64 21 Medyan(Ortanca) . Büyüklük sırasına göre düzenlenmiş dizisinin tam ortasına düşen puandır. . Ortanca hesaplanırken mutlaka verilerin sıraya konulmuş olması gerekmektedir. puanlar . Ölçülen değerler küçükten büyüğe ya da büyükten küçüğe doğru dizildiği zaman grubun, dizinin tam ortasındaki ,yani yüzde ellinci puan veya ölçümüdür. . Denek sayısı çiftse, ortalamaları alınır. ortadaki . Aşırı değerlerden etkilenmez. . Verilerde sapan değerler var ortalamadan daha iyi betimler. iki deneğin ise ortanca verileri . Seri birimlerinin tek sayıda olması durumunda serinin n 1 ‘inci biriminin değeri medyan olacaktır. 2 (tek sayıda gözlem var ise ortanca orta değerdir) . . Seri birimlerinin çift sayıda olması durumunda ise, serinin n 2 n 1 ‘inci birimlerinin değerlerinin ortalaması ‘inci ve 2 olarak kabul edilmektedir. ( çift sayıda gözlem var ise ortanca iki orta değerin ortalamasıdır) Örnek: Aşağıda hesaplayınız verilen Xi :2; 4; 7; 11; 13; 13; 17 n 1 7 1 4 2 serilerin medyanlarını Yi:3; 9; 13; 17; 19; 19; 23; 2 Xi serisi, 7 birimli bir seri medyanı 4. birimin değeri olan 11 dir. Yi serisi 8 birimli bir seri olduğundan n 8 4 2 2 n 8 1 1 5 2 2 serinin medyanı 4’üncü ve 5’inci birimlerin değerlerinin ortalamasına eşittir. 17 19 36 Me 18 2 2 Medyanın avantajları: . Hesaplanması ve anlaşılması kolaydır. . Uç değerlerden etkilenmez . Her dağılımda bir tane ortanca vardır. Medyanın Dezavantajları: . Standart sapması ortalamanın standart sapmasından büyüktür. . Büyük veri yığınlarında bilgisayar kullanmadan hesaplanması zordur. . Ortanca, ölçüm sayısına eklenecek herhangi bir değerden hemen etkilenir ve değişir. Mod(Tepe değeri) . Bir veri grubunda en çok tekrarlanan,yani . . . . frekansı en yüksek olan puandır. Tepe değer verilerin en çok hangi değer etrafında toplandığı hakkında bilgi verir. Mod en kararsız ölçüdür. Eğer puan dizisinde her puan aynı frekansa sahipse o puan dizisinin Modu yoktur. Bir seride birden fazla Mod olabilir. Bu durumda değişken çok Modlu olarak nitelendirilir. . Mod pratik olarak ,bir seride en çok rastlanan, en çok tekrarlanan terim olarak tanımlanabilir. Eğer serinin histogramı çizilirse, en yüksek sütunun değeri serinin modudur.Bu sebepten Mod’a tepe değeri de denir. TEPE DEĞERİNİN ÖZELLİKLERİ . Hesaplanması ve anlaşılması kolaydır . Dağılımdaki aşırı değerlerden etkilenmez . Grafik üzerinde hiç işlem yapmadan, gözlenebilen tek ölçüdür. . Bazı dağılışlarda tepe değeri bulunmayabilir, bazılarında da birden fazla tepe değeri bulunabilir. İki tepe değeri bulunan dağılışlara bimodal dağılış adı verilir. . Bazı dizilerde “tek mod” vardır. 20,30,40,50,50,50,60 Dizidenin modu:50 . Bazı dizilerde mod olabilecek değerler ard arda geldiğinde bunların ortalaması alınarak moda ulaşılır. 20,30,40,40,50,50,60 Dizinin modu:45 . Bazı dizilerde birden fazla mod vardır. 20,20,30,40,40,40,50,60,60,60,70,70 Dizinin modları:40 ve 60 20,30,30,40,50,50,60,60 Dizinin modları:30 ve 55 . Bazı dizilerde mod yoktur. 20,20,20,30,30,30 20,30,40,50,60,70 20,20,20,20,30,30,30,30 0,0,0,100,100,100 . Puanlar frekans sayıları açısından farklılaşma göstermediklerinden dizide mod bulunamaz. . Puanlar farklılaşma göstermediğinde de mod aranmaz. 20,20,20,20,20,20 Merkezi Dağılım (Değişim )Ölçüleri . Farklı grupların merkezi eğilim ölçütleri aynı olduğu halde, gruplar birbirlerinden çok farklı olabilir. Bu nedenle merkezi eğilim ölçütleri yanında, yayılma ölçütleri de çok önemlidir. . Merkezi dağılım ölçüleri, verilerin yığılma gösterilen noktadan ne kadar uzakta olduklarını, nasıl bir dağılım gösterdiklerini belirleyen istatistiklerdir. . Başlıca dağılım ölçüleri puan standart sapma ve varyansdır. genişliği(ranj), Yayılım Ölçüleri . Puanlar arasındaki farklılaşma gösterir.(homojen-heterojen) . . Standart sapma en hassas yayılım ölçüsüdür. . Herhangi birinin 0 olması yayılım ölçüleri de 0 olur. miktarını durumunda diğer Bütün notlar aynı olduğunda, bütün yayılım ölçüleri 0 olur. Dağılım Aralığı (Ranj, DA) . Bir dizideki en büyük değer (Xmax) ile en küçük değer (Xmin) arasındaki farktır. DA= (Xmax) - (Xmin) biçiminde hesaplanır. 71-68-75-44-75-81-75-94-56-75-69 veri setinin dağılım aralığı nedir? DA=94-44=50’dir. 108 Örnek: A üniversitesinin B bölümünün tavan puanı 361 ve taban puanı 349 ise. En düşük (Minimum) = 349 puan En yüksek (Maksimum) = 361 puan Değişim aralığı = 361-349 = 12 puan . Ranj bir veri grubunun hangi aralıkta değişkenlik gösterdiğini belirten istatistiktir. . Ranj, puan dağılımları hakkında yüzeysel bilgi verir. . En basit yaygınlık ölçüsüdür. . Ortalama gibi uç değerlerden çok etkilenir. . En uçtaki iki değer arasında kalan değerler hakkında bilgi vermez. . Ranj yeterince güvenilir değil, en basit yayılım ölçüsüdür. . 20,60,80,70,90,80 Ranj:90-20=70 . 20,20,20,90,20,20,20 Ranj:90-20=70 . 2 grup hiç benzemiyor ama ranjları aynıdır. Standart Sapma . Bir veri grubunda verilerin aritmetik ortalamadan ne kadar uzaklaştığının ölçüsüdür. . Puanların ortalamadan kareleri toplamının kareköküne eşittir. S (X X ) n 1 Örnek: 78,89,56,36,48,92,59,60 S=19.8 olan farklarının, ortalamasının, 2 . Bir örnek vermek gerekirse; 2, 4, 4, 4, 5, 5, 7, 9 değerlerine sahip bir örneklemi ele alalım. . Ortalamamız olacaktır. {(2+4+4+4+5+5+7+9)/8} = 5 . Her bir değerin ortalamadan farkını bulup karesini alırız, ve bu kareleri toplayıp toplam gözlem sayısına böler, sonucun kare kökünü alarak standart sapmaya ulaşırız. . (9+1+1+1+0+0+4+16)/8 = 4 ve 4’ün de kare kökü 2’dir. 113 • Standart sapma ve varyans : . Tüm değerlerin dağılımı ile bilgi verirler. Tüm değerler eşitse, her ikisi de sıfıra eşittir. . Değerler arasında farklar arttıkça standart sapma (Ss) ve varyans büyür. . Standart sapma değişken değerlerinin ortalamanın etrafındaki yayılmasını temsil eden bir yayılma ölçütüdür. Yani, denekler arasında ne kadar yaygınlık olduğunu ifade eder. . Ss’ nın karesine varyans adı verilir. . Merkezi eğilim ölçütü olarak ortalama kullanıldığında, yayılma ölçütü olarak da standart sapma kullanılır. . Bir dizi puanın varyansı o dizideki değişkenliğin bir ölçüsüdür. Puanların varyansı denildiğinde, puanların değişkenliğinin ölçüsü ifade edilmiş olur. Varyansın karekökü alınırsa standart sapma elde edilir. Varyans standart sapmanın karesi olduğundan , bu istatistiklerden birisi bilindiğinde diğerinin hesaplanması kolaydır. . Standart sapma, bir merkezi dağılım ölçüsü olarak puanların merkezi yığılma ölçüsünden uzaklıklarının bir ortalama değeri anlamını taşımaktadır. . Bir dizideki ölçümlerin birbirinden farkı arttıkça standart sapma büyür; ölçümler birbirine yaklaştıkça da küçülür. . Başka bir deyişle, dizideki ölçümlerin dağıldığı alan genişledikçe standart sapma büyür, dağılım alanı küçülüp daraldıkça da küçülür. . Standart sapma küçüldükçe homojenlik(benzerlik) artar. dizi grubundaki . Dağılımın yaygınlığını gösteren ölçümlerin en önemlisi varyansdır. Eğer varyans küçükse sayılar birbirine yakın, büyükse daha uzaktır. . Standart sapma büyüdükçe dağılım yaygınlaşır. . Aritmetik ortalamaları aynı olan iki dağılım aynı yaygınlıkta olmayabilir. Örneğin; 10,22,34 değerlerini alan 3 kişilik bir dağılımda aritmetik ortalama 66/3=22’dir.21,23,22 değerlerini alan başka bir 3 kişilik dağılımda aritmetik ortalama yine 66/3=22’dir. . İki dağılımın aritmetik ortalaması 22 olduğu halde birinci dağılımda değerler (1 ve 3’üncü değerler) aritmetik ortalamadan çok uzakta iken ikinci dağılımdaki değerler ortalamaya çok yakındır. . Bir dağılımda değerler aritmetik uzaklaştıkça dağılımın yaygınlığı artar. . Genel olarak, standart sapmanın küçük olması; ortalamadan sapmaların ve riskin az olduğunun, büyük olması ise; ortalamadan sapmaların, riskin çok olduğunun ve oynaklığın göstergesidir. ortalamadan Aritmetik ortalamaya bağlı olarak verilen kararlar Grubun başarı düzeyi nedir? Grubun mutlak başarı düzeyi nedir? Öğrencilerin ortalama başarı düzeyi nedir? Öğrencilerin öğrenme düzeyi nedir? Standart sapmaya bağlı olarak verilen kararlar Başarılı ve başarısız sınıf (grup) hangisidir? Öğrencileri arasında farklılaşma var mı? ya da öğrencilerin öğrenme düzeyleri benzer mi? Grup ya da dağılım homojen mi, heterojen mi? Grup aritmetik ortalamaya ne kadar uzaktır? Ya da yakındır? VARYASYON KATSAYISI (DEĞİŞİM KATSAYISI) . Standart sapma dağılımın yaygınlığını gösteren bir ölçüdür. . Ancak standart sapma ile dağılım hakkında çok fazla bir şey söylemek olanaksızdır. Örneğin; bir dağılımın standart sapması 6 ise bu değer büyük müdür, yoksa küçük müdür? . Bir karar verebilmek için VARYASYON KATSAYISINI hesaplamak gerekir. . Varyasyon katsayısı; standart sapmanın ortalamaya göre yüzde kaçlık bir değişim gösterdiğini belirtir. S V = --------- x 100 X Örnek : Ortalaması 31.7 ve standart sapması 8.37 olan bir dağılımın varyasyon katsayısı, V = (8.37 / 31.7) x 100 = % 26.4 Bu dağılımdaki değerler ortalamaya göre %26.4’lük bir değişim göstermektedir. . Standart sapma, eğitimde başarıyı belirlemede ortalamalar ile birlikte yaygın bir şekilde kullanılmaktadır. Eğer bir sınavda grup ortalamaları eşit ise standart sapması daha küçük olan grup daha başarılıdır. Standart sapması küçük olan gruplarda öğrencilerin öğrenme düzeyleri daha birbirine yakın iken, standart sapması büyük olan gruplarda öğrenme düzeyleri arasında daha belirgin farklar mevcuttur. . Bir dağılımda değerler aritmetik ortalamadan uzaklaştıkça dağılımın yaygınlığı artar. . Standart sapmanın küçüklüğü; ortalamaya yakınlığı, büyüklüğü ise; ortalamaya uzaklığı ifade eder. 126 Standart Sapma ve Aritmetik Ortalama Arasındaki İlişki Aritmetik ortalama ile standart Heterojen yapı oluşur ve grup sapmanın arası büyürse, başarısı düşer. Aritmetik ortalama ile standart Homojen yapı oluşur ve grup sapmanın arası küçülürse, başarısı artar. Bir puan dağılımında puanlar Standart sapmada büyür. arası fark (ranj) büyüdükçe, Bir testten elde edilen Testin güvenirliği artar puanların standart sapması (Standart hata formülünü büyüdükçe, inceleyiniz) 1 Se S x rx Se= Ölçmenin standart hatası Sx= Test puanlarının standart sapması rx = Testin güvenirliği Çarpıklık ve Basıklık Ölçüleri Çarpıklık(Skewness) . Çarpıklık, normal dağılışta simetrikliğin bozulma derecesidir. Dağılış sağa uzun kuyruklu ise pozitif çarpık veya sağa çarpık, dağılış sola uzun kuyruklu ise negatif çarpık vaya sola çarpık olarak adlandırılır. Basıklık(Kurtosis) . Normal dağılış eğrisinin sivrilik veya yayvanlık derecesi basıklık olarak adlandırılır. Dağılım şekli ölçütleri . Ortalama=ortanca=mod dağılımdır. . Çarpıklık (skewness): Mod<ortanca<ortalama ise dağılım sağdan çarpık; ortalama<ortanca<mod ise dağılım soldan çarpıktır. . Sivrilik-basıklık (kurtosis): Eğrinin tepesi sivriyse dağılım leptokurtik; tepesi basıksa dağılım platikurtiktir. ise dağılım normal Grafiklerin Yorumlanması(Aritmetik ortalama,mod,medyan ilişkisi) . Uygulanan bir testin aritmetik ortalaması, modu, medyanı ve standart sapması bulunduktan sonra bunun nasıl bir dağılım gösterdiğini ortaya koymak gerekir. Grafiklerin yorumlanması ile grubun başarı durumu hakkında bilgi edinilebilir. Normal(simetrik)Dağılım . Başarı açısından normal düzeyde olan bir sınıfın grafiğidir.Normal dağılım eğrisi genelde çan biçiminde olur. . Aritmetik ortalama, mod ve medyan değerleri aynıysa bu dağılım simetriklik gösterir. 1. Simetrik dağılışlarda bu üç değer birbirine eşittir. (A.O. = Medyan = Mod) 0 Ortanca A.Ortalama MERKEZİ EĞİLİM ÖLÇÜLERİ 50 Normal dağılım 100 2. Sola çarpık dağılışlarda aritmetik ortalama ortancadan, ortanca ise tepe değerinden daha küçüktür. (A.O. Medyan Mod) 0 50 Sola çarpık dağılım Ortanca A.Ortalama MERKEZİ EĞİLİM ÖLÇÜLERİ 100 Sola Çarpık(kayışlı)dağılım Başarı yüksektir. Öğretim yeterlidir. Sorular ve test kolaydır. Puanların çoğu dağılımın sağında toplanmıştır. Öğrenciler hedef davranışları kazanmışlardır. 3.Sağa çarpık dağılışlarda aritmetik ortalama ortancadan, ortanca ise tepe değerinden daha büyüktür. (A.O. Medyan Mod) 0 A.Ortalama Ortanca MERKEZİ EĞİLİM ÖLÇÜLERİ 50 Sağa çarpık dağılım 100 Sağa Çarpık(Kayışlı) dağılım Başarı düşüktür. Öğretme yetersizdir. Test zordur. Puanların çoğu sol tarafa yığılmıştır. Öğrenme düzeyi düşüktür. Öğrenciler hedef-davranışları kazamamışlardır. Sorular: 1) Toplam puanların puan sayısına bölünmesi neyi ifade eder? A) Mod B) Medyan C) Aritmetik ortalama D) Standart sapma E) Varyans 2) Bir veri grubunda en çok tekrarlanan yani frekansı en yüksek olan puan nedir? A) Medyan B) Mod C) Ortanca D) Ranj E) Varyans 3) Puanların ortalamaya katkı oranlarının farklı olması gerektiği durumlarda hesaplanan, eğitimde yaygın olarak kredili ders siteminde kullanılan yöntem hangisidir? A) Mod B) Medyan C) Standart sapma D) Aritmetik ortalama E) Ağırlı ortalama 4) Bir dizideki en büyük değer ile en küçük değer arasındaki fark nedir? A) Ranj B) Varyans C) Ortanca D) Mod E) Medyan 5) Aşağıdakilerden hangisi standart sapmaya bağlı olarak verilebilecek bir karardır? A) Grubun başarı düzeyi B) Grubun mutlak başarı düzeyi C) Öğrenciler arasında farklılaşma D) Öğrencilerin ortalama başarı düzeyi E) Öğrencilerin öğrenme düzeyi 6) Aşağıdakilerden hangisi simetrik dağılımı ifade eder? A) A.O.<Medyan<Mod B) Mod<Medyan<A.O. C) A.O.<Medyan<Mod D) A.O.=Medyan=Mod E) Mod<Medyan=A.O.